top of page

Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

logo.png

NVIDIA mang công nghệ Flash Step 3.7 đến với doanh nghiệp.

Generatived

0:00 1/6/26

NVIDIA đã công bố hỗ trợ cho StepFun Step 3.7 Flash, một mô hình AI đa phương thức được thiết kế cho các khối lượng công việc quy mô doanh nghiệp kết hợp thị giác, ngôn ngữ, tìm kiếm và suy luận. Mô hình này được tối ưu hóa cho các ứng dụng dựa trên tác nhân xử lý tài liệu, hình ảnh và video trong thời gian thực.

Bước 3.7 Flash có tổng cộng 198 tỷ tham số với khoảng 11 tỷ tham số hoạt động trên mỗi lượt suy luận. Nó hỗ trợ cửa sổ ngữ cảnh 256K và nhiều chế độ suy luận, nhắm đến các trường hợp sử dụng như phân tích tài chính, hỗ trợ lập trình và xử lý tài liệu quy mô lớn.

Các nhà phát triển có thể truy cập các điểm kiểm tra được lượng tử hóa NVFP4 thông qua Hugging Face và triển khai mô hình bằng cách sử dụng các framework bao gồm SGLang, TensorRT-LLM và vLLM. Công ty cho biết các tùy chọn này giúp giảm yêu cầu bộ nhớ trong khi vẫn duy trì hiệu suất suy luận cao trên phần cứng NVIDIA.

NVIDIA cũng nhấn mạnh việc triển khai sản phẩm thông qua các dịch vụ vi mô NIM và khả năng tùy chỉnh thông qua Khung NeMo. Các tổ chức có thể chạy mô hình trên môi trường đám mây, tại chỗ hoặc lai và tinh chỉnh nó với dữ liệu chuyên biệt cho các ứng dụng doanh nghiệp chuyên ngành.

Chia sẻ bài viết này:

Tin tức mới nhất
Hitachi ra mắt trợ lý AI cho việc đảm bảo chất lượng

Hitachi ra mắt trợ lý AI cho việc đảm bảo chất lượng

0:00 5/6/26

Hitachi vừa công bố ra mắt Hệ thống Kiến thức Chất lượng dựa trên tác nhân AI, được thiết kế để hỗ trợ các hoạt động đảm bảo chất lượng trong sản xuất. Giải

agnt8x ra mắt nền tảng quản lý lực lượng lao động bằng trí tuệ nhân tạo.

agnt8x ra mắt nền tảng quản lý lực lượng lao động bằng trí tuệ nhân tạo.

0:00 5/6/26

agnt8x vừa công bố nền tảng quản lý lực lượng lao động AI của mình, được thiết kế để giúp các doanh nghiệp tuyển dụng, đào tạo, quản lý

three.ws hợp tác với IBM để phát triển các tác nhân AI dành cho doanh nghiệp.

three.ws hợp tác với IBM để phát triển các tác nhân AI dành cho doanh nghiệp.

0:00 5/6/26

three.ws, có trụ sở tại Los Angeles, đã công bố hợp tác chiến lược với IBM để mở rộng việc ứng dụng nền tảng tác nhân AI 3D trên trình duyệt của mình trong doanh nghiệp

NVIDIA mở rộng khả năng AI của Jetson với JetPack 7.2

NVIDIA mở rộng khả năng AI của Jetson với JetPack 7.2

0:00 4/6/26

NVIDIA vừa công bố JetPack 7.2 cho nền tảng Jetson của mình, bổ sung các khả năng mới được thiết kế để đơn giản hóa việc triển khai các ứng dụng trí tuệ nhân tạo (AI) tại biên mạng.

Copyright © 2024 Generatived - All right Reserved.

Chia sẻ bài viết này:

Chia sẻ bài viết này:

Generatived AI Logo

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

  • Facebook
  • X

Hãy theo dõi chúng tôi

Ngôn ngữ

Tin tức mới nhất
Hitachi ra mắt trợ lý AI cho việc đảm bảo chất lượng

Hitachi ra mắt trợ lý AI cho việc đảm bảo chất lượng

0:00 5/6/26

Hitachi vừa công bố ra mắt Hệ thống Kiến thức Chất lượng dựa trên tác nhân AI, được thiết kế để hỗ trợ các hoạt động đảm bảo chất lượng trong sản xuất. Giải

agnt8x ra mắt nền tảng quản lý lực lượng lao động bằng trí tuệ nhân tạo.

agnt8x ra mắt nền tảng quản lý lực lượng lao động bằng trí tuệ nhân tạo.

0:00 5/6/26

agnt8x vừa công bố nền tảng quản lý lực lượng lao động AI của mình, được thiết kế để giúp các doanh nghiệp tuyển dụng, đào tạo, quản lý

three.ws hợp tác với IBM để phát triển các tác nhân AI dành cho doanh nghiệp.

three.ws hợp tác với IBM để phát triển các tác nhân AI dành cho doanh nghiệp.

0:00 5/6/26

three.ws, có trụ sở tại Los Angeles, đã công bố hợp tác chiến lược với IBM để mở rộng việc ứng dụng nền tảng tác nhân AI 3D trên trình duyệt của mình trong doanh nghiệp

NVIDIA mở rộng khả năng AI của Jetson với JetPack 7.2

NVIDIA mở rộng khả năng AI của Jetson với JetPack 7.2

0:00 4/6/26

NVIDIA vừa công bố JetPack 7.2 cho nền tảng Jetson của mình, bổ sung các khả năng mới được thiết kế để đơn giản hóa việc triển khai các ứng dụng trí tuệ nhân tạo (AI) tại biên mạng.

bottom of page