Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

NVIDIA mang công nghệ Flash Step 3.7 đến với doanh nghiệp.
Generatived
0:00 1/6/26
NVIDIA đã công bố hỗ trợ cho StepFun Step 3.7 Flash, một mô hình AI đa phương thức được thiết kế cho các khối lượng công việc quy mô doanh nghiệp kết hợp thị giác, ngôn ngữ, tìm kiếm và suy luận. Mô hình này được tối ưu hóa cho các ứng dụng dựa trên tác nhân xử lý tài liệu, hình ảnh và video trong thời gian thực.
Bước 3.7 Flash có tổng cộng 198 tỷ tham số với khoảng 11 tỷ tham số hoạt động trên mỗi lượt suy luận. Nó hỗ trợ cửa sổ ngữ cảnh 256K và nhiều chế độ suy luận, nhắm đến các trường hợp sử dụng như phân tích tài chính, hỗ trợ lập trình và xử lý tài liệu quy mô lớn.
Các nhà phát triển có thể truy cập các điểm kiểm tra được lượng tử hóa NVFP4 thông qua Hugging Face và triển khai mô hình bằng cách sử dụng các framework bao gồm SGLang, TensorRT-LLM và vLLM. Công ty cho biết các tùy chọn này giúp giảm yêu cầu bộ nhớ trong khi vẫn duy trì hiệu suất suy luận cao trên phần cứng NVIDIA.
NVIDIA cũng nhấn mạnh việc triển khai sản phẩm thông qua các dịch vụ vi mô NIM và khả năng tùy chỉnh thông qua Khung NeMo. Các tổ chức có thể chạy mô hình trên môi trường đám mây, tại chỗ hoặc lai và tinh chỉnh nó với dữ liệu chuyên biệt cho các ứng dụng doanh nghiệp chuyên ngành.
Chia sẻ bài viết này:
Tin tức mới nhất
Mizuho NEC ra mắt thử nghiệm xác thực bằng tác nhân AI
0:00 2/6/26
Tập đoàn tài chính Mizuho đã công bố hợp tác với NEC trong một dự án thử nghiệm để phát triển một khung xác thực mới có tên KYA
2C2P mở rộng nền tảng thanh toán với AWS AI
0:00 2/6/26
2C2P thông báo rằng họ tiếp tục vận hành nền tảng thanh toán khu vực của mình trên cơ sở hạ tầng AWS
Google ra mắt Gemini Omni và Flash 3.5
0:00 2/6/26
Tại Google I/O 2026, Google đã giới thiệu Gemini Omni và dòng sản phẩm Gemini 3.5, mở rộng danh mục sản phẩm AI của mình với các khả năng mới về tạo video
Copyright © 2024 Generatived - All right Reserved.
Chia sẻ bài viết này:
Chia sẻ bài viết này:
Danh mục
Tin tức
AI và luật/hệ thống/kinh tế/xã hội
Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.
Tin tức mới nhất
Mizuho NEC ra mắt thử nghiệm xác thực bằng tác nhân AI
0:00 2/6/26
Tập đoàn tài chính Mizuho đã công bố hợp tác với NEC trong một dự án thử nghiệm để phát triển một khung xác thực mới có tên KYA
2C2P mở rộng nền tảng thanh toán với AWS AI
0:00 2/6/26
2C2P thông báo rằng họ tiếp tục vận hành nền tảng thanh toán khu vực của mình trên cơ sở hạ tầng AWS
Google ra mắt Gemini Omni và Flash 3.5
0:00 2/6/26
Tại Google I/O 2026, Google đã giới thiệu Gemini Omni và dòng sản phẩm Gemini 3.5, mở rộng danh mục sản phẩm AI của mình với các khả năng mới về tạo video




%20(1).webp)

