top of page

Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

logo.png

NVIDIA công bố mô hình ngôn ngữ Llama 3.2 Vision

Generatived

4:30 20/11/24

Meta đã công bố loạt mô hình ngôn ngữ tầm nhìn Llama 3.2 mới nhất. Model này cung cấp cả phiên bản tham số 11B và 90B để xử lý đầu vào văn bản và hình ảnh. Cũng được giới thiệu là các biến thể mô hình ngôn ngữ chỉ có văn bản nhỏ hơn với tham số 1B và 3B. NVIDIA tận dụng nhiều loại GPU, từ các thiết bị trung tâm dữ liệu hiệu suất cao đến máy trạm RTX cục bộ cho đến các thiết bị NVIDIA Jetson công suất thấp, để mang lại hiệu suất hiệu quả và triển khai tiết kiệm chi phí cho các mô hình này trên toàn thế giới. Tôi đã thực hiện một số điều chỉnh nhỏ.

Llama 3.2 VLM được thiết kế để xử lý nhiều độ dài ngữ cảnh và hình ảnh có độ phân giải cao, mang lại thời gian phản hồi nhanh và thông lượng cao để mang lại trải nghiệm liền mạch cho người dùng. Tối ưu hóa toàn diện trên nền tảng công nghệ của NVIDIA đóng vai trò quan trọng trong việc đạt được các chỉ số hiệu suất này. SLM đã được cải tiến tương tự để hoạt động tốt nhất trên PC và máy trạm NVIDIA RTX, đồng thời với các điều chỉnh lượng tử hóa để chạy trên các thiết bị biên NVIDIA Jetson.

Những tiến bộ về thông lượng suy luận AI cho các mô hình Llama 3.2 của NVIDIA là rất đáng chú ý. Mô hình này bao gồm bộ mã hóa tầm nhìn và bộ giải mã văn bản, cả hai đều được tối ưu hóa để suy luận hiệu suất cao bằng thư viện TensorRT của NVIDIA. Cơ chế chú ý chéo của bộ giải mã văn bản cho phép VLM tạo văn bản có ngữ cảnh trực quan, tăng hiệu quả. NVIDIA cũng đã phát triển các công thức lượng tử hóa sau đào tạo FP8 tùy chỉnh, khi kết hợp với Lõi Tensor FP8 thế hệ thứ 4, sẽ tăng thông lượng mô hình và giảm độ trễ mà không làm giảm độ chính xác.

Hiệu suất của mô hình Llama 3.2 trên nền tảng NVIDIA rất ấn tượng, với các phép đo nội bộ thể hiện khả năng của nó trong cả các tình huống thông lượng tối đa và độ trễ tối thiểu. Những kết quả này nêu bật hiệu năng vượt trội của GPU NVIDIA H200 được tối ưu hóa bằng phần mềm TensorRT. Ngoài ra, trong môi trường Windows, Llama 3.2 SLM được tối ưu hóa để hoạt động với ONNX Runtime Generative API và mang lại hiệu suất thông lượng tuyệt vời trên GPU NVIDIA GeForce RTX 4090. Nền tảng điện toán tăng tốc của NVIDIA cho phép bạn xây dựng các mô hình hiệu suất cao trên nhiều nền tảng khác nhau, từ trung tâm dữ liệu đến máy trạm cục bộ, đáp ứng nhu cầu của các doanh nghiệp muốn nhanh chóng triển khai và nhận ra giá trị.

Chia sẻ bài viết này:

Tin tức mới nhất
Khóa học AI Librex bắt đầu sử dụng NotebookLM

Khóa học AI Librex bắt đầu sử dụng NotebookLM

0:00 11/11/25

Librex (Shibuya-ku, Tokyo) đã ra mắt khóa học tìm hiểu về "NotebookLM" do Google phát triển.

Sự kiện chia sẻ ứng dụng AI do Đại học Okayama tổ chức

Sự kiện chia sẻ ứng dụng AI do Đại học Okayama tổ chức

0:00 11/11/25

Đại học OKama (Kita-ku, Thành phố OKama) đã tổ chức "Buổi chia sẻ sử dụng Generative AI OI-Start" tại cơ sở Tsushima vào ngày 31 tháng 10 năm 2025.

Hỗ trợ quản lý nghệ thuật AI tiếp thị AGO

Hỗ trợ quản lý nghệ thuật AI tiếp thị AGO

0:00 11/11/25

AGO MARKETING (Nishi-Shinjuku, Shinjuku-ku, Tokyo) sẽ ra mắt doanh nghiệp tư vấn cải tiến quản lý sử dụng phương pháp "Nghệ thuật & Khoa học" kết hợp Generative AI) và nghệ thuật.

Ra mắt dịch vụ hỗ trợ thông minh sản xuất dữ liệu AI

Ra mắt dịch vụ hỗ trợ thông minh sản xuất dữ liệu AI

0:00 11/11/25

AI Data (Minato-ku, Tokyo) đã bắt đầu cung cấp dịch vụ hỗ trợ sản xuất thông minh cho ngành sản xuất bằng cách sử dụng "Intellectual Property AI x AI Factory".

Copyright © 2024 Generatived - All right Reserved.

Chia sẻ bài viết này:

Chia sẻ bài viết này:

Generatived AI Logo

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

  • Facebook
  • X

Hãy theo dõi chúng tôi

Ngôn ngữ

Tin tức mới nhất
Khóa học AI Librex bắt đầu sử dụng NotebookLM

Khóa học AI Librex bắt đầu sử dụng NotebookLM

0:00 11/11/25

Librex (Shibuya-ku, Tokyo) đã ra mắt khóa học tìm hiểu về "NotebookLM" do Google phát triển.

Sự kiện chia sẻ ứng dụng AI do Đại học Okayama tổ chức

Sự kiện chia sẻ ứng dụng AI do Đại học Okayama tổ chức

0:00 11/11/25

Đại học OKama (Kita-ku, Thành phố OKama) đã tổ chức "Buổi chia sẻ sử dụng Generative AI OI-Start" tại cơ sở Tsushima vào ngày 31 tháng 10 năm 2025.

Hỗ trợ quản lý nghệ thuật AI tiếp thị AGO

Hỗ trợ quản lý nghệ thuật AI tiếp thị AGO

0:00 11/11/25

AGO MARKETING (Nishi-Shinjuku, Shinjuku-ku, Tokyo) sẽ ra mắt doanh nghiệp tư vấn cải tiến quản lý sử dụng phương pháp "Nghệ thuật & Khoa học" kết hợp Generative AI) và nghệ thuật.

Ra mắt dịch vụ hỗ trợ thông minh sản xuất dữ liệu AI

Ra mắt dịch vụ hỗ trợ thông minh sản xuất dữ liệu AI

0:00 11/11/25

AI Data (Minato-ku, Tokyo) đã bắt đầu cung cấp dịch vụ hỗ trợ sản xuất thông minh cho ngành sản xuất bằng cách sử dụng "Intellectual Property AI x AI Factory".

bottom of page