Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

NVIDIA công bố mô hình ngôn ngữ Llama 3.2 Vision

Generatived

4:30 20/11/24

Meta đã công bố loạt mô hình ngôn ngữ tầm nhìn Llama 3.2 mới nhất. Model này cung cấp cả phiên bản tham số 11B và 90B để xử lý đầu vào văn bản và hình ảnh. Cũng được giới thiệu là các biến thể mô hình ngôn ngữ chỉ có văn bản nhỏ hơn với tham số 1B và 3B. NVIDIA tận dụng nhiều loại GPU, từ các thiết bị trung tâm dữ liệu hiệu suất cao đến máy trạm RTX cục bộ cho đến các thiết bị NVIDIA Jetson công suất thấp, để mang lại hiệu suất hiệu quả và triển khai tiết kiệm chi phí cho các mô hình này trên toàn thế giới. Tôi đã thực hiện một số điều chỉnh nhỏ.

Llama 3.2 VLM được thiết kế để xử lý nhiều độ dài ngữ cảnh và hình ảnh có độ phân giải cao, mang lại thời gian phản hồi nhanh và thông lượng cao để mang lại trải nghiệm liền mạch cho người dùng. Tối ưu hóa toàn diện trên nền tảng công nghệ của NVIDIA đóng vai trò quan trọng trong việc đạt được các chỉ số hiệu suất này. SLM đã được cải tiến tương tự để hoạt động tốt nhất trên PC và máy trạm NVIDIA RTX, đồng thời với các điều chỉnh lượng tử hóa để chạy trên các thiết bị biên NVIDIA Jetson.

Những tiến bộ về thông lượng suy luận AI cho các mô hình Llama 3.2 của NVIDIA là rất đáng chú ý. Mô hình này bao gồm bộ mã hóa tầm nhìn và bộ giải mã văn bản, cả hai đều được tối ưu hóa để suy luận hiệu suất cao bằng thư viện TensorRT của NVIDIA. Cơ chế chú ý chéo của bộ giải mã văn bản cho phép VLM tạo văn bản có ngữ cảnh trực quan, tăng hiệu quả. NVIDIA cũng đã phát triển các công thức lượng tử hóa sau đào tạo FP8 tùy chỉnh, khi kết hợp với Lõi Tensor FP8 thế hệ thứ 4, sẽ tăng thông lượng mô hình và giảm độ trễ mà không làm giảm độ chính xác.

Hiệu suất của mô hình Llama 3.2 trên nền tảng NVIDIA rất ấn tượng, với các phép đo nội bộ thể hiện khả năng của nó trong cả các tình huống thông lượng tối đa và độ trễ tối thiểu. Những kết quả này nêu bật hiệu năng vượt trội của GPU NVIDIA H200 được tối ưu hóa bằng phần mềm TensorRT. Ngoài ra, trong môi trường Windows, Llama 3.2 SLM được tối ưu hóa để hoạt động với ONNX Runtime Generative API và mang lại hiệu suất thông lượng tuyệt vời trên GPU NVIDIA GeForce RTX 4090. Nền tảng điện toán tăng tốc của NVIDIA cho phép bạn xây dựng các mô hình hiệu suất cao trên nhiều nền tảng khác nhau, từ trung tâm dữ liệu đến máy trạm cục bộ, đáp ứng nhu cầu của các doanh nghiệp muốn nhanh chóng triển khai và nhận ra giá trị.

Nguồn: Blog nhà phát triển NVIDIA

Chia sẻ bài viết này:

Tin tức mới nhất

Google ra mắt Gemini Omni Flash Video AI

0:00 27/5/26

Google vừa công bố ra mắt “Gemini Omni”, một mô hình trí tuệ nhân tạo đa phương thức được thiết kế để tạo và chỉnh sửa video từ sự kết hợp của văn bản

đọc thêm

Microsoft công khai các công cụ an toàn AI.

0:00 27/5/26

Microsoft đã công bố phát hành mã nguồn mở hai công cụ an toàn AI mới, “RAMPART” và “Clarity”, nhằm mục đích cải thiện tính bảo mật và độ tin cậy của các tác nhân AI trong doanh nghiệp.

đọc thêm

AWS mở rộng dịch vụ điện toán đám mây độc lập tại châu Âu.

0:00 27/5/26

Amazon Web Services (AWS) đã công bố sự gia tăng đáng kể việc sử dụng dịch vụ AWS European Sovereign Cloud, được hỗ trợ bởi các tính năng trí tuệ nhân tạo (AI) mới

đọc thêm

Google mở rộng công cụ xác minh nội dung bằng trí tuệ nhân tạo.

0:00 27/5/26

Google vừa công bố triển khai rộng rãi công nghệ đóng dấu bản quyền SynthID của mình trên các hình ảnh, video và âm thanh được tạo ra bằng trí tuệ nhân tạo.

đọc thêm

Chia sẻ bài viết này:

Danh mục

Trình nâng cao hình ảnh AI

Trình tạo mã AI

Quản lý tác vụ AI

Không có mã/mã thấp

Trình tạo thiết kế đồ họa AI

Trình tạo minh họa/nghệ thuật AI

Tất cả công cụ

Tin tức

AI và luật/hệ thống/kinh tế/xã hội

Các công ty/sản phẩm/công nghệ AI

AI công nghệ lớn

OpenAI/ChatGPT

AI thế hệ sáng tạo

AI thế hệ dựa trên văn bản

AI sáng tạo của Nhật Bản

Cơ bản về AI sáng tạo

Hướng dẫn ứng dụng AI cơ bản

Hồ sơ công ty

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng trang web

Công ty điều hành

Hãy theo dõi chúng tôi

Ngôn ngữ

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Hãy theo dõi chúng tôi

Ngôn ngữ

Danh mục

Tất cả công cụ

Quản lý tác vụ AI

Trình tạo thiết kế đồ họa AI

Không có mã/mã thấp

Trình tạo mã AI

Trình nâng cao hình ảnh AI

Trình tạo minh họa/nghệ thuật AI

AI và luật/hệ thống/kinh tế/xã hội

Các công ty/sản phẩm/công nghệ AI

AI công nghệ lớn

OpenAI/ChatGPT

AI thế hệ sáng tạo

AI thế hệ dựa trên văn bản

AI sáng tạo của Nhật Bản

Cơ bản về AI tạo ra

Hướng dẫn ứng dụng AI cơ bản

Tin tức

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng của trang web

Công ty điều hành

Hồ sơ công ty

Tin tức mới nhất

Google ra mắt Gemini Omni Flash Video AI

0:00 27/5/26

Google vừa công bố ra mắt “Gemini Omni”, một mô hình trí tuệ nhân tạo đa phương thức được thiết kế để tạo và chỉnh sửa video từ sự kết hợp của văn bản

đọc thêm

Microsoft công khai các công cụ an toàn AI.

0:00 27/5/26

Microsoft đã công bố phát hành mã nguồn mở hai công cụ an toàn AI mới, “RAMPART” và “Clarity”, nhằm mục đích cải thiện tính bảo mật và độ tin cậy của các tác nhân AI trong doanh nghiệp.

đọc thêm

AWS mở rộng dịch vụ điện toán đám mây độc lập tại châu Âu.

0:00 27/5/26

Amazon Web Services (AWS) đã công bố sự gia tăng đáng kể việc sử dụng dịch vụ AWS European Sovereign Cloud, được hỗ trợ bởi các tính năng trí tuệ nhân tạo (AI) mới

đọc thêm

Google mở rộng công cụ xác minh nội dung bằng trí tuệ nhân tạo.

0:00 27/5/26

Google vừa công bố triển khai rộng rãi công nghệ đóng dấu bản quyền SynthID của mình trên các hình ảnh, video và âm thanh được tạo ra bằng trí tuệ nhân tạo.

đọc thêm