top of page

Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

logo.png

NVIDIA công bố TensorRT Edge-LLM để tăng cường trí tuệ nhân tạo (AI).

Generatived

0:00 14/1/26

NVIDIA đã công bố TensorRT Edge-LLM, một khung phần mềm mã nguồn mở C++ mới được thiết kế để cải thiện hiệu suất của các mô hình ngôn ngữ quy mô lớn (LLM) và mô hình ngôn ngữ thị giác (VLM) trong điện toán biên. Khung phần mềm này được xây dựng dành riêng cho các ứng dụng thời gian thực trong lĩnh vực ô tô và robot, đáp ứng nhu cầu về latency thấp và hoạt động ngoại tuyến đáng tin cậy trên các nền tảng như NVIDIA DRIVE AGX Thor và NVIDIA Jetson Thor.

TensorRT Edge-LLM có các phụ thuộc tối thiểu và thiết kế gọn nhẹ, dẫn đến mức tiêu thụ tài nguyên thấp, phù hợp cho các ứng dụng biên trong môi trường sản xuất. Nó bao gồm các tính năng nâng cao như giải mã dự đoán EAGLE-3 và hỗ trợ lượng tử hóa NVFP4, rất cần thiết cho các trường hợp sử dụng thời gian thực đòi hỏi khắt khe mà các ngành công nghiệp này đang phải đối mặt.

Một số đối tác trong ngành đã và đang tích hợp TensorRT Edge-LLM vào sản phẩm của họ: Bosch đang sử dụng TensorRT Edge-LLM để phát triển buồng lái hỗ trợ trí tuệ nhân tạo với tương tác giọng nói tự nhiên, nền tảng AIBOX của ThunderSoft sẽ sử dụng khung công nghệ này để mang lại trải nghiệm phản hồi nhanh nhạy trong xe, và MediaTek cũng đang sử dụng TensorRT Edge-LLM để hỗ trợ các ứng dụng trí tuệ nhân tạo và giao diện người-máy trong khoang xe.

Khung phần mềm này đơn giản hóa quy trình triển khai suy luận LLM và VLM, từ việc xuất mô hình đến chạy suy luận trên phần cứng mục tiêu. Sự có mặt của nó trong hệ sinh thái NVIDIA Jetson đánh dấu một bước tiến lớn hướng tới việc đưa các khả năng AI tiên tiến đến vùng biên. Các nhà phát triển có thể truy cập TensorRT Edge-LLM thông qua GitHub và tích hợp nó vào các giải pháp điện toán biên của họ bằng cách làm theo tài liệu được cung cấp.

Chia sẻ bài viết này:

Tin tức mới nhất
Chủ tịch M-Mart công bố ứng dụng thực tiễn của trí tuệ nhân tạo (AI).

Chủ tịch M-Mart công bố ứng dụng thực tiễn của trí tuệ nhân tạo (AI).

0:00 14/1/26

Ngày 7 tháng 1, M Mart (Shinjuku-ku, Tokyo) thông báo về việc phát triển và ứng dụng thực tiễn "Trí tuệ nhân tạo Chủ tịch (Phiên bản nội bộ)"

Hỗ trợ phương pháp phát triển đầu tiên trên thực địa FYBE

Hỗ trợ phương pháp phát triển đầu tiên trên thực địa FYBE

0:00 14/1/26

FYBE (Minato-ku, Tokyo) chủ trương phương pháp phát triển "ưu tiên hiện trường" để giải quyết các thách thức tại chỗ trong các doanh nghiệp mới và ứng dụng AI.

Nghiên cứu tối ưu hóa chi phí Generative AI của Largegate

Nghiên cứu tối ưu hóa chi phí Generative AI của Largegate

0:00 14/1/26

Công ty Largegate (Tokyo) đã tiến hành "Khảo sát về chi phí và tối ưu hóa Generative AI " với sự tham gia của 550 nhà quản lý doanh nghiệp sử dụng Generative AI .

Hệ thống kế toán AI của FocusFirstAdvisors vừa được công bố.

Hệ thống kế toán AI của FocusFirstAdvisors vừa được công bố.

0:00 14/1/26

FocusFirstAdvisors (quận Shibuya, Tokyo) đã công bố hệ thống kế toán AI mua một lần duy nhất mang thương hiệu "AI Flow Digital Transformation

Copyright © 2024 Generatived - All right Reserved.

Chia sẻ bài viết này:

Chia sẻ bài viết này:

Generatived AI Logo

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

  • Facebook
  • X

Hãy theo dõi chúng tôi

Ngôn ngữ

Tin tức mới nhất
Chủ tịch M-Mart công bố ứng dụng thực tiễn của trí tuệ nhân tạo (AI).

Chủ tịch M-Mart công bố ứng dụng thực tiễn của trí tuệ nhân tạo (AI).

0:00 14/1/26

Ngày 7 tháng 1, M Mart (Shinjuku-ku, Tokyo) thông báo về việc phát triển và ứng dụng thực tiễn "Trí tuệ nhân tạo Chủ tịch (Phiên bản nội bộ)"

Hỗ trợ phương pháp phát triển đầu tiên trên thực địa FYBE

Hỗ trợ phương pháp phát triển đầu tiên trên thực địa FYBE

0:00 14/1/26

FYBE (Minato-ku, Tokyo) chủ trương phương pháp phát triển "ưu tiên hiện trường" để giải quyết các thách thức tại chỗ trong các doanh nghiệp mới và ứng dụng AI.

Nghiên cứu tối ưu hóa chi phí Generative AI của Largegate

Nghiên cứu tối ưu hóa chi phí Generative AI của Largegate

0:00 14/1/26

Công ty Largegate (Tokyo) đã tiến hành "Khảo sát về chi phí và tối ưu hóa Generative AI " với sự tham gia của 550 nhà quản lý doanh nghiệp sử dụng Generative AI .

Hệ thống kế toán AI của FocusFirstAdvisors vừa được công bố.

Hệ thống kế toán AI của FocusFirstAdvisors vừa được công bố.

0:00 14/1/26

FocusFirstAdvisors (quận Shibuya, Tokyo) đã công bố hệ thống kế toán AI mua một lần duy nhất mang thương hiệu "AI Flow Digital Transformation

bottom of page