Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

NVIDIA TensorRT-LLM giới thiệu chức năng điền trước đoạn hiệu quả

Generatived

4:30 18/11/24

NVIDIA đã giới thiệu các tính năng mới cho TensorRT-LLM giúp tăng cường sử dụng GPU và hợp lý hóa quy trình triển khai cho các nhà phát triển. Tính năng này, được gọi là điền trước đoạn, giải quyết các thách thức tính toán gặp phải trong giai đoạn suy luận giải mã và điền trước truyền thống. Bằng cách chia mã thông báo đầu vào thành các phần nhỏ hơn, hệ thống có thể xử lý bộ đệm KV hiệu quả hơn, xử lý đồng thời nhiều yêu cầu và ngăn ngừa tắc nghẽn trong giai đoạn điền trước.

Phương pháp điền trước theo khối không chỉ cải thiện hiệu suất GPU mà còn cho phép hệ thống quản lý các bối cảnh dài hơn và mức độ đồng thời cao hơn mà không làm tăng nhu cầu bộ nhớ. Điều này đặc biệt có lợi vì nó tách mức tiêu thụ bộ nhớ khỏi độ dài ngữ cảnh của các yêu cầu gửi đến, cho phép xử lý độ dài ngữ cảnh dài hơn một cách hiệu quả hơn.

Ngoài ra, NVIDIA đã có đóng góp đáng kể trong việc đơn giản hóa quá trình tạo động cơ bằng cách triển khai kích thước khối động. Tính năng này tự động đề xuất kích thước khối tối ưu dựa trên số liệu sử dụng GPU, giúp nhà phát triển không cần phải chỉ định độ dài đầu vào tối đa theo cách thủ công. Do đó, kích thước bộ đệm kích hoạt hiện được xác định bởi kích thước khối đã định cấu hình, dẫn đến việc sử dụng bộ nhớ hiệu quả hơn trong thời gian chạy.

Việc giới thiệu tính năng điền trước đoạn trong TensorRT-LLM giúp cải thiện đáng kể hiệu suất và mức sử dụng hệ thống. Bằng cách tăng tính song song giữa các giai đoạn điền trước và giải mã cũng như giảm thời gian hoàn thành truy vấn, NVIDIA cải thiện trải nghiệm người dùng. Các nhà phát triển quan tâm đến việc tận dụng tính năng này có thể tìm hiểu thêm, bắt đầu và cập nhật các bản cập nhật hiệu suất suy luận AI mới nhất bằng tài liệu GitHub của NVIDIA.

Nguồn: Blog nhà phát triển NVIDIA

Chia sẻ bài viết này:

Tin tức mới nhất

Hợp đồng với công ty cung cấp dịch vụ đối thoại giọng nói AI Works ID

0:00 14/1/26

Works ID (quận Shibuya, Tokyo) đã ký kết thỏa thuận đại lý bán hàng với Hmcomm (quận Minato, Tokyo) cho giải pháp đối thoại giọng nói AI "Terry2".

đọc thêm

Hiển thị thông tin công ty công cụ tìm kiếm Habitus AI

0:00 14/1/26

Công ty Habitus (quận Shibuya, Tokyo) sẽ ra mắt "Habitus Logic" vào ngày 10 tháng 1 năm 2026, một dịch vụ cho phép hiển thị thông tin doanh nghiệp chính xác cho các công cụ tìm kiếm AI.

đọc thêm

Rosetta ra mắt dịch vụ hỗ trợ AI cho các khách thuê nhà trống.

0:00 14/1/26

Công ty Rosetta (Tokyo) đã ra mắt Metareal Tenant Demand (Metareal TD), một hệ thống trí tuệ nhân tạo (AI) dự đoán nhu cầu thuê mặt bằng thương mại đang bỏ trống.

đọc thêm

Hiệp hội Nikkei về Ứng dụng và Thành công của Trí tuệ Nhân tạo trong Kinh doanh

0:00 14/1/26

Hiệp hội Quản lý Nhật Bản (Shibuya-ku, Tokyo) đã phát hành ấn bản tháng 1 năm 2026 của tạp chí thông tin quản lý Omni Management dưới dạng sách điện tử.

đọc thêm

Chia sẻ bài viết này:

Danh mục

Trình nâng cao hình ảnh AI

Trình tạo mã AI

Quản lý tác vụ AI

Không có mã/mã thấp

Trình tạo thiết kế đồ họa AI

Trình tạo minh họa/nghệ thuật AI

Tất cả công cụ

Tin tức

AI và luật/hệ thống/kinh tế/xã hội

Các công ty/sản phẩm/công nghệ AI

AI công nghệ lớn

OpenAI/ChatGPT

AI thế hệ sáng tạo

AI thế hệ dựa trên văn bản

AI sáng tạo của Nhật Bản

Cơ bản về AI sáng tạo

Hướng dẫn ứng dụng AI cơ bản

Hồ sơ công ty

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng trang web

Công ty điều hành

Hãy theo dõi chúng tôi

Ngôn ngữ

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Hãy theo dõi chúng tôi

Ngôn ngữ

Danh mục

Tất cả công cụ

Quản lý tác vụ AI

Trình tạo thiết kế đồ họa AI

Không có mã/mã thấp

Trình tạo mã AI

Trình nâng cao hình ảnh AI

Trình tạo minh họa/nghệ thuật AI

AI và luật/hệ thống/kinh tế/xã hội

Các công ty/sản phẩm/công nghệ AI

AI công nghệ lớn

OpenAI/ChatGPT

AI thế hệ sáng tạo

AI thế hệ dựa trên văn bản

AI sáng tạo của Nhật Bản

Cơ bản về AI tạo ra

Hướng dẫn ứng dụng AI cơ bản

Tin tức

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng của trang web

Công ty điều hành

Hồ sơ công ty

Tin tức mới nhất

Hợp đồng với công ty cung cấp dịch vụ đối thoại giọng nói AI Works ID

0:00 14/1/26

Works ID (quận Shibuya, Tokyo) đã ký kết thỏa thuận đại lý bán hàng với Hmcomm (quận Minato, Tokyo) cho giải pháp đối thoại giọng nói AI "Terry2".

đọc thêm

Hiển thị thông tin công ty công cụ tìm kiếm Habitus AI

0:00 14/1/26

Công ty Habitus (quận Shibuya, Tokyo) sẽ ra mắt "Habitus Logic" vào ngày 10 tháng 1 năm 2026, một dịch vụ cho phép hiển thị thông tin doanh nghiệp chính xác cho các công cụ tìm kiếm AI.

đọc thêm

Rosetta ra mắt dịch vụ hỗ trợ AI cho các khách thuê nhà trống.

0:00 14/1/26

Công ty Rosetta (Tokyo) đã ra mắt Metareal Tenant Demand (Metareal TD), một hệ thống trí tuệ nhân tạo (AI) dự đoán nhu cầu thuê mặt bằng thương mại đang bỏ trống.

đọc thêm

Hiệp hội Nikkei về Ứng dụng và Thành công của Trí tuệ Nhân tạo trong Kinh doanh

0:00 14/1/26

Hiệp hội Quản lý Nhật Bản (Shibuya-ku, Tokyo) đã phát hành ấn bản tháng 1 năm 2026 của tạp chí thông tin quản lý Omni Management dưới dạng sách điện tử.

đọc thêm