Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

NVIDIA RTX AI giới thiệu multi-LoRA để LLM hiệu quả

Generatived

2:00 29/8/24

Những tiến bộ mới nhất trong công nghệ AI đã phát triển các khả năng mới trong bộ công cụ RTX AI cho phép sử dụng hiệu quả các mô hình ngôn ngữ quy mô lớn (LLM) trên các thiết bị có bộ nhớ hạn chế. Cải tiến này cho phép bạn xử lý đồng thời nhiều trường hợp sử dụng, chẳng hạn như trợ lý dịch thuật đa ngôn ngữ mà không cần phải lưu trữ nhiều phiên bản của mô hình.

Giờ đây, các nhà phát triển có thể tận dụng Thích ứng xếp hạng thấp (LoRA), một kỹ thuật cho phép tùy chỉnh một LLM duy nhất với yêu cầu bộ nhớ tối thiểu. LoRA hoạt động bằng cách gắn các bộ điều hợp nhỏ dành riêng cho nhiệm vụ vào mô hình cơ sở, có thể mở rộng để phù hợp với các ứng dụng khác nhau trên thiết bị. Cách tiếp cận này đặc biệt hữu ích cho các thiết bị cần quản lý đồng thời nhiều ứng dụng và tác vụ trong khi chia sẻ tài nguyên hệ thống.

TensorRT-LLM của NVIDIA, một phần của bộ công cụ RTX AI, đã giới thiệu hỗ trợ đa LoRA. Đây là một cải tiến lớn dành cho máy tính và máy trạm RTX AI. Tính năng này cho phép thực hiện nhiều trường hợp sử dụng khác nhau trong quá trình suy luận và giúp nhà phát triển dễ dàng triển khai các tính năng AI trong ứng dụng của họ mà không cần tốn nhiều bộ nhớ.

Bản thân công nghệ LoRA liên quan đến việc tinh chỉnh một tập hợp con các tham số trong mô hình, được gọi là bộ điều hợp LoRA. Các bộ điều hợp này được tùy chỉnh nhưng các thông số chính của mô hình vẫn không thay đổi. Bộ điều hợp đã đào tạo được tích hợp vào mô hình cơ bản trong quá trình suy luận, giảm thiểu độ trễ và chi phí thông lượng. Phương pháp này không chỉ tiết kiệm bộ nhớ mà còn duy trì hiệu suất cao khi sử dụng các mô hình tùy chỉnh để phục vụ nhiều máy khách.

Nguồn: Blog nhà phát triển NVIDIA

Chia sẻ bài viết này:

Tin tức mới nhất

Khảo sát về việc sử dụng Trí tuệ Generative AI) và những khoảng trống trong môi trường làm việc của SHE.

0:00 12/12/25

SHE (Minato-ku, Tokyo) đã tiến hành một cuộc khảo sát toàn quốc với 400 người lao động trong độ tuổi 20-59 để tìm hiểu về tình trạng sử dụng Trí tuệ Generative AI) hiện nay.

đọc thêm

メタリアル資格取得AI開始

0:00 12/12/25

Công ty Metalial (Tokyo) thông báo đã phát triển "Metareal Certification Watch" (Metareal CW), một hệ thống trí tuệ nhân tạo (AI) dự đoán nhu cầu đào tạo chứng chỉ của các công ty

đọc thêm

Hỗ trợ AI y tế Mutex, nâng cao chức năng Reze.

0:00 12/12/25

Mutex (Bunkyo-ku, Tokyo) là một công ty khởi nghiệp đang phát triển "Reze," một phần mềm dịch vụ (SaaS) dựa trên trí tuệ nhân tạo dành cho các cơ sở y tế, hỗ trợ xử lý yêu cầu bồi thường bảo hiểm y tế.

đọc thêm

SHIFT AI: Xu hướng ngành công nghiệp AI và các liên minh mới

0:00 12/12/25

SHIFT AI (Shibuya-ku, Tokyo) đã xuất bản ấn phẩm tháng 11 của AI Trends Tsushin.

đọc thêm

Chia sẻ bài viết này:

Danh mục

Trình nâng cao hình ảnh AI

Trình tạo mã AI

Quản lý tác vụ AI

Không có mã/mã thấp

Trình tạo thiết kế đồ họa AI

Trình tạo minh họa/nghệ thuật AI

Tất cả công cụ

Tin tức

AI và luật/hệ thống/kinh tế/xã hội

Các công ty/sản phẩm/công nghệ AI

AI công nghệ lớn

OpenAI/ChatGPT

AI thế hệ sáng tạo

AI thế hệ dựa trên văn bản

AI sáng tạo của Nhật Bản

Cơ bản về AI sáng tạo

Hướng dẫn ứng dụng AI cơ bản

Hồ sơ công ty

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng trang web

Công ty điều hành

Hãy theo dõi chúng tôi

Ngôn ngữ

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Hãy theo dõi chúng tôi

Ngôn ngữ

Danh mục

Tất cả công cụ

Quản lý tác vụ AI

Trình tạo thiết kế đồ họa AI

Không có mã/mã thấp

Trình tạo mã AI

Trình nâng cao hình ảnh AI

Trình tạo minh họa/nghệ thuật AI

AI và luật/hệ thống/kinh tế/xã hội

Các công ty/sản phẩm/công nghệ AI

AI công nghệ lớn

OpenAI/ChatGPT

AI thế hệ sáng tạo

AI thế hệ dựa trên văn bản

AI sáng tạo của Nhật Bản

Cơ bản về AI tạo ra

Hướng dẫn ứng dụng AI cơ bản

Tin tức

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng của trang web

Công ty điều hành

Hồ sơ công ty

Tin tức mới nhất

Khảo sát về việc sử dụng Trí tuệ Generative AI) và những khoảng trống trong môi trường làm việc của SHE.

0:00 12/12/25

SHE (Minato-ku, Tokyo) đã tiến hành một cuộc khảo sát toàn quốc với 400 người lao động trong độ tuổi 20-59 để tìm hiểu về tình trạng sử dụng Trí tuệ Generative AI) hiện nay.

đọc thêm

メタリアル資格取得AI開始

0:00 12/12/25

Công ty Metalial (Tokyo) thông báo đã phát triển "Metareal Certification Watch" (Metareal CW), một hệ thống trí tuệ nhân tạo (AI) dự đoán nhu cầu đào tạo chứng chỉ của các công ty

đọc thêm

Hỗ trợ AI y tế Mutex, nâng cao chức năng Reze.

0:00 12/12/25

Mutex (Bunkyo-ku, Tokyo) là một công ty khởi nghiệp đang phát triển "Reze," một phần mềm dịch vụ (SaaS) dựa trên trí tuệ nhân tạo dành cho các cơ sở y tế, hỗ trợ xử lý yêu cầu bồi thường bảo hiểm y tế.

đọc thêm

SHIFT AI: Xu hướng ngành công nghiệp AI và các liên minh mới

0:00 12/12/25

SHIFT AI (Shibuya-ku, Tokyo) đã xuất bản ấn phẩm tháng 11 của AI Trends Tsushin.

đọc thêm