Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

Nhóm nghiên cứu NVIDIA công bố SteerLM để tùy chỉnh LLM

Generatived

9:42 27/10/23

NVIDIA gần đây đã xuất bản một bài viết về việc nâng cao LLM bao gồm tinh chỉnh có giám sát (SFT) trong các cuộc trình diễn của con người. Các nhóm nghiên cứu của NVIDIA đã đạt được tiến bộ đáng kể trong lĩnh vực mô hình ngôn ngữ quy mô lớn (LLM) với sự phát triển của SteerLM, một công nghệ mới giúp đơn giản hóa việc tùy chỉnh LLM. Bất chấp những tiến bộ ấn tượng trong việc tạo ngôn ngữ tự nhiên với LLM như GPT-3 và Megatron-Turing, những mô hình này thường gặp khó khăn trong việc cung cấp các phản hồi có sắc thái phù hợp với sở thích của người dùng.

Các phương pháp hiện tại để nâng cao LLM bao gồm tinh chỉnh có giám sát (SFT) trên các cuộc trình diễn của con người, sau đó là học tăng cường từ phản hồi của con người (RLHF). Mặc dù RLHF có thể cải thiện hiệu suất nhưng nó gặp phải những thách thức như độ phức tạp trong đào tạo và khả năng kiểm soát người dùng hạn chế.

SteerLM, một phần của NVIDIA NeMo, giải quyết những vấn đề này bằng cách cho phép điều khiển linh hoạt các kết quả đầu ra của mô hình dựa trên các thuộc tính được chỉ định. Công nghệ tiên tiến này đơn giản hóa quá trình tùy chỉnh và giúp người dùng dễ tiếp cận hơn.

LLM được đào tạo trước về kho văn bản phong phú và có trình độ ngôn ngữ sâu rộng cũng như kiến thức thế giới. Chúng đã được áp dụng thành công cho nhiều tác vụ xử lý ngôn ngữ tự nhiên, bao gồm dịch thuật, trả lời câu hỏi và tạo văn bản. Tuy nhiên, nó thường không tuân theo hướng dẫn do người dùng cung cấp và thay vào đó tạo ra văn bản chung chung hoặc vô nghĩa. Sự phát triển của SteerLM thể hiện một bước tiến lớn trong việc giải quyết những vấn đề này. nước xốt:

Nguồn: Blog nhà phát triển NVIDIA

Chia sẻ bài viết này:

Tin tức mới nhất

ディスカバリーズAI学習データ評価開始

0:00 20/2/26

ディスカバリーズ（東京都港区）は、企業の生産性向上を目指し「データスコア評価ソリューション」の提供を開始した。

đọc thêm

LayerX AIプラットフォーム導入UFJ

0:00 20/2/26

LayerX（東京都中央区）が開発したAIプラットフォーム「Ai Workforce」が、三菱ＵＦＪ銀行に導入された。

đọc thêm

zeteoh空間AIで製造現場効率化

0:00 20/2/26

zeteoh（東京都中央区）は、製造現場の「人・ロボット・資材」の動きをリアルタイムで把握する「空間AI」技術で特許を取得した。

đọc thêm

コレックHD子会社AIメディア改善実証

0:00 20/2/26

コレックホールディングス（東京都豊島区）の子会社サンジュウナナド（東京都豊島区）は、生成AIを活用したメディア開発プロセスの高度化・迅速化プロジェクトの実証フェーズとして、Webメディアに生成AIコンテンツを導入し、UX改善効果を検証すると発表した。

đọc thêm

Chia sẻ bài viết này:

Danh mục

Trình nâng cao hình ảnh AI

Trình tạo mã AI

Quản lý tác vụ AI

Không có mã/mã thấp

Trình tạo thiết kế đồ họa AI

Trình tạo minh họa/nghệ thuật AI

Tất cả công cụ

Tin tức

AI và luật/hệ thống/kinh tế/xã hội

Các công ty/sản phẩm/công nghệ AI

AI công nghệ lớn

OpenAI/ChatGPT

AI thế hệ sáng tạo

AI thế hệ dựa trên văn bản

AI sáng tạo của Nhật Bản

Cơ bản về AI sáng tạo

Hướng dẫn ứng dụng AI cơ bản

Hồ sơ công ty

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng trang web

Công ty điều hành

Hãy theo dõi chúng tôi

Ngôn ngữ

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.