top of page

Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

logo.png

AI21 Labs công bố mô hình ngôn ngữ Jamba 1.5

Generatived

9:00 23/8/24

AI21 Labs gần đây đã công bố dòng mô hình Jamba 1.5, một bộ mô hình ngôn ngữ quy mô lớn (LLM) phức tạp phù hợp cho nhiều nhiệm vụ AI tổng quát khác nhau. Các nhiệm vụ này bao gồm tạo nội dung, tóm tắt tài liệu, so sánh và trích xuất thông tin chuyên sâu từ các bộ dữ liệu mở rộng. Mô hình này tận dụng kiến ​​trúc kết hợp kết hợp cấu trúc Transformer và Mamba với mô-đun Kết hợp các chuyên gia (MoE) để nâng cao hiệu quả, độ trễ và khả năng xử lý ngữ cảnh lâu dài. Nó cũng được thiết kế để dễ dàng triển khai trên các nền tảng tăng tốc, cho phép các doanh nghiệp chạy ứng dụng một cách an toàn và gần gũi với dữ liệu của họ.

Các mô hình Jamba 1.5, được NVIDIA tối ưu hóa và lưu trữ, hiện có thể truy cập được thông qua Danh mục API NVIDIA. Các mô hình này tích hợp kiến ​​trúc Mamba, nổi tiếng với khả năng quản lý ngữ cảnh lâu dài và lớp biến áp cung cấp khả năng suy luận và độ chính xác. Các mô-đun MoE tăng công suất mô hình mà không cần thêm nhu cầu tính toán. Mỗi khối Jamba bao gồm tám lớp với tỷ lệ chú ý đến Mamba là 1:7 và vừa với một GPU NVIDIA H100 80 GB. Mô hình này cũng tự hào có cửa sổ ngữ cảnh mã thông báo 256K, tương đương với khoảng 800 trang văn bản, cho phép xử lý và tạo phản hồi chính xác hơn.

Một tính năng đáng chú ý của mô hình Jamba 1.5 là chức năng gọi hàm được hỗ trợ bởi trao đổi dữ liệu JSON. Điều này giúp tăng cường khả năng tương tác của AI, cho phép các mô hình thực hiện các hành động phức tạp và xử lý các truy vấn dữ liệu có cấu trúc. Tính linh hoạt như vậy cho phép các mô hình được triển khai trong nhiều ngành khác nhau, từ tạo tài liệu tài chính đến hỗ trợ trong môi trường bán lẻ, tất cả đều có độ chính xác theo thời gian thực.

Ngoài ra, các mô hình Jamba 1.5 tương thích với Thế hệ tăng cường tìm kiếm (RAG), giúp nâng cao khả năng cung cấp phản hồi chính xác và phù hợp với ngữ cảnh. Cửa sổ ngữ cảnh mã thông báo mở rộng cho phép mô hình xử lý lượng lớn thông tin, khiến nó trở nên lý tưởng cho việc phân tích dữ liệu chi tiết. RAG đã được chứng minh là có lợi trong các môi trường có nền tảng kiến ​​thức rộng lớn và phân tán, vì mô hình này giúp đơn giản hóa việc tìm kiếm và tăng độ chính xác. Các bên quan tâm có thể khám phá mô hình Jamba 1.5 trong Danh mục API NVIDIA. Danh mục này có nhiều mô hình AI được hỗ trợ bởi vi dịch vụ NVIDIA NIM để tối ưu hóa việc triển khai trong các ứng dụng doanh nghiệp. nước xốt:

Chia sẻ bài viết này:

Tin tức mới nhất
CyberAgent �đã thành công trong việc tối ưu hóa quá trình phát triển trí tuệ nhân tạo.

CyberAgent đã thành công trong việc tối ưu hóa quá trình phát triển trí tuệ nhân tạo.

0:00 17/2/26

Công ty CyberAgent (Tokyo) đã triển khai thành công quy trình phát triển dựa trên trí tuệ nhân tạo (AI), góp phần nâng cao năng suất của các kỹ sư.

Việc tích hợp AI vào Copilot Studio tiềm ẩn rủi ro bảo mật.

Việc tích hợp AI vào Copilot Studio tiềm ẩn rủi ro bảo mật.

0:00 17/2/26

Các tác nhân AI của Copilot Studio ngày càng được tích hợp vào hoạt động kinh doanh, cung cấp khả năng tự động hóa và tương tác hệ thống.

Microsoft ra mắt bộ công cụ tối ưu hóa công cụ tạo sinh (Generative Engine Optimization Toolkit).

Microsoft ra mắt bộ công cụ tối ưu hóa công cụ tạo sinh (Generative Engine Optimization Toolkit).

0:00 17/2/26

Microsoft luôn đi đầu trong việc nâng cao công nghệ định vị dữ liệu, một công nghệ ngày càng trở nên quan trọng khi các trợ lý AI định hình cách mọi người tiếp cận thông tin.

NVIDIA DGX Spark thúc đẩy trí tuệ nhân tạo trong giáo dục

NVIDIA DGX Spark thúc đẩy trí tuệ nhân tạo trong giáo dục

0:00 17/2/26

Siêu máy tính để bàn DGX Spark của NVIDIA đang tăng cường khả năng trí tuệ nhân tạo (AI) tại các cơ sở giáo dục hàng đầu trên toàn thế giới, bao gồm cả một triển khai độc đáo tại

Copyright © 2024 Generatived - All right Reserved.

Chia sẻ bài viết này:

Chia sẻ bài viết này:

Generatived AI Logo

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

  • Facebook
  • X

Hãy theo dõi chúng tôi

Ngôn ngữ

Tin tức mới nhất
CyberAgent đã thành công trong việc tối ưu hóa quá trình phát triển trí tuệ nhân tạo.

CyberAgent đã thành công trong việc tối ưu hóa quá trình phát triển trí tuệ nhân tạo.

0:00 17/2/26

Công ty CyberAgent (Tokyo) đã triển khai thành công quy trình phát triển dựa trên trí tuệ nhân tạo (AI), góp phần nâng cao năng suất của các kỹ sư.

Việc tích hợp AI vào Copilot Studio tiềm ẩn rủi ro bảo mật.

Việc tích hợp AI vào Copilot Studio tiềm ẩn rủi ro bảo mật.

0:00 17/2/26

Các tác nhân AI của Copilot Studio ngày càng được tích hợp vào hoạt động kinh doanh, cung cấp khả năng tự động hóa và tương tác hệ thống.

Microsoft ra mắt bộ công cụ tối ưu hóa công cụ tạo sinh (Generative Engine Optimization Toolkit).

Microsoft ra mắt bộ công cụ tối ưu hóa công cụ tạo sinh (Generative Engine Optimization Toolkit).

0:00 17/2/26

Microsoft luôn đi đầu trong việc nâng cao công nghệ định vị dữ liệu, một công nghệ ngày càng trở nên quan trọng khi các trợ lý AI định hình cách mọi người tiếp cận thông tin.

NVIDIA DGX Spark thúc đẩy trí tuệ nhân tạo trong giáo dục

NVIDIA DGX Spark thúc đẩy trí tuệ nhân tạo trong giáo dục

0:00 17/2/26

Siêu máy tính để bàn DGX Spark của NVIDIA đang tăng cường khả năng trí tuệ nhân tạo (AI) tại các cơ sở giáo dục hàng đầu trên toàn thế giới, bao gồm cả một triển khai độc đáo tại

bottom of page