top of page
Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif
logo.png

AI21 Labs mengumumkan model bahasa Jamba 1.5

Generatived

23/8/24, 09.00

AI21 Labs baru-baru ini mengumumkan rangkaian model Jamba 1.5, rangkaian model bahasa skala besar (LLM) canggih yang cocok untuk berbagai tugas AI generatif. Tugas-tugas ini mencakup pembuatan konten, peringkasan dokumen, perbandingan, dan penggalian wawasan dari kumpulan data yang luas. Model ini memanfaatkan arsitektur hibrid yang menggabungkan struktur Transformer dan Mamba dengan modul Mix of Experts (MoE) untuk meningkatkan efisiensi, latensi, dan penanganan konteks yang panjang. Ini juga dirancang agar mudah diterapkan pada platform yang dipercepat, memungkinkan bisnis menjalankan aplikasi dengan aman dan dekat dengan data mereka.

Model Jamba 1.5, dioptimalkan dan dihosting oleh NVIDIA, kini dapat diakses melalui Katalog API NVIDIA. Model ini mengintegrasikan arsitektur Mamba, yang dikenal dengan manajemen konteks panjangnya, dan lapisan transformator yang memberikan kemampuan presisi dan inferensi. Modul MoE meningkatkan kapasitas model tanpa tuntutan komputasi tambahan. Setiap blok Jamba terdiri dari delapan lapisan dengan rasio perhatian terhadap Mamba 1:7 dan muat pada satu GPU NVIDIA H100 80 GB. Model ini juga menawarkan jendela konteks token 256 ribu, yang setara dengan sekitar 800 halaman teks, memungkinkan pemrosesan dan pembuatan respons yang lebih akurat.

Fitur penting dari model Jamba 1.5 adalah fungsionalitas pemanggilan fungsi yang didukung oleh pertukaran data JSON. Hal ini meningkatkan interaktivitas AI, memungkinkan model melakukan tindakan kompleks dan memproses kueri data terstruktur. Keserbagunaan tersebut memungkinkan model untuk diterapkan di berbagai industri, mulai dari menghasilkan dokumen keuangan hingga membantu lingkungan ritel, semuanya dengan akurasi real-time.

Selain itu, model Jamba 1.5 kompatibel dengan Search Augmentation Generation (RAG), yang meningkatkan kemampuannya dalam memberikan respons yang akurat dan sesuai konteks. Jendela konteks token yang diperluas memungkinkan model menangani informasi dalam jumlah besar, sehingga ideal untuk analisis data mendetail. RAG telah terbukti bermanfaat dalam lingkungan dengan basis pengetahuan yang luas dan terdistribusi, karena modelnya membantu menyederhanakan pencarian dan meningkatkan akurasi. Pihak yang berminat dapat menjelajahi model Jamba 1.5 di Katalog API NVIDIA. Katalog ini menampilkan berbagai model AI yang didukung oleh layanan mikro NVIDIA NIM untuk mengoptimalkan penerapan dalam aplikasi perusahaan. saus:

Bagikan artikel ini:

Tin tức mới nhất
Gemini、 Google AIを活用したカスタムトラック作成を開始

Gemini、 Google AIを活用したカスタムトラック作成を開始

20/2/26, 00.00

Geminiは、ユーザーが説明文を入力するか写真をアップロードするだけで、カスタム音楽トラックを作成できる新機能を導入しました。

Google、グローバルAIアクセス強化イニシアチブを発表

Google、グローバルAIアクセス強化イニシアチブを発表

20/2/26, 00.00

Googleは、AI技術への世界的なアクセス向上への取り組みを発表し、様々な分野における課題解決のためにこれらのツールが広く利用可能であることの重要性を強調しました。

Sarvam AI と NVIDIA が多言語 AI モデルを加速

Sarvam AI と NVIDIA が多言語 AI モデルを加速

20/2/26, 00.00

インド・ベンガルールのAIスタートアップ企業Sarvam AIは、インドの多様な言語ニーズに応えるため、大規模な多言語基盤モデルを構築するという野心的なプロジェクトに着手しました。

NVIDIA と Nebius が GPU 部分割り当てのメリットを紹介

NVIDIA と Nebius が GPU 部分割り当てのメリットを紹介

20/2/26, 00.00

NVIDIA は Nebius 社と協力し、大規模言語モデル (LLM) 推論における NVIDIA Run:ai の部分的 GPU 割り当てによるパフォーマンス向上を評価しました。

Copyright © 2024 Generatived - All right Reserved.

Bagikan artikel ini:

Bagikan artikel ini:

Generatived

Hãy theo dõi chúng tôi

  • Facebook
  • X

Bahasa

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Generatived AI Logo

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

  • Facebook
  • X

Ikuti kami

Bahasa

Berita terkini
Gemini、 Google AIを活用したカスタムトラック作成を開始

Gemini、 Google AIを活用したカスタムトラック作成を開始

20/2/26, 00.00

Geminiは、ユーザーが説明文を入力するか写真をアップロードするだけで、カスタム音楽トラックを作成できる新機能を導入しました。

Google、グローバルAIアクセス強化イニシアチブを発表

Google、グローバルAIアクセス強化イニシアチブを発表

20/2/26, 00.00

Googleは、AI技術への世界的なアクセス向上への取り組みを発表し、様々な分野における課題解決のためにこれらのツールが広く利用可能であることの重要性を強調しました。

Sarvam AI と NVIDIA が多言語 AI モデルを加速

Sarvam AI と NVIDIA が多言語 AI モデルを加速

20/2/26, 00.00

インド・ベンガルールのAIスタートアップ企業Sarvam AIは、インドの多様な言語ニーズに応えるため、大規模な多言語基盤モデルを構築するという野心的なプロジェクトに着手しました。

NVIDIA と Nebius が GPU 部分割り当てのメリットを紹介

NVIDIA と Nebius が GPU 部分割り当てのメリットを紹介

20/2/26, 00.00

NVIDIA は Nebius 社と協力し、大規模言語モデル (LLM) 推論における NVIDIA Run:ai の部分的 GPU 割り当てによるパフォーマンス向上を評価しました。

bottom of page