top of page
Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif
logo.png

AI21 Labs mengumumkan model bahasa Jamba 1.5

Generatived

23/8/24, 09.00

AI21 Labs baru-baru ini mengumumkan rangkaian model Jamba 1.5, rangkaian model bahasa skala besar (LLM) canggih yang cocok untuk berbagai tugas AI generatif. Tugas-tugas ini mencakup pembuatan konten, peringkasan dokumen, perbandingan, dan penggalian wawasan dari kumpulan data yang luas. Model ini memanfaatkan arsitektur hibrid yang menggabungkan struktur Transformer dan Mamba dengan modul Mix of Experts (MoE) untuk meningkatkan efisiensi, latensi, dan penanganan konteks yang panjang. Ini juga dirancang agar mudah diterapkan pada platform yang dipercepat, memungkinkan bisnis menjalankan aplikasi dengan aman dan dekat dengan data mereka.

Model Jamba 1.5, dioptimalkan dan dihosting oleh NVIDIA, kini dapat diakses melalui Katalog API NVIDIA. Model ini mengintegrasikan arsitektur Mamba, yang dikenal dengan manajemen konteks panjangnya, dan lapisan transformator yang memberikan kemampuan presisi dan inferensi. Modul MoE meningkatkan kapasitas model tanpa tuntutan komputasi tambahan. Setiap blok Jamba terdiri dari delapan lapisan dengan rasio perhatian terhadap Mamba 1:7 dan muat pada satu GPU NVIDIA H100 80 GB. Model ini juga menawarkan jendela konteks token 256 ribu, yang setara dengan sekitar 800 halaman teks, memungkinkan pemrosesan dan pembuatan respons yang lebih akurat.

Fitur penting dari model Jamba 1.5 adalah fungsionalitas pemanggilan fungsi yang didukung oleh pertukaran data JSON. Hal ini meningkatkan interaktivitas AI, memungkinkan model melakukan tindakan kompleks dan memproses kueri data terstruktur. Keserbagunaan tersebut memungkinkan model untuk diterapkan di berbagai industri, mulai dari menghasilkan dokumen keuangan hingga membantu lingkungan ritel, semuanya dengan akurasi real-time.

Selain itu, model Jamba 1.5 kompatibel dengan Search Augmentation Generation (RAG), yang meningkatkan kemampuannya dalam memberikan respons yang akurat dan sesuai konteks. Jendela konteks token yang diperluas memungkinkan model menangani informasi dalam jumlah besar, sehingga ideal untuk analisis data mendetail. RAG telah terbukti bermanfaat dalam lingkungan dengan basis pengetahuan yang luas dan terdistribusi, karena modelnya membantu menyederhanakan pencarian dan meningkatkan akurasi. Pihak yang berminat dapat menjelajahi model Jamba 1.5 di Katalog API NVIDIA. Katalog ini menampilkan berbagai model AI yang didukung oleh layanan mikro NVIDIA NIM untuk mengoptimalkan penerapan dalam aplikasi perusahaan. saus:

Bagikan artikel ini:

Tin tức mới nhất
Gudang Data AI yang Ditingkatkan Cloudera

Gudang Data AI yang Ditingkatkan Cloudera

13/2/26, 00.00

Cloudera (Chuo-ku, Tokyo) mengumumkan bahwa mereka telah memperluas Cloudera Data Warehouse, yang didukung oleh Cloudera AI Inference dan Trino, ke lingkungan on-premises,

Jitera mematenkan teknologi sinkronisasi generasi balik AI.

Jitera mematenkan teknologi sinkronisasi generasi balik AI.

13/2/26, 00.00

Jitera (Tokyo) telah memperoleh paten (Paten No. 7789284) untuk proses teknis yang menggunakan Generative AI(LLM) miliknya.

Memperkuat e-commerce generasi berikutnya melalui kemitraan saluran dengan ZETA

Memperkuat e-commerce generasi berikutnya melalui kemitraan saluran dengan ZETA

13/2/26, 00.00

ZETA (Setagaya-ku, Tokyo) telah mengumumkan kemitraan bisnis dengan Channel Corporation (Chiyoda-ku, Tokyo).

Layanan AI dan gudang data baru dari Cloudera

Layanan AI dan gudang data baru dari Cloudera

13/2/26, 00.00

Cloudera (Santa Clara, California) mengumumkan layanan baru yang memperluas AI dan analitik ke lingkungan on-premises.

Copyright © 2024 Generatived - All right Reserved.

Bagikan artikel ini:

Bagikan artikel ini:

Generatived

Hãy theo dõi chúng tôi

  • Facebook
  • X

Bahasa

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Generatived AI Logo

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

  • Facebook
  • X

Ikuti kami

Bahasa

Berita terkini
Gudang Data AI yang Ditingkatkan Cloudera

Gudang Data AI yang Ditingkatkan Cloudera

13/2/26, 00.00

Cloudera (Chuo-ku, Tokyo) mengumumkan bahwa mereka telah memperluas Cloudera Data Warehouse, yang didukung oleh Cloudera AI Inference dan Trino, ke lingkungan on-premises,

Jitera mematenkan teknologi sinkronisasi generasi balik AI.

Jitera mematenkan teknologi sinkronisasi generasi balik AI.

13/2/26, 00.00

Jitera (Tokyo) telah memperoleh paten (Paten No. 7789284) untuk proses teknis yang menggunakan Generative AI(LLM) miliknya.

Memperkuat e-commerce generasi berikutnya melalui kemitraan saluran dengan ZETA

Memperkuat e-commerce generasi berikutnya melalui kemitraan saluran dengan ZETA

13/2/26, 00.00

ZETA (Setagaya-ku, Tokyo) telah mengumumkan kemitraan bisnis dengan Channel Corporation (Chiyoda-ku, Tokyo).

Layanan AI dan gudang data baru dari Cloudera

Layanan AI dan gudang data baru dari Cloudera

13/2/26, 00.00

Cloudera (Santa Clara, California) mengumumkan layanan baru yang memperluas AI dan analitik ke lingkungan on-premises.

bottom of page