Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif
WEKA Meluncurkan Blueprint Inferensi AI di Supercomputing 2024
Generatived
24/11/21 4:30
WEKA, perusahaan platform data berbasis AI, mengumumkan solusi arsitektur referensi baru di Supercomputing 2024 di Atlanta dan Campbell, California. WEKA AI RAG Reference Platform (WARRP) bertujuan untuk menyederhanakan dan merampingkan pengembangan dan penerapan lingkungan inferensi AI perusahaan. Solusi ini menyediakan cetak biru bagi pengembang dan arsitek cloud untuk menciptakan kerangka kerja infrastruktur yang tangguh menggunakan Search Augmentation Generation (RAG), sebuah teknik yang menyempurnakan model bahasa besar (LLM) dengan memungkinkan mereka mengumpulkan data baru dari sumber eksternal.
Menurut survei terbaru oleh S&P Global Market Intelligence, Generative AI(GenAI) telah melampaui aplikasi lain dan menjadi modalitas AI yang paling banyak digunakan di perusahaan. Tantangan bagi perusahaan yang menerapkan LLM adalah memperoleh dan mengontekstualisasikan data baru dari berbagai lingkungan secara efektif sehingga dapat mendukung inferensi AI. RAG adalah teknik terdepan untuk inferensi AI, yang membantu mengurangi halusinasi dalam model AI dan meningkatkan akurasi dan keandalan output. Namun, membangun lingkungan produksi yang mendukung kerangka kerja RAG dalam skala besar menjadi rumit karena evolusi arsitektur dan alat yang cepat.
WARRP menyediakan cetak biru komponen modular yang komprehensif untuk mengembangkan dan menerapkan lingkungan inferensi AI kelas dunia dengan cepat. WARRP didasarkan pada perangkat lunak WEKA® Data Platform dan mengintegrasikan kerangka kerja AI perusahaan NVIDIA seperti layanan mikro NVIDIA NIM™ dan NVIDIA NeMo™ Retriever. Platform ini juga mencakup beban kerja AI tingkat lanjut dan kemampuan orkestrasi GPU dari Run:ai, serta teknologi manajemen data populer seperti Kubernetes dan Milvus Vector DB.
Shimon Ben-David, Chief Technology Officer di WEKA, menekankan pentingnya penyederhanaan proses implementasi RAG untuk meningkatkan akurasi, keamanan, dan efektivitas biaya pelaksanaan model AI perusahaan. WARRP menyediakan kerangka kerja yang fleksibel untuk mendukung berbagai implementasi LLM, yang memungkinkan skalabilitas, adaptasi, dan kinerja yang unggul dalam lingkungan produksi. Versi pertama arsitektur referensi WARRP kini tersedia untuk diunduh, dan peserta Supercomputing 2024 dapat mengunjungi stan WEKA untuk mendapatkan detail dan demo selengkapnya.
Bagikan artikel ini:
Berita terkini
Memperkenalkan Agen AI Spicecode
24/12/13 4:30
Spicecode (Chuo-ku, Tokyo) mengumumkan akan menyediakan fungsionalitas agen AI untuk layanan ERP-nya "Locale Order for B2B" mulai paruh pertama tahun 2025.
Riset Pasar Generative AI Aung Consulting
24/12/13 4:30
Aung Consulting (Chiyoda-ku, Tokyo) menyelidiki volume pencarian untuk Generative AI di 18 negara dan wilayah di seluruh dunia.
OSIRO meluncurkan komunitas AI
24/12/13 4:30
OSIRO (Shibuya-ku, Tokyo) telah mengumumkan akan meluncurkan "Linear," sebuah komunitas daring yang diselenggarakan oleh konsultan AI/ Digital Transformation Yosuke Kurashima, pada platform "OSIRO".
Copyright © 2024 Generatived - All right Reserved.
Bagikan artikel ini:
Bagikan artikel ini:
Kategori
Berita
AI dan hukum/peraturan/masyarakat
Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.
Profil perusahaan
Berita terkini
Memperkenalkan Agen AI Spicecode
24/12/13 4:30
Spicecode (Chuo-ku, Tokyo) mengumumkan akan menyediakan fungsionalitas agen AI untuk layanan ERP-nya "Locale Order for B2B" mulai paruh pertama tahun 2025.
Riset Pasar Generative AI Aung Consulting
24/12/13 4:30
Aung Consulting (Chiyoda-ku, Tokyo) menyelidiki volume pencarian untuk Generative AI di 18 negara dan wilayah di seluruh dunia.
OSIRO meluncurkan komunitas AI
24/12/13 4:30
OSIRO (Shibuya-ku, Tokyo) telah mengumumkan akan meluncurkan "Linear," sebuah komunitas daring yang diselenggarakan oleh konsultan AI/ Digital Transformation Yosuke Kurashima, pada platform "OSIRO".