Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif

Desain arsitektur referensi lingkungan inferensi AI WEKA
Generatived
24/11/21 4:30
WEKA (Atlanta dan Campbell, California), sebuah perusahaan platform data mentah AI, mengumumkan solusi arsitektur referensi baru yang menyederhanakan pengembangan dan implementasi lingkungan inferensi AI perusahaan. Platform Referensi WEKA AI RAG (WARRP) memberikan cetak biru kepada pengembang AI generatif dan arsitek cloud untuk mengembangkan kerangka infrastruktur inferensi yang kuat.
Kerangka kerja ini, yang mencakup teknologi RAG, memungkinkan model bahasa skala besar (LLM) mengumpulkan data baru dari sumber eksternal dan meningkatkan efisiensi proses inferensi AI. Menurut Laporan Tren AI Global terbaru dari S&P Global Market Intelligence, AI generatif adalah mode AI dengan tingkat adopsi tertinggi oleh perusahaan, dan cakupannya melebihi aplikasi AI lainnya.
WARRP menyediakan cetak biru komponen modular yang komprehensif untuk membantu perusahaan dengan cepat membangun dan mengimplementasikan jalur inferensi AI berbasis RAG. Arsitektur referensi ini menggunakan perangkat lunak WEKA® Data Platform sebagai lapisan dasar, kerangka AI perusahaan teratas NVIDIA, beban kerja AI canggih dan kemampuan orkestrasi GPU Run:ai, serta teknologi perangkat lunak manajemen data terintegrasi sumber terbuka dan komersial yang populer.
“Gelombang pertama teknologi AI generatif akan mulai diterapkan di perusahaan pada tahun 2023, dan banyak institusi memfokuskan sumber daya mereka untuk melatih model AI,” kata Presiden WEKA Shimon Ben-David. “Melakukan inferensi AI sangatlah menantang, dan kami memanfaatkan solusi AI dan infrastruktur cloud yang terdepan di industri seperti WEKA, NVIDIA, Run:ai, Kubernetes, dan Milvus untuk mengembangkan WARRP.”
WARRP menyediakan kerangka kerja yang fleksibel dan modular yang menunjukkan skalabilitas, kemampuan beradaptasi, dan kinerja yang sangat baik dalam lingkungan produksi. Versi pertama arsitektur referensi ini tersedia untuk diunduh gratis, dan peserta Supercomputing 2024 dapat mempelajari lebih lanjut dan melihat demo solusi baru di stan WEKA. Informasi lebih lanjut tersedia di https://www.weka.io/resources/reference-architecture/warrp-weka-ai-rag-reference-platform/.
Bagikan artikel ini:
Tin tức mới nhất
Alplus Co., Ltd. Industri AI mengkhususkan pengembangan GPU
25/2/17 4:30
al+ Inc. (Minato-ku, Tokyo) bekerja sama dengan Profesor Duc-Minh Nguyen untuk mengembangkan GPU khusus industri yang menggunakan AI.
OpenAI bekerja sama dengan The Guardian untuk meningkatkan kemampuan obrolan Berita GPT
25/2/17 4:30
OpenAI telah membentuk kemitraan strategis dengan Guardian Media Group, yang bertujuan untuk meningkatkan pengalaman ChatGPT bagi basis penggunanya yang luas.
Acara dukungan kewirausahaan Lanitech diadakan
25/2/17 4:30
lanitech (Shibuya-ku, Tokyo) akan mengadakan acara "Bloom Startup Hub" di Creative Garage Hoshigaoka dengan tema bekerja dengan bahagia dan bertujuan untuk masyarakat yang berkelanjutan.
Copyright © 2024 Generatived - All right Reserved.
Bagikan artikel ini:
Bagikan artikel ini:
Kategori
Berita
AI dan hukum/peraturan/masyarakat
Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.
Berita terkini
Alplus Co., Ltd. Industri AI mengkhususkan pengembangan GPU
25/2/17 4:30
al+ Inc. (Minato-ku, Tokyo) bekerja sama dengan Profesor Duc-Minh Nguyen untuk mengembangkan GPU khusus industri yang menggunakan AI.
OpenAI bekerja sama dengan The Guardian untuk meningkatkan kemampuan obrolan Berita GPT
25/2/17 4:30
OpenAI telah membentuk kemitraan strategis dengan Guardian Media Group, yang bertujuan untuk meningkatkan pengalaman ChatGPT bagi basis penggunanya yang luas.
Acara dukungan kewirausahaan Lanitech diadakan
25/2/17 4:30
lanitech (Shibuya-ku, Tokyo) akan mengadakan acara "Bloom Startup Hub" di Creative Garage Hoshigaoka dengan tema bekerja dengan bahagia dan bertujuan untuk masyarakat yang berkelanjutan.