Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif

SambaNova Mengumumkan AI DeepSeek-R1 yang Cepat di Cloud
Generatived
14/2/25, 04.45
Perusahaan Generative AI SambaNova mengumumkan bahwa model DeepSeek-R1 671B miliknya kini berjalan pada platform cloud miliknya, memberikan kinerja yang mengagumkan sebesar 198 token per detik. Kinerja ini tak tertandingi dalam industri ini, memberikan pengembang dan perusahaan solusi yang lebih hemat biaya dan efisien untuk inferensi AI dalam skala besar. Kecepatan tinggi ini dikaitkan dengan chip SN40L RDU milik perusahaan, yang diharapkan dapat terus ditingkatkan hingga 5 kali lebih cepat daripada satu rak GPU modern pada akhir tahun.
CEO perusahaan, Rodrigo Liang, menekankan pentingnya kemampuan menjalankan model DeepSeek-R1 secara penuh, bukan hanya versi yang disederhanakan, pada kecepatan tinggi. Kemajuan ini khususnya penting untuk model inferensi yang memerlukan sejumlah besar token untuk menghasilkan output yang baik. Dr. Andrew Ng, tokoh terkemuka dalam AI, juga menyoroti dampak transformatif yang akan dimiliki teknologi SambaNova terhadap kemampuan pengembang untuk menangani model inferensi yang kompleks.
Benchmark independen oleh Artificial Analysis mengonfirmasi bahwa penerapan DeepSeek-R1 di cloud oleh SambaNova merupakan kecepatan output tercepat yang tercatat untuk model ini. Salah satu pendiri Artificial Analysis, George Cameron, mencatat bahwa output cepat penting bagi model inferensi yang menggunakan token ini untuk meningkatkan kualitas respons. Pekerjaan SambaNova bertujuan untuk mempromosikan penggunaan model inferensi dalam skenario di mana latency merupakan faktor utama.
SambaNova memanfaatkan arsitektur aliran datanya yang unik dan desain memori tiga tingkat untuk mengatasi tantangan biaya inferensi tinggi yang terkait dengan DeepSeek-R1. Pendekatan ini secara signifikan mengurangi persyaratan perangkat keras untuk menjalankan model dari 40 rak GPU menjadi satu rak RDU SambaNova. Perusahaan ini siap untuk memperluas kapasitas secara signifikan, dengan menjanjikan untuk memberikan lebih dari 100 kali kapasitas global DeepSeek-R1 saat ini pada akhir tahun, memposisikan RDU sebagai solusi perusahaan yang paling efisien untuk model inferensi.
Bagikan artikel ini:
Tin tức mới nhất
Tiga Perusahaan Mengembangkan Platform RAG Terdistribusi yang Aman
12/5/26, 00.00
Aegis Application, ZenmuTech, dan Technica AI mengumumkan pengembangan bersama solusi "berbagi rahasia × RAG" yang aman
Surgecraft Meluncurkan Platform Dukungan TuneAIBot
12/5/26, 00.00
Surgecraft mengumumkan peluncuran “TuneAIBot,” sebuah platform AI dukungan pelanggan yang dirancang untuk mengelola pertanyaan di berbagai saluran LINE
PKSHA Infinity Menambahkan Obrolan AI ke YOMEL
12/5/26, 00.00
PKSHA Infinity mengumumkan peluncuran fungsi obrolan AI baru untuk platform transkripsi rapatnya, “YOMEL.” Fitur ini memungkinkan pengguna
Copyright © 2024 Generatived - All right Reserved.
Bagikan artikel ini:
Bagikan artikel ini:
Kategori
Berita
AI dan hukum/peraturan/masyarakat
Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.
Berita terkini
Tiga Perusahaan Mengembangkan Platform RAG Terdistribusi yang Aman
12/5/26, 00.00
Aegis Application, ZenmuTech, dan Technica AI mengumumkan pengembangan bersama solusi "berbagi rahasia × RAG" yang aman
Surgecraft Meluncurkan Platform Dukungan TuneAIBot
12/5/26, 00.00
Surgecraft mengumumkan peluncuran “TuneAIBot,” sebuah platform AI dukungan pelanggan yang dirancang untuk mengelola pertanyaan di berbagai saluran LINE
PKSHA Infinity Menambahkan Obrolan AI ke YOMEL
12/5/26, 00.00
PKSHA Infinity mengumumkan peluncuran fungsi obrolan AI baru untuk platform transkripsi rapatnya, “YOMEL.” Fitur ini memungkinkan pengguna



%20(1).webp)

