top of page
Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif
logo.png

Kinara mengumumkan “Prosesor AI Ara-2 Edge”

Generatived

13/12/23, 10.01

Kinara™, Inc. telah memperkenalkan prosesor Ara-2 Edge AI, sebuah chip baru yang dirancang untuk memberi daya pada server dan laptop edge. Prosesor ini disetel untuk menangani aplikasi seperti analisis video dan berbagai model AI secara efisien, termasuk yang berbasis arsitektur Transformer. Ara-2 menawarkan lompatan kinerja yang signifikan dibandingkan pendahulunya, menawarkan kekuatan 5 hingga 8 kali lebih besar dibandingkan Ara-1. Kemajuan ini disebabkan oleh kemampuan untuk menyeimbangkan memori on-chip dan bandwidth off-chip, sehingga model besar dapat dijalankan dengan latensi minimal.

Produk terbaru perusahaan ini menjawab meningkatnya permintaan akan model bahasa skala besar (LLM) dan AI generatif. Hal ini biasanya bergantung pada GPU di pusat data, sehingga menyebabkan latensi dan biaya yang tinggi, serta masalah privasi. Ara-2 dari Kinara bertujuan untuk mengatasi masalah ini dengan memungkinkan model AI yang kompleks dengan miliaran parameter dijalankan langsung di perangkat edge. Mesin komputasi prosesor dan perangkat pengembangan perangkat lunak (SDK) yang menyertainya dirancang untuk mendukung dukungan langsung FP32, serta kuantisasi yang tepat dan waktu proses host yang disesuaikan secara dinamis, membuatnya lebih mudah untuk menjalankan GPU yang mahal.

Dalam langkah strategisnya pada Oktober lalu, Kinara bergabung dengan AI Platform Alliance yang dipimpin oleh Ampere dengan tujuan bersama untuk menyederhanakan arsitektur sistem dan mendorong ekosistem AI yang lebih kolaboratif dan terbuka. Kemitraan ini diharapkan dapat memberikan kinerja superior dan peningkatan daya serta efisiensi biaya dibandingkan dengan pengaturan GPU tradisional. Kepemimpinan Ampere telah menyatakan antusiasmenya terhadap potensi kolaborasi untuk mentransformasi penyampaian solusi AI.

Keamanan juga merupakan fitur utama Ara-2, yang mencakup boot aman, akses memori terenkripsi, dan antarmuka host yang aman untuk memenuhi persyaratan penerapan AI perusahaan. Kinara juga mendukung prosesor dengan SDK tangguh yang mencakup kompiler model, penjadwal unit komputasi, dan penyeimbang beban untuk sistem dengan banyak chip. SDK juga menawarkan opsi kuantisasi yang fleksibel, termasuk fungsionalitas kuantisasi terintegrasi Kinara dan kompatibilitas dengan model pra-kuantisasi PyTorch dan TFLite, memastikan perangkat yang komprehensif untuk pengembang.

Bagikan artikel ini:

Tin tức mới nhất
Qodo Memperkenalkan Sistem Aturan Pengkodean Dinamis Berbasis AI

Qodo Memperkenalkan Sistem Aturan Pengkodean Dinamis Berbasis AI

19/2/26, 00.00

Qodo telah meluncurkan Sistem Aturan inovatif yang dirancang untuk meningkatkan tata kelola AI dalam pengembangan perangkat lunak.

ZETA Meluncurkan Platform Integrasi AI untuk E-commerce

ZETA Meluncurkan Platform Integrasi AI untuk E-commerce

19/2/26, 00.00

ZETA telah mengumumkan peluncuran 'ZETA LINK for AI,' sebuah platform baru yang dirancang untuk memfasilitasi integrasi layanan AI generatif, seperti chatbot AI

AWS India dan Yotta Meningkatkan Infrastruktur Cloud NIC

AWS India dan Yotta Meningkatkan Infrastruktur Cloud NIC

19/2/26, 00.00

Amazon Web Services India telah menjalin kerja sama dengan Yotta Data Services untuk mengimplementasikan AWS Outposts bagi proyek Meghraj 2.0

Blueprint RAG Perusahaan NVIDIA Meningkatkan Kemampuan Agen Cerdas

Blueprint RAG Perusahaan NVIDIA Meningkatkan Kemampuan Agen Cerdas

19/2/26, 00.00

NVIDIA Enterprise RAG Blueprint telah memperkenalkan arsitektur referensi modular baru yang dirancang untuk meningkatkan kemampuan agen cerdas

Copyright © 2024 Generatived - All right Reserved.

Bagikan artikel ini:

Bagikan artikel ini:

Generatived

Hãy theo dõi chúng tôi

  • Facebook
  • X

Bahasa

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Generatived AI Logo

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

  • Facebook
  • X

Ikuti kami

Bahasa

Berita terkini
Qodo Memperkenalkan Sistem Aturan Pengkodean Dinamis Berbasis AI

Qodo Memperkenalkan Sistem Aturan Pengkodean Dinamis Berbasis AI

19/2/26, 00.00

Qodo telah meluncurkan Sistem Aturan inovatif yang dirancang untuk meningkatkan tata kelola AI dalam pengembangan perangkat lunak.

ZETA Meluncurkan Platform Integrasi AI untuk E-commerce

ZETA Meluncurkan Platform Integrasi AI untuk E-commerce

19/2/26, 00.00

ZETA telah mengumumkan peluncuran 'ZETA LINK for AI,' sebuah platform baru yang dirancang untuk memfasilitasi integrasi layanan AI generatif, seperti chatbot AI

AWS India dan Yotta Meningkatkan Infrastruktur Cloud NIC

AWS India dan Yotta Meningkatkan Infrastruktur Cloud NIC

19/2/26, 00.00

Amazon Web Services India telah menjalin kerja sama dengan Yotta Data Services untuk mengimplementasikan AWS Outposts bagi proyek Meghraj 2.0

Blueprint RAG Perusahaan NVIDIA Meningkatkan Kemampuan Agen Cerdas

Blueprint RAG Perusahaan NVIDIA Meningkatkan Kemampuan Agen Cerdas

19/2/26, 00.00

NVIDIA Enterprise RAG Blueprint telah memperkenalkan arsitektur referensi modular baru yang dirancang untuk meningkatkan kemampuan agen cerdas

bottom of page