top of page
Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif
logo.png

Kinara mengumumkan “Prosesor AI Ara-2 Edge”

Generatived

13/12/23, 10.01

Kinara™, Inc. telah memperkenalkan prosesor Ara-2 Edge AI, sebuah chip baru yang dirancang untuk memberi daya pada server dan laptop edge. Prosesor ini disetel untuk menangani aplikasi seperti analisis video dan berbagai model AI secara efisien, termasuk yang berbasis arsitektur Transformer. Ara-2 menawarkan lompatan kinerja yang signifikan dibandingkan pendahulunya, menawarkan kekuatan 5 hingga 8 kali lebih besar dibandingkan Ara-1. Kemajuan ini disebabkan oleh kemampuan untuk menyeimbangkan memori on-chip dan bandwidth off-chip, sehingga model besar dapat dijalankan dengan latensi minimal.

Produk terbaru perusahaan ini menjawab meningkatnya permintaan akan model bahasa skala besar (LLM) dan AI generatif. Hal ini biasanya bergantung pada GPU di pusat data, sehingga menyebabkan latensi dan biaya yang tinggi, serta masalah privasi. Ara-2 dari Kinara bertujuan untuk mengatasi masalah ini dengan memungkinkan model AI yang kompleks dengan miliaran parameter dijalankan langsung di perangkat edge. Mesin komputasi prosesor dan perangkat pengembangan perangkat lunak (SDK) yang menyertainya dirancang untuk mendukung dukungan langsung FP32, serta kuantisasi yang tepat dan waktu proses host yang disesuaikan secara dinamis, membuatnya lebih mudah untuk menjalankan GPU yang mahal.

Dalam langkah strategisnya pada Oktober lalu, Kinara bergabung dengan AI Platform Alliance yang dipimpin oleh Ampere dengan tujuan bersama untuk menyederhanakan arsitektur sistem dan mendorong ekosistem AI yang lebih kolaboratif dan terbuka. Kemitraan ini diharapkan dapat memberikan kinerja superior dan peningkatan daya serta efisiensi biaya dibandingkan dengan pengaturan GPU tradisional. Kepemimpinan Ampere telah menyatakan antusiasmenya terhadap potensi kolaborasi untuk mentransformasi penyampaian solusi AI.

Keamanan juga merupakan fitur utama Ara-2, yang mencakup boot aman, akses memori terenkripsi, dan antarmuka host yang aman untuk memenuhi persyaratan penerapan AI perusahaan. Kinara juga mendukung prosesor dengan SDK tangguh yang mencakup kompiler model, penjadwal unit komputasi, dan penyeimbang beban untuk sistem dengan banyak chip. SDK juga menawarkan opsi kuantisasi yang fleksibel, termasuk fungsionalitas kuantisasi terintegrasi Kinara dan kompatibilitas dengan model pra-kuantisasi PyTorch dan TFLite, memastikan perangkat yang komprehensif untuk pengembang.

Bagikan artikel ini:

Tin tức mới nhất
Gudang Data AI yang Ditingkatkan Cloudera

Gudang Data AI yang Ditingkatkan Cloudera

13/2/26, 00.00

Cloudera (Chuo-ku, Tokyo) mengumumkan bahwa mereka telah memperluas Cloudera Data Warehouse, yang didukung oleh Cloudera AI Inference dan Trino, ke lingkungan on-premises,

Jitera mematenkan teknologi sinkronisasi generasi balik AI.

Jitera mematenkan teknologi sinkronisasi generasi balik AI.

13/2/26, 00.00

Jitera (Tokyo) telah memperoleh paten (Paten No. 7789284) untuk proses teknis yang menggunakan Generative AI(LLM) miliknya.

Memperkuat e-commerce generasi berikutnya melalui kemitraan saluran dengan ZETA

Memperkuat e-commerce generasi berikutnya melalui kemitraan saluran dengan ZETA

13/2/26, 00.00

ZETA (Setagaya-ku, Tokyo) telah mengumumkan kemitraan bisnis dengan Channel Corporation (Chiyoda-ku, Tokyo).

Layanan AI dan gudang data baru dari Cloudera

Layanan AI dan gudang data baru dari Cloudera

13/2/26, 00.00

Cloudera (Santa Clara, California) mengumumkan layanan baru yang memperluas AI dan analitik ke lingkungan on-premises.

Copyright © 2024 Generatived - All right Reserved.

Bagikan artikel ini:

Bagikan artikel ini:

Generatived

Hãy theo dõi chúng tôi

  • Facebook
  • X

Bahasa

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Generatived AI Logo

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

  • Facebook
  • X

Ikuti kami

Bahasa

Berita terkini
Gudang Data AI yang Ditingkatkan Cloudera

Gudang Data AI yang Ditingkatkan Cloudera

13/2/26, 00.00

Cloudera (Chuo-ku, Tokyo) mengumumkan bahwa mereka telah memperluas Cloudera Data Warehouse, yang didukung oleh Cloudera AI Inference dan Trino, ke lingkungan on-premises,

Jitera mematenkan teknologi sinkronisasi generasi balik AI.

Jitera mematenkan teknologi sinkronisasi generasi balik AI.

13/2/26, 00.00

Jitera (Tokyo) telah memperoleh paten (Paten No. 7789284) untuk proses teknis yang menggunakan Generative AI(LLM) miliknya.

Memperkuat e-commerce generasi berikutnya melalui kemitraan saluran dengan ZETA

Memperkuat e-commerce generasi berikutnya melalui kemitraan saluran dengan ZETA

13/2/26, 00.00

ZETA (Setagaya-ku, Tokyo) telah mengumumkan kemitraan bisnis dengan Channel Corporation (Chiyoda-ku, Tokyo).

Layanan AI dan gudang data baru dari Cloudera

Layanan AI dan gudang data baru dari Cloudera

13/2/26, 00.00

Cloudera (Santa Clara, California) mengumumkan layanan baru yang memperluas AI dan analitik ke lingkungan on-premises.

bottom of page