top of page
Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif
logo.png

Viettel Solutions memperkuat AI untuk bahasa Vietnam

Generatived

20/11/24, 04.30

Viettel Solutions memanfaatkan Kurator NVIDIA NeMo untuk meningkatkan kemampuan AI di Vietnam secara signifikan. Alat ini telah membantu kami membuat kumpulan data berkualitas tinggi untuk melatih model bahasa tingkat lanjut Llama 3 ViettelSolution 8B. Dengan melakukan kurasi kumpulan data yang ekstensif, Viettel Solutions telah meningkatkan akurasi model, mengurangi waktu pelatihan, dan mengurangi ukuran kumpulan data secara signifikan.

Prosesnya dimulai dengan mengumpulkan berbagai data teks bahasa Vietnam dari berbagai sumber, termasuk data penjelajahan web dan Wikipedia. Data ini kemudian distandarisasi dan diformat untuk konsistensi. Viettel Solutions menyempurnakan kumpulan data menggunakan berbagai teknik kurasi data, termasuk pemformatan ulang Unicode dan deduplikasi yang tepat. Langkah-langkah ini penting untuk memastikan keunikan dan kualitas data pelatihan.

Metode pemfilteran berbasis heuristik dan pengklasifikasi juga diterapkan untuk lebih meningkatkan kualitas kumpulan data. Filter ini membantu menghapus konten berkualitas rendah dan menyaring data berdasarkan pola kompleks yang mungkin terlewatkan oleh aturan sederhana. Hasilnya adalah kumpulan data dengan distribusi panjang teks dan jumlah token yang lebih merata, serta mengurangi data outlier dan noise secara signifikan.

Upaya Viettel Solutions tidak hanya meningkatkan kinerja model bahasa, namun juga menjaga keragaman kumpulan data, yang penting untuk membangun model bahasa yang serbaguna dan bertujuan umum. Kolaborasi perusahaan dengan NVIDIA dan penggunaan NeMo Curator menunjukkan potensi AI untuk memenuhi kebutuhan bahasa spesifik di negara-negara yang tidak berbahasa Inggris dan memastikan pengalaman pelanggan yang lebih inklusif dan berdampak.

Bagikan artikel ini:

Tin tức mới nhất
Server Aucfan MCP diluncurkan dengan dukungan AI.

Server Aucfan MCP diluncurkan dengan dukungan AI.

14/1/26, 00.00

Aucfan (Shinagawa-ku, Tokyo) telah meluncurkan server MCP di situs pencarian harga pasarnya, aucfan.com.

Patsnap IP Practice AI Benchmark Dirilis

Patsnap IP Practice AI Benchmark Dirilis

14/1/26, 00.00

Patsnap (Singapura) telah menciptakan "PatentBench," sebuah tolok ukur yang khusus untuk praktik kekayaan intelektual.

FiberMall Meluncurkan Transceiver Optik 400G dan 800G

FiberMall Meluncurkan Transceiver Optik 400G dan 800G

14/1/26, 00.00

Shenzhen, Tiongkok – FiberMall telah memulai produksi massal dan pengiriman transceiver optik 400G dan 800G yang dirancang untuk memenuhi kebutuhan konektivitas berkecepatan tinggi di bidang AI.

KunlunMeta Meluncurkan Perangkat Seluler AI GPT-Station

KunlunMeta Meluncurkan Perangkat Seluler AI GPT-Station

14/1/26, 00.00

LAS VEGAS, 9 Januari 2026 – Consumer Electronics Show (CES) di Las Vegas telah menjadi ajang pameran teknologi kecerdasan buatan (AI) terbaru, dengan perusahaan rintisan asal Tiongkok, KunlunMeta

Copyright © 2024 Generatived - All right Reserved.

Bagikan artikel ini:

Bagikan artikel ini:

Generatived

Hãy theo dõi chúng tôi

  • Facebook
  • X

Bahasa

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Generatived AI Logo

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

  • Facebook
  • X

Ikuti kami

Bahasa

Berita terkini
Server Aucfan MCP diluncurkan dengan dukungan AI.

Server Aucfan MCP diluncurkan dengan dukungan AI.

14/1/26, 00.00

Aucfan (Shinagawa-ku, Tokyo) telah meluncurkan server MCP di situs pencarian harga pasarnya, aucfan.com.

Patsnap IP Practice AI Benchmark Dirilis

Patsnap IP Practice AI Benchmark Dirilis

14/1/26, 00.00

Patsnap (Singapura) telah menciptakan "PatentBench," sebuah tolok ukur yang khusus untuk praktik kekayaan intelektual.

FiberMall Meluncurkan Transceiver Optik 400G dan 800G

FiberMall Meluncurkan Transceiver Optik 400G dan 800G

14/1/26, 00.00

Shenzhen, Tiongkok – FiberMall telah memulai produksi massal dan pengiriman transceiver optik 400G dan 800G yang dirancang untuk memenuhi kebutuhan konektivitas berkecepatan tinggi di bidang AI.

KunlunMeta Meluncurkan Perangkat Seluler AI GPT-Station

KunlunMeta Meluncurkan Perangkat Seluler AI GPT-Station

14/1/26, 00.00

LAS VEGAS, 9 Januari 2026 – Consumer Electronics Show (CES) di Las Vegas telah menjadi ajang pameran teknologi kecerdasan buatan (AI) terbaru, dengan perusahaan rintisan asal Tiongkok, KunlunMeta

bottom of page