top of page
Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif
logo.png

Viettel Solutions memperkuat AI untuk bahasa Vietnam

Generatived

20/11/24, 04.30

Viettel Solutions memanfaatkan Kurator NVIDIA NeMo untuk meningkatkan kemampuan AI di Vietnam secara signifikan. Alat ini telah membantu kami membuat kumpulan data berkualitas tinggi untuk melatih model bahasa tingkat lanjut Llama 3 ViettelSolution 8B. Dengan melakukan kurasi kumpulan data yang ekstensif, Viettel Solutions telah meningkatkan akurasi model, mengurangi waktu pelatihan, dan mengurangi ukuran kumpulan data secara signifikan.

Prosesnya dimulai dengan mengumpulkan berbagai data teks bahasa Vietnam dari berbagai sumber, termasuk data penjelajahan web dan Wikipedia. Data ini kemudian distandarisasi dan diformat untuk konsistensi. Viettel Solutions menyempurnakan kumpulan data menggunakan berbagai teknik kurasi data, termasuk pemformatan ulang Unicode dan deduplikasi yang tepat. Langkah-langkah ini penting untuk memastikan keunikan dan kualitas data pelatihan.

Metode pemfilteran berbasis heuristik dan pengklasifikasi juga diterapkan untuk lebih meningkatkan kualitas kumpulan data. Filter ini membantu menghapus konten berkualitas rendah dan menyaring data berdasarkan pola kompleks yang mungkin terlewatkan oleh aturan sederhana. Hasilnya adalah kumpulan data dengan distribusi panjang teks dan jumlah token yang lebih merata, serta mengurangi data outlier dan noise secara signifikan.

Upaya Viettel Solutions tidak hanya meningkatkan kinerja model bahasa, namun juga menjaga keragaman kumpulan data, yang penting untuk membangun model bahasa yang serbaguna dan bertujuan umum. Kolaborasi perusahaan dengan NVIDIA dan penggunaan NeMo Curator menunjukkan potensi AI untuk memenuhi kebutuhan bahasa spesifik di negara-negara yang tidak berbahasa Inggris dan memastikan pengalaman pelanggan yang lebih inklusif dan berdampak.

Bagikan artikel ini:

Tin tức mới nhất
NVIDIA Umumkan TensorRT Edge-LLM untuk Peningkatan AI

NVIDIA Umumkan TensorRT Edge-LLM untuk Peningkatan AI

14/1/26, 00.00

NVIDIA telah mengumumkan TensorRT Edge-LLM, sebuah kerangka kerja C++ sumber terbuka baru yang dirancang untuk meningkatkan kinerja model bahasa skala besar (LLM) dan model bahasa visi

DeepSeek Melaporkan Peningkatan Pesat dalam Adopsi Generative AI Secara Global

DeepSeek Melaporkan Peningkatan Pesat dalam Adopsi Generative AI Secara Global

14/1/26, 00.00

Statistik terbaru menunjukkan bahwa adopsi kecerdasan buatan (AI) secara global terus meningkat, dan diperkirakan akan tumbuh sebesar 1,2 poin persentase pada paruh kedua tahun 2025.

Laboratorium Nasional Lawrence Berkeley meluncurkan AI asisten akselerator.

Laboratorium Nasional Lawrence Berkeley meluncurkan AI asisten akselerator.

14/1/26, 00.00

Di lanskap indah Berkeley, California, sistem AI meningkatkan efisiensi eksperimen fisika berisiko tinggi di akselerator partikel ternama.

NVIDIA AI Blueprint Memberdayakan Katalog E-Commerce

NVIDIA AI Blueprint Memberdayakan Katalog E-Commerce

14/1/26, 00.00

Katalog e-commerce seringkali terhambat oleh keterbatasan informasi produk, yang berdampak pada kesadaran produk dan keterlibatan pelanggan.

Copyright © 2024 Generatived - All right Reserved.

Bagikan artikel ini:

Bagikan artikel ini:

Generatived

Hãy theo dõi chúng tôi

  • Facebook
  • X

Bahasa

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Generatived AI Logo

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

  • Facebook
  • X

Ikuti kami

Bahasa

Berita terkini
NVIDIA Umumkan TensorRT Edge-LLM untuk Peningkatan AI

NVIDIA Umumkan TensorRT Edge-LLM untuk Peningkatan AI

14/1/26, 00.00

NVIDIA telah mengumumkan TensorRT Edge-LLM, sebuah kerangka kerja C++ sumber terbuka baru yang dirancang untuk meningkatkan kinerja model bahasa skala besar (LLM) dan model bahasa visi

DeepSeek Melaporkan Peningkatan Pesat dalam Adopsi Generative AI Secara Global

DeepSeek Melaporkan Peningkatan Pesat dalam Adopsi Generative AI Secara Global

14/1/26, 00.00

Statistik terbaru menunjukkan bahwa adopsi kecerdasan buatan (AI) secara global terus meningkat, dan diperkirakan akan tumbuh sebesar 1,2 poin persentase pada paruh kedua tahun 2025.

Laboratorium Nasional Lawrence Berkeley meluncurkan AI asisten akselerator.

Laboratorium Nasional Lawrence Berkeley meluncurkan AI asisten akselerator.

14/1/26, 00.00

Di lanskap indah Berkeley, California, sistem AI meningkatkan efisiensi eksperimen fisika berisiko tinggi di akselerator partikel ternama.

NVIDIA AI Blueprint Memberdayakan Katalog E-Commerce

NVIDIA AI Blueprint Memberdayakan Katalog E-Commerce

14/1/26, 00.00

Katalog e-commerce seringkali terhambat oleh keterbatasan informasi produk, yang berdampak pada kesadaran produk dan keterlibatan pelanggan.

bottom of page