top of page

Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

logo.png

Viettel Solutions tăng cường AI cho tiếng Việt

Generatived

4:30 20/11/24

Viettel Solutions tận dụng NVIDIA NeMo Curator để nâng cao đáng kể năng lực AI của Việt Nam. Công cụ này đã giúp chúng tôi tạo ra bộ dữ liệu chất lượng cao để đào tạo mô hình ngôn ngữ nâng cao Llama 3 VietSolution 8B. Bằng cách quản lý một tập dữ liệu mở rộng, Giải pháp Viễn thông đã cải thiện độ chính xác của mô hình, giảm thời gian đào tạo và giảm đáng kể kích thước tập dữ liệu.

Quá trình này bắt đầu bằng việc thu thập nhiều dữ liệu văn bản tiếng Việt từ nhiều nguồn, bao gồm dữ liệu được thu thập trên web và Wikipedia. Dữ liệu này sau đó được chuẩn hóa và định dạng để đảm bảo tính nhất quán. Giải pháp Viettel đã tinh chỉnh tập dữ liệu bằng nhiều kỹ thuật quản lý dữ liệu khác nhau, bao gồm định dạng lại Unicode và sao chép chính xác. Các bước này rất quan trọng trong việc đảm bảo tính duy nhất và chất lượng của dữ liệu đào tạo.

Các phương pháp lọc dựa trên heuristic và phân loại cũng được áp dụng để nâng cao hơn nữa chất lượng của bộ dữ liệu. Những bộ lọc này đã giúp loại bỏ nội dung chất lượng thấp và tinh chỉnh dữ liệu dựa trên các mẫu phức tạp mà các quy tắc đơn giản có thể bỏ sót. Kết quả là một tập dữ liệu có sự phân bố đồng đều hơn về độ dài văn bản và số lượng mã thông báo, đồng thời giảm đáng kể các dữ liệu ngoại lệ và nhiễu.

Những nỗ lực của Viettel Solutions không chỉ cải thiện hiệu suất của mô hình ngôn ngữ mà còn duy trì tính đa dạng của tập dữ liệu, điều cần thiết để xây dựng các mô hình ngôn ngữ đa năng và có mục đích chung. Sự hợp tác của công ty với NVIDIA và sử dụng NeMo Curator chứng tỏ tiềm năng của AI trong việc đáp ứng nhu cầu ngôn ngữ cụ thể của các quốc gia không nói tiếng Anh và đảm bảo trải nghiệm khách hàng toàn diện và có tác động hơn.

Chia sẻ bài viết này:

Tin tức mới nhất
NVIDIA công bố TensorRT Edge-LLM để tăng cường trí tuệ nhân tạo (AI).

NVIDIA công bố TensorRT Edge-LLM để tăng cường trí tuệ nhân tạo (AI).

0:00 14/1/26

NVIDIA đã công bố TensorRT Edge-LLM, một khung phần mềm mã nguồn mở C++ mới được thiết kế để cải thiện hiệu suất của các mô hình ngôn ngữ quy mô lớn (LLM)

DeepSeek báo cáo sự gia tăng nhanh chóng trong việc áp dụng Generative AI trên toàn cầu.

DeepSeek báo cáo sự gia tăng nhanh chóng trong việc áp dụng Generative AI trên toàn cầu.

0:00 14/1/26

Theo số liệu thống kê mới nhất, việc ứng dụng trí tuệ nhân tạo (AI) trên toàn cầu đang tăng đều đặn, dự kiến sẽ tăng 1,2 điểm phần trăm vào nửa cuối năm 2025.

Phòng thí nghiệm quốc gia Lawrence Berkeley ra mắt tr�ợ lý AI cho máy gia tốc

Phòng thí nghiệm quốc gia Lawrence Berkeley ra mắt trợ lý AI cho máy gia tốc

0:00 14/1/26

Giữa khung cảnh tuyệt đẹp của Berkeley, California, một hệ thống trí tuệ nhân tạo (AI) đang nâng cao hiệu quả của các thí nghiệm vật lý rủi ro cao tại máy gia tốc hạt nổi tiếng.

Nền tảng NVIDIA AI Blueprint hỗ trợ mạnh mẽ cho các danh mục sản phẩm thương mại điện tử.

Nền tảng NVIDIA AI Blueprint hỗ trợ mạnh mẽ cho các danh mục sản phẩm thương mại điện tử.

0:00 14/1/26

Các danh mục thương mại điện tử thường bị hạn chế bởi thông tin sản phẩm ít ỏi, ảnh hưởng đến khả năng hiển thị sản phẩm và sự tương tác của khách hàng.

Copyright © 2024 Generatived - All right Reserved.

Chia sẻ bài viết này:

Chia sẻ bài viết này:

Generatived AI Logo

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

  • Facebook
  • X

Hãy theo dõi chúng tôi

Ngôn ngữ

Tin tức mới nhất
NVIDIA công bố TensorRT Edge-LLM để tăng cường trí tuệ nhân tạo (AI).

NVIDIA công bố TensorRT Edge-LLM để tăng cường trí tuệ nhân tạo (AI).

0:00 14/1/26

NVIDIA đã công bố TensorRT Edge-LLM, một khung phần mềm mã nguồn mở C++ mới được thiết kế để cải thiện hiệu suất của các mô hình ngôn ngữ quy mô lớn (LLM)

DeepSeek báo cáo sự gia tăng nhanh chóng trong việc áp dụng Generative AI trên toàn cầu.

DeepSeek báo cáo sự gia tăng nhanh chóng trong việc áp dụng Generative AI trên toàn cầu.

0:00 14/1/26

Theo số liệu thống kê mới nhất, việc ứng dụng trí tuệ nhân tạo (AI) trên toàn cầu đang tăng đều đặn, dự kiến sẽ tăng 1,2 điểm phần trăm vào nửa cuối năm 2025.

Phòng thí nghiệm quốc gia Lawrence Berkeley ra mắt trợ lý AI cho máy gia tốc

Phòng thí nghiệm quốc gia Lawrence Berkeley ra mắt trợ lý AI cho máy gia tốc

0:00 14/1/26

Giữa khung cảnh tuyệt đẹp của Berkeley, California, một hệ thống trí tuệ nhân tạo (AI) đang nâng cao hiệu quả của các thí nghiệm vật lý rủi ro cao tại máy gia tốc hạt nổi tiếng.

Nền tảng NVIDIA AI Blueprint hỗ trợ mạnh mẽ cho các danh mục sản phẩm thương mại điện tử.

Nền tảng NVIDIA AI Blueprint hỗ trợ mạnh mẽ cho các danh mục sản phẩm thương mại điện tử.

0:00 14/1/26

Các danh mục thương mại điện tử thường bị hạn chế bởi thông tin sản phẩm ít ỏi, ảnh hưởng đến khả năng hiển thị sản phẩm và sự tương tác của khách hàng.

bottom of page