Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo
%20(1).webp)
NVIDIA giới thiệu quy trình đánh giá dữ liệu tổng hợp.
Generatived
0:00 16/12/25
Việc xác thực các hệ thống AI trong các ngành được quản lý chặt chẽ như y tế, tài chính và chính phủ đặt ra những thách thức đáng kể do sự khan hiếm dữ liệu và các hạn chế về quyền riêng tư. Dữ liệu thực tế thường được yêu cầu để đánh giá hiệu năng thường không thể truy cập được do các thỏa thuận bảo mật, sự phân mảnh dữ liệu hoặc chi phí chú thích cao. Tình trạng này kìm hãm sự đổi mới và buộc việc đánh giá AI phải dựa vào phỏng đoán. Các tiêu chuẩn đánh giá mạnh mẽ đặc biệt cần thiết cho các ứng dụng của chính phủ như trợ lý AI phục vụ công dân, nhưng không được phép làm tổn hại đến dữ liệu cá nhân.
Để giải quyết những thách thức này trên nhiều ngành công nghiệp, một quy trình đánh giá AI bảo mật quyền riêng tư đã được giới thiệu. Quy trình này cho phép tạo ra các tập dữ liệu tổng hợp chuyên biệt theo từng lĩnh vực và các tiêu chuẩn đánh giá có thể tái tạo mà không làm lộ các bản ghi thực tế. Bằng cách tận dụng các công cụ như NVIDIA NeMo Data Designer và NVIDIA NeMo Evaluator, các mô hình ngôn ngữ quy mô lớn (LLM) có thể được tạo ra và đánh giá một cách hiệu quả và an toàn. Phương pháp này đã được chứng minh trong môi trường chăm sóc sức khỏe, tạo ra các ghi chú phân loại bệnh nhân tổng hợp trong phòng cấp cứu.
Dữ liệu tổng hợp đang nổi lên như một nguồn tài nguyên quan trọng cho sự phát triển trí tuệ nhân tạo (AI) trong các lĩnh vực nhạy cảm về quyền riêng tư. Nó cho phép tạo ra các kịch bản đa dạng và các trường hợp ngoại lệ hiếm gặp trong khi vẫn tuân thủ các quy định về quyền riêng tư. Việc sử dụng dữ liệu tổng hợp giúp rút ngắn thời gian phát triển và cho phép tạo ra các tập dữ liệu và tiêu chuẩn đánh giá một cách nhanh chóng, điều này đặc biệt có lợi trong lĩnh vực chăm sóc sức khỏe. AI có tiềm năng cải thiện việc phân loại bệnh nhân tại phòng cấp cứu, nhưng việc hạn chế tiếp cận dữ liệu bệnh nhân thực tế vẫn là một thách thức.
Để bắt đầu với việc tạo dữ liệu tổng hợp và đánh giá mô hình, các nhà phát triển có thể tạo các tập dữ liệu tổng hợp bằng NeMo Data Designer và kiểm tra hiệu năng dự đoán của mô hình bằng NeMo Evaluator. Quá trình này bao gồm việc tạo các ghi chú phân loại tổng hợp với các ràng buộc thực tế và đánh giá các dự đoán của LLM bằng cách sử dụng các tiêu chuẩn tự động. Quy trình này tạo điều kiện thuận lợi cho việc mở rộng quy mô các mẫu được gắn nhãn mà không ảnh hưởng đến quyền riêng tư của bệnh nhân và có thể được tích hợp vào các quy trình CI/CD để cho phép xác thực liên tục. Các công cụ và mô hình được trình bày ở đây, bao gồm mô hình NVIDIA Nemotron và API NVIDIA NIM, đều có sẵn trên các nền tảng như Hugging Face và NVIDIA Build.
Chia sẻ bài viết này:


