Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo
.webp)
GPU NVIDIA RTX cải thiện hiệu suất PC AI
Generatived
4:38 13/6/24
Công nghệ NVIDIA RTX và GeForce RTX đang mở ra một kỷ nguyên mới của PC AI và giới thiệu các tiêu chuẩn mới về hiệu suất cho các tác vụ tăng tốc AI. Các số liệu truyền thống như số khung hình trên giây được bổ sung bằng TOPS (nghìn tỷ phép tính mỗi giây), thước đo sức mạnh tính toán thô. Ví dụ: Copilot+ PC của Microsoft, được trang bị bộ xử lý thần kinh, có thể mang lại hiệu suất hơn 40 TOPS và xử lý các tác vụ AI đơn giản hơn. Tuy nhiên, GPU của NVIDIA, chẳng hạn như GeForce RTX 4090, có hiệu suất vượt quá 1.300 TOPS, cần thiết cho các ứng dụng AI phức tạp hơn.
Ngoài TOPS, hiệu suất của các mô hình ngôn ngữ quy mô lớn (LLM) được đo bằng mã thông báo được tạo mỗi giây và kích thước lô (số lượng đầu vào được xử lý đồng thời). GPU NVIDIA RTX có đủ VRAM và Tensor Cores sẽ vượt trội trong các lĩnh vực này, đặc biệt là khi kết hợp với bộ phát triển phần mềm NVIDIA TensorRT. Sự kết hợp này làm tăng đáng kể thông lượng, đặc biệt là khi kích thước lô tăng lên, khiến GPU RTX trở thành lựa chọn hoàn hảo để xử lý LLM.
Trong lĩnh vực tạo hình ảnh dựa trên AI, tốc độ là yếu tố quan trọng nhất. Stable Diffusion, một mô hình chuyển đổi lời nhắc văn bản thành hình ảnh, chạy nhanh hơn đáng kể trên GPU RTX so với CPU và NPU. Sử dụng TensorRT sẽ tăng tốc quá trình này. Điểm chuẩn của UL Procyon AI Image Generation cho thấy GPU GeForce RTX 4080 SUPER tăng tốc 50%. Các cải tiến TensorRT sắp tới cho Stable Diffusion 3 sẽ cải thiện hơn nữa hiệu suất và cải thiện hiệu suất bộ nhớ.
Những lợi ích thực tế của những tiến bộ này được thể hiện rõ trong các ứng dụng trong thế giới thực. Ví dụ: khi Jan.ai tích hợp TensorRT-LLM vào ứng dụng chatbot của mình, nó đã nhận thấy những cải tiến đáng kể. Giờ đây, người dùng có thể lặp lại các lời nhắc bằng hình ảnh nhanh hơn nhiều trên GPU RTX, với lợi ích bổ sung là giữ dữ liệu ở chế độ riêng tư trên máy hỗ trợ RTX cục bộ của họ. Tác động hữu hình này đến hiệu quả và bảo mật nêu bật tiềm năng của công nghệ NVIDIA trong việc chuyển đổi các tác vụ được AI hỗ trợ. nước xốt:
Chia sẻ bài viết này:
Tin tức mới nhất
Mở rộng dữ liệu AI, các nền tảng AI chuyên ngành.
0:00 16/2/26
Công ty AI Data (Minato-ku, Tokyo) đã thông báo về việc mở rộng nền tảng trí tuệ nhân tạo (AI) chuyên biệt cho từng doanh nghiệp.
Bloom ra mắt dịch vụ hỗ trợ bộ phận kinh doanh AIX mới.
0:00 16/2/26
Bloom (Chiyoda-ku, Tokyo) tập trung vào việc sử dụng trí tuệ nhân tạo (AI) để nâng cao hiệu quả kinh doanh và cung cấp dịch vụ hỗ trợ AI cho các doanh nghiệp.
Nâng cao bảo mật AI Digeon ENSOU
0:00 16/2/26
Digeon (Kobe, tỉnh Hyogo) đã bổ sung chức năng xác thực đăng nhập một lần bằng tài khoản Microsoft và chức năng hạn chế địa chỉ IP vào tác nhân Generative AI
Copyright © 2024 Generatived - All right Reserved.
Chia sẻ bài viết này:
Chia sẻ bài viết này:
Danh mục
Tin tức
AI và luật/hệ thống/kinh tế/xã hội
Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.
Tin tức mới nhất
Mở rộng dữ liệu AI, các nền tảng AI chuyên ngành.
0:00 16/2/26
Công ty AI Data (Minato-ku, Tokyo) đã thông báo về việc mở rộng nền tảng trí tuệ nhân tạo (AI) chuyên biệt cho từng doanh nghiệp.
Bloom ra mắt dịch vụ hỗ trợ bộ phận kinh doanh AIX mới.
0:00 16/2/26
Bloom (Chiyoda-ku, Tokyo) tập trung vào việc sử dụng trí tuệ nhân tạo (AI) để nâng cao hiệu quả kinh doanh và cung cấp dịch vụ hỗ trợ AI cho các doanh nghiệp.
Nâng cao bảo mật AI Digeon ENSOU
0:00 16/2/26
Digeon (Kobe, tỉnh Hyogo) đã bổ sung chức năng xác thực đăng nhập một lần bằng tài khoản Microsoft và chức năng hạn chế địa chỉ IP vào tác nhân Generative AI



%20(1).webp)


