Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

Hao AI Lab tích hợp NVIDIA DGX cho nghiên cứu LLM

Generatived

0:00 19/12/25

Phòng thí nghiệm AI Hao tại Đại học California, San Diego, gần đây đã tích hợp hệ thống NVIDIA DGX B200 vào cơ sở hạ tầng nghiên cứu của mình. Hệ thống AI tiên tiến này nhằm mục đích tăng cường nghiên cứu của phòng thí nghiệm về suy luận mô hình ngôn ngữ quy mô lớn (LLM). Trong lĩnh vực này, nhiều nền tảng sản xuất, bao gồm NVIDIA Dynamo, đã áp dụng các khái niệm nghiên cứu của Phòng thí nghiệm AI Hao, chẳng hạn như DistServe.

Việc phòng thí nghiệm được tiếp cận với siêu máy tính DGX B200, được lắp đặt tại Trung tâm Siêu máy tính San Diego, mở ra những khả năng nghiên cứu mới cho cộng đồng Đại học California, San Diego. Phó giáo sư Hao Zhang thuộc Viện Khoa học Dữ liệu Harithiogul nhấn mạnh rằng hiệu năng vượt trội của hệ thống sẽ đẩy nhanh đáng kể quá trình tạo mẫu và thử nghiệm. Các dự án Current đang tận dụng DGX B200 bao gồm FastVideo, nhằm mục đích nhanh chóng tạo ra các video ngắn từ các lời nhắc văn bản, và Lmgame-bench, một bộ công cụ đo hiệu năng kiểm tra LLM bằng cách sử dụng các trò chơi phổ biến như Tetris và Super Mario Bros.

Ngoài các dự án này, Phòng thí nghiệm AI Hao đang nghiên cứu các phương pháp giảm latency trong dịch vụ LLM, nhằm mục đích cải thiện khả năng phản hồi của mô hình theo thời gian thực. Nghiên cứu sinh tiến sĩ Junda Chen nhấn mạnh trọng tâm của phòng thí nghiệm là tận dụng khả năng của DGX B200 để vượt qua giới hạn của các dịch vụ LLM có độ trễ thấp.

Khái niệm suy luận tách biệt, được nhóm DistServe tiên phong, cũng là trọng tâm chính của phòng thí nghiệm chúng tôi. Cách tiếp cận này tối ưu hóa thông lượng hệ thống trong khi vẫn duy trì latency yêu cầu người dùng thấp và giới thiệu một chỉ số hiệu suất mới gọi là "goodput", có tính đến cả chi phí và chất lượng dịch vụ, dẫn đến một hệ thống phục vụ LLM hiệu quả hơn và thân thiện hơn với người dùng. Nghiên cứu của chúng tôi về việc tách biệt quá trình điền trước/giải mã đã chứng minh rằng việc cô lập các quy trình này trên các GPU khác nhau có thể tối đa hóa goodput, tạo điều kiện thuận lợi cho việc mở rộng khối lượng công việc mà không làm giảm chất lượng phản hồi.

Phòng thí nghiệm AI Hao đang hợp tác với nhiều khoa tại Đại học UC San Diego, bao gồm cả y tế và sinh học, để khai thác tối đa sức mạnh của hệ thống NVIDIA DGX B200. Những nỗ lực này là một phần của nỗ lực rộng lớn hơn nhằm khám phá cách các nền tảng AI có thể thúc đẩy nghiên cứu và đổi mới liên ngành.

Nguồn: Blog nhà phát triển NVIDIA

Chia sẻ bài viết này:

Tin tức mới nhất

Zoom ra mắt ứng dụng AI Companion 3.0 giúp tăng cường năng suất làm việc.

0:00 17/12/25

Zoom Communications, Inc. vừa công bố phiên bản mới nhất AI Companion 3.0, được thiết kế để nâng cao năng suất bằng cách tối ưu hóa quy trình làm việc cá nhân và việc tạo nội dung.

đọc thêm

Meta khởi động chiến dịch hỗ trợ sự phát triển của các doanh nghiệp vừa và nhỏ Ấn Độ.

0:00 17/12/25

Meta Platforms vừa triển khai một chiến dịch mới tại Ấn Độ tập trung vào sự hiện diện mạnh mẽ của các doanh nghiệp siêu nhỏ, nhỏ và vừa (MSMEs) trên nền tảng của mình.

đọc thêm

Microsoft khuyến nghị vá lỗi trong thành phần máy chủ React.

0:00 17/12/25

Một lỗ hổng bảo mật nghiêm trọng (CVE-2025-55182) đã được phát hiện trong React Server Components và các framework liên quan như Next.js, gây ra mối đe dọa nghiêm trọng cho các ứng dụng web.

đọc thêm

NVIDIA công bố dòng mô hình AI Nemotron 3.

0:00 17/12/25

Unsloth đang thu hút sự chú ý như một khung phần mềm mã nguồn mở để tinh chỉnh các mô hình ngôn ngữ quy mô lớn (LLM), cung cấp giải pháp đơn giản hóa việc tùy chỉnh mô hình AI.

đọc thêm

Chia sẻ bài viết này:

Danh mục

Trình nâng cao hình ảnh AI

Trình tạo mã AI

Quản lý tác vụ AI

Không có mã/mã thấp

Trình tạo thiết kế đồ họa AI

Trình tạo minh họa/nghệ thuật AI

Tất cả công cụ

Tin tức

AI và luật/hệ thống/kinh tế/xã hội

Các công ty/sản phẩm/công nghệ AI

AI công nghệ lớn

OpenAI/ChatGPT

AI thế hệ sáng tạo

AI thế hệ dựa trên văn bản

AI sáng tạo của Nhật Bản

Cơ bản về AI sáng tạo

Hướng dẫn ứng dụng AI cơ bản

Hồ sơ công ty

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng trang web

Công ty điều hành

Hãy theo dõi chúng tôi

Ngôn ngữ

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Hãy theo dõi chúng tôi

Ngôn ngữ

Danh mục

Tất cả công cụ

Quản lý tác vụ AI

Trình tạo thiết kế đồ họa AI

Không có mã/mã thấp

Trình tạo mã AI

Trình nâng cao hình ảnh AI

Trình tạo minh họa/nghệ thuật AI

AI và luật/hệ thống/kinh tế/xã hội

Các công ty/sản phẩm/công nghệ AI

AI công nghệ lớn

OpenAI/ChatGPT

AI thế hệ sáng tạo

AI thế hệ dựa trên văn bản

AI sáng tạo của Nhật Bản

Cơ bản về AI tạo ra

Hướng dẫn ứng dụng AI cơ bản

Tin tức

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng của trang web

Công ty điều hành

Hồ sơ công ty

Tin tức mới nhất

Zoom ra mắt ứng dụng AI Companion 3.0 giúp tăng cường năng suất làm việc.

0:00 17/12/25

Zoom Communications, Inc. vừa công bố phiên bản mới nhất AI Companion 3.0, được thiết kế để nâng cao năng suất bằng cách tối ưu hóa quy trình làm việc cá nhân và việc tạo nội dung.

đọc thêm

Meta khởi động chiến dịch hỗ trợ sự phát triển của các doanh nghiệp vừa và nhỏ Ấn Độ.

0:00 17/12/25

Meta Platforms vừa triển khai một chiến dịch mới tại Ấn Độ tập trung vào sự hiện diện mạnh mẽ của các doanh nghiệp siêu nhỏ, nhỏ và vừa (MSMEs) trên nền tảng của mình.

đọc thêm

Microsoft khuyến nghị vá lỗi trong thành phần máy chủ React.

0:00 17/12/25

Một lỗ hổng bảo mật nghiêm trọng (CVE-2025-55182) đã được phát hiện trong React Server Components và các framework liên quan như Next.js, gây ra mối đe dọa nghiêm trọng cho các ứng dụng web.

đọc thêm

NVIDIA công bố dòng mô hình AI Nemotron 3.

0:00 17/12/25

Unsloth đang thu hút sự chú ý như một khung phần mềm mã nguồn mở để tinh chỉnh các mô hình ngôn ngữ quy mô lớn (LLM), cung cấp giải pháp đơn giản hóa việc tùy chỉnh mô hình AI.

đọc thêm