Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

Google Tech công bố Managed Lustre để tăng cường suy luận AI

Generatived

0:00 5/11/25

Nhu cầu về cơ sở hạ tầng suy luận AI dự kiến sẽ tăng nhanh hơn so với đầu tư vào đào tạo các mô hình AI, nhờ trải nghiệm người dùng được cải thiện và sự xuất hiện của AI tiên tiến hơn. Các tổ chức đang tập trung vào việc quản lý hiệu quả các nguồn lực suy luận để cân bằng giữa việc cải thiện trải nghiệm người dùng với việc quản lý chi phí hiệu quả.

Các nghiên cứu gần đây đã chỉ ra rằng việc tận dụng bộ nhớ đệm khóa-giá trị ngoài (bộ nhớ đệm KV) trong giải pháp lưu trữ hiệu suất cao như Google Cloud Managed Lustre có thể giảm đáng kể tổng chi phí sở hữu (TCO) của công ty. Bằng cách chuyển một số tính toán sang I/O, các công ty có thể xử lý cùng một khối lượng công việc với số lượng GPU ít hơn đáng kể, có khả năng giảm TCO tới 35%.

Bộ nhớ đệm KV đóng vai trò quan trọng trong giai đoạn suy luận của các mô hình ngôn ngữ quy mô lớn (LLM) dựa trên Transformer, giúp ngăn ngừa các phép tính dư thừa bằng cách lưu trữ các vectơ khóa (K) và giá trị (V). Việc tối ưu hóa này đặc biệt quan trọng để quản lý suy luận AI ngữ cảnh dài, vốn có thể đòi hỏi rất nhiều tài nguyên cho quá trình tính toán trước. Việc sử dụng bộ lưu trữ mở rộng hiệu suất cao như Google Cloud Managed Lustre là điều cần thiết để quản lý các ngữ cảnh lớn như vậy và sử dụng hiệu quả các bộ tăng tốc.

Xét về tổng chi phí sở hữu (TCO), các giải pháp lưu trữ đệm KV dựa trên lưu trữ như Managed Lustre mang lại lợi ích đáng kể so với các giải pháp chỉ dựa trên bộ nhớ. Phân tích cho thấy với cấu hình phù hợp và cải tiến phần mềm, Managed Lustre có thể cải thiện hiệu suất suy luận và giảm 43% số lượng bộ tăng tốc cần thiết, giúp tiết kiệm chi phí trực tiếp cho các tổ chức triển khai khối lượng công việc suy luận AI quy mô lớn.

Nguồn: Thông cáo báo chí

Chia sẻ bài viết này:

Tin tức mới nhất

Hội thảo AI cải tiến doanh nghiệp ORENDA WORLD

0:00 5/11/25

ORENDA WORLD (Minato-ku, Tokyo) sẽ tổ chức "Hội thảo AI nội bộ để cải thiện hoạt động kinh doanh" nhằm trang bị các kỹ năng ứng dụng về Generative AI ( AI) tại Holt Hall Oita vào ngày 17 tháng 11 năm 2025.

đọc thêm

Dữ liệu AI Sở hữu trí tuệ Hỗ trợ năng lượng AI

0:00 5/11/25

AI Data (Minato-ku, Tokyo) đã bắt đầu cung cấp cơ sở hạ tầng sở hữu trí tuệ bằng cách sử dụng IP AI x AI Factory cho các ngành công nghiệp công nghệ năng lượng và khí hậu.

đọc thêm

Phiên bản mới của Softfront AI Voicebot đã được công bố

0:00 5/11/25

Softfront (Chiyoda-ku, Tokyo) vừa công bố phiên bản mới của bot giọng nói AI "commubo".

đọc thêm

Algoage AI Đầu tư Bất động sản và Phân tích Tâm lý

0:00 5/11/25

Algoage (Bunkyo-ku, Tokyo) đã có bài phát biểu tại ad:tech tokyo 2025 vào ngày 24 tháng 10 năm 2025.

đọc thêm

Chia sẻ bài viết này:

Danh mục

Trình nâng cao hình ảnh AI

Trình tạo mã AI

Quản lý tác vụ AI

Không có mã/mã thấp

Trình tạo thiết kế đồ họa AI

Trình tạo minh họa/nghệ thuật AI

Tất cả công cụ

Tin tức

AI và luật/hệ thống/kinh tế/xã hội

Các công ty/sản phẩm/công nghệ AI

AI công nghệ lớn

OpenAI/ChatGPT

AI thế hệ sáng tạo

AI thế hệ dựa trên văn bản

AI sáng tạo của Nhật Bản

Cơ bản về AI sáng tạo

Hướng dẫn ứng dụng AI cơ bản

Hồ sơ công ty

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng trang web

Công ty điều hành

Hãy theo dõi chúng tôi

Ngôn ngữ

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Hãy theo dõi chúng tôi

Ngôn ngữ

Danh mục

Tất cả công cụ

Quản lý tác vụ AI

Trình tạo thiết kế đồ họa AI

Không có mã/mã thấp

Trình tạo mã AI

Trình nâng cao hình ảnh AI

Trình tạo minh họa/nghệ thuật AI

AI và luật/hệ thống/kinh tế/xã hội

Các công ty/sản phẩm/công nghệ AI

AI công nghệ lớn

OpenAI/ChatGPT

AI thế hệ sáng tạo

AI thế hệ dựa trên văn bản

AI sáng tạo của Nhật Bản

Cơ bản về AI tạo ra

Hướng dẫn ứng dụng AI cơ bản

Tin tức

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng của trang web

Công ty điều hành

Hồ sơ công ty

Tin tức mới nhất

Hội thảo AI cải tiến doanh nghiệp ORENDA WORLD

0:00 5/11/25

ORENDA WORLD (Minato-ku, Tokyo) sẽ tổ chức "Hội thảo AI nội bộ để cải thiện hoạt động kinh doanh" nhằm trang bị các kỹ năng ứng dụng về Generative AI ( AI) tại Holt Hall Oita vào ngày 17 tháng 11 năm 2025.

đọc thêm

Dữ liệu AI Sở hữu trí tuệ Hỗ trợ năng lượng AI

0:00 5/11/25

AI Data (Minato-ku, Tokyo) đã bắt đầu cung cấp cơ sở hạ tầng sở hữu trí tuệ bằng cách sử dụng IP AI x AI Factory cho các ngành công nghiệp công nghệ năng lượng và khí hậu.

đọc thêm

Phiên bản mới của Softfront AI Voicebot đã được công bố

0:00 5/11/25

Softfront (Chiyoda-ku, Tokyo) vừa công bố phiên bản mới của bot giọng nói AI "commubo".

đọc thêm

Algoage AI Đầu tư Bất động sản và Phân tích Tâm lý

0:00 5/11/25

Algoage (Bunkyo-ku, Tokyo) đã có bài phát biểu tại ad:tech tokyo 2025 vào ngày 24 tháng 10 năm 2025.

đọc thêm