top of page

Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

logo.png

Ironwood TPU công bố những tiến bộ trong siêu máy tính AI

Generatived

0:00 10/11/25

Ironwood, Bộ xử lý Tensor (TPU) mới nhất từ một công ty công nghệ hàng đầu, đang dẫn đầu trong quá trình phát triển AI, cung cấp năng lượng cho các mô hình phức tạp như Gemini và Nano Banana. TPU rất cần thiết cho cả đào tạo quy mô lớn và suy luận hiệu quả, thông lượng cao. Bộ phần mềm AI tích hợp sâu của Ironwood chứng minh cách thức sự kết hợp này cải thiện hiệu suất, hiệu quả và khả năng mở rộng. Bộ phần mềm này bao gồm hỗ trợ cho các hệ sinh thái JAX và PyTorch, trình biên dịch XLA và các khung công tác cấp cao giúp sức mạnh tính toán tiên tiến được sử dụng rộng rãi.

Bộ phần mềm Ironwood được thiết kế tỉ mỉ để đáp ứng nhu cầu tính toán của các mô hình cơ bản mới nhất với hàng nghìn tỷ tham số. Đồng thiết kế cấp hệ thống coi các pod TPU như một siêu máy tính thống nhất, có kết nối tùy chỉnh để trao đổi dữ liệu băng thông cao, độ trễ thấp. Kiến trúc của Ironwood tự hào có dung lượng HBM 1,77PB và được tối ưu hóa cho khối lượng công việc AI. Các lõi phần cứng của nó bao gồm một đơn vị nhân ma trận (MXU) và một đơn vị xử lý vector (VPU). Trình biên dịch XLA nhắm mục tiêu vào phần cứng này và hợp nhất các hoạt động thành các hạt nhân được tối ưu hóa để đạt hiệu suất cao nhất.

Thiết kế chip Ironwood cũng mở rộng sang kết nối, cho phép mở rộng quy mô lớn. Các chip TPU được sắp xếp theo "khối lập phương" và được kết nối thông qua mạng chuyển mạch mạch quang (OCS), cho phép hệ thống mở rộng từ các pod nhỏ đến các superpod khổng lồ. Mạng lưới động này là chìa khóa cho khả năng chịu lỗi và hoạt động hiệu quả, ngay cả khi mở rộng lên hàng trăm nghìn chip.

Ngăn xếp phần mềm dịch mã cấp cao thành các lệnh được tối ưu hóa để tối đa hóa khả năng của phần cứng. Nó hỗ trợ hệ sinh thái JAX về hiệu suất và tính linh hoạt, và PyTorch trên TPU cho trải nghiệm gốc. Ngăn xếp được thiết kế để tối ưu hóa toàn bộ vòng đời AI, từ tiền huấn luyện đến suy luận, với các khả năng phần cứng và phần mềm cụ thể cho từng giai đoạn. Điều này bao gồm quản lý khả năng phục hồi ở quy mô lớn, cung cấp phần mềm được tối ưu hóa cho các quy trình làm việc phức tạp và đạt được dự đoán độ trễ thấp và thông lượng cao trong sản xuất.

Tóm lại, ngăn xếp Ironwood đại diện cho một phương pháp tiếp cận toàn diện về đồng thiết kế phần cứng và phần mềm AI. Nền tảng này mang lại hiệu suất và hiệu quả vượt trội, cho phép các nhà phát triển khai thác sức mạnh của siêu máy tính trong nhiều giai đoạn phát triển và triển khai mô hình AI. Nền tảng này hỗ trợ cả hệ sinh thái JAX và PyTorch, đảm bảo các nhà phát triển có đủ công cụ cần thiết để hiện thực hóa những sáng kiến AI của mình.

Chia sẻ bài viết này:

Tin tức mới nhất
Hội thảo về sử dụng an toàn các công cụ Generative AI UPF

Hội thảo về sử dụng an toàn các công cụ Generative AI UPF

0:00 10/11/25

UPF (Chuo-ku, Tokyo) sẽ tổ chức hội thảo trực tuyến miễn phí về rủi ro bảo mật thông tin của các công cụ Generative AI vào ngày 13 tháng 11 năm 2025.

Mở rộng chức năng trợ lý AI Argyle

Mở rộng chức năng trợ lý AI Argyle

0:00 10/11/25

Argyle (Shinjuku-ku, Tokyo) thông báo rằng họ đã bổ sung các tính năng mới vào gói triển khai AI dành cho doanh nghiệp, "Trợ lý AI Argyle", bao gồm tạo hình ảnh Nano Banana, GPT-5 Pro và Claude 4.5.

Tăng cường trò chuyện về lương hưu với sự ra đời của Fujitsu AI

Tăng cường trò chuyện về lương hưu với sự ra đời của Fujitsu AI

0:00 10/11/25

Fujitsu(Tokyo) đã đưa Generative AI) vào "Chatbot về lương hưu" của Cơ quan quản lý lương hưu Nhật Bản và hiện đang xây dựng nó với mục tiêu đưa vào hoạt động vào tháng 4 năm 2026.

Công ty quảng cáo trực tuyến Sales bắt đầu sản xuất quảng cáo AI

Công ty quảng cáo trực tuyến Sales bắt đầu sản xuất quảng cáo AI

0:00 10/11/25

Tập đoàn quảng cáo Ureru Net (Thành phố Fukuoka, Tỉnh Fukuoka) thông báo rằng công ty con Ureru Net Advertising đã giới thiệu Generative AI) vào nhóm sản xuất sáng tạo quảng cáo của mình

Copyright © 2024 Generatived - All right Reserved.

Chia sẻ bài viết này:

Chia sẻ bài viết này:

Generatived AI Logo

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

  • Facebook
  • X

Hãy theo dõi chúng tôi

Ngôn ngữ

Tin tức mới nhất
Hội thảo về sử dụng an toàn các công cụ Generative AI UPF

Hội thảo về sử dụng an toàn các công cụ Generative AI UPF

0:00 10/11/25

UPF (Chuo-ku, Tokyo) sẽ tổ chức hội thảo trực tuyến miễn phí về rủi ro bảo mật thông tin của các công cụ Generative AI vào ngày 13 tháng 11 năm 2025.

Mở rộng chức năng trợ lý AI Argyle

Mở rộng chức năng trợ lý AI Argyle

0:00 10/11/25

Argyle (Shinjuku-ku, Tokyo) thông báo rằng họ đã bổ sung các tính năng mới vào gói triển khai AI dành cho doanh nghiệp, "Trợ lý AI Argyle", bao gồm tạo hình ảnh Nano Banana, GPT-5 Pro và Claude 4.5.

Tăng cường trò chuyện về lương hưu với sự ra đời của Fujitsu AI

Tăng cường trò chuyện về lương hưu với sự ra đời của Fujitsu AI

0:00 10/11/25

Fujitsu(Tokyo) đã đưa Generative AI) vào "Chatbot về lương hưu" của Cơ quan quản lý lương hưu Nhật Bản và hiện đang xây dựng nó với mục tiêu đưa vào hoạt động vào tháng 4 năm 2026.

Công ty quảng cáo trực tuyến Sales bắt đầu sản xuất quảng cáo AI

Công ty quảng cáo trực tuyến Sales bắt đầu sản xuất quảng cáo AI

0:00 10/11/25

Tập đoàn quảng cáo Ureru Net (Thành phố Fukuoka, Tỉnh Fukuoka) thông báo rằng công ty con Ureru Net Advertising đã giới thiệu Generative AI) vào nhóm sản xuất sáng tạo quảng cáo của mình

bottom of page