Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

Quadric hỗ trợ Llama 2 với Chimera GPNPU

Generatived

7:04 15/9/23

Quadric đã công bố hỗ trợ ngay lập tức cho Mô hình ngôn ngữ quy mô lớn (LLM) Llama 2 trên lõi sở hữu trí tuệ (IP) của Bộ xử lý thần kinh mục đích chung Chimera (GPNPU). Không giống như các nhà cung cấp bộ xử lý ứng dụng bán dẫn và IP khác, Quadric có thể bổ sung hỗ trợ này thông qua một cổng phần mềm đơn giản mà không thực hiện bất kỳ thay đổi phần cứng nào. Điều này có nghĩa là các thiết kế hiện có có thể chạy mô hình này ngay lập tức, trong khi các nhà cung cấp khác đang lên kế hoạch thay đổi phần cứng để cung cấp hỗ trợ từ năm 2024 trở đi. Llama2 LLM, được Meta giới thiệu vào ngày 18 tháng 7 năm nay cho AI tổng quát, trước đây được cho là chỉ khả thi trong các trung tâm dữ liệu đám mây. Tuy nhiên, mối quan hệ hợp tác được công bố của Meta và Qualcomm nhằm chuyển Llama2 sang các chip Qualcomm Snapdragon trong tương lai dự kiến vào năm 2024 đã thu hút sự chú ý của thị trường và đầu tư vào việc triển khai LLM trên thiết bị giữa các nhà cung cấp chip và IP. Nhóm của Quadric đã chuyển thành công phiên bản lượng tử hóa INT8 của Llama2 sang nền tảng Chimera và điều chỉnh hiệu suất chỉ trong 13 trên tổng số bốn tuần kỹ thuật. Điều này đạt được bằng cách mã hóa hai lớp toán tử ML mới và hai biến thể của nhân toán tử hiện có trong C++ để chạy mô hình. Hai tuần kỹ thuật bổ sung được dành để tinh chỉnh hiệu suất và độ chính xác của vỏ góc để đảm bảo rằng nó hoạt động đáng tin cậy với cả ba kích cỡ của bộ xử lý dòng Chimera QB. Trong khi đó, các nhà cung cấp giải pháp suy luận máy học khác với các nhóm lớn vẫn đang gặp khó khăn để đạt được mục tiêu chuyển đổi trong tháng 6. Hiệu suất của Chimera QB4 4 TOPs GPNPU của Quadric chạy Llama2 15M rất ấn tượng, đạt hiệu suất 225 token/giây/watt với công nghệ 5nm trong khi chỉ chiếm 2,5 mm2. Để so sánh, CPU đơn có hiệu suất cao nhất trong máy tính xách tay M1 Pro chỉ đạt được 11 token/giây/W khi chạy cùng phiên bản Int8 của Llama2. Điều này có nghĩa là Quadric mang lại khả năng suy luận ML trên mỗi watt cải thiện gấp 20 lần so với các CPU hiện đại.

Nguồn: Thông cáo báo chí

Chia sẻ bài viết này:

Tin tức mới nhất

Nemotron ra mắt AI nâng cao dành cho hệ thống đa tác nhân.

0:00 13/3/26

Một mô hình AI mới, Nemotron 3 Super, đã được giới thiệu để tăng cường khả năng của các hệ thống đa tác tử trong các ứng dụng phức tạp như phát triển phần mềm và an ninh mạng.

đọc thêm

Wayfair tăng cường hỗ trợ danh mục sản phẩm và nhà cung cấp với OpenAI.

0:00 13/3/26

Wayfair đã tích hợp thành công các mô hình OpenAI vào hệ thống nội bộ của mình, tăng cường hỗ trợ nhà cung cấp và quản lý danh mục sản phẩm.

đọc thêm

ChatGPT tăng cường bảo mật AI chống lại các cuộc tấn công chèn mã độc vào lời nhắc (Prompt Injection).

0:00 13/3/26

Các tác nhân AI ngày càng trở nên thành thạo hơn trong việc duyệt web, truy xuất thông tin và hành động tự động, điều này, mặc dù có lợi

đọc thêm

ShiftPlus giới thiệu GPT-5.4 cho hệ thống AI chính quyền địa phương của mình.

0:00 13/3/26

ShiftPlus (Nishi-ku, Osaka) đã giới thiệu GPT-5.4 vào "Hệ thống AI đô thị zevo", được phát triển với sự hợp tác của thành phố Miyakonojo.

đọc thêm

Chia sẻ bài viết này:

Danh mục

Trình nâng cao hình ảnh AI

Trình tạo mã AI

Quản lý tác vụ AI

Không có mã/mã thấp

Trình tạo thiết kế đồ họa AI

Trình tạo minh họa/nghệ thuật AI

Tất cả công cụ

Tin tức

AI và luật/hệ thống/kinh tế/xã hội

Các công ty/sản phẩm/công nghệ AI

AI công nghệ lớn

OpenAI/ChatGPT

AI thế hệ sáng tạo

AI thế hệ dựa trên văn bản

AI sáng tạo của Nhật Bản

Cơ bản về AI sáng tạo

Hướng dẫn ứng dụng AI cơ bản

Hồ sơ công ty

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng trang web

Công ty điều hành

Hãy theo dõi chúng tôi

Ngôn ngữ

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Hãy theo dõi chúng tôi

Ngôn ngữ

Danh mục

Tất cả công cụ

Quản lý tác vụ AI

Trình tạo thiết kế đồ họa AI

Không có mã/mã thấp

Trình tạo mã AI

Trình nâng cao hình ảnh AI

Trình tạo minh họa/nghệ thuật AI

AI và luật/hệ thống/kinh tế/xã hội

Các công ty/sản phẩm/công nghệ AI

AI công nghệ lớn

OpenAI/ChatGPT

AI thế hệ sáng tạo

AI thế hệ dựa trên văn bản

AI sáng tạo của Nhật Bản

Cơ bản về AI tạo ra

Hướng dẫn ứng dụng AI cơ bản

Tin tức

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng của trang web

Công ty điều hành

Hồ sơ công ty

Tin tức mới nhất

Nemotron ra mắt AI nâng cao dành cho hệ thống đa tác nhân.

0:00 13/3/26

Một mô hình AI mới, Nemotron 3 Super, đã được giới thiệu để tăng cường khả năng của các hệ thống đa tác tử trong các ứng dụng phức tạp như phát triển phần mềm và an ninh mạng.

đọc thêm

Wayfair tăng cường hỗ trợ danh mục sản phẩm và nhà cung cấp với OpenAI.

0:00 13/3/26

Wayfair đã tích hợp thành công các mô hình OpenAI vào hệ thống nội bộ của mình, tăng cường hỗ trợ nhà cung cấp và quản lý danh mục sản phẩm.

đọc thêm

ChatGPT tăng cường bảo mật AI chống lại các cuộc tấn công chèn mã độc vào lời nhắc (Prompt Injection).

0:00 13/3/26

Các tác nhân AI ngày càng trở nên thành thạo hơn trong việc duyệt web, truy xuất thông tin và hành động tự động, điều này, mặc dù có lợi

đọc thêm

ShiftPlus giới thiệu GPT-5.4 cho hệ thống AI chính quyền địa phương của mình.

0:00 13/3/26

ShiftPlus (Nishi-ku, Osaka) đã giới thiệu GPT-5.4 vào "Hệ thống AI đô thị zevo", được phát triển với sự hợp tác của thành phố Miyakonojo.

đọc thêm