top of page

Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

logo.png

Microsoft ra mắt mô hình AI Phi-4 cho các tác vụ đa phương thức

Generatived

4:30 27/2/25

Microsoft đã mở rộng các dịch vụ AI của mình bằng cách giới thiệu các bổ sung mới cho họ mô hình ngôn ngữ nhỏ gọn Phi: Phi-4-multimodal và Phi-4-mini. Mô hình Phi-4-multimodal được điều chỉnh để xử lý đồng thời các đầu vào giọng nói, hình ảnh và văn bản, cho phép tạo các ứng dụng nhận biết ngữ cảnh. Trong khi đó, Phi-4-mini được tối ưu hóa cho các tác vụ dựa trên văn bản, tự hào có độ chính xác cao và khả năng mở rộng trong một định dạng nhỏ gọn hơn. Cả hai mô hình hiện có thể truy cập được đối với các nhà phát triển thông qua Azure AI Foundry, HuggingFace và NVIDIA API Catalog, với mô hình sau cung cấp một nền tảng để thử nghiệm với Phi-4-multimodal.

Mô hình đa phương thức Phi-4 đại diện cho một bước tiến lớn trong AI, kết hợp xử lý giọng nói, thị giác và văn bản thành một kiến ​​trúc thống nhất. Mô hình 5,6 tỷ tham số này sử dụng các kỹ thuật học tập đa phương thức để tạo điều kiện cho tương tác tự nhiên và phản hồi nhận biết ngữ cảnh trên nhiều loại đầu vào. Nó được thiết kế để đạt hiệu quả, cung cấp suy luận độ trễ thấp đồng thời giảm thiểu gánh nặng tính toán, khiến nó phù hợp để triển khai trên thiết bị.

Phi-4-multimodal của Microsoft hoạt động tốt trong việc xử lý cả đầu vào hình ảnh và âm thanh, vượt trội hơn các mô hình tiên tiến khác trong các chuẩn mực nhận dạng giọng nói và dịch thuật. Nó đã giành vị trí hàng đầu trên bảng xếp hạng Huggingface OpenASR và đã cho thấy kết quả đầy hứa hẹn trong việc tóm tắt giọng nói. Mặc dù có kích thước nhỏ, nó cũng duy trì hiệu suất cạnh tranh trong các tác vụ đa phương thức như OCR và lý luận trực quan.

Phi-4-mini, một mô hình có 3,8 tỷ tham số, vượt trội trong các tác vụ dựa trên văn bản, hỗ trợ các chuỗi dài và đạt được độ chính xác cao. Khả năng gọi hàm của nó cho phép nó tương tác với API và nguồn dữ liệu bên ngoài, khiến nó trở nên rất thiết thực. Cả Phi-4-mini và Phi-4-multimodal đều được thiết kế để sử dụng trong các môi trường có tài nguyên điện toán hạn chế, cung cấp các giải pháp tiết kiệm chi phí, nhạy cảm với độ trễ. Chúng cũng dễ dàng tùy chỉnh, khiến chúng phù hợp với nhiều ứng dụng phân tích trong các ngành công nghiệp khác nhau.

Chia sẻ bài viết này:

Tin tức mới nhất
Nemotron ra mắt AI nâng cao dành cho hệ thống đa tác nhân.

Nemotron ra mắt AI nâng cao dành cho hệ thống đa tác nhân.

0:00 13/3/26

Một mô hình AI mới, Nemotron 3 Super, đã được giới thiệu để tăng cường khả năng của các hệ thống đa tác tử trong các ứng dụng phức tạp như phát triển phần mềm và an ninh mạng.

Wayfair tăng cường hỗ trợ danh mục sản phẩm và nhà cung cấp với OpenAI.

Wayfair tăng cường hỗ trợ danh mục sản phẩm và nhà cung cấp với OpenAI.

0:00 13/3/26

Wayfair đã tích hợp thành công các mô hình OpenAI vào hệ thống nội bộ của mình, tăng cường hỗ trợ nhà cung cấp và quản lý danh mục sản phẩm.

ChatGPT tăng cường bảo mật AI chống lại các cuộc tấn công chèn mã độc vào lời nhắc (Prompt Injection).

ChatGPT tăng cường bảo mật AI chống lại các cuộc tấn công chèn mã độc vào lời nhắc (Prompt Injection).

0:00 13/3/26

Các tác nhân AI ngày càng trở nên thành thạo hơn trong việc duyệt web, truy xuất thông tin và hành động tự động, điều này, mặc dù có lợi

ShiftPlus giới thiệu GPT-5.4 cho hệ thống AI chính quyền địa phương của mình.

ShiftPlus giới thiệu GPT-5.4 cho hệ thống AI chính quyền địa phương của mình.

0:00 13/3/26

ShiftPlus (Nishi-ku, Osaka) đã giới thiệu GPT-5.4 vào "Hệ thống AI đô thị zevo", được phát triển với sự hợp tác của thành phố Miyakonojo.

Copyright © 2024 Generatived - All right Reserved.

Chia sẻ bài viết này:

Chia sẻ bài viết này:

Generatived AI Logo

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

  • Facebook
  • X

Hãy theo dõi chúng tôi

Ngôn ngữ

Tin tức mới nhất
Nemotron ra mắt AI nâng cao dành cho hệ thống đa tác nhân.

Nemotron ra mắt AI nâng cao dành cho hệ thống đa tác nhân.

0:00 13/3/26

Một mô hình AI mới, Nemotron 3 Super, đã được giới thiệu để tăng cường khả năng của các hệ thống đa tác tử trong các ứng dụng phức tạp như phát triển phần mềm và an ninh mạng.

Wayfair tăng cường hỗ trợ danh mục sản phẩm và nhà cung cấp với OpenAI.

Wayfair tăng cường hỗ trợ danh mục sản phẩm và nhà cung cấp với OpenAI.

0:00 13/3/26

Wayfair đã tích hợp thành công các mô hình OpenAI vào hệ thống nội bộ của mình, tăng cường hỗ trợ nhà cung cấp và quản lý danh mục sản phẩm.

ChatGPT tăng cường bảo mật AI chống lại các cuộc tấn công chèn mã độc vào lời nhắc (Prompt Injection).

ChatGPT tăng cường bảo mật AI chống lại các cuộc tấn công chèn mã độc vào lời nhắc (Prompt Injection).

0:00 13/3/26

Các tác nhân AI ngày càng trở nên thành thạo hơn trong việc duyệt web, truy xuất thông tin và hành động tự động, điều này, mặc dù có lợi

ShiftPlus giới thiệu GPT-5.4 cho hệ thống AI chính quyền địa phương của mình.

ShiftPlus giới thiệu GPT-5.4 cho hệ thống AI chính quyền địa phương của mình.

0:00 13/3/26

ShiftPlus (Nishi-ku, Osaka) đã giới thiệu GPT-5.4 vào "Hệ thống AI đô thị zevo", được phát triển với sự hợp tác của thành phố Miyakonojo.

bottom of page