Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

Một mô hình mới cho việc truy xuất thông tin đa phương thức được trình bày

Generatived

0:00 2/7/25

Việc tích hợp dữ liệu trực quan và văn bản đã dẫn đến sự phát triển của các mô hình ngôn ngữ trực quan (VLM). VLM tích hợp thông tin trực quan và văn bản và có thể xử lý và hiểu cả hai. Các mô hình này được thiết kế để tạo điều kiện cho các tương tác trực quan hơn của máy, chẳng hạn như trả lời câu hỏi trực quan và chú thích hình ảnh. Chúng đã được đào tạo trên các tập dữ liệu mở rộng kết hợp hình ảnh và văn bản, và những tiến bộ gần đây đã dẫn đến sự phát triển của các mô hình có thể xử lý hình ảnh phức tạp, khiến chúng đáng tin cậy và hiệu quả hơn.

Trong lĩnh vực truy xuất tài liệu, các kỹ thuật truyền thống thường chuyển đổi tài liệu thành văn bản trước khi xử lý. Tuy nhiên, sự xuất hiện của VLM đã đơn giản hóa quy trình này bằng cách loại bỏ nhu cầu trích xuất văn bản phức tạp. Các mô hình này có thể diễn giải ý nghĩa của văn bản trong khi vẫn bảo toàn thông tin trực quan bằng cách nhúng trực tiếp hình ảnh thô. Tuy nhiên, mặc dù có khả năng vượt trội, VLM vẫn dễ bị lỗi, khiến các quy trình truy xuất chính xác trở thành yếu tố chính trong việc xác định hiệu quả của VLM.

Để giúp xây dựng các hệ thống truy xuất thông tin đa phương thức hiệu quả và quy mô lớn, một mô hình mới đã được giới thiệu. Mô hình này nhỏ gọn nhưng mạnh mẽ và có thể nhúng hình ảnh và văn bản vào không gian tính năng được chia sẻ. Điều này rất cần thiết cho các tác vụ như công cụ tìm kiếm sản phẩm và quản lý tập dữ liệu đa phương tiện. Kết hợp bộ mã hóa tầm nhìn, mô hình ngôn ngữ và lớp chiếu, nó ánh xạ hình ảnh vào không gian nhúng của mô hình ngôn ngữ.

Hiệu suất của mô hình mới này được đánh giá trên nhiều tập dữ liệu khác nhau và chứng minh độ chính xác truy xuất vượt trội so với các mô hình nhúng tầm nhìn quy mô nhỏ khác. Bằng cách tinh chỉnh với mất độ tương phản, nó khớp các nhúng truy vấn văn bản với hình ảnh tài liệu có chứa câu trả lời có liên quan. Mô hình này là một phần của bộ dịch vụ vi mô được thiết kế để cung cấp khả năng truy xuất thông tin có độ chính xác cao và thông tin chi tiết về doanh nghiệp theo thời gian thực và có sẵn trong môi trường lưu trữ.

Nguồn: Blog nhà phát triển NVIDIA

Chia sẻ bài viết này:

Tin tức mới nhất

NTT West hợp tác với công ty quản lý Carbon để giảm phát thải carbon.

0:00 3/7/26

NTT West và Tansoman GX đã công bố hợp tác kinh doanh nhằm hỗ trợ các sáng kiến khử carbon cho các doanh nghiệp vừa và nhỏ, phối hợp với chính quyền địa phương.

đọc thêm

Google Cloud mở rộng cơ sở hạ tầng AI bảo mật trên toàn cầu.

0:00 3/7/26

Google Cloud đã giới thiệu các khả năng Điện toán Bảo mật mới được thiết kế để tăng cường quyền riêng tư cho các khối lượng công việc AI.

đọc thêm

Microsoft mở rộng Azure Files cho khối lượng công việc Linux

0:00 3/7/26

Microsoft đã giới thiệu các khả năng mới của Azure Files được thiết kế để hỗ trợ khối lượng công việc Linux trong lĩnh vực trí tuệ nhân tạo, ứng dụng đám mây

đọc thêm

Microsoft chia sẻ hướng dẫn tối ưu hóa chi phí Azure IaaS.

0:00 3/7/26

Microsoft vừa ban hành hướng dẫn mới về tối ưu hóa môi trường Cơ sở hạ tầng dưới dạng dịch vụ (IaaS) Azure , nhấn mạnh các chiến lược trên các lĩnh vực điện toán, lưu trữ và mạng.

đọc thêm

Chia sẻ bài viết này:

Danh mục

Trình nâng cao hình ảnh AI

Trình tạo mã AI

Quản lý tác vụ AI

Không có mã/mã thấp

Trình tạo thiết kế đồ họa AI

Trình tạo minh họa/nghệ thuật AI

Tất cả công cụ

Tin tức

AI và luật/hệ thống/kinh tế/xã hội

Các công ty/sản phẩm/công nghệ AI

AI công nghệ lớn

OpenAI/ChatGPT

AI thế hệ sáng tạo

AI thế hệ dựa trên văn bản

AI sáng tạo của Nhật Bản

Cơ bản về AI sáng tạo

Hướng dẫn ứng dụng AI cơ bản

Hồ sơ công ty

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng trang web

Công ty điều hành

Hãy theo dõi chúng tôi

Ngôn ngữ

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Hãy theo dõi chúng tôi

Ngôn ngữ

Danh mục

Tất cả công cụ

Quản lý tác vụ AI

Trình tạo thiết kế đồ họa AI

Không có mã/mã thấp

Trình tạo mã AI

Trình nâng cao hình ảnh AI

Trình tạo minh họa/nghệ thuật AI

AI và luật/hệ thống/kinh tế/xã hội

Các công ty/sản phẩm/công nghệ AI

AI công nghệ lớn

OpenAI/ChatGPT

AI thế hệ sáng tạo

AI thế hệ dựa trên văn bản

AI sáng tạo của Nhật Bản

Cơ bản về AI tạo ra

Hướng dẫn ứng dụng AI cơ bản

Tin tức

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng của trang web

Công ty điều hành

Hồ sơ công ty

Tin tức mới nhất

NTT West hợp tác với công ty quản lý Carbon để giảm phát thải carbon.

0:00 3/7/26

NTT West và Tansoman GX đã công bố hợp tác kinh doanh nhằm hỗ trợ các sáng kiến khử carbon cho các doanh nghiệp vừa và nhỏ, phối hợp với chính quyền địa phương.

đọc thêm

Google Cloud mở rộng cơ sở hạ tầng AI bảo mật trên toàn cầu.

0:00 3/7/26

Google Cloud đã giới thiệu các khả năng Điện toán Bảo mật mới được thiết kế để tăng cường quyền riêng tư cho các khối lượng công việc AI.

đọc thêm

Microsoft mở rộng Azure Files cho khối lượng công việc Linux

0:00 3/7/26

Microsoft đã giới thiệu các khả năng mới của Azure Files được thiết kế để hỗ trợ khối lượng công việc Linux trong lĩnh vực trí tuệ nhân tạo, ứng dụng đám mây

đọc thêm

Microsoft chia sẻ hướng dẫn tối ưu hóa chi phí Azure IaaS.

0:00 3/7/26

Microsoft vừa ban hành hướng dẫn mới về tối ưu hóa môi trường Cơ sở hạ tầng dưới dạng dịch vụ (IaaS) Azure , nhấn mạnh các chiến lược trên các lĩnh vực điện toán, lưu trữ và mạng.

đọc thêm