Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo
%20(1).webp)
InstructBLIP Alpha, mô hình ngôn ngữ trực quan để hiểu hình ảnh và hỏi đáp độc đáo của Nhật Bản, hiện đã có sẵn
Generatived
5:07 4/9/23
Stability AI đã giới thiệu mô hình ngôn ngữ tầm nhìn mới nhất của mình, InstructBLIP Alpha tiếng Nhật. Mô hình sáng tạo này có thể tạo ra các mô tả bằng văn bản về hình ảnh và trả lời các câu hỏi dựa trên thông tin đầu vào trực quan. InstructBLIP Alpha của Nhật Bản được xây dựng trên StableLM Instruct Alpha 7B của Nhật Bản và sử dụng kiến trúc InstructBLIP, được biết đến với hiệu suất vượt trội trong các tác vụ ngôn ngữ hình ảnh. Để nâng cao chức năng trên tập dữ liệu tiếng Nhật hạn chế, một phần của mô hình đã được khởi tạo bằng cách sử dụng InstructBLIP được đào tạo trước từ một tập dữ liệu lớn bằng tiếng Anh và sau đó được huấn luyện trên dữ liệu tiếng Nhật được Tinh chỉnh. Mô hình này có ứng dụng trong nhiều lĩnh vực khác nhau, bao gồm công cụ tìm kiếm dựa trên hình ảnh, mô tả cảnh và Hỏi đáp, đồng thời cung cấp mô tả văn bản về hình ảnh cho người khiếm thị. Hơn nữa, nó có thể xác định chính xác các vật thể độc đáo của Nhật Bản trong hình ảnh, chẳng hạn như Tokyo Sky Tree và Kinkakuji Temple. Hơn nữa, InstructBLIP Alpha tiếng Nhật không chỉ giới hạn ở việc chỉ nhập hình ảnh. Nó có thể xử lý các câu hỏi dựa trên văn bản và tạo ra câu trả lời chính xác dựa trên nội dung trực quan, khiến nó trở thành một công cụ linh hoạt cho các nhà nghiên cứu và nhà phát triển. Mô hình này chỉ có sẵn cho mục đích nghiên cứu, được truy cập thông qua Hugging Face Hub để thử nghiệm và đào tạo thêm.
