Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

Google Gemini nâng cao khả năng giải thích hình ảnh đa phổ
Generatived
0:00 20/11/25
Mô hình Gemini của Google cung cấp cho các ứng dụng khả năng diễn giải hình ảnh đa phổ, thu thập dữ liệu vượt ra ngoài phổ khả kiến. Công nghệ này cho phép các ứng dụng phân tích dữ liệu vệ tinh và hiểu thế giới theo những cách mới mà không cần đến các mô hình chuyên biệt. Bằng cách tận dụng các cảm biến đa phổ, các ứng dụng có thể phát hiện chính xác hơn nhiều hiện tượng, từ sức khỏe thảm thực vật đến chất lượng nước.
Hình ảnh đa phổ là một bước tiến vượt bậc so với hình ảnh RGB truyền thống vì nó bao gồm dữ liệu ở các bước sóng mắt người không nhìn thấy được, chẳng hạn như cận hồng ngoại (NIR) và hồng ngoại sóng ngắn (SWIR). Khả năng này rất quan trọng trong các lĩnh vực như nông nghiệp, nơi NIR có thể được sử dụng để đánh giá sức khỏe cây trồng, và quản lý thảm họa, nơi SWIR có thể xác định các vết cháy rừng. Phương pháp tiếp cận Google giúp đơn giản hóa việc sử dụng dữ liệu phức tạp này và giúp các nhà phát triển dễ tiếp cận hơn.
Để tích hợp dữ liệu đa phổ vào Gemini, các nhà phát triển tạo ra một hình ảnh "tổng hợp màu giả" bằng cách ánh xạ các dải bước sóng vô hình với các kênh RGB được mô hình nhận dạng. Quá trình này bao gồm việc lựa chọn các dải phổ liên quan, chuẩn hóa dữ liệu và cung cấp ngữ cảnh cho mô hình. Kỹ thuật này cho phép Gemini xử lý và hiểu dữ liệu khoa học được mã hóa trong hình ảnh.
Tính linh hoạt của mô hình Gemini được thể hiện qua khả năng phân loại chính xác các loại hình thảm thực vật và các đặc điểm khác trong các ứng dụng viễn thám. Việc tích hợp dữ liệu đầu vào đa phổ cho phép mô hình đưa ra những phân biệt chính xác ngay cả trong những tình huống khó khăn mà chỉ dữ liệu RGB là không đủ. Khả năng thích ứng này chứng minh khả năng của Gemini trong việc kết hợp nhiều loại dữ liệu đầu vào và cải thiện khả năng ra quyết định mà không cần phải sửa đổi mô hình.
Chia sẻ bài viết này:
Tin tức mới nhất
Chiến lược kinh doanh AI của LINE Đài Loan và thông báo về dịch vụ mới
0:00 21/11/25
LINE Đài Loan đã tổ chức sự kiện "LINE CONVERGE 2025" tại Đài Loan vào ngày 22 tháng 10 năm 2025 và công bố chiến lược kinh doanh mới, bao gồm việc triển khai công nghệ AI agent trên tất cả các dịch vụ.
Ra mắt AI dự đoán đồ uống Rosetta
0:00 21/11/25
Rosetta (Tokyo) đã phát triển "Metareal Drink Trends" (Metareal DT), một công cụ AI dùng để dự đoán nhu cầu đồ uống cho các nhà hàng và ra mắt vào ngày 19 tháng 11 năm 2025.
Dịch vụ mới của nhà điều hành AI Onebox đã ra mắt
0:00 21/11/25
Onebox (Shibuya-ku, Tokyo) đã ra mắt dịch vụ mới có tên "yaritori Assist", trong đó AI và các nhà điều hành chuyên biệt cùng nhau làm việc để cải thiện quy trình kinh doanh và xử lý các nhiệm vụ không cốt lõi.
Copyright © 2024 Generatived - All right Reserved.
Chia sẻ bài viết này:
Chia sẻ bài viết này:
Danh mục
Tin tức
AI và luật/hệ thống/kinh tế/xã hội
Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.
Tin tức mới nhất
Chiến lược kinh doanh AI của LINE Đài Loan và thông báo về dịch vụ mới
0:00 21/11/25
LINE Đài Loan đã tổ chức sự kiện "LINE CONVERGE 2025" tại Đài Loan vào ngày 22 tháng 10 năm 2025 và công bố chiến lược kinh doanh mới, bao gồm việc triển khai công nghệ AI agent trên tất cả các dịch vụ.
Ra mắt AI dự đoán đồ uống Rosetta
0:00 21/11/25
Rosetta (Tokyo) đã phát triển "Metareal Drink Trends" (Metareal DT), một công cụ AI dùng để dự đoán nhu cầu đồ uống cho các nhà hàng và ra mắt vào ngày 19 tháng 11 năm 2025.
Dịch vụ mới của nhà điều hành AI Onebox đã ra mắt
0:00 21/11/25
Onebox (Shibuya-ku, Tokyo) đã ra mắt dịch vụ mới có tên "yaritori Assist", trong đó AI và các nhà điều hành chuyên biệt cùng nhau làm việc để cải thiện quy trình kinh doanh và xử lý các nhiệm vụ không cốt lõi.



%20(1).webp)


