Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

Google Gemini nâng cao khả năng giải thích hình ảnh đa phổ
Generatived
0:00 20/11/25
Mô hình Gemini của Google cung cấp cho các ứng dụng khả năng diễn giải hình ảnh đa phổ, thu thập dữ liệu vượt ra ngoài phổ khả kiến. Công nghệ này cho phép các ứng dụng phân tích dữ liệu vệ tinh và hiểu thế giới theo những cách mới mà không cần đến các mô hình chuyên biệt. Bằng cách tận dụng các cảm biến đa phổ, các ứng dụng có thể phát hiện chính xác hơn nhiều hiện tượng, từ sức khỏe thảm thực vật đến chất lượng nước.
Hình ảnh đa phổ là một bước tiến vượt bậc so với hình ảnh RGB truyền thống vì nó bao gồm dữ liệu ở các bước sóng mắt người không nhìn thấy được, chẳng hạn như cận hồng ngoại (NIR) và hồng ngoại sóng ngắn (SWIR). Khả năng này rất quan trọng trong các lĩnh vực như nông nghiệp, nơi NIR có thể được sử dụng để đánh giá sức khỏe cây trồng, và quản lý thảm họa, nơi SWIR có thể xác định các vết cháy rừng. Phương pháp tiếp cận Google giúp đơn giản hóa việc sử dụng dữ liệu phức tạp này và giúp các nhà phát triển dễ tiếp cận hơn.
Để tích hợp dữ liệu đa phổ vào Gemini, các nhà phát triển tạo ra một hình ảnh "tổng hợp màu giả" bằng cách ánh xạ các dải bước sóng vô hình với các kênh RGB được mô hình nhận dạng. Quá trình này bao gồm việc lựa chọn các dải phổ liên quan, chuẩn hóa dữ liệu và cung cấp ngữ cảnh cho mô hình. Kỹ thuật này cho phép Gemini xử lý và hiểu dữ liệu khoa học được mã hóa trong hình ảnh.
Tính linh hoạt của mô hình Gemini được thể hiện qua khả năng phân loại chính xác các loại hình thảm thực vật và các đặc điểm khác trong các ứng dụng viễn thám. Việc tích hợp dữ liệu đầu vào đa phổ cho phép mô hình đưa ra những phân biệt chính xác ngay cả trong những tình huống khó khăn mà chỉ dữ liệu RGB là không đủ. Khả năng thích ứng này chứng minh khả năng của Gemini trong việc kết hợp nhiều loại dữ liệu đầu vào và cải thiện khả năng ra quyết định mà không cần phải sửa đổi mô hình.
Chia sẻ bài viết này:
Tin tức mới nhất
Google Cloud vượt qua BIRD Benchmark trong NL2SQL
0:00 18/11/25
Google Cloud gần đây đã đạt được một chuẩn mực mới trong lĩnh vực xử lý ngôn ngữ tự nhiên, đặc biệt là trong lĩnh vực chuyển đổi văn bản sang SQL .
BlueCodeAgent nâng cao các biện pháp bảo mật AI của CodeGen
0:00 18/11/25
Các nhà nghiên cứu từ nhiều tổ chức khác nhau đã hợp tác để giải quyết những thách thức bảo mật do các mô hình ngôn ngữ lớn (LLM) đặt ra trong quá trình tạo mã tự động.
NVIDIA nâng cao khả năng lưu trữ S3 với công nghệ RDMA
0:00 18/11/25
NVIDIA đã giới thiệu một công nghệ mới giúp tăng cường khả năng lưu trữ tương thích với S3 bằng cách sử dụng truy cập bộ nhớ trực tiếp từ xa (RDMA) để tăng tốc giao diện lập trình ứng dụng (API) của S3.
Copyright © 2024 Generatived - All right Reserved.
Chia sẻ bài viết này:
Chia sẻ bài viết này:
Danh mục
Tin tức
AI và luật/hệ thống/kinh tế/xã hội
Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.
Tin tức mới nhất
Google Cloud vượt qua BIRD Benchmark trong NL2SQL
0:00 18/11/25
Google Cloud gần đây đã đạt được một chuẩn mực mới trong lĩnh vực xử lý ngôn ngữ tự nhiên, đặc biệt là trong lĩnh vực chuyển đổi văn bản sang SQL .
BlueCodeAgent nâng cao các biện pháp bảo mật AI của CodeGen
0:00 18/11/25
Các nhà nghiên cứu từ nhiều tổ chức khác nhau đã hợp tác để giải quyết những thách thức bảo mật do các mô hình ngôn ngữ lớn (LLM) đặt ra trong quá trình tạo mã tự động.
NVIDIA nâng cao khả năng lưu trữ S3 với công nghệ RDMA
0:00 18/11/25
NVIDIA đã giới thiệu một công nghệ mới giúp tăng cường khả năng lưu trữ tương thích với S3 bằng cách sử dụng truy cập bộ nhớ trực tiếp từ xa (RDMA) để tăng tốc giao diện lập trình ứng dụng (API) của S3.


%20(1).webp)
%20(1).webp)

