NVIDIA Mengumumkan Alat AI untuk Insight Dokumen yang Ditingkatkan 115/3924

Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif

NVIDIA Mengumumkan Alat AI untuk Insight Dokumen yang Ditingkatkan

Generatived

26/11/25, 00.00

NVIDIA mengumumkan AI-Q Research Assistant dan Enterprise RAG Blueprints, yang menggunakan model AI inferensi Nemotron dan pembangkitan augmentasi pencarian (RAG) untuk meningkatkan pemahaman dokumen dan ekstraksi wawasan. Perangkat ini dirancang untuk mengotomatiskan proses analisis dan pelaporan dari kumpulan data besar dan membutuhkan infrastruktur AI yang tangguh untuk penerapannya. NVIDIA merinci proses penerapan pada Amazon Elastic Kubernetes Service (EKS) di AWS, memanfaatkan layanan tambahan seperti basis data vektor Amazon OpenSearch Serverless, Amazon S3 untuk penyimpanan, dan Karpenter untuk penskalaan GPU dinamis.

Blueprint Asisten Riset AI-Q dibangun di atas Blueprint RAG Perusahaan, yang berfungsi sebagai komponen intinya. Sistem ini memanfaatkan layanan mikro NVIDIA NIM, sebuah wadah inferensi yang dioptimalkan untuk model AI pada GPU. Blueprint AI-Q menyempurnakan fondasi RAG dengan komponen-komponen canggih seperti model bahasa berskala besar untuk pembuatan laporan terperinci dan integrasi pencarian web untuk informasi waktu nyata.

Arsitektur solusi di AWS menerapkan layanan mikro NVIDIA NIM sebagai pod pada klaster Kubernetes dan menyediakan instans GPU secara dinamis untuk mengoptimalkan biaya dan performa. AI-Q Blueprint menambahkan lapisan "agen" untuk mengorkestrasi alur kerja yang kompleks—merencanakan, mengelaborasi, dan merefleksikan—untuk menghasilkan laporan yang komprehensif. Enterprise RAG Blueprint dilengkapi pipeline paralel untuk ekstraksi dan pengambilan data, serta terintegrasi dengan OpenSearch untuk mendapatkan jawaban yang peka konteks.

Solusi AWS NVIDIA menyediakan lingkungan komprehensif yang mengotomatiskan pengaturan infrastruktur dan komponen keamanan. Solusi ini memanfaatkan Amazon EKS untuk mengelola layanan kontainer, Amazon S3 untuk danau data, Amazon OpenSearch Serverless untuk penyematan dokumen, dan Karpenter untuk penskalaan otomatis node GPU. Proses penerapan disederhanakan oleh skrip otomatis dan mencakup tumpukan observabilitas dengan alat pemantauan seperti Prometheus, Grafana, Zipkin, dan NVIDIA DCGM.

Kesimpulannya, AI-Q Research Assistant dan Enterprise RAG Blueprints dari NVIDIA menyediakan aplikasi AI yang skalabel dan efisien untuk perusahaan. Diimplementasikan di AWS, perangkat ini memproses dan mengintegrasikan wawasan dari data dalam jumlah besar, mengubah data perusahaan menjadi intelijen yang aman dan dapat ditindaklanjuti. Pengguna dapat menerapkan blueprint ini di Amazon EKS untuk memanfaatkan kekuatan AI generatif dalam operasi bisnis mereka.

Sumber: Blog Pengembang NVIDIA

Bagikan artikel ini:

Tin tức mới nhất

Peningkatan integrasi antara Google GKE dan Gemini CLI

11/11/25, 00.00

Google(California, AS) terus menyediakan alat-alat canggih bagi para pengembang dan profesional operasi.

Baca lebih lanjut

ComputeEval Memperluas AIBenchmark dengan Tantangan Baru

11/11/25, 00.00

Organisasi tersebut baru-baru ini memperluas ComputeEval, sebuah tolok ukur sumber terbuka untuk mengevaluasi model AI pada tugas pemrograman CUDA, untuk menyertakan lebih dari 100 tantangan baru.

Baca lebih lanjut

NVIDIA Mengumumkan Nemotron Nano-9B-v2 untuk Pembelajaran Mesin yang Efisien

11/11/25, 00.00

Agen ilmu data baru telah dikembangkan untuk menyederhanakan alur kerja pembelajaran mesin (ML) dan memungkinkan ilmuwan data untuk memproses kumpulan data besar secara lebih efisien.

Baca lebih lanjut

n8n menyederhanakan alur kerja hosting mandiri di Cloud Run

11/11/25, 00.00

n8n memperkenalkan cara yang efisien bagi tim untuk menghosting sendiri alur kerja dan alat otomatisasi mereka di Cloud Run, menyediakan platform tanpa server yang dapat diskalakan sesuai beban kerja Anda.

Baca lebih lanjut

Bagikan artikel ini:

Kategori

Peningkat Gambar AI

Pembuat kode AI

Manajemen tugas AI

Tanpa kode/kode rendah

Generator desain grafis AI

Generator seni/ilustrasi AI

Semua alat

Berita

AI dan hukum/peraturan/masyarakat

Perusahaan/produk/teknologi AI

AI Teknologi Besar

OpenAI/ChatGPT

AI generasi kreatif

AI generasi berbasis teks

AI generatif Jepang

Dasar-dasar AI generatif

Panduan penerapan AI terbaik

Profil perusahaan

Tentang kami

Chính sách quyền riêng tư

Điều khoản sử dụng trang web

Công ty điều hành

Hãy theo dõi chúng tôi

Bahasa

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

Ikuti kami

Bahasa

Kategori

Semua alat

Manajemen tugas AI

Generator desain grafis AI

Tanpa kode/kode rendah

Pembuat kode AI

Peningkat Gambar AI

Pembuat Seni/Ilustrasi AI

AI dan hukum/sistem/ekonomi/masyarakat

Perusahaan/produk/teknologi AI

AI berteknologi besar

OpenAI/ChatGPT

AI generasi inovatif

AI generasi berbasis teks

AI inovatif Jepang

Dasar-dasar AI generatif

Petunjuk dasar aplikasi AI

Tin tức

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng của trang web

Công ty điều hành

Hồ sơ công ty

Berita terkini

Peningkatan integrasi antara Google GKE dan Gemini CLI

11/11/25, 00.00

Google(California, AS) terus menyediakan alat-alat canggih bagi para pengembang dan profesional operasi.

Baca lebih lanjut

ComputeEval Memperluas AIBenchmark dengan Tantangan Baru

11/11/25, 00.00

Organisasi tersebut baru-baru ini memperluas ComputeEval, sebuah tolok ukur sumber terbuka untuk mengevaluasi model AI pada tugas pemrograman CUDA, untuk menyertakan lebih dari 100 tantangan baru.

Baca lebih lanjut

NVIDIA Mengumumkan Nemotron Nano-9B-v2 untuk Pembelajaran Mesin yang Efisien

11/11/25, 00.00

Agen ilmu data baru telah dikembangkan untuk menyederhanakan alur kerja pembelajaran mesin (ML) dan memungkinkan ilmuwan data untuk memproses kumpulan data besar secara lebih efisien.

Baca lebih lanjut

n8n menyederhanakan alur kerja hosting mandiri di Cloud Run

11/11/25, 00.00

n8n memperkenalkan cara yang efisien bagi tim untuk menghosting sendiri alur kerja dan alat otomatisasi mereka di Cloud Run, menyediakan platform tanpa server yang dapat diskalakan sesuai beban kerja Anda.

Baca lebih lanjut