top of page
Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif
logo.png

NVIDIA Mengumumkan Alat AI untuk Insight Dokumen yang Ditingkatkan

Generatived

26/11/25, 00.00

NVIDIA mengumumkan AI-Q Research Assistant dan Enterprise RAG Blueprints, yang menggunakan model AI inferensi Nemotron dan pembangkitan augmentasi pencarian (RAG) untuk meningkatkan pemahaman dokumen dan ekstraksi wawasan. Perangkat ini dirancang untuk mengotomatiskan proses analisis dan pelaporan dari kumpulan data besar dan membutuhkan infrastruktur AI yang tangguh untuk penerapannya. NVIDIA merinci proses penerapan pada Amazon Elastic Kubernetes Service (EKS) di AWS, memanfaatkan layanan tambahan seperti basis data vektor Amazon OpenSearch Serverless, Amazon S3 untuk penyimpanan, dan Karpenter untuk penskalaan GPU dinamis.

Blueprint Asisten Riset AI-Q dibangun di atas Blueprint RAG Perusahaan, yang berfungsi sebagai komponen intinya. Sistem ini memanfaatkan layanan mikro NVIDIA NIM, sebuah wadah inferensi yang dioptimalkan untuk model AI pada GPU. Blueprint AI-Q menyempurnakan fondasi RAG dengan komponen-komponen canggih seperti model bahasa berskala besar untuk pembuatan laporan terperinci dan integrasi pencarian web untuk informasi waktu nyata.

Arsitektur solusi di AWS menerapkan layanan mikro NVIDIA NIM sebagai pod pada klaster Kubernetes dan menyediakan instans GPU secara dinamis untuk mengoptimalkan biaya dan performa. AI-Q Blueprint menambahkan lapisan "agen" untuk mengorkestrasi alur kerja yang kompleks—merencanakan, mengelaborasi, dan merefleksikan—untuk menghasilkan laporan yang komprehensif. Enterprise RAG Blueprint dilengkapi pipeline paralel untuk ekstraksi dan pengambilan data, serta terintegrasi dengan OpenSearch untuk mendapatkan jawaban yang peka konteks.

Solusi AWS NVIDIA menyediakan lingkungan komprehensif yang mengotomatiskan pengaturan infrastruktur dan komponen keamanan. Solusi ini memanfaatkan Amazon EKS untuk mengelola layanan kontainer, Amazon S3 untuk danau data, Amazon OpenSearch Serverless untuk penyematan dokumen, dan Karpenter untuk penskalaan otomatis node GPU. Proses penerapan disederhanakan oleh skrip otomatis dan mencakup tumpukan observabilitas dengan alat pemantauan seperti Prometheus, Grafana, Zipkin, dan NVIDIA DCGM.

Kesimpulannya, AI-Q Research Assistant dan Enterprise RAG Blueprints dari NVIDIA menyediakan aplikasi AI yang skalabel dan efisien untuk perusahaan. Diimplementasikan di AWS, perangkat ini memproses dan mengintegrasikan wawasan dari data dalam jumlah besar, mengubah data perusahaan menjadi intelijen yang aman dan dapat ditindaklanjuti. Pengguna dapat menerapkan blueprint ini di Amazon EKS untuk memanfaatkan kekuatan AI generatif dalam operasi bisnis mereka.

Bagikan artikel ini:

Tin tức mới nhất
Peningkatan integrasi antara Google GKE dan Gemini CLI

Peningkatan integrasi antara Google GKE dan Gemini CLI

11/11/25, 00.00

Google(California, AS) terus menyediakan alat-alat canggih bagi para pengembang dan profesional operasi.

ComputeEval Memperluas AIBenchmark dengan Tantangan Baru

ComputeEval Memperluas AIBenchmark dengan Tantangan Baru

11/11/25, 00.00

Organisasi tersebut baru-baru ini memperluas ComputeEval, sebuah tolok ukur sumber terbuka untuk mengevaluasi model AI pada tugas pemrograman CUDA, untuk menyertakan lebih dari 100 tantangan baru.

NVIDIA Mengumumkan Nemotron Nano-9B-v2 untuk Pembelajaran Mesin yang Efisien

NVIDIA Mengumumkan Nemotron Nano-9B-v2 untuk Pembelajaran Mesin yang Efisien

11/11/25, 00.00

Agen ilmu data baru telah dikembangkan untuk menyederhanakan alur kerja pembelajaran mesin (ML) dan memungkinkan ilmuwan data untuk memproses kumpulan data besar secara lebih efisien.

n8n menyederhanakan alur kerja hosting mandiri di Cloud Run

n8n menyederhanakan alur kerja hosting mandiri di Cloud Run

11/11/25, 00.00

n8n memperkenalkan cara yang efisien bagi tim untuk menghosting sendiri alur kerja dan alat otomatisasi mereka di Cloud Run, menyediakan platform tanpa server yang dapat diskalakan sesuai beban kerja Anda.

Copyright © 2024 Generatived - All right Reserved.

Bagikan artikel ini:

Bagikan artikel ini:

Generatived

Hãy theo dõi chúng tôi

  • Facebook
  • X

Bahasa

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Generatived AI Logo

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

  • Facebook
  • X

Ikuti kami

Bahasa

Berita terkini
Peningkatan integrasi antara Google GKE dan Gemini CLI

Peningkatan integrasi antara Google GKE dan Gemini CLI

11/11/25, 00.00

Google(California, AS) terus menyediakan alat-alat canggih bagi para pengembang dan profesional operasi.

ComputeEval Memperluas AIBenchmark dengan Tantangan Baru

ComputeEval Memperluas AIBenchmark dengan Tantangan Baru

11/11/25, 00.00

Organisasi tersebut baru-baru ini memperluas ComputeEval, sebuah tolok ukur sumber terbuka untuk mengevaluasi model AI pada tugas pemrograman CUDA, untuk menyertakan lebih dari 100 tantangan baru.

NVIDIA Mengumumkan Nemotron Nano-9B-v2 untuk Pembelajaran Mesin yang Efisien

NVIDIA Mengumumkan Nemotron Nano-9B-v2 untuk Pembelajaran Mesin yang Efisien

11/11/25, 00.00

Agen ilmu data baru telah dikembangkan untuk menyederhanakan alur kerja pembelajaran mesin (ML) dan memungkinkan ilmuwan data untuk memproses kumpulan data besar secara lebih efisien.

n8n menyederhanakan alur kerja hosting mandiri di Cloud Run

n8n menyederhanakan alur kerja hosting mandiri di Cloud Run

11/11/25, 00.00

n8n memperkenalkan cara yang efisien bagi tim untuk menghosting sendiri alur kerja dan alat otomatisasi mereka di Cloud Run, menyediakan platform tanpa server yang dapat diskalakan sesuai beban kerja Anda.

bottom of page