Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif

Google Tech Mengumumkan DataGemma untuk LLM yang Tepat
Generatived
13/9/24, 04.30
Kemajuan terbaru dalam kecerdasan buatan telah mengembangkan model bahasa skala besar (LLM) canggih yang dapat mengurai data teks dalam jumlah besar, menghasilkan ide-ide kreatif, dan bahkan menulis kode. Meskipun memiliki kemampuan yang canggih, LLM ini dapat menghasilkan informasi palsu dengan keandalan yang tinggi. Ini adalah masalah yang disebut "halusinasi". Untuk mengatasi masalah ini, para peneliti telah memberikan kontribusi yang signifikan untuk mengurangi halusinasi dengan menghubungkan LLM dengan data statistik dunia nyata. Hal ini menghasilkan DataGemma, serangkaian model terbuka perintis yang terintegrasi dengan Data Commons Google, gudang data tepercaya yang komprehensif.
Data Commons adalah database informasi publik yang besar dan terus berkembang dari organisasi terkemuka seperti Perserikatan Bangsa-Bangsa dan WHO. Ini menawarkan lebih dari 240 miliar titik data di berbagai variabel statistik, memberikan banyak pengetahuan tentang berbagai topik mulai dari data kesehatan hingga lingkungan. Data Commons dapat diakses melalui antarmuka bahasa alami bertenaga AI yang memungkinkan pengguna menanyakan berbagai topik, seperti korelasi antara pendapatan dan diabetes di Amerika Serikat atau perubahan akses listrik di negara-negara Afrika.
Dengan mengintegrasikan Data Commons ke dalam Gemma, rangkaian model terbuka yang canggih, kami bertujuan menjadikan LLM lebih faktual dan spekulatif. DataGemma menggunakan dua pendekatan inovatif: Retrieval-Interleaved Generation (RIG) dan Retrieval-Augmented Generation (RAG). RIG menanyakan sumber tepercaya dan melakukan referensi silang dengan Data Commons untuk memastikan keakuratan, sementara RAG menggabungkan informasi kontekstual yang relevan untuk memberikan respons yang lebih komprehensif. Metode-metode ini telah menunjukkan hasil yang menjanjikan dalam meningkatkan keakuratan fakta numerik dalam model bahasa dan mengurangi terjadinya halusinasi.
Para peneliti dan pengembang kini memiliki akses ke DataGemma dan metodologinya, yang dirinci dalam makalah penelitian terbaru. Penelitian yang sedang berjalan difokuskan pada penyempurnaan pendekatan ini dan kami berencana untuk mengintegrasikannya ke dalam model Gemma dan Gemini. Dengan menjadikan DataGemma sebagai model terbuka, kami akan mendorong adopsi teknologi ini secara luas, meningkatkan kepercayaan terhadap LLM, memberikan informasi yang akurat, mendukung pengambilan keputusan yang tepat, dan menyediakan alat berharga yang meningkatkan pemahaman kami tentang dunia .
Bagikan artikel ini:

