Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif
%20(1).webp)
Pengecer Fortune 100 Mempercepat Pemrosesan Data JSON
Generatived
30/1/25, 05.00
Pengecer Fortune 100 memanfaatkan format JSON dengan baik karena fleksibilitasnya dalam memproses informasi yang tidak terstruktur dan mengelola sejumlah besar data inventaris. Perusahaan menerapkan akselerasi GPU, yang secara signifikan meningkatkan efisiensi beban kerja pemrosesan datanya. Menjalankan beban kerja ini pada GPU secara drastis mengurangi waktu eksekusi dari 16,7 jam menjadi hanya 3,8 jam, menghasilkan pengurangan biaya sebesar 80% dibandingkan dengan menggunakan kluster CPU.
Kemajuan pemrosesan data pengecer dimungkinkan oleh penggunaan instans GCP n1-standard-16, yang masing-masing dilengkapi dengan GPU NVIDIA T4. Pengaturan ini terbukti efektif dalam menangani beban kerja Spark pengecer, yang melibatkan permintaan data JSON yang ekstensif, terkadang melebihi puluhan terabyte pada satu instans.
Tantangan dalam memproses data JSON pada GPU diatasi oleh RAPIDS Accelerator untuk Apache Spark, khususnya saat menggunakan fungsi get_json_object Spark untuk mengurai string JSON dalam kueri SQL . Meskipun ada tantangan awal karena ukuran string yang besar dan seringnya pemanggilan fungsi, kemampuan fungsi untuk mengekstrak objek dari rekaman JSON berdasarkan jalur yang ditentukan sangat penting bagi alur kerja ETL pengecer.
Serangkaian perbaikan strategis diterapkan untuk mengoptimalkan pemrosesan JSON pada GPU, khususnya untuk data yang jarang. Ini termasuk pengelompokan data serupa dalam warp untuk meminimalkan divergensi thread dan mengurutkan kueri untuk lebih mengurangi divergensi. Penggunaan tokenizer paralel data dalam pustaka RAPIDS cuDF juga berkontribusi pada peningkatan kinerja yang signifikan. Pengoptimalan ini menghasilkan percepatan 5,6x dalam waktu pemrosesan, dengan peningkatan lebih lanjut yang dijadwalkan akan dirilis akhir tahun ini. RAPIDS Accelerator untuk Apache Spark, bersama dengan cuDF, membantu meningkatkan pemrosesan data JSON oleh GPU, memberikan perusahaan peluang untuk memigrasikan beban kerja Spark yang ada ke GPU tanpa perubahan kode.
Bagikan artikel ini:
Tin tức mới nhất
Distribusi Panduan Kata-Kata Berguna Dimulai
16/12/25, 00.00
Useful (Chiyoda-ku, Tokyo) telah mulai mendistribusikan panduan gratis, "Panduan Lengkap Copilot x Word," yang mengilustrasikan cara menggunakan "Copilot" dengan Microsoft Word.
Meningkatkan keandalan agen AI Salesforce
16/12/25, 00.00
Salesforce(San Francisco) telah mengumumkan inisiatif baru untuk meningkatkan kemampuan penalaran dan keandalan perilaku agen AI.
Layanan Kemitraan Bisnis AI Bellsystem 24
16/12/25, 00.00
Bell System 24 (Minato-ku, Tokyo) telah mengumumkan kemitraan bisnis dengan AVILEN (Chuo-ku, Tokyo) dan Itochu Corporation (Minato-ku, Tokyo).
Copyright © 2024 Generatived - All right Reserved.
Bagikan artikel ini:
Bagikan artikel ini:
Kategori
Berita
AI dan hukum/peraturan/masyarakat
Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.
Berita terkini
Distribusi Panduan Kata-Kata Berguna Dimulai
16/12/25, 00.00
Useful (Chiyoda-ku, Tokyo) telah mulai mendistribusikan panduan gratis, "Panduan Lengkap Copilot x Word," yang mengilustrasikan cara menggunakan "Copilot" dengan Microsoft Word.
Meningkatkan keandalan agen AI Salesforce
16/12/25, 00.00
Salesforce(San Francisco) telah mengumumkan inisiatif baru untuk meningkatkan kemampuan penalaran dan keandalan perilaku agen AI.
Layanan Kemitraan Bisnis AI Bellsystem 24
16/12/25, 00.00
Bell System 24 (Minato-ku, Tokyo) telah mengumumkan kemitraan bisnis dengan AVILEN (Chuo-ku, Tokyo) dan Itochu Corporation (Minato-ku, Tokyo).


%20(1).webp)



