Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

Thiết kế kiến trúc tham chiếu môi trường suy luận WEKA AI
Generatived
4:30 21/11/24
WEKA (Atlanta và Campbell, California), một công ty nền tảng dữ liệu thô AI, đã công bố giải pháp kiến trúc tham chiếu mới giúp đơn giản hóa việc phát triển và triển khai môi trường suy luận AI của doanh nghiệp. Nền tảng tham chiếu WEKA AI RAG (WARRP) cung cấp cho các nhà phát triển AI và kiến trúc sư đám mây một bản kế hoạch chi tiết để phát triển các khung cơ sở hạ tầng suy luận mạnh mẽ.
Khung này, bao gồm công nghệ RAG, cho phép các mô hình ngôn ngữ quy mô lớn (LLM) thu thập dữ liệu mới từ các nguồn bên ngoài và cải thiện hiệu quả của quá trình suy luận AI. Theo Báo cáo xu hướng AI toàn cầu mới nhất của S&P Global Market Intelligence, AI tổng quát là chế độ AI có tỷ lệ áp dụng cao nhất bởi các doanh nghiệp và phạm vi của nó vượt xa các ứng dụng AI khác.
WARRP cung cấp bản thiết kế thành phần mô-đun toàn diện để giúp doanh nghiệp nhanh chóng xây dựng và triển khai quy trình suy luận AI dựa trên RAG. Kiến trúc tham chiếu này sử dụng phần mềm Nền tảng dữ liệu WEKA® làm lớp nền tảng, khung AI doanh nghiệp hàng đầu của NVIDIA, khối lượng công việc AI nâng cao và khả năng điều phối GPU của Run:ai cũng như công nghệ phần mềm quản lý dữ liệu tích hợp mã nguồn mở và thương mại phổ biến.
Chủ tịch WEKA Shimon Ben-David cho biết: “Làn sóng công nghệ AI thế hệ đầu tiên sẽ bắt đầu được áp dụng tại các doanh nghiệp vào năm 2023 và nhiều tổ chức đang tập trung nguồn lực vào việc đào tạo các mô hình AI”. "Việc thực hiện suy luận AI là vô cùng thách thức và chúng tôi tận dụng các giải pháp cơ sở hạ tầng đám mây và AI hàng đầu trong ngành như WEKA, NVIDIA, Run: ai, Kubernetes và Milvus để phát triển WARRP."
WARRP cung cấp một khung mô-đun linh hoạt, thể hiện khả năng mở rộng, khả năng thích ứng và hiệu suất tuyệt vời trong môi trường sản xuất. Phiên bản đầu tiên của kiến trúc tham chiếu này có sẵn để tải xuống miễn phí và những người tham dự Supercomputing 2024 có thể tìm hiểu thêm và xem bản demo của giải pháp mới tại gian hàng của WEKA. Thông tin thêm có tại https://www.weka.io/resources/reference-architecture/warrp-weka-ai-rag-reference-platform/.
Chia sẻ bài viết này:
Tin tức mới nhất
OpenAI giới thiệu các mô hình GPT-5.4 Mini và Nano.
0:00 19/3/26
Những tiến bộ mới nhất trong công nghệ trí tuệ nhân tạo đã dẫn đến sự ra đời của các mô hình hiệu quả hơn, được gọi là GPT-5.4 mini và nano.
Cách tiếp cận lấy kỹ sư làm trung tâm trong thời đại trí tuệ nhân tạo lạm phát.
0:00 19/3/26
Công ty Inflation (Meguro-ku, Tokyo) được thành lập với mục tiêu trở thành một doanh nghiệp nơi các kỹ sư đóng vai trò chủ đạo, chịu ảnh hưởng bởi Trí tuệ nhân Generative AI).


%20(1).webp)
