top of page

Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

logo.png

NVIDIA giới thiệu NIXL để tăng cường khả năng suy luận AI.

Generatived

0:00 11/3/26

AI アプリケーションへの大規模言語モデル (LLM) の導入により、スケーラビリティを向上させ、レーテンシーを削減する分散推論フレームワークが開発されました。これらのフレームワークは、複数の GPU とノードにわたる計算負荷を管理するために、分散サービング、KV キャッシュ ローディング、ワイド エキスパート並列処理などのさまざまな手法を採用しています。たとえば、分散サービングでは、プレフィル フェーズとデコード フェーズを異なる GPU に分離し、それらの間で効率的なデータ転送が必要になります。KV キャッシュ ローディングは、特にマルチターン AI ワークロードで、ストレージを活用して拡張キャッシュを処理します。これは、以前の結果を再計算するのではなく、ストレージから取得することにより行います。ワイド エキスパート並列処理では、GPU 全体に「エキスパート」を分散するため、中間結果の転送には超低レイテンシの通信が必要です。

これらのサービスは継続的に稼働する可能性があり、動的な性質を持つため、ユーザーの需要に応じて変化するGPU使用率に適応し、障害発生時の回復力を確保できるシステムが必要です。これには、リカバリ期間中にスループットを低下させて稼働させる機能も含まれます。さらに、メモリ、ストレージ、コンピューティング能力といったハードウェアの多様性を考慮すると、通信技術とストレージ技術を統合し、様々なメモリおよびストレージ階層間で効率的なデータ移動を可能にするライブラリが必要です。

これらの課題に対処するため、NVIDIA Inference Transfer Library (NIXL) がオープンソースでベンダーに依存しないデータ移動ライブラリとして導入されました。NIXL は、異なるメモリおよびストレージ技術間でのデータ転送のための統合APIを提供することで、複雑な AI 推論フレームワークをサポートするように設計されています。RDMA、GPU 主導型ネットワーク、高度なクラウドストレージオプションなど、幅広い技術をサポートしています。NIXL はすでに複数の AI 推論フレームワークに統合されており、様々なクラウドサービスとの互換性を備えているため、汎用性とパフォーマンスが向上しています。

NIXLのアーキテクチャには、コア転送エージェントが含まれており、 APIを介して複数の転送バックエンドプラグインをサポートしています。メモリ登録、メタデータ交換、転送要求の作成と管理など、エージェント間のデータ転送を設定するための効率的なプロセスを提供します。ライブラリの設計により、動的なスケーリングが可能になり、オーバーヘッドが最小限に抑えられ、通信と計算の効率的なオーバーラップが実現します。NIXLには、システムの検証と最適化を支援するNIXLBenchやKVBenchなどのパフォーマンスベンチマークツールも含まれています。ライブラリはGitHubで公開されており、Linux環境をサポートし、C、 Python、Rustのバインディングを備えているため、開発者はNIXLをAI推論ワークロードに組み込むことができます。

Chia sẻ bài viết này:

Tin tức mới nhất
OpenAI mua lại Promptfoo để Enhance AI.

OpenAI mua lại Promptfoo để Enhance AI.

0:00 11/3/26

Việc một công ty AI hàng đầu mua lại Promptfoo sẽ tăng cường các tính năng bảo mật của nền tảng OpenAI Frontier.

Ra mắt dịch vụ vận hành mạng xã hội (SNS) được hỗ trợ bởi trí tuệ nhân tạo của Riddell.

Ra mắt dịch vụ vận hành mạng xã hội (SNS) được hỗ trợ bởi trí tuệ nhân tạo của Riddell.

0:00 11/3/26

Riddell (quận Minato, Tokyo) đã cải tiến dịch vụ quản lý mạng xã hội "PRST" và sẽ bắt đầu cung cấp dịch vụ "quản lý mạng xã hội dựa trên trí tuệ nhân tạo"

Truyền thông thử nghiệm công cụ tạo nội dung AI m��ới.

Truyền thông thử nghiệm công cụ tạo nội dung AI mới.

0:00 11/3/26

Media Try (quận Nishi, Osaka) đã ra mắt "CREAITOR," một nền tảng truyền thông dựa trên trí tuệ nhân tạo (AI) dành cho người sáng tạo.

Chương trình học tập tại trường "Tư duy trong kỷ nguyên AI"

Chương trình học tập tại trường "Tư duy trong kỷ nguyên AI"

0:00 11/3/26

Trường phái tư duy trong kỷ nguyên AI chỉ ra tầm quan trọng của khả năng tư duy để xác định vấn đề và tạo ra giải pháp, ngay cả khi sự phát triển của Generative AI)

Copyright © 2024 Generatived - All right Reserved.

Chia sẻ bài viết này:

Chia sẻ bài viết này:

Generatived AI Logo

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

  • Facebook
  • X

Hãy theo dõi chúng tôi

Ngôn ngữ

Tin tức mới nhất
OpenAI mua lại Promptfoo để Enhance AI.

OpenAI mua lại Promptfoo để Enhance AI.

0:00 11/3/26

Việc một công ty AI hàng đầu mua lại Promptfoo sẽ tăng cường các tính năng bảo mật của nền tảng OpenAI Frontier.

Ra mắt dịch vụ vận hành mạng xã hội (SNS) được hỗ trợ bởi trí tuệ nhân tạo của Riddell.

Ra mắt dịch vụ vận hành mạng xã hội (SNS) được hỗ trợ bởi trí tuệ nhân tạo của Riddell.

0:00 11/3/26

Riddell (quận Minato, Tokyo) đã cải tiến dịch vụ quản lý mạng xã hội "PRST" và sẽ bắt đầu cung cấp dịch vụ "quản lý mạng xã hội dựa trên trí tuệ nhân tạo"

Truyền thông thử nghiệm công cụ tạo nội dung AI mới.

Truyền thông thử nghiệm công cụ tạo nội dung AI mới.

0:00 11/3/26

Media Try (quận Nishi, Osaka) đã ra mắt "CREAITOR," một nền tảng truyền thông dựa trên trí tuệ nhân tạo (AI) dành cho người sáng tạo.

Chương trình học tập tại trường "Tư duy trong kỷ nguyên AI"

Chương trình học tập tại trường "Tư duy trong kỷ nguyên AI"

0:00 11/3/26

Trường phái tư duy trong kỷ nguyên AI chỉ ra tầm quan trọng của khả năng tư duy để xác định vấn đề và tạo ra giải pháp, ngay cả khi sự phát triển của Generative AI)

bottom of page