top of page

Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

logo.png

NVIDIA、OpenAIの強化されたGPT-OSS AIモデルを発表

Generatived

25/8/7 0:00

NVIDIA と OpenAI は、AI 機能の強化に向けて再び協力し、新しいオープンウェイトモデル「gpt-oss-20b」と「gpt-oss-120b」を発表しました。推論性能の高速化を目的として設計されたこれらのモデルは、NVIDIA の Blackwell アーキテクチャ上で最大 150 万トークン/秒という驚異的な速度を実現します。思考連鎖推論やツール呼び出し機能といった高度な機能を備え、FP4 精度でリリースされているため、80 GB のデータセンター GPU 1 台で動作します。

これらのモデルのトレーニングは NVIDIA H100 Tensor Core GPU で実施され、より大規模な gpt-oss-120b モデルでは 210 万時間以上のトレーニングを要しました。NVIDIA は、複数の主要なオープンソースフレームワークとの互換性を確保し、モデルのパフォーマンスを最適化しました。また、開発者の多様なニーズに対応するため、gpt-oss モデルを自社のソフトウェアプラットフォーム全体に統合しています。

モデルのパフォーマンスを最大限に高めるため、NVIDIA は、アテンションおよび Mixture of Experts (MoE) ルーティング向けの専用カーネルや、OpenAI Triton カーネル MoE のサポートなど、さまざまな機能を導入しました。これらの機能強化は、大規模言語モデル (LLM) 向けに設計された FlashInfer カーネルサービングライブラリを通じて利用できます。NVIDIA はまた、vLLM や TensorRT-LLM などのさまざまなツールを使用してこれらのモデルをデプロイするためのガイダンスも提供し、開発者がプロジェクトに容易に統合できるようにしています。

NVIDIA のパフォーマンスへの取り組みは、OpenAI とのコラボレーションに表れており、gpt-oss モデルは初日から高速パフォーマンスに対応しています。これらのモデルは、高いスループットとトークンあたりの低コストを維持しながら、多数の同時ユーザーをサポートできると期待されています。NVIDIA のプラットフォームは AI エコシステムを継続的にサポートし、開発者に最新モデルを効率的かつ効果的にデプロイするために必要なツールとリソースを提供します。

この記事を共有:

最新のニュース
3社、秘密分散型RAG��を開発

3社、秘密分散型RAGを開発

26/5/12 0:00

イージス・アプリケーション、ZenmuTech、Technica AIの3社は、秘密分散技術とRAG(検索拡張生成)を組み合わせた「秘密分散×RAGソリューション」を共同開発したと発表した。

サージクラフト、AI対応基盤を提供開始

サージクラフト、AI対応基盤を提供開始

26/5/12 0:00

サージクラフトは、LINEやメール、Webチャット、SNSなど複数チャネルの問い合わせを一元管理し、AIによる回答生成と人間レビューを組み合わせたカスタマーサポートAIプラットフォーム「TuneAIBot」の提供を開始したと発表した。

PKSHA Infinity、YOMELにAI対話機能

PKSHA Infinity、YOMELにAI対話機能

26/5/12 0:00

PKSHA Infinity(福岡県福岡市)は、AI議事録作成ツール「YOMEL」において、会議ログを基にAIと対話しながら分析や次回アクション整理を行える「AIチャット機能」の提供を開始した。

FID、AI検索最適化Genview提供開始

FID、AI検索最適化Genview提供開始

26/5/12 0:00

FID(東京都新宿区)は、AI検索最適化(GEO)プラットフォーム「Genview」の正式提供を開始したと発表した。

Copyright © 2024 Generatived - All right Reserved.

この記事を共有:

この記事を共有:

Generatived AI Logo

Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。

  • Facebook
  • X

フォローをお願いします

言語

最新のニュース
3社、秘密分散型RAGを開発

3社、秘密分散型RAGを開発

26/5/12 0:00

イージス・アプリケーション、ZenmuTech、Technica AIの3社は、秘密分散技術とRAG(検索拡張生成)を組み合わせた「秘密分散×RAGソリューション」を共同開発したと発表した。

サージクラフト、AI対応基盤を提供開始

サージクラフト、AI対応基盤を提供開始

26/5/12 0:00

サージクラフトは、LINEやメール、Webチャット、SNSなど複数チャネルの問い合わせを一元管理し、AIによる回答生成と人間レビューを組み合わせたカスタマーサポートAIプラットフォーム「TuneAIBot」の提供を開始したと発表した。

PKSHA Infinity、YOMELにAI対話機能

PKSHA Infinity、YOMELにAI対話機能

26/5/12 0:00

PKSHA Infinity(福岡県福岡市)は、AI議事録作成ツール「YOMEL」において、会議ログを基にAIと対話しながら分析や次回アクション整理を行える「AIチャット機能」の提供を開始した。

FID、AI検索最適化Genview提供開始

FID、AI検索最適化Genview提供開始

26/5/12 0:00

FID(東京都新宿区)は、AI検索最適化(GEO)プラットフォーム「Genview」の正式提供を開始したと発表した。

bottom of page