top of page
Generatived(Beta)|生成AIの最新ニュースとトレンドを提供
logo.png

NVIDIA とGoogle DeepMind が Gemma AI モデルを発表

Generatived

2024年2月22日

NVIDIAは、NVIDIAのAIプラットフォームに最適化された新しいオープンモデル シリーズであるGemmaを導入するためにGoogleと協力することを発表した。Google DeepMindによって開発されたGemma 2Bおよび7Bモデルは、TensorRT-LLMライブラリーを活用して推論の最適化を強化し、高スループットと最高レベルのパフォーマンスを提供するように設計されている。このコラボレーションにより、開発者はNVIDIA RTX GPUを搭載したデスクトップ上で大規模言語モデル(LLM)のパワーを活用できるようになり、高度なAI機能へのアクセスが民主化される。

Gemmaモデルは、256Kの語彙サイズと最大8Kのコンテキスト長をサポートし、安全性を念頭に置いて設計されている。PIIフィルタリングを組み込んでデータセットから機密識別子を削除し、責任あるAI開発を保証する。さらに、モデルは人間のフィードバックからの強化学習の恩恵を受け、倫理的なAI実践と連携する。6兆を超えるトークンでトレーニングされたこれらのモデルは、開発者が自信を持って高度なAIアプリケーションを作成およびデプロイできるようにする準備が整っている。

TensorRT-LLMは、FP8、XQA、INT4アクティベーション対応の重み量子化など、Gemmaモデルのパフォーマンスを向上させる機能をいくつか導入している。FP8はディープラーニング アプリケーションの高速化を促進し、NVIDIA AIによって開発されたカーネルであるXQAは生成フェーズ中のアテンションメカニズムを最適化する。もう1つのイノベーションであるINT4 AWQにより、メモリー帯域幅が制限されたシナリオで効率的なメモリー使用とパフォーマンスの向上が可能になる。これらの進歩により、Gemmaモデルはバッチサイズが小さくても、より高い精度と速度で動作できるようになる。

NVIDIAのH200 TensorコアGPUは、Gemmaモデルで優れたパフォーマンスを発揮するように設定されており、Gemma 2Bでは1秒当たり79,000トークンを超え、Gemma 7Bでは19,000トークン近くを達成する。この機能は、単一のGPU上でリアルタイムのレーテンシーで数千人の同時ユーザーにサービスを提供することを意味する。開発者は、NVIDIAのAIプレーグラウンドと今後のChat with RTXデモアプリを通じてGemmaを間もなく体験できるようになる。さらに、最適化されたGemmaモデルチェックポイントがNGCで利用可能になり、FP8量子化バージョンにはHugging Face Optimum-NVIDIAライブラリー経由でアクセスできるようになり、高速LLM推論の統合が合理化される。ソース:

この記事を共有:

最新のニュース
ベクトルOwned AIツール活用ガイド2024

ベクトルOwned AIツール活用ガイド2024

2024年10月4日 3:45:00

ベクトル(東京都港区)の子会社Owned(東京都品川区)は、AIツールの特性を動物に例えた「ビジネスに役立つ8つのツール個性まとめレポート」2024年10月版を公開した。

イントラマート新バージョン、ローコードAIを強化

イントラマート新バージョン、ローコードAIを強化

2024年10月4日 3:45:00

イントラマート(東京都港区)は、エンタープライズ・ローコードプラットフォーム「intra-mart®︎」の新版を2024年10月にリリースすると発表。

ContractPodAi、契約書レビュー強化のためのLeah Intelligenceを発表

ContractPodAi、契約書レビュー強化のためのLeah Intelligenceを発表

2024年10月4日 3:45:00

ContractPodAi は、必要に応じて重要な情報を提供することで契約レビュー プロセスを強化するように設計された新しいソリューション、Leah Intelligence を発表しました。

Credo AI、AIガバナンスのための統合ハブを発表

Credo AI、AIガバナンスのための統合ハブを発表

2024年10月4日 3:45:00

Credo AI は、さまざまなビジネス ツールで AI ガバナンスを強化するために設計された統合ハブのリリースを発表しました。

Copyright © 2024 Generatived - All right Reserved.

この記事を共有:

この記事を共有:

Generatived

Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。

  • Facebook
  • X

フォローをお願いします

最新のニュース
ベクトルOwned AIツール活用ガイド2024

ベクトルOwned AIツール活用ガイド2024

2024年10月4日 3:45:00

ベクトル(東京都港区)の子会社Owned(東京都品川区)は、AIツールの特性を動物に例えた「ビジネスに役立つ8つのツール個性まとめレポート」2024年10月版を公開した。

イントラマート新バージョン、ローコードAIを強化

イントラマート新バージョン、ローコードAIを強化

2024年10月4日 3:45:00

イントラマート(東京都港区)は、エンタープライズ・ローコードプラットフォーム「intra-mart®︎」の新版を2024年10月にリリースすると発表。

ContractPodAi、契約書レビュー強化のためのLeah Intelligenceを発表

ContractPodAi、契約書レビュー強化のためのLeah Intelligenceを発表

2024年10月4日 3:45:00

ContractPodAi は、必要に応じて重要な情報を提供することで契約レビュー プロセスを強化するように設計された新しいソリューション、Leah Intelligence を発表しました。

Credo AI、AIガバナンスのための統合ハブを発表

Credo AI、AIガバナンスのための統合ハブを発表

2024年10月4日 3:45:00

Credo AI は、さまざまなビジネス ツールで AI ガバナンスを強化するために設計された統合ハブのリリースを発表しました。

bottom of page