top of page
Generatived(Beta)|生成AIの最新ニュースとトレンドを提供
logo.png

AnthropicのAIシステム、安全性強化の取り組み

Generatived

2023年7月27日

AI 研究会社である Anthropic は、AI システムの安全性とセキュリティを測定および強化するために、AI システムに対して「レッド チーム」または敵対的テストを実施してきました。同社は最近、AI システムの内部および外部のセキュリティ テストを実施するというホワイト ハウスで発表された取り組みに参加しました。リスクを評価し、さまざまなトピックにわたってそのようなテストを実行する反復可能な方法を作成するための「フロンティア脅威レッドチーム」に焦点が当てられています。生物学的リスクに関する最近のプロジェクトでは、AI モデルが近いうちに国家安全保障にリスクをもたらす可能性があることが明らかになりましたが、これらのリスクを軽減するための緩和策は存在します。Anthropic は現在、リスクを確実に特定し、緩和策を構築するためにこの作業を拡大しています。このプロセスには、ドメインの専門家と協力して脅威モデルを定義し、専門家の知識に基づいて新しい自動評価を構築することが含まれます。Anthropic はまた、その調査結果を政府、研究所、その他の関係者と共有しています。Futureの研究は、AI モデルが引き起こす可能性のある潜在的な害を、たとえば検索エンジンと比較して測定することに焦点を当てます。Anthropic はまた、フロンティアの脅威のレッドチーム化を受けていないモデルのリリースの可能性にも備えて準備を進めています。 Anthropic はフロンティア脅威のレッドチーム研究チームを構築しており、その結果を適切な対象者と共有することに前向きです。

この記事を共有:

最新のニュース
ベストティーチャーAI英作文添削品質向上

ベストティーチャーAI英作文添削品質向上

2024年9月20日 3:30:00

ベストティーチャー(東京都渋谷区)は、英作文添削の品質向上を目指し、生成AIを活用した新機能を開発。

大広&WEDO、AI分析手法講演

大広&WEDO、AI分析手法講演

2024年9月20日 3:30:00

大広(東京都港区)と大広WEDO(東京都港区)は、2024年9月27日に浜松町コンベンションホールで「宣伝会議アドタイデイズ2024(秋)東京」に参加すると発表した。

二見書房新刊「非合理思考で難問解決

二見書房新刊「非合理思考で難問解決

2024年9月20日 3:30:00

二見書房(東京)は、ラス・ロバーツ著、ラッカ珠美訳の新刊『「知の巨人」たちがやっている非合理な思考術 いかにして「人生の難問」に答えを出すべきか』を9月19日に発売する。

BLUEISH IVS2024京都AIピッチ2位

BLUEISH IVS2024京都AIピッチ2位

2024年9月20日 3:30:00

BLUEISH(東京都港区)は、「IVS2024 KYOTO」Generative AI起業家ピッチで会場賞2位を受賞。

Generatived

Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。

  • Facebook
  • X

フォローをお願いします

Copyright © 2024 Generatived - All right Reserved.

この記事を共有:

この記事を共有:

最新のニュース
ベストティーチャーAI英作文添削品質向上

ベストティーチャーAI英作文添削品質向上

2024年9月20日 3:30:00

ベストティーチャー(東京都渋谷区)は、英作文添削の品質向上を目指し、生成AIを活用した新機能を開発。

大広&WEDO、AI分析手法講演

大広&WEDO、AI分析手法講演

2024年9月20日 3:30:00

大広(東京都港区)と大広WEDO(東京都港区)は、2024年9月27日に浜松町コンベンションホールで「宣伝会議アドタイデイズ2024(秋)東京」に参加すると発表した。

二見書房新刊「非合理思考で難問解決

二見書房新刊「非合理思考で難問解決

2024年9月20日 3:30:00

二見書房(東京)は、ラス・ロバーツ著、ラッカ珠美訳の新刊『「知の巨人」たちがやっている非合理な思考術 いかにして「人生の難問」に答えを出すべきか』を9月19日に発売する。

BLUEISH IVS2024京都AIピッチ2位

BLUEISH IVS2024京都AIピッチ2位

2024年9月20日 3:30:00

BLUEISH(東京都港区)は、「IVS2024 KYOTO」Generative AI起業家ピッチで会場賞2位を受賞。

bottom of page