Anthropicが現地時間7月11日に、安全性とコーディング機能を強化したAIチャットボットClaude 2を発表した。新しいモデルは、パフォーマンスの向上、応答時間の短縮、APIおよび公開ベータウェブサイトclaude.aiを介したアクセシビリティーを備えている。

同社はClaudeの会話のしやすさ、明確な説明力、有害な出力の削減、記憶力の向上などを以前から強調しているが、今回の機能強化はコーディング、数学、推論に重点を置いている。

例えば、Claude 2は、司法試験の多肢選択セクションで76.5%という驚異的なスコアを達成し、Caulde1.3の73.0%を上回ったという。また、GREの読み書きにおいて90パーセンタイルの大学生を上回り、定量的推論においては志願者の中央値と一致する。

Claude 2 APIの価格は、企業向けのClaude 1.3と同じだ。ベータ版のチャットエクスペリエンスは現在、米国と英国のユーザーが利用できる。パフォーマンスと安全性が向上し、クロードの入力と出力が拡大した。プロンプトごとに最大100,000のトークンを処理できるため、広範な技術文書や書籍全体を処理できる。Claude 2は、メモやストーリーなど、最大数千トークンの長いドキュメントを生成できる。

Claude 2のコーディングスキルも大幅に向上した。Codex HumanEval Pythonテストで71.2%のスコアを獲得し、Claude 1.3の56.0%を上回ったという。GSM8kの小学校の算数の問題では、85.2%から88.0%のスコアを獲得した。

一方で、同社は安全性の強化を最優先事項にしている。Claude 2は1.3の2倍は無害な応答を返すが、完全に影響を受けないモデルはないと同社は考えており、安全技術に関するレッドチームを編成したという。

Claude 2の利用は今は米国と英国に限られているが、世界中で利用可能になる予定だ。またClaude APIに関してはいくつかの企業と提携している。生成AIプラットフォームであるJasperは、さまざまなユースケース、特に長時間の低遅延タスクにおけるClaude 2のパフォーマンスを賞賛している。コードAIプラットフォームであるSourcegraphも、Claude 2の改善された推論と正確な回答の恩恵を受けているという。