NTTデータ(東京)は、官公庁の行政事務業務をAIで効率化するためのPoCを実施し、Google Cloud TPUを活用したモデル作成を可能にした。同社は、AIを用いた書類の分類や検索業務の改善に取り組んでいる。

同社の桂康文氏によると、官公庁の申請書類は年間数十万件に及び、分類付与や内容検証に時間がかかる。自然言語処理技術の進展を踏まえ、機械学習を用いた分類と検索システムの検証プロジェクトが始まった。

甲野慎太郎氏は、機械学習が有効だと判断した理由を技術的な観点から語る。多種多様な申請書類に対応するため、BERTなどの自然言語処理モデルがブレークスルーとなった。

NTTデータグループの小池大地氏は、プロジェクトでの事前学習モデル構築について語る。データ量が膨大で専門用語が多いため、ドメイン特化のモデルを新たに構築した。Cloud TPUの高速処理能力がプロジェクト成功の鍵となった。

プロジェクトリーダーの桂氏は、ドメイン特化モデルの知見を生成AIの活用にもつなげたいと述べる。テキスト情報だけでなく、マルチモーダルな情報処理への応用も視野に入れている。

ソース:AI & Machine Learning | Google Cloud Blog