2021年04月09日
【流 通】NTTデータ 業務領域特有の用語・文脈を理解する言語モデルの提供体制確立
NTTデータは汎用言語モデルBERT(※)を特定の業務領域(ドメイン)に応じて最適化し、顧客企業が扱う業務文書に適した言語モデルを自動で構築するドメイン特化BERT構築フレームワーク(以下 ドメイン特化BERT−FW)を開発した。
ドメイン特化BERT−FWの利用によりNTTデータは業界を限定しないさまざまなドメインに特化したBERTを短期間で構築し、顧客に高性能な言語処理サービスを素早く提供できるようになった。
ドメイン特化BERT−FWは専門用語や特有の文脈を含む文書を解析する際に、言語モデル自体を顧客企業の業務文書に最適化することで、従来のBERTと比べて高精度の結果を得ることができる。また言語モデル構築の一連の流れは自動化されているため、専門家によるチューニングを行う場合と比べて短期間でモデルを構築できる。
ドメイン特化BERT−FWの適用により、専門用語や特有の文脈への対応が必要だった分野での自然言語処理技術活用の幅が大きく広がることが見込まれる。2021年4月以降順次、文書を扱う業務の効率化やサービスの高度化を検討している企業を募り、2021年度中に5件の共同検証実施を目指す。
※ BERT (Bidirectional Encoder Representations from Transformers)
2018年10月にGoogleが発表した自然言語処理モデルであり、自然言語処理分野のさまざまなベンチマークにおいて従来モデルの精度を上回るなど近年非常に注目されている
※ 製品名および会社名は、各社の商標または登録商標です
投稿者:gotsuat 09:40| 流通