人が日常的にコミュニケーションで使うテキスト(文字列)を対象としたコンピューター処理(natural language processing:NLP)のこと。人に代わって機械に解析させることで、大量のデータ処理を可能とし、医療や健康の分野でも応用が進んでいる。

 自然言語処理の日常生活での典型的な応用例は「チャットボット」。文章や音声を通じて質問を投げかけると自動的に回答が寄せられるというもの。テキストから要素を抽出し、その要素を分類したり重み付けしたりして、適した回答を選び出して表示するような処理が行われている。

 自然言語処理で行われるタスクには、「文書分類」「質問応答」「対話」のほか、「機械翻訳」「文書要約」などがある。文章を要素に分け、名詞なのか、動詞なのか、固有名詞なのかを見分けたり、どのような文章の構成になっているのかを判断しランク付けしたりしていく。

 こうした処理により、チャットボットで見られるような、投げかけた質問に対応して、親和性の高い部分を大量のマニュアルテキストから抽出し、ディスプレー上に表示したりする処理も可能になる。

 医療分野においては、例えば、がんのゲノム医療での活用が進んでいる。東京大学医科学研究所ヒトゲノム解析センターの宮野悟氏のグループが、自然言語処理を用いた仕組みによって、医学論文などのデータベースを解析し、ゲノム情報と照らし合わせて治療につなげる研究を進めている (関連記事:医学の源泉は試験管からデジタルへ)