テキストマイニングについて

テキストマイニングの基礎知識

定型化されていない文章の集まりを自然言語解析の手法を使って単語やフレーズに分割し、それらの出現頻度や相関関係を分析して有用な情報を抽出する手法やシステム。マイニング(mining)とは「発掘」という意味で、テキストの山から価値ある情報を掘り出す、といった意味が込められているデータマイニング手法の一種です。

エントリーシートや自由記述のセミナーアンケート、入社時の決意表明など、自然文の蓄積の形で存在する採用業務関連データは多く存在しますが、これらは意味のある形で数値化や定型化することが難しく、担当者が一つ一つ目を通して分析するのは時間ばかりかかってしまい効率的に活用することは困難でした。 テキストマイニングでは膨大に蓄積されたテキストデータを単語やフレーズに分解し、これらの関係を一定のルールに従って分析することにより、単語間の関係や時系列の変化などを抽出致します。これにより、採用上の問題点を把握したり、自社の評価を調べたり、特に学生が共感する自社の強みを見出すなど、これらが時系列にどう変遷しているかを調べたりすることが可能となるのです。

高度な構文解析、意味解析によりテキストデータを解析します。

単語の分類(形態素解析)

係り受けの関係(構文解析)

疑問要望否定などの解析(意味解析)

同義語の統一

単語や係り受けの有無データ化

高度な構文解析、意味解析によりテキストデータを解析します。