KH Coderによる共起ネットワーク作成

[2/26のTokyoWebMiningで発表する内容のアブストラクト]
 テキストマイニングを行うには、テキストを統計に落とし込むための前処理が必須であり、なおかつその作業は非常に煩雑である。この前処理を怠ると、分析の精度は非常に低いものとなり、有益な知見を得ることが出来ない。
今回のLTでは、比較的簡易に実行可能であり、視覚効果も高い共起ネットワークを作成し、共起ネットワークの説明、その作成法について学ぶ。共起ネットワークとは、文書からその文書を特徴づける語の抽出を行い、特徴語同士の共起関係をネットワーク図にするものである。実行には無料のテキストマイニングソフト「KH Coder」を用いる。KH Coderは前処理から共起ネットワークの作成、可視化まで全てGUIで簡単に実行することが出来る優れたツールである。以下の図は夏目漱石「こころ」から作成した共起ネットワークである(詳細はLTにて)。


LT時間は15分程度の予定です。
当日は共起ネットワークだけではなく、広くテキストマイニング一般についてのご質問も承ります。
宜しくお願いします。