GUIで簡単にSVMが実践出来るテキストマイニングアプリ "SakuSakuSVM ver0.1" を作りました


http://www24.atpages.jp/antibayesian/app/
のSSSVM.zip


●SakuSakuSVMの基本的な使い方
1.SS-SVMを起動
2.exeと同じフォルダに学習データ、テストデータ、ストップワードファイルを置く
3.前処理タブ内の一括実行ボタンを押下
4.SVM分類タブ内のクロスバリデーションボタン押下。CrossValidation.txtからモデルの説明力を見る(これが低すぎたら前処理やり直し)
5.モデル生成ボタン押下
6.分類実行ボタン押下。Output.txtで分類結果、Accuracy.txtで分類精度を確認


●学習/テストデータの作り方
各行にクラス情報(タグ)を付与する。
二値分類する場合は、例として正例=1, 負例=-1をタグとし、各行の先頭に[タグ,]を追加する。
例:各テキストのネガポジを判定したいとき
"1,Happy Happy Birthday!"
"-1,I am very sad..."


ストップワードファイルの作り方
ストップワードファイルに記述された文字列を、学習に用いないようにするためには、
除外すべき文字列を記述するだけでよい。
単語毎に改行すること


現状、とりあえず動くだけでまだまだ不親切です(エラー処理とか全くやっていません…)。
今後バージョンアップしていきたいと思います。