テキストマイニング

ブラウザ上でデータ分析が出来る!Clojure/Gorilla入門

概要 この記事は、Gorillaという ブラウザ上でClojureという言語を利用出来るライブラリを利用し、 ブラウザ上でデータ分析環境を構築するための入門記事です。 Clojureの事前知識は一切不要で、 ClojureやGorillaのインストールから、ブラウザ上で各種手法…

自然言語処理の最新手法"word2vec"で艦これ加賀さんから乳を引いてみる

概要 この記事は自然言語処理という分野の最新手法word2vec を利用して誰でも遊べるようにするための手順を説明するものです。 word2vecを利用すると意味の計算が実現できます。 例えば"king"から"man"を引いて"woman"を足すと"queen"が出てきたり、 "東京"…

進撃の巨人を読んだことない人がデータだけでキャラを推測してみる

はじめに 最近超人気の漫画として私のTwitter TLを賑わす作品、その名も「進撃の巨人」。 これだけ人気なんだからきっと面白いに違いないのですが、 なんか絵が怖そうだし、人がバンバン死んでてグロいっぽいという噂を聞くので、 なんとか漫画を読まずに、…

SPSSで簡単テキストマイニング

SPSSで簡単テキストマイニング View more presentations from SPSSはPythonと連携することが出来ます。SPSSは大変多機能ですが、業務で実際扱うデータは一筋縄にはいきません。様々な前処理が必要です。SPSSに落とし込めるよう、データの整備やクリーニング…

なぜ「主人がオオアリクイに殺されて1年が過ぎました」なのか?

件名: 主人がオオアリクイに殺されて1年が過ぎました。 差出人: 久光いきなりのメール失礼します。 久光さやか、29歳の未亡人です。 お互いのニーズに合致しそうだと思い、連絡してみました。 自分のことを少し語ります。 昨年の夏、わけあって主人を亡く…

テキストマイニングのための機械学習超入門 二夜目 パーセプトロン

一夜目はパターン認識と機械学習の概要を学びました。今夜は、識別部で用いられる機械学習の基本的な線形識別器である「パーセプトロン」を具体的に学びたいと思います。「線形識別器?パーセプトロン?何それ?」字面は厳しいですが、手を動かしてみると意…

テキストマイニングのための機械学習超入門 一夜目

テキストマイニングに必要なパターン認識と機械学習について学びます。非常に初歩的な話から始めます。対象者は「テキストマイニングに興味があり、用いられる手法の中身を知りたい(けれど高度な数学は厳しい…)」というビジネスマンや学生さんです。数式は…

GUIで簡単にSVMが実践出来るテキストマイニングアプリ "SakuSakuSVM ver0.1" を作りました

http://www24.atpages.jp/antibayesian/app/ のSSSVM.zip ●SakuSakuSVMの基本的な使い方 1.SS-SVMを起動 2.exeと同じフォルダに学習データ、テストデータ、ストップワードファイルを置く 3.前処理タブ内の一括実行ボタンを押下 4.SVM分類タブ内のクロスバリ…

Rによるtwitterテキストマイニング 〜テキストに対する学習とは〜

あんちべのすべらない話〜俺のツイートがこんなにウケないはずがない〜 View more presentations from AntiBayesian 自分のtweetがウケるか滑るかをpostする前にrandomForestで判別してみよう! LTは制限時間10分だったため、詳細は意図的に省きました。 本…

twitterの呟きを収集するアプリ "SakusakuTwitterMining ver0.1" 公開

※2011/10/2 ver0.2になりました。 更新内容 64bit版対応 https対応 微修正 csvで吐くのが不評だったため、txtで出力(しかしボタン名修正するの忘れた… SakusakuTwitterMiningのダウンロード http://www24.atpages.jp/antibayesian/app/ 32bit版OSをお使いの…