2011-01-01から1年間の記事一覧

統計解析アプリ「Incanter」入門

Clojure製統計解析アプリ「Incanter」は無料かつjarファイル一つでお手軽に実行できる、その上Javaの豊富なライブラリを利用したり、描画に特化したProcessingという処理系でリッチなアニメーションやインターフェイスを実装できるという面白いアプリケーシ…

なぜ「主人がオオアリクイに殺されて1年が過ぎました」なのか?

件名: 主人がオオアリクイに殺されて1年が過ぎました。 差出人: 久光いきなりのメール失礼します。 久光さやか、29歳の未亡人です。 お互いのニーズに合致しそうだと思い、連絡してみました。 自分のことを少し語ります。 昨年の夏、わけあって主人を亡く…

テキストマイニングのための機械学習超入門 二夜目 パーセプトロン

一夜目はパターン認識と機械学習の概要を学びました。今夜は、識別部で用いられる機械学習の基本的な線形識別器である「パーセプトロン」を具体的に学びたいと思います。「線形識別器?パーセプトロン?何それ?」字面は厳しいですが、手を動かしてみると意…

Ubuntu 10.4に最新のR2.14.0をインストールしてみた

Ubuntu10.4機にRをクリーンインストールしようと思ったら、公開鍵が変わっていたり、10.4向けのパッケージを置いていないミラーサーバーがあったりとちょっと手こずったのでメモ。基本はRjpWikiを参照。2011/9/26時点で公開鍵が変わっていたらしい、知らなん…

テキストマイニングのための機械学習超入門 一夜目

テキストマイニングに必要なパターン認識と機械学習について学びます。非常に初歩的な話から始めます。対象者は「テキストマイニングに興味があり、用いられる手法の中身を知りたい(けれど高度な数学は厳しい…)」というビジネスマンや学生さんです。数式は…

退職しました

昨日2011年10月31日をもちまして、約2年半お世話になった金融機関を退職しました。退職の旨を周囲にお伝えすると、驚きの声が…全く上がらず、「あんちべは5年もここに居ないだろうなってずっと思ってた」と皆さんから言われました。それどころか「なんでお…

Javaプログラミング始めました

最近話題の大規模分散処理システムHadoopやWikipediaなどでも利用されている全文検索エンジンLuceneなど、Javaで書かれたアプリケーションは数多くあります。それらを利用するにはJavaからアクセスするのがもっともパフォーマンスが良いです。そのため、大規…

Pocket WiFi (GP02)の設定

Pocket WiFiが、2年縛りはあるものの、月2750円という安さになっていたため、契約しました。 詳細→http://tinyurl.com/42hj8ru 9/1に申し込んで、実際Pocket WiFiが届いたのが9/10と結構間が空きます(9/1から料金発生)。 ようやく届いたPocket WiFiを繋ご…

Python/NetworkXで簡単ネットワーク分析

slaさん主催のNumpy/Scipy勉強会でLTをします。 内容はNetworkXというPythonのネットワーク分析パッケージの紹介です。 Pythonで簡単ネットワーク分析 View more presentations from AntiBayesian ネットワーク分析と言えば、PajekやRのigraphが定評有ります…

文字数チェッカーを作りました

http://www24.atpages.jp/antibayesian/app/ のTextSizer.exe いや、作ったも何も、TextBox貼り付けて、Form.Text = textbox.text.lengthしただけですが…。書類書くのに文字数制限があったので、適当なの探すより作った方が速いなと。開発所要時間、多分20秒…

NetBeans, XamppをUbuntuにインストールしてみた

NetBeansはJavaやPHPのコーディングやテストに便利なIDE(統合開発環境)です。Eclipseよりちょっと機能が少なくて、その分ちょっと軽め。だからネットブックでもなんとか動かせるかな、という印象。XamppはApache、MySQL、PHPの動作環境をまとめてインスト…

Clojureのビルドツール"Leiningen"を使ってみた

LeiningenはClojureの標準的な総合ビルドツールで、単体で動作するjarファイルを簡単に吐けたり、依存関係を適切に自動設定してくれたりと何かと便利です。Leiningenは簡単にインストールできますし、ついでにClojureも一緒に入れてくれるので、色々設定して…

プログラミングClojure1章を読んでみた

前から関数型言語に興味があり、LispやF#を勉強しました。 Lispはとても面白い言語ではあるものの、ライブラリの貧弱さから、 これで実際にアプリケーション作成するのは厳しいと感じました。 F#は.NET Frameworkが利用できるため、実用性の観点から言っても…

GUIで簡単にSVMが実践出来るテキストマイニングアプリ "SakuSakuSVM ver0.1" を作りました

http://www24.atpages.jp/antibayesian/app/ のSSSVM.zip ●SakuSakuSVMの基本的な使い方 1.SS-SVMを起動 2.exeと同じフォルダに学習データ、テストデータ、ストップワードファイルを置く 3.前処理タブ内の一括実行ボタンを押下 4.SVM分類タブ内のクロスバリ…

KH Coderに関して

第三回さくさくテキストマイニング勉強会にて「KH Coderは4MB以上のファイルを扱うと動作が不安定になる」と申し上げましたが、あくまで私の環境ではそうであるというだけの話であり、一般的にそうなると主張するものでは御座いません。一般的に4MB以上を扱…

Rによるtwitterテキストマイニング 〜テキストに対する学習とは〜

あんちべのすべらない話〜俺のツイートがこんなにウケないはずがない〜 View more presentations from AntiBayesian 自分のtweetがウケるか滑るかをpostする前にrandomForestで判別してみよう! LTは制限時間10分だったため、詳細は意図的に省きました。 本…

twitterの呟きを収集するアプリ "SakusakuTwitterMining ver0.1" 公開

※2011/10/2 ver0.2になりました。 更新内容 64bit版対応 https対応 微修正 csvで吐くのが不評だったため、txtで出力(しかしボタン名修正するの忘れた… SakusakuTwitterMiningのダウンロード http://www24.atpages.jp/antibayesian/app/ 32bit版OSをお使いの…

Ruby覚え書き

#introRuby #コメント #実行 ruby -e 'puts ("hello, world")' #変数の文字列内展開 var = "world" puts "hello #{var}" > hello world #条件分岐 i = 1 if i < 0 puts "負" elsif i > 0 puts "正" else puts "零" end > 正 if i % 2 == 1 : puts "奇数です…

モテる自然言語処理系女子力を磨くための4つの心得

1. あえて2〜3世代前の分類器を使う あえて2〜3世代前の分類器を使うようにしましょう。そして飲み会の場で好みの男がいたら話しかけ、わざとらしくWekaを出していじってみましょう。そして「あ〜ん! この決定木本当にマジでチョームカつくんですけどぉぉお…

第二回さくさくテキストマイニング勉強会 終了後、運営側の雑感

※発表内容の紹介などは濱田さんの記事や チームラボ・高須さんのUst録画まとめをご参考に。 色々な勉強会に参加させて頂いているが、 今回運営側に回ることになり、そこで得た情報や考えたことを思い浮かぶまま書きました。 次回の勉強会で活かせるように書…

猫缶は醤油を垂らせば美味しく頂けます

スーパーへ買い物に行きました。 何にもありません…。 私はテレビも持ってないし、インターネットもあまりしないので、 買い占めの惨状は噂話でしか知らなかったのですが、 自分が買い物する段になって買いだめの恐怖を味わうことが出来ました…。 あぁ、保存…

参考資料

私が統計やプログラミングを学んだ時、特に有用だった無料のWeb資料を御紹介致します。 本当はもっと数あったのですが、失念したモノも多く、これを機にメモとして残しておきます。 ここで御紹介しているモノは全て日本語で平易に書かれているものです。是非…

GIANT ESCAPE R3.1所感 (自転車全くご存知無い方向け)

GIANT ESCAPE R3.1を購入しました。 まとめ:快適な走りを求める方にはESCAPEとてもお薦め。6万円の価値は十二分にある。買い物などに使うだけなら不要 ESCAPEは私の人生初のクロスバイクです。前々から面白い自転車に乗りたいという欲求はあり、悪路に強い…

2/27 TokyoWebMining 3分間で出来るテキストマイニング 発表内容

「3分間で出来るテキストマイニング」はテキストをJavaScriptで読み込んで拡大表示するというプレゼンスタイルで挑んだため、発表スライドは御座いません。 発表時に用いたテキストを当ブログに貼り付けておきますので、宜しければ御覧下さい。 一画面で表示…

KH Coderによる共起ネットワーク作成

[2/26のTokyoWebMiningで発表する内容のアブストラクト] テキストマイニングを行うには、テキストを統計に落とし込むための前処理が必須であり、なおかつその作業は非常に煩雑である。この前処理を怠ると、分析の精度は非常に低いものとなり、有益な知見を得…

にこにこテキストマイニング開催しました

にこにこテキストマイニング発表資料〜テキストマイニングの歩き方〜私の準備不足により、受付に時間が掛かってしまい、開始時間が遅れたこと、 Ustを序盤配信できなかったこと、非常に残念で、申し訳ありませんでした。 初めての勉強会だったため、会場設営…

同期勉強会資料公開

今年度、同期と勉強会を開きました。 参加者は隔週、担当持ち回りでスライドを作成し、1時間発表、30分議論という形で進めました。 その際私が作った資料を公開致します。 SIerのための行動マーケティング入門 リスク管理のためのデリバティブ入門

TokyoRで発表したスライドを公開します

TokyoR Rで始めるテキストマイニング ついでに学生の頃作ったファイルも以下に公開します。 内容は不正確だと思われますが、 学生の頃のあんちべはこんなことしてたんだなー、 とご笑覧頂けましたら幸いです。 http://www24.atpages.jp/antibayesian/up/uplo…