2014-01-01から1年間の記事一覧

統計屋のためのAWK入門

はじめに 本稿はAWKという言語を用いて、 ごく簡単にデータ分析用の前処理*1をするための解説記事です。AWKは短いコマンドを記述するだけで多様なデータ処理を可能にします。 特にデータの抽出に関して恐るべき簡易さを提供します。 具体的には、input.txtと…

ブラウザ上でデータ分析が出来る!Clojure/Gorilla入門

概要 この記事は、Gorillaという ブラウザ上でClojureという言語を利用出来るライブラリを利用し、 ブラウザ上でデータ分析環境を構築するための入門記事です。 Clojureの事前知識は一切不要で、 ClojureやGorillaのインストールから、ブラウザ上で各種手法…

新宿高島屋のピンボールワンダーランド行ったらクッソ楽しかったので皆さんも行かねばならぬ

新宿高島屋で80~90年代のピンボールを遊びまくれるイベントが 5/6の18時まで開催しています。 詳細は下記 ゴールデンウイークフェスティバル☆ピンボール ワンダーランド!のイベント情報|ウォーカープラス 5/5に行ってみたらクッソ楽しくてゲラゲラ笑いま…

統計屋による新社会人のための統計系入門書お薦め一覧

本稿では統計学・データマイニング・機械学習関連書籍について 内容が易しいこと。数学力(特に微積・線形代数)を求められないこと 入手しやすいこと。絶版や学会に入らないと入手不可などではない、値段が安いこと 実務に繋げやすいこと。 持ち運びしやす…

自然言語処理の最新手法"word2vec"で艦これ加賀さんから乳を引いてみる

概要 この記事は自然言語処理という分野の最新手法word2vec を利用して誰でも遊べるようにするための手順を説明するものです。 word2vecを利用すると意味の計算が実現できます。 例えば"king"から"man"を引いて"woman"を足すと"queen"が出てきたり、 "東京"…

エンジニアのためのデータ可視化実践入門という本を書いた

2014/10/14 追記 本書87ページに「母数」という単語が複数回出てきますが、 これは全て「分母」とすべきでした。*1 通常、統計学の文脈では、母数は各確率分布を特徴付ける変数を指す単語であり、 例えば正規分布は平均と分散という二つの母数によって形状が…

Clojure/Incanter/clj-mlでデータマイニング入門

概要 Clojureでデータマイニングに必要な各手法を解説する記事です。 本記事を読むと、全くClojureを知らない方でも データ抽出・集計 可視化 機械学習(決定木、ランダムフォレスト、k-meansクラスタリング) をClojureで実行できるようになります。 はじめ…

《塔、都市、書簡》というWebで小説投稿しあう企画に参加した

企画情報 詳細はこちら。http://turris.skr.jp/ 作品はこちら。http://turris.skr.jp/gallery 概要は「塔、都市、書簡」というキーワードのうち最低2つ以上利用して小説を書く、 それ以外基本的に縛り無し、というもの。 前書き 別に読まなくて良い。 これを…

お正月なので色々ネタ的に面白そうな論文読んでみた

はじめに 前提知識不要の面白論文を幾つか紹介致します、 暇なお正月を利用して読んでみましょう! 1. 明治期における学生男色イメージの変容~女学生の登場に注目して~ http://ci.nii.ac.jp/naid/110006474771 概要 1900年前後の「男色」に関するイメージ…