形態素解析をする時はmecabを使う。他にも何種類かあるらしいけど、知人にお奨めされたのでmecabで。
下記サイトが参考になる。
インストール方法(ていうより本家のサイト)
http://mecab.googlecode.com/svn/trunk/mecab/doc/index.html
mecab pythonを使う
http://d.hatena.ne.jp/yutakikuchi/20130215/1360884220
品詞IDの定義
http://mecab.googlecode.com/svn/trunk/mecab/doc/posid.html
ユーザの類似性の評価の前準備
オライリー:集合値プログラミングより
http://kiwitobes.com/clusters/blogdata.txt