俺用分かち書きデータ。

http://sapporo.cool.ne.jp/tsukimoriseki/wakatigaki.txt


2-gram解析してもピンと来なかったので結局使っていない、例の分かち書きデータです。
殆ど手入れできないまま公開…。
作業効率重視のため、東大式分かち書きなのでぶつ切り過ぎると感じるかも。
後半は分かち書きでないデータが混ぜてあります。


思うに、Rayさんがおそらくやっていたように、
連接頻度表の中から、意味的に連接できそうな組み合わせの頻度をフィーリングで加減するという方法のほうがうまくいくんだろうと思う。