2006年2月10日金曜日

ついでにわかったこと



チャットのログだと、年単位でとった統計データにちかいデータをだすには


やっぱり1かげつぶん(860文)ぐらいのデータがひつようっぽい(さとーさんのばあい)


webで800文のったページって結構壮大なぺーじだよなぁ。。。


すこし考え直そう。


とりあえずお風呂でおもいついたアイディアとしては、母音n-gramをつかうってのかなぁ。。


まぁ母音といっても「っ」とか「ょ」とか濁音とかをすこし特別扱いするけど。





0 件のコメント:

コメントを投稿