2013-04-01から1ヶ月間の記事一覧

マイクロブログ、ソーシャルメディア上の崩れた表記の現在

Twitterのマイニング技術については東工大の奥村先生が2012年1月に発表された「マイクロブログマイニングの現在」という原稿が非常にわかりやすかった。 マイクロブログマイニングの現在自分が今関心がある分野の1つとして「崩れた表記」がある。 崩れた表記…

全文検索について

NLP関連の分野を勉強してきて、検索について人に説明できなかったので、ネットサーフィンした結果を書く。以下転置インデックス - Wikipedia参考にして書いた。 索引(転置インデックス)について grepは索引を作らずに、毎回文字列検索アルゴリズム(ボイヤ…