2013-07-01から1ヶ月間の記事一覧

検索インデックス周り(主に接尾辞配列周り)に関する基礎の話

資料リンク集みたいなものですね。不完全なので、徐々に詳しく書いていきたい記事です。 接尾辞配列がなぜ巷で「痺れる、憧れるぅ!」状態なのかを理解した。 検索速度、スケーラビリティ、網羅性の観点から優れているみたいだ。 Lucene(Solr)を扱う際は、…

情報理論の定義の話

この資料を参考につらつらと書いてみます。 Lecture 6; Using Entropy for Evaluating and Comparing Probability Distributions今までに「エントロピーは未知の値を定式化」とか他にも色々言われたけど結局よくわかりませんでした。式を見ても、よくわかな…

LOUDSの基本事項

LOUDSとは木を表現する簡潔データ構造の一つである。 以下のリンクの練習問題を全て解いたらLOUDSについての理解が進んだので、それについて簡単にメモしておく。 情報系修士にもわかるLOUDS※ノード番号とは、木を根から(左の子優先の)BFSで辿った順番であ…