2012-01-01から1年間の記事一覧

Kaggle: Detecting Insulting in Social Commentary

I have competed in the following competition (till the milestone) http://www.kaggle.com/c/detecting-insults-in-social-commentaryI was focusing on another competition called Jubatus Challenge, so I did not compete for the final result.By th…

編集距離を忘れてた

Jurafsky and Martin著のSpeech and Language Processing p.73〜 chapter 3.1に良い解説がある。 下記のサイトもおすすめ。 http://d.hatena.ne.jp/naoya/20090329/1238307757実装するにはより深い理解が必要

Virtual BoxにCentOSを入れてみた

CentOSのネットインストール http://www005.upp.so-net.ne.jp/develop-tom/centos/centos-netinstall.htmlVirutualBoxのゲストOSの解像度変更に関して http://marigold.sakura.ne.jp/linux/vbox_guest_additions/index.html二時間くらいかな? サーバとして…

ACL, NAACL, EMNLP2012輪読会の発表資料

Tweet Recommendation with Graph Co-Ranking Algorithm, Rui Yan, Mirella Lapata, Xiaoming Li, ACL 2012 Tweet Recommendation with Graph Co-Ranking from Yoshinari Fujinuma

SRM554 Div2 Easy Practice

TreeSetの使い方を学ぶがてら、解いてみた。最初のコードは自分で書いたやつ。二番目は正解者のコードを参考にreviseしたやつ import java.util.*; public class TheBrickTowerEasyDivTwo { public int find(int redCount, int redHeight, int blueCount, in…

JumanとPythonの連携

cJumanを使うのだけど、普通にやろうとしたらCFLAGS=-fPIC ./configureを実行しているのに共通で使う.oはちゃんと-fPICでコンパイルしろと出てくる。 参考 http://www.gentoo.org/proj/en/base/amd64/howtos/index.xml?part=1&chap=3しかし、setup.pyを使っ…

今日学んだUNIXコマンド

一つのファイルを入力として、Pythonプログラムを通して一つのファイルを出力する。これをforループを使用して並列化して実行する。 また立ち上がった複数のプロセスを同時にキルする方法を学んだ(先輩より) JSON形式ファイルに適用した。pstreeはプロセス…

データの結合

Rを利用して、文字バイグラムのデータを結合しようとしたが、いかんせん、ノイズが多すぎて断念する。Pythonの辞書型の結合 http://d.hatena.ne.jp/cheeseshop/20090530/1243677621

Rに関連して

Rにおけるデータのマージ(結合)の仕方 http://cse.naro.affrc.go.jp/takezawa/r-tips/r/43.html

今日学んだLinuxコマンド

CTRL+R: reverse command searchで過去に行ったコマンドをサーチできる alias: .bashrcを編集して、これを追加すれば、コマンドを自分で定義できる。また.bashrcを変更した際は必ずsource .bashrcを行っておくこと。 また、Pythonのいつもやっている、サー…

Rでのグラフの書き方

Rが面倒だ。挫折しそうだが頑張る。Rでグラフを書く http://takenaka-akio.org/doc/r_auto/chapter_04.htmlplot()における種類の指定 http://cse.naro.affrc.go.jp/takezawa/r-tips/r/48.html重ね書きのポイント http://takenaka-akio.org/doc/r_auto/chapte…

OSSコミュニティへの関わり方

http://www.aosabook.org/en/index.html

UbuntuへRをインストール

準備段階でこけてしまったので、ファイヤウォールを回避する方法を載せておく。 http://d.hatena.ne.jp/xr0038/20111006/1317917402

Linuxでパスの変更方法

パス変更方法 http://pocketstudio.jp/linux/?%A5%D1%A5%B9(PATH)%A4%CE%B3%CE%C7%A7%A4%C8%C0%DF%C4%EA%CA%FD%CB%A1%A4%CF%A1%A9コマンドを通してのテキスト編集 http://itpro.nikkeibp.co.jp/article/COLUMN/20060228/230985/Pythonにおける多次元配列のソ…

インターン選考の反省

おそらく、論理性が足りなかったのが原因だと考えられる。 あと、プログラミング力が足りないのもあるかも。もっと様々な種類のプログラムを書いた方がいいね。 研究テーマについてはどこも聞かれるので、深く考えておく必要がある。Mソフト、インターン選考…

Pythonのインストール(サーバにも対応)とLinuxサーバーコマンド

Pythonのインストール http://d.hatena.ne.jp/knaka20blue/20090630/1246330115SSHを用いたサーバーへのアップロード方法 http://www.atmarkit.co.jp/flinux/rensai/linuxtips/985sftp.htmlファイルのコピー http://itpro.nikkeibp.co.jp/article/COLUMN/200…

Linux コマンド chmod

/etc/hostsに接続先のアドレスを加えておくと、接続が早くなる。cdmod go-r ファイル名 :権限の変更。グループとOtherよりr権限を引く。使う時は| grep を併用するとよい。

Python関連

Reading the last line using Python http://www.daniweb.com/software-development/python/threads/24544/how-do-i-read-the-last-line-of-a-text-file

Linux コマンド

twitterのデータが手に入ったのはいいけど、Linuxのシェルコマンドを使いこなせない為、奮闘中。自分用にリンクをいくつか張り付けておくgrepでマッチしたワードに色を付けるオプション http://d.hatena.ne.jp/hogem/20070728/1185549229jsonモジュールでjso…

Twitter Bot 作成に関するメモ

Twitterを100倍楽しむためのbot開発基礎講座 http://gihyo.jp/dev/serial/01/twitterbot/0003GAE/Python で Twitter bot を作る(準備編) http://d.hatena.ne.jp/namaco35/20090810/1249904668Google App Engine詳解:さっそくHello Worldから作ってみた http…

Ubuntu12.04にMecabをインストールしてみた

Ubuntu12.04から$ sudo apt-get install mecab mecab-ipadicを使用すると、$ mecabと打っても反応しない。その為autoremoveをつかってアンインストールし、公式サイトに載っている通りのやり方にてインストールしてみる。これで動くのだが、エンコーディング…