Windowsで自然言語処理環境を整える
Windows環境で自然言語処理(の中の係り受け解析)を行う際にcabochaをインストールしました。
cabochaとは何するもの?
cabochaはSVM(機械学習に用いられるアルゴリズムのひとつ)に基づいた日本語係り受け解析器です。
cabochaを入れて実行することで、与えられた日本語文に対し、どの語がどの語に係るかといった修飾関係を解析することができます。
cabochaを使用するには事前に辞書であるMecabをインストールしておく必要がありましたが、これは以前行ったので大丈夫でした。
ということで文字コードも合わせて早速cabochaを入れて実行してみたところ以下のエラーが表示されました。
morph.cpp(90)[g_mecab_parse_lattice]
色々なcabochaのバージョン入れてたけどなぜかこのエラー。(そもそも、元々入れてたMecabにも問題ありでした。
実行できたMecabとcabochaの組み合わせ
結局、Mecab-0.996、cabocha-0.66を順に入れなおしたら直りました。
片方のparse_lattice部分が問題だったっぽい。
とりあえず簡単にメモ書きとして残しておきます。
その他Windows環境で自然言語処理をする際のメモ