Mecabをwin7にインストールしてコマンドプロンプトで実行してみる
Mecabは、オープンソースの形態素解析エンジンです。
詳しくはwikipediaとか参照でお願いします。
今回の目標は、windows7の端末にMecabをインストールし、コマンドプロンプト上でテキストファイルに書かれている文章を形態素解析することです。
OS : Windows7 64bit Professional
Mecab : ver0.98
1. 本体のダウンロード
まずは、SourceforgeからWIndows版exeファイルをダウンロードします。ちなみに今回は「mecab-0.98.exe」をダウンロードしました。
2.インストール
次にインストールです。普通のインストーラと同様にダウンロードしたexeファイルをダブルクリックでいいのですが、インストール作業の前に辞書の文字コードの設定ができます。デフォルトでは、「Shift-jis」になっていますが、今回は「UTF-8」でインストールしました。
インストール終了後に、辞書の作成が自動的に行われますので、これが終わればインストールは終了です。
2.5. 動作確認
さて、では実際にMecabを動かしてみましょう。・・・・・・という前に、解析を行う被検体としてテキストファイルを用意します。今回私は、以下のようなファイルを用意しました。
「in.txt」 utf-8
里芋は大冒険に出かけました。
被検体ファイルができたら、コマンドプロンプトを起動して以下のコマンドを入れてみてください。
1 |
mecab [上記で作ったテキストファイル名.txt] -o [出力ファイル名] |
括弧の中はそれぞれ自分の環境にあわして書き換えてください。
ちなみに私が打ち込むとこうなります。
1 |
mecab in.txt -o out.txt |
こうすると、実行したフォルダに「out.txt」ができているので、その中身を見てみると・・・。
1 2 3 4 5 6 7 8 9 10 |
里芋 名詞,一般,*,*,*,*,里芋,サトイモ,サトイモ は 助詞,係助詞,*,*,*,*,は,ハ,ワ 大 接頭詞,名詞接続,*,*,*,*,大,ダイ,ダイ 冒険 名詞,サ変接続,*,*,*,*,冒険,ボウケン,ボーケン に 助詞,格助詞,一般,*,*,*,に,ニ,ニ 出かけ 動詞,自立,*,*,一段,連用形,出かける,デカケ,デカケ まし 助動詞,*,*,*,特殊・マス,連用形,ます,マシ,マシ た 助動詞,*,*,*,特殊・タ,基本形,た,タ,タ 。 記号,句点,*,*,*,*,。,。,。 EOS |
こんな感じになっていれば完了です。
お疲れ様でした。
3.なんかコマンドが動かなかった人へ
僕の環境では、なんかパスを通さなくてはいけなかったので、通します。
winメニューから「コンピュータ」←ここで右クリック
→「プロパティ」←左のメニューから「システムの詳細設定
→「環境変数」←システム環境変数から「Path」をダブルクリック
で出てくる小さいウィンドウの変数値というところに、Mecabをインストールしたフォルダの中にあるbinのパスを追記します。
僕の環境では、MecabをProgramFiles(x86)にインストールしていたので、ここでの記述したのは、
1 |
C:Program Files (x86)MeCabbin; |
となりました。記述したら、「OK」ボタンを押した後に先ほどのMecabコマンドに再挑戦してみてください。
上記のようになっていれば完了です。
お疲れ様でした。
これでもできなかったら、僕には分かりません。
参考度強化のために解決決方法が分かったら教えてください。
「Mecab 公式HP」
「Download Mecab」
「MeCabのWindows版をインストールしてみる」
「Wikipedia Mecab」