MacにもPythonでMeCabの環境を構築するよ
どもども最近記事更新頻度が上がってきて、いい感じですが今回は自然言語処理系の記事です。
普段使っているデスクトップPCのHDDが異音(?)を発するようになってきたので、一応サブのMacBookにもMeCab環境を構築していこうと思います。また、基本的にPythonから使用するため、PythonのコードからMeCabを呼び出せるように環境構築を行いたいと思います。
前提としてHomebrewの導入とPython(+pip)環境の導入が終わっていることが前提となりますので、まだ環境構築ができていない場合はこちらの記事なんかを参考に構築しちゃってください。
OS : macOS Sierra
Python : 3.6.0
1. MeCabのインストール
もしhomebrewの環境があるならMeCabのインストールはめちゃんこ簡単です。以下のコマンドでインストールされます。
1 2 |
brew install mecab brew install mecab-ipadic |
これだけでMeCabはインストール完了なので、端末から”mecab”と打ってみるとお試しで実行することができます。
2. neologd辞書の導入
さて上記のコマンドでMeCabのお試しをしてみるとわかると思いますが、かなり解析精度は低いです。そこで解析に使用する辞書をmecab-ipadic-NEologdに変更します。これは有志が作成している辞書で、Webから新語を獲得して辞書にしてくださっているものです。詳しくはGitHubをご覧ください。
GitHubから環境構築に必要なコマンドだけを書きますと以下の感じになります。
1 2 3 4 5 6 7 8 |
$ brew install mecab mecab-ipadic git curl xz $ git clone --depth 1 https://github.com/neologd/mecab-ipadic-neologd.git $ cd mecab-ipadic-neologd $ ./bin/install-mecab-ipadic-neologd -n -a $ echo `mecab-config --dicdir`"/mecab-ipadic-neologd" # インストール先の確認 $ mecab -d /usr/local/lib/mecab/dic/mecab-ipadic-neologd/ # 動作確認 |
これでNEologdのインストールは完了です。ですが、今の状態だと起動するたびにNEologdのパスを指定する必要があります。さすがにそれはめんどくさいので、デフォルトで使用する辞書を変えてしまおうと思います。
そのために編集するのはmecabrcです。homebrewでMeCabをインストールした場合、mecabrcは”/usr/local/etc/mecabrc”にあります。これを以下の通りに編集します。
1 2 |
; dicdir = /usr/local/lib/mecab/dic/ipadic ; この行はコメントアウト dicdir = /usr/local/lib/mecab/dic/mecab-ipadic-neologd ; この行を新しく追加 |
NEologdのパスはご自身の環境に合わせて書き換えてください。
3. Pythonにバイディング
最後に、頑張ってインストールしたMeCabをPythonから呼び出せるようにしたいと思います。と言ってもpipが使えるならこれまたメチャクチャ簡単に以下のコマンドでインストールできます。
1 |
$ pip install mecab-python3 |
4. 起動してみる
テスト用に以下のPythonプログラムを書いて実行してみてください。
1 2 3 |
import MeCab m = MeCab.Tagger("") print(m.parse('さといものだいぼうけん')) |
これの結果、以下のような感じに出力されれば完了です。お疲れ様でした。
1 2 3 4 5 6 |
さといものだいぼうけん さといも 名詞,固有名詞,一般,*,*,*,さといも,サトイモ,サトイモ の 助詞,連体化,*,*,*,*,の,ノ,ノ だい 名詞,一般,*,*,*,*,だい,ダイ,ダイ ぼうけん 名詞,固有名詞,一般,*,*,*,ぼうけん,ボウケン,ボーケン EOS |
コーディングで分からないことがあれば
プログラミングや環境構築で分からないことがあったら『teratail』というエンジニア特化型のQ&Aサービスがオススメです。自分もどうしても分からないことがあったら、時々質問しにいきますが、かなりニッチな質問にも意外と早く回答がつくのでとても頼もしいです。という宣伝でした。
おわりに
さて、テケトーに最低限に書いてきました。これでサブ環境にいつでも移行できそうです。メインのデスクトップはどうにかしなくちゃいけないなぁって憂鬱です。
「MacでPython+mecab」
「HomebrewでインストールしたMeCabの設定ファイル(mecabrc)の保存場所」
ディスカッション
コメント一覧
PythonではないですがMeCabを使ってこのようなこともできます
MacOSXのSafariブラウザで
形態素解析の結果を表示したり
APPLE辞書やウィキペディア
などの検索結果をブラウザ内で直接プリントアウトできたりします
その他
バーコード付き商品アイテムの作成やプリントアウトにも対応しています
またブラウザの操作だけでゆうちょ銀行の払込取扱票に直接プリントする機能もあったりします
ぜひお試しください
http://snowjobs.blog.jp/archives/cat_mecab.html (最後尾に最初の記事があります)
http://snowjobs.blog.jp/detail_item/201710011251/4547597950043
コメントありがとうございます!
サイトの方も拝見しました!
まだ斜め読みですが面白そうですね!
今度時間があるときに試してみます!