MeCabをインストール。
形態素解析プログラムMeCabをMac OS XとCentOSにインストールしてみた。日本語文書を形態素(最小意味単位)に分割して、品詞を判別してくれるプログラム。日本語をゴニョゴニョしてくれるわけですよ。
MeCabの公式ページはコチラ → MeCab|SourceForge
ここに書いてあるとおりに作業すれば、たぶん問題なくインストールできます。まずは必要なファイルをダウンロード。
libiconv:
でlibiconvのインストール完了。installは、もちろん管理者権限で。
次にMeCab本体のインストール。文字コードはUTF-8しか使わないので、はじめからUTF-8専用で作ってしまいます。
MeCab:
これでMeCab本体が /usr/local/bin に、ライブラリは /usr/local/lib にインストールされるはず。
make checkの段階で「ひとつのテストに失敗したよ」みたいなメッセージが表示されたりします。↓こんなやつ。
最後に辞書のインストール。こちらも文字コードはUTF-8にします。
IPA辞書:
辞書は /usr/local/lib/mecab/dic/ にインストールされます。
makeのときに「libiconv.soが見つからないよ」と言われたら、ライブラリへのパスが通っていないのが原因です。とりあえず環境変数を弄ってパスを追加しておく。
いちおうmake cleanしてからやり直し。これで無事にインストールできる筈。
さて。
うん、ちゃんとインストールされていますね。
テストしてみる。
動きました。
出力フォーマットの制御については公式ページを参照しましょう。
MeCabの公式ページはコチラ → MeCab|SourceForge
ここに書いてあるとおりに作業すれば、たぶん問題なくインストールできます。まずは必要なファイルをダウンロード。
- (システムにインストールされていなければ)libiconv → GNUの公式ページから
- MeCab本体(mecab-x.xx.tar.gz) → 最新版をMeCab公式ダウンロードページから
- 辞書ファイル:IPA辞書(mecab-ipadic-x.x.xx-xxxx.tar.gz) → 最新版をMeCab公式ダウンロードページから
libiconv:
$ ./configure --prefix=/usr/local
$ make
$ make install
$ make
$ make install
でlibiconvのインストール完了。installは、もちろん管理者権限で。
次にMeCab本体のインストール。文字コードはUTF-8しか使わないので、はじめからUTF-8専用で作ってしまいます。
MeCab:
$ ./configure --enable-utf8-only
$ make
$ make check
$ make install
$ make
$ make check
$ make install
これでMeCab本体が /usr/local/bin に、ライブラリは /usr/local/lib にインストールされるはず。
make checkの段階で「ひとつのテストに失敗したよ」みたいなメッセージが表示されたりします。↓こんなやつ。
===================
1 of 3 tests failed
===================
この記事によると、放っておいても大丈夫みたい。うちでも、この状況のままでmecabは動作しています。1 of 3 tests failed
===================
最後に辞書のインストール。こちらも文字コードはUTF-8にします。
IPA辞書:
$ ./configure --with-charset=utf8
$ make
$ make install
$ make
$ make install
辞書は /usr/local/lib/mecab/dic/ にインストールされます。
makeのときに「libiconv.soが見つからないよ」と言われたら、ライブラリへのパスが通っていないのが原因です。とりあえず環境変数を弄ってパスを追加しておく。
$ export LD_LIBRARY_PATH=/usr/local/lib
いちおうmake cleanしてからやり直し。これで無事にインストールできる筈。
さて。
$ which mecab
/usr/local/bin/mecab
/usr/local/bin/mecab
うん、ちゃんとインストールされていますね。
テストしてみる。
$ mecab
これはテストです。
これ 名詞,代名詞,一般,*,*,*,これ,コレ,コレ
は 助詞,係助詞,*,*,*,*,は,ハ,ワ
テスト 名詞,サ変接続,*,*,*,*,テスト,テスト,テスト
です 助動詞,*,*,*,特殊・デス,基本形,です,デス,デス
。 記号,句点,*,*,*,*,。,。,。
EOS
これはテストです。
これ 名詞,代名詞,一般,*,*,*,これ,コレ,コレ
は 助詞,係助詞,*,*,*,*,は,ハ,ワ
テスト 名詞,サ変接続,*,*,*,*,テスト,テスト,テスト
です 助動詞,*,*,*,特殊・デス,基本形,です,デス,デス
。 記号,句点,*,*,*,*,。,。,。
EOS
動きました。
出力フォーマットの制御については公式ページを参照しましょう。
snowjobs
自分の場合はMeCab+UniDicです
MeCabでこのような使い方もできます
MacOSXのSafariブラウザで
形態素解析の結果を表示したり
APPLE辞書やウィキペディア
などの検索結果をブラウザ内で直接プリントアウトできたりします
その他
バーコード付き商品アイテムの作成やプリントアウトにも対応しています
またブラウザの操作だけでゆうちょ銀行の払込取扱票に直接プリントする機能もあったりします
ぜひお試しください
http://snowjobs.blog.jp/archives/cat_mecab.html (最後尾に最初の記事があります)
http://snowjobs.blog.jp/detail_item/201710011251/4547597950043