【Python】形態素解析器 Mecab を Linux(Ubuntu)で使ってみた。

Linux の Ubuntu OS に、形態素解析器 Mecab をインストールし、使ってみたときのメモです。

Mecab のインストール

mecab-ipadic-neologd 辞書をインストール

辞書が古いと、固有名詞が正しく解析されないことがあります。mecab-ipadic-neologd という辞書は、定期的に更新されているため、新しい固有名詞にも対応していることが多いみたいです。

Mecab の設定ファイルの辞書の場所を変更します。

; dicdir = /var/lib/mecab/dic/debian
dicdir = /usr/lib/mecab/dic/mecab-ipadic-neologd

mecab-python3 をインストール

python から MeCab を呼び出すために、mecab-python3 をインストールします。

pip で普通にインストールしようとしたらエラーが出てしまったので、その対処法も併せて記載します。

まずは、python3 に pip でインストールしてみました。

すると、以下のようなエラーがでました。

Collecting mecab-python3
Downloading https://files.pythonhosted.org/packages/ac/48/295efe525df40cbc2173748eb869290e81a57e835bc41f6d3834fc5dad5f/mecab-python3-0.996.1.tar.gz
Complete output from command python setup.py egg_info:
Traceback (most recent call last):
File “<string>”, line 1, in <module>
File “/tmp/pip-install-9gjyIi/mecab-python3/setup.py”, line 39, in <module>
long_description = read_file(‘README.md’),
File “/tmp/pip-install-9gjyIi/mecab-python3/setup.py”, line 21, in read_file
raw = open(filepath, ‘rb’).read()
IOError: [Errno 2] No such file or directory: ‘/tmp/pip-install-9gjyIi/README.md’


色々調べてみると、事前に swig というものをインストールすると書いてありました。

以下のコマンドで swig をインストールします。

再度、mecab-python3 をインストールします。

今度は、無事にインストールできました。

関連記事

【Python】NLTK(自然言語処理ライブラリ)を使ってみた。

Python の自然言語処理ライブラリである NLTK を Linux 環境にインストールして使って

記事を読む

【テキストマイニング】 bigram を用いて小説の書き手の識別をしてみる

「テキストマイニング入門」という本に書かれている内容に添って RMeCab を使った小説の分析を行っ

記事を読む

【mecab-python3】parseToNode で surface が正しく取得できないときの対処法。

python3 で mecab-python3 を使うと、parseToNode で surface

記事を読む

【テキストマイニング】 Amebaブログからデータ取得するための準備。

テキストマイニングを行うために、Ameba ブログ(アメブロ)のデータを取得してみようと思ったので、

記事を読む

【MT4】日付と時間を指定してPCを自動起動させる方法【DELL】

今回は、日付と時間を指定してPCを自動的に起動させる方法について紹介し

【MT4】PCが再起動しても自動的に起動させる方法【FX自動売買】

今回は、FX 自動売買用のツールの MT4 で、実行しているPCが再起

【MT4】複数口座を同時に起動させる方法【FX・CFD】

今回は、MT4(メタトレーダー4)で複数口座を同時にログインし、起動さ

【MQL4】スプレッドを取得する方法【MT4】

今回は、MQL4 で対象通貨ペアのスプレッドを取得する方法について紹介

【楽天CFD】取引口座を開設してみた【MT4】

今回は、楽天CFDの取引口座(本番口座)の開設方法について紹介します。

→もっと見る

PAGE TOP ↑