【Python】形態素解析器 Mecab を Linux(Ubuntu)で使ってみた。

Linux の Ubuntu OS に、形態素解析器 Mecab をインストールし、使ってみたときのメモです。

Mecab のインストール

mecab-ipadic-neologd 辞書をインストール

辞書が古いと、固有名詞が正しく解析されないことがあります。mecab-ipadic-neologd という辞書は、定期的に更新されているため、新しい固有名詞にも対応していることが多いみたいです。

Mecab の設定ファイルの辞書の場所を変更します。

; dicdir = /var/lib/mecab/dic/debian
dicdir = /usr/lib/mecab/dic/mecab-ipadic-neologd

mecab-python3 をインストール

python から MeCab を呼び出すために、mecab-python3 をインストールします。

pip で普通にインストールしようとしたらエラーが出てしまったので、その対処法も併せて記載します。

まずは、python3 に pip でインストールしてみました。

すると、以下のようなエラーがでました。

Collecting mecab-python3
Downloading https://files.pythonhosted.org/packages/ac/48/295efe525df40cbc2173748eb869290e81a57e835bc41f6d3834fc5dad5f/mecab-python3-0.996.1.tar.gz
Complete output from command python setup.py egg_info:
Traceback (most recent call last):
File “<string>”, line 1, in <module>
File “/tmp/pip-install-9gjyIi/mecab-python3/setup.py”, line 39, in <module>
long_description = read_file(‘README.md’),
File “/tmp/pip-install-9gjyIi/mecab-python3/setup.py”, line 21, in read_file
raw = open(filepath, ‘rb’).read()
IOError: [Errno 2] No such file or directory: ‘/tmp/pip-install-9gjyIi/README.md’


色々調べてみると、事前に swig というものをインストールすると書いてありました。

以下のコマンドで swig をインストールします。

再度、mecab-python3 をインストールします。

今度は、無事にインストールできました。

関連記事

【mecab-python3】parseToNode で surface が正しく取得できないときの対処法。

python3 で mecab-python3 を使うと、parseToNode で surface

記事を読む

【Python】NLTK(自然言語処理ライブラリ)を使ってみた。

Python の自然言語処理ライブラリである NLTK を Linux 環境にインストールして使って

記事を読む

【テキストマイニング】 Amebaブログからデータ取得するための準備。

テキストマイニングを行うために、Ameba ブログ(アメブロ)のデータを取得してみようと思ったので、

記事を読む

【テキストマイニング】 bigram を用いて小説の書き手の識別をしてみる

「テキストマイニング入門」という本に書かれている内容に添って RMeCab を使った小説の分析を行っ

記事を読む

【転移学習】学習済みVGG16 による転移学習を行う方法【PyTorch】

今回は、PyTorch を使って、学習済みのモデル VGG16 を用い

【PyTorch】畳込みニューラルネットワークを構築する方法【CNN】

今回は、PyTorch を使って畳込みニューラルネットワーク(CNN)

【PyTorch】ニューラルネットワークを構築する方法【NN】

今回は、PyTorch を使って、ニューラルネットワーク(NN)を構築

【OpenCV】検出した顔画像部分を切り出す方法【Python】

OpenCV を使って、Python で画像の中から顔部分を切り出した

【Fashion-MNIST】ファッションアイテムのデータセットを使ってみた【TensorFlow】

今回は、機械学習用に公開されているデータセットの1つである「Fashi

→もっと見る

PAGE TOP ↑