【mecab-python3】parseToNode で surface が正しく取得できないときの対処法。

公開日: : 最終更新日:2019/01/17 テキストマイニング , , ,

python3 で mecab-python3 を使うと、parseToNode で surface(表層形)が正しく取得できずはまってしまったときのメモです。

なお、MeCab のバージョンは 0.966 で、mecab-python3 のバージョンは 0.996.1 でした。

具体的には、以下のようなコードで surface の値が正しくとれません。

以下のように、形態素ではなく文章が表示されてしまいます。

色々調べてみると、バグのようで、mecab-python3 のバージョンを下げると解決するようです。

まず、mecab-python3 をアンインストールします。

Uninstalling mecab-python3-0.996.1:
Would remove:
/usr/local/lib/python3.5/dist-packages/MeCab.py
/usr/local/lib/python3.5/dist-packages/_MeCab.cpython-35m-x86_64-linux-gnu.so
/usr/local/lib/python3.5/dist-packages/mecab_python3-0.996.1-py3.5.egg-info
Proceed (y/n)? y
Successfully uninstalled mecab-python3-0.996.1

次に、再度、mecab-python3 をインストールします。

そして、先ほどのコードを実行すると、surface が正しく取得できました。

いやぁ、、結構はまっちゃいました。。

関連記事

【テキストマイニング】 bigram を用いて小説の書き手の識別をしてみる

「テキストマイニング入門」という本に書かれている内容に添って RMeCab を使った小説の分析を行っ

記事を読む

【Python】NLTK(自然言語処理ライブラリ)を使ってみた。

Python の自然言語処理ライブラリである NLTK を Linux 環境にインストールして使って

記事を読む

【テキストマイニング】 Amebaブログからデータ取得するための準備。

テキストマイニングを行うために、Ameba ブログ(アメブロ)のデータを取得してみようと思ったので、

記事を読む

【Python】形態素解析器 Mecab を Linux(Ubuntu)で使ってみた。

Linux の Ubuntu OS に、形態素解析器 Mecab をインストールし、使ってみたときの

記事を読む

【耳コピ】音楽ファイルを楽器ごとに分離する方法【Spleeter:フリー】

今回は、mp3 などの音楽ファイルをボーカル、ベース、ドラムなどの楽器

【Chainer】手書き数字認識をしてみた【Deep Learning】

Chainerを用いて、ニューラルネットワークを構築し、手書き数字認識

【Spyder】引数のあるスクリプトを実行する方法。

Python の統合開発環境(IDE)である Spyder では、簡単

【Anaconda】Prompt 上で Git コマンドを実行する方法。

Anaconda のコマンドプロンプト(Anaconda Prompt

【MT4】日付と時間を指定してPCを自動起動させる方法【DELL】

今回は、日付と時間を指定してPCを自動的に起動させる方法について紹介し

→もっと見る

PAGE TOP ↑