【Python】NLTK(自然言語処理ライブラリ)を使ってみた。

公開日: : テキストマイニング , ,

Python の自然言語処理ライブラリである NLTK を Linux 環境にインストールして使ってみたときのメモです。

NLTK をインストール

以下のコマンドでインストールします。

サンプルテキストデータをダウンロード

NLTK ではサンプル用のテキストデータが用意されていて、以下のコマンドで使用できる。

「d」を入力し、「book」を入力すると、テキストの集合がダウンロードできる。

以下のコードを使って、ダウンロードしたテキストに簡単にアクセスできます。

「text1」にアクセスしたいときは、以下のようにします。

<Text: Moby Dick by Herman Melville 1851>

 

関連記事

【Python】形態素解析器 Mecab を Linux(Ubuntu)で使ってみた。

Linux の Ubuntu OS に、形態素解析器 Mecab をインストールし、使ってみたときの

記事を読む

【mecab-python3】parseToNode で surface が正しく取得できないときの対処法。

python3 で mecab-python3 を使うと、parseToNode で surface

記事を読む

【テキストマイニング】 bigram を用いて小説の書き手の識別をしてみる

「テキストマイニング入門」という本に書かれている内容に添って RMeCab を使った小説の分析を行っ

記事を読む

【テキストマイニング】 Amebaブログからデータ取得するための準備。

テキストマイニングを行うために、Ameba ブログ(アメブロ)のデータを取得してみようと思ったので、

記事を読む

【耳コピ】音楽ファイルを楽器ごとに分離する方法【Spleeter:フリー】

今回は、mp3 などの音楽ファイルをボーカル、ベース、ドラムなどの楽器

【Chainer】手書き数字認識をしてみた【Deep Learning】

Chainerを用いて、ニューラルネットワークを構築し、手書き数字認識

【Spyder】引数のあるスクリプトを実行する方法。

Python の統合開発環境(IDE)である Spyder では、簡単

【Anaconda】Prompt 上で Git コマンドを実行する方法。

Anaconda のコマンドプロンプト(Anaconda Prompt

【MT4】日付と時間を指定してPCを自動起動させる方法【DELL】

今回は、日付と時間を指定してPCを自動的に起動させる方法について紹介し

→もっと見る

PAGE TOP ↑