【Linux】ファイルの文字コードを調べる方法

公開日: : 最終更新日:2018/11/30 プログラミング , , , , ,

Linux でファイルの文字コードを調べる必要があったので、その時のメモです。

いくつか方法があるみたいなのですが、ここでは「file」コマンドと「nkf」コマンドの2種類を紹介します。

file」コマンド

Linux の file コマンドでオプション -i をつけると、ファイルの文字コードを調べることができます。

結果です。charset=unknown-8bit となった場合は、Shift-JIS コード を表しています。

15.txt: text/html; charset=utf-8

86833.txt: text/html; charset=unknown-8bit

nkf」コマンド

nkf」コマンドは、「Network Kanji Filter」の略です。「-g」オプションを付けることによって、ファイルの文字コードを推測してくれます。-g は –guess の省略形です。

結果は、以下のように、文字コードと改行コードを出力してくれます。

EUC-JP (LF)

関連記事

将棋|ブラウザ上でJavaScriptを使って棋譜データを再生する方法【jsShogiKifu】

将棋の棋譜データをブラウザ上で再生する方法を調べて分かったことを紹介します。 スマホ上では F

記事を読む

指定ディレクトリ以下のファイルの内容を一括置換する方法|Linux

簡単なウェブサイトを Perl 作っていて、開発環境が Windows で、公開する環境が Linu

記事を読む

【Raspberry Pi】Webサーバ apache を入れてみた【Linux】

ラズベリーパイで SSH を起動させ、Windows から SSH でアクセスできるように設定しまし

記事を読む

【Linux】ファイルの文字コードを一括変換する方法|EUC-JP ⇒ UTF-8

Linux で、あるディレクトリ内のファイルの文字コードを EUC-JP から UTF-8 に一括変

記事を読む

囲碁|ブラウザ上でJavaScriptを使って棋譜データを再生する方法【WGO.js】

以前、将棋の棋譜をブラウザ上で再生する方法 を紹介しました。同様に、囲碁の棋譜再生も JavaScr

記事を読む

Linux|cp コマンドでディレクトリごとコピーし、ファイルの上書き確認されないようにする方法

Linux で cp コマンドを使って、ディレクトリごとコピーし、同一ファイル名があった場合に上書き

記事を読む

no image

【ETL】手書き文字のデータベースをダウンロードしてみた

文字認識や筆者識別の研究を行う際、手書き文字のデータが必要になってきます。 そのあたりの研究を

記事を読む

【情報処理学会】正会員から学生会員に変更する方法。

大学院に行くことになったので、入会していた情報処理学会を、 正会員から学生会員に変更

記事を読む

Windows で Scala をインストールする。

Windows に Scala というプログラミング言語をインストールしたときのメモです。Java,

記事を読む

【Linux】文字化け対策に unar のインストールを試みた。

Windows で圧縮したファイルを Linux で解凍すると、文字化けが起こってしまいます。文字化

記事を読む

Message

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

【Python】pip3 で「cannot import name ‘main’」エラーが出たときの対処法。

Python でライブラリをインストールする際に、pipを使います。

【mecab-python3】parseToNode で surface が正しく取得できないときの対処法。

python3 で mecab-python3 を使うと、parseT

【Python】形態素解析器 Mecab を Linux(Ubuntu)で使ってみた。

Linux の Ubuntu OS に、形態素解析器 Mecab をイ

【Python】NLTK(自然言語処理ライブラリ)を使ってみた。

Python の自然言語処理ライブラリである NLTK を Linux

【Python】OpenCV を使って顔画像を検出してみた。

OpenCV のインストール Numpy のインストール [c

→もっと見る

PAGE TOP ↑