【Linux】ファイルの文字コードを調べる方法
Linux でファイルの文字コードを調べる必要があったので、その時のメモです。
いくつか方法があるみたいなのですが、ここでは「file」コマンドと「nkf」コマンドの2種類を紹介します。
「file」コマンド
Linux の file コマンドでオプション -i をつけると、ファイルの文字コードを調べることができます。
1 |
file -i ファイル名 |
結果です。charset=unknown-8bit となった場合は、Shift-JIS コード を表しています。
15.txt: text/html; charset=utf-8
86833.txt: text/html; charset=unknown-8bit
「nkf」コマンド
「nkf」コマンドは、「Network Kanji Filter」の略です。「-g」オプションを付けることによって、ファイルの文字コードを推測してくれます。-g は –guess の省略形です。
1 |
nkf -g ファイル名 |
結果は、以下のように、文字コードと改行コードを出力してくれます。
EUC-JP (LF)
関連記事
-
【WSL】Windows10 に Linux(Ubuntu) を入れてみた。
最新の Windows10 環境であれば、簡単に Linux 環境を構築できるということで、試してみ
-
【Linux】cp コマンドでディレクトリごとコピーし、ファイルの上書き確認されないようにする方法
Linux で cp コマンドを使って、ディレクトリごとコピーし、同一ファイル名があった場合に上書き
-
【Linux】 ファイルの重複した行を削除して、ファイルを結合する方法。
大容量の CSV ファイルの重複した行を削除して、ファイルを結合する処理を行ったときのメモです。
-
【Linux】WinSCP で Windows からファイルをコピーする方法。
今回は、WinSCP というソフトを使って、Windows から GUI で Linux のサーバに
-
【Linux】文字化け対策に unar のインストールを試みた。
Windows で圧縮したファイルを Linux で解凍すると、文字化けが起こってしまいます。文字化
-
【Linux】SSH でリモートからログインする方法。
SSH(Secure Shell)は、暗号化され、安全にリモートホストにログインするためのプロトコル
-
【Linux】SSH を切断した後でも Python を実行し続ける方法|nohub
今回、Linux のサーバに Windows から TeraTerm で SSH 接続し、Pytho
-
【Linux】ファイルの行数をカウントし、行数指定でファイル分割する方法。
Linux のコマンドを使って、ファイルの行数をカウントし、行数を指定してファイルを分割したときのメ
-
【Linux】ファイルの文字コードを一括変換する方法|EUC-JP ⇒ UTF-8
Linux で、あるディレクトリ内のファイルの文字コードを EUC-JP から UTF-8 に一括変
-
【Linux】指定ディレクトリ以下のファイルの内容を一括置換する方法
簡単なウェブサイトを Perl 作っていて、開発環境が Windows で、公開する環境が Linu