【Linux】ファイルの文字コードを一括変換する方法|EUC-JP ⇒ UTF-8
Linux で、あるディレクトリ内のファイルの文字コードを EUC-JP から UTF-8 に一括変換したときのメモです。
まず、cp コマンドで文字コード変換前のディレクトリのバックアップを取っておきます。ディレクトリのコピーは「-r」オプションを付けます。
1 |
$ cp -r 対象ディレクトリ名 バックアップディレクトリ名 |
次に、「find」コマンドで対象ディレクトリ内のファイルのリストを取得し、それらのファイルに対して、nkf コマンドで文字コードの変換を行っていきます。
1 |
$ find . -type f | xargs -n 10 nkf -w --overwrite |
find と nkf コマンドを パイプ「|」でつないでいます。「xargs -n 10」は取得したファイルリストを 10個ずつ nkf に渡すことを意味します。「–overwrite」は上書き保存を意味します。「-w」は UTF-8 に変換することを意味します。変換したい文字コードの種類によって以下のようにオプションが変わります。
- -w:UTF-8
- -e:EUC-JP
- -s:Shift-JIS
最後に、ちゃんと文字コードが変換されていることを「nkf -g」コマンドで確認します。
1 |
$ nkf -g ファイル名 |
結果は、「UTF-8 (LF)」と出力され、無事に UTF-8 に変換されていることが確認でしました。
関連記事
-
-
大量のテキストファイルを圧縮して Windows から Linux へコピーして解凍してみた。
大量のテキストファイルを Windows から Linux にコピーする必要があり、最初はそのまま
-
-
【Linux】 ファイルの重複した行を削除して、ファイルを結合する方法。
大容量の CSV ファイルの重複した行を削除して、ファイルを結合する処理を行ったときのメモです。
-
-
【Linux】ファイルの行数をカウントし、行数指定でファイル分割する方法。
Linux のコマンドを使って、ファイルの行数をカウントし、行数を指定してファイルを分割したときのメ
-
-
【Linux】cp コマンドでディレクトリごとコピーし、ファイルの上書き確認されないようにする方法
Linux で cp コマンドを使って、ディレクトリごとコピーし、同一ファイル名があった場合に上書き
-
-
【Linux】指定ディレクトリ以下のファイルの内容を一括置換する方法
簡単なウェブサイトを Perl 作っていて、開発環境が Windows で、公開する環境が Linu
-
-
【Linux】文字化け対策に unar のインストールを試みた。
Windows で圧縮したファイルを Linux で解凍すると、文字化けが起こってしまいます。文字化
-
-
【Raspberry Pi】Webサーバ apache を入れてみた【Linux】
ラズベリーパイで SSH を起動させ、Windows から SSH でアクセスできるように設定しまし
-
-
【Linux】SSH でリモートからログインする方法。
SSH(Secure Shell)は、暗号化され、安全にリモートホストにログインするためのプロトコル
-
-
【Linux】SSH を切断した後でも Python を実行し続ける方法|nohub
今回、Linux のサーバに Windows から TeraTerm で SSH 接続し、Pytho
-
-
【Linux】ファイルの文字コードを調べる方法
Linux でファイルの文字コードを調べる必要があったので、その時のメモです。 いくつか方法が