【Linux】ファイルの文字コードを一括変換する方法|EUC-JP ⇒ UTF-8
Linux で、あるディレクトリ内のファイルの文字コードを EUC-JP から UTF-8 に一括変換したときのメモです。
まず、cp コマンドで文字コード変換前のディレクトリのバックアップを取っておきます。ディレクトリのコピーは「-r」オプションを付けます。
1 |
$ cp -r 対象ディレクトリ名 バックアップディレクトリ名 |
次に、「find」コマンドで対象ディレクトリ内のファイルのリストを取得し、それらのファイルに対して、nkf コマンドで文字コードの変換を行っていきます。
1 |
$ find . -type f | xargs -n 10 nkf -w --overwrite |
find と nkf コマンドを パイプ「|」でつないでいます。「xargs -n 10」は取得したファイルリストを 10個ずつ nkf に渡すことを意味します。「–overwrite」は上書き保存を意味します。「-w」は UTF-8 に変換することを意味します。変換したい文字コードの種類によって以下のようにオプションが変わります。
- -w:UTF-8
- -e:EUC-JP
- -s:Shift-JIS
最後に、ちゃんと文字コードが変換されていることを「nkf -g」コマンドで確認します。
1 |
$ nkf -g ファイル名 |
結果は、「UTF-8 (LF)」と出力され、無事に UTF-8 に変換されていることが確認でしました。
関連記事
-
【Linux】指定ディレクトリ以下のファイルの内容を一括置換する方法
簡単なウェブサイトを Perl 作っていて、開発環境が Windows で、公開する環境が Linu
-
【Linux】cp コマンドでディレクトリごとコピーし、ファイルの上書き確認されないようにする方法
Linux で cp コマンドを使って、ディレクトリごとコピーし、同一ファイル名があった場合に上書き
-
【Linux】SSH を切断した後でも Python を実行し続ける方法|nohub
今回、Linux のサーバに Windows から TeraTerm で SSH 接続し、Pytho
-
【Linux】SSH でリモートからログインする方法。
SSH(Secure Shell)は、暗号化され、安全にリモートホストにログインするためのプロトコル
-
【Raspberry Pi】Webサーバ apache を入れてみた【Linux】
ラズベリーパイで SSH を起動させ、Windows から SSH でアクセスできるように設定しまし
-
【Linux】ファイルの行数をカウントし、行数指定でファイル分割する方法。
Linux のコマンドを使って、ファイルの行数をカウントし、行数を指定してファイルを分割したときのメ
-
大量のテキストファイルを圧縮して Windows から Linux へコピーして解凍してみた。
大量のテキストファイルを Windows から Linux にコピーする必要があり、最初はそのまま
-
【WSL】Windows10 に Linux(Ubuntu) を入れてみた。
最新の Windows10 環境であれば、簡単に Linux 環境を構築できるということで、試してみ
-
【Linux】WinSCP で Windows からファイルをコピーする方法。
今回は、WinSCP というソフトを使って、Windows から GUI で Linux のサーバに
-
【Linux】 ファイルの重複した行を削除して、ファイルを結合する方法。
大容量の CSV ファイルの重複した行を削除して、ファイルを結合する処理を行ったときのメモです。