【Linux】ファイルの文字コードを一括変換する方法|EUC-JP ⇒ UTF-8

公開日: : 最終更新日:2020/04/21 Linux , , , , ,

Linux で、あるディレクトリ内のファイルの文字コードを EUC-JP から UTF-8 に一括変換したときのメモです。

まず、cp コマンドで文字コード変換前のディレクトリのバックアップを取っておきます。ディレクトリのコピーは「-r」オプションを付けます。

次に、「find」コマンドで対象ディレクトリ内のファイルのリストを取得し、それらのファイルに対して、nkf コマンドで文字コードの変換を行っていきます。

find と nkf コマンドを パイプ「|」でつないでいます。「xargs -n 10」は取得したファイルリストを 10個ずつ nkf に渡すことを意味します。「–overwrite」は上書き保存を意味します。「-w」は UTF-8 に変換することを意味します。変換したい文字コードの種類によって以下のようにオプションが変わります。

  • -w:UTF-8
  • -e:EUC-JP
  • -s:Shift-JIS

最後に、ちゃんと文字コードが変換されていることを「nkf -g」コマンドで確認します。

結果は、「UTF-8 (LF)」と出力され、無事に UTF-8 に変換されていることが確認でしました。

関連記事

【Linux】SSH でリモートからログインする方法。

SSH(Secure Shell)は、暗号化され、安全にリモートホストにログインするためのプロトコル

記事を読む

【Linux】文字化け対策に unar のインストールを試みた。

Windows で圧縮したファイルを Linux で解凍すると、文字化けが起こってしまいます。文字化

記事を読む

【Linux】WinSCP で Windows からファイルをコピーする方法。

今回は、WinSCP というソフトを使って、Windows から GUI で Linux のサーバに

記事を読む

大量のテキストファイルを圧縮して Windows から Linux へコピーして解凍してみた。

大量のテキストファイルを Windows から Linux にコピーする必要があり、最初はそのまま

記事を読む

【Linux】指定ディレクトリ以下のファイルの内容を一括置換する方法

簡単なウェブサイトを Perl 作っていて、開発環境が Windows で、公開する環境が Linu

記事を読む

【WSL】Windows10 に Linux(Ubuntu) を入れてみた。

最新の Windows10 環境であれば、簡単に Linux 環境を構築できるということで、試してみ

記事を読む

【Linux】 ファイルの重複した行を削除して、ファイルを結合する方法。

大容量の CSV ファイルの重複した行を削除して、ファイルを結合する処理を行ったときのメモです。

記事を読む

【Linux】ファイルの文字コードを調べる方法

Linux でファイルの文字コードを調べる必要があったので、その時のメモです。 いくつか方法が

記事を読む

【Linux】cp コマンドでディレクトリごとコピーし、ファイルの上書き確認されないようにする方法

Linux で cp コマンドを使って、ディレクトリごとコピーし、同一ファイル名があった場合に上書き

記事を読む

【Raspberry Pi】Webサーバ apache を入れてみた【Linux】

ラズベリーパイで SSH を起動させ、Windows から SSH でアクセスできるように設定しまし

記事を読む

Message

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

【TensorFlow】GPUを認識しない時の対処方法【Python】

TensorFlow で GPU を認識させようとしたときにハマってし

【耳コピ】音楽ファイルを楽器ごとに分離する方法【Spleeter:フリー】

今回は、mp3 などの音楽ファイルをボーカル、ベース、ドラムなどの楽器

【Chainer】手書き数字認識をしてみた【Deep Learning】

Chainerを用いて、ニューラルネットワークを構築し、手書き数字認識

【Spyder】引数のあるスクリプトを実行する方法。

Python の統合開発環境(IDE)である Spyder では、簡単

【Anaconda】Prompt 上で Git コマンドを実行する方法。

Anaconda のコマンドプロンプト(Anaconda Prompt

→もっと見る

PAGE TOP ↑