【Linux】ファイルの文字コードを一括変換する方法|EUC-JP ⇒ UTF-8

公開日: : 最終更新日:2020/04/21 Linux , , , , ,

Linux で、あるディレクトリ内のファイルの文字コードを EUC-JP から UTF-8 に一括変換したときのメモです。

まず、cp コマンドで文字コード変換前のディレクトリのバックアップを取っておきます。ディレクトリのコピーは「-r」オプションを付けます。

次に、「find」コマンドで対象ディレクトリ内のファイルのリストを取得し、それらのファイルに対して、nkf コマンドで文字コードの変換を行っていきます。

find と nkf コマンドを パイプ「|」でつないでいます。「xargs -n 10」は取得したファイルリストを 10個ずつ nkf に渡すことを意味します。「–overwrite」は上書き保存を意味します。「-w」は UTF-8 に変換することを意味します。変換したい文字コードの種類によって以下のようにオプションが変わります。

  • -w:UTF-8
  • -e:EUC-JP
  • -s:Shift-JIS

最後に、ちゃんと文字コードが変換されていることを「nkf -g」コマンドで確認します。

結果は、「UTF-8 (LF)」と出力され、無事に UTF-8 に変換されていることが確認でしました。

関連記事

【Linux】指定ディレクトリ以下のファイルの内容を一括置換する方法

簡単なウェブサイトを Perl 作っていて、開発環境が Windows で、公開する環境が Linu

記事を読む

【Linux】SSH でリモートからログインする方法。

SSH(Secure Shell)は、暗号化され、安全にリモートホストにログインするためのプロトコル

記事を読む

【Linux】ファイルの行数をカウントし、行数指定でファイル分割する方法。

Linux のコマンドを使って、ファイルの行数をカウントし、行数を指定してファイルを分割したときのメ

記事を読む

【Linux】文字化け対策に unar のインストールを試みた。

Windows で圧縮したファイルを Linux で解凍すると、文字化けが起こってしまいます。文字化

記事を読む

【Linux】ファイルの文字コードを調べる方法

Linux でファイルの文字コードを調べる必要があったので、その時のメモです。 いくつか方法が

記事を読む

【Linux】SSH を切断した後でも Python を実行し続ける方法|nohub

今回、Linux のサーバに Windows から TeraTerm で SSH 接続し、Pytho

記事を読む

【Raspberry Pi】Webサーバ apache を入れてみた【Linux】

ラズベリーパイで SSH を起動させ、Windows から SSH でアクセスできるように設定しまし

記事を読む

【Linux】 ファイルの重複した行を削除して、ファイルを結合する方法。

大容量の CSV ファイルの重複した行を削除して、ファイルを結合する処理を行ったときのメモです。

記事を読む

【Linux】WinSCP で Windows からファイルをコピーする方法。

今回は、WinSCP というソフトを使って、Windows から GUI で Linux のサーバに

記事を読む

【Linux】cp コマンドでディレクトリごとコピーし、ファイルの上書き確認されないようにする方法

Linux で cp コマンドを使って、ディレクトリごとコピーし、同一ファイル名があった場合に上書き

記事を読む

Message

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

【Python】 DataFrame の特定の列で出現回数をカウントして降順でソートする方法。

Python で DataFrame 型の特定の列を指定して、対象列の

【テキストマイニング】 Amebaブログからデータ取得するための準備。

テキストマイニングを行うために、Ameba ブログ(アメブロ)のデータ

【Linux】 ローカルに Python をインストールする方法。

今回は、Linux サーバに、root 権限なしで、ローカルに Pyt

【Linux】 ファイルの重複した行を削除して、ファイルを結合する方法。

大容量の CSV ファイルの重複した行を削除して、ファイルを結合する処

【画像認識】 Google画像検索結果を取得する方法 【google image download】

今回は、深層学習(DeepLearning)で画像認識をするための画像

→もっと見る

PAGE TOP ↑