【Linux】ファイルの文字コードを一括変換する方法|EUC-JP ⇒ UTF-8

Linux で、あるディレクトリ内のファイルの文字コードを EUC-JP から UTF-8 に一括変換したときのメモです。

まず、cp コマンドで文字コード変換前のディレクトリのバックアップを取っておきます。ディレクトリのコピーは「-r」オプションを付けます。

次に、「find」コマンドで対象ディレクトリ内のファイルのリストを取得し、それらのファイルに対して、nkf コマンドで文字コードの変換を行っていきます。

find と nkf コマンドを パイプ「|」でつないでいます。「xargs -n 10」は取得したファイルリストを 10個ずつ nkf に渡すことを意味します。「–overwrite」は上書き保存を意味します。「-w」は UTF-8 に変換することを意味します。変換したい文字コードの種類によって以下のようにオプションが変わります。

  • -w:UTF-8
  • -e:EUC-JP
  • -s:Shift-JIS

最後に、ちゃんと文字コードが変換されていることを「nkf -g」コマンドで確認します。

結果は、「UTF-8 (LF)」と出力され、無事に UTF-8 に変換されていることが確認でしました。

関連記事

【情報処理学会】正会員から学生会員に変更する方法。

大学院に行くことになったので、入会していた情報処理学会を、 正会員から学生会員に変更

記事を読む

将棋|ブラウザ上でJavaScriptを使って棋譜データを再生する方法【jsShogiKifu】

将棋の棋譜データをブラウザ上で再生する方法を調べて分かったことを紹介します。 スマホ上では F

記事を読む

【Linux】ファイルの文字コードを調べる方法

Linux でファイルの文字コードを調べる必要があったので、その時のメモです。 いくつか方法が

記事を読む

【Raspberry Pi】Webサーバ apache を入れてみた【Linux】

ラズベリーパイで SSH を起動させ、Windows から SSH でアクセスできるように設定しまし

記事を読む

no image

【ETL】手書き文字のデータベースをダウンロードしてみた

文字認識や筆者識別の研究を行う際、手書き文字のデータが必要になってきます。 そのあたりの研究を

記事を読む

囲碁|ブラウザ上でJavaScriptを使って棋譜データを再生する方法【WGO.js】

以前、将棋の棋譜をブラウザ上で再生する方法 を紹介しました。同様に、囲碁の棋譜再生も JavaScr

記事を読む

Windows で Scala をインストールする。

Windows に Scala というプログラミング言語をインストールしたときのメモです。Java,

記事を読む

Linux|cp コマンドでディレクトリごとコピーし、ファイルの上書き確認されないようにする方法

Linux で cp コマンドを使って、ディレクトリごとコピーし、同一ファイル名があった場合に上書き

記事を読む

Apache の error_log で「(8)Exec format error: exec of 」エラー表示が出たときの対処法

Perl でウェブサイトを作っていて、Apache のエラーで少しはまったため、そのときのメモ。

記事を読む

【Linux】文字化け対策に unar のインストールを試みた。

Windows で圧縮したファイルを Linux で解凍すると、文字化けが起こってしまいます。文字化

記事を読む

Message

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

【Python】pip3 で「cannot import name ‘main’」エラーが出たときの対処法。

Python でライブラリをインストールする際に、pipを使います。

【mecab-python3】parseToNode で surface が正しく取得できないときの対処法。

python3 で mecab-python3 を使うと、parseT

【Python】形態素解析器 Mecab を Linux(Ubuntu)で使ってみた。

Linux の Ubuntu OS に、形態素解析器 Mecab をイ

【Python】NLTK(自然言語処理ライブラリ)を使ってみた。

Python の自然言語処理ライブラリである NLTK を Linux

【Python】OpenCV を使って顔画像を検出してみた。

OpenCV のインストール Numpy のインストール [c

→もっと見る

PAGE TOP ↑