【Linux】ファイルの行数をカウントし、行数指定でファイル分割する方法。

公開日: : 最終更新日:2020/04/23 Linux , , , , ,

Linux のコマンドを使って、ファイルの行数をカウントし、行数を指定してファイルを分割したときのメモです。

ファイルの行数をカウント(wc コマンド)

Linux でファイルの行数をカウントするには「wc」コマンドを用います。

今回は CSVファイル の行数をカウントしました。

結果は以下のように出力されます。

2533350 2533350 173407888028 file_name.csv

3つ出力されるのですが、左から 対象ファイルの「行数」「単語数」「バイト数」を表しています。

この例だと、2533350 行とわかりました。

行数を指定してファイルを分割(split コマンド)

Linux でファイルを分割するには「split」コマンドを用います。

分割する方法は色々あるのですが、今回は行数を指定して分割しました。

行数を指定するには「-l」オプションを付けます。

そして、分割したファイル名に数字で3桁の連番をつけるには、「-d」オプションを付けます。

例えば、20万行で分割する場合は、以下のようになります。

さらに、出力ファイル名に拡張子(.csv)を付けるには、末尾に「-additional-shuffix=.csv」オプションを付けます。

関連記事

【Linux】文字化け対策に unar のインストールを試みた。

Windows で圧縮したファイルを Linux で解凍すると、文字化けが起こってしまいます。文字化

記事を読む

【Linux】cp コマンドでディレクトリごとコピーし、ファイルの上書き確認されないようにする方法

Linux で cp コマンドを使って、ディレクトリごとコピーし、同一ファイル名があった場合に上書き

記事を読む

【WSL】Windows10 に Linux(Ubuntu) を入れてみた。

最新の Windows10 環境であれば、簡単に Linux 環境を構築できるということで、試してみ

記事を読む

大量のテキストファイルを圧縮して Windows から Linux へコピーして解凍してみた。

大量のテキストファイルを Windows から Linux にコピーする必要があり、最初はそのまま

記事を読む

【Linux】ファイルの文字コードを調べる方法

Linux でファイルの文字コードを調べる必要があったので、その時のメモです。 いくつか方法が

記事を読む

【Raspberry Pi】Webサーバ apache を入れてみた【Linux】

ラズベリーパイで SSH を起動させ、Windows から SSH でアクセスできるように設定しまし

記事を読む

【Linux】SSH を切断した後でも Python を実行し続ける方法|nohub

今回、Linux のサーバに Windows から TeraTerm で SSH 接続し、Pytho

記事を読む

【Linux】SSH でリモートからログインする方法。

SSH(Secure Shell)は、暗号化され、安全にリモートホストにログインするためのプロトコル

記事を読む

【Linux】 ファイルの重複した行を削除して、ファイルを結合する方法。

大容量の CSV ファイルの重複した行を削除して、ファイルを結合する処理を行ったときのメモです。

記事を読む

【Linux】指定ディレクトリ以下のファイルの内容を一括置換する方法

簡単なウェブサイトを Perl 作っていて、開発環境が Windows で、公開する環境が Linu

記事を読む

【TensorFlow】GPUを認識しない時の対処方法【Python】

TensorFlow で GPU を認識させようとしたときにハマってし

【耳コピ】音楽ファイルを楽器ごとに分離する方法【Spleeter:フリー】

今回は、mp3 などの音楽ファイルをボーカル、ベース、ドラムなどの楽器

【Chainer】手書き数字認識をしてみた【Deep Learning】

Chainerを用いて、ニューラルネットワークを構築し、手書き数字認識

【Spyder】引数のあるスクリプトを実行する方法。

Python の統合開発環境(IDE)である Spyder では、簡単

【Anaconda】Prompt 上で Git コマンドを実行する方法。

Anaconda のコマンドプロンプト(Anaconda Prompt

→もっと見る

PAGE TOP ↑