【Linux】ファイルの行数をカウントし、行数指定でファイル分割する方法。

公開日: : 最終更新日:2020/04/23 Linux , , , , ,

Linux のコマンドを使って、ファイルの行数をカウントし、行数を指定してファイルを分割したときのメモです。

ファイルの行数をカウント(wc コマンド)

Linux でファイルの行数をカウントするには「wc」コマンドを用います。

今回は CSVファイル の行数をカウントしました。

結果は以下のように出力されます。

2533350 2533350 173407888028 file_name.csv

3つ出力されるのですが、左から 対象ファイルの「行数」「単語数」「バイト数」を表しています。

この例だと、2533350 行とわかりました。

行数を指定してファイルを分割(split コマンド)

Linux でファイルを分割するには「split」コマンドを用います。

分割する方法は色々あるのですが、今回は行数を指定して分割しました。

行数を指定するには「-l」オプションを付けます。

そして、分割したファイル名に数字で3桁の連番をつけるには、「-d」オプションを付けます。

例えば、20万行で分割する場合は、以下のようになります。

さらに、出力ファイル名に拡張子(.csv)を付けるには、末尾に「-additional-shuffix=.csv」オプションを付けます。

関連記事

【WSL】Windows10 に Linux(Ubuntu) を入れてみた。

最新の Windows10 環境であれば、簡単に Linux 環境を構築できるということで、試してみ

記事を読む

【Linux】ファイルの文字コードを一括変換する方法|EUC-JP ⇒ UTF-8

Linux で、あるディレクトリ内のファイルの文字コードを EUC-JP から UTF-8 に一括変

記事を読む

【Linux】cp コマンドでディレクトリごとコピーし、ファイルの上書き確認されないようにする方法

Linux で cp コマンドを使って、ディレクトリごとコピーし、同一ファイル名があった場合に上書き

記事を読む

【Linux】文字化け対策に unar のインストールを試みた。

Windows で圧縮したファイルを Linux で解凍すると、文字化けが起こってしまいます。文字化

記事を読む

大量のテキストファイルを圧縮して Windows から Linux へコピーして解凍してみた。

大量のテキストファイルを Windows から Linux にコピーする必要があり、最初はそのまま

記事を読む

【Linux】WinSCP で Windows からファイルをコピーする方法。

今回は、WinSCP というソフトを使って、Windows から GUI で Linux のサーバに

記事を読む

【Linux】SSH を切断した後でも Python を実行し続ける方法|nohub

今回、Linux のサーバに Windows から TeraTerm で SSH 接続し、Pytho

記事を読む

【Linux】SSH でリモートからログインする方法。

SSH(Secure Shell)は、暗号化され、安全にリモートホストにログインするためのプロトコル

記事を読む

【Linux】ファイルの文字コードを調べる方法

Linux でファイルの文字コードを調べる必要があったので、その時のメモです。 いくつか方法が

記事を読む

【Raspberry Pi】Webサーバ apache を入れてみた【Linux】

ラズベリーパイで SSH を起動させ、Windows から SSH でアクセスできるように設定しまし

記事を読む

【転移学習】学習済みVGG16 による転移学習を行う方法【PyTorch】

今回は、PyTorch を使って、学習済みのモデル VGG16 を用い

【PyTorch】畳込みニューラルネットワークを構築する方法【CNN】

今回は、PyTorch を使って畳込みニューラルネットワーク(CNN)

【PyTorch】ニューラルネットワークを構築する方法【NN】

今回は、PyTorch を使って、ニューラルネットワーク(NN)を構築

【OpenCV】検出した顔画像部分を切り出す方法【Python】

OpenCV を使って、Python で画像の中から顔部分を切り出した

【Fashion-MNIST】ファッションアイテムのデータセットを使ってみた【TensorFlow】

今回は、機械学習用に公開されているデータセットの1つである「Fashi

→もっと見る

PAGE TOP ↑