大量のテキストファイルを圧縮して Windows から Linux へコピーして解凍してみた。

公開日: : 最終更新日:2020/07/17 Linux , , , , ,

大量のテキストファイルを Windows から Linux にコピーする必要があり、最初はそのまま FFFTP を使ってコピーしてしていたのですが、全然終わらなかったので、フォルダを zip に圧縮してから Linux 環境にコピーし、Linux 環境で解凍するようにしました。

まずは、Windows 環境でフォルダごと zip 形式に圧縮します。

ファイル数約8万5千個で、サイズが約1Gあります。

zip に圧縮すると、

約350MB となり、容量が 約30% に圧縮されていました(圧縮率約70%)。

次に、FFFTP を使って、zip ファイルをコピーします。

結構時間がかかりました。。

最後に、TeraTerm を使って Linux 環境にログインして、unzip コマンドで zip ファイルを解凍します。

以下のようなエラーが出て、解凍できず。

zip ファイルが壊れているみたいなので、zip コマンドで修復してみました。

再度、unzip コマンドで解凍、、、できませんでした><。

 

そこで、ZIP 形式はあきらめて、tar.gz で圧縮する方法に切り替えました。

Lhaplus」を使って、Windows 環境で tar.gz に圧縮します。

なんと、ファイルサイズが約60MBとなり、ZIP と比べて tar.gz の圧縮率が高いことが分かりました。

同様に FFFTP を使って Linux 環境にアップロードし、tar コマンドで解凍します。

オプションの意味は、z:gz、x:解凍 (extract)、v:圧縮・解凍状況を表示(verbose)、f:圧縮ファイル名指定 (filename) のようです。

これでようやく無事に解凍することができました。

関連記事

【Linux】SSH を切断した後でも Python を実行し続ける方法|nohub

今回、Linux のサーバに Windows から TeraTerm で SSH 接続し、Pytho

記事を読む

【Linux】ファイルの文字コードを一括変換する方法|EUC-JP ⇒ UTF-8

Linux で、あるディレクトリ内のファイルの文字コードを EUC-JP から UTF-8 に一括変

記事を読む

【Linux】WinSCP で Windows からファイルをコピーする方法。

今回は、WinSCP というソフトを使って、Windows から GUI で Linux のサーバに

記事を読む

【Linux】ファイルの行数をカウントし、行数指定でファイル分割する方法。

Linux のコマンドを使って、ファイルの行数をカウントし、行数を指定してファイルを分割したときのメ

記事を読む

【Linux】 ファイルの重複した行を削除して、ファイルを結合する方法。

大容量の CSV ファイルの重複した行を削除して、ファイルを結合する処理を行ったときのメモです。

記事を読む

【WSL】Windows10 に Linux(Ubuntu) を入れてみた。

最新の Windows10 環境であれば、簡単に Linux 環境を構築できるということで、試してみ

記事を読む

【Linux】SSH でリモートからログインする方法。

SSH(Secure Shell)は、暗号化され、安全にリモートホストにログインするためのプロトコル

記事を読む

【Linux】文字化け対策に unar のインストールを試みた。

Windows で圧縮したファイルを Linux で解凍すると、文字化けが起こってしまいます。文字化

記事を読む

【Raspberry Pi】Webサーバ apache を入れてみた【Linux】

ラズベリーパイで SSH を起動させ、Windows から SSH でアクセスできるように設定しまし

記事を読む

【Linux】cp コマンドでディレクトリごとコピーし、ファイルの上書き確認されないようにする方法

Linux で cp コマンドを使って、ディレクトリごとコピーし、同一ファイル名があった場合に上書き

記事を読む

Message

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

【TensorFlow】GPUを認識しない時の対処方法【Python】

TensorFlow で GPU を認識させようとしたときにハマってし

【耳コピ】音楽ファイルを楽器ごとに分離する方法【Spleeter:フリー】

今回は、mp3 などの音楽ファイルをボーカル、ベース、ドラムなどの楽器

【Chainer】手書き数字認識をしてみた【Deep Learning】

Chainerを用いて、ニューラルネットワークを構築し、手書き数字認識

【Spyder】引数のあるスクリプトを実行する方法。

Python の統合開発環境(IDE)である Spyder では、簡単

【Anaconda】Prompt 上で Git コマンドを実行する方法。

Anaconda のコマンドプロンプト(Anaconda Prompt

→もっと見る

PAGE TOP ↑