大量のテキストファイルを圧縮して Windows から Linux へコピーして解凍してみた。
大量のテキストファイルを Windows から Linux にコピーする必要があり、最初はそのまま FFFTP を使ってコピーしてしていたのですが、全然終わらなかったので、フォルダを zip に圧縮してから Linux 環境にコピーし、Linux 環境で解凍するようにしました。
まずは、Windows 環境でフォルダごと zip 形式に圧縮します。
ファイル数約8万5千個で、サイズが約1Gあります。
zip に圧縮すると、
約350MB となり、容量が 約30% に圧縮されていました(圧縮率約70%)。
次に、FFFTP を使って、zip ファイルをコピーします。
結構時間がかかりました。。
最後に、TeraTerm を使って Linux 環境にログインして、unzip コマンドで zip ファイルを解凍します。
1 |
# unzip ファイル名 |
以下のようなエラーが出て、解凍できず。
1 2 3 4 5 6 7 |
Archive: KIFU_DATA_utf8.zip End-of-central-directory signature not found. Either this file is not a zipfile, or it constitutes one disk of a multi-part archive. In the latter case the central directory and zipfile comment will be found on the last disk(s) of this archive. unzip: cannot find zipfile directory in one of KIFU_DATA_utf8.zip or KIFU_DATA_utf8.zip.zip, and cannot find KIFU_DATA_utf8.zip.ZIP, period. |
zip ファイルが壊れているみたいなので、zip コマンドで修復してみました。
1 2 3 4 5 |
# zip -FF KIFU_DATA_utf8.zip --output KIFU_DATA_utf8_2.zip Fix archive (-FF) - salvage what can zip warning: Missing end (EOCDR) signature - either this archive is not readable or the end is damaged Is this a single-disk archive? (y/n): y |
再度、unzip コマンドで解凍、、、できませんでした><。
そこで、ZIP 形式はあきらめて、tar.gz で圧縮する方法に切り替えました。
「Lhaplus」を使って、Windows 環境で tar.gz に圧縮します。
なんと、ファイルサイズが約60MBとなり、ZIP と比べて tar.gz の圧縮率が高いことが分かりました。
同様に FFFTP を使って Linux 環境にアップロードし、tar コマンドで解凍します。
1 |
# tar -zxvf ファイル名 |
オプションの意味は、z:gz、x:解凍 (extract)、v:圧縮・解凍状況を表示(verbose)、f:圧縮ファイル名指定 (filename) のようです。
これでようやく無事に解凍することができました。
関連記事
-
【Linux】SSH を切断した後でも Python を実行し続ける方法|nohub
今回、Linux のサーバに Windows から TeraTerm で SSH 接続し、Pytho
-
【Raspberry Pi】Webサーバ apache を入れてみた【Linux】
ラズベリーパイで SSH を起動させ、Windows から SSH でアクセスできるように設定しまし
-
【Linux】ファイルの行数をカウントし、行数指定でファイル分割する方法。
Linux のコマンドを使って、ファイルの行数をカウントし、行数を指定してファイルを分割したときのメ
-
【Linux】 ファイルの重複した行を削除して、ファイルを結合する方法。
大容量の CSV ファイルの重複した行を削除して、ファイルを結合する処理を行ったときのメモです。
-
【WSL】Windows10 に Linux(Ubuntu) を入れてみた。
最新の Windows10 環境であれば、簡単に Linux 環境を構築できるということで、試してみ
-
【Linux】文字化け対策に unar のインストールを試みた。
Windows で圧縮したファイルを Linux で解凍すると、文字化けが起こってしまいます。文字化
-
【Linux】ファイルの文字コードを調べる方法
Linux でファイルの文字コードを調べる必要があったので、その時のメモです。 いくつか方法が
-
【Linux】指定ディレクトリ以下のファイルの内容を一括置換する方法
簡単なウェブサイトを Perl 作っていて、開発環境が Windows で、公開する環境が Linu
-
【Linux】cp コマンドでディレクトリごとコピーし、ファイルの上書き確認されないようにする方法
Linux で cp コマンドを使って、ディレクトリごとコピーし、同一ファイル名があった場合に上書き
-
【Linux】WinSCP で Windows からファイルをコピーする方法。
今回は、WinSCP というソフトを使って、Windows から GUI で Linux のサーバに