Comprimir archivos en Linux: ZIP y algunas cosas que no te esperas
La entrada de hoy versa sobre el programa ZIP, popular programa y formato de compresión. Pero no hablaremos de sus usos más habituales, como la compresión y descompresión. Para ello ya realizamos una entrada al respecto. Hablaremos de otras opciones y como nos pueden ayudar.
El artículo es una adaptación del publicado en Networkworld.com por Sandra Henry-Stocker.
Algunos de nosotros hemos estado comprimiendo archivos en sistemas UNIX y GNU/Linux durante muchas décadas, para así mantener espacio disponible en disco y organizar los ficheros. Aún así, hay algunas variaciones interesantes sobre la compresión que no todos hemos probado. Por lo tanto, en esta publicación, veremos la compresión y descompresión estándar, así como otras opciones interesantes de compresión.
Comprimir archivos den Linux: ZIP y algunas cosas que no te esperas
Uso básico del comando ZIP
Primero, veamos el uso básico del comando zip. Utiliza esencialmente el mismo algoritmo de compresión de gzip, pero hay un par de diferencias importantes. Por un lado, el comando gzip se usa solo para comprimir un solo archivo donde zip puede comprimir archivos y unirlos en un archivo. Por otro lado, el comando gzip se cierra “en su lugar”. En otras palabras, deja un fichero comprimid, no el fichero original, junto con la copia comprimida.
Veamos un ejemplo del uso de gzip:
$ gzip onefile
$ ls -l
-rw-rw-r-- 1 shs shs 10514 Jan 15 13:13 onefile.gz
Y aquí veamos el uso de zip. Observe cómo este comando requiere que se proporcione un nombre para el fichero comprimido donde gzip simplemente utiliza el nombre del fichero original y agrega la extensión “.gz”
$ zip twofiles.zip file*
adding: file1 (deflated 82%)
adding: file2 (deflated 82%)
$ ls -l
-rw-rw-r-- 1 shs shs 58021 Jan 15 13:25 file1
-rw-rw-r-- 1 shs shs 58933 Jan 15 13:34 file2
-rw-rw-r-- 1 shs shs 21289 Jan 15 13:35 twofiles.zip
Tenga en cuenta también que los ficheros originales todavía están allí.
La cantidad de espacio en disco que se guarda (es decir, el grado de compresión obtenido) dependerá del contenido de cada fichero. La variación en el seguimiento ejemplo es considerable.
$ zip mybin.zip ~/bin/*
adding: bin/1 (deflated 26%)
adding: bin/append (deflated 64%)
adding: bin/BoD_meeting (deflated 18%)
adding: bin/cpuhog1 (deflated 14%)
adding: bin/cpuhog2 (stored 0%)
adding: bin/ff (deflated 32%)
adding: bin/file.0 (deflated 1%)
adding: bin/loop (deflated 14%)
adding: bin/notes (deflated 23%)
adding: bin/patterns (stored 0%)
adding: bin/runme (stored 0%)
adding: bin/tryme (deflated 13%)
adding: bin/tt (deflated 6%)
El comando unzip
El comando Unzip recuperará el contenido de un fichero con extensión zip y , como es probable que sospeche, dejará el fichero zip intacto, mientras que un comando gunzip similar dejaría solo fichero sin comprimir.
$ unzip twofiles.zip
Archive: twofiles.zip
inflating: file1
inflating: file2
$ ls -l
-rw-rw-r-- 1 shs shs 58021 Jan 15 13:25 file1
-rw-rw-r-- 1 shs shs 58933 Jan 15 13:34 file2
-rw-rw-r-- 1 shs shs 21289 Jan 15 13:35 twofiles.zip
El comando zipcloak
El comando zipcloak cifra un fichero zip, solicitándole que ingrese una contraseña dos veces (para ayudar a asegurar que no lo haga) y deja el fichero en su lugar. Puede esperar que el tamaño del archivo varíe un poco del original.
$ zipcloak twofiles.zip
Enter password:
Verify password:
encrypting: file1
encrypting: file2
$ ls -l
total 204
-rw-rw-r-- 1 shs shs 58021 Jan 15 13:25 file1
-rw-rw-r-- 1 shs shs 58933 Jan 15 13:34 file2
-rw-rw-r-- 1 shs shs 21313 Jan 15 13:46 twofiles.zip <== slightly larger than
unencrypted version
Tenga en cuenta que los archivos originales todavía se encuentran sin cifrar.
El comando zipdetails
El comando zipdetails te mostrará detalles: muchos detalles sobre un fichero comprimido, probablemente mucho más de lo que te interesa absorber. A pesar de que estamos viendo un archivo cifrado, zipdetails muestra los nombres de los ficheros junto con las fechas de modificación del archivo, la información del usuario y del grupo, los datos de la longitud del archivo, etc. Recuerde que esto es todo «metadatos». No vemos el contenido de los archivos.
$ zipdetails twofiles.zip
0000 LOCAL HEADER #1 04034B50
0004 Extract Zip Spec 14 '2.0'
0005 Extract OS 00 'MS-DOS'
0006 General Purpose Flag 0001
[Bit 0] 1 'Encryption'
[Bits 1-2] 1 'Maximum Compression'
0008 Compression Method 0008 'Deflated'
000A Last Mod Time 4E2F6B24 'Tue Jan 15 13:25:08 2019'
000E CRC F1B115BD
0012 Compressed Length 00002904
0016 Uncompressed Length 0000E2A5
001A Filename Length 0005
001C Extra Length 001C
001E Filename 'file1'
0023 Extra ID #0001 5455 'UT: Extended Timestamp'
0025 Length 0009
0027 Flags '03 mod access'
0028 Mod Time 5C3E2584 'Tue Jan 15 13:25:08 2019'
002C Access Time 5C3E27BB 'Tue Jan 15 13:34:35 2019'
0030 Extra ID #0002 7875 'ux: Unix Extra Type 3'
0032 Length 000B
0034 Version 01
0035 UID Size 04
0036 UID 000003E8
003A GID Size 04
003B GID 000003E8
003F PAYLOAD
2943 LOCAL HEADER #2 04034B50
2947 Extract Zip Spec 14 '2.0'
2948 Extract OS 00 'MS-DOS'
2949 General Purpose Flag 0001
[Bit 0] 1 'Encryption'
[Bits 1-2] 1 'Maximum Compression'
294B Compression Method 0008 'Deflated'
294D Last Mod Time 4E2F6C56 'Tue Jan 15 13:34:44 2019'
2951 CRC EC214569
2955 Compressed Length 00002913
2959 Uncompressed Length 0000E635
295D Filename Length 0005
295F Extra Length 001C
2961 Filename 'file2'
2966 Extra ID #0001 5455 'UT: Extended Timestamp'
2968 Length 0009
296A Flags '03 mod access'
296B Mod Time 5C3E27C4 'Tue Jan 15 13:34:44 2019'
296F Access Time 5C3E27BD 'Tue Jan 15 13:34:37 2019'
2973 Extra ID #0002 7875 'ux: Unix Extra Type 3'
2975 Length 000B
2977 Version 01
2978 UID Size 04
2979 UID 000003E8
297D GID Size 04
297E GID 000003E8
2982 PAYLOAD
5295 CENTRAL HEADER #1 02014B50
5299 Created Zip Spec 1E '3.0'
529A Created OS 03 'Unix'
529B Extract Zip Spec 14 '2.0'
529C Extract OS 00 'MS-DOS'
529D General Purpose Flag 0001
[Bit 0] 1 'Encryption'
[Bits 1-2] 1 'Maximum Compression'
529F Compression Method 0008 'Deflated'
52A1 Last Mod Time 4E2F6B24 'Tue Jan 15 13:25:08 2019'
52A5 CRC F1B115BD
52A9 Compressed Length 00002904
52AD Uncompressed Length 0000E2A5
52B1 Filename Length 0005
52B3 Extra Length 0018
52B5 Comment Length 0000
52B7 Disk Start 0000
52B9 Int File Attributes 0001
[Bit 0] 1 Text Data
52BB Ext File Attributes 81B40000
52BF Local Header Offset 00000000
52C3 Filename 'file1'
52C8 Extra ID #0001 5455 'UT: Extended Timestamp'
52CA Length 0005
52CC Flags '03 mod access'
52CD Mod Time 5C3E2584 'Tue Jan 15 13:25:08 2019'
52D1 Extra ID #0002 7875 'ux: Unix Extra Type 3'
52D3 Length 000B
52D5 Version 01
52D6 UID Size 04
52D7 UID 000003E8
52DB GID Size 04
52DC GID 000003E8
52E0 CENTRAL HEADER #2 02014B50
52E4 Created Zip Spec 1E '3.0'
52E5 Created OS 03 'Unix'
52E6 Extract Zip Spec 14 '2.0'
52E7 Extract OS 00 'MS-DOS'
52E8 General Purpose Flag 0001
[Bit 0] 1 'Encryption'
[Bits 1-2] 1 'Maximum Compression'
52EA Compression Method 0008 'Deflated'
52EC Last Mod Time 4E2F6C56 'Tue Jan 15 13:34:44 2019'
52F0 CRC EC214569
52F4 Compressed Length 00002913
52F8 Uncompressed Length 0000E635
52FC Filename Length 0005
52FE Extra Length 0018
5300 Comment Length 0000
5302 Disk Start 0000
5304 Int File Attributes 0001
[Bit 0] 1 Text Data
5306 Ext File Attributes 81B40000
530A Local Header Offset 00002943
530E Filename 'file2'
5313 Extra ID #0001 5455 'UT: Extended Timestamp'
5315 Length 0005
5317 Flags '03 mod access'
5318 Mod Time 5C3E27C4 'Tue Jan 15 13:34:44 2019'
531C Extra ID #0002 7875 'ux: Unix Extra Type 3'
531E Length 000B
5320 Version 01
5321 UID Size 04
5322 UID 000003E8
5326 GID Size 04
5327 GID 000003E8
532B END CENTRAL HEADER 06054B50
532F Number of this disk 0000
5331 Central Dir Disk no 0000
5333 Entries in this disk 0002
5335 Total Entries 0002
5337 Size of Central Dir 00000096
533B Offset to Central Dir 00005295
533F Comment Length 0000
Done
El comando zipgrep
El comando zipgrep usará una función de tipo grep para localizar contenido particular en sus archivos comprimidos. Si el archivo está cifrado, deberá ingresar la contraseña provista para el cifrado de cada archivo que desee examinar. Si solo desea verificar el contenido de un solo fichero del archivo comprimido, agregue su nombre al final del comando zipgrep como se muestra a continuación.
$ zipgrep hazard twofiles.zip file1
[twofiles.zip] file1 password:
Certain pesticides should be banned since they are hazardous to the environment.
El comando zipinfo
El comando zipinfo proporciona información sobre el contenido de un archivo comprimido, ya sea cifrado o no. Esto incluye los nombres de archivos, tamaños, fechas y permisos.
$ zipinfo twofiles.zip
Archive: twofiles.zip
Zip file size: 21313 bytes, number of entries: 2
-rw-rw-r-- 3.0 unx 58021 Tx defN 19-Jan-15 13:25 file1
-rw-rw-r-- 3.0 unx 58933 Tx defN 19-Jan-15 13:34 file2
2 files, 116954 bytes uncompressed, 20991 bytes compressed: 82.1%
El comando zipnote
Si hablamos de zipnote, vemos que se puede utilizar para extraer comentarios de archivos zip o agregarlos. Para mostrar los comentarios, simplemente inicie el nombre del archivo con el comando. Si no se han agregado comentarios anteriormente, verá algo como esto:
$ zipnote twofiles.zip
@ file1
@ (comment above this line)
@ file2
@ (comment above this line)
@ (zip file comment below this line)
Si desea agregar comentarios, escriba la salida del comando zipnote en un archivo:
$ zipnote twofiles.zip > comments
A continuación, edite el fichero que acaba de crear e inserte sus comentarios sobre las líneas (comentarios sobre esta línea). Luego agrega los comentarios usando un comando zipnote como este:
$ zipnote -w twofiles.zip < comments
El comando zipsplit
El comando zipsplit se puede usar para dividir un fichero zip en múltiples archivos zip, cuando el archivo original es demasiado grande, tal vez porque está intentando agregar uno de los archivos a una pequeña unidad de almacenamiento. La forma más fácil de hacer esto parece ser especificar el tamaño máximo para cada una de las partes del archivo comprimido. Este tamaño debe ser lo suficientemente grande para acomodar el archivo incluido más grande.
$ zipsplit -n 12000 twofiles.zip
2 zip files will be made (100% efficiency)
creating: twofile1.zip
creating: twofile2.zip
$ ls twofile*.zip
-rw-rw-r-- 1 shs shs 10697 Jan 15 14:52 twofile1.zip
-rw-rw-r-- 1 shs shs 10702 Jan 15 14:52 twofile2.zip
-rw-rw-r-- 1 shs shs 21377 Jan 15 14:27 twofiles.zip
Observe cómo los archivos extraídos se denominan secuencialmente «twofile1» y «twofile2».
Conclusión
El comando zip, junto con algunos de otros programas similares, proporcionan un gran control sobre cómo generar y trabajar con archivos comprimidos.
Espero que el artículo os haya parecido de interés.