Después de mucho tiempo sin pisar por aquí, vuelvo con una herramienta muy útil que no es nueva … pero poco utilizada :(
Resulta que ahora se ha puesto de moda la deduplicación de datos. Es decir, que las herramientas de backup, archivado, … se dan cuenta que el dato que tienen entre manos es igual a otro anterior así que no lo copian, pero dejan un puntero. Esto de la deduplicación está muy bien, pero es una moda más :( Para aquellos que tengan curiosidad y quieran aprender más del tema, pueden echarle un vistazo a estos enlaces:
- http://www.idg.es/cio/mostrarArticulo.asp?id=182423&seccion=
- http://searchstorage.techtarget.com/sDefinition/0,,sid5_gci1248105,00.html
- http://en.wikipedia.org/wiki/Data_deduplication
- http://searchdatabackup.techtarget.com/tip/0,289483,sid187_gci1300486,00.html
- http://www.datadomain.com/resources/faq.html
Aquí entra el tema económico: ¿cuánto cuesta una herramienta de esas? Bastante :( Así que para casa … mejor nos olvidamos … Noooooo!!! Como siempre, en el mundillo FOSS tenemos algunas herramientas que nos valen para hacer nuestra deduplicación casera. Una de esas herramientas es fdupes
. A mi me gusta fdupes
porque es muy sencilla de utilizar, aunque como he dicho antes, hay muchas más, como por ejemplo: dupfinder
, fdmf
y fslint
.
fdupes
tiene muy pocas opciones (lo cual lo hace muy sencillo de utilizar) siendo (en mi opinión) las más útiles estas:
-r
: nos permite hacer búsquedas recursivas, es decir, se mete en los subdirectorios y va buscando ficheros iguales-s
: si encuentra un symlink, lo sigue-H
: trata a dos enlaces hardlinks iguales como copias dobles del mismo fichero-S
: te muestra el tamaño de los ficheros que son iguales
¿Pero cómo lo uso? Muy sencillo, para usar fdupes
, basta con teclear:
fdupes [opciones] <ruta_donde_quiero_buscar>
Por ejemplo, si quiero buscar los ficheros duplicados que tengo en el directorio musica
, basta con teclear:
fdupes -rsHS musica
Esto hará que fdupes
compare entre sí todos los ficheros que encuentre en el directorio música
. ¿Y ya está? Pues sí, ya está … bueno, los busca y te los muestra. ¿Y ahora qué? Depende, puedes borrarlos, volver a hacer más copias para ocupar aún más disco, moverlos a otro sitio, … Eso ya es cosa tuya ;)
Hablando de borrar ficheros, fdupes
tiene una opción (-d
) que lo que hace es que te pregunta qué fichero quieres mantener. Por ejemplo:
Set 1 of 2, preserve files [1 - 2, all] (15084733 bytes each): 2
[-] ./directorio_original/skype-2.0.0.72-suse.i586.rpm [1] ./directorio_original/img.jpg Set 2 of 2, preserve files [1 - 3, all] (150613 bytes each): 1
[+] ./directorio_original/img.jpg ~/tmp> fdupes -rsHSd ./~/tmp> fdupes -rsHSd ./
[1] ./directorio_original/skype-2.0.0.72-suse.i586.rpm
[2] ./copia/skype-2.0.0.72-suse.i586.rpm
[+] ./copia/skype-2.0.0.72-suse.i586.rpm
[2] ./copia/logo_2.jpg
[3] ./directorio_original/logo_2.jpg
[-] ./copia/logo_2.jpg
[-] ./directorio_original/logo_2.jpg
~/tmp>
En este ejemplo, me he quedado con la copia del fichero skype-2.0.0.72-suse.i586.rpm
y en el segundo caso me he quedado con el fichero img.jpg
.
Pues nada, que me has convencido, que me voy a poner a liberar espacio de mi disco duro pero que ya mismo !!! Eh! «Cuidao», siempre que borres algo … comprueba que es lo que efectivamente quieres borrar ;)