Después de mucho tiempo sin pisar por aquí, vuelvo con una herramienta muy útil que no es nueva … pero poco utilizada 🙁
Resulta que ahora se ha puesto de moda la deduplicación de datos. Es decir, que las herramientas de backup, archivado, … se dan cuenta que el dato que tienen entre manos es igual a otro anterior así que no lo copian, pero dejan un puntero. Esto de la deduplicación está muy bien, pero es una moda más 🙁 Para aquellos que tengan curiosidad y quieran aprender más del tema, pueden echarle un vistazo a estos enlaces:
- http://www.idg.es/cio/mostrarArticulo.asp?id=182423&seccion=
- http://searchstorage.techtarget.com/sDefinition/0,,sid5_gci1248105,00.html
- http://en.wikipedia.org/wiki/Data_deduplication
- http://searchdatabackup.techtarget.com/tip/0,289483,sid187_gci1300486,00.html
- http://www.datadomain.com/resources/faq.html
Aquí entra el tema económico: ¿cuánto cuesta una herramienta de esas? Bastante 🙁 Así que para casa … mejor nos olvidamos … Noooooo!!! Como siempre, en el mundillo FOSS tenemos algunas herramientas que nos valen para hacer nuestra deduplicación casera. Una de esas herramientas es fdupes. A mi me gusta fdupes porque es muy sencilla de utilizar, aunque como he dicho antes, hay muchas más, como por ejemplo: dupfinder, fdmf y fslint.
fdupes tiene muy pocas opciones (lo cual lo hace muy sencillo de utilizar) siendo (en mi opinión) las más útiles estas:
-r: nos permite hacer búsquedas recursivas, es decir, se mete en los subdirectorios y va buscando ficheros iguales-s: si encuentra un symlink, lo sigue-H: trata a dos enlaces hardlinks iguales como copias dobles del mismo fichero-S: te muestra el tamaño de los ficheros que son iguales
¿Pero cómo lo uso? Muy sencillo, para usar fdupes, basta con teclear:
fdupes [opciones] <ruta_donde_quiero_buscar>
Por ejemplo, si quiero buscar los ficheros duplicados que tengo en el directorio musica, basta con teclear:
fdupes -rsHS musica
Esto hará que fdupes compare entre sí todos los ficheros que encuentre en el directorio música. ¿Y ya está? Pues sí, ya está … bueno, los busca y te los muestra. ¿Y ahora qué? Depende, puedes borrarlos, volver a hacer más copias para ocupar aún más disco, moverlos a otro sitio, … Eso ya es cosa tuya 😉
Hablando de borrar ficheros, fdupes tiene una opción (-d) que lo que hace es que te pregunta qué fichero quieres mantener. Por ejemplo:
~/tmp> fdupes -rsHSd ./
[1] ./directorio_original/skype-2.0.0.72-suse.i586.rpm
[2] ./copia/skype-2.0.0.72-suse.i586.rpm
Set 1 of 2, preserve files [1 - 2, all] (15084733 bytes each): 2
[-] ./directorio_original/skype-2.0.0.72-suse.i586.rpm
[+] ./copia/skype-2.0.0.72-suse.i586.rpm
[1] ./directorio_original/img.jpg
[2] ./copia/logo_2.jpg
[3] ./directorio_original/logo_2.jpg
Set 2 of 2, preserve files [1 - 3, all] (150613 bytes each): 1
[+] ./directorio_original/img.jpg
[-] ./copia/logo_2.jpg
[-] ./directorio_original/logo_2.jpg
~/tmp> fdupes -rsHSd ./
~/tmp>
En este ejemplo, me he quedado con la copia del fichero skype-2.0.0.72-suse.i586.rpm y en el segundo caso me he quedado con el fichero img.jpg.
Pues nada, que me has convencido, que me voy a poner a liberar espacio de mi disco duro pero que ya mismo !!! Eh! «Cuidao», siempre que borres algo … comprueba que es lo que efectivamente quieres borrar 😉




















