1. Regexxer
es una práctica herramienta de búsqueda de archivos que permite editar archivos directamente desde su interfaz. Puede buscar archivos y carpetas por nombre y buscar dentro de archivos basados en texto (incluyendo archivos HTML y XML). El lado izquierdo de la ventana le permite seleccionar la carpeta y el patrón de destino (poner * para todos los archivos o *.txt sólo para los archivos de texto). Regexxer puede realizar búsquedas recursivas en subcarpetas de cualquier carpeta seleccionada e incluir archivos ocultos en los resultados.
El lado derecho de la ventana le permite realizar “buscar y reemplazar” en un archivo seleccionado. Aquí puede reemplazar sólo una instancia de una frase encontrada o todas automáticamente. También puede reemplazar la frase seleccionada en todos los archivos encontrados, lo que resulta útil para la edición por lotes.
2. Searchmonkey
En su día Searchmonkey fue muy popular. En algún momento, el desarrollo de la versión de Linux cesó, y ahora el sitio web ofrece nuevas descargas sólo para Windows. Aún así, la versión antigua puede instalarse desde los repositorios de casi todas las distribuciones de Linux. Tal vez sorprendentemente, funciona muy bien y es muy rápido. Puede utilizar Searchmonkey para buscar archivos y carpetas por nombre, o para buscar en su contenido y frases usando expresiones regulares.
Searchmonkey le ayuda a construir consultas complejas con el Asistente de Expresión de Archivo (activado al hacer clic en el botón Constructor de Expresiones) y una opción llamada Probar Expresión Regular (en el menú Extras). Puede buscar archivos recursivamente, y puede establecer la profundidad de búsqueda (cuántas subcarpetas debe buscar) y filtrar los archivos por tamaño y fecha. En la pestaña “Opciones” puede limitar el número de archivos de los resultados y elegir cuántas líneas de contexto desea ver.
3. DocFetcher
En lugar de buscar directamente en su sistema de archivos, DocFetcher le pedirá que cree un índice y luego busque sus consultas sólo en archivos indexados. Ofrece una versión portátil (basta con desempaquetarla y ejecutar el archivo.sh desde el terminal) para sistemas de 32 y 64 bits. Para crear un índice, haga clic con el botón derecho del ratón en el área “Alcance de la búsqueda” a la izquierda.
Puede agregar carpetas al índice, pausar la creación del índice y continuar más tarde, indexar archivos de archivo (ZIP, TAR) como carpetas y excluir archivos seleccionados del índice con la ayuda de expresiones regulares.
DocFetcher tiene un renderizador HTML incorporado que le permite previsualizar archivos HTML con formato e imágenes. Ofrece una opción consciente de la privacidad para eliminar el historial de búsqueda y le permite buscar y dentro de los archivos utilizando comodines, operadores booleanos, búsqueda difusa (encuentra palabras similares), búsqueda por proximidad (qué tan lejos deben estar las palabras entre sí en el texto), y más. DocFetcher es compatible con un número impresionante de formatos, incluidos los archivos de Microsoft y Libre Office (DOC, DOCX, ODT, OTP…), PDF y EPUB, HTML y XML, archivos de correo electrónico PST de Outlook y metadatos de audio e imagen.
4. Recuperar
es un motor de búsqueda para su escritorio; algo así como Google, pero para sus archivos y carpetas. Está escrito en Java, por lo que funciona en Linux, OS X y Windows, siempre que tenga Java instalado y configurado correctamente. El archivo de instalación está disponible en el sitio web del proyecto , y puede simplemente extraerlo en una carpeta, abrir esa carpeta en el terminal y ejecutar java -jar regain.jar para iniciar la aplicación. (El archivo “regain.jar” tiene que ser ejecutable). Regain se ejecutará en su navegador web predeterminado.
Para buscar sus archivos y carpetas, Recuperar debe primero rastrear su sistema y crear un índice de búsqueda. En el formulario “Preferencias” se añaden las carpetas que se desean indexar. Si no desea incluir determinados archivos en el índice, haga una lista negra en el archivo “CrawlerConfiguration.xml”. Una vez que empiece a usar Recuperar, buscará en el índice en lugar de escanear todo el disco duro. Esto ahorra recursos del sistema y hace que la búsqueda sea más rápida.
5. PDFgrep
De todas las herramientas de esta lista, PDFgrep es la más parecida al grep original, pero también es “la más extraña”, porque es una herramienta de línea de comandos. ofrecen PDFgrep en sus repositorios, pero es necesario compilar la versión más reciente (actualmente 1.3.2).
Mientras grep produce el número de línea en la que aparece la cadena de búsqueda, PDFgrep le mostrará el número de página en su lugar, lo que es más útil para los archivos PDF ya que tendemos a leerlos como libros, no a analizarlos línea por línea. PDFgrep sólo funciona en archivos PDF. Tienen que ser convertidos a partir de texto o OCR, no sólo imágenes escaneadas.
Para buscar una palabra en un archivo PDF, escriba:
pdfgrep word nombrearchivo.pdf
Para ignorar el caso, utilice la opción -i:
pdfgrep -i word filename.pdf
Encontrará “Palabra”, “palabra”, “palabra”, “palabra” y otras combinaciones posibles. Si busca una frase, póngala entre comillas. Algunas opciones útiles son:
-n: produce el número de página para cada coincidencia
-c: imprime sólo el número de coincidencias en un archivo
-p muestra el número de coincidencias por página
-NÚMERO C: imprime el número seleccionado de caracteres alrededor de cada coincidencia para el contexto. En lugar de un número, puede escribir “line” y PDFgrep imprimirá la línea completa.
PDFgrep puede buscar recursivamente en todas las subcarpetas de una carpeta activa y buscar en varios archivos PDF. También soporta expresiones regulares, y las opciones pueden ser combinadas:
pdfgrep -nH “Mundo Linux” file1.pdf file2.pdf /home/user/Desktop/newfile.pdf
Esto imprimiría el número de página y el nombre de archivo de cada coincidencia (debido a la opción -H).
¿Qué herramientas y comandos de Linux utiliza para encontrar archivos? Comparte tus favoritos en los siguientes comentarios.
Crédito de la imagen: Fuente de imagen destacada , Fuente de imagen de teaser