Primero que na darme un like aunque sea por pena.
Buenas, voy a hacer un aporte de como a partir de un txt puedes crear con algunas herramientas un motor de busqueda para una base de datos. Yo he usado una leak que había por ahi y ya que hago este post aprovecho para preguntar si conoceis BD de España que esten filtradas ya que de ese tema ando algo perdido.
A lo que va el post, a partir de un txt con muchos datos creas tu propio buscador en un rato. Me aburria y lo he hecho, os dejo con la explicacion por encima que chatgpt da porque me da pereza explicarlo y es algo extenso, si alguien le interesa en detalle pues le puede ayudar, pero el resultado es el que se ve en las imagenes
Me ha faltado poner tambien la ubicacion, pero ya me da pereza.
Programa usado: Docker
Primero se montó el entorno de trabajo usando Docker para poder ejecutar servicios sin instalar nada a mano en el sistema.
Programa usado: Elasticsearch
Se utilizó Elasticsearch como base de datos de búsqueda.
Aquí es donde se almacenan e indexan los registros del TXT para poder consultarlos de forma rápida.
Programa usado: Kibana
Kibana se usó únicamente para:
No se usó como interfaz final.
Programa usado: Logstash
Logstash se encargó de:
Esta fue la parte más importante del proceso.
Programa usado: Elasticsearch (índices)
Una vez procesado el archivo, los datos quedaron almacenados como una base de datos indexada, lista para consultas rápidas por nombre, apellidos o teléfono.
Programa usado: FastAPI
Se creó una aplicación web sencilla para:
Programas usados: Navegador web
La consulta final se hace desde el navegador, como cualquier buscador normal, sin necesidad de usar herramientas técnicas.
Resultado: un TXT inmanejable convertido en una base de datos rápida y consultable.
Buenas, voy a hacer un aporte de como a partir de un txt puedes crear con algunas herramientas un motor de busqueda para una base de datos. Yo he usado una leak que había por ahi y ya que hago este post aprovecho para preguntar si conoceis BD de España que esten filtradas ya que de ese tema ando algo perdido.
A lo que va el post, a partir de un txt con muchos datos creas tu propio buscador en un rato. Me aburria y lo he hecho, os dejo con la explicacion por encima que chatgpt da porque me da pereza explicarlo y es algo extenso, si alguien le interesa en detalle pues le puede ayudar, pero el resultado es el que se ve en las imagenes
Proceso seguido
Preparación del entorno
Programa usado: Docker
Primero se montó el entorno de trabajo usando Docker para poder ejecutar servicios sin instalar nada a mano en el sistema.
Motor de búsqueda
Programa usado: Elasticsearch
Se utilizó Elasticsearch como base de datos de búsqueda.
Aquí es donde se almacenan e indexan los registros del TXT para poder consultarlos de forma rápida.
Herramienta de validación
Programa usado: Kibana
Kibana se usó únicamente para:
- comprobar que los datos se estaban cargando bien
- verificar campos (nombre, apellidos, teléfono)
- validar el número total de registros
No se usó como interfaz final.
Carga y transformación del TXT
Programa usado: Logstash
Logstash se encargó de:
- leer el fichero TXT línea a línea
- separar cada línea en campos
- corregir el significado real de los datos
- descartar información incorrecta
- enviar los registros limpios a Elasticsearch
Esta fue la parte más importante del proceso.
Creación de una base de datos usable
Programa usado: Elasticsearch (índices)
Una vez procesado el archivo, los datos quedaron almacenados como una base de datos indexada, lista para consultas rápidas por nombre, apellidos o teléfono.
Interfaz de consulta
Programa usado: FastAPI
Se creó una aplicación web sencilla para:
- buscar registros sin usar Kibana
- combinar búsquedas por distintos campos
- mostrar resultados de forma clara y controlada
Uso final
Programas usados: Navegador web
La consulta final se hace desde el navegador, como cualquier buscador normal, sin necesidad de usar herramientas técnicas.
Resumen final
- Docker → entorno
- Logstash → leer y limpiar el TXT
- Elasticsearch → base de datos de búsqueda
- Kibana → validación
- FastAPI → interfaz de consulta
Resultado: un TXT inmanejable convertido en una base de datos rápida y consultable.