BUENAS NOCHES NODERS
Bien. Hoy me ha dicho un amigo que tenía que tener hacer una analizador léxico para una práctica de la uni. Hasta hace un rato no sabía lo que era un analizador léxico así que mi cerebro ha empezado a investigar y funcionar.
La función de un analizador léxico es extraer tokens de un texto. Es decir, palabras según un criterio o patrón de búsqueda.
Por ejemplo:
Tienes un texto con un montón de mierda y quieres extraer los correos electrónicos. Necesitas un analizador léxico.
Sirve por ejemplo para extraer datos de archivos grandes y clasificarlos. Imagina que tienes un archivo con un montón de datos de personas: Nombre, apellidos, dni, fecha de nacimiento, correo electrónico, etc. Un analizador léxico te lo puede sacar todo muy rápido.
También se necesita para los compiladores de lenguajes de programación.
El que os voy a dejar a continuación no es muy sofisticado porque lo he hecho para la uni sin calentarme mucho la cabeza. He utilizado flex y C. Flex busca los tokens mediante expresiones regulares (Ahora lo veréis).
Se puede mejorar, y mucho, para que busque los correos entre texto seguido (que no esté separado por espacios ni saltos de línea), que busque los nombres de los remitentes...
Os dejo el vídeo de un pancho para que os instaléis lo que necesitáis: Tutorial-Panchito
Aquí os dejo mi código:
Bien. Hoy me ha dicho un amigo que tenía que tener hacer una analizador léxico para una práctica de la uni. Hasta hace un rato no sabía lo que era un analizador léxico así que mi cerebro ha empezado a investigar y funcionar.
La función de un analizador léxico es extraer tokens de un texto. Es decir, palabras según un criterio o patrón de búsqueda.
Por ejemplo:
Tienes un texto con un montón de mierda y quieres extraer los correos electrónicos. Necesitas un analizador léxico.
Sirve por ejemplo para extraer datos de archivos grandes y clasificarlos. Imagina que tienes un archivo con un montón de datos de personas: Nombre, apellidos, dni, fecha de nacimiento, correo electrónico, etc. Un analizador léxico te lo puede sacar todo muy rápido.
También se necesita para los compiladores de lenguajes de programación.
El que os voy a dejar a continuación no es muy sofisticado porque lo he hecho para la uni sin calentarme mucho la cabeza. He utilizado flex y C. Flex busca los tokens mediante expresiones regulares (Ahora lo veréis).
Se puede mejorar, y mucho, para que busque los correos entre texto seguido (que no esté separado por espacios ni saltos de línea), que busque los nombres de los remitentes...
Os dejo el vídeo de un pancho para que os instaléis lo que necesitáis: Tutorial-Panchito
Aquí os dejo mi código:
Para ver el contenido, necesitas Iniciar sesión o Registrarte.