ANALIZADOR LÉXICO DISTINGUE TIPOS DE CORREO ELECTRÓNICO


Rodkaiser

Més que un nodero | Verdunchderechista
Noderador
Nodero
Noder
BUENAS NOCHES NODERS

Bien. Hoy me ha dicho un amigo que tenía que tener hacer una analizador léxico para una práctica de la uni. Hasta hace un rato no sabía lo que era un analizador léxico así que mi cerebro ha empezado a investigar y funcionar.

La función de un analizador léxico es extraer tokens de un texto. Es decir, palabras según un criterio o patrón de búsqueda.
Por ejemplo:
Tienes un texto con un montón de mierda y quieres extraer los correos electrónicos. Necesitas un analizador léxico.
Sirve por ejemplo para extraer datos de archivos grandes y clasificarlos. Imagina que tienes un archivo con un montón de datos de personas: Nombre, apellidos, dni, fecha de nacimiento, correo electrónico, etc. Un analizador léxico te lo puede sacar todo muy rápido.
También se necesita para los compiladores de lenguajes de programación.

El que os voy a dejar a continuación no es muy sofisticado porque lo he hecho para la uni sin calentarme mucho la cabeza. He utilizado flex y C. Flex busca los tokens mediante expresiones regulares (Ahora lo veréis).

Se puede mejorar, y mucho, para que busque los correos entre texto seguido (que no esté separado por espacios ni saltos de línea), que busque los nombres de los remitentes...

Os dejo el vídeo de un pancho para que os instaléis lo que necesitáis: Tutorial-Panchito

Aquí os dejo mi código:

 

Anon

🏴‍☠️
Owner
Staff
Moderador
Paladín de Nodo
Jinete de Nodo
Burgués de Nodo
Noderador
Nodero
Noder
Muevo post a programación (y)