El procesamiento del lenguaje natural (PLN) permite a las máquinas comprender y generar texto de manera coherente. En este módulo, se estudian conceptos clave como la tokenización, la lematización y el análisis sintáctico, así como la evolución de los modelos de lenguaje desde enfoques estadísticos hasta arquitecturas basadas en Transformers.
Se presentan aplicaciones prácticas en traducción automática, análisis de sentimientos, generación de texto y búsqueda en documentos mediante lenguaje natural. Se abordan estrategias para la redacción efectiva de contenido automatizado y la integración de modelos LLM en entornos empresariales.
El módulo concluye con una práctica en la que los estudiantes desarrollan un asistente virtual basado en GPT, explorando su implementación en diversas tareas.
Temario:
- Introducción de los principios de aprendizaje automático y redes neuronales.
- Historial PLN.
- Arquitectura básica y componentes de un LLM.
- Funcionamiento: tokenización, lematización, y análisis sintáctico.
- Aplicaciones: traducción automática, análisis de sentimientos, generación de texto, generación de resumen.
- Funciones avanzadas:
- Búsqueda en documentos usando lenguaje humano.
- Estrategias para redactar correos efectivos y generar contenido creativo y técnico.
- Seguridad en los LLMs.
- Integración LLMs con tareas externas.
Práctica:
Creación de un asistente virtual usando GPT.