Resumen Son fascinantes los avances en el procesamiento del lenguaje natural (NLP –Natural Language Processing–) a partir de las tecnologías de aprendizaje profundo (DL –Deep Learning–), incluyendo generadores de texto natural que escriben ensayos, artículos técnicos, programas de computador y hasta poesía, a partir de especificaciones muy genéricas. Pero estas aplicaciones sólo generan muestras de distribuciones de probabilidad detalladamente construidas: ¡No entienden de qué están hablando a pesar de la alta calidad de los textos que producen! Paralelamente, las ciencias cognitivas se han construido desde la psicología, la neurología, la lingüística, la inteligencia artificial, la filosofía y otras disciplinas, con el fin de acercarnos a la comprensión de la cognición humana. En este contexto, el lenguaje parece ser el producto evolutivo de un sistema dinámico muy complejo, que evolucionó a partir de las estructuras neuronales para la coordinación motriz y sensorial. Si usamos el lenguaje es porque él nos permite expresar los resultados de nuestra experiencia sensorial y motriz con el mundo: Nosotros si comprendemos de qué estamos hablando porque hablamos sobre nuestra propia experiencia y no desde el muestreo de distribuciones probabilísticas. Un agente cognitivo con capacidades lingüísticas no procesa el lenguaje desde las estadísticas de sus símbolos sino desde su semántica: El agente usa el lenguaje para hablar de la realidad que él experimenta pues, al interactuar con su ambiente, es capaz de entender su representación interna y conectar conceptos con símbolos (“symbol grounding” y “embodied cognition”). En esta charla presentamos la construcción de un agente que adquiere conceptos fundamentados en la forma, el color y algunas relaciones espaciales entre objetos en una imagen. El agente construye conceptos de manera no supervisada y asigna etiquetas lingüísticas a sus conceptos de manera supervisada. Para esto, integramos información visual y auditiva en una “corteza cerebral” (mapa auto-organizado de Kohonen) y los conceptos topográficos que se forman de manera no supervisada se asocian con oraciones de cinco palabras que describen el escenario (sustantivo-adjetivo-adverbio-
Invitados Marco Aurelio Alzate Monroy: Ingeniero electrónico de la Universidad Distrital, Magíster en ingeniería eléctrica de la Universidad de los Andes y Doctor en Ingeniería de la Universidad de los Andes. Ha sido ingeniero de desarrollo en CIEL Ingeniería, investigador del Instituto Tecnológico de Electrónica y Comunicaciones (ITEC – Telecom), asistente de investigación en el Departamento de Ingeniería Eléctrica y de Computadores de la Universidad de Maryland y científico investigador en el Laboratorio de Sistemas de Información de la Universidad del Sur de la Florida. Actualmente es profesor titular de la Facultad de Ingeniería de la Universidad Distrital y colabora esporádicamente con cursos de posgrado en la Universidad Javeriana y la Universidad de los Andes. Miembro senior del IEEE y de sus sociedades de comunicaciones y de procesamiento de señales. Vivian Herrera Ardila: Ingeniería electrónica de la Universidad Distrital, donde adelanta actualmente sus estudios de Maestría en Ciencias de la Información y las Comunicaciones. Con experiencia en el desarrollo de proyectos tecnológicos para el sector académico y laboratorios de investigación, su trabajo de maestría se orienta al diseño de agentes cognitivos con capacidades lingüísticas para ingeniería de sistemas complejos, en donde también aplica sus intereses y estudios básicos en filología e idiomas, literatura y ciencias naturales. |
Sistema Integrado de Comunicaciones
Fuente de información:
Licenciatura en Física
Facultad de Ciencias y Educación
Universidad Distrital Francisco José de Caldas