Publicado el 13 de agosto del 2021 - Actualizado el 18 de agosto del 2021

Resumen

Son fascinantes los avances en el procesamiento del lenguaje natural (NLP –Natural Language Processing–) a partir de las tecnologías de aprendizaje profundo (DL –Deep Learning–), incluyendo generadores de texto natural que escriben ensayos, artículos técnicos, programas de computador y hasta poesía, a partir de especificaciones muy genéricas. Pero estas aplicaciones sólo generan muestras de distribuciones de probabilidad detalladamente construidas: ¡No entienden de qué están hablando a pesar de la alta calidad de los textos que producen! Paralelamente, las ciencias cognitivas se han construido desde la psicología, la neurología, la lingüística, la inteligencia artificial, la filosofía y otras disciplinas, con el fin de acercarnos a la comprensión de la cognición humana. En este contexto, el lenguaje parece ser el producto evolutivo de un sistema dinámico muy complejo, que evolucionó a partir de las estructuras neuronales para la coordinación motriz y sensorial. Si usamos el lenguaje es porque él nos permite expresar los resultados de nuestra experiencia sensorial y motriz con el mundo: Nosotros si comprendemos de qué estamos hablando porque hablamos sobre nuestra propia experiencia y no desde el muestreo de distribuciones probabilísticas. 

Un agente cognitivo con capacidades lingüísticas no procesa el lenguaje desde las estadísticas de sus símbolos sino desde su semántica: El agente usa el lenguaje para hablar de la realidad que él experimenta pues, al interactuar con su ambiente, es capaz de entender su representación interna y conectar conceptos con símbolos  (“symbol grounding” y “embodied cognition”).

 En esta charla presentamos la construcción de un agente que adquiere conceptos fundamentados en la forma, el color y algunas relaciones espaciales entre objetos en una imagen. El agente construye conceptos de manera no supervisada y asigna etiquetas lingüísticas a sus conceptos de manera supervisada. Para esto, integramos información visual y auditiva en una “corteza cerebral” (mapa auto-organizado de Kohonen) y los conceptos topográficos que se forman de manera no supervisada se asocian con oraciones de cinco palabras que describen el escenario (sustantivo-adjetivo-adverbio-sustantivo-adjetivo -"triángulo azul sobre cuadro verde"). Otro mapa forma un concepto lingüístico topográfico asociado con la escena observada. Estas dos representaciones se asociarán en un mecanismo de inferencia que le permite al agente integrar información visual y auditiva para la expresión y el raciocinio lingüísticos que le permita decidir qué acciones tomar para modificar ventajosamente su entorno en lo que será un nivel superior de complejidad entre agentes cognitivos con capacidades lingüísticas. En efecto, la magia se completa cuando, con el lenguaje, logramos que un agente aprenda de la experiencia de otro agente y, de esa interacción, emerjan nuevas complejidades.

 

Invitados

Marco Aurelio Alzate Monroy: Ingeniero electrónico de la Universidad Distrital, Magíster en ingeniería eléctrica de la Universidad de los Andes y Doctor en Ingeniería de la Universidad de los Andes. Ha sido ingeniero de desarrollo en CIEL Ingeniería, investigador del Instituto Tecnológico de Electrónica y Comunicaciones (ITEC – Telecom), asistente de investigación en el Departamento de Ingeniería Eléctrica y de Computadores de la Universidad de Maryland y científico investigador en el Laboratorio de Sistemas de Información de la Universidad del Sur de la Florida. Actualmente es profesor titular de la Facultad de Ingeniería de la Universidad Distrital y colabora esporádicamente con cursos de posgrado en la Universidad Javeriana y la Universidad de los Andes. Miembro senior del IEEE y de sus sociedades de comunicaciones y de procesamiento de señales.

Vivian Herrera Ardila:  Ingeniería electrónica de la Universidad Distrital, donde adelanta actualmente sus estudios de Maestría en Ciencias de la Información y las Comunicaciones. Con experiencia en el desarrollo de proyectos tecnológicos para el sector académico y laboratorios de investigación, su trabajo de maestría se orienta al diseño de agentes cognitivos con capacidades lingüísticas para ingeniería de sistemas complejos, en donde también aplica sus intereses y estudios básicos en filología e idiomas, literatura y ciencias naturales.

Sistema Integrado de Comunicaciones
Fuente de información: Licenciatura en Física
Facultad de Ciencias y Educación
Universidad Distrital Francisco José de Caldas