Asunción Gómez-Pérez (foto: RAE)

CURSOS DE VERANO DE LA UNIVERSIDAD INTERNACIONAL MENÉNDEZ PELAYO

«Los datos multilingües, su ontología y el español»

8 de Julio de 2022

La Real Academia Española (RAE) organizó las jornadas sobre el español y la inteligencia artificial, enmarcadas en los cursos de verano de la Universidad Internacional Menéndez Pelayo (UIMP). La Academia, que ha ideado y lidera el proyecto LEIA (Lengua Española e Inteligencia Artificial), reunió a expertos y estudiosos en la materia con el fin de conocer cuál es el estado de nuestro idioma en la IA.  

Durante la tarde de la primera jornada, tuvo lugar la conferencia «Los datos multilingües, su ontología y el español», a cargo de Asunción Gómez-Pérez, vicerrectora de Investigación, Innovación y Doctorado, catedrática de la Universidad Politécnica de Madrid y académica electa de la RAE.

Empezó con una breve introducción a la inteligencia artificial enfatizando la importancia de los datos multilingües en múltiples dominios y en la toma de decisiones. En contraposición a los avances basados en modelos del lenguaje que utilizan una distribución probabilística, en esta ponencia presentó los aspectos claves en la representación computacional del conocimiento utilizando modelos simbólicos (ontologías) y su importancia en el razonamiento y en la toma de decisiones.

«Las ontologías, como representaciones del conocimiento computacional, están muy próximas a las tareas desarrolladas en la Academia. Si bien un diccionario recoge las palabras de una lengua, acompañadas de su definición, equivalencia o explicación en un lenguaje natural que los seres humanos leemos y entendemos, las ontologías, en analogía con los diccionarios, recogen los conceptos de un dominio, los define en un lenguaje computacional, utilizando para ello palabras de un lenguaje natural», detalló.

Las ontologías proporcionan semántica a los datos de un dominio concreto (por ejemplo, salud, energía, etc.) y forman una nube de datos enlazados. «Permiten a los sistemas inteligentes agregar de forma consistente datos de fuentes heterogéneas y multilingües, a la vez que deducir nuevos datos a partir de los ya existentes en diferentes idiomas», señaló la catedrática.

Asimismo, Gómez-Pérez destacó la importancia de transformar la información lingüística de las palabras recogidas en recursos lingüísticos de calidad, principalmente lexicones, tesauros y diccionarios, con distintos grados de digitalización y en diferentes idiomas al formato RDF. De esta forma, se construye un gran grafo conectado de conocimiento lingüístico multilingüe de grandes beneficios.

Galería de fotos

Los datos multilingües, su ontología y el español
cerrar

Buscador general de la RAE