Firma del convenio entre la RAE y SESIAD.

Convenio con la Secretaría de Estado para la Sociedad de la Información y la Agenda Digital

20 de Diciembre de 2017

• Para la construcción de un corpus textual que sirva de base tecnológica

La Real Academia Española (RAE) y la Secretaría de Estado para la Sociedad de la Información y la Agenda Digital (SESIAD) del Ministerio de Energía, Turismo y Agenda Digital han suscrito hoy un convenio de colaboración para « la construcción de un corpus textual de español actual que sirva de base y referencia para la tecnología cuyo desarrollo pretende fomentar el Plan de Impulso de las Tecnologías del Lenguaje».

El acuerdo, cuya firma ha tenido lugar este mediodía en la sede académica, lo han suscrito Darío Villanueva, director de la RAE, y José María Lassalle Ruiz, secretario de Estado para la Sociedad de la Información y la Agenda Digital. Al acto también han asistido los académicos Guillermo Rojo, José María Merino, José Manuel Blecua, Pedro Álvarez de Miranda y Paz Battaner, además de los responsables de los equipos de trabajo implicados en el proyecto de ambas instituciones.

De acuerdo con el texto del convenio, «la construcción de este corpus textual contempla su diseño, adquisición y marcación, así como la gestión de derechos y la documentación y preparación para su acceso y posterior distribución». También está prevista «la anotación semiautomática con revisión manual de un subcorpus del corpus de referencia que permita la construcción y evaluación de procesadores básicos».

Las actuaciones previstas por el convenio para la construcción y anotación del corpus textual de español actual son las siguientes: creación de un grupo de seguimiento; gestión de derechos; diseño del corpus; adquisición de corpus; preprocesamiento morfosintáctico y sintáctico automático del corpus; creación de un entorno de revisión de la anotación del corpus; revisión manual del preprocesamiento automático; explotación; puesta en producción del acceso público, y desarrollo de un plan de comunicación y promoción.

CONVENIO MARCO

En mayo de 2016 la RAE y la SESIAD suscribieron un convenio marco de colaboración para fijar las bases de la cooperación entre ambas instituciones en la implementación del Plan de Impulso de las Tecnologías del Lenguaje, aprobado el 7 de octubre del 2013, en el marco de la Agenda Digital para España. El plan tiene un alcance temporal de cinco años y tiene por objeto fomentar el desarrollo del sector del procesamiento del lenguaje natural y la traducción automática en España.

El Plan de Impulso de las Tecnologías del Lenguaje se articula en torno a cuatro ejes: el desarrollo de infraestructuras lingüísticas, el impulso de la industria de las tecnologías del lenguaje, las Administraciones públicas como impulsoras de la industria del lenguaje y un eje destinado a proyectos faro.

De acuerdo con el convenio marco, la SESIAD «colaborará en el desarrollo e impulso de estándares aplicados a recursos lingüísticos (anotaciones lingüísticas, estructura de recursos, metadatos, etc.) y promoverá el desarrollo de recursos lingüísticos estandarizados en áreas de trabajo propias de la Real Academia Española».

Por su parte, la RAE trabajará «en el diseño de la arquitectura o planta para el desarrollo de infraestructuras lingüísticas de interés para el Plan de Impulso de las Tecnologías del Lenguaje, participará en el desarrollo de herramientas abiertas para la creación y mantenimiento de recursos lingüísticos e incrementará el número de datos abiertos sobre recursos lingüísticos de la institución de interés industrial y académico».

Por ello, ambas instituciones han concretado el convenio marco en la construcción de un corpus de español actual que sirva de base y referencia para la tecnología cuyo desarrollo pretende fomentar el Plan de Impulso de las Tecnologías del Lenguaje.

Galería de fotos

José María Lasalle y Darío Villanueva tras la firma del convenio.

Firma del convenio entre la RAE y SESIAD.

cerrar

Buscador general de la RAE