El CORPES XXI es un proyecto panhispánico

El CORPES XXI ya se puede consultar en la Red

10 de Diciembre de 2013

El Corpus del Español del Siglo XXI (CORPES XXI), uno de los proyectos más ambiciosos de la RAE y de la Asociación de Academias de la Lengua Española (ASALE) ya está disponible para su consulta en Internet, en versión beta. Este nuevo recurso cuenta con el patrocinio de Banco Santander.

En la misma línea seguida en 1998, cuando decidió dar acceso abierto a las primeras versiones del CREA y el CORDE, la institución ha considerado conveniente hacer pública la versión provisional 0.6 del Corpus del Español del Siglo XXI. El académico y director del CORPES, Guillermo Rojo, presentó el proyecto y anunció su publicación el pasado 22 de octubre, en el VI Congreso Internacional de la Lengua, en Panamá.

La versión 0.6 contiene 158 031 738 formas ortográficas distribuidas de acuerdo con los parámetros de su diseño y anotadas lingüísticamente a través de procedimientos automáticos desarrollados en la Real Academia Española.

Se trata de un recurso en construcción y, por tanto, con desequilibrios y desajustes lógicos que irán desapareciendo en las versiones posteriores.

El sistema de codificación ha sido diseñado especialmente para el CORPES. También se encuentra a disposición de las personas interesadas la Descripción del sistema de codificación. Libros y prensa (Madrid: Real Academia Española, 2013) que pretende servir como referencia para la codificación de textos en español.

La Real Academia Española agradece los comentarios, sugerencias y críticas, sobre la versión 0.6 del CORPES, que ayudarán a mejorar las posteriores.

«Real Academia Española 2.0». Jot Down, 11 de diciembre de 2013.

cerrar

Buscador general de la RAE