Real Academia Española

   

Codificación de CORPES

Codificación de CORPES

Los textos que forman el CORPES incorporan un sistema de codificación que refleja su carácter con respecto a cada uno de los parámetros descritos en el punto anterior. De ese modo, la aplicación de búsqueda puede recuperar las formas correspondientes a los factores de interés para quien hace la consulta: búsqueda de un lema o forma en textos de prensa, en textos de no ficción procedentes de la zona andina, novelas argentinas de determinado año, etc.

El sistema de codificación, basado en el esquema propuesto por la Text Encoding Initiative, ha sido diseñado especialmente para el CORPES y desarrollado en el lenguaje de codificación XML (eXtensible Markup Language).

La codificación de los textos, diseñada en función de los parámetros utilizados en su construcción, permite la selección del subconjunto con que se quiere trabajar en cada momento: solo textos procedentes de un país, de un cierto período o tipo, etc.; y, por supuesto, todas sus combinaciones: documentación de una determinada forma o grupo de formas en noticias periodísticas referentes a economía y finanzas publicadas en la prensa mexicana entre 2008 y 2011 es una consulta posible en el CORPES. Por último, las referencias que acompañan a los fragmentos devueltos permiten conocer siempre el texto del cual surgen los datos, con lo que los resultados obtenidos pueden ser debidamente valorados desde el punto de vista cuantitativo y cualitativo.

Con el patrocinio de

Diccionarios

UNIDRAE
Envíe las propuestas relacionadas con el Diccionario de la lengua española a la Unidad Interactiva.

Consultas lingüísticas

El Departamento de «Español al día» resuelve aquí las dudas de los hablantes sobre el uso correcto del español.

Con el patrocinio de

Tuits de @RAEinforma

Formulario de búsqueda