Codificación de CORPES

Los textos que forman el CORPES XXI incorporan un sistema de codificación que refleja su carácter con respecto a cada uno de los parámetros descritos aquí. De ese modo, la aplicación de búsqueda puede recuperar las formas correspondientes a los factores de interés para quien hace la consulta: búsqueda de un lema o forma en textos de prensa, en textos de no ficción procedentes de la zona andina, novelas argentinas de determinado año, etc.

Los sistemas de codificación (escrito y oral), basados en el esquema propuesto por la Text Encoding Initiative, han sido diseñados especialmente para el CORPES y desarrollados en el lenguaje de codificación XML (eXtensible Markup Language).

La codificación de los textos, diseñada en función de los parámetros utilizados en su construcción, permite la selección del subconjunto con que se quiere trabajar en cada momento: solo textos procedentes de un país, de un cierto período o tipo, etc.; y, por supuesto, todas sus combinaciones: documentación de una determinada forma o grupo de formas en noticias periodísticas referentes a economía y finanzas publicadas en la prensa mexicana entre 2008 y 2011 es una consulta posible en el CORPES. Por último, las referencias que acompañan a los fragmentos devueltos permiten conocer siempre el texto del cual surgen los datos, con lo que los resultados obtenidos pueden ser debidamente valorados desde el punto de vista cuantitativo y cualitativo.

cerrar

Buscador general de la RAE