CREA

CREA, versión anotada

La primera versión del CREA anotado, la 0.1, publicada el 18 de noviembre de 2015, cuenta con 111 220 documentos, que suman más de 126 millones de formas, procedentes de textos escritos o producidos entre 1975 y 2000 en todos los países hispánicos.

Se ha aplicado al CREA el sistema de codificación y anotación desarrollado para CORPES: la versión anotada de CREA que ahora se publica permite la consulta por lemas, formas y categorías gramaticales. El motor de búsqueda soporta la consulta en tiempo real sin necesidad de establecer restricciones de formas o lemas.

Por lo que respecta al bloque de ficción (novelas, relatos, obras de teatro) las formas del CREA anotado sobrepasan los 29 millones, mientras que las contenidas en textos de libros de no ficción y prensa (ciencias sociales, salud, política, artes, tecnología...) se acercan a los 97 millones. 

Los textos procedentes de libros suponen algo más de 68 millones de formas; la prensa está representada con unos 56 millones. Dos millones más provienen de materiales de tipo misceláneo (propaganda, folletos, exámenes...).

Cronológicamente, el mayor peso recae en el segmento más moderno, 1995-2000, con más de 54 millones de formas. Casi 26 millones corresponden a los años 1990-1994, más de 22 millones al segmento 1985-1989, cerca de 18 millones representan a 1980-1984 y, finalmente, casi 10 millones corresponden a 1975-1979.

cerrar

Buscador general de la RAE