CREA

CREA, versión anotada

La actual versión del CREA anotado, la 0.3, publicada en marzo de 2021, cuenta con más de  111 000 documentos que suman más de 122.500.000 millones de formas, procedentes de textos escritos o producidos entre 1975 y 2000 en todos los países hispánicos. Se ha aplicado al CREA el sistema de codificación y anotación desarrollado para CORPES: la versión anotada de CREA que ahora se publica permite la consulta por lemas, formas y categorías gramaticales.

El motor de búsqueda soporta la consulta en tiempo real sin necesidad de establecer restricciones de formas o lemas. Por lo que respecta al bloque de ficción (novelas, relatos, obras de teatro) las formas del CREA anotado sobrepasan los 30 millones, mientras que las contenidas en textos de libros de no ficción y prensa (ciencias sociales, salud, política, artes, tecnología…) se acercan a los 102 millones. Los textos procedentes de libros suponen algo más de 72 millones de formas; la prensa está representada con unos 58 millones. Dos millones más provienen de materiales de tipo misceláneo (propaganda, folletos, exámenes...).

Cronológicamente, el mayor peso recae en el segmento más moderno, 1996-2000, con más de 46 millones de formas. Casi 33 millones corresponden a los años 1991-1995, más de 23 millones al segmento 1986-1990, cerca de 16 millones representan a 1981-1985 y, finalmente, casi 14 millones corresponden a 1975-1980.

cerrar

Buscador general de la RAE