|
El banco de datos de la Real Academia Española está constituido por dos grandes corpus textuales: el Corpus de Referencia del Español Actual (CREA, escrito y oral) y el Corpus Diacrónico del Español (CORDE). Ambos conjuntos son complementarios, de modo que el CREA contiene textos desde 1975 a 2004, mientras que el CORDE incluye textos de todos los períodos anteriores. El carácter integrado de los dos corpus se refleja en la previsión de que los textos pertenecientes a períodos que, por el paso del tiempo, vayan quedando fuera del ámbito del CREA, pasarán a formar parte del CORDE.
En la actualidad, el CREA está formado por algo más de 154 millones de formas correspondientes a la parte escrita y algo más de ocho millones en la parte oral. El CORDE alcanza cerca de 250 millones de formas. A través de la aplicación de concordancias, los investigadores tienen a su disposición alrededor de 400 millones de formas de todos los períodos del español, tanto de España como de América, lo que constituye, sin duda, el recurso más importante del que se haya podido disponer jamás para el estudio de esta lengua.
La nómina de autores y obras muestra las estadísticas generales del banco de datos, lo que permite valorar en todo su alcance los resultados obtenidos en la consulta a ambos corpus. Además, a través de esa aplicación específica, obtenemos los datos reales sobre los que se realiza cada consulta, bien sea de carácter general, bien combinando distintos criterios de selección, para obtener los datos estadísticos de la consulta realizada: número total de textos y su distribución geográfica, cronológica o temática. Se muestra también la referencia bibliográfica completa de cada uno de los textos, el criterio que ha servido para su clasificación cronológica en el banco de datos, la clasificación temática y el número de palabras de cada texto.
Codificación
A todos los materiales procesados tanto en el CREA como en el CORDE se les ha añadido una serie de marcas textuales, establecidas según el estándar internacional SGML (Standard General Markup Language), de acuerdo con las recomendaciones de la TEI (Text Encoding Initiative), que facilitan la recuperación de la información y el intercambio de textos con otros corpus, y garantizan la independencia de sistemas operativos y programas CREA CORDE Nómina de autores y obras
Colaboraciones
La Real Academia Española manifiesta su profunda gratitud a todas las personas e instituciones que han colaborado en la realización del banco de datos del español, tanto a los que han cedido materiales de forma desinteresada, como a aquellos que han participado activamente con su trabajo.
- Arte Gráfico Editorial Argentino - Asociación de Lingüística y Filología de América Latina (ALFAL) - Biblioteca Nacional (Madrid) - Centro de Investigaciones Lingüísticas de la Universidad de Salamanca - Congreso de los Diputados (Madrid) - Diario La Información (Texas) - Grupo PRISA - Hispanic Seminary of Medieval Studies (University of Wisconsin-Madison) - Instituto Tecnológico de Estudios Superiores de Monterrey (México) - Institut Universitari de Lingüística Aplicada (IULA) (Universitat Pompeu Fabra) - Planeta - Prensa Española, S. A. - Radio Nacional - Radio Televisión Española - Real Academia de Ciencias Exactas, Físicas y Naturales - Revista Criticón (Universitè de Toulouse) - The Aarhus School of Business (Dinamarca) - Universidad Autónoma de Barcelona - Universidad Autónoma de Madrid - Universidad Central de Venezuela - Universidad Complutense de Madrid - Universidad de Alcalá de Henares - Universidad de Alicante - Universidad de Castilla-La Mancha - Universidad de Gotemburgo - Universidad de las Islas Baleares - Universidad de Los Andes - Universidad de Murcia - Universidad de Oviedo - Universidad de Salamanca - Universidad de Santiago de Compostela - Universidad de Valencia - Universidad de Deusto - Universidad de Sevilla - Universidad de Zaragoza - Universidad de Jaén - Universidad de Las Palmas de Gran Canaria - Universidad de Navarra - Universidad de Valladolid - Biblioteca Virtual Miguel de Cervantes
|