
Los textos orales del CORPES
9 de Febrero de 2023La versión actual del CORPES, la 0.99, cuenta con más de 357 000 documentos, que suman algo más de 381 millones de formas ortográficas.
Más de cuatro millones y medio de ellas proceden del parámetro oral. En esta entrada vamos a explicar algo más sobre las consultas que se pueden realizar sobre el subcorpus oral.
- Para realizar consultas solo en el subcorpus oral, debe seleccionar SUBCORPUS → Medio → Oral.

- Algunos archivos ofrecen el sonido alineado correspondiente a la transcripción:

- En otros es posible la descarga del archivo de audio, además de la visualización del vídeo.

- La anotación morfosintáctica, a su vez, permite la consulta aún más refinada: por ejemplo, por categoría gramatical según grupos de edad o nivel de estudios.

- Los datos que proporciona la consulta al corpus oral mediante la combinación de todos los criterios (léxicos y gramaticales, cronológico, geográfico, sexo, grupo de edad o nivel de estudios) resultan de especial interés para la investigación lingüística. Presentamos a continuación algunos ejemplos:
Uso de preposiciones y conjunciones por nivel de estudios
Construcción de la consulta:
- Clase de palabra: preposición/conjunción
- Subcorpus: Medio → Oral
- Nivel de estudios: alto/medio/bajo
Datos obtenidos (frecuencia normalizada, casos por millón):
Nivel de estudios |
Preposiciones |
Conjunciones |
Superior |
152 744,64 |
78 613,50 |
Medio |
114 677,35 |
112 500,53 |
Bajo |
102 920,95 |
115 073,56 |
Trasladados a un gráfico:

Otros ejemplos:
- Uso de categorías gramaticales por franja de edad:

- Un poco más complicado, combinando además con el parámetro geográfico (zonas lingüísticas): Adjetivo / Mujer / Zona lingüística

Intente realizar un gráfico similar seleccionando por edad, clase de palabra y país. ¿Nos envía sus resultados?