Otras miradas

Hemos estudiado medio millón de palabras en busca de las leyes lingüísticas universales

Ivan González Torre

Investigador postdoctoral, Universidad Politécnica de Madrid (UPM)

Marijus Auruskevicius / Shutterstock
Marijus Auruskevicius / Shutterstock

¿Existen leyes que gobiernen cómo nos comunicamos, cómo hablamos y escribimos? ¿Cuáles son estas leyes y cuál es su origen?

Hoy en día existen más de 7 000 lenguas en el mundo, de las cuales 2 500 se encuentran en peligro de extinción. Todas ellas suponen una pequeña parte de las que han existido. Algunas han dejado su legado a través de la escritura; la mayoría, desaparecieron para siempre.

Cada una de esas lenguas es una solución a la necesidad que tienen los humanos de comunicarse. Surgen espontáneamente y han ido evolucionando naturalmente con el uso, sin necesidad de que alguien imponga unas normas. Es por ello que se denominan "lenguas naturales".

¿Tienen algo en común el euskera y el chino?

Lo cierto es que sí, y también lo tienen con el español, el suajili y el árabe. Todas las lenguas naturales guardan en común ciertos patrones. Si no fuera así, ¿por que iba a ser tan sencillo aprender cualquier lengua cuando somos pequeños? La existencia de estos patrones comunes ha sido objeto de investigación durante décadas. Los científicos consideran que comprenderlos nos ayudaría a entender mejor la complejidad del lenguaje y el cerebro.

Uno de estos patrones universales son las denominadas "leyes lingüísticas". Estas leyes se han encontrado en todas las lenguas y niveles lingüísticos estudiados: desde los fonemas hasta las frases, pasando por las sílabas o palabras.

Un ejemplo de ley lingüística es la ley de Zipf de brevedad. Esta predice que las palabras más frecuentes son más cortas y que las palabras más largas se utilizan menos. De este patrón, y de otros como la ley de Menzerath-Altmann, la ley de Herdan-Heaps y la ley de Zipf, es de lo que hablaremos más adelante.

¿Cómo pensamos el lenguaje?

Probablemente el lector se habrá planteado alguna vez cómo aprendemos a combinar elementos lingüísticos para comunicarnos. O si nuestro idioma afecta a la forma en que pensamos. O si nuestros pensamientos tienen forma de palabras o frases.

Una hipótesis extendida entre los lingüistas, propuesta por Noam Chomsky, sostiene que los pensamientos se producen en una especie de lenguaje mental. Según esta teoría, este lenguaje tiene unas reglas innatas y los textos escritos serían su reflejo. Siguiendo esta linea de pensamiento, las leyes lingüísticas observadas en textos escritos representarían la complejidad del lenguaje mental. Este concepto es a lo que se denomina "teoría simbólica del lenguaje".

Hasta hace muy poco, la mayor parte de la investigación relacionada con el lenguaje se realizaba en textos escritos. Era muy difícil procesar grabaciones de audio y analizar la señal debido a la ausencia de ordenadores. Probablemente por este motivo la teoría simbólica del lenguaje se vio influenciada por la escritura.

Sin embargo, al plasmar en letras las palabras, se pasa por alto la realidad oral del lenguaje. Una misma palabra puede ser pronunciada de formas muy distintas, con diversas entonaciones y duraciones. Toda esta variabilidad es fuertemente comunicativa, y nos sirve para expresar estados de ánimo, hacer bromas y expresar nuestros sentimientos. Esta complejidad del habla se pierde cuando se transcribe una conversación. Precisamente las leyes lingüísticas se han estudiado en textos escritos.

Si la hipótesis simbólica del lenguaje fuera cierta, al estudiar las leyes lingüísticas directamente en la voz, toda esta variabilidad introduciría distorsiones que nos impedirían observarlas.

Analizando cómo hablamos

En dos estudios recientes (Royal Society y Entropy) hemos observado justamente lo contrario: las leyes lingüísticas se observan mejor en la voz que en textos escritos. Este hecho no puede ser explicado por la teoría simbólica del lenguaje.

Para ello, seis investigadores de cinco universidades hemos llevado a cabo un estudio masivo sobre el lenguaje. Hemos analizado todos los fonemas, palabras y frases en 40 conversaciones (en inglés) de una hora cada una. Esto hace un total de casi 1 millón de fonemas y medio millón de palabras. Este análisis se replicó posteriormente para el español y el catalán.

Hemos estudiado las leyes lingüísticas, por un lado, en la transcripción de las conversaciones (lenguaje simbólico) y, por otro lado, directamente sobre la señal de voz (oralidad). Para estudiar la ley de brevedad, por ejemplo, hemos contado cuantas veces aparece cada palabra y con que duración. Para el lenguaje simbólico la duración de una palabra se mide contando el número de letras, y siempre que aparezca tendrá la misma longitud. Esto no ocurre así cuando hablamos. Un "sí" afirmativo lo decimos en décimas de segundo, pero para un "sí" dubitativo empleamos hasta 10 veces más.

Cuando comparamos las leyes lingüísticas en su versión simbólica con la versión hablada, descubrimos que en estas últimas los patrones están presentes de forma mucho más evidente. Es más, para varias de esas leyes hemos mostrado que la versión simbólica es un reflejo incompleto de la versión física. Aunque aparecen en la escritura, lo hacen simplemente por el hecho de que la escritura es una simplificación del habla.

Hacia una teoría completa del lenguaje

Durante el último siglo la ciencia ha avanzado enormemente gracias a la alta especialización de la investigación. Sin embargo, esto ha creado otros problemas. Hay expertos en la sinapsis de las neuronas y otros que investigan cómo viaja el sonido. Ambos probablemente nunca coincidan, ni tampoco leerán el trabajo del otro. Ambos están investigando sobre el lenguaje.

El lenguaje es un mecanismo altamente complejo en el que todas las piezas engranan perfectamente para que funcione. Probablemente, los próximos descubrimientos lingüísticos vendrán de la mano de equipos altamente transdisciplinares que abarquen aspectos fisiológicos, cognitivos, físicos, evolutivos y lingüísticos, entre muchos otros.


Este artículo ha sido publicado originalmente en The Conversation

The Conversation