Otras miradas

Big data para analizar la brecha de género en la prensa

Maite Taboada

Profesora de Lingüística en la Universidad Simon Fraser.

Maite Taboada

Investigadora postdoctoral en la Universidad Simon Fraser

Fatemeh Torabi Asr

¿Arrimadas o Rivera? ¿Calvo o Sánchez? ¿De quién vamos a oír más durante esta campaña electoral? En otras palabras, ¿cuántas mujeres y cuántos hombres se van a ver citados en las páginas de la prensa nacional durante la próxima campaña?

Para contestar a una pregunta similar, y utilizando la lingüística computacional hemos creado el Gender Gap Tracker que permite analizar cómo y en qué medida los medios de comunicación canadienses dan cabida a las voces de las mujeres. Esta herramienta recaba información sobre los medios de comunicación en Canadá. Animamos a los lingüistas españoles, que los hay muchos y muy buenos, a que desarrollen herramientas parecidas en los medios nacionales. Los estudios cualitativos realizados hasta la fecha arrojan una realidad muy parecida a la canadiense.

Con la ayuda del Gender Gap Tracker, en colaboración con la organización sin ánimo de lucro Informed Opinions, y con el apoyo de la Universidad Simon Fraser, hemos descargado y analizado miles de artículos publicados en medios de comunicación canadienses. El análisis lingüístico mediante técnicas de big data nos permite identificar las voces femeninas mencionadas y citadas en los medios de comunicación, proporcionando un desglose preciso de cuál es la distribución de las fuentes por género.

Minería de texto en aras del bien social

La lingüística computacional, y el área relacionada de la minería de textos, han demostrado su capacidad para lograr cambios sociales.

El análisis de grabaciones de las cámaras que portan los policías en EE.UU. ha demostrado que existe disparidad racial cuando paran a ciudadanos por violaciones de tráfico. Los policías utilizan un lenguaje menos respetuoso con ciudadanos negros que con blancos, independientemente de la raza del o de la policía o de la gravedad de la infracción. Teniendo en cuenta los resultados de estas investigaciones, el Departamento de Policía de Oakland en EE.UU. ha modificado sus módulos de formación, y otros departamentos de policía en este país están también considerando iniciativas similares.

La traducción automática, otra aplicación de la lingüística computacional, se ha utilizado en situaciones de crisis. El sistema de traducción del inglés al lenguaje criollo de Haití fue desarrollado por Microsoft días después del terremoto de 2010, proporcionando una ayuda inestimable a los servicios de rescate y primeros auxilios.

La lingüística computacional se utiliza asimismo para detectar y superar la dislexia, así como para detectar brotes epidémicos en Canadá y hacer seguimientos de posibles incendios en Australia.

Descarga y organización de datos

El Gender Gap Tracker descarga y organiza datos de todos los artículos publicados en los principales medios de comunicación nacionales de Canadá. Una vez obtenidos los datos, utilizamos la técnica de reconocimiento de entidades para compilar una lista de las personas mencionadas en cada artículo, así como de las fuentes que originan dichas menciones. Para evitar contar a la misma persona más de una vez, llevamos a cabo un segundo nivel de análisis que enlaza las diferentes menciones. Finalmente, asignamos el género a que pertenece cada persona mencionada o citada en el artículo.

El proceso de identificación de género contempla tres categorías: femenino, masculino o desconocido. La categoría de desconocido incluye casos en los que hay ambigüedad en el nombre (¿Es Alex un hombre o una mujer?) y casos en los que no se puede identificar el género porque la fuente es una organización (por ejemplo. "La policía dice que han arrestado a un sospechoso").

Big data para analizar la brecha de género en la prensa
Ratio de hombres y mujeres utilizados como fuentes en la prensa canadiense.

El sistema analiza datos de medios de comunicación canadienses en inglés. Estamos colaborando con investigadores francófonos para desarrollar una versión para los medios franceses, que se lanzará este año. También queremos incorporar un desglose de los tipos de fuentes: políticos, testigos, víctimas o expertos.

Paridad en los medios de comunicación en 2025

El objetivo del equipo de investigación que participamos en este proyecto es facilitar que los responsables de la toma de decisiones en los medios de comunicación puedan hacer un seguimiento de la representación de voces femeninas en sus medios. El objetivo de Informed Opinions es motivar a los periodistas a lograr la paridad en el discurso público canadiense para 2025. Lo que hacemos es utilizar técnicas de lingüística computacional con el fin de motivar y propiciar un cambio social.

En los últimos meses, el Gender Gap Tracker ha mostrado que los medios de comunicación canadienses sistemáticamente son portavoces en mayor medida de fuentes masculinas: se registra un 74% de voces masculinas, frente a un 25% de voces femeninas y un 1% por determinar. A la luz de estos resultados, y teniendo en cuenta que la mitad de la población mundial está constituida por mujeres, parece evidente que existe un margen de mejora en cuando a la representación mediática de voces femeninas. Algunos periodistas que hacen un seguimiento del desglose de sus fuentes ya están tomando medidas para alcanzar la paridad.

Este artículo fue publicado originalmente en The Conversation

The Conversation

Más Noticias