Por Mercedes Leticia Sánchez Ambriz y Carlos Bravo Reyes
![]() |
Elaborado con ChatGPT |
Escucha el pódcast del artículo en este enlace
En la era del aprendizaje multimodal, los recursos educativos ya no se limitan a formatos tradicionales. La convergencia entre texto y audio se presenta como una herramienta pedagógica de alto impacto, especialmente en contextos donde se busca mejorar la retención de la información y la comprensión lectora. Diversos estudios han explorado cómo la estimulación de diferentes canales sensoriales puede favorecer procesos cognitivos complejos como la memoria, la atención y la comprensión.
Beneficios comprobados de la combinación de texto y audio
Un informe de Globant (2025) destaca que la retención puede aumentar hasta un 40% cuando se integra el formato auditivo con el visual (texto), gracias a la activación simultánea de la memoria auditiva y de los centros emocionales del cerebro. Esta estimulación dual facilita una mejor codificación de la información, lo que se traduce en aprendizajes más duraderos.
Por su parte, una investigación de la Universidad de Waterloo con 95 estudiantes evidenció que leer en voz alta (es decir, producir y escuchar el propio audio) mejora significativamente la retención frente a leer en silencio o solo escuchar a otra persona (El Ciudadano, 2023). Este hallazgo refuerza la importancia de la participación activa del estudiante, donde hablar y escuchar a la vez fortalece los mecanismos de memorización.
En el ámbito de la educación infantil, un estudio de ULADECH (2023) mostró que la estrategia del “audio cuento” permitió elevar el nivel de comprensión de textos en niños de 4 años del 73% al 80%. Esta mejora del 7% es significativa si se considera el impacto que puede tener en las etapas tempranas del desarrollo lector.
Todo lo anterior se puede apoyar en la Teoría del Aprendizaje Multimedia, formulada por Richard E. Mayer. Esta es una de las teorías más influyentes en el campo del diseño instruccional apoyado en tecnología. Se fundamenta en principios de la psicología cognitiva y la neurociencia, y propone cómo deben diseñarse los medios de enseñanza que integran texto, imagen y sonido para facilitar el aprendizaje significativo.
La teoría parte de tres supuestos principales: el doble canal de procesamiento (visual/pictórico) con el procesamiento de imágenes y texto escrito, y el (auditivo/verbal), que procesa sonidos y lenguaje hablado. El segundo supuesto es la capacidad limitada, de cada canal en la memoria de trabajo. Como todos conocemos no es posible procesar grandes volúmenes de información visual y auditiva simultáneamente sin sobrecargar la cognición. El tercero y último de estas ideas es el procesamiento activo: El aprendizaje requiere que el estudiante seleccione la información relevante (imágenes o palabras, las organice mentalmente en estructuras coherentes y a su vez la Integre con los conocimientos previos.
Cómo lograr la DUPA: herramientas y recomendaciones prácticas
La Duplicación de Procesamiento Auditivo y Visual (DUPA) consiste en presentar simultáneamente un mismo contenido en formato textual y en formato auditivo. Para implementarla de forma eficaz, es necesario seguir ciertos principios didácticos y apoyarse en herramientas accesibles. A continuación, se describen algunas estrategias y recursos recomendados:
1. Diseño de contenidos sincronizados
- Utiliza fragmentos breves de texto (entre 150 y 300 palabras) acompañados por grabaciones del mismo contenido.
- Sincroniza el audio con el texto, resaltando las frases que se están leyendo. Esto puede hacerse con subtítulos resaltados o software especializado.
2. Herramientas tecnológicas recomendadas
- Notebook LM y ElevenLabs: para generar audios naturales a partir de textos educativos.
- Fliki o Lumen5: para transformar artículos escritos en videos con locución automática, ideales para microcápsulas educativas.
· Canva Docs + Audio Embed: permite insertar grabaciones de voz en infografías o presentaciones interactivas.
· PowerPoint + función “Narrar diapositiva”: útil para clases asincrónicas.
· Padlet y Google Sites: permiten incluir texto junto con archivos de audio integrados en entradas o materiales de clase.
· H5P (en Moodle): para crear actividades interactivas con texto, audio y retroalimentación inmediata.
3. Buenas prácticas
En un curso de Doctorado en Educación que se imparte en la modalidad virtual, 105 estudiantes tenían que desarrollar una investigación, apoyarse con herramientas de Inteligencia artificial para buscar información, y como estrategia de aprendizaje, producir un audio por cada 50 textos seleccionados.
Debían de ser únicamente artículos científicos e identificar palabras clave. Para esto se empleó la herramienta Notebook LM para generar una versión en audio de los textos. Para compartir los audios se subieron a una plataforma gratuita llamada vocaroo.com
Algunos ejemplos de este trabajo de investigación son:
Tema: Coevalución en educación superior en el que se realiza un análisis de esta metodología, vinculada al pódcast.
Tema Ciencia y tecnología, se hace un recorrido por varias ciencias y la metodología STEAM
Tema: La IA en el bachillerato. Un análisis de lo se hace hoy en este nivel de enseñanza.
Tema: La educación se reinventa con los nativos digitales. Un pódcast que resumen varios documentos relacionados con el tema y narra varios ejemplos de trabajo con los nativos digitales.
En este blog estamos aplicando el concepto de realizar un pódcast de cada artículo, para lo que empleamos NotebookLM en la mayoría de los casos. El pódcast se carga en Spotify.
Esta práctica multiplica las formas de acceder a la información: quienes prefieren escuchar mientras conducen o hacen ejercicio pueden mantenerse informados, y quienes leen disponen de una opción auditiva para reforzar la comprensión. Al activar dos canales sensorios‑cognitivos, sus lectores reportan mayor retención de conceptos clave y una experiencia de lectura más rica y accesible.
Conclusiones y proyecciones
La incorporación simultánea de texto y audio en los procesos de enseñanza y aprendizaje representa una estrategia pedagógica altamente eficaz, respaldada por evidencia empírica.
Diversos estudios han demostrado que esta combinación potencia la retención de la información entre un 7% y un 40%, dependiendo del contexto educativo y la metodología empleada (Globant, 2025; ULADECH, 2023). Esta mejora se debe a que el uso combinado de canales visuales y auditivos activa múltiples áreas cerebrales, favoreciendo una codificación más profunda y una recuperación más accesible de los contenidos (El Ciudadano, 2023).
Entre los beneficios más destacados se encuentran:
· El incremento en la comprensión lectora, especialmente en niveles iniciales (como lo evidenció la estrategia de “audio cuento” en educación infantil con un aumento del 7% en comprensión textual).
· La mayor atención y análisis crítico por parte de estudiantes de niveles superiores, como en el caso de los doctorandos que utilizaron Notebook LM para convertir artículos científicos en audios y así reforzar su lectura crítica y su capacidad de análisis conceptual.
· La accesibilidad y diversificación de formatos, facilitando el aprendizaje ubicuo y adaptado a distintos estilos, como lo demuestra el trabajo de en este blog promoviendo una experiencia multimodal en su comunidad lectora.
Estos ejemplos ilustran cómo tanto en entornos formales como en contextos de autoformación y divulgación académica, la integración de texto y audio no solo incrementa la retención, sino que enriquece la experiencia de aprendizaje, fomenta la autonomía del estudiante y promueve una educación más inclusiva y flexible. Por lo tanto, se recomienda su implementación sistemática en la creación de materiales didácticos, recursos académicos y contenidos digitales educativos.
Referencias
- Globant. (2025). La ventaja del audio por sobre el texto. Globant Blog.
- El Ciudadano. (2023). Comprobado: leer en voz alta ayuda a retener mejor la información.
- Universidad Católica Los Ángeles de Chimbote (ULADECH). (2023). La estrategia de audio cuento mejora el nivel de comprensión de textos en niños de 4 años [Tesis de grado].
- Cambridge University Press. (2014). The Cambridge Handbook of Multimedia Learning (R. E. Mayer, Ed.). Cambridge University Press. https://doi.org/10.1017/CBO9781139547369
No hay comentarios:
Publicar un comentario