Mostrando entradas con la etiqueta Audio. Mostrar todas las entradas
Mostrando entradas con la etiqueta Audio. Mostrar todas las entradas

sábado, 21 de febrero de 2026

MAV - Audio

Tratamiento del audio. ¿Para qué?

En un mundo en el que los recursos audio-visuales son tan abundantes, donde "una imagen vale más que mil palabras", el audio, a palo seco, parece extremadamente pobre. En principio, pero sólo en principio.

En realidad el audio es la mitad del material AV, pero aparentemente es el pariente pobre: si los efectos visuales no triunfan, el MAV tampoco.

Sin embargo el tratamiento del audio es fundamental como recurso dentro de los modelos DUA, ya que garantizan el correcto acceso al contenido para determinados colectivos, como es el caso de las personas invidentes, pero no sólo.

Otro campo de interés, también dentro del tema de la accesibilidad, es el de los audiolibros y la generación de podcast en base a textos propios o seleccionados personalmente. Hablo de ambos como recursos educativos, sin entrar en su realidad como producto comercial, de los cuales todos podemos ser consumidores.

En el campo específico de los SEO, el uso del audio (en realidad de los MAV) es secundario, por no decir prácticamente inexistente. No acaba de "tener hueco" como recurso de recogida de información dentro del quehacer profesional y su tratamiento posterior es sumamente complejo y costoso.

La causa fundamental de todas estas limitaciones es que nuestra referencia al audio (la de los SEO, quiero decir) es siempre la de su relación con el texto escrito: la transcripción de voz_a_texto. No hace tanto que ésta, en sus dos sentidos, puede considerarse "satisfactoriamente resuelta".

La conversión de texto_a_voz no es especialmente interesante para los SEO, aunque sí lo es para la intervención educativa. Por eso no la voy a abordar aquí. La contraria, de voz_a_texto, sí, y mucho; mucho más de lo que se puede suponer en función de la prácticamente ausencia de uso por parte de los SEO.

Con los consabidos medios (y hoy en día está disponibles), muchas de nuestras actuaciones podrían ser grabadas en audio (incluso en video), permitiendo que el profesional se involucre muchos más activamente en la intervención de lo que le es posible cuando debe atender, además, a la toma de notas. Además nada impide que siga tomando notas en caso de grabar la intervención. En otras ocasiones, esas actuaciones podría agilizarse en cuanto a duración si dejamos a la grabación de audio la responsabilidad de registrar su desarrollo.

Pero si esto no ha sido ni aun hoy en día es así, no lo es por negligencia o apego a la costumbre. Es porque el tratamiento posterior de esos archivos sonoros (o AV) ha sido, hasta hace prácticamente ayer mismo, inabordable por el tiempo de trabajo que consume su transcripción.

Actualmente, sin embargo, contamos con recursos que resuelven satisfactoriamente la conversión de voz_a_texto, lo que pone la información en formato texto a disposición del SEO. Pero con muchas de estas tecnologías nos encontramos con un problema: la exposición de información confidencial en la red no es una opción. Se necesitan medios que permitan realizar transcripciones fiables y seguras en local (off-line).

Afortunadamente en estos disponemos de esos recursos, los cuales nos permiten resolver lo que Balabolka ya hace tiempo que ha resuelto, muy satisfactoriamente, en la conversión inversa (texto_a_voz). De algunos de ellos hablaremos en esta subsección de MEDIOS AV

sábado, 19 de abril de 2025

MAV. Python


PyGame




Objeto sonido


Además de imágenes también necesitamos incluir sonidos en nuestras recursos para que puedan ser considerados MAV. Los juegos hacen uso continuado de ambos, así que PyGame no sería un buen recurso si no contara con procedimientos que permitieran el uso de sonidos.



Como lo primero que tenemos que tener es audios, qué mejor que un programa (gratuito) de edición y grabación de audio como es Audacity, o si se prefiere, más especializado de trabajo con grabaciones de voz como es PRAAT (sobre ambos, consultar enlaces  en Contenidos), así que, para desarrollar esta entrada voy a grabar un audio con la palabra taza. Así seguimos trabajando con el script en el que incorporamos la imagen de una taza.

Lo primero que tenemos que hacer para trabajar con audios en PyGame es inicializar los recursos de audio (pygame.mixer.init()), cosa que corresponde hacer en la sección 1ª del script, a continuación de la inicialización de pygame (pygame.init())

Siguiendo en esta misma sección, después de finalizar el proceso de carga de la imagen, procedemos a cargar y ajustar el sonido.
  • Cargándolo en memoria (pygame.mixer.music.load("assets/taza.mp3")) mediante la función music.load() del objeto mixer.
  • Estableciendo el modo de reproducción mediante la función music.play(). Si pasamos como parámetro 0 se reproduce una vez, pero si pasamos como parámetro -1 se reproduce en bucle. En este caso pygame.mixer.music.play(0)
  • Y para finalizar indicamos el volumen deseado mediante la función set_volumen() (vg. pygame.mixer.music.set_volume(0.5))
Y de este modo tan sencillo ya disponemos de recursos para crear una presentación basada en PyGame que utilice imágenes y sonidos. Cierto que nos falta saber cómo incorporar textos, cosa que veremos más adelante, pero podemos simular su uso capturándolos como imágenes desde la pantalla. No es muy elegante como solución, pero sí efectiva. Además ya te adelanto que el trabajo con textos en PyGame no es precisamente sencillo y (considero) tampoco es que brille por su utilidad.

En cualquier caso, desde este enlace puedes descargar el script explicado en la entrada. Y [desde este otro el audio], que también debes incluir en la carpeta assets. al igual que las imágenes.