Enjoyment

Whisper: la herramienta para convertir archivos de audio a texto

30 marzo 2023

Whisper: la herramienta para convertir archivos de audio a texto

Quienes trabajan en el mundo editorial saben lo complicado que puede resultar transcribir una entrevista. A veces, la parte fácil del proceso es realizar la entrevista en sí misma; lo complicado es transcribirla en un intento por recuperar las palabras y el tono exacto en que el entrevistado habló. 

Cuando se trata de enfrentarse a la transcripción de largas conversaciones y al incesante tecleo que puede tomar horas y horas, el trabajo puede resultar una pesadilla, y lo mismo aplica para investigadores que trabajan con grabadoras de audio, entre otras carreras. 

¿Qué pasa? Tienes que volver a escuchar el audio e ir escribiendo rápidamente. Ese es el proceso manual. Por otra lado, han aparecido diversas aplicaciones para convertir archivos de audio de voz en texto, las cuales solían presentar algunas fallas (sobre todo con la puntuación) y se trataba de aplicaciones de pago en las que, además, había que subir los archivos a su plataforma. El proceso seguía teniendo un su grado de complejidad y tedio. 

Pero la inteligencia artificial ha llegado para solucionar prácticamente todo. Y hablamos en concreto de Whisper, de los creadores de ChatGPT.  

Según se explica en la página oficial del proyecto, Whisper es un sistema de reconocimiento automático de voz (ASR) entrenado con más de 680,000 horas de datos supervisados multilingües y multitarea recopilados de la web. 

El programa no solo es capaz de convertir a texto lo que escucha, sino que también de traducirlo al inglés con resultados sorprendentes. La herramienta es muy precisa, reconoce la puntuación y es capaz de entender hasta las voces veloces y complejas. 

Whisper es, en resumen, una herramienta de transcripción casi inmediata y de alta precisión capaz de funcionar con varios idiomas que resulta perfecta para evitar esas largas horas frente al teclado y facilitar así la vida de cientos de profesionistas. 

Lo mejor de todo es que se puede acceder de forma libre a través de la web ya que es de código abierto. De este modo, bastará con subir el archivo de audio deseado ya sea una entrevista, investigación, etcétera, y así Whisper te regresa el texto transcrito con mucha precisión al cabo de un periodo de tiempo que varía en función de la longitud y el tamaño del archivo de audio. 

Imagen de Gerd Altmann en Pixabay

Escrita por:

Iván González

30 marzo 2023

Compártelo en tus redes: