En ocasiones, nos encontramos con audios que presentan variados problemas; partes cortadas, partes faltantes, sonidos que salieron por error, partes en las que no es legible la voz etc., etc. En este pequeño "hilo", intentaré mostrar (aunque no de forma profesional), una posible solución a esos errores o problemas utilizando la Inteligencia Artificial.
A continuación, mostraré algunos ejemplos y su descripción para entender de qué se trata. A modo de comparativa, en los videos se van a encontrar con la versión original, sin tocar y su continuación con la versión trabajada.
Basic Instinct 2 (2006) AKA Bajos instintos 2 - Versión de 1h 56min (116 min - unrated extended cut)
Problema= El problema que presenta el audio en español latino, es que está realizado para la version de 1h 54min (114 min) y hay escenas sin doblaje.
Solución= El video a continuación son unos segundos de la primera escena sin doblar a la que utilizando IA, intenté recrear la interpretación. Usé como doblaje base, la voz de la actriz (Kata Dobó) realizada en la película Átjáróház (2022) AKA El salvador de almas
https://streamtape.com/v/Z1KXMX02mwTqXLD
Dumb and Dumber (1994) AKA Tonto y retonto / Una pareja de idiotas - Versión de 1h 53min (113 min) (unrated)
Problema= El problema que presenta el audio en español latino, es que está realizado para la version de 1h 47min (107 min) y hay escenas sin doblaje.
Solución= El video a continuación, son unos segundos de la escena extendida sin doblar en el restaurante donde Lloyd y Harry conocen a Sea Bass.
https://streamtape.com/v/z6oj2lQvzbUY029
3:10 to Yuma (2007) AKA El tren de las 3:10 a Yuma / 3:10 misión peligrosa - Versión de 2h 2min (122 min)
Problema= El audio presenta múltiples problemas. 1- El más importante, al ser un audio descriptivo en ocasiones se superpone con el sonido o voz de fondo 2- Voz ininteligible en algunos pasajes 3- Frecuencia de muestreo muy baja (Hz)
Solución= El video a continuación, son unos segundos del comienzo de la película donde traté de recrear la escena con el doblaje principal.
https://streamtape.com/v/lgVXBj3qoYIOjm
Bonanza 1959–1973 - TV Series - Aproximadamente 49min por capítulo (430 episodes)
Problema= El problema que presenta el audio es que en algunos capítulos, se puede presentar saltos o cortes en la onda, en otros episodios partes o doblaje faltantes.
Solución= El video a continuación, son unos segundos donde se aprecia saltos en el audio. Utilizando IA se corrigió el inconveniente.
https://streamtape.com/v/J2JwZMQzoeIGAR
Aclaración y conclusiones:
Vale la pena aclarar que algunos proyectos fueron realizados con mi antigua y modesta PC la cual no disponía de potencia suficiente. Se puede apreciar el resultado obtenido con la misma en estos dos proyectos: Basic Instinct 2 y 3:10 to Yuma.
El año pasado me hice de una build más potente - gama media - la cual es compatible con librerías y plugins necesarios para un mejor resultado; cosa que no ocurría con la anterior. Cuanto más potente el setup o componentes de un ordenador, mejor calidad en el trabajo final. Quizás se puede apreciar esto en estos dos ejemplos: Dumb and Dumber y Bonanza.
Otra aclaración importante es que las soluciones aquí descritas fueron utilizando clonación de voz con IA para tratar de arreglar las situaciones referidas anteriormente. Incluso se puede mejorar más aún si se entrena a la IA en el tema interjecciones, canto, gritos, sollozos etc., como para que salga más natural. Además los plugins y software se van actualizando. La única contra es que cada vez requieren de más potencia
Espero haya sido de agrado o al menos de info lo expuesto en este post. Saludos.
A continuación, mostraré algunos ejemplos y su descripción para entender de qué se trata. A modo de comparativa, en los videos se van a encontrar con la versión original, sin tocar y su continuación con la versión trabajada.
Basic Instinct 2 (2006) AKA Bajos instintos 2 - Versión de 1h 56min (116 min - unrated extended cut)
Problema= El problema que presenta el audio en español latino, es que está realizado para la version de 1h 54min (114 min) y hay escenas sin doblaje.
Solución= El video a continuación son unos segundos de la primera escena sin doblar a la que utilizando IA, intenté recrear la interpretación. Usé como doblaje base, la voz de la actriz (Kata Dobó) realizada en la película Átjáróház (2022) AKA El salvador de almas
https://streamtape.com/v/Z1KXMX02mwTqXLD
Dumb and Dumber (1994) AKA Tonto y retonto / Una pareja de idiotas - Versión de 1h 53min (113 min) (unrated)
Problema= El problema que presenta el audio en español latino, es que está realizado para la version de 1h 47min (107 min) y hay escenas sin doblaje.
Solución= El video a continuación, son unos segundos de la escena extendida sin doblar en el restaurante donde Lloyd y Harry conocen a Sea Bass.
https://streamtape.com/v/z6oj2lQvzbUY029
3:10 to Yuma (2007) AKA El tren de las 3:10 a Yuma / 3:10 misión peligrosa - Versión de 2h 2min (122 min)
Problema= El audio presenta múltiples problemas. 1- El más importante, al ser un audio descriptivo en ocasiones se superpone con el sonido o voz de fondo 2- Voz ininteligible en algunos pasajes 3- Frecuencia de muestreo muy baja (Hz)
Solución= El video a continuación, son unos segundos del comienzo de la película donde traté de recrear la escena con el doblaje principal.
https://streamtape.com/v/lgVXBj3qoYIOjm
Bonanza 1959–1973 - TV Series - Aproximadamente 49min por capítulo (430 episodes)
Problema= El problema que presenta el audio es que en algunos capítulos, se puede presentar saltos o cortes en la onda, en otros episodios partes o doblaje faltantes.
Solución= El video a continuación, son unos segundos donde se aprecia saltos en el audio. Utilizando IA se corrigió el inconveniente.
https://streamtape.com/v/J2JwZMQzoeIGAR
Aclaración y conclusiones:
Vale la pena aclarar que algunos proyectos fueron realizados con mi antigua y modesta PC la cual no disponía de potencia suficiente. Se puede apreciar el resultado obtenido con la misma en estos dos proyectos: Basic Instinct 2 y 3:10 to Yuma.
El año pasado me hice de una build más potente - gama media - la cual es compatible con librerías y plugins necesarios para un mejor resultado; cosa que no ocurría con la anterior. Cuanto más potente el setup o componentes de un ordenador, mejor calidad en el trabajo final. Quizás se puede apreciar esto en estos dos ejemplos: Dumb and Dumber y Bonanza.
Otra aclaración importante es que las soluciones aquí descritas fueron utilizando clonación de voz con IA para tratar de arreglar las situaciones referidas anteriormente. Incluso se puede mejorar más aún si se entrena a la IA en el tema interjecciones, canto, gritos, sollozos etc., como para que salga más natural. Además los plugins y software se van actualizando. La única contra es que cada vez requieren de más potencia
Espero haya sido de agrado o al menos de info lo expuesto en este post. Saludos.