Existe la funcionalidad r Voz a Texto asistida por inteligencia artificial , muy útil para las personas que tienen que escuchar largos discursos , asambleas, consejos etc, que luego tienen que generar actas, el programa Victor Voice AI https://victorvoice.co/, (ya no funciona). presta un excelente servicio y es gratis, hasta ahora me ha permitido hacer conversiones de hasta 1 hora y 30 minutos , relativamente rápido y con bastante fidelidad y un servicio en linea., una opción alternativa con capacidad de procesar 2000 caracteres unos 2 minutos y medio, es https://luvvoice.com/ , tiene voces en varios idiomas, el español de Colombia tanto en voz masculina como femenina es aceptable.
Fracionando la informacion logre procesar un texto de mas de 10 minutos el cual edite con PITIVI , y quedó baste decente.
También puede consultar Deegram https://console.deepgram.com
Si se trata de hacer una conversión Victor Voice y DeepGram , suele permitir formatos tipo m4a y mp3 el primero es un estandard muy usado por los celulares y el segundo es un estándar muy general, si su archivo esta en un formato que Victor Voice , no reconce puede convertirlo en linea por ejemplo con :
Los he usado ambos con excelentes resultados, recomiendo que si tiene un archivo tipo .wav u otro formato diferente a .mp3 o .m4a, lo convierta a .mp3 para mejores resultados (recordar que wav tiene mejor calidad de sonido pero suelen ser muy grandes, lo que puede generar problemas si se esta usando la versión Free.
Victor Voice AI tiene varios modelos de uso, el mas sencillo es gratis (Free) , aunque para obtener mejores resultados se puede hacer un pequeño pago por la modalidad standard 1.5 US o pro por 5.0 US, la diferencia mas notable en las diferentes modalidades es el tamaño del archivo de audio a convertir que en la modalidad Free es de 100M , mientras que para Standar y Pro son de 10GB y 100GB. y la cantidad de usuarios que pueden usarlo simultáneamente.
En mi caso el Free me ha servido en la mayoría de los casos. salvo una o dos excepciones de asamblea eternas o archivos muy extensos.
Una vez se está en la pagina de Victor Voice, basta darle Get Started, solicita ingresar una información muy básica de registro, darle el correo donde usted desea que la conversión se enviada ya que el no permite descargar el archivo generado texto de forma directa sino que lo envía al correo indicado al momento de registrarse.
Si ya se ha registrado anteriormente solamente tiene que buscar el enlace Sign In, que a veces es difícil de ubicar porque esta en letra muy pequeña,
El siguiente paso solicita que se indique el idioma del audio , que se puede seleccionar en mi caso Spanish, y luego seleccionar el archivo que se va a convertir y esos es todo.
Hay que tener en cuenta que la calidad de estos conversores están directamente relacionados con la calidad del audio , que suele ser un problema por los siguientes motivos.
1. Ruido blanco o estática, o sea mucho ruido externo que dificulta escuchar bien el audio
2. Las personas no se identifican al hablar que es un gran problema al generar los documentos y poder determinar quien es quien habla
3. Hablan muy suave y fuera del micrófono
4. Varias personas hablan a la vez,
So corrigen estas falencias la conversión suele ser bastante buena, sin embargo algunas herramientas ayudan a mejorar la calidad del audio, herramientas como Audacite https://www.audacityteam.org/download/ que mejoran la calidad del audio y es gratis , existe para prácticamente para todo los sistemas operativos, aunque Audacito no es en linea hay que instalarlo.
En usado en linea algunos VEED.IO https://www.veed.io /herramientas/editor-de-audio y Cuter https://mp3cut.net/es/
La verdad no me sentí cómodo con las herramientas on line, también tienen un limite muy bajo para su uso gratuito, sin embargo hay están si alguien desea usarlas.
Estos editores de audio permiten:
.
1. Eliminar el ruido de fondo
2. Ecualizar el sonido , es decir realzar lo que esta muy baja y disminuir lo que está muy alto
3. Enfatizar graves y agudos para mejorar la calidad auditiva del audio.
4. Amplificar el volumen del audio
Esto facilita enormemente la calidad antes de hacer uso de un programa de conversión voz a texto como Victor Voice AI https://victorvoice.co/
VictorVoice https://victorvoice.co/, aunque funciona muy bien es mas limitado en la cantidad de conversiones que permite de forma gratuita, Deepgram https://console.deepgram.com es mucho mas amplio en ese contexto , pero una vez pasada la etapa de pruebas sugiero suscribirse algún plan para poder disfrutas de estas excelente herramientas que facilitan mucho la transcripción de voz a texto, fuera de las herramientas arriba mencionadas existen otras , pero su uso es un poco mas complejo y el costo muy superior a las anteriores.
Por otra parte recomiendo el uso de alguno de los Chat de inteligencia artificial (Open AI, Google Gemini (antes Bard )entre otros) , para darle forma, estilo y hacer el texto mas legible , incluso obtener resúmenes , sinopsis, tablas de puntos importantes entre otros.
Para animar algunas imágenes esta disponible Pika Labs, es una utilidad IA , muy sencilla de usar , y da animaciones muy buenas de hasta 3 segundos totalmente gratis.
Par generar imágenes de alta calidad mediante un descripción (script) podemos disponer de Leonardo AI , totalmente gratis y que permite https://app.leonardo.ai/
Un buen programa para la generación de vídeos es https://lumen5.com/ permite generar vídeos de hasta varios minutos , ademas de que tiene un asistente de IA, que te ayuda a crear buenos prompt , tiene la facilidad de generar vídeos , con texto o con voz y le coloca audio, es bastante sencillo de manejar.
Por ultimo un proceso que puede ayudar a sus presentaciones es convertir texto a voz, es un proceso sencillo lo único que gastar un poco de tiempo seleccionado la voz que mas no agrade de la muchas que hay disponibles, en mi caso selecciono español , hay voz femenina y masculina, suelo elegir o Santiago o Camila ya que hablan español de Colombia, pro lo hay de Perú, México, de Argentina , España entre otros. https://ttsmaker.com/es , tiene un manejo de 10.000 palabras gratis, lo que no me ha gustado es que cada vez que para o entras un nuevo texto hay que registrar un catcha que presenta que algunas veces no se ve muy bien, de resto es muy bueno

No hay comentarios:
Publicar un comentario