Transcripción Automática
La solución que necesitas
Introducción
El objetivo de la transcripción automática es producir textos enriquecidos a partir de pistas de audio. Basada en la tecnología de reconocimiento de voz, nos permite generar automáticamente transcripciones partiendo de contenidos hablados junto con metadatos enriquecidos, como la clasificación del fondo, la detección del idioma, la puntuación, las mayúsculas y la segmentación e identificación del hablante, entre otros.
Todos estos componentes tecnológicos pueden adaptarse a cualquier dominio, tema o entorno acústico para minimizar los errores, de modo que la solución de transcripción automática puede explotarse en muchos sectores y para diversas aplicaciones, como la transcripción automática anotada, la recuperación de documentos hablados, la detección de términos hablados, el resumen, la navegación semántica y la minería de datos del habla.
Funciones
Reconocimiento del Habla
Tecnología Speech-To-Text para la generación automática del flujo de palabras en bruto a partir de audios
Uso de Mayúsculas
Detección automática de nombres propios y mayúsculas en el flujo de palabras sin procesar
Detección de Idiomas
Detección y seguimiento automáticos de la lengua hablada en el audio multilingüe
Puntuación
Inserción automática de signos de puntuación en el flujo de palabras en mayúsculas
Identificación del Orador
Segmentación, agrupación e identificación automática de hablantes específicos en el audio
Procesamiento del Audio
Normalización del audio, detección de segmentos vocales y no vocales y clasificación de los sonidos ambientales
Mercados
Administración Pública
Minimizar los costes con la transcripción automática de texto enriquecidoLa solución permite transcribir automáticamente el gran volumen de contenidos hablados existentes en las administraciones públicas, en lugar de transcribirlos de forma manual. Aligerando el proceso, ayudando a reducir los costes y permitiendo al personal centrarse en otras tareas
Audiovisual
Generando información accesibleActualmente, las emisoras están obligadas a incluir subtítulos en sus emisiones en beneficio de los espectadores con problemas de audición. Basada en la tecnología de reconocimiento de voz, la solución permite la generación automática de subtítulos intralingüísticos, tanto en modo offline como online
Sanidad
Creación de documentación sanitaria basada en la vozEl reconocimiento de voz en el ámbito sanitario se promueve como una tecnología para aumentar la productividad, acelerar la creación de documentación médica y agilizar las consultas. Esta solución puede funcionar tanto en modo de dictado como procesando las voces digitales grabadas del personal sanitario
e-Learning
Mejora de la calidad de los contenidos audiovisuales de la enseñanza digitalLa solución permite crear transcripciones sincronizadas junto con los vídeos, generando información accesible para mejorar la experiencia de aprendizaje, resumiendo los puntos más importantes en la transcripción y creando material didáctico compartible para los cursos online
Casos de uso
Subtitulado Automático Bilingüe
Caso de aplicación en EiTB
Larraitz Eguren (EITB) – Aitor Alvarez (Vicomtech)
Administración Pública
Se ha desarrollado una solución completa de transcripción, adaptada y transferida al Parlamento Vasco. Esta solución permite generar las actas de las sesiones parlamentarias de forma automática, ayudando a los profesionales a crearlas de forma más rápida tras una pequeña tarea de post-edición. Como resultado, los documentos se encuentran disponibles de forma rápida y se reduce la carga de trabajo de los profesionales, permitiéndoles centrarse en otras tareas administrativas.
Audiovisual
Irekia, como portal de Gobierno Abierto (oGov) del Gobierno Vasco, también ha integrado nuestra solución de subtitulado para generar subtítulos automáticos de sus contenidos bilingües y publicarlos online con una pequeña edición posterior.