Transcripción Automática

La solución que necesitas

Introducción

El objetivo de la transcripción automática es producir textos enriquecidos a partir de pistas de audio. Basada en la tecnología de reconocimiento de voz, nos permite generar automáticamente transcripciones partiendo de contenidos hablados junto con metadatos enriquecidos, como la clasificación del fondo, la detección del idioma, la puntuación, las mayúsculas y la segmentación e identificación del hablante, entre otros.

Todos estos componentes tecnológicos pueden adaptarse a cualquier dominio, tema o entorno acústico para minimizar los errores, de modo que la solución de transcripción automática puede explotarse en muchos sectores y para diversas aplicaciones, como la transcripción automática anotada, la recuperación de documentos hablados, la detección de términos hablados, el resumen, la navegación semántica y la minería de datos del habla.

Funciones

Reconocimiento del Habla

Tecnología Speech-To-Text para la generación automática del flujo de palabras en bruto a partir de audios

Uso de Mayúsculas

Detección automática de nombres propios y mayúsculas en el flujo de palabras sin procesar

Detección de Idiomas

Detección y seguimiento automáticos de la lengua hablada en el audio multilingüe

Puntuación

Inserción automática de signos de puntuación en el flujo de palabras en mayúsculas

Identificación del Orador

Segmentación, agrupación e identificación automática de hablantes específicos en el audio

Procesamiento del Audio

Normalización del audio, detección de segmentos vocales y no vocales y clasificación de los sonidos ambientales

Mercados

Administración Pública

Minimizar los costes con la transcripción automática de texto enriquecido

La solución permite transcribir automáticamente el gran volumen de contenidos hablados existentes en las administraciones públicas, en lugar de transcribirlos de forma manual. Aligerando el proceso, ayudando a reducir los costes y permitiendo al personal centrarse en otras tareas

Audiovisual

Generando información accesible

Actualmente, las emisoras están obligadas a incluir subtítulos en sus emisiones en beneficio de los espectadores con problemas de audición. Basada en la tecnología de reconocimiento de voz, la solución permite la generación automática de subtítulos intralingüísticos, tanto en modo offline como online

Sanidad

Creación de documentación sanitaria basada en la voz

El reconocimiento de voz en el ámbito sanitario se promueve como una tecnología para aumentar la productividad, acelerar la creación de documentación médica y agilizar las consultas. Esta solución puede funcionar tanto en modo de dictado como procesando las voces digitales grabadas del personal sanitario

e-Learning

Mejora de la calidad de los contenidos audiovisuales de la enseñanza digital

La solución permite crear transcripciones sincronizadas junto con los vídeos, generando información accesible para mejorar la experiencia de aprendizaje, resumiendo los puntos más importantes en la transcripción y creando material didáctico compartible para los cursos online

Casos de uso

Subtitulado Automático Bilingüe

Caso de aplicación en EiTB

Larraitz Eguren (EITB) – Aitor Alvarez (Vicomtech)

Administración Pública

Se ha desarrollado una solución completa de transcripción, adaptada y transferida al Parlamento Vasco. Esta solución permite generar las actas de las sesiones parlamentarias de forma automática, ayudando a los profesionales a crearlas de forma más rápida tras una pequeña tarea de post-edición. Como resultado, los documentos se encuentran disponibles de forma rápida y se reduce la carga de trabajo de los profesionales, permitiéndoles centrarse en otras tareas administrativas.

Audiovisual

Irekia, como portal de Gobierno Abierto (oGov) del Gobierno Vasco, también ha integrado nuestra solución de subtitulado para generar subtítulos automáticos de sus contenidos bilingües y publicarlos online con una pequeña edición posterior.