Go to Top
Icono de web - Avanzada 7

Verbio: síntesis de voz (TTS) y reconocimiento del habla (ASR) español

La síntesis de voz (TTS) y reconocimiento del habla (ASR) son piezas clave en servicios de atención al cliente, procesos industriales, logísticos, entornos domóticos y en productos para discapacitados.


Verbio Technologies SL, es una empresa especializada en el desarrollo de tecnologías del habla, síntesis de voz y reconocimiento del habla, con sede en Barcelona (España).

En pocos años, Verbio Technologies se ha convertido en la referencia en tecnologías del habla para el mercado hispano en especial, para el mercado español. El hecho de disponer de tecnología propia de productos de síntesis y reconocimiento del habla, incluidas herramientas de VoiceXML, sistemas de verificación de locutor y recursos lingüísticos, ha permitido asegurar la calidad de sus productos y servicios. Verbio Technologies trabaja constantemente en la mejora de sus productos VERBIO invirtiendo importantes recursos en I+D propio y participando en los proyectos internacionales de investigación más avanzados del momento.

Verbio ofrece reducción de costes y mayor rentabilidad facilitando el acceso a nuevos canales de información.

Productos Verbio:

verbio_tts_3-Avanzada 7

TTS : Tech-To-Speech

Verbio TTS es el motor de síntesis de voz o conversión de texto en habla de VERBIO. Disponible en los distintos idiomas utilizados en la península ibérica y en algunos países latinoamericanos.

¿Qué es la Conversión de texto en habla?

La conversión de texto en habla o síntesis de voz (TTS - Text-to-Speech) es la tecnología que permite convertir, de forma automática, un texto escrito en una locución de voz natural, con la mejor naturalidad e inteligibilidad. Permite al sistema que dispone de dicho motor "leer en voz alta" un texto escrito.

¿Cuándo es indicado utilizarlo? 

  • Es una herramienta imprescindible en aplicaciones cuya información es muy cambiante y por lo tanto hay que comunicar información dinámica.
  • La síntesis no pretende sustituir nunca a la calidad de una grabación profesional hecha en un estudio de grabación, pero sí cuando se necesitan de forma inmediata o cuando lo que se pretende es un ahorro directo de costes.

Con la utilización de Verbio TTS en un sistema de información se evita la grabación constante en estudio de nuevos mensajes (a veces imposible de llevar a cabo) y se consigue por lo tanto un ahorro elevado en costes y tiempo, disponiendo de una flexibilidad total y disponibilidad inmediata. 

¿Dónde es aplicable?

El motor de síntesis de voz Verbio TTS está especialmente indicado para emitir mensajes en la interacción hombre-máquina y comunicaciones personales en ámbitos como:

  • Telefonía y CTI: Call centers, IVR’s, Mensajería unificada, Operadoras automáticas, Portales de voz, etc.
  • Internet: Mensajes personalizados en páginas web, con mensajes de voz de información de última hora, recordatorios, locución de instrucciones de ayuda, lectura de correo electrónico o noticias, etc.
  • Domótica: Confirmación de información o lectura de datos del sistema.
  • Discapacitación: Aplicaciones de ayuda y soporte a distintos niveles de discapacitación, verificación de información o comandos.
  • Industrial: Ayuda a la automatización industrial de procesos mediante la voz (logística, maquinaria, etc).
  • Terminales multimedia (móviles, PDA, etc.): Escucha de información en móviles con manos libres.

Características principales

  • Voces de hombre y mujer de gran calidad, basadas en locutores profesionales.
  • Entorno multilingüe con el que podrá sintetizar voces en español, catalán, euskera, gallego y lenguas internacionales como inglés, francés, portugués europeo, portugués brasileño y mexicano.
  • Entonación dinámica y adaptativa: selección de la curva de entonación original del locutor que mejor se adapta a cada contexto, superando la monotonía de los patrones estáticos .
  • Algoritmo de ritmos y pausas del habla basado en la propia sintaxis y en métodos estadísticos.

 

ASR: Automatic Speech Recognition

Verbio ASR es el motor de reconocimiento del habla de VERBIO muy orientado a aplicaciones telefónicas e independiente de locutor, si bien es aplicable también en muchas otras aplicaciones microfónicas y multimedia. Disponible en los distintos idiomas utilizados en España, Portugal y en la mayoría de países latinoamericanos, incluyendo también una versión en inglés.

¿Qué es el Reconocimiento del habla?

El reconocimiento del habla (ASR - Automatic Speech Recognition) es la tecnología que permite convertir, de forma automática, una locución de habla natural en un texto que se corresponda con ésta con la máxima fiabilidad posible. Permite al sistema que dispone de dicho motor "entender" o interpretar el contenido de una locución con independia de la voz de locutor.

¿Cuándo es indicado utilizarlo?

  • Control por Voz: Verbio ASR imprescindible en aplicaciones interactivas entre usuarios y sistemas automáticos, IVR, Portales de voz o dispositivos en general.
  • Entornos Telefónicos: si bien el canal voz forma parte de muchos sistemas multicanal que requiera ASR para ser automatizado, es el más extendido.
  • Flexible: Cuando se requiere una navegación flexible, con iniciativa y control por parte del usuario.
  • Reducción de tiempos: Para ahorrar tiempos de interacción y para evitar memorización de menús muy largos.

¿Dónde es aplicable?

Verbio ASR está orientado principalmente para trabajar en entorno telefónico aunque tiene una amplia compatibilidad, previa adaptación, en otros recursos o modelos acústicos, con distintos entornos de trabajo que van desde los sectores de call centers, domótica, seguridad, aplicaciones de PC, aplicaciones industriales, móviles, PDA y, en general, cualquier entorno que requiera o disponga de un sistema de manos libres.

Está especialmente indicado para permitir la interacción hombre-máquina y comunicaciones personales mediante la voz.

¿Cómo debe utilizarse?

A continuación se especifican algunos aspectos que deberían tenerse en cuenta a la hora de diseñar aplicaciones que hagan uso de la tecnología de reconocimiento del habla:

  • Es imprescindible realizar un estudio previo por especialistas para evaluar la viabilidad de introducir las tecnologías del habla en un sistema. No todos los sistemas pueden aprovechar las ventajas de estas tecnologías, al menos en su totalidad. Es aconsejable introducirlas progresivamente para no crear un rechazo inicial si su rendimiento no es el esperado.
  • Es imprescindible adaptar el sistema a los condicionantes de las tecnologías del habla: la automatización directa no garantiza resultados inmediatos.
  • Es muy aconsejable realizar un seguimiento del sistema una vez puesto en producción para detectar errores de funcionamiento y poder corregirlos paulatinamente (etapa de tuning).

Otros Productos Verbio:verbio_otros_prod_1-Avanzada 7

Integración de Verbio y Asterisk:

La integración entre Asterisk y Verbio lleva realizándose desde hace años. Avanzada7 es el Partner oficial que da soporte a esta tecnología

Avanzada 7 promocionará el uso de las soluciones Verbio en proyectos Asterisk y ofrecerá su habitual soporte técnico especializado para la integración de los distintos productos.

comentarios