W3C Speech API Community Group ha publicado una especificación para un API Web de voz en JavaScript.
¿De qué trata la especificación?
Básicamente la integración de está API dará pie a que los desarrolladores ingresen texto mediante la voz a páginas web; los usuarios tendrán la posibilidad del reconocimiento de voz, introducir datos, hacer dictado continúo y controlar computadoras con su voz.
A finales del 2011 se generó un reporte final de propuestas realizadas por el HTML Speech Incubator Group con miembros de Microsoft, Google, Voxeo, AT&T, Mozilla y OpenReach de los cuales sólo Google y Microsoft participaron en las mismas para la especificación del API de JavaScript, así como también los límites de HTML.
Google dio la iniciativa y propuso el API de voz para JavaScript dos semanas después del reporte, el cual soporta 15 de 17 casos definidos en el reporte final del HTML Speech Incubator Group, y abarca:
- Búsqueda por voz
- Interface de comandos por voz
- Gramáticas contingentes de dominio específico
- Reconocimiento contínuo de díalogos abiertos
- Gramáticas específicas en dominios
- Interfaces de voz presentes cuando no se necesita una interfaz gráfica
- Detección de actividad de voz
- Hello world
- Traducción de voz
- Cliente de correo por voz
- Sistemas de diálogo
- Direcciones para manejo de autos por voz
- Interacciones multimodales
- Videojuegos multimodales
- Estructura temporal de la síntesis para dar retroalimentación visual
Por el momento la especificación API no tiene el status de un estándar W3C y únicamente Gloogle Chrome es el único navegador con soporte a ésta API de voz; en un futuro se espera que los demás navegadores también cuenten con el soporte y unificar así ésta tecnología.
Fuente: Matuk

