El último artículo publicado en el blog “Apple Machine Learning Journal” está centrando en Siri, pero principalmente en su versión móvil, la ejecutable mediante un iPhone o un Apple Watch. Y el dato de color lo aporta, cómo no, su principal función: el “Hey Siri” (Oye Siri, para nosotros), esa detección automática -mediante reconocimiento de voz- que poco a poco se vuelve más popular.
En el post, Apple explica que el hardware del iPhone o Apple Watch convierte la voz en una secuencia de ondas casi instantáneamente, a una velocidad de 16.000 por segundo. Éstas alimentan a una “Red Neuronal Profunda” que, a su vez, clasifica lo que está escuchando y lo compara con la frase de activación del sistema operativo.
Además, se han establecido varios umbrales de sensibilidad. Si el resultado es de rango medio, el software automáticamente “escucha” la frase por segunda vez durante algunos segundos. Luego de la activación, la onda llega al servidor de Siri. Desde donde, si el detector de voz principal entiende algo diferente a “Oye Siri” -como, por ejemplo, “Oye en serio”-, se enviará una señal de cancelación al teléfono para que vuelva a dormirse.
También hay cuestiones fonéticas específicas del idioma integradas al sistema. En este sentido, Apple remarca que las palabras parecidas, como “Siria”, se examinan en contexto con la frase que lo rodea.
Por su parte, el Apple Watch presenta algunos desafíos especiales debido a que la batería es mucho más pequeña y la capacidad de procesamiento mucho menor. Es por ello que el detector “Oye Siri” del Apple Watch se ejecuta solo cuando el coprocesador de movimiento de reloj detecta un gesto de elevación de la muñeca.
El Apple Machine Learning Journal se lanzó el pasado 19 de julio, con un primer post que llamaron “Mejorando el realismo de las imágenes sintéticas“, en donde se explayaban acerca del entrenamiento de redes neuronales con imágenes compiladas.
En dicho blog, Apple invita a investigadores, estudiantes, ingenieros y desarrolladores a ponerse en contacto con la empresa a fin de evacuar y compartir todo tipo de preguntas y comentarios sobre el programa. Todo este movimiento parece ser parte de la promesa de los de Cupertino de permitir que investigadores publiquen lo que descubren y compartan en qué están trabajando con sus colegas.
El cambio en las políticas, para algunos “radical”, fue anunciado en diciembre del año pasado por el Director de Investigación de Inteligencia Artificial de Apple, Russ Salakhutdinov.