Recientemente llegó la noticia de un estudio enfocado en la accesibilidad del habla y el cual será colaborativo entre la Universidad de Illinois (UIUC) junto a la empresa de Cupertino, así como también otras empresas expertas y especializadas en la tecnología como Google, Meta, entre otras. Esta colaboración lleva por nombre Proyecto de Accesibilidad del Habla, pensando principalmente mejorar los sistemas de reconocimiento de voz utilizados primordialmente por personas con discapacidades o problemas relacionados, así como problemas para comprender o de cognición.
El fundamento de este estudio radica en las habituales agresiones en contra de Apple y demás empresas que no pueden cumplir correctamente las peticiones de personas con estas discapacidades. Todo esto, debido a que los sistemas de reconocimiento de voz de asistentes digitales tales como la propia Siri han ido evolucionando con el tiempo, a niveles bastante óptimos, aunque quizá no lo suficiente. La precisión que han ganado con los años es bastante buena, además del propio hardware y software de los dispositivos. Ahora, este nuevo proyecto busca mejorar aún más la precisión para ayudar a los usuarios discapacitados o con diferentes dificultades relacionadas al habla.
Proyecto para la accesibilidad del habla
La colaboración será entre las empresas de Apple, Amazon, Google, Meta y Microsoft, además de otras organizaciones que no buscan tener algún tipo de beneficio. El punto es que gracias a la UIUC, el Proyecto de Accesibilidad del Habla adapte mejores capacidades a los sistemas de reconocimiento de voz para que estos entiendan mejor los patrones.
El estudio también abarcaría a los afectados en el habla por enfermedades y discapacidades, entre las cuales entra la enfermedad del conocido Lou Gehrig, esclerosis lateral amiotrófica, también está el Parkinson, parálisis cerebral y síndrome de Down.
Ya sea en mediana, pequeña o gran escala, los sistemas de reconocimiento de voz tienen como objetivo mejorar de forma real la calidad de vida de los usuarios que tengan diferentes tipos de discapacidades de movimiento. Aunque, evidentemente esto deja un poco fuera a los usuarios con afectaciones de la voz.
El Proyecto de Accesibilidad del Habla tiene pensado recabar los datos y muestras por parte de sujetos que «presenten una diversidad de patrones de habla». De este modo utilizarán dichos datos de forma privada y anónima, centrándose en el inglés americano. Aunque se tiene pensado adaptar parte de este nuevo sistema para los modelos de aprendizaje automático en un futuro y así contribuir mucho más a estos servicios.
Así se está desarrollando el proyecto
Debido a la magnitud del proyecto, se pensó en distintas empresas que tuvieran el compromiso para afiliarse a esta colaboración. Así es como encontramos a una amplia variedad de gigantes tecnológicos, que claro, tienen asistentes digitales activados por voz y que ofrecen diferentes servicios de accesibilidad del habla. El objetivo es analizar dichas herramientas que ofrecen estas características y observar cómo podrían ir evolucionando el estudio.
De este modo, no necesitarán trabajar con cada una de las empresas por separado, pues ahora pueden integrarse todos, compartiendo resultados. La colaboración de todos los equipos directamente sobre el objeto de estudio ayudará bastante a los fines y resultados próximos del proyecto.
En palabras de Mark Hasegawa-Johnson, quien es uno de los encargados del proyecto como profesor de la Universidad de Illinois señala la importancia del estudio. Puesto que todos estos servicios de accesibilidad del habla tendrían que estar siendo utilizados por todas las personas a nivel mundial, abarcando claramente a quienes tengan algún tipo de discapacidad.
Además añade que el proyecto no tendrá ningún tipo de facilidad, puesto que necesita la alineación de todo el equipo, así como demasiada infraestructura. Aquí remarca la importancia del apoyo de las empresas tecnológicas que están igualmente aportando su propio esfuerzo. Finalmente habla sobre el buen equipo interdisciplinario encargado, ya sea desde la base con «experiencia lingüística, el habla, la IA, seguridad y privacidad».