Los ingenieros de Apple comparten la evolución de Siri

siri iOS 9

El asistente inteligente de nuestros dispositivos Apple, Siri, está en una fase de evolución importante. La llegada de iOS 11 y del HomePod son claves para dicho proceso.

En la pasada WWDC 2017, llegaron novedades importantes para los desarrolladores como fue el SiriKit. Apple, en vistas al nuevo iOS y a su altavoz digital, decidió abrir más su API para terceros para mejorarlo y hacerlo más potente y compatible con las apps.

https://youtu.be/5Tn3oRZSZIc

Después de lanzar su nueva revista Apple Machine Learning Journal para que los ingenieros de Apple compartan con la comunidad, hoy el equipo de Siri ha compartido tres nuevas entradas en el blog basadas en la investigación que se presenta en Interspeech 2017 en Estocolmo esta semana.

Una entrada de blog titulada «Aprendizaje Profundo para la Voz de Siri: Redes de Densidad de Mezcla Profunda en Dispositivos para Síntesis de Selección de Unidades Híbridas» detalla la evolución de la voz de Siri hasta iOS 11 y el proceso que Apple utiliza para la síntesis del habla. Incluidas son las grabaciones que comparan iOS 9 e iOS 10 a iOS 11 para demostrar las mejoras que Apple ha hecho con la nueva versión que viene junto a la próxima generación de iPhones el próximo mes:

Para iOS 11, elegimos un nuevo talento vocal femenino con el objetivo de mejorar la naturalidad, personalidad y expresividad de la voz de Siri. Evaluamos cientos de candidatos antes de elegir el mejor. Luego, grabamos más de 20 horas de habla y construimos una nueva voz TTS usando la nueva tecnología de TTS basada en el aprendizaje profundo. Como resultado, la nueva voz de Siri en los Estados Unidos suena mejor que nunca. La Tabla 1 contiene algunos ejemplos de las voces basadas en el aprendizaje profundo de Siri en iOS 11 y 10 en comparación con una voz de selección de unidad tradicional en iOS 9.

Los otros dos posts del blog titulado «Mejora de los modelos acústicos de redes neuronales mediante el cross-bandwidth y la inicialización entre lenguajes» y «La normalización del texto inverso como un problema de etiquetado» también fueron publicados por el equipo Siri de Apple. Un post detalla cómo Siri usa el aprendizaje de máquinas para mostrar cosas como fechas, horas, direcciones y cantidades de moneda de una manera bien formateada, y las otras técnicas que Apple usa para hacer la introducción de un nuevo lenguaje lo más suave posible.

Tal y como van la evolución de la competencia como Alexa, Google Assistant o Cortana, esperamos grandes novedades para Siri este otoño. A parte del cambio de logo que sufrirá.

Salir de la versión móvil