Esto demuestra que el aprendizaje automático aumenta su valor de frente a la innovación tecnológica en video, de la mano con lograr distinguir entre caras y fondos a 100 fotogramas por segundo. Así Google, empresa propietaria de Youtube, busca que las animaciones se vean más fluidas y naturales, lo que permitiría a la famosa plataforma de videos competir con otras aplicaciones que tienen la misma herramienta.
Para lograrlo, Google entrenó una red neuronal con base en muchas imágenes cuidadosamente etiquetadas para que aprendiera a distinguir características faciales como el cabello o la boca, de todo el demás conjunto propio de la imagen, el resultado fue un sistema que intercambia los fondos lo suficientemente rápido como para mantener el video. Tal fue el logro de la IA que si comparamos, los marcos de video digital estándar funcionan a 30 fotogramas por segundo, pero la tecnología de Google funciona a 40 fotogramas por segundo en un Google Pixel 2 y a más de 100 fotogramas por segundo en un iPhone 7.
Este es gran avance si se considera que, aunque ya conocida desde hace mucho tiempo, dicha tecnología es complicada y requiere mucho trabajo, como en el caso de la industria cinematográfica y las pantallas verdes que luego permiten a las computadoras reemplazar el color verde con efectos digitales; por lo que tener datos de escena en 3D, por ejemplo, extraídos de las cámaras gemelas de los iPhones más nuevos, hace que el proceso sea un poco más fácil.
Vía Google Research Blog y Mashable