La Curva de Aprendizaje, parte 6: El camino colaborativo hacia la innovación en IA
Samsung Research en India es parte de una serie sobre las personas y las innovaciones detrás de la democratización de la IA móvil
Mientras Samsung continúa siendo pionero en experiencias premium de IA móvil, visitamos los centros de investigación de Samsung en todo el mundo para conocer cómo Galaxy AI permite que más usuarios a maximicen su potencial. Galaxy AI ahora admite 16 idiomas, por lo que más personas pueden ampliar sus capacidades lingüísticas, incluso sin conexión, gracias a la traducción en el dispositivo con funciones como Traducción simultánea, Intérprete, Asistente de notas y Asistente de navegación. Pero ¿qué implica el desarrollo del lenguaje de IA? La última vez visitamos Brasil para explorar cómo trabajan los equipos a través de culturas y fronteras para llevar Galaxy AI a más personas. Esta vez estamos en la India para conocer el valor de la cooperación con socios locales.
Escondido dentro del Instituto de Tecnología Vellore en Chennai, India, hay un laboratorio lleno de equipos de audio futuristas. Se pueden encontrar maniquíes —conocidos en la industria como simuladores de cabeza y torso— así como micrófonos binaurales y audífonos. Se almacenan en cámaras especiales tratadas con un avanzado sistema de absorción acústica, lo que convierte a este laboratorio en el primero de su tipo en la India. Imagine que una instalación así se utiliza para desarrollar los últimos equipos de alta fidelidad (Hi-Fi) de próxima generación.
Aquí es donde el Instituto de Tecnología Vellore colabora con Samsung para producir y desarrollar datos e ideas que impulsan los últimos modelos de IA para las capacidades lingüísticas de Galaxy AI. El centro se desarrolló como parte del Samsung SEED (Students Ecosystem for Engineered Data) Labs, una iniciativa que permite al personal universitario, estudiantes y becarios en la India trabajar en proyectos solicitados por Samsung desde 2021. Este es solo uno de varios programas universitarios financiados por Samsung, en el que los alumnos tienen la oportunidad de trabajar en proyectos con expertos técnicos de la empresa.
"Como estudiante, me encanta poder trabajar en varios proyectos con una empresa conocida y respetada como Samsung", asegura Yashika Ilanchezhiyan, estudiante del Samsung SEED. "Me dieron confianza para aprender nuevas habilidades de manera práctica y siento que estoy marcando una diferencia real en los productos actuales y futuros".
"En este tipo de colaboración todos salen ganando", afirma Giridhar Jakki, director de IA para idiomas en el Instituto de Investigación y Desarrollo de India - Bangalore (SRI-B). "Gracias a nuestros proyectos con universidades, podemos acceder a conocimientos adicionales y conjuntos de datos personalizados. A cambio, las universidades asociadas reciben inversión, incentivos financieros y asesoramiento especializado de Samsung".
Reducir las barreras del idioma
SRI-B ha colaborado con equipos de todo el mundo para desarrollar modelos de IA para el inglés británico, indio y australiano, así como para los idiomas tailandés, vietnamita e indonesio. Recientemente, los principales ingenieros de otros centros de investigación de Samsung visitaron Bangalore (India), donde el equipo de SRI-B ayudó a desarrollar la tecnología para incorporar el vietnamita, el tailandés y el indonesio a Galaxy AI. De este modo, SRI-B se situó en una posición ideal para desarrollar el idioma hindi para Galaxy AI.
Según Jakki, "Cada idioma tiene sus desafíos. Pero cuando pensamos en el objetivo final de brindarle a las personas la capacidad de comunicarse en otros idiomas, todo el esfuerzo vale la pena. No veíamos la hora de incorporar el hindi a Galaxy AI".
Desarrollar el modelo hindi de IA no fue fácil. El equipo tuvo que garantizar que se incluyeran más de 20 dialectos regionales, inflexiones vocales, puntuación y coloquialismos. Además, los hablantes de hindi suelen mezclar palabras en inglés en sus conversaciones. Esto requirió que el equipo tuviera que realizar varias sesiones de entrenamiento de modelos de IA con una combinación de datos traducidos y transliterados.
"El hindi tiene una estructura fonética compleja que incluye sonidos retroflejos —sonidos que se producen al curvar la lengua hacia atrás— que no existen en muchos otros idiomas", asevera Jakki. "Para desarrollar el elemento de síntesis de voz de la solución de IA, analizamos cuidadosamente los datos con lingüistas nativos para comprender todos los sonidos únicos y creamos un conjunto especial de fonemas para admitir dialectos específicos del idioma".
Los esfuerzos de colaboración entre Samsung y los socios académicos fueron fundamentales para desarrollar el modelo de lenguaje de IA que reflejara los matices culturales de las regiones de la India. El Instituto de Tecnología Vellore ayudó a obtener casi un millón de líneas de datos de audio segmentados y organizados sobre voz, palabras y comandos conversacionales. Los datos fueron un componente clave para una tarea tan crítica como la de incorporar el cuarto idioma más hablado del mundo a Galaxy AI. Trabajar con universidades garantizó que Samsung utilizara datos de la más alta calidad.
Conexiones globales que generan grandes impactos
Este proyecto resume a la perfección la filosofía de colaboración abierta de Samsung y la convicción de la compañía de que compartir conocimientos y perspectivas garantiza una innovación significativa En el caso de SRI-B, esto no solo incluye trabajar con el mundo académico sino también compartir ideas y prácticas recomendadas con otros centros de investigación de Samsung en todo el mundo.
"Estoy muy orgulloso de lo que hemos logrado con la ayuda de nuestros socios", afirma Jakki. "La innovación en IA mediante la colaboración es una gran parte de lo que hacemos. Continuaremos comprendiendo, recopilando y analizando mejor los datos lingüísticos para que más personas puedan acceder a las herramientas de IA en el futuro".