Así es la aplicación del modelo TTS ‘DiTTo’ de la división de aprendizaje profundo de KRAFTON.
ReLU Games, un estudio creativo que forma parte de KRAFTON Inc, anunció este 12 de septiembre una actualización del juego de detectives Uncover the Smoking Gun.
En esta actualización, ReLU Games colaboró con KRAFTON para incorporar al juego el modelo avanzado de texto a voz (TTS) ‘DiTTo’. Desarrollado por la división de aprendizaje profundo de KRAFTON a principios de este año, es la primera vez que DiTTo se aplica en el entorno de un videojuego disponible de manera pública.
DiTTo es un ejemplo innovador de cómo usar los transformadores de difusión (DiT) con la síntesis de voz, lo cual permite un lenguaje hablado más natural y flexible en comparación con las tecnologías TTS tradicionales. Un transformador de difusión es la técnica más reciente de modelado de IA que combina el proceso de generación de datos paso-a-paso de los modelos de difusión, con las capacidades excepcionales que tienen los transformadores respecto a aprendizaje relacional.
El modelo simplifica el proceso de entrenamiento de la IA, lo que permite una generación más rápida y precisa de nuevas voces, proporcionando una voz de IA notablemente similar a la de un humano.
Con esta actualización, los robots sospechosos del juego responderán a las preguntas no solo con texto, sino también con voz generada por IA, lo que mejorará notablemente la experiencia del usuario.
Actualmente, solo hay soporte para voces en inglés, pero planean introducir más voces de IA en otros idiomas en el futuro.
Además, la actualización añade tres nuevos idiomas —portugués, italiano y polaco— a los ocho que ya soportaba el juego. En respuesta a la petición del público, también se lanzó la banda sonora original del juego como contenido descargable (DLC).
'Uncover the Smoking Gun': Steam
'Uncover the Smoking Gun': Discord
Sitio web de ReLU Games: ReLU Games
Página oficial de YouTube de ReLU Games: YouTube
Página oficial de X de ReLU Games: X
Comments