Gracias, gracias y mil gracias. Un año más, la Codemotion Madrid ha sido un éxito rotundo, superando todas nuestras expectativas. El pasado 21 y 22 de mayo más de 2100 asistentes llenaron las salas de Kinépolis para disfrutar de las mejores ponencias, compartir proyectos y encontrar nuevas oportunidades para seguir creciendo. Aún seguimos con resaca de estos emocionantes días e impresionados por la increíble cantidad de talento e innovación que se exhibió.
Para seguir saboreando algunas de las cosas que pasaron, nos gustaría repasar con vosotros algunas de las ponencias a las que tuvimos el placer de asistir en la Codemotion Madrid 2024. Hoy empezamos con «Recreando el mundo en 3D con ayuda de la IA«, una innovadora TechTalk impartida por Ramón Rotaeche y Colleen McMillen, ambos Data Scientist en en Intelygenz, a VASS Company.
Contexto de la charla
En la última década, tecnologías como el Big Data, el Machine y el Deep Learning o la realidad virtual y aumentada han dado un salto de calidad enorme. Su aplicación a redes neuronales y LLM (Modelos de lenguaje de gran tamaño) han dado lugar a herramientas de inteligencia artificial accesibles, fáciles de usar y que ofrecen resultados como nunca habíamos visto.
En esta misma tónica, la salida de las populares Vision Pro, las gafas AR de Apple, también nos permitieron acercarnos a cosas hasta ahora inimaginables. ¿Alguna vez has querido ver tu deporte favorito desde varios ángulos o incluso verte a ti cómo el jugador principal? Esto es ahora posible gracias a la combinación de la tecnología 3D y la inteligencia artificial.
Hasta el momento la única forma de conseguir un resultado similar era la fotogrametría, una técnica basada en la captura de múltiples fotografías desde diferentes ángulos y la posterior unión de estos datos para obtener un modelo tridimensional. Sin embargo, esta técnica tiene limitaciones, especialmente en términos de tiempo y recursos.
En la actualidad, y gracias a técnicas como el NeRF 3D o el 3D Gaussian Splatting (entre otras), la forma de diseñar y recrear experiencias 3D inmersivas y realistas está cambiando radicalmente. Estas innovadoras técnicas permiten generar modelos 3D a partir de imágenes 2D, con un nivel de detalle y realismo impresionante, en un tiempo mucho menor al que requería la fotogrametría.
¿Cómo funciona el NERF 3D?
El NERF 3D (Neural Radiance Fields) es un método que utiliza una red neuronal entrenada para generar escenas 3D a partir de imágenes y vídeos en 2D. Imagina una escena 3D como una colección de puntos, cada uno con información sobre su posición, color, dirección de la luz que recibe y cómo la refleja.
Para aprender esta información a partir de las imágenes o vídeos de la escena, la red neuronal analiza cada imagen, identificando la posición de la cámara y la dirección en la que mira. Luego, predice el color y la densidad de cada punto en la escena, basándose en los píxeles de la imagen y su posición relativa a la cámara.
Este proceso se repite para todas las imágenes, creando una representación volumétrica de la escena, conocida como campo de radiación. El campo de radiación no solo almacena la geometría de la escena, sino también la forma en que la luz interactúa con ella, permitiendo renderizar imágenes realistas desde cualquier punto de vista.
Herramientas como Instant NeRF de NVIDIA están acercando esta tecnología a más usuarios, permitiendo generar escenas 3D de alta calidad en minutos. Sin duda, es un paso adelante en la evolución de la recreación de escenas 3D, proporcionando resultados impresionantes y abriendo nuevas posibilidades en la visualización de datos, la realidad virtual, visionado de deportes, recreación de escenarios, arquitectura, videojuegos y un largo etcétera.
¿Y el 3D Gaussian Splatting?
Por otro lado, el 3D Gaussian Splatting es una técnica de renderizado 3D que utiliza funciones gaussianas para representar y renderizar escenas tridimensionales. La escena 3D se descompone en una nube de puntos, donde cada punto se representa con una función gaussiana. Cada gaussiana tiene atributos como posición, tamaño, color, opacidad y orientación.
Las gaussianas individuales se superponen y combinan empleando las transparencias necesarias de cada gaussiana para dar forma a la imagen final. Las gaussianas se rasterizan en un plano 2D, proyectándolas desde la perspectiva de la cámara y empleando IA para calcular los efectos de iluminación y sombras que permiten obtener una imagen final realista.
Se trata de una técnica que a nivel computacional es muy eficiente, sobre todo en escenas complejas con muchos detalles o que tengan una gran variedad de geometrías, incluyendo superficies orgánicas, fluidos y efectos volumétricos. Puede manejar grandes conjuntos de datos y escenas a gran escala y ofrece un control preciso sobre la apariencia de la imagen final, ajustando los parámetros de las gaussianas.
La charla: Recreando el mundo en 3D con ayuda de la IA – VASS
VASS es una compañía global de transformación digital que sitúa a las organizaciones a la vanguardia de la innovación, uniendo talento, conocimiento y tecnología. Con sus soluciones digitales, acompaña a personas y organizaciones de todo el mundo en su transición hacia el futuro. Sus 4,900 expertos en 26 países de Europa, América y Asia trabajan junto a sus clientes, socios y aliados clave, ofreciendo soluciones y servicios de innovación digital de alto nivel, facilitando la transformación y evolución de sectores clave como servicios financieros y banca, retail, seguros, administración pública, telecomunicaciones y medios de comunicación, entre otros.
Su enfoque está basado en el desarrollo de tecnología consciente, creada para impulsar el cambio positivo y fomentar la creación de oportunidades relevantes para personas y organizaciones a través de la tecnología.
Como uno de los principales sponsor de la Codemotion Madrid, no podían faltar en esta edición. Además de estar presentes en su stand propio, nos deleitaron con sus conocimientos de estas tecnologías emergentes durante su ponencia «Recreando el mundo en 3D con ayuda de la IA» , donde demostraron una vez más su liderazgo en el campo de la innovación digital.
En ella, los científicos de datos de VASS, Ramón Rotaeche y Colleen McMillen, nos hablaron de su experiencia durante un proyecto de investigación en el que experimentaron con diferentes técnicas IA para la reconstrucción en escenas 3D, como el NeRF y 3D Gaussian Splatting. También reflexionaron sobre el estado del arte de esta tecnología, el resultado de algunos de sus experimentos y con qué aprendizajes, retos y limitaciones se encontraron.
Esta TechTalk resultó ser una de las más interesantes del evento, proporcionando a los asistentes una visión amplia sobre las posibilidades que ofrece la inteligencia artificial en la creación de experiencias 3D. El Kahoot que se ofreció al final de la presentación también cosechó un gran éxito, con muchos participantes compitiendo para hacerse con la victoria.
Como puedes ver, lo pasamos genial durante la Codemotion Madrid 2024, y eso que esto solo es una pequeña muestra de todo lo que vivimos. Tanto si acudiste y te quedaste con ganas de más como si no pudiste venir, te invitamos a que estés muy atento para no perderte próximos eventos. ¡Nos vemos muy pronto!
Los ponentes
- Ramón Rotaeche Data Scientist at Intelygenz, a VASS Company: Ramon tiene más de 8 años de experiencia construyendo soluciones basadas en datos e IA para empresas de todo el mundo. En los últimos años, ha estado trabajando como Científico de Datos Senior at Intelygenz, a VASS Company, donde se ha centrado en aprovechar los últimos modelos y técnicas de IA generativa, aplicados tanto al lenguaje como a la visión.
- Colleen McMillon, Data Scientist at Intelygenz, a VASS Company: Colleen acumula más de 7 años de experiencia en ciencia de datos en diferentes compañías y tiene una gran experiencia internacional. Actualmente trabaja en Intelygenz (una empresa de VASS) como Científica de Datos Senior, donde aplica técnicas de machine learning a proyectos en diferentes sectores. Tiene un interés especial en computer vision, en el cual ha trabajado en varios proyectos aplicando algoritmos de IA generativa, radiance fields y CNNs.