La Conferencia Codemotion Madrid 2024 puso buen parte de su foco en la inteligencia artificial, una tecnología que ha dejado de ser emergente y que se ha colado en el día a día de los desarrolladores. Llegados a este punto, son muchas las organizaciones que aspiran a desarrollar sus propios modelos de IA, con el objetivo de obtener sistemas que se ajusten mejor a sus necesidades.
Con el objetivo de dar claridad a todos aquellos que deseen saber más sobre cómo se crea y entrena un modelo de IA, en la Codemotion Madrid 2024 contamos con la ponencia “Puntos clave en el desarrollo de un modelo de Inteligencia Artificial”, la cual tuvo lugar en el Room 21 el 22 de mayo y corrió a cargo de Alejandro Jiménez, Tech Lead at Softtek.
Contexto de la charla
Alejandro Jiménez se subió al escenario con el objetivo de explicarnos cómo funciona y cuáles son los puntos claves a la hora de desarrollar un modelo de IA. Como Teach Lead en Softtek, una empresa mexicana de desarrollo de software fundada en 1982 y con presencia en más de 15 países, ha podido comprobar cómo este tipo de modelos está transformando la industria.
Durante la introducción de la charla destacó el rápido crecimiento de esta tecnología los últimos 5 años. Para ilustrarlo, aportó dos datos clarificadores.
- Por un lado, el uso de GPU’s, claves para alcanzar la potencia computacional necesaria para el entrenamiento de los modelos de IA, ha crecido un 2000 % desde 2019.
- Por otro, como la inversión privada en IA generativa ha aumentado año tras año, alcanzando los 25,2 mil millones de dólares en 2023, según el AI Index Report 2024 de la Universidad de Stanford.
Además, también nos habló de sobre cómo la IA está permitiendo llegar a conclusiones y predecir hechos que hasta ahora nos parecía imposible. Diversos periódicos se hacían en eco de como un modelo de IA podría predecir la interacción entre todas las moléculas de la vida, o como hay modelos capaces de predecir la muerte de una persona con un 78 % de precisión.
Estas capacidades de predicción no solo son asombrosas, sino que también abren un abanico de posibilidades para diversas industrias. Y a pesar de lo que pueda parecer, tanto por su abstracción de cara al usuario como el desconocimiento que aún existe sobre cómo funcionan estos modelos de IA, no es una cuestión de magIA, sino de ciencIA.
¿Cómo funciona el desarrollo de un modelo IA y cuáles son los puntos clave?
La capacidad de la computación que disponemos en la actualidad, así como la evolución de técnicas de aprendizaje automático y la disponibilidad de grandes cantidades de datos, han permitido en los últimos años un avance significativo en el desarrollo de modelos de IA.
Tal y como nos explicaba Alejandro, la clave está en que hemos llegado a un punto en el que hemos sido capaces de convertir lo complejo en sencillo. De manejar grandes volúmenes de datos, monstruosas infraestructuras IT o complicadas redes neuronales, hemos pasado a herramientas que tienen la capacidad de construir un modelo de IA a partir de una idea general, un Dataset, mucho entrenamiento y tests de rendimiento y precisión.
Para ilustrarnos en todo esto, Alejandro nos propuso un ejemplo de cómo se entrena un modelo de clasificación de imágenes capaz de distinguir entre un Chihuahua y un Muffin.
- Inicialmente, se necesita un conjunto de datos de entrenamiento. Este conjunto debe contener imágenes de Chihuahuas y Muffins, las cuales deben estar etiquetadas correctamente para que el modelo pueda aprender de ellas. Las etiquetas son esenciales, ya que proporcionan la información necesaria para que el modelo pueda distinguir entre las diferentes categorías.
- Posteriormente, el modelo se entrena con estos datos. En este proceso, el modelo aprende a identificar las características distintivas de cada imagen, ya sean Chihuahuas o Muffins. Esto se logra a través de un proceso llamado aprendizaje supervisado, en el que el modelo utiliza las etiquetas proporcionadas en el conjunto de datos de entrenamiento para aprender y hacer predicciones.
- Finalmente, se prueba el modelo con un nuevo conjunto de imágenes que no han sido utilizadas en el entrenamiento
- Este conjunto de datos se conoce como conjunto de datos de prueba. El propósito de esta etapa es evaluar la precisión y el rendimiento del modelo. Esto se hace comparando las predicciones del modelo con las etiquetas reales del conjunto de datos de prueba. Este proceso permite evaluar cuán bien el modelo ha aprendido a identificar Chihuahuas y Muffins y cuán precisas son sus predicciones.
Durante este proceso es muy importante evitar el overfifting o sobreajuste, un problema común en el aprendizaje automático donde un modelo se ajusta demasiado a los datos de entrenamiento y, como resultado, tiene un rendimiento deficiente con datos nuevos o no vistos. Para evitar esto, es vital realizar un ajuste adecuado del modelo y utilizar técnicas como la validación cruzada.
Asimismo, es necesario poner en marcha lo que se conoce como predicciones iterativas, donde el modelo hace predicciones basadas en el conjunto de entrenamiento para compararlas con los valores reales. Las diferencias entre las predicciones y los valores reales se utilizan para ajustar el modelo iterativamente, mejorando su precisión con cada iteración.
Gracias a todo este proceso, el modelo IA acaba adquiriendo el conocimiento necesario sobre los rasgos característicos de un Chihuahua y un Muffin. De esta forma, cuando compara imágenes nuevas, el modelo puede identificar y clasificarlas correctamente, alcanzando una alta precisión y un bajo índice de falsos positivos y falsos negativos.
Reflexión final
Alejandro acababa la ponencia mostrándonos ejemplos de cómo aplicar estos modelos en sistemas de producción reales. Por ejemplo, se pueden emplear para buscar defectos en la fabricación de un producto.
Para cerrar, nos invitaba reflexionar sobre el uso responsable de la IA generativa, haciendo hincapié en que “antes de correr hay que aprender a caminar”. Estudiar cómo funciona, realizar el cambio de enfoque y filosofía de trabajo que requiere esta tecnología o entender a fondo su complejidad técnica, son factores cruciales antes de incorporar estos modelos en nuestros procesos de negocio.
El Ponente: Alejandro Jiménez Sánchez, Tech Lead at Softtek
Graduado en ingeniería informática y matemáticas. Desarrollador backend Python. Apasionado del mundo tecnológico, Alejandro encuentra en la IA y ML un campo fascinante y un auténtico game changer.