MiniMax M2.5: rendimiento de élite a precio de startup

Hay un hilo rojo que atraviesa los últimos seis meses de desarrollo de la inteligencia artificial china, y corre paralelo a la geografía de las restricciones comerciales impuestas por Washington. Cada vez que pensamos que hemos trazado los límites de la innovación posible bajo el embargo de hardware, un nuevo modelo reescribe las reglas del juego. Sucedió con Kimi K2.5 en diciembre, con Qwen 3 en enero, con DeepSeek MHC hace unas semanas. Ahora le toca el turno a MiniMax M2.5, un modelo que llega al mercado con una propuesta tan sencilla como desestabilizadora: rendimiento de modelo de frontera a una décima parte del precio de la competencia occidental.

El lanzamiento del 12 de febrero de 2026 se inscribe en una trayectoria que venimos documentando desde hace meses: la capacidad del ecosistema chino para transformar los límites impuestos por las restricciones en chips avanzados en aceleradores de innovación. MiniMax, una startup de Shanghái fundada en 2022 por el exvicepresidente de SenseTime, Yan Junjie, acaba de completar una oferta pública inicial de 619 millones de dólares en la bolsa de Hong Kong. Las acciones duplicaron su valor en el primer día de cotización, alcanzando una capitalización de mercado de unos 13.000 millones de dólares. Los inversores suscribieron la oferta más de 1.800 veces por encima de las acciones disponibles. El mensaje es inequívoco: el mercado ve algo que va más allá de las cifras financieras inmediatas.

El modelo que piensa como un arquitecto

MiniMax M2.5 es un modelo basado en una arquitectura de expertos mixtos, técnicamente llamada Mixture of Experts: sobre el papel cuenta con 230.000 millones de parámetros totales, pero en la práctica solo activa 10.000 millones para cada consulta individual. Es como tener una biblioteca inmensa pero consultar solo los estantes pertinentes: se obtiene el conocimiento de un sistema masivo con la agilidad de uno ligero. La versión Lightning alcanza velocidades de 100 tokens por segundo, exactamente el doble que los modelos de frontera competidores. La versión estándar se queda en 50 tokens por segundo pero cuesta la mitad.

Las cifras de los benchmarks cuentan una historia precisa. En SWE-Bench Verified, la prueba que mide la capacidad de resolver problemas reales en repositorios de GitHub, el M2.5 alcanza el 80,2%. Claude Opus 4.6 se sitúa en el 80,8%, GPT-5.2 en el 80%, Gemini 3 Pro en el 78%. Estamos en el orden de un punto porcentual de diferencia, prácticamente paridad técnica. En Multi-SWE-Bench, que prueba capacidades de codificación multilingüe en proyectos complejos, el M2.5 alcanza el 51,3%, superando a Opus 4.6, que se queda en el 50,3%. En BrowseComp, benchmark que evalúa la investigación web y el razonamiento contextual, llega al 76,3%.

Pero hay un detalle de comportamiento que surge del análisis del modelo y que MiniMax define como «mentalidad de arquitecto». Antes de escribir siquiera una línea de código, el M2.5 descompone de forma autónoma los requisitos del proyecto, planifica su estructura y diseña la interfaz. No es retórica de comunicado de prensa: es un patrón que surgió espontáneamente durante el entrenamiento por refuerzo realizado en más de 200.000 entornos reales diferentes. El modelo no se limita a corregir errores o resolver problemas aislados, sino que cubre todo el ciclo de desarrollo de software: desde el diseño inicial del sistema hasta la revisión completa del código, pasando por la configuración de entornos, pruebas y validación. Soporta de forma nativa más de diez lenguajes de programación, desde Go hasta Python, desde Rust hasta TypeScript, desde C++ hasta Kotlin, y opera en diferentes plataformas: web, Android, iOS, Windows.

Imagen tomada de minimax.io

La cuestión del precio que lo cambia todo

Aquí la narrativa da un giro diferente. MiniMax M2.5 Lightning cuesta 0,30 dólares por millón de tokens de entrada y 2,40 dólares por millón de tokens de salida. La versión estándar reduce a la mitad estos precios: 0,15 y 1,20 dólares respectivamente. Claude Opus 4.6 cuesta 5 dólares en entrada y 25 dólares en salida. No es una diferencia marginal de una cláusula contractual: es una proporción de uno a veinte en el coste de salida, la diferencia entre poder permitirse un experimento y tener que renunciar a él.

Traducido en aplicaciones concretas, una tarea típica en SWE-Bench Verified consume una media de 3,52 millones de tokens. Con el M2.5 Lightning, el coste ronda los 8,45 dólares por tarea completada. Con Claude Opus 4.6 estamos por encima de los 260 dólares para obtener exactamente el mismo resultado. La eficiencia también surge de la velocidad de ejecución: el M2.5 completa las tareas de SWE-Bench en 22,8 minutos de media, un 37% más rápido que su predecesor M2.1. El tiempo de ejecución es idéntico al de Claude Opus 4.6, pero al 10% del coste total.

MiniMax resume la propuesta con una fórmula que recuerda al sueño de la energía atómica de los años cincuenta: «inteligencia demasiado barata para ser medida». Mantener el M2.5 Lightning activo de forma continua durante una hora, generando 100 tokens por segundo de forma ininterrumpida, cuesta exactamente un dólar. A 50 tokens por segundo, el precio baja a 30 centavos. Con un presupuesto de 10.000 dólares se pueden hacer funcionar cuatro instancias del modelo ininterrumpidamente durante un año entero. No es una especulación teórica de comunicado de prensa: la propia empresa utiliza el M2.5 internamente a escala de producción. El 30% de las actividades globales son gestionadas de forma autónoma por el modelo, cubriendo investigación y desarrollo, producto, ventas, recursos humanos, finanzas. En el ámbito específico de la programación, el 80% del código nuevo enviado al repositorio de la empresa es generado por el M2.5.

Aplicaciones prácticas más allá del código

El diseño del M2.5 no se limita a la programación. El modelo ha sido entrenado en escenarios de oficina reales, colaborando directamente con profesionales senior en finanzas, derecho y ciencias sociales. Estos expertos diseñaron requisitos específicos, proporcionaron comentarios detallados durante el desarrollo, definieron estándares de calidad precisos y contribuyeron directamente a la construcción de los datos de entrenamiento. El objetivo era incorporar al modelo el conocimiento tácito de los respectivos sectores, ese tipo de saber procedimental que no se encuentra escrito en los manuales pero que se adquiere con años de práctica diaria.

MiniMax ha construido un marco de evaluación interno llamado GDPval-MM que juzga no solo la calidad del producto final entregado sino también la profesionalidad del camino recorrido por el agente para llegar allí, monitorizando al mismo tiempo los costes en tokens de todo el flujo de trabajo para estimar las ganancias reales de productividad del modelo. En comparaciones directas con otros modelos mainstream mediante comparaciones por pares, el M2.5 alcanzó una tasa de victoria media del 59%. En la plataforma MiniMax Agent, que integra de forma nativa el modelo, los usuarios han construido más de 10.000 expertos personalizados en pocos días desde el lanzamiento, combinando competencias específicas de dominio con las habilidades básicas del sistema.

En investigación web y llamada de herramientas, el M2.5 demuestra una madurez de toma de decisiones superior a la de sus predecesores. No se limita a «hacer las cosas correctamente», busca activamente caminos más eficientes para resolver los problemas asignados. En tareas como BrowseComp, Wide Search y RISE ha reducido el consumo de turnos en aproximadamente un 20% respecto al M2.1, alcanzando mejores resultados con mayor eficiencia en términos de tokens consumidos. Es una señal importante: el modelo no acumula pasos redundantes para cubrirse de potenciales errores, sino que navega con más precisión y determinación hacia la solución óptima.

Imagen tomada de minimax.io

La IPO y el contexto financiero

La oferta pública inicial de enero de 2026 en Hong Kong representa mucho más que un simple evento financiero en el calendario de cotizaciones. MiniMax recaudó 619 millones de dólares vendiendo 29,2 millones de acciones a 165 dólares de Hong Kong cada una, exactamente en el límite superior de la horquilla indicativa comunicada a los inversores. El título cerró el primer día de cotización a 345 dólares de Hong Kong, con una subida del 109% que hizo saltar la capitalización de mercado a unos 13.000 millones de dólares. La demanda fue literalmente abrumadora: 1.837 veces la oferta pública destinada al mercado minorista, 37 veces la colocación internacional.

Catorce inversores de referencia comprometieron 350 millones de dólares incluso antes de la cotización pública. La Abu Dhabi Investment Authority aporta capital soberano de Oriente Medio interesado en las tecnologías emergentes, Alibaba posee el 13,66% de la sociedad trayendo consigo todo el ecosistema tecnológico chino consolidado, Mirae Asset Securities representa los intereses surcoreanos en el sector de la IA. MiHoYo, el desarrollador del videojuego Genshin Impact e inversor ángel en MiniMax desde los orígenes de la startup, posee el 6,4% de la sociedad por un valor que a capitalización actual ronda los 615 millones de dólares. Otros accionistas de peso incluyen a Tencent, Hillhouse Capital, Sequoia China e IDG.

La valoración post-IPO de 6.500 millones de dólares representa un crecimiento sustancial respecto a los 4.200 millones de la ronda de financiación privada anterior. Pero detrás de la euforia de las contrataciones del primer día hay cifras que cuentan una historia más compleja. En los tres primeros trimestres de 2025, MiniMax registró ingresos de 53 millones de dólares frente a pérdidas netas de 512 millones. La empresa se encuentra en la fase de alta inversión típica de las startups de IA, esa fase crítica en la que se quema capital a un ritmo sostenido para construir rápidamente una posición de mercado. Los ingresos crecen, pero los costes de infraestructura en la nube e investigación devoran el capital aún más rápido.

La trayectoria geopolítica

MiniMax se inserta en un panorama competitivo que está redefiniendo los equilibrios globales de la inteligencia artificial. Zhipu AI, otro actor chino de los modelos de lenguaje de gran tamaño, debutó en bolsa en Hong Kong un día antes que MiniMax, recaudando 558 millones de dólares con una subida del 13% el primer día. El mercado está asistiendo a una auténtica carrera de las startups de IA chinas hacia los mercados públicos, impulsada por el apoyo de Pekín al sector tecnológico doméstico y la necesidad de financiación masiva para competir a escala global con los gigantes occidentales.

Esta aceleración llega mientras empresas estadounidenses de la talla de OpenAI y Anthropic todavía están trabajando en los preparativos para sus ofertas públicas. OpenAI convirtió su división con fines de lucro en una sociedad de beneficio público en septiembre de 2025, señalando su intención de salir a bolsa pero sin una fecha precisa todavía. Anthropic contrató a un bufete de abogados para iniciar el proceso el mes pasado, con analistas que especulan con un posible debut antes de que acabe el año. Pero mientras tanto, los competidores chinos ya han recaudado miles de millones en los mercados públicos y están consolidando valoraciones de mercado significativas.

El embargo estadounidense sobre los chips avanzados representa el contexto geopolítico inevitable de esta historia. Las restricciones impuestas por Washington limitan el acceso chino a GPUs de última generación, obligando a los desarrolladores a trabajar con hardware H800 y H20, versiones deliberadamente menos potentes que las A100 e H100 disponibles libremente en Occidente. La respuesta china ha sido doble y coordinada: por un lado, una optimización de software llevada al límite físico de las posibilidades; por otro, estrategias de código abierto agresivas que transforman un vínculo en oportunidad. MiniMax ha publicado los pesos completos del modelo en Hugging Face bajo una licencia MIT modificada que solo requiere la visualización de la mención «MiniMax M2.5» en las aplicaciones, con código fuente disponible también en GitHub. Es el mismo enfoque ya visto con DeepSeek, Qwen, Kimi: transparencia forzada por las circunstancias que se transforma en ventaja competitiva.

Arquitectura técnica y entrenamiento

La arquitectura de expertos mixtos no es una novedad absoluta en el panorama de los modelos de lenguaje, pero MiniMax la ha perfeccionado con un marco de aprendizaje por refuerzo propio llamado Forge. El sistema introduce un nivel intermedio que desacopla completamente el motor de entrenamiento e inferencia del agente real, soportando la integración de agentes arbitrarios y permitiendo optimizar la generalización del modelo entre diferentes estructuras de agentes y herramientas. Una estrategia de fusión estructurada en árbol para las muestras produjo una aceleración de unas 40 veces respecto a los enfoques anteriores.

En el frente algorítmico, la empresa ha seguido utilizando CISPO, un algoritmo propio propuesto a principios de 2025 para garantizar la estabilidad de los modelos de expertos mixtos durante el entrenamiento a gran escala. Lightning Attention, el otro componente técnico relevante de la arquitectura, permite al modelo gestionar ventanas de contexto de hasta 204.800 tokens, con la arquitectura subyacente que soporta teóricamente hasta un millón de tokens. La capacidad de salida alcanza los 128.000 tokens.

Imagen tomada de minimax.io

Código abierto y seguridad de los datos

La decisión de publicar los pesos completos del modelo en código abierto presenta ventajas y riesgos que merecen un análisis equilibrado. En el lado positivo encontramos la accesibilidad para desarrolladores e investigadores independientes, la posibilidad concreta de realizar auditorías de seguridad transparentes, la construcción de una comunidad global que puede contribuir a la mejora continua. En el lado negativo persisten preocupaciones legítimas sobre la residencia física de los datos procesados, posibles sesgos incorporados durante el entrenamiento en conjuntos de datos chinos, cuestiones complejas de alineación del modelo respecto a valores culturales diferentes.

El prospecto de la IPO de MiniMax revela que solo el 26% de los ingresos de la empresa provienen de China continental, el 20% de Estados Unidos, el resto de Singapur y otros mercados internacionales. La base de usuarios mensuales activos pasó de 3,1 millones en 2023 a 27,6 millones en septiembre de 2025. Son cifras que pintan un modelo con ambiciones y presencia globales, no un campeón puramente doméstico confinado al mercado chino.

Pero para empresas y organizaciones europeas que evalúan concretamente la adopción del M2.5, la procedencia geográfica del modelo plantea preguntas que no pueden ser ignoradas. ¿Dónde residen físicamente los datos procesados por las APIs? ¿Qué garantías concretas existen contra posibles accesos no autorizados por parte de autoridades gubernamentales? La licencia de código abierto permite el despliegue completamente local, mitigando algunos de estos riesgos a través del control directo de la infraestructura, pero no elimina completamente las preocupaciones sobre la cadena de suministro del software.

MiniMax ha publicado métricas de alineación que muestran una reducción del 41% en los errores de alucinación respecto al M2.1 en el benchmark AA-Omniscience, situándose de todos modos en una puntuación de -30 frente al -41 de Opus 4.6. La brecha es significativa pero probablemente no prohibitiva para muchas aplicaciones prácticas menos críticas.

Sostenibilidad económica y futuro

El modelo de negocio de bajo coste de MiniMax plantea interrogantes profundos sobre la sostenibilidad a largo plazo de toda la operación. Vender inteligencia artificial de frontera a una veinteava parte del precio de los competidores occidentales funciona brillantemente como estrategia de adquisición de usuarios y penetración de mercado, pero ¿puede sostenerse realmente cuando la empresa tenga que mostrar a los inversores un camino creíble hacia la rentabilidad? MiniMax gastó más de 150 millones de dólares en servicios en la nube en 2025, con investigación y desarrollo que consumieron unos 250 millones adicionales. Son 400 millones de dólares anuales quemados solo para mantenerse competitivos en la carrera tecnológica global.

La respuesta de la empresa podría residir en una combinación inteligente de volumen masivo y eficiencia técnica extrema. Si el precio derriba drásticamente las barreras a la adopción, el número total de usuarios y aplicaciones puede escalar muy rápidamente, compensando los márgenes estrechos con los volúmenes. Pero existe de todos modos un límite físico más allá del cual la matemática simplemente deja de cuadrar: las GPUs tienen un coste real, la energía eléctrica tiene un coste real, la ingeniería de sistemas tiene un coste real. La presión sobre los márgenes acabará inevitablemente por apretar.

La IPO proporciona de todos modos una ventana de tiempo valiosa. Los 619 millones de dólares recaudados compran margen operativo para al menos un par de años, permiten inversiones masivas en el escalado de la infraestructura, dan respiro para perfeccionar tanto el modelo como la oferta comercial global. Pero la capitalización de mercado de 13.000 millones de dólares implica expectativas muy elevadas sobre los resultados futuros.

Implicaciones para el mercado europeo

Para desarrolladores y empresas españolas y europeas que evalúan concretamente la adopción de nuevas tecnologías de IA, el M2.5 representa una opción que merece una evaluación atenta y ponderada. La relación calidad-precio es objetivamente innegable mirando las cifras puras. La posibilidad de despliegue completamente local a través de los pesos de código abierto mitiga algunas de las preocupaciones más urgentes sobre la privacidad de los datos. Pero existen compensaciones reales a considerar con atención: la documentación disponible está predominantemente en inglés y chino, el soporte empresarial dedicado es todavía menos maduro que el de los proveedores occidentales consolidados como Anthropic u OpenAI.

Por otro lado, el coste dramáticamente inferior permite experimentaciones que serían simplemente prohibitivas económicamente con Claude Opus o GPT-5 a los precios actuales. Para startups innovadoras y pequeñas y medianas empresas con restricciones presupuestarias estrictas, la diferencia práctica entre gastar 1.000 euros al mes y gastar 20.000 euros al mes puede determinar literalmente la viabilidad misma de un proyecto ambicioso o su muerte prematura.

La cuestión geopolítica más amplia permanece de todos modos en segundo plano, pero no desaparece en absoluto. La Unión Europea está trabajando intensamente en la Ley de IA y la Ley de Servicios Digitales, tratando fatigosamente de equilibrar la innovación tecnológica y la protección de los ciudadanos. ¿Cómo encajan exactamente los modelos chinos de código abierto en este marco regulatorio todavía en evolución? Las respuestas definitivas todavía no están del todo claras, pero las preguntas son absolutamente legítimas y necesarias para una evaluación responsable.

Preguntas todavía abiertas

MiniMax M2.5 llega al mercado en un momento histórico particularmente delicado para la industria de la inteligencia artificial. La euforia inicial por los modelos de lenguaje de gran tamaño persiste ciertamente, pero crece en paralelo también un escepticismo cada vez más extendido sobre los costes astronómicos y los resultados concretos efectivamente medibles. Las empresas quieren ver retornos tangibles sobre la inversión en IA, no solo demos técnicas impresionantes para mostrar a los inversores.

¿Qué tan robusto es realmente el modelo en escenarios de producción complejos no previstos explícitamente durante el entrenamiento? ¿Cómo gestiona concretamente casos límite inesperados, requisitos inusuales específicos de dominios particulares, contextos profundamente ambiguos que requieren juicio humano? Los benchmarks estandarizados captan inevitablemente solo una dimensión restringida de la calidad global de un sistema de IA. El uso real en producción expone complejidades y desafíos que ninguna prueba controlada puede anticipar completamente. Se necesitarán meses de despliegue a escala industrial para tener un cuadro realmente definitivo.

La competición global en la inteligencia artificial se está desplazando rápidamente de «quién construye el cerebro más grande» hacia «quién construye el cerebro más útil y accesible al mayor número de usuarios». Es un cambio de paradigma profundo que favorece sistemáticamente la eficiencia operativa, la optimización inteligente de los recursos, la ingeniería atenta de los sistemas respecto a la pura potencia computacional bruta. En este escenario en evolución, los vínculos de hardware impuestos por el embargo estadounidense podrían revelarse, paradójicamente, como una ventaja competitiva duradera y estructural para todo el ecosistema chino de la IA.

El futuro del liderazgo tecnológico en la inteligencia artificial podría, por tanto, no estar determinado principalmente por quién posee los chips más potentes y avanzados, sino más bien por quién consigue concretamente hacer más con menos recursos. MiniMax M2.5 es una señal precisa e inequívoca en esta dirección estratégica.

MiniMax M2.5: bajos costes, alto rendimiento, relanza el desafío geopolítico de la IA china

El modelo que piensa como un arquitecto

La cuestión del precio que lo cambia todo