MiniMax M3: el modelo chino open-weights que iguala a los gigantes cerrados

Un modelo open-weights que no pide permiso

El 1 de junio de 2026, MiniMax —el unicornio chino de IA con sede en Shanghái— lanzó M3, su modelo fundacional de nueva generación. La propuesta es ambiciosa: es el primer modelo open-weights que combina coding de nivel frontier, una ventana de contexto de un millón de tokens y multimodalidad nativa en una sola arquitectura. Nada de pegar módulos después —todo entrenado desde el primer paso de datos de texto, imagen y vídeo mezclados entre sí.

La arquitectura: atención dispersa que reduce el costo a una veinteava parte

El corazón técnico de M3 es MiniMax Sparse Attention (MSA), una arquitectura de atención dispersa que reemplaza la atención completa de su generación anterior. Un módulo ligero de indexación escanea los tokens entrantes y selecciona qué bloques del cache de key-value merecen atención; luego ejecuta la atención costosa solo sobre esos bloques.

Los números son contundentes: a un millón de tokens de contexto, el costo de computación por token se redujo a 1/20 de la generación M2. El prefill se aceleró más de 9 veces y la decodificación más de 15 veces. A eso se suma una velocidad de salida de 100 tokens por segundo, aproximadamente tres veces más rápido que Claude Opus.

Mixture-of-Experts: 229 mil millones de parámetros, 9.8 mil millones activos

M3 es un modelo MoE (Mixture-of-Experts) con 229,900 millones de parámetros totales distribuidos en 256 expertos, pero solo 9,800 millones se activan por token. La traducción práctica: capacidad de modelo gigante con costo de inferencia de modelo mediano.

Benchmarks: supera a GPT-5.5 y Gemini 3.1 Pro

En las evaluaciones publicadas por MiniMax, M3 muestra resultados competitivos con los mejores modelos cerrados:

SWE-Bench Pro: 59.0% —supera a GPT-5.5 y Gemini 3.1 Pro, se acerca a Claude Opus 4.7
Terminal-Bench 2.1: 66.0% —casi idéntico a Opus 4.7 (66.1%)
OSWorld-Verified: 70.0% —capacidad de operar interfaces de escritorio
BrowseComp: 83.5% —el más alto entre los modelos evaluados
SVG-Bench: supera a Opus 4.7 en generación de gráficos

Un resultado particularmente llamativo: M3 reprodujo autónomamente los experimentos de un paper de ICLR (International Conference on Learning Representations, una de las conferencias de investigación en IA más prestigiosas del mundo) en 12 horas, corrió 24 horas sin código de referencia llamando herramientas casi 2,000 veces, y mejoró la utilización de hardware FP8 (un formato de punto flotante de 8 bits usado para acelerar el entrenamiento e inferencia de modelos de IA en GPUs modernas) en la arquitectura Hopper (la generación de GPUs de NVIDIA que incluye los chips H100 y H200, diseñados específicamente para cargas de trabajo de IA) del 7.6% al 71.3%.

El precio como argumento

La API de M3 llega con un descuento del 50% durante la primera semana: $0.30 por millón de tokens de entrada y $1.20 de salida. Con cache optimizada, el costo combinado baja a $0.06 por millón. Los planes mensuales van desde $20 (Plus) hasta $120 (Ultra).

Para contexto: los modelos cerrados de nivel frontier cuestan entre $15 y $75 por millón de tokens de entrada. M3 ofrece un precio de entrada 50 a 250 veces menor.

Open-weights en 10 días

MiniMax prometió publicar los pesos del modelo y el informe técnico completo en Hugging Face y GitHub dentro de aproximadamente 10 días desde el lanzamiento. Esto convertiría a M3 en el primer modelo open-weights de esta clase disponible para fine-tuning y despliegue en clusters privados.

El momento de MiniMax

El lanzamiento de M3 llegó en un momento estratégico: la empresa se prepara para cotizar en el Star Market de Shanghái, complementando su cotización actual en Hong Kong. Las acciones subieron más de 5% al anunciarse el lanzamiento, aunque después corrigieron a la baja.

La pregunta que deja M3 no es solo técnica —es económica. Si un modelo open-weights puede acercarse al rendimiento de Opus a una fracción del costo, ¿cuánto tiempo más pueden los gigantes cerrados justificar sus precios?

Fuentes

MiniMax Blog: "MiniMax M3: Frontier Coding, 1M Context, Native Multimodality" (junio 2026)
TechTimes: "MiniMax M3 Open-Weight Coding Model: Frontier Claims, Unverified Benchmarks" (junio 2026)
South China Morning Post: "MiniMax debuts AI model built for long and complex coding tasks" (junio 2026)
WebReactivа: "MiniMax M3: el open-weight que se atreve a mirar a Opus" (junio 2026)
Pandaily: "MiniMax Launches M3 Model With 1M Context and Native Multimodality" (junio 2026)