Files
Rdmclin2 60bed5782f chore: update i18n (#15712)
chore: update i18n files
2026-06-12 16:21:34 +08:00

1350 lines
337 KiB
JSON
Raw Permalink Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
{
"01-ai/yi-1.5-34b-chat.description": "El modelo ajustado de código abierto más reciente de 01.AI con 34 mil millones de parámetros, compatible con múltiples escenarios de diálogo, entrenado con datos de alta calidad y alineado con las preferencias humanas.",
"01-ai/yi-1.5-9b-chat.description": "El modelo ajustado de código abierto más reciente de 01.AI con 9 mil millones de parámetros, compatible con múltiples escenarios de diálogo, entrenado con datos de alta calidad y alineado con las preferencias humanas.",
"360/deepseek-r1.description": "DeepSeek-R1, desplegado a gran escala por 360, utiliza aprendizaje por refuerzo (RL) en la etapa de postentrenamiento para mejorar significativamente el razonamiento con una mínima cantidad de datos etiquetados. Alcanza el nivel del modelo OpenAI o1 en tareas de matemáticas, programación y razonamiento en lenguaje natural.",
"360gpt-pro-trans.description": "Modelo especializado en traducción, ajustado en profundidad para ofrecer una calidad de traducción líder en su clase.",
"360gpt-pro.description": "360GPT Pro es un modelo clave de IA de 360 con procesamiento de texto eficiente para diversos escenarios de PLN, compatible con comprensión de textos largos y diálogos de múltiples turnos.",
"360gpt-turbo-responsibility-8k.description": "360GPT Turbo Responsibility 8K pone énfasis en la seguridad semántica y la responsabilidad en aplicaciones sensibles al contenido, garantizando experiencias precisas y sólidas para el usuario.",
"360gpt-turbo.description": "360GPT Turbo ofrece gran capacidad de cómputo y conversación con excelente comprensión semántica y eficiencia en generación, ideal para empresas y desarrolladores.",
"360gpt2-o1.description": "360gpt2-o1 construye cadenas de pensamiento mediante búsqueda en árbol con un mecanismo de reflexión y entrenamiento por RL, lo que permite autorreflexión y autocorrección.",
"360gpt2-pro.description": "360GPT2 Pro es un modelo avanzado de PLN de 360 con excelente generación y comprensión de texto, especialmente para tareas creativas, transformaciones complejas y simulación de roles.",
"360zhinao2-o1.5.description": "360 Zhinao, el modelo de razonamiento más poderoso, con las capacidades más avanzadas y soporte tanto para llamadas de herramientas como para razonamientos complejos.",
"360zhinao2-o1.description": "360zhinao2-o1 construye cadenas de pensamiento mediante búsqueda en árbol con un mecanismo de reflexión y entrenamiento por RL, lo que permite autorreflexión y autocorrección.",
"360zhinao3-o1.5.description": "360 Zhinao, modelo de razonamiento de próxima generación.",
"4.0Ultra.description": "Spark Ultra es el modelo más potente de la serie Spark, mejorando la comprensión y resumen de texto, además de optimizar la búsqueda web. Es una solución integral para aumentar la productividad en el trabajo y ofrecer respuestas precisas, posicionándose como un producto inteligente líder.",
"AnimeSharp.description": "AnimeSharp (también conocido como \"4x-AnimeSharp\") es un modelo de superresolución de código abierto basado en ESRGAN desarrollado por Kim2091, enfocado en escalar y mejorar imágenes de estilo anime. Fue renombrado desde \"4x-TextSharpV1\" en febrero de 2022, originalmente también para imágenes de texto, pero optimizado fuertemente para contenido anime.",
"Baichuan-M2-Plus.description": "Presentamos BaichuanM2, un modelo de razonamiento con capacidades médicas mejoradas, diseñado para tareas de razonamiento clínico en escenarios reales. Partimos de preguntas médicas reales y realizamos entrenamiento mediante aprendizaje por refuerzo basado en un sistema de verificación a gran escala. Manteniendo las capacidades generales del modelo, BaichuanM2 logra un avance decisivo en eficacia médica. Es el mejor modelo médico de código abierto del mundo hasta la fecha. Supera a todos los modelos de código abierto, incluido gptoss120b, así como a muchos modelos cerrados de vanguardia en el benchmark HealthBench. Es el modelo de código abierto más cercano a GPT5 en capacidades médicas. Nuestra experiencia demuestra que un verificador sólido es crucial para conectar las capacidades del modelo con el mundo real, y que un enfoque de aprendizaje por refuerzo de extremo a extremo mejora fundamentalmente las habilidades de razonamiento médico. La publicación de BaichuanM2 impulsa el avance tecnológico en el campo de la inteligencia artificial médica.",
"Baichuan-M2.description": "Presentamos BaichuanM2, un modelo de razonamiento con capacidades médicas mejoradas, diseñado para tareas de razonamiento clínico en escenarios reales. Partimos de preguntas médicas reales y realizamos entrenamiento mediante aprendizaje por refuerzo basado en un sistema de verificación a gran escala. Manteniendo las capacidades generales del modelo, BaichuanM2 logra un avance decisivo en eficacia médica. Es el mejor modelo médico de código abierto del mundo hasta la fecha. Supera a todos los modelos de código abierto, incluido gptoss120b, así como a muchos modelos cerrados de vanguardia en el benchmark HealthBench. Es el modelo de código abierto más cercano a GPT5 en capacidades médicas. Nuestra experiencia demuestra que un verificador sólido es crucial para conectar las capacidades del modelo con el mundo real, y que un enfoque de aprendizaje por refuerzo de extremo a extremo mejora fundamentalmente las habilidades de razonamiento médico. La publicación de BaichuanM2 impulsa el avance tecnológico en el campo de la inteligencia artificial médica.",
"Baichuan-M3-Plus.description": "Presentamos BaichuanM3, un modelo de lenguaje de nueva generación mejorado para tareas médicas, diseñado para ofrecer asistencia clínica de nivel profesional. A diferencia de los enfoques previos centrados en preguntas estáticas o interacciones superficiales, BaichuanM3 se entrena para modelar explícitamente el proceso de toma de decisiones clínicas, con el objetivo de mejorar la fiabilidad y utilidad en la práctica médica real. En lugar de limitarse a producir respuestas plausibles, realizar preguntas fluidas o dar recomendaciones vagas como “debe acudir al médico lo antes posible”, BaichuanM3 está entrenado explícitamente para adquirir información clínica crítica, construir trayectorias de razonamiento coherentes y limitar de forma sistemática los comportamientos propensos a alucinaciones durante todo el proceso de decisión. Este diseño dota al modelo de capacidades médicas intrínsecas alineadas con los flujos de trabajo clínicos reales. En evaluaciones de consulta clínica, robustez ante alucinaciones médicas, HealthBench y HealthBenchHard, BaichuanM3 supera al último modelo insignia de OpenAI, GPT5.2, estableciendo un nuevo referente en modelos de lenguaje mejorados para tareas médicas.",
"Baichuan-M3.description": "Presentamos BaichuanM3, un modelo de lenguaje de nueva generación mejorado para tareas médicas, diseñado para ofrecer asistencia clínica de nivel profesional. A diferencia de los enfoques previos centrados en preguntas estáticas o interacciones superficiales, BaichuanM3 se entrena para modelar explícitamente el proceso de toma de decisiones clínicas, con el objetivo de mejorar la fiabilidad y utilidad en la práctica médica real. En lugar de limitarse a producir respuestas plausibles, realizar preguntas fluidas o dar recomendaciones vagas como “debe acudir al médico lo antes posible”, BaichuanM3 está entrenado explícitamente para adquirir información clínica crítica, construir trayectorias de razonamiento coherentes y limitar de forma sistemática los comportamientos propensos a alucinaciones durante todo el proceso de decisión. Este diseño dota al modelo de capacidades médicas intrínsecas alineadas con los flujos de trabajo clínicos reales. En evaluaciones de consulta clínica, robustez ante alucinaciones médicas, HealthBench y HealthBenchHard, BaichuanM3 supera al último modelo insignia de OpenAI, GPT5.2, estableciendo un nuevo referente en modelos de lenguaje mejorados para tareas médicas.",
"Baichuan2-Turbo.description": "Utiliza aumento por búsqueda para conectar el modelo con conocimiento de dominio y de la web. Admite cargas de archivos PDF/Word e ingreso de URLs para una recuperación oportuna y completa, con resultados profesionales y precisos.",
"Baichuan3-Turbo-128k.description": "Con una ventana de contexto ultra larga de 128K, está optimizado para escenarios empresariales de alta frecuencia con grandes mejoras y alto valor. En comparación con Baichuan2, la creación de contenido mejora un 20 %, las preguntas y respuestas de conocimiento un 17 % y la simulación de roles un 40 %. Su rendimiento general supera al de GPT-3.5.",
"Baichuan3-Turbo.description": "Optimizado para escenarios empresariales de alta frecuencia con grandes mejoras y alto valor. En comparación con Baichuan2, la creación de contenido mejora un 20 %, las preguntas y respuestas de conocimiento un 17 % y la simulación de roles un 40 %. Su rendimiento general supera al de GPT-3.5.",
"Baichuan4-Air.description": "Modelo de alto rendimiento en China, que supera a modelos internacionales en tareas en chino como conocimiento, texto largo y generación creativa. También cuenta con capacidades multimodales líderes en la industria con resultados sólidos en pruebas de referencia autorizadas.",
"Baichuan4-Turbo.description": "Modelo de alto rendimiento en China, que supera a modelos internacionales en tareas en chino como conocimiento, texto largo y generación creativa. También cuenta con capacidades multimodales líderes en la industria con resultados sólidos en pruebas de referencia autorizadas.",
"Baichuan4.description": "Rendimiento nacional líder, superando a modelos internacionales en tareas en chino como conocimiento enciclopédico, texto largo y generación creativa. También ofrece capacidades multimodales líderes en la industria y resultados sólidos en pruebas de referencia.",
"ByteDance-Seed/Seed-OSS-36B-Instruct.description": "Seed-OSS es una familia de modelos LLM de código abierto de ByteDance Seed, diseñados para manejar contextos largos, razonamiento, agentes y habilidades generales. Seed-OSS-36B-Instruct es un modelo de 36B ajustado por instrucciones con contexto ultra largo nativo para procesar documentos o bases de código extensas. Está optimizado para razonamiento, generación de código y tareas de agente (uso de herramientas), manteniendo una gran capacidad general. Una característica clave es el \"Presupuesto de Pensamiento\", que permite una longitud de razonamiento flexible para mejorar la eficiencia.",
"DeepSeek-OCR.description": "DeepSeek-OCR es un modelo visiónlenguaje de DeepSeek AI centrado en OCR y en la “compresión óptica de contexto”. Explora la compresión de contexto a partir de imágenes, procesa documentos de forma eficiente y los convierte en texto estructurado (por ejemplo, Markdown). Reconoce texto en imágenes con alta precisión, ideal para la digitalización de documentos, extracción de texto y procesamiento estructurado.",
"DeepSeek-R1-Distill-Llama-70B.description": "DeepSeek R1, el modelo más grande e inteligente de la suite DeepSeek, ha sido destilado en la arquitectura Llama 70B. Las pruebas de referencia y evaluaciones humanas muestran que es más inteligente que el Llama 70B base, especialmente en tareas de matemáticas y precisión factual.",
"DeepSeek-R1-Distill-Qwen-1.5B.description": "Modelo destilado de DeepSeek-R1 basado en Qwen2.5-Math-1.5B. El aprendizaje por refuerzo y los datos de arranque en frío optimizan el rendimiento en razonamiento, estableciendo nuevos estándares de referencia multitarea para modelos abiertos.",
"DeepSeek-R1-Distill-Qwen-14B.description": "Un modelo destilado DeepSeek-R1 basado en Qwen2.5-14B. El aprendizaje por refuerzo y los datos de inicio en frío optimizan el rendimiento en razonamiento, estableciendo nuevos estándares de referencia multitarea para modelos abiertos.",
"DeepSeek-R1-Distill-Qwen-32B.description": "La serie DeepSeek-R1 mejora el rendimiento en razonamiento con aprendizaje por refuerzo y datos de inicio en frío, estableciendo nuevos estándares de referencia multitarea para modelos abiertos y superando a OpenAI o1-mini.",
"DeepSeek-R1-Distill-Qwen-7B.description": "Modelo destilado de DeepSeek-R1 basado en Qwen2.5-Math-7B. El aprendizaje por refuerzo y los datos de arranque en frío optimizan el rendimiento en razonamiento, estableciendo nuevos estándares de referencia multitarea para modelos abiertos.",
"DeepSeek-R1.description": "Modelo eficiente de última generación, destacado en razonamiento, matemáticas y programación.",
"DeepSeek-V3-1.description": "DeepSeek V3.1 es un modelo de razonamiento de nueva generación con mejoras en razonamiento complejo y cadenas de pensamiento, adecuado para tareas de análisis profundo.",
"DeepSeek-V3-Fast.description": "Proveedor: sophnet. DeepSeek V3 Fast es la versión de alta velocidad de DeepSeek V3 0324, de precisión completa (sin cuantización), con mejor rendimiento en código y matemáticas y respuestas más rápidas.",
"DeepSeek-V3.1-Think.description": "Modo de pensamiento de DeepSeek-V3.1: un nuevo modelo de razonamiento híbrido con modos de pensamiento y no pensamiento, más eficiente que DeepSeek-R1-0528. Las optimizaciones posteriores al entrenamiento mejoran significativamente el uso de herramientas de agente y el rendimiento en tareas de agente.",
"DeepSeek-V3.2.description": "deepseek-v3.2 incorpora un mecanismo de atención dispersa para mejorar la eficiencia de entrenamiento e inferencia al procesar textos largos, con un precio inferior al de deepseek-v3.1.",
"DeepSeek-V3.description": "El despliegue abierto de Volcengine de ByteDance es actualmente el más estable; recomendado. Ha sido actualizado automáticamente a la última versión (250324).",
"Doubao-lite-128k.description": "Doubao-lite ofrece respuestas ultra rápidas y mejor relación calidad-precio, con opciones flexibles para distintos escenarios. Admite contexto de 128K para inferencia y ajuste fino.",
"Doubao-lite-32k.description": "Doubao-lite ofrece respuestas ultra rápidas y mejor relación calidad-precio, con opciones flexibles para distintos escenarios. Admite contexto de 32K para inferencia y ajuste fino.",
"Doubao-lite-4k.description": "Doubao-lite ofrece respuestas ultra rápidas y mejor relación calidad-precio, con opciones flexibles para distintos escenarios. Admite contexto de 4K para inferencia y ajuste fino.",
"Doubao-pro-128k.description": "Modelo insignia de mejor rendimiento para tareas complejas, con gran capacidad en preguntas y respuestas con referencia, resumen, creación, clasificación y simulación de roles. Admite contexto de 128K para inferencia y ajuste fino.",
"Doubao-pro-32k.description": "Modelo insignia de mejor rendimiento para tareas complejas, con gran capacidad en preguntas y respuestas con referencia, resumen, creación, clasificación y simulación de roles. Admite contexto de 32K para inferencia y ajuste fino.",
"Doubao-pro-4k.description": "Modelo insignia de mejor rendimiento para tareas complejas, con gran capacidad en preguntas y respuestas con referencia, resumen, creación, clasificación y simulación de roles. Admite contexto de 4K para inferencia y ajuste fino.",
"DreamO.description": "DreamO es un modelo de personalización de imágenes de código abierto desarrollado conjuntamente por ByteDance y la Universidad de Pekín, que utiliza una arquitectura unificada para admitir generación de imágenes multitarea. Emplea modelado composicional eficiente para generar imágenes altamente coherentes y personalizadas según identidad, tema, estilo, fondo y otras condiciones especificadas por el usuario.",
"ERNIE-3.5-128K.description": "Modelo LLM insignia de Baidu, entrenado con grandes corpus en chino e inglés. Posee sólidas capacidades generales para chat, creación y uso de complementos. Admite integración automática con el complemento de búsqueda de Baidu para ofrecer respuestas actualizadas.",
"ERNIE-3.5-8K-Preview.description": "Modelo LLM insignia de Baidu, entrenado con grandes corpus en chino e inglés. Posee sólidas capacidades generales para chat, creación y uso de complementos. Admite integración automática con el complemento de búsqueda de Baidu para ofrecer respuestas actualizadas.",
"ERNIE-3.5-8K.description": "Modelo LLM insignia de Baidu, entrenado con grandes corpus en chino e inglés. Posee sólidas capacidades generales para chat, creación y uso de complementos. Admite integración automática con el complemento de búsqueda de Baidu para ofrecer respuestas actualizadas.",
"ERNIE-4.0-8K-Latest.description": "Modelo LLM ultra grande insignia de Baidu con mejoras integrales respecto a ERNIE 3.5, adecuado para tareas complejas en múltiples dominios. Admite integración con el complemento de búsqueda de Baidu para respuestas actualizadas.",
"ERNIE-4.0-8K-Preview.description": "Modelo LLM ultra grande insignia de Baidu con mejoras integrales respecto a ERNIE 3.5, adecuado para tareas complejas en múltiples dominios. Admite integración con el complemento de búsqueda de Baidu para respuestas actualizadas.",
"ERNIE-4.0-Turbo-8K-Latest.description": "Modelo LLM ultra grande insignia de Baidu con un rendimiento general sólido para tareas complejas. Incluye integración con el complemento de búsqueda de Baidu para respuestas actualizadas. Supera a ERNIE 4.0.",
"ERNIE-4.0-Turbo-8K-Preview.description": "Modelo LLM ultra grande insignia de Baidu con un rendimiento general sólido para tareas complejas. Incluye integración con el complemento de búsqueda de Baidu para respuestas actualizadas. Supera a ERNIE 4.0.",
"ERNIE-Character-8K.description": "Modelo LLM de dominio vertical de Baidu para NPCs de videojuegos, atención al cliente y juegos de rol. Ofrece mayor coherencia de personaje, mejor seguimiento de instrucciones y razonamiento más sólido.",
"ERNIE-Lite-Pro-128K.description": "Modelo LLM ligero de Baidu que equilibra calidad y rendimiento de inferencia. Supera a ERNIE Lite y es adecuado para aceleradores de bajo consumo.",
"ERNIE-Speed-128K.description": "Modelo LLM de alto rendimiento más reciente de Baidu (2024), con sólidas capacidades generales. Ideal como base para ajustes finos en escenarios específicos, con excelente rendimiento en razonamiento.",
"ERNIE-Speed-Pro-128K.description": "Modelo LLM de alto rendimiento más reciente de Baidu (2024), con sólidas capacidades generales. Supera a ERNIE Speed y es ideal como base para ajustes finos, con excelente rendimiento en razonamiento.",
"FLUX-1.1-pro.description": "FLUX.1.1 Pro",
"FLUX.1-Kontext-dev.description": "FLUX.1-Kontext-dev es un modelo multimodal de generación y edición de imágenes de Black Forest Labs, basado en una arquitectura Rectified Flow Transformer con 12 mil millones de parámetros. Se centra en generar, reconstruir, mejorar o editar imágenes bajo condiciones contextuales dadas. Combina la generación controlada de los modelos de difusión con el modelado contextual de Transformers, ofreciendo resultados de alta calidad para tareas como inpainting, outpainting y reconstrucción de escenas visuales.",
"FLUX.1-Kontext-pro.description": "FLUX.1 Kontext [pro]",
"FLUX.1-dev.description": "FLUX.1-dev es un modelo de lenguaje multimodal de código abierto (MLLM) de Black Forest Labs, optimizado para tareas de imagen y texto. Combina comprensión y generación de imagen/texto. Basado en LLMs avanzados (como Mistral-7B), utiliza un codificador visual cuidadosamente diseñado y ajuste por etapas para lograr coordinación multimodal y razonamiento complejo.",
"GLM-4.5-Air.description": "GLM-4.5-Air: Versión ligera para respuestas rápidas.",
"GLM-4.5.description": "GLM-4.5: Modelo de alto rendimiento para razonamiento, programación y tareas de agentes.",
"GLM-4.6.description": "GLM-4.6: Modelo de la generación anterior.",
"GLM-4.7.description": "GLM-4.7 es el modelo insignia más reciente de Zhipu, mejorado para escenarios de codificación agentiva con capacidades de programación avanzadas, planificación de tareas a largo plazo y colaboración con herramientas.",
"GLM-5-Turbo.description": "GLM-5-Turbo es un modelo base profundamente optimizado para escenarios agentivos. Ha sido específicamente ajustado desde la fase de entrenamiento para cubrir los requisitos fundamentales de las tareas de agentes, mejorando capacidades clave como la invocación de herramientas, el seguimiento de instrucciones y la ejecución de cadenas largas. Es ideal para construir asistentes agentivos de alto rendimiento.",
"GLM-5.1.description": "GLM-5.1 es el último modelo insignia de Zhipu, una iteración mejorada del GLM-5 con capacidades avanzadas de ingeniería agéntica para sistemas complejos y tareas de largo alcance.",
"GLM-5.description": "GLM-5 es el modelo base insignia de nueva generación de Zhipu, diseñado específicamente para la Ingeniería Agentiva. Ofrece productividad fiable en ingeniería de sistemas complejos y tareas agentivas de largo horizonte. En capacidades de programación y agentes, GLM-5 alcanza un rendimiento líder entre los modelos de código abierto. En escenarios reales de programación, su experiencia de uso se acerca a la de Claude Opus 4.5. Destaca en ingeniería de sistemas avanzados y tareas agentivas prolongadas, siendo un modelo base ideal para asistentes agentivos de propósito general.",
"Gryphe/MythoMax-L2-13b.description": "MythoMax-L2 (13B) es un modelo innovador para dominios diversos y tareas complejas.",
"HelloMeme.description": "HelloMeme es una herramienta de IA que genera memes, GIFs o videos cortos a partir de imágenes o movimientos proporcionados. No requiere habilidades de dibujo ni programación: solo una imagen de referencia para crear contenido divertido, atractivo y estilísticamente coherente.",
"HiDream-E1-Full.description": "HiDream-E1-Full es un modelo de edición de imágenes multimodal de código abierto de HiDream.ai, basado en una avanzada arquitectura Diffusion Transformer y una sólida comprensión del lenguaje (LLaMA 3.1-8B-Instruct incorporado). Admite generación de imágenes impulsada por lenguaje natural, transferencia de estilo, ediciones locales y repintado, con excelente comprensión y ejecución de texto e imagen.",
"HiDream-I1-Full.description": "HiDream-I1 es un nuevo modelo de generación de imágenes base de código abierto lanzado por HiDream. Con 17 mil millones de parámetros (Flux tiene 12 mil millones), puede ofrecer calidad de imagen líder en la industria en segundos.",
"HunyuanDiT-v1.2-Diffusers-Distilled.description": "hunyuandit-v1.2-distilled es un modelo ligero de texto a imagen optimizado mediante destilación para generar imágenes de alta calidad rápidamente, especialmente adecuado para entornos con pocos recursos y generación en tiempo real.",
"I2V-01-Director.description": "Se ha lanzado oficialmente un modelo de generación de video a nivel de director, ofreciendo una mejor adherencia a las instrucciones de movimiento de cámara y un lenguaje narrativo cinematográfico.",
"I2V-01-live.description": "Rendimiento mejorado de los personajes: más estable, fluido y vívido.",
"I2V-01.description": "El modelo base de imagen a video de la serie 01.",
"InstantCharacter.description": "InstantCharacter es un modelo de generación de personajes personalizados sin necesidad de ajuste, lanzado por Tencent AI en 2025. Permite generar personajes con alta fidelidad y consistencia entre escenarios. Puede modelar un personaje a partir de una sola imagen de referencia y transferirlo con flexibilidad entre estilos, acciones y fondos.",
"InternVL2-8B.description": "InternVL2-8B es un potente modelo visión-lenguaje que admite procesamiento multimodal imagen-texto, reconociendo con precisión el contenido visual y generando descripciones o respuestas relevantes.",
"InternVL2.5-26B.description": "InternVL2.5-26B es un potente modelo visión-lenguaje que admite procesamiento multimodal imagen-texto, reconociendo con precisión el contenido visual y generando descripciones o respuestas relevantes.",
"KAT-Coder-Air-V1.description": "Una versión ligera dentro de la serie KAT-Coder. Diseñada específicamente para Agentic Coding, cubre de forma completa tareas y escenarios de programación. Aprovecha el aprendizaje por refuerzo a gran escala basado en agentes, permitiendo comportamientos inteligentes emergentes y superando ampliamente a modelos comparables en rendimiento de programación.",
"KAT-Coder-Exp-72B-1010.description": "KAT-Coder-Exp-72B es la versión experimental con innovaciones de aprendizaje por refuerzo dentro de la serie KAT-Coder, logrando un rendimiento sobresaliente del 74.6% en el benchmark verificado SWE-Bench, estableciendo un nuevo récord para modelos de código abierto. Está centrado en Agentic Coding y actualmente solo es compatible con el andamiaje SWE-Agent, aunque también puede usarse para conversaciones simples.",
"KAT-Coder-Pro-V1.description": "Diseñado para Agentic Coding, cubre de forma completa tareas y escenarios de programación, logrando comportamientos inteligentes emergentes mediante aprendizaje por refuerzo a gran escala, superando notablemente a modelos similares en rendimiento de escritura de código.",
"KAT-Coder-Pro-V2.description": "El modelo de alto rendimiento más reciente del equipo Kuaishou Kwaipilot, diseñado para proyectos empresariales complejos e integración SaaS. Destaca en escenarios relacionados con programación y es compatible con varios tipos de marcos agentivos (Claude Code, OpenCode, KiloCode), con soporte nativo para OpenClaw y optimización específica para estética de interfaces frontend.",
"Kimi-K2.5.description": "Kimi K2.5 es el modelo más potente de Kimi, con rendimiento SOTA de código abierto en tareas agentivas, programación y comprensión visual. Soporta entradas multimodales y modos con y sin razonamiento.",
"Kolors.description": "Kolors es un modelo de texto a imagen desarrollado por el equipo Kolors de Kuaishou. Entrenado con miles de millones de parámetros, destaca por su calidad visual, comprensión semántica en chino y renderizado de texto.",
"Kwai-Kolors/Kolors.description": "Kolors es un modelo de difusión latente a gran escala de texto a imagen del equipo Kolors de Kuaishou. Entrenado con miles de millones de pares texto-imagen, sobresale en calidad visual, precisión semántica compleja y renderizado de texto en chino/inglés, con sólida comprensión y generación de contenido en chino.",
"Ling-2.5-1T.description": "Como el último modelo insignia en tiempo real de la serie Ling, Ling-2.5-1T introduce mejoras integrales en la arquitectura del modelo, eficiencia de tokens y alineación de preferencias, con el objetivo de elevar la calidad de la IA accesible a un nuevo nivel.",
"Ling-2.6-1T.description": "El último modelo insignia de lenguaje a gran escala, con soporte para una ventana de contexto de 1M tokens, que permite un flujo de trabajo completo desde el razonamiento lógico hasta la ejecución de tareas.",
"Ling-2.6-flash.description": "Ling-2.6-flash es el modelo de última generación con alta relación costo-rendimiento de la serie Ling. Adopta una arquitectura de Mixture-of-Experts (MoE), con un total de 100B parámetros y 6.1B parámetros activados por token, logrando un equilibrio óptimo entre rendimiento de inferencia y costo computacional.",
"Llama-3.2-11B-Vision-Instruct.description": "Razonamiento visual sólido en imágenes de alta resolución, ideal para aplicaciones de comprensión visual.",
"Llama-3.2-90B-Vision-Instruct.description": "Razonamiento avanzado de imágenes para aplicaciones de agentes de comprensión visual.",
"LongCat-2.0-Preview.description": "Las funciones principales de LongCat2.0Preview son las siguientes: diseñado para escenarios de desarrollo de agentes, con compatibilidad nativa para el uso de herramientas, razonamiento de varios pasos y tareas de contexto largo; destaca en generación de código, flujos de trabajo automatizados y ejecución de instrucciones complejas; profundamente integrado con herramientas de productividad como Claude Code, OpenClaw, OpenCode y Kilo Code.",
"M2-her.description": "Un modelo de diálogo de texto diseñado para juegos de rol y conversaciones de múltiples turnos, con personalización de personajes y expresión emocional.",
"Meta-Llama-3-3-70B-Instruct.description": "Llama 3.3 70B es un modelo Transformer versátil para tareas de chat y generación.",
"Meta-Llama-3.1-405B-Instruct.description": "Modelo de texto ajustado por instrucciones Llama 3.1, optimizado para chat multilingüe. Destaca en los principales benchmarks de la industria entre modelos abiertos y cerrados.",
"Meta-Llama-3.1-70B-Instruct.description": "Modelo de texto ajustado por instrucciones Llama 3.1, optimizado para chat multilingüe. Destaca en los principales benchmarks de la industria entre modelos abiertos y cerrados.",
"Meta-Llama-3.1-8B-Instruct.description": "Modelo de texto ajustado por instrucciones Llama 3.1, optimizado para chat multilingüe. Destaca en los principales benchmarks de la industria entre modelos abiertos y cerrados.",
"Meta-Llama-3.2-1B-Instruct.description": "Modelo de lenguaje pequeño de última generación con sólida comprensión del lenguaje, excelente razonamiento y generación de texto.",
"Meta-Llama-3.2-3B-Instruct.description": "Modelo de lenguaje pequeño de última generación con sólida comprensión del lenguaje, excelente razonamiento y generación de texto.",
"Meta-Llama-3.3-70B-Instruct.description": "Llama 3.3 es el modelo Llama multilingüe de código abierto más avanzado, con rendimiento cercano al de modelos de 405B a un costo muy bajo. Basado en Transformer y mejorado con SFT y RLHF para utilidad y seguridad. La versión ajustada por instrucciones está optimizada para chat multilingüe y supera a muchos modelos abiertos y cerrados en benchmarks de la industria. Fecha de corte de conocimiento: diciembre de 2023.",
"Meta-Llama-4-Maverick-17B-128E-Instruct-FP8.description": "Llama 4 Maverick es un modelo MoE grande con activación eficiente de expertos para un rendimiento sólido en razonamiento.",
"MiMo-V2-Pro.description": "MiMo-V2-Pro está diseñado específicamente para flujos de trabajo agentivos de alta intensidad en escenarios reales. Cuenta con más de 1 billón de parámetros totales (42B activados), adopta una arquitectura híbrida de atención innovadora y soporta una longitud de contexto extremadamente larga de hasta 1 millón de tokens. Construido sobre un potente modelo base, ampliamos continuamente los recursos computacionales para un rango más amplio de escenarios agentivos, expandiendo el espacio de acción de la inteligencia y logrando una fuerte generalización—desde programación hasta ejecución de tareas reales (“claw”).",
"MiniMax-Hailuo-02.description": "El modelo de generación de video de próxima generación, MiniMax Hailuo 02, ha sido lanzado oficialmente, soportando resolución 1080P y generación de videos de 10 segundos.",
"MiniMax-Hailuo-2.3-Fast.description": "Nuevo modelo de generación de video con mejoras integrales en movimiento corporal, realismo físico y seguimiento de instrucciones.",
"MiniMax-Hailuo-2.3.description": "Nuevo modelo de generación de video con mejoras integrales en movimiento corporal, realismo físico y seguimiento de instrucciones.",
"MiniMax-M1.description": "Nuevo modelo de razonamiento interno con 80K de cadena de pensamiento y 1M de entrada, con rendimiento comparable a los mejores modelos globales.",
"MiniMax-M2-Stable.description": "Diseñado para codificación eficiente y flujos de trabajo de agentes, con mayor concurrencia para uso comercial.",
"MiniMax-M2.1-Lightning.description": "Potentes capacidades de programación multilingüe con inferencia más rápida y eficiente.",
"MiniMax-M2.1-highspeed.description": "Potentes capacidades de programación multilingüe, con una experiencia de programación completamente mejorada. Más rápido y eficiente.",
"MiniMax-M2.1.description": "MiniMax-M2.1 es un modelo insignia de código abierto de MiniMax, enfocado en resolver tareas complejas del mundo real. Sus principales fortalezas son sus capacidades de programación multilingüe y su habilidad para resolver tareas complejas como un Agente.",
"MiniMax-M2.5-highspeed.description": "MiniMax M2.5 Highspeed: Mismo rendimiento que M2.5 con inferencia más rápida.",
"MiniMax-M2.5.description": "MiniMax-M2.5 es un modelo insignia de código abierto de gran tamaño de MiniMax, enfocado en resolver tareas complejas del mundo real. Sus principales fortalezas son las capacidades de programación multilingüe y la habilidad para resolver tareas complejas como un Agente.",
"MiniMax-M2.7-highspeed.description": "MiniMax M2.7 Highspeed: Mismo rendimiento que M2.7 con inferencia significativamente más rápida.",
"MiniMax-M2.7.description": "Primer modelo autoevolutivo con rendimiento de primer nivel en programación y tareas agentivas (~60 tps).",
"MiniMax-M2.description": "MiniMax M2: Modelo de la generación anterior.",
"MiniMax-M3.description": "Modelo fronterizo de codificación multimodal y agente con una ventana de contexto de 1M, comprensión nativa de imágenes/videos y pensamiento controlable.",
"MiniMax-Text-01.description": "MiniMax-01 introduce atención lineal a gran escala más allá de los Transformers clásicos, con 456B de parámetros y 45.9B activados por paso. Logra rendimiento de primer nivel y admite hasta 4M tokens de contexto (32× GPT-4o, 20× Claude-3.5-Sonnet).",
"MiniMaxAI/MiniMax-M2.5.description": "MiniMax-M2.5 es el último modelo de lenguaje grande desarrollado por MiniMax, entrenado mediante aprendizaje por refuerzo a gran escala en cientos de miles de entornos complejos y del mundo real. Con una arquitectura MoE y 229 mil millones de parámetros, logra un rendimiento líder en la industria en tareas como programación, uso de herramientas de agentes, búsqueda y escenarios de oficina.",
"Moonshot-Kimi-K2-Instruct.description": "1 billón de parámetros totales con 32 mil millones activos. Entre los modelos sin modo de razonamiento, es de los mejores en conocimiento avanzado, matemáticas y programación, y destaca en tareas generales de agentes. Optimizado para cargas de trabajo de agentes, puede ejecutar acciones, no solo responder preguntas. Ideal para conversaciones improvisadas, chat general y experiencias con agentes como un modelo de reflejo sin razonamiento prolongado.",
"NousResearch/Nous-Hermes-2-Mixtral-8x7B-DPO.description": "Nous Hermes 2 - Mixtral 8x7B-DPO (46,7 mil millones) es un modelo de instrucciones de alta precisión para cálculos complejos.",
"OmniConsistency.description": "OmniConsistency mejora la coherencia de estilo y la generalización en tareas de imagen a imagen mediante la introducción de Transformadores de Difusión a gran escala (DiTs) y datos estilizados emparejados, evitando la degradación del estilo.",
"PaddlePaddle/PaddleOCR-VL-1.5.description": "PaddleOCR-VL-1.5 es una versión mejorada de la serie PaddleOCR-VL, alcanzando un 94.5% de precisión en el benchmark de análisis de documentos OmniDocBench v1.5, superando a los principales modelos generales y especializados en análisis documental. Soporta de forma innovadora la localización de cuadros delimitadores irregulares para elementos de documentos, manejando eficazmente imágenes escaneadas, inclinadas y capturadas de pantalla.",
"Phi-3-medium-128k-instruct.description": "El mismo modelo Phi-3-medium con una ventana de contexto ampliada para RAG o indicaciones de pocos ejemplos.",
"Phi-3-medium-4k-instruct.description": "Un modelo de 14 mil millones de parámetros con mayor calidad que Phi-3-mini, centrado en datos de alta calidad y razonamiento intensivo.",
"Phi-3-mini-128k-instruct.description": "El mismo modelo Phi-3-mini con una ventana de contexto ampliada para RAG o indicaciones de pocos ejemplos.",
"Phi-3-mini-4k-instruct.description": "El miembro más pequeño de la familia Phi-3, optimizado para calidad y baja latencia.",
"Phi-3-small-128k-instruct.description": "El mismo modelo Phi-3-small con una ventana de contexto ampliada para RAG o indicaciones de pocos ejemplos.",
"Phi-3-small-8k-instruct.description": "Un modelo de 7 mil millones de parámetros con mayor calidad que Phi-3-mini, centrado en datos de alta calidad y razonamiento intensivo.",
"Phi-3.5-mini-instruct.description": "Una versión actualizada del modelo Phi-3-mini.",
"Phi-3.5-vision-instrust.description": "Una versión actualizada del modelo Phi-3-vision.",
"Pro/MiniMaxAI/MiniMax-M2.5.description": "MiniMax-M2.5 es el último modelo de lenguaje desarrollado por MiniMax, entrenado mediante aprendizaje por refuerzo a gran escala en cientos de miles de entornos complejos del mundo real. Con una arquitectura MoE y 229 mil millones de parámetros, logra un rendimiento líder en la industria en tareas como programación, uso de herramientas de agentes, búsqueda y escenarios de oficina.",
"Pro/Qwen/Qwen2.5-7B-Instruct.description": "Qwen2.5-7B-Instruct forma parte de la última serie de LLM de Alibaba Cloud. El modelo de 7 mil millones ofrece mejoras notables en programación y matemáticas, admite más de 29 idiomas y mejora el seguimiento de instrucciones, la comprensión de datos estructurados y la generación de salidas estructuradas (especialmente JSON).",
"Pro/deepseek-ai/DeepSeek-R1.description": "DeepSeek-R1 es un modelo de razonamiento impulsado por aprendizaje por refuerzo que reduce la repetición y mejora la legibilidad. Utiliza datos de arranque en frío antes del RL para potenciar aún más el razonamiento, iguala a OpenAI-o1 en tareas de matemáticas, programación y razonamiento, y mejora los resultados generales mediante un entrenamiento cuidadoso.",
"Pro/deepseek-ai/DeepSeek-V3.1-Terminus.description": "DeepSeek-V3.1-Terminus es una versión actualizada del modelo V3.1, posicionado como un LLM híbrido para agentes. Corrige problemas reportados por usuarios y mejora la estabilidad, coherencia lingüística y reduce caracteres anómalos o mezclas de chino/inglés. Integra modos de razonamiento y no razonamiento con plantillas de chat para cambiar de forma flexible. También mejora el rendimiento de los agentes de código y búsqueda para un uso más fiable de herramientas y tareas de múltiples pasos.",
"Pro/deepseek-ai/DeepSeek-V3.2.description": "DeepSeek-V3.2 es un modelo que combina alta eficiencia computacional con excelente razonamiento y rendimiento como Agente. Su enfoque se basa en tres avances tecnológicos clave: DeepSeek Sparse Attention (DSA), un mecanismo de atención eficiente que reduce significativamente la complejidad computacional mientras mantiene el rendimiento del modelo, optimizado específicamente para escenarios de contexto largo; un marco de aprendizaje por refuerzo escalable que permite que el rendimiento del modelo rivalice con GPT-5, con su versión de alta computación igualando a Gemini-3.0-Pro en capacidades de razonamiento; y una tubería de síntesis de tareas de Agente a gran escala diseñada para integrar capacidades de razonamiento en escenarios de uso de herramientas, mejorando así el seguimiento de instrucciones y la generalización en entornos interactivos complejos. El modelo obtuvo medallas de oro en la Olimpiada Internacional de Matemáticas (IMO) y la Olimpiada Internacional de Informática (IOI) de 2025.",
"Pro/deepseek-ai/DeepSeek-V3.description": "DeepSeek-V3 es un modelo MoE de 671 mil millones de parámetros que utiliza MLA y DeepSeekMoE con balanceo de carga sin pérdida para inferencia y entrenamiento eficientes. Preentrenado con 14,8 billones de tokens de alta calidad y ajustado con SFT y RL, supera a otros modelos abiertos y se acerca al rendimiento de modelos cerrados líderes.",
"Pro/moonshotai/Kimi-K2.5.description": "Kimi K2.5 es un modelo agente multimodal nativo de código abierto, basado en Kimi-K2-Base, entrenado con aproximadamente 1.5 billones de tokens mixtos de visión y texto. El modelo adopta una arquitectura MoE con 1T de parámetros totales y 32B de parámetros activos, soportando una ventana de contexto de 256K, integrando de forma fluida capacidades de comprensión visual y lingüística.",
"Pro/moonshotai/Kimi-K2.6.description": "Kimi K2.6 es un modelo de agente multimodal nativo de código abierto de Moonshot AI, que logra un rendimiento de última generación en múltiples benchmarks principales, incluidos HLE (con herramientas), SWE-Bench Pro y BrowseComp. El modelo adopta una arquitectura MoE con 1T de parámetros totales y 32B de parámetros activos, admite una ventana de contexto de 256K tokens e integra capacidades multimodales nativas.",
"Pro/zai-org/GLM-4.7.description": "GLM-4.7 es el modelo insignia de nueva generación de Zhipu con 355B de parámetros totales y 32B de parámetros activos, completamente mejorado en capacidades de diálogo general, razonamiento y agentes. GLM-4.7 mejora el Pensamiento Intercalado e introduce Pensamiento Preservado y Pensamiento a Nivel de Turno.",
"Pro/zai-org/GLM-5.1.description": "GLM-5.1 es un modelo insignia de nueva generación diseñado para ingeniería agentiva, utilizando una arquitectura Mixture of Experts (MoE) con 754B parámetros. Mejora significativamente las capacidades de programación, logrando resultados líderes en SWE-Bench Pro y superando ampliamente a su predecesor en benchmarks como NL2Repo y Terminal-Bench 2.0. Diseñado para tareas agentivas de larga duración, maneja preguntas ambiguas con mejor criterio, descompone tareas complejas, ejecuta experimentos, analiza resultados y optimiza continuamente a través de cientos de iteraciones y miles de llamadas a herramientas.",
"Pro/zai-org/glm-5.1.description": "GLM-5.1 es el modelo de agente insignia de próxima generación de Zhipu para ingeniería inteligente. Utiliza una arquitectura Mixture-of-Experts de 754B con llamadas nativas a herramientas, finalización de prefijos, soporte FIM y una ventana de contexto de 200K para flujos de trabajo de largo alcance.",
"Pro/zai-org/glm-5.description": "GLM-5 es el modelo de lenguaje grande de próxima generación de Zhipu, enfocado en ingeniería de sistemas complejos y tareas de Agente de larga duración. Los parámetros del modelo se han ampliado a 744 mil millones (40 mil millones activos) e integran DeepSeek Sparse Attention.",
"QwQ-32B-Preview.description": "Qwen QwQ es un modelo de investigación experimental centrado en mejorar el razonamiento.",
"Qwen/QwQ-32B-Preview.description": "Qwen QwQ es un modelo de investigación experimental centrado en mejorar el razonamiento de IA.",
"Qwen/Qwen-Image-Edit-2509.description": "Qwen-Image-Edit-2509 es la última versión de edición de Qwen-Image del equipo Qwen. Basado en el modelo Qwen-Image de 20 mil millones de parámetros, amplía su potente renderizado de texto hacia la edición de imágenes para realizar ediciones textuales precisas. Utiliza una arquitectura de control dual, enviando entradas a Qwen2.5-VL para control semántico y a un codificador VAE para control de apariencia, permitiendo ediciones tanto a nivel semántico como visual. Admite ediciones locales (agregar/quitar/modificar) y ediciones semánticas de alto nivel como creación de IP y transferencia de estilo, preservando el significado. Logra resultados SOTA en múltiples pruebas de referencia.",
"Qwen/Qwen-Image.description": "Qwen-Image es un modelo base de generación de imágenes de 20 mil millones de parámetros del equipo Qwen. Logra avances importantes en renderizado de texto complejo y edición precisa de imágenes, especialmente para texto en chino/inglés de alta fidelidad. Admite diseños de múltiples líneas y párrafos manteniendo la coherencia tipográfica. Más allá del renderizado de texto, admite una amplia gama de estilos desde fotorrealismo hasta anime, y edición avanzada como transferencia de estilo, adición/eliminación de objetos, mejora de detalles, edición de texto y control de poses, con el objetivo de ser una base integral para la creación visual.",
"Qwen/Qwen2-72B-Instruct.description": "Qwen 2 Instruct (72B) ofrece un seguimiento preciso de instrucciones para cargas de trabajo empresariales.",
"Qwen/Qwen2-7B-Instruct.description": "Qwen2-7B-Instruct es un modelo de 7B ajustado con instrucciones de la serie Qwen2 que utiliza Transformer, SwiGLU, sesgo QKV y atención de consulta agrupada. Maneja entradas extensas y ofrece un rendimiento destacado en comprensión, generación, multilingüismo, programación, matemáticas y razonamiento, superando a la mayoría de los modelos abiertos y superando a Qwen1.5-7B-Chat en múltiples evaluaciones.",
"Qwen/Qwen2.5-14B-Instruct.description": "Qwen2.5-14B-Instruct forma parte de la última serie de LLM de Alibaba Cloud. El modelo de 14B ofrece mejoras notables en programación y matemáticas, admite más de 29 idiomas y mejora el seguimiento de instrucciones, la comprensión de datos estructurados y la generación de salidas estructuradas (especialmente en formato JSON).",
"Qwen/Qwen2.5-32B-Instruct.description": "Qwen2.5-32B-Instruct forma parte de la última serie de LLM de Alibaba Cloud. El modelo de 32B ofrece mejoras notables en programación y matemáticas, admite más de 29 idiomas y mejora el seguimiento de instrucciones, la comprensión de datos estructurados y la generación de salidas estructuradas (especialmente en formato JSON).",
"Qwen/Qwen2.5-72B-Instruct-128K.description": "Qwen2.5-72B-Instruct forma parte de la última serie de LLM de Alibaba Cloud. El modelo de 72B mejora la programación y las matemáticas, admite hasta 128K de entrada y más de 8K de salida, ofrece soporte para más de 29 idiomas y mejora el seguimiento de instrucciones y la salida estructurada (especialmente en formato JSON).",
"Qwen/Qwen2.5-72B-Instruct-Turbo.description": "Qwen2.5 es una nueva familia de LLM optimizada para tareas basadas en instrucciones.",
"Qwen/Qwen2.5-72B-Instruct.description": "Qwen2.5-72B-Instruct forma parte de la última serie de LLM de Alibaba Cloud. El modelo de 72B ofrece mejoras notables en programación y matemáticas, admite más de 29 idiomas y mejora el seguimiento de instrucciones, la comprensión de datos estructurados y la generación de salidas estructuradas (especialmente en formato JSON).",
"Qwen/Qwen2.5-7B-Instruct-Turbo.description": "Qwen2.5 es una nueva familia de LLM optimizada para tareas basadas en instrucciones.",
"Qwen/Qwen2.5-7B-Instruct.description": "Qwen2.5-7B-Instruct forma parte de la última serie de LLM de Alibaba Cloud. El modelo de 7B ofrece mejoras notables en programación y matemáticas, admite más de 29 idiomas y mejora el seguimiento de instrucciones, la comprensión de datos estructurados y la generación de salidas estructuradas (especialmente en formato JSON).",
"Qwen/Qwen2.5-Coder-32B-Instruct.description": "Qwen2.5 Coder 32B Instruct es el último LLM de Alibaba Cloud enfocado en programación. Basado en Qwen2.5 y entrenado con 5.5T tokens, mejora significativamente la generación, el razonamiento y la corrección de código, manteniendo fortalezas en matemáticas y capacidades generales, proporcionando una base sólida para agentes de programación.",
"Qwen/Qwen3-14B.description": "Qwen3 es un modelo Tongyi Qwen de nueva generación con grandes avances en razonamiento, capacidad general, habilidades de agente y rendimiento multilingüe, y permite cambiar entre modos de pensamiento.",
"Qwen/Qwen3-235B-A22B.description": "Qwen3 235B A22B es el modelo ultraescalado de Qwen3 que ofrece capacidades de IA de primer nivel.",
"Qwen/Qwen3-30B-A3B-Instruct-2507.description": "Qwen3-30B-A3B-Instruct-2507 es la versión actualizada no reflexiva de Qwen3-30B-A3B. Es un modelo MoE con 30.5B de parámetros totales y 3.3B de parámetros activos. Mejora significativamente el seguimiento de instrucciones, el razonamiento lógico, la comprensión de texto, las matemáticas, la ciencia, la codificación y el uso de herramientas, amplía el conocimiento multilingüe de nicho y se alinea mejor con las preferencias del usuario en tareas abiertas subjetivas. Admite un contexto de 256K. Este modelo es solo no reflexivo y no generará etiquetas `נקוד`.",
"Qwen/Qwen3-32B.description": "Qwen3 es un modelo Tongyi Qwen de nueva generación con grandes avances en razonamiento, capacidad general, habilidades de agente y rendimiento multilingüe, y permite cambiar entre modos de pensamiento.",
"Qwen/Qwen3-8B.description": "Qwen3 es un modelo Tongyi Qwen de nueva generación con grandes avances en razonamiento, capacidad general, habilidades de agente y rendimiento multilingüe, y permite cambiar entre modos de pensamiento.",
"Qwen/Qwen3-Coder-30B-A3B-Instruct.description": "Qwen3-Coder-30B-A3B-Instruct es un modelo de código de la serie Qwen3. Está optimizado para alto rendimiento y eficiencia, mejorando las capacidades de programación. Muestra ventajas destacadas en codificación con agentes, operaciones automatizadas de navegador y uso de herramientas entre modelos abiertos. Admite de forma nativa contexto de 256K y puede extenderse hasta 1M tokens para comprensión a nivel de base de código. Impulsa la codificación con agentes en plataformas como Qwen Code y CLINE con un formato dedicado de llamadas a funciones.",
"Qwen/Qwen3-Omni-30B-A3B-Captioner.description": "Qwen3-Omni-30B-A3B-Captioner es un modelo VLM de la serie Qwen3 diseñado para generar descripciones de imágenes detalladas, precisas y de alta calidad. Utiliza una arquitectura MoE de 30 mil millones de parámetros para comprender profundamente las imágenes y producir descripciones fluidas, destacándose en la captura de detalles, comprensión de escenas, reconocimiento de objetos y razonamiento relacional.",
"Qwen/Qwen3-Omni-30B-A3B-Instruct.description": "Qwen3-Omni-30B-A3B-Instruct es un modelo MoE de la serie Qwen3 con 30 mil millones de parámetros totales y 3 mil millones activos, que ofrece un rendimiento sólido con menor costo de inferencia. Entrenado con datos multilingües de alta calidad y múltiples fuentes, admite entradas multimodales completas (texto, imágenes, audio, video) y comprensión y generación entre modalidades.",
"Qwen/Qwen3-Omni-30B-A3B-Thinking.description": "Qwen3-Omni-30B-A3B-Thinking es el componente central \"Thinker\" de Qwen3-Omni. Procesa entradas multimodales (texto, audio, imágenes, video) y realiza razonamiento complejo en cadena de pensamiento, unificando las entradas en una representación compartida para una comprensión profunda entre modalidades. Es un modelo MoE con 30 mil millones de parámetros totales y 3 mil millones activos, equilibrando razonamiento potente y eficiencia computacional.",
"Qwen/Qwen3-VL-30B-A3B-Instruct.description": "Qwen3-VL-30B-A3B-Instruct es el modelo Qwen3-VL ajustado para instrucciones con sólida comprensión y generación visión-lenguaje. Admite de forma nativa contextos de hasta 256K para chat multimodal y generación condicionada por imágenes.",
"Qwen/Qwen3-VL-30B-A3B-Thinking.description": "Qwen3-VL-30B-A3B-Thinking es la versión mejorada para razonamiento de Qwen3-VL, optimizada para razonamiento multimodal, conversión de imágenes a código y comprensión visual compleja. Admite contextos de hasta 256K con una capacidad de cadena de pensamiento más sólida.",
"Qwen/Qwen3-VL-32B-Instruct.description": "Qwen3-VL-32B-Instruct es un modelo visión-lenguaje del equipo Qwen con resultados SOTA líderes en múltiples benchmarks VL. Admite imágenes de resolución megapíxel y ofrece una sólida comprensión visual, OCR multilingüe, anclaje visual detallado y diálogo visual. Maneja tareas multimodales complejas y admite llamadas a herramientas y completado por prefijo.",
"Qwen/Qwen3-VL-32B-Thinking.description": "Qwen3-VL-32B-Thinking está optimizado para razonamiento visual complejo. Incluye un modo de pensamiento incorporado que genera pasos intermedios de razonamiento antes de las respuestas, mejorando la lógica de múltiples pasos, la planificación y el razonamiento complejo. Admite imágenes de megapíxeles, comprensión visual sólida, OCR multilingüe, anclaje detallado, diálogo visual, llamadas a herramientas y completado por prefijo.",
"Qwen/Qwen3-VL-8B-Instruct.description": "Qwen3-VL-8B-Instruct es un modelo visión-lenguaje Qwen3 basado en Qwen3-8B-Instruct y entrenado con grandes cantidades de datos imagen-texto. Destaca en comprensión visual general, diálogo centrado en visión y reconocimiento de texto multilingüe en imágenes, siendo adecuado para preguntas visuales, subtitulado, seguimiento de instrucciones multimodales y uso de herramientas.",
"Qwen/Qwen3-VL-8B-Thinking.description": "Qwen3-VL-8B-Thinking es la versión de pensamiento visual de Qwen3, optimizada para razonamiento complejo de múltiples pasos. Genera una cadena de pensamiento antes de las respuestas para mejorar la precisión, ideal para preguntas visuales profundas y análisis detallado de imágenes.",
"Qwen/Qwen3.5-122B-A10B.description": "Qwen3.5-122B-A10B es un modelo de lenguaje grande multimodal nativo del equipo Qwen con 122 mil millones de parámetros totales y solo 10 mil millones de parámetros activos. Adopta una arquitectura híbrida eficiente que combina Redes Delta con Puertas y Mezcla de Expertos (MoE), soportando nativamente una longitud de contexto de 256K con extensibilidad a aproximadamente 1 millón de tokens.",
"Qwen/Qwen3.5-27B.description": "Qwen3.5-27B es un modelo de lenguaje grande multimodal nativo del equipo Qwen con 27 mil millones de parámetros. Adopta una arquitectura híbrida eficiente que combina Redes Delta con Puertas y Atención, soportando nativamente una longitud de contexto de 256K con extensibilidad a aproximadamente 1 millón de tokens.",
"Qwen/Qwen3.5-35B-A3B.description": "Qwen3.5-35B-A3B es un modelo de lenguaje grande multimodal nativo del equipo Qwen con 35 mil millones de parámetros totales y solo 3 mil millones de parámetros activos. Adopta una arquitectura híbrida eficiente que combina Redes Delta con Puertas y Mezcla de Expertos (MoE), soportando nativamente una longitud de contexto de 256K con extensibilidad a aproximadamente 1 millón de tokens.",
"Qwen/Qwen3.5-397B-A17B.description": "Qwen3.5-397B-A17B es el último modelo de visión-lenguaje en la serie Qwen3.5, utilizando una arquitectura de Mezcla de Expertos (MoE) con 397 mil millones de parámetros totales y 17 mil millones de parámetros activos. Soporta nativamente una longitud de contexto de 256K con extensibilidad a aproximadamente 1 millón de tokens, soporta 201 idiomas y proporciona capacidades unificadas de comprensión visión-lenguaje, invocación de herramientas y razonamiento.",
"Qwen/Qwen3.5-4B.description": "Qwen3.5-4B es un modelo de lenguaje grande multimodal nativo del equipo Qwen con 4 mil millones de parámetros, el modelo Denso más ligero de la serie Qwen3.5. Adopta una arquitectura híbrida eficiente que combina Redes Delta con Puertas y Atención, soportando nativamente una longitud de contexto de 256K con extensibilidad a aproximadamente 1 millón de tokens.",
"Qwen/Qwen3.5-9B.description": "Qwen3.5-9B es un modelo de lenguaje grande multimodal nativo del equipo Qwen con 9 mil millones de parámetros. Como modelo Denso ligero en la serie Qwen3.5, adopta una arquitectura híbrida eficiente que combina Redes Delta con Puertas y Atención, soportando nativamente una longitud de contexto de 256K con extensibilidad a aproximadamente 1 millón de tokens.",
"Qwen/Qwen3.6-27B.description": "Qwen3.6-27B es el primer modelo denso de tamaño medio de código abierto de la serie Qwen3.6, con mejoras clave para la generación de código, flujos de trabajo de agentes y escenarios de desarrollo del mundo real. En comparación con Qwen3.5-27B, este modelo muestra mejoras significativas en el desarrollo front-end, el razonamiento a nivel de repositorio, el uso de herramientas y la resolución de problemas complejos, con optimizaciones recientemente añadidas para el razonamiento histórico.",
"Qwen/Qwen3.6-35B-A3B.description": "Qwen3.6-35B-A3B es un modelo de lenguaje de gran tamaño del equipo Qwen dentro de la serie Qwen3.6. Utiliza una arquitectura MixtureofExperts (MoE) con 35B de parámetros totales y 3B de parámetros activos. Ofrece un equilibrio entre inferencia eficiente y un rendimiento excelente, y admite tanto modos de pensamiento como de no pensamiento, lo que permite alternar de forma flexible entre respuestas rápidas y razonamiento profundo.",
"Qwen2-72B-Instruct.description": "Qwen2 es la última serie Qwen, compatible con una ventana de contexto de 128k. En comparación con los mejores modelos abiertos actuales, Qwen2-72B supera significativamente a los modelos líderes en comprensión del lenguaje natural, conocimiento, código, matemáticas y capacidades multilingües.",
"Qwen2-7B-Instruct.description": "Qwen2 es la última serie Qwen, que supera a los mejores modelos abiertos de tamaño similar e incluso a modelos más grandes. Qwen2 7B muestra ventajas significativas en múltiples benchmarks, especialmente en programación y comprensión del chino.",
"Qwen2-VL-72B.description": "Qwen2-VL-72B es un potente modelo visión-lenguaje que admite procesamiento multimodal imagen-texto, reconociendo con precisión el contenido de las imágenes y generando descripciones o respuestas relevantes.",
"Qwen2.5-14B-Instruct.description": "Qwen2.5-14B-Instruct es un LLM de 14 mil millones de parámetros con un rendimiento sólido, optimizado para escenarios en chino y multilingües, compatible con preguntas y respuestas inteligentes y generación de contenido.",
"Qwen2.5-32B-Instruct.description": "Qwen2.5-32B-Instruct es un LLM de 32 mil millones de parámetros con rendimiento equilibrado, optimizado para escenarios en chino y multilingües, compatible con preguntas y respuestas inteligentes y generación de contenido.",
"Qwen2.5-72B-Instruct.description": "LLM para chino e inglés, ajustado para lenguaje, programación, matemáticas y razonamiento.",
"Qwen2.5-7B-Instruct.description": "Qwen2.5-7B-Instruct es un LLM de 7 mil millones de parámetros que admite llamadas a funciones e integración fluida con sistemas externos, mejorando enormemente la flexibilidad y extensibilidad. Está optimizado para escenarios en chino y multilingües, compatible con preguntas y respuestas inteligentes y generación de contenido.",
"Qwen2.5-Coder-14B-Instruct.description": "Qwen2.5-Coder-14B-Instruct es un modelo de instrucciones de codificación preentrenado a gran escala con sólida comprensión y generación de código. Maneja eficientemente una amplia gama de tareas de programación, ideal para codificación inteligente, generación automática de scripts y preguntas y respuestas sobre programación.",
"Qwen2.5-Coder-32B-Instruct.description": "LLM avanzado para generación de código, razonamiento y corrección de errores en los principales lenguajes de programación.",
"Qwen3-235B-A22B-Instruct-2507-FP8.description": "Qwen3 235B A22B Instruct 2507 está optimizado para razonamiento avanzado y seguimiento de instrucciones, utilizando MoE para mantener la eficiencia del razonamiento a gran escala.",
"Qwen3.5-Plus.description": "Qwen3.5 Plus soporta entrada de texto, imagen y video. Su rendimiento en tareas de solo texto es comparable al de Qwen3 Max, con mejor rendimiento y menor costo. Sus capacidades multimodales mejoran significativamente frente a la serie Qwen3 VL.",
"Ring-2.5-1T.description": "En comparación con el Ring-1T previamente lanzado, Ring-2.5-1T logra mejoras significativas en tres dimensiones clave: Eficiencia de Generación**: Al aprovechar una alta proporción de mecanismos de atención lineal, Ring-2.5-1T reduce la sobrecarga de acceso a memoria en más de 10×. Al procesar secuencias que superan los 32K tokens, ofrece más de 3× mayor rendimiento de generación, lo que lo hace particularmente adecuado para razonamiento profundo y ejecución de tareas de largo alcance. Razonamiento Profundo**: Basándose en RLVR, se introduce un mecanismo de recompensa densa para proporcionar retroalimentación sobre el rigor del proceso de razonamiento. Esto permite que Ring-2.5-1T alcance un rendimiento de nivel medalla de oro tanto en IMO 2025 como en CMO 2025 (autoevaluado). Ejecución de Tareas de Largo Alcance**: A través de entrenamiento de aprendizaje por refuerzo basado en agentes completamente asincrónico a gran escala, el modelo mejora significativamente su capacidad para ejecutar tareas complejas de manera autónoma durante períodos prolongados. Esto permite que Ring-2.5-1T se integre perfectamente con marcos de programación de agentes como Claude Code y asistentes personales de IA OpenClaw.",
"Ring-2.6-1T.description": "Ring-2.6-1T es un modelo de razonamiento a escala de un billón de parámetros que activa aproximadamente 63B parámetros por inferencia. Diseñado para flujos de trabajo de agentes, se centra en capacidades de agentes, uso de herramientas y ejecución de tareas de largo alcance, logrando un rendimiento líder en estándares como PinchBench, ClawEval, TAU2-Bench y GAIA2-search. El modelo está optimizado en calidad de ejecución, latencia y costo, lo que lo hace ideal para agentes avanzados de programación, tuberías de razonamiento complejo y sistemas autónomos a gran escala.",
"S2V-01.description": "El modelo base de referencia a video de la serie 01.",
"Skylark2-lite-8k.description": "Modelo Skylark de segunda generación. Skylark2-lite ofrece respuestas rápidas para escenarios en tiempo real y sensibles al costo, con menores requisitos de precisión y una ventana de contexto de 8K.",
"Skylark2-pro-32k.description": "Modelo Skylark de segunda generación. Skylark2-pro ofrece mayor precisión para generación de texto compleja como redacción profesional, escritura de novelas y traducción de alta calidad, con una ventana de contexto de 32K.",
"Skylark2-pro-4k.description": "Modelo Skylark de segunda generación. Skylark2-pro ofrece mayor precisión para generación de texto compleja como redacción profesional, escritura de novelas y traducción de alta calidad, con una ventana de contexto de 4K.",
"Skylark2-pro-character-4k.description": "Modelo Skylark de segunda generación. Skylark2-pro-character destaca en juegos de rol y conversación, adaptando los mensajes a estilos de personajes distintivos y diálogos naturales para chatbots, asistentes virtuales y atención al cliente, con respuestas rápidas.",
"Skylark2-pro-turbo-8k.description": "Modelo Skylark de segunda generación. Skylark2-pro-turbo-8k ofrece inferencia más rápida a menor costo con una ventana de contexto de 8K.",
"T2V-01-Director.description": "Se ha lanzado oficialmente un modelo de generación de video a nivel de director, ofreciendo una mejor adherencia a las instrucciones de movimiento de cámara y un lenguaje narrativo cinematográfico.",
"T2V-01.description": "El modelo base de texto a video de la serie 01.",
"THUDM/GLM-4-32B-0414.description": "GLM-4-32B-0414 es un modelo GLM de próxima generación con 32 mil millones de parámetros, comparable en rendimiento a OpenAI GPT y la serie DeepSeek V3/R1.",
"THUDM/GLM-4-9B-0414.description": "GLM-4-9B-0414 es un modelo GLM de 9 mil millones de parámetros que hereda las técnicas de GLM-4-32B, ofreciendo una implementación más ligera. Tiene buen rendimiento en generación de código, diseño web, generación de SVG y redacción basada en búsqueda.",
"THUDM/GLM-Z1-9B-0414.description": "GLM-Z1-9B-0414 es un modelo GLM pequeño de 9 mil millones de parámetros que conserva las fortalezas del código abierto y ofrece una capacidad impresionante. Tiene un rendimiento destacado en razonamiento matemático y tareas generales, liderando su clase de tamaño entre los modelos abiertos.",
"Wan-AI/Wan2.2-I2V-A14B.description": "Wan2.2-I2V-A14B es uno de los primeros modelos de generación de imagen a video (I2V) de código abierto lanzados por Wan-AI, una iniciativa de IA de Alibaba, que adopta una arquitectura de Mixture of Experts (MoE). El modelo se centra en generar secuencias de video dinámicas suaves y naturales combinando imágenes estáticas con indicaciones de texto. Su innovación principal radica en la arquitectura MoE: un experto de alto ruido maneja la estructura general en las primeras etapas de generación de video, mientras que un experto de bajo ruido refina los detalles en las etapas posteriores. Este diseño mejora el rendimiento general del modelo sin aumentar el costo de inferencia. En comparación con versiones anteriores, Wan2.2 se entrena con un conjunto de datos significativamente más grande, lo que lleva a mejoras notables en la comprensión de movimientos complejos, estilos estéticos y contenido semántico. Produce videos más estables y reduce movimientos de cámara poco realistas.",
"Wan-AI/Wan2.2-T2V-A14B.description": "Wan2.2-T2V-A14B es el primer modelo de generación de video de texto a video (T2V) de código abierto lanzado por Alibaba que adopta una arquitectura de Mixture of Experts (MoE). El modelo está diseñado para tareas de generación de texto a video y es capaz de producir videos de hasta 5 segundos de duración con resoluciones de 480P o 720P. Al introducir la arquitectura MoE, el modelo aumenta significativamente su capacidad general mientras mantiene casi sin cambios los costos de inferencia. Incluye un experto de alto ruido que maneja la estructura global en las primeras etapas de generación y un experto de bajo ruido que refina los detalles en las etapas posteriores del video. Además, Wan2.2 incorpora datos estéticos cuidadosamente seleccionados, con anotaciones detalladas en dimensiones como iluminación, composición y color. Esto permite una generación más precisa y controlable de visuales de calidad cinematográfica. En comparación con versiones anteriores, el modelo se entrena con un conjunto de datos más grande, lo que resulta en una mejora significativa en la generalización de movimiento, semántica y estética, y un mejor manejo de efectos dinámicos complejos.",
"Yi-34B-Chat.description": "Yi-1.5-34B mantiene las sólidas capacidades lingüísticas generales de la serie, mientras que el entrenamiento incremental con 500 mil millones de tokens de alta calidad mejora significativamente la lógica matemática y la programación.",
"abab5.5-chat.description": "Diseñado para escenarios de productividad con manejo de tareas complejas y generación eficiente de texto para uso profesional.",
"abab5.5s-chat.description": "Diseñado para conversación con personajes en chino, ofreciendo diálogos de alta calidad en chino para diversas aplicaciones.",
"abab6.5g-chat.description": "Diseñado para conversación con personajes multilingües, compatible con generación de diálogos de alta calidad en inglés y otros idiomas.",
"abab6.5s-chat.description": "Adecuado para una amplia gama de tareas de PLN, incluida la generación de texto y sistemas de diálogo.",
"abab6.5t-chat.description": "Optimizado para conversación con personajes en chino, proporcionando diálogos fluidos que se ajustan a los hábitos de expresión en chino.",
"accounts/fireworks/models/deepseek-r1.description": "DeepSeek-R1 es un modelo de lenguaje de última generación optimizado con aprendizaje por refuerzo y datos de arranque en frío, que ofrece un rendimiento sobresaliente en razonamiento, matemáticas y programación.",
"accounts/fireworks/models/deepseek-v3.description": "Un potente modelo de lenguaje Mixture-of-Experts (MoE) de DeepSeek con 671 mil millones de parámetros totales y 37 mil millones de parámetros activos por token.",
"accounts/fireworks/models/llama-v3-70b-instruct.description": "Meta desarrolló y lanzó la serie de modelos LLM Meta Llama 3, que incluye modelos de generación de texto preentrenados y ajustados por instrucciones en tamaños de 8B y 70B. Los modelos Llama 3 ajustados por instrucciones están optimizados para uso conversacional y superan a muchos modelos de chat abiertos existentes en los principales estándares de la industria.",
"accounts/fireworks/models/llama-v3-8b-instruct-hf.description": "Los modelos Llama 3 de Meta ajustados por instrucciones están optimizados para uso conversacional y superan a muchos modelos de chat abiertos existentes en los principales estándares de la industria. Llama 3 8B Instruct (versión HF) es la versión original en FP16 de Llama 3 8B Instruct, con resultados esperados que coinciden con la implementación oficial de Hugging Face.",
"accounts/fireworks/models/llama-v3-8b-instruct.description": "Meta desarrolló y lanzó la serie de modelos LLM Meta Llama 3, una colección de modelos de generación de texto preentrenados y ajustados por instrucciones en tamaños de 8B y 70B. Los modelos Llama 3 ajustados por instrucciones están optimizados para uso conversacional y superan a muchos modelos de chat abiertos existentes en los principales estándares de la industria.",
"accounts/fireworks/models/llama-v3p1-405b-instruct.description": "Meta Llama 3.1 es una familia de modelos LLM multilingües con modelos de generación preentrenados y ajustados por instrucciones en tamaños de 8B, 70B y 405B. Los modelos de texto ajustados por instrucciones están optimizados para diálogos multilingües y superan a muchos modelos de chat abiertos y cerrados en los principales estándares de la industria. El modelo de 405B es el más potente de la familia Llama 3.1, utilizando inferencia FP8 que se aproxima estrechamente a la implementación de referencia.",
"accounts/fireworks/models/llama-v3p1-70b-instruct.description": "Meta Llama 3.1 es una familia de modelos LLM multilingües con modelos de generación preentrenados y ajustados por instrucciones en tamaños de 8B, 70B y 405B. Los modelos de texto ajustados por instrucciones están optimizados para diálogos multilingües y superan a muchos modelos de chat abiertos y cerrados en los principales estándares de la industria.",
"accounts/fireworks/models/llama-v3p1-8b-instruct.description": "Meta Llama 3.1 es una familia de modelos LLM multilingües con modelos de generación preentrenados y ajustados por instrucciones en tamaños de 8B, 70B y 405B. Los modelos de texto ajustados por instrucciones están optimizados para diálogos multilingües y superan a muchos modelos de chat abiertos y cerrados en los principales estándares de la industria.",
"accounts/fireworks/models/llama-v3p2-11b-vision-instruct.description": "Un modelo de razonamiento visual ajustado por instrucciones de Meta con 11 mil millones de parámetros, optimizado para reconocimiento visual, razonamiento sobre imágenes, generación de descripciones y preguntas y respuestas relacionadas con imágenes. Comprende datos visuales como gráficos y diagramas, y conecta visión y lenguaje generando descripciones textuales de los detalles de las imágenes.",
"accounts/fireworks/models/llama-v3p2-3b-instruct.description": "Llama 3.2 3B Instruct es un modelo multilingüe ligero de Meta, diseñado para una ejecución eficiente con ventajas significativas en latencia y costo frente a modelos más grandes. Los casos de uso típicos incluyen reescritura de consultas/prompts y asistencia en redacción.",
"accounts/fireworks/models/llama-v3p2-90b-vision-instruct.description": "Un modelo de razonamiento visual ajustado por instrucciones de Meta con 90 mil millones de parámetros, optimizado para reconocimiento visual, razonamiento sobre imágenes, generación de descripciones y preguntas y respuestas relacionadas con imágenes. Comprende datos visuales como gráficos y diagramas, y conecta visión y lenguaje generando descripciones textuales de los detalles de las imágenes. Nota: este modelo se ofrece actualmente de forma experimental como modelo sin servidor. Para uso en producción, tenga en cuenta que Fireworks podría retirar su despliegue sin previo aviso.",
"accounts/fireworks/models/llama-v3p3-70b-instruct.description": "Llama 3.3 70B Instruct es la actualización de diciembre del modelo Llama 3.1 70B. Mejora el uso de herramientas, el soporte multilingüe, las matemáticas y la programación respecto a la versión de julio de 2024. Alcanza un rendimiento líder en la industria en razonamiento, matemáticas y seguimiento de instrucciones, ofreciendo un rendimiento comparable al modelo 3.1 405B con ventajas significativas en velocidad y costo.",
"accounts/fireworks/models/mistral-small-24b-instruct-2501.description": "Un modelo de 24 mil millones de parámetros con capacidades de vanguardia comparables a modelos más grandes.",
"accounts/fireworks/models/mixtral-8x22b-instruct.description": "Mixtral MoE 8x22B Instruct v0.1 es la versión ajustada por instrucciones de Mixtral MoE 8x22B v0.1, con la API de finalización de chat habilitada.",
"accounts/fireworks/models/mixtral-8x7b-instruct.description": "Mixtral MoE 8x7B Instruct es la versión ajustada por instrucciones de Mixtral MoE 8x7B, con la API de finalización de chat habilitada.",
"accounts/fireworks/models/mythomax-l2-13b.description": "Una variante mejorada de MythoMix, posiblemente su forma más refinada, que fusiona MythoLogic-L2 y Huginn mediante una técnica de fusión de tensores altamente experimental. Su naturaleza única lo hace excelente para narración y juegos de rol.",
"accounts/fireworks/models/phi-3-vision-128k-instruct.description": "Phi-3-Vision-128K-Instruct es un modelo multimodal ligero y de última generación construido a partir de datos sintéticos y conjuntos de datos públicos seleccionados, centrado en datos de texto y visión de alta calidad y con gran carga de razonamiento. Pertenece a la familia Phi-3, con una versión multimodal que admite una longitud de contexto de 128K (en tokens). El modelo se somete a mejoras rigurosas, incluyendo ajuste supervisado y optimización directa de preferencias, para garantizar un seguimiento preciso de instrucciones y sólidas medidas de seguridad.",
"accounts/fireworks/models/qwen-qwq-32b-preview.description": "El modelo Qwen QwQ se centra en avanzar en el razonamiento de IA, demostrando que los modelos abiertos pueden rivalizar con los modelos cerrados de vanguardia en razonamiento. QwQ-32B-Preview es una versión experimental que iguala a o1 y supera a GPT-4o y Claude 3.5 Sonnet en razonamiento y análisis en GPQA, AIME, MATH-500 y LiveCodeBench. Nota: este modelo se ofrece actualmente de forma experimental como modelo sin servidor. Para uso en producción, tenga en cuenta que Fireworks podría retirar su despliegue sin previo aviso.",
"accounts/fireworks/models/qwen2-vl-72b-instruct.description": "El modelo Qwen-VL de 72B es la última iteración de Alibaba, reflejando casi un año de innovación.",
"accounts/fireworks/models/qwen2p5-72b-instruct.description": "Qwen2.5 es una serie de modelos LLM solo decodificadores desarrollada por el equipo de Qwen y Alibaba Cloud, que ofrece tamaños de 0.5B, 1.5B, 3B, 7B, 14B, 32B y 72B, con variantes base y ajustadas por instrucciones.",
"accounts/fireworks/models/qwen2p5-coder-32b-instruct.description": "Qwen2.5-Coder es el modelo LLM más reciente de Qwen diseñado para programación (anteriormente CodeQwen). Nota: este modelo se ofrece actualmente de forma experimental como modelo sin servidor. Para uso en producción, tenga en cuenta que Fireworks podría retirar su despliegue sin previo aviso.",
"accounts/yi-01-ai/models/yi-large.description": "Yi-Large es un modelo LLM de primer nivel que se sitúa justo por debajo de GPT-4, Gemini 1.5 Pro y Claude 3 Opus en el ranking de LMSYS. Destaca por su capacidad multilingüe, especialmente en español, chino, japonés, alemán y francés. Yi-Large también es amigable para desarrolladores, utilizando el mismo esquema de API que OpenAI para facilitar la integración.",
"ai21-jamba-1.5-large.description": "Un modelo multilingüe de 398 mil millones de parámetros (94B activos) con una ventana de contexto de 256K, llamadas a funciones, salida estructurada y generación fundamentada.",
"ai21-jamba-1.5-mini.description": "Un modelo multilingüe de 52 mil millones de parámetros (12B activos) con una ventana de contexto de 256K, llamadas a funciones, salida estructurada y generación fundamentada.",
"ai21-labs/AI21-Jamba-1.5-Large.description": "Un modelo multilingüe de 398 mil millones de parámetros (94B activos) con una ventana de contexto de 256K, llamadas a funciones, salida estructurada y generación fundamentada.",
"ai21-labs/AI21-Jamba-1.5-Mini.description": "Un modelo multilingüe de 52 mil millones de parámetros (12B activos) con una ventana de contexto de 256K, llamadas a funciones, salida estructurada y generación fundamentada.",
"alibaba/qwen-3-14b.description": "Qwen3 es la última generación de la serie Qwen, que ofrece un conjunto completo de modelos densos y MoE. Basado en un entrenamiento exhaustivo, aporta avances en razonamiento, seguimiento de instrucciones, capacidades de agente y soporte multilingüe.",
"alibaba/qwen-3-235b.description": "Qwen3 es la última generación de la serie Qwen, que ofrece un conjunto completo de modelos densos y MoE. Basado en un entrenamiento exhaustivo, aporta avances en razonamiento, seguimiento de instrucciones, capacidades de agente y soporte multilingüe.",
"alibaba/qwen-3-30b.description": "Qwen3 es la última generación de la serie Qwen, que ofrece un conjunto completo de modelos densos y MoE. Basado en un entrenamiento exhaustivo, aporta avances en razonamiento, seguimiento de instrucciones, capacidades de agente y soporte multilingüe.",
"alibaba/qwen-3-32b.description": "Qwen3 es la última generación de la serie Qwen, que ofrece un conjunto completo de modelos densos y MoE. Basado en un entrenamiento exhaustivo, aporta avances en razonamiento, seguimiento de instrucciones, capacidades de agente y soporte multilingüe.",
"alibaba/qwen3-coder.description": "Qwen3-Coder-480B-A35B-Instruct es el modelo de código más agente de Qwen, con un rendimiento destacado en codificación autónoma, uso de navegador por agentes y otras tareas clave de programación, alcanzando resultados comparables al nivel de Claude Sonnet.",
"amazon/nova-lite.description": "Un modelo multimodal de muy bajo costo con procesamiento extremadamente rápido de entradas de imagen, video y texto.",
"amazon/nova-micro.description": "Un modelo solo de texto que ofrece una latencia ultra baja a un costo muy reducido.",
"amazon/nova-pro.description": "Un modelo multimodal altamente capaz con el mejor equilibrio entre precisión, velocidad y costo para una amplia gama de tareas.",
"amazon/titan-embed-text-v2.description": "Amazon Titan Text Embeddings V2 es un modelo de incrustación multilingüe ligero y eficiente que admite dimensiones de 1024, 512 y 256.",
"anthropic.claude-3-5-sonnet-20240620-v1:0.description": "Claude 3.5 Sonnet eleva el estándar de la industria, superando a sus competidores y a Claude 3 Opus en evaluaciones amplias, manteniendo velocidad y costo de nivel medio.",
"anthropic.claude-3-5-sonnet-20241022-v2:0.description": "Claude 3.5 Sonnet eleva el estándar de la industria, superando a sus competidores y a Claude 3 Opus en evaluaciones amplias, manteniendo velocidad y costo de nivel medio.",
"anthropic.claude-3-haiku-20240307-v1:0.description": "Claude 3 Haiku es el modelo más rápido y compacto de Anthropic, que ofrece respuestas casi instantáneas para consultas simples. Permite experiencias de IA fluidas y naturales, y admite entrada de imágenes con una ventana de contexto de 200K.",
"anthropic.claude-3-opus-20240229-v1:0.description": "Claude 3 Opus es el modelo de IA más potente de Anthropic, con un rendimiento de vanguardia en tareas altamente complejas. Maneja indicaciones abiertas y escenarios novedosos con fluidez excepcional y comprensión similar a la humana, y admite entrada de imágenes con una ventana de contexto de 200K.",
"anthropic.claude-3-sonnet-20240229-v1:0.description": "Claude 3 Sonnet equilibra inteligencia y velocidad para cargas de trabajo empresariales, ofreciendo un alto valor a menor costo. Está diseñado como un modelo confiable para implementaciones de IA a gran escala y admite entrada de imágenes con una ventana de contexto de 200K.",
"anthropic.claude-instant-v1.description": "Un modelo rápido, económico y capaz para chat diario, análisis de texto, resúmenes y preguntas sobre documentos.",
"anthropic.claude-v2.description": "Un modelo altamente competente en tareas que van desde diálogos complejos y generación creativa hasta el seguimiento detallado de instrucciones.",
"anthropic.claude-v2:1.description": "Una versión actualizada de Claude 2 con el doble de ventana de contexto y mejoras en fiabilidad, reducción de alucinaciones y precisión basada en evidencia para documentos largos y RAG.",
"anthropic/claude-3-haiku.description": "Claude 3 Haiku es el modelo más rápido de Anthropic, diseñado para cargas de trabajo empresariales con indicaciones extensas. Puede analizar rápidamente documentos grandes como informes trimestrales, contratos o casos legales a la mitad del costo de sus pares.",
"anthropic/claude-3-opus.description": "Claude 3 Opus es el modelo más inteligente de Anthropic, con un rendimiento líder en el mercado en tareas altamente complejas, manejando indicaciones abiertas y escenarios novedosos con fluidez excepcional y comprensión similar a la humana.",
"anthropic/claude-3.5-haiku.description": "Claude 3.5 Haiku ofrece mayor velocidad, precisión en programación y uso de herramientas, adecuado para escenarios con altos requerimientos de velocidad e interacción con herramientas.",
"anthropic/claude-3.5-sonnet.description": "Claude 3.5 Sonnet es el modelo rápido y eficiente de la familia Sonnet, con mejor rendimiento en programación y razonamiento, con algunas versiones reemplazadas gradualmente por Sonnet 3.7 y posteriores.",
"anthropic/claude-3.7-sonnet.description": "Claude 3.7 Sonnet es una versión mejorada del modelo Sonnet con mayor capacidad de razonamiento y programación, adecuado para tareas empresariales complejas.",
"anthropic/claude-haiku-4.5.description": "Claude Haiku 4.5 es el modelo rápido de alto rendimiento de Anthropic, con latencia muy baja y alta precisión.",
"anthropic/claude-opus-4.1.description": "Opus 4.1 es el modelo de gama alta de Anthropic, optimizado para programación, razonamiento complejo y tareas de larga duración.",
"anthropic/claude-opus-4.5.description": "Claude Opus 4.5 es el modelo insignia de Anthropic, que combina inteligencia de primer nivel con rendimiento escalable para tareas complejas de razonamiento de alta calidad.",
"anthropic/claude-opus-4.description": "Opus 4 es el modelo insignia de Anthropic, diseñado para tareas complejas y aplicaciones empresariales.",
"anthropic/claude-sonnet-4.5.description": "Claude Sonnet 4.5 es el último modelo híbrido de razonamiento de Anthropic, optimizado para razonamiento complejo y programación.",
"anthropic/claude-sonnet-4.description": "Claude Sonnet 4 es el modelo híbrido de razonamiento de Anthropic con capacidad de pensamiento mixto y no pensante.",
"aya.description": "Aya 23 es el modelo multilingüe de Cohere que admite 23 idiomas para diversos casos de uso.",
"aya:35b.description": "Aya 23 es el modelo multilingüe de Cohere que admite 23 idiomas para diversos casos de uso.",
"azure-DeepSeek-R1-0528.description": "Desplegado por Microsoft; DeepSeek R1 ha sido actualizado a DeepSeek-R1-0528. La actualización mejora el cómputo y las optimizaciones del algoritmo de postentrenamiento, mejorando significativamente la profundidad de razonamiento y la inferencia. Tiene un rendimiento destacado en matemáticas, programación y lógica general, acercándose a modelos líderes como O3 y Gemini 2.5 Pro.",
"baichuan-m2-32b.description": "Baichuan M2 32B es un modelo MoE de Baichuan Intelligence con gran capacidad de razonamiento.",
"baichuan/baichuan2-13b-chat.description": "Baichuan-13B es un modelo LLM de código abierto y uso comercial con 13 mil millones de parámetros de Baichuan, que logra resultados líderes en su clase en pruebas de referencia autorizadas en chino e inglés.",
"baidu/ernie-5.0-thinking-preview.description": "Vista previa de ERNIE 5.0 Thinking, el modelo ERNIE multimodal nativo de próxima generación de Baidu, con gran capacidad en comprensión multimodal, seguimiento de instrucciones, creación, preguntas y respuestas basadas en hechos y uso de herramientas.",
"big-pickle.description": "Big Pickle de OpenCode: modelo de pesos abiertos con potentes capacidades de programación.",
"black-forest-labs/flux-1.1-pro.description": "FLUX 1.1 Pro es una versión más rápida y mejorada de FLUX Pro, con excelente calidad de imagen y fidelidad a las instrucciones.",
"black-forest-labs/flux-dev.description": "FLUX Dev es la versión de desarrollo de FLUX para uso no comercial.",
"black-forest-labs/flux-pro.description": "FLUX Pro es el modelo profesional de FLUX para generación de imágenes de alta calidad.",
"black-forest-labs/flux-schnell.description": "FLUX Schnell es un modelo de generación de imágenes optimizado para velocidad.",
"c4ai-aya-expanse-32b.description": "Aya Expanse es un modelo multilingüe de alto rendimiento con 32 mil millones de parámetros que utiliza ajuste por instrucciones, arbitraje de datos, entrenamiento por preferencias y fusión de modelos para competir con modelos monolingües. Soporta 23 idiomas.",
"c4ai-aya-expanse-8b.description": "Aya Expanse es un modelo multilingüe de alto rendimiento con 8 mil millones de parámetros que utiliza ajuste por instrucciones, arbitraje de datos, entrenamiento por preferencias y fusión de modelos para competir con modelos monolingües. Soporta 23 idiomas.",
"c4ai-aya-vision-32b.description": "Aya Vision es un modelo multimodal de última generación con excelente rendimiento en pruebas clave de lenguaje, texto y visión. Soporta 23 idiomas. Esta versión de 32 mil millones se enfoca en un rendimiento multilingüe de primer nivel.",
"c4ai-aya-vision-8b.description": "Aya Vision es un modelo multimodal de última generación con excelente rendimiento en pruebas clave de lenguaje, texto y visión. Esta versión de 8 mil millones se enfoca en baja latencia y alto rendimiento.",
"charglm-3.description": "CharGLM-3 está diseñado para juegos de rol y compañía emocional, con soporte para memoria de múltiples turnos ultra larga y diálogo personalizado.",
"charglm-4.description": "CharGLM-4 está diseñado para juegos de rol y compañía emocional, con soporte para memoria de múltiples turnos ultra larga y diálogo personalizado.",
"chat-latest.description": "Último modelo Instantáneo utilizado en ChatGPT.",
"chatgpt-4o-latest.description": "ChatGPT-4o es un modelo dinámico actualizado en tiempo real. Combina una sólida comprensión y generación de lenguaje para casos de uso a gran escala como soporte al cliente, educación y asistencia técnica.",
"claude-2.0.description": "Claude 2 ofrece mejoras clave para empresas, incluyendo un contexto líder de 200 mil tokens, reducción de alucinaciones, indicaciones del sistema y una nueva función de prueba: uso de herramientas.",
"claude-2.1.description": "Claude 2 ofrece mejoras clave para empresas, incluyendo un contexto líder de 200 mil tokens, reducción de alucinaciones, indicaciones del sistema y una nueva función de prueba: uso de herramientas.",
"claude-3-5-haiku-20241022.description": "Claude 3.5 Haiku es el modelo de próxima generación más rápido de Anthropic. En comparación con Claude 3 Haiku, mejora en habilidades y supera al modelo más grande anterior Claude 3 Opus en muchos puntos de referencia de inteligencia.",
"claude-3-5-haiku-latest.description": "Claude 3.5 Haiku ofrece respuestas rápidas para tareas ligeras.",
"claude-3-5-haiku.description": "Claude Haiku 3.5 de Anthropic: modelo rápido y rentable con soporte de visión.",
"claude-3-7-sonnet-20250219.description": "Claude 3.7 Sonnet es el modelo más inteligente de Anthropic y el primer modelo de razonamiento híbrido en el mercado. Puede producir respuestas casi instantáneas o razonamientos extendidos paso a paso que los usuarios pueden ver. Sonnet es especialmente fuerte en tareas de codificación, ciencia de datos, visión y agentes.",
"claude-3-7-sonnet-latest.description": "Claude 3.7 Sonnet es el modelo más reciente y potente de Anthropic para tareas altamente complejas, destacando en rendimiento, inteligencia, fluidez y comprensión.",
"claude-3-haiku-20240307.description": "Claude 3 Haiku es el modelo más rápido y compacto de Anthropic, diseñado para respuestas casi instantáneas con rendimiento rápido y preciso.",
"claude-3-opus-20240229.description": "Claude 3 Opus es el modelo más potente de Anthropic para tareas altamente complejas, destacando en rendimiento, inteligencia, fluidez y comprensión.",
"claude-3-sonnet-20240229.description": "Claude 3 Sonnet equilibra inteligencia y velocidad para cargas de trabajo empresariales, ofreciendo alta utilidad a menor costo y despliegue confiable a gran escala.",
"claude-fable-5.description": "Claude Fable 5 es el modelo más avanzado de Anthropic: un nuevo nivel superior a Opus para los trabajos más exigentes de razonamiento y tareas de largo alcance.",
"claude-haiku-4-5-20251001.description": "Claude Haiku 4.5 es el modelo Haiku más rápido e inteligente de Anthropic, con velocidad relámpago y razonamiento extendido.",
"claude-haiku-4-5.description": "Claude Haiku 4.5 de Anthropic: Haiku de nueva generación con razonamiento y visión mejorados.",
"claude-haiku-4.5.description": "Claude Haiku 4.5 es el modelo Haiku más rápido e inteligente de Anthropic, con velocidad relámpago y razonamiento extendido.",
"claude-opus-4-1-20250805-thinking.description": "Claude Opus 4.1 Thinking es una variante avanzada que puede mostrar su proceso de razonamiento.",
"claude-opus-4-1-20250805.description": "Claude Opus 4.1 es el modelo más reciente y capaz de Anthropic para tareas altamente complejas, destacando en rendimiento, inteligencia, fluidez y comprensión.",
"claude-opus-4-1.description": "Claude Opus 4.1 de Anthropic: modelo de razonamiento premium con profundas capacidades de análisis.",
"claude-opus-4-20250514.description": "Claude Opus 4 es el modelo más poderoso de Anthropic para tareas altamente complejas, sobresaliendo en rendimiento, inteligencia, fluidez y comprensión.",
"claude-opus-4-5-20251101.description": "Claude Opus 4.5 es el modelo insignia de Anthropic, combinando inteligencia excepcional con rendimiento escalable, ideal para tareas complejas que requieren respuestas y razonamiento de la más alta calidad.",
"claude-opus-4-5.description": "Claude Opus 4.5 de Anthropic: modelo insignia con razonamiento y programación de primer nivel.",
"claude-opus-4-6.description": "Claude Opus 4.6 de Anthropic: modelo insignia con ventana de contexto de 1M y razonamiento avanzado.",
"claude-opus-4-7.description": "Claude Opus 4.7 de Anthropic: última versión Opus con razonamiento y programación de vanguardia.",
"claude-opus-4-8.description": "Claude Opus 4.8 es el modelo más avanzado de Anthropic, basado en Opus 4.7 con mejoras en razonamiento, codificación agente y uso de herramientas.",
"claude-opus-4.5.description": "Claude Opus 4.5 es el modelo insignia de Anthropic, que combina inteligencia de primer nivel con un rendimiento escalable para tareas complejas de razonamiento de alta calidad.",
"claude-opus-4.6-fast.description": "Claude Opus 4.6 es el modelo más inteligente de Anthropic para construir agentes y programar.",
"claude-opus-4.6.description": "Claude Opus 4.6 es el modelo más inteligente de Anthropic para construir agentes y programar.",
"claude-sonnet-4-20250514-thinking.description": "Claude Sonnet 4 Thinking puede generar respuestas casi instantáneas o pensamiento paso a paso extendido con proceso visible.",
"claude-sonnet-4-20250514.description": "Claude Sonnet 4 puede generar respuestas casi instantáneas o razonamientos detallados paso a paso con un proceso visible.",
"claude-sonnet-4-5-20250929.description": "Claude Sonnet 4.5 es el modelo más inteligente de Anthropic hasta la fecha.",
"claude-sonnet-4-5.description": "Claude Sonnet 4.5 de Anthropic: versión mejorada de Sonnet con mayor rendimiento en programación.",
"claude-sonnet-4-6.description": "Claude Sonnet 4.6 de Anthropic: última versión de Sonnet con programación superior y uso avanzado de herramientas.",
"claude-sonnet-4.5.description": "Claude Sonnet 4.5 es el modelo más inteligente de Anthropic hasta la fecha.",
"claude-sonnet-4.6.description": "Claude Sonnet 4.6 es la mejor combinación de velocidad e inteligencia de Anthropic.",
"claude-sonnet-4.description": "Claude Sonnet 4 de Anthropic: modelo equilibrado con sólidas capacidades de programación y razonamiento.",
"codegeex-4.description": "CodeGeeX-4 es un potente asistente de codificación con soporte multilingüe para preguntas y respuestas y autocompletado de código, mejorando la productividad de los desarrolladores.",
"codegeex4-all-9b.description": "CodeGeeX4-ALL-9B es un modelo multilingüe de generación de código que admite autocompletado y generación de código, interpretación de código, búsqueda web, llamadas a funciones y preguntas y respuestas a nivel de repositorio, cubriendo una amplia gama de escenarios de desarrollo de software. Es un modelo de código de primer nivel con menos de 10 mil millones de parámetros.",
"codegemma.description": "CodeGemma es un modelo ligero para tareas de programación variadas, que permite iteración rápida e integración sencilla.",
"codegemma:2b.description": "CodeGemma es un modelo ligero para tareas de programación variadas, que permite iteración rápida e integración sencilla.",
"codellama.description": "Code Llama es un modelo LLM enfocado en generación y discusión de código, con amplio soporte de lenguajes para flujos de trabajo de desarrollo.",
"codellama/CodeLlama-34b-Instruct-hf.description": "Code Llama es un modelo LLM enfocado en generación y discusión de código, con amplio soporte de lenguajes para flujos de trabajo de desarrollo.",
"codellama:13b.description": "Code Llama es un modelo LLM enfocado en generación y discusión de código, con amplio soporte de lenguajes para flujos de trabajo de desarrollo.",
"codellama:34b.description": "Code Llama es un modelo LLM enfocado en generación y discusión de código, con amplio soporte de lenguajes para flujos de trabajo de desarrollo.",
"codellama:70b.description": "Code Llama es un modelo LLM enfocado en generación y discusión de código, con amplio soporte de lenguajes para flujos de trabajo de desarrollo.",
"codeqwen.description": "CodeQwen1.5 es un modelo de lenguaje grande entrenado con datos extensos de código, diseñado para tareas de programación complejas.",
"codestral-latest.description": "Codestral es nuestro modelo de codificación más avanzado; la versión v2 (enero 2025) está orientada a tareas de baja latencia y alta frecuencia como FIM, corrección de código y generación de pruebas.",
"codestral.description": "Codestral es el primer modelo de código de Mistral AI, ofreciendo un sólido soporte para generación de código.",
"cogito-2.1:671b.description": "Cogito v2.1 671B es un modelo de lenguaje abierto de EE. UU. de uso comercial gratuito, con un rendimiento comparable a los mejores modelos, mayor eficiencia en razonamiento por tokens, contexto largo de 128k y gran capacidad general.",
"cogvideox-2.description": "CogVideoX-2 es el modelo base de generación de video de nueva generación de Zhipu, con capacidades de imagen a video mejoradas en un 38%. Ofrece mejoras significativas en el manejo de movimientos a gran escala, estabilidad visual, seguimiento de instrucciones, estilo artístico y estética visual general.",
"cogvideox-3.description": "CogVideoX-3 añade una función de generación de fotogramas iniciales y finales, mejorando significativamente la estabilidad y claridad visual. Permite movimientos suaves y naturales de sujetos a gran escala, ofrece mejor seguimiento de instrucciones y simulación física más realista, y mejora aún más el rendimiento en escenas realistas de alta definición y estilo 3D.",
"cogvideox-flash.description": "CogVideoX-Flash es un modelo de generación de video gratuito lanzado por Zhipu, capaz de generar videos que siguen las instrucciones del usuario mientras logran puntuaciones de calidad estética más altas.",
"cogview-3-flash.description": "CogView-3-Flash es un modelo gratuito de generación de imágenes lanzado por Zhipu. Genera imágenes que se alinean con las instrucciones del usuario mientras logra puntuaciones más altas en calidad estética. CogView-3-Flash se utiliza principalmente en campos como la creación artística, referencia de diseño, desarrollo de videojuegos y realidad virtual, ayudando a los usuarios a convertir rápidamente descripciones de texto en imágenes.",
"cogview-4.description": "CogView-4 es el primer modelo de texto a imagen de código abierto de Zhipu que puede generar caracteres chinos. Mejora la comprensión semántica, la calidad de imagen y la representación de texto en chino/inglés, admite entradas bilingües de longitud arbitraria y puede generar imágenes en cualquier resolución dentro de los rangos especificados.",
"cohere-command-r-plus.description": "Command R+ es un modelo avanzado optimizado para RAG, diseñado para cargas de trabajo empresariales.",
"cohere-command-r.description": "Command R es un modelo generativo escalable diseñado para RAG y uso de herramientas, permitiendo IA de nivel de producción.",
"cohere/Cohere-command-r-plus.description": "Command R+ es un modelo avanzado optimizado para RAG, diseñado para cargas de trabajo empresariales.",
"cohere/Cohere-command-r.description": "Command R es un modelo generativo escalable diseñado para RAG y uso de herramientas, permitiendo IA de nivel de producción.",
"cohere/command-a.description": "Command A es el modelo más potente de Cohere hasta la fecha, sobresaliendo en uso de herramientas, agentes, RAG y casos multilingües. Tiene una ventana de contexto de 256K, funciona con solo dos GPUs y ofrece un rendimiento 150% superior al de Command R+ 08-2024.",
"cohere/embed-v4.0.description": "Un modelo que clasifica o convierte texto, imágenes o contenido mixto en embeddings.",
"comfyui/flux-dev.description": "FLUX.1 Dev es un modelo de texto a imagen de alta calidad (1050 pasos), ideal para resultados creativos y artísticos premium.",
"comfyui/flux-kontext-dev.description": "FLUX.1 Kontext-dev es un modelo de edición de imágenes que admite ediciones guiadas por texto, incluidas ediciones locales y transferencia de estilo.",
"comfyui/flux-krea-dev.description": "FLUX.1 Krea-dev es un modelo de texto a imagen con mejoras de seguridad, co-desarrollado con Krea, con filtros de seguridad integrados.",
"comfyui/flux-schnell.description": "FLUX.1 Schnell es un modelo de texto a imagen ultrarrápido que genera imágenes de alta calidad en 1-4 pasos, ideal para uso en tiempo real y prototipado rápido.",
"comfyui/stable-diffusion-15.description": "Stable Diffusion 1.5 es un modelo clásico de texto a imagen 512x512, ideal para prototipado rápido y experimentación creativa.",
"comfyui/stable-diffusion-35-inclclip.description": "Stable Diffusion 3.5 con codificadores CLIP/T5 integrados no necesita archivos de codificador externos, adecuado para modelos como sd3.5_medium_incl_clips con menor uso de recursos.",
"comfyui/stable-diffusion-35.description": "Stable Diffusion 3.5 es un modelo de texto a imagen de próxima generación con variantes Large y Medium. Requiere archivos de codificador CLIP externos y ofrece excelente calidad de imagen y fidelidad al prompt.",
"comfyui/stable-diffusion-custom-refiner.description": "Modelo personalizado SDXL de imagen a imagen. Usa custom_sd_lobe.safetensors como nombre de archivo del modelo; si tienes un VAE, usa custom_sd_vae_lobe.safetensors. Coloca los archivos del modelo en las carpetas requeridas de Comfy.",
"comfyui/stable-diffusion-custom.description": "Modelo personalizado SD de texto a imagen. Usa custom_sd_lobe.safetensors como nombre de archivo del modelo; si tienes un VAE, usa custom_sd_vae_lobe.safetensors. Coloca los archivos del modelo en las carpetas requeridas de Comfy.",
"comfyui/stable-diffusion-refiner.description": "Modelo SDXL de imagen a imagen que realiza transformaciones de alta calidad a partir de imágenes de entrada, compatible con transferencia de estilo, restauración y variaciones creativas.",
"comfyui/stable-diffusion-xl.description": "SDXL es un modelo de texto a imagen que admite generación de alta resolución 1024x1024 con mejor calidad de imagen y detalle.",
"command-a-03-2025.description": "Command A es nuestro modelo más capaz hasta la fecha, sobresaliendo en uso de herramientas, agentes, RAG y escenarios multilingües. Tiene una ventana de contexto de 256K, funciona con solo dos GPUs y ofrece un rendimiento 150% superior al de Command R+ 08-2024.",
"command-light-nightly.description": "Para acortar el tiempo entre versiones principales, ofrecemos compilaciones nocturnas de Command. Para la serie command-light, se llama command-light-nightly. Es la versión más nueva y experimental (y potencialmente inestable), actualizada regularmente sin previo aviso, por lo que no se recomienda para producción.",
"command-light.description": "Una variante más pequeña y rápida de Command que es casi igual de capaz pero más veloz.",
"command-nightly.description": "Para acortar el tiempo entre versiones principales, ofrecemos compilaciones nocturnas de Command. Para la serie Command, se llama command-nightly. Es la versión más nueva y experimental (y potencialmente inestable), actualizada regularmente sin previo aviso, por lo que no se recomienda para producción.",
"command-r-03-2024.description": "command-r es un modelo de chat que sigue instrucciones y realiza tareas de lenguaje con mayor calidad, confiabilidad mejorada y contexto más largo que los modelos anteriores. Admite flujos de trabajo complejos como generación de código, RAG, uso de herramientas y agentes.",
"command-r-08-2024.description": "command-r-08-2024 es una versión actualizada del modelo Command R lanzada en agosto de 2024.",
"command-r-plus-04-2024.description": "command-r-plus es un alias de command-r-plus-04-2024, por lo que usar command-r-plus en la API apunta a ese modelo.",
"command-r-plus-08-2024.description": "Command R+ es un modelo de chat que sigue instrucciones con mayor calidad, fiabilidad y una ventana de contexto más larga que modelos anteriores. Es ideal para flujos de trabajo RAG complejos y uso de herramientas en múltiples pasos.",
"command-r-plus.description": "Command R+ es un LLM de alto rendimiento diseñado para escenarios empresariales reales y aplicaciones complejas.",
"command-r.description": "Command R es un LLM optimizado para tareas de chat y contexto largo, ideal para interacción dinámica y gestión del conocimiento.",
"command-r7b-12-2024.description": "command-r7b-12-2024 es una actualización pequeña y eficiente lanzada en diciembre de 2024. Destaca en RAG, uso de herramientas y tareas de agentes que requieren razonamiento complejo en múltiples pasos.",
"command.description": "Un modelo de chat que sigue instrucciones y ofrece mayor calidad y fiabilidad en tareas lingüísticas, con una ventana de contexto más larga que nuestros modelos generativos base.",
"computer-use-preview.description": "computer-use-preview es un modelo especializado para la herramienta \"uso de computadora\", entrenado para comprender y ejecutar tareas relacionadas con computadoras.",
"dall-e-3.description": "DALL·E 3",
"databricks/dbrx-instruct.description": "DBRX Instruct ofrece un manejo de instrucciones altamente confiable en múltiples industrias.",
"deepseek-ai/DeepSeek-OCR.description": "DeepSeek-OCR es un modelo visión-lenguaje de DeepSeek AI enfocado en OCR y \"compresión óptica contextual\". Explora la compresión del contexto a partir de imágenes, procesa documentos de forma eficiente y los convierte en texto estructurado (por ejemplo, Markdown). Reconoce texto en imágenes con gran precisión, ideal para digitalización de documentos, extracción de texto y procesamiento estructurado.",
"deepseek-ai/DeepSeek-R1-0528-Qwen3-8B.description": "DeepSeek-R1-0528-Qwen3-8B destila el razonamiento en cadena de DeepSeek-R1-0528 en Qwen3 8B Base. Alcanza el estado del arte entre los modelos abiertos, superando a Qwen3 8B en un 10% en AIME 2024 y equiparando el rendimiento de Qwen3-235B-thinking. Destaca en razonamiento matemático, programación y lógica general. Comparte la arquitectura de Qwen3-8B pero utiliza el tokenizador de DeepSeek-R1-0528.",
"deepseek-ai/DeepSeek-R1-0528.description": "DeepSeek R1 aprovecha mayor capacidad de cómputo y optimizaciones algorítmicas post-entrenamiento para profundizar el razonamiento. Tiene un rendimiento destacado en pruebas de matemáticas, programación y lógica general, acercándose a líderes como o3 y Gemini 2.5 Pro.",
"deepseek-ai/DeepSeek-R1-Distill-Llama-70B.description": "Los modelos destilados DeepSeek-R1 utilizan aprendizaje por refuerzo (RL) y datos de arranque en frío para mejorar el razonamiento y establecer nuevos estándares en tareas múltiples con modelos abiertos.",
"deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B.description": "Los modelos destilados DeepSeek-R1 utilizan aprendizaje por refuerzo (RL) y datos de arranque en frío para mejorar el razonamiento y establecer nuevos estándares en tareas múltiples con modelos abiertos.",
"deepseek-ai/DeepSeek-R1-Distill-Qwen-14B.description": "Los modelos destilados DeepSeek-R1 utilizan aprendizaje por refuerzo (RL) y datos de arranque en frío para mejorar el razonamiento y establecer nuevos estándares en tareas múltiples con modelos abiertos.",
"deepseek-ai/DeepSeek-R1.description": "DeepSeek-R1 mejora el razonamiento mediante aprendizaje por refuerzo (RL) y datos de arranque en frío, estableciendo nuevos estándares en tareas múltiples con modelos abiertos y superando a OpenAI-o1-mini.",
"deepseek-ai/DeepSeek-V3.1-Terminus.description": "DeepSeek-V3.1-Terminus es una versión actualizada del modelo V3.1, concebido como un agente híbrido. Corrige problemas reportados por usuarios y mejora la estabilidad, coherencia lingüística y reduce caracteres anómalos o mezclas de chino/inglés. Integra modos de pensamiento y no pensamiento con plantillas de chat para cambiar de forma flexible. También mejora el rendimiento de los agentes de código y búsqueda para un uso más confiable de herramientas y tareas de múltiples pasos.",
"deepseek-ai/DeepSeek-V3.1.description": "DeepSeek V3.1 utiliza una arquitectura de razonamiento híbrido y admite modos de pensamiento y no pensamiento.",
"deepseek-ai/DeepSeek-V3.2-Exp.description": "DeepSeek V3.2 Exp utiliza una arquitectura de razonamiento híbrida y admite modos de pensamiento y no pensamiento.",
"deepseek-ai/DeepSeek-V3.2.description": "DeepSeek-V3.2 es un modelo que combina alta eficiencia computacional con excelente razonamiento y rendimiento como Agente. Su enfoque se basa en tres avances tecnológicos principales: DeepSeek Sparse Attention (DSA), un mecanismo de atención eficiente que reduce significativamente la complejidad computacional mientras mantiene el rendimiento del modelo, optimizado específicamente para escenarios de contexto largo; un marco de aprendizaje por refuerzo escalable que permite que el rendimiento del modelo rivalice con GPT-5, y su versión de alta computación puede igualar a Gemini-3.0-Pro en capacidades de razonamiento; y una tubería de síntesis de tareas de Agente a gran escala, diseñada para integrar capacidades de razonamiento en escenarios de uso de herramientas, mejorando así el seguimiento de instrucciones y las habilidades de generalización en entornos interactivos complejos. El modelo obtuvo resultados de medalla de oro en la Olimpiada Internacional de Matemáticas (IMO) y la Olimpiada Internacional de Informática (IOI) de 2025.",
"deepseek-ai/DeepSeek-V3.description": "DeepSeek-V3 es un modelo MoE con 671 mil millones de parámetros que utiliza MLA y DeepSeekMoE con balanceo de carga sin pérdida para un entrenamiento e inferencia eficientes. Preentrenado con 14.8T de tokens de alta calidad, SFT y RL, supera a otros modelos abiertos y se acerca a los modelos cerrados líderes.",
"deepseek-ai/DeepSeek-V4-Flash.description": "DeepSeek-V4-Flash es una versión preliminar del modelo de lenguaje MoE en la serie DeepSeek-V4. El tamaño total de parámetros es de 284B, el tamaño de parámetros de activación es de 13B y admite un contexto ultra largo de 1M tokens. El modelo utiliza una arquitectura de atención híbrida que combina CSA y HCA, e introduce mHC y Muon Optimizer para mejorar la eficiencia del razonamiento en contextos largos, la estabilidad del entrenamiento y el rendimiento general.",
"deepseek-ai/DeepSeek-V4-Pro.description": "DeepSeek-V4-Pro es el modelo de lenguaje insignia MoE de la serie DeepSeek-V4, con 1.6T de parámetros totales y 49B de parámetros activos, que soporta de forma nativa un contexto ultra largo de 1 millón de tokens. El modelo adopta una arquitectura de atención híbrida innovadora que combina Atención Dispersa Comprimida (CSA) y Atención Altamente Comprimida (HCA), requiriendo solo el 27% de FLOPs de inferencia por token de DeepSeek-V3.2 y el 10% de caché KV en un contexto de 1M. También introduce Conexiones Hiper Manifold-Constrained (mHC) para mejorar la estabilidad de la propagación de señales entre capas, y emplea el optimizador Muon para acelerar la convergencia. DeepSeek-V4-Pro está preentrenado con más de 32T de tokens diversos de alta calidad, con post-entrenamiento utilizando un paradigma de dos etapas de cultivo independiente de expertos en dominios más destilación de políticas en línea para una integración unificada. Su modo de intensidad máxima de razonamiento DeepSeek-V4-Pro-Max logra un rendimiento superior en benchmarks de codificación y reduce significativamente la brecha con los modelos de código cerrado líderes en tareas de razonamiento y agentes, convirtiéndolo en uno de los modelos de código abierto más fuertes de la actualidad, soportando modos de intensidad de razonamiento Non-think, Think High y Think Max.",
"deepseek-ai/deepseek-llm-67b-chat.description": "DeepSeek LLM Chat (67B) es un modelo innovador que ofrece una comprensión profunda del lenguaje y una interacción avanzada.",
"deepseek-chat.description": "Un nuevo modelo de código abierto que combina habilidades generales y de codificación. Preserva el diálogo general del modelo de chat y la sólida capacidad de codificación del modelo de programador, con una mejor alineación de preferencias. DeepSeek-V2.5 también mejora la escritura y el seguimiento de instrucciones.",
"deepseek-coder-33B-instruct.description": "DeepSeek Coder 33B es un modelo de lenguaje para código entrenado con 2T de tokens (87% código, 13% texto en chino/inglés). Introduce una ventana de contexto de 16K y tareas de completado intermedio, ofreciendo completado de código a nivel de proyecto y relleno de fragmentos.",
"deepseek-coder-v2.description": "DeepSeek Coder V2 es un modelo de código MoE de código abierto que tiene un rendimiento sólido en tareas de programación, comparable a GPT-4 Turbo.",
"deepseek-coder-v2:236b.description": "DeepSeek Coder V2 es un modelo de código MoE de código abierto que tiene un rendimiento sólido en tareas de programación, comparable a GPT-4 Turbo.",
"deepseek-r1-0528.description": "Modelo completo de 685B lanzado el 28-05-2025. DeepSeek-R1 utiliza aprendizaje por refuerzo a gran escala en la etapa post-entrenamiento, mejorando significativamente el razonamiento con datos etiquetados mínimos, y tiene un rendimiento destacado en matemáticas, programación y razonamiento en lenguaje natural.",
"deepseek-r1-250528.description": "DeepSeek R1 250528 es el modelo completo de razonamiento DeepSeek-R1 para tareas complejas de matemáticas y lógica.",
"deepseek-r1-70b-fast-online.description": "Edición rápida de DeepSeek R1 70B con búsqueda web en tiempo real, ofreciendo respuestas más rápidas sin sacrificar rendimiento.",
"deepseek-r1-70b-online.description": "Edición estándar de DeepSeek R1 70B con búsqueda web en tiempo real, ideal para tareas de chat y texto actualizadas.",
"deepseek-r1-distill-llama-70b.description": "DeepSeek R1 Distill Llama 70B combina el razonamiento de R1 con el ecosistema Llama.",
"deepseek-r1-distill-llama-8b.description": "DeepSeek-R1-Distill-Llama-8B es una destilación de Llama-3.1-8B utilizando salidas de DeepSeek R1.",
"deepseek-r1-distill-llama.description": "deepseek-r1-distill-llama es una destilación de DeepSeek-R1 sobre Llama.",
"deepseek-r1-distill-qianfan-70b.description": "DeepSeek R1 Distill Qianfan 70B es una destilación R1 basada en Qianfan-70B con gran valor.",
"deepseek-r1-distill-qianfan-8b.description": "DeepSeek R1 Distill Qianfan 8B es una destilación R1 basada en Qianfan-8B para aplicaciones pequeñas y medianas.",
"deepseek-r1-distill-qianfan-llama-70b.description": "DeepSeek R1 Distill Qianfan Llama 70B es una destilación R1 basada en Llama-70B.",
"deepseek-r1-distill-qwen-1.5b.description": "DeepSeek R1 Distill Qwen 1.5B es un modelo de destilación ultraligero para entornos con muy pocos recursos.",
"deepseek-r1-distill-qwen-14b.description": "DeepSeek R1 Distill Qwen 14B es un modelo de destilación de tamaño medio para despliegue en múltiples escenarios.",
"deepseek-r1-distill-qwen-32b.description": "DeepSeek R1 Distill Qwen 32B es una destilación R1 basada en Qwen-32B, equilibrando rendimiento y coste.",
"deepseek-r1-distill-qwen-7b.description": "DeepSeek R1 Distill Qwen 7B es un modelo de destilación ligero para entornos empresariales privados y en el borde.",
"deepseek-r1-distill-qwen.description": "deepseek-r1-distill-qwen es una destilación de DeepSeek-R1 sobre Qwen.",
"deepseek-r1-fast-online.description": "Versión completa rápida de DeepSeek R1 con búsqueda web en tiempo real, combinando capacidad a escala 671B y respuesta ágil.",
"deepseek-r1-online.description": "Versión completa de DeepSeek R1 con 671B de parámetros y búsqueda web en tiempo real, ofreciendo mejor comprensión y generación.",
"deepseek-r1.description": "DeepSeek-R1 utiliza datos de arranque en frío antes del aprendizaje por refuerzo y tiene un rendimiento comparable a OpenAI-o1 en matemáticas, programación y razonamiento.",
"deepseek-reasoner.description": "Un modelo de razonamiento DeepSeek enfocado en tareas de razonamiento lógico complejo.",
"deepseek-v2.description": "DeepSeek V2 es un modelo MoE eficiente para procesamiento rentable.",
"deepseek-v2:236b.description": "DeepSeek V2 236B es el modelo de DeepSeek centrado en código con fuerte generación de código.",
"deepseek-v3-0324.description": "DeepSeek-V3-0324 es un modelo MoE con 671 mil millones de parámetros, con fortalezas destacadas en programación, capacidad técnica, comprensión de contexto y manejo de textos largos.",
"deepseek-v3.1-terminus.description": "DeepSeek-V3.1-Terminus es un modelo LLM optimizado para terminales de DeepSeek, diseñado específicamente para dispositivos de terminal.",
"deepseek-v3.1-think-250821.description": "DeepSeek V3.1 Think 250821 es el modelo de pensamiento profundo correspondiente a la versión Terminus, creado para un razonamiento de alto rendimiento.",
"deepseek-v3.1.description": "DeepSeek V3.1 utiliza una arquitectura de razonamiento híbrida con modos de pensamiento y no pensamiento.",
"deepseek-v3.1:671b.description": "DeepSeek V3.1 es un modelo de razonamiento de nueva generación con mejoras en razonamiento complejo y cadena de pensamiento, ideal para tareas que requieren análisis profundo.",
"deepseek-v3.2-exp.description": "deepseek-v3.2-exp introduce atención dispersa para mejorar la eficiencia de entrenamiento e inferencia en textos largos, a un precio más bajo que deepseek-v3.1.",
"deepseek-v3.2-speciale.description": "En tareas altamente complejas, el modelo Speciale supera significativamente a la versión estándar, pero consume considerablemente más tokens y genera mayores costos. Actualmente, DeepSeek-V3.2-Speciale está destinado solo para uso en investigación, no admite llamadas de herramientas y no ha sido optimizado específicamente para conversaciones cotidianas o tareas de escritura.",
"deepseek-v3.2-think.description": "DeepSeek V3.2 Think es un modelo de pensamiento profundo completo con razonamiento de cadenas largas más sólido.",
"deepseek-v3.2-thinking.description": "DeepSeek-V3.2 Thinking es la variante de modo de pensamiento de DeepSeek-V3.2, centrada en tareas de razonamiento.",
"deepseek-v3.2.description": "DeepSeek-V3.2 es el modelo de programación más reciente de DeepSeek con fuertes capacidades de razonamiento.",
"deepseek-v3.description": "DeepSeek-V3 es un potente modelo MoE con 671 mil millones de parámetros totales y 37 mil millones activos por token.",
"deepseek-v4-flash.description": "DeepSeek-V4-Flash es el modelo eficiente de 1M-contexto de DeepSeek en Volcano Ark, equilibrando velocidad y costo mientras mantiene fuertes capacidades de razonamiento y agente.",
"deepseek-v4-pro.description": "DeepSeek-V4-Pro es el modelo insignia MoE de DeepSeek en Volcano Ark, que admite modos de pensamiento y no pensamiento para razonamiento avanzado, generación de código y flujos de trabajo complejos de agentes.",
"deepseek-vl2-small.description": "DeepSeek VL2 Small es una versión multimodal ligera para entornos con recursos limitados y alta concurrencia.",
"deepseek-vl2.description": "DeepSeek VL2 es un modelo multimodal para comprensión imagen-texto y preguntas visuales detalladas.",
"deepseek/deepseek-chat-v3-0324.description": "DeepSeek V3 es un modelo MoE de 685 mil millones de parámetros y la última iteración de la serie insignia de chat de DeepSeek.\n\nSe basa en [DeepSeek V3](/deepseek/deepseek-chat-v3) y ofrece un rendimiento sólido en diversas tareas.",
"deepseek/deepseek-chat-v3.1.description": "DeepSeek-V3.1 es el modelo de razonamiento híbrido de largo contexto de DeepSeek, compatible con modos mixtos de pensamiento/no pensamiento e integración de herramientas.",
"deepseek/deepseek-chat.description": "DeepSeek-V3 es el modelo de razonamiento híbrido de alto rendimiento de DeepSeek para tareas complejas e integración de herramientas.",
"deepseek/deepseek-math-v2.description": "DeepSeek Math V2 es un modelo que ha logrado avances significativos en capacidades de razonamiento matemático. Su innovación principal radica en el mecanismo de entrenamiento de \"autoverificación\", y ha alcanzado niveles de medalla de oro en varias competiciones matemáticas de alto nivel.",
"deepseek/deepseek-r1-0528.description": "DeepSeek R1 0528 es una variante actualizada centrada en disponibilidad abierta y razonamiento más profundo.",
"deepseek/deepseek-r1-distill-llama-70b.description": "DeepSeek R1 Distill Llama 70B es un modelo LLM destilado basado en Llama 3.3 70B, ajustado finamente con salidas de DeepSeek R1 para lograr un rendimiento competitivo con modelos de frontera de gran tamaño.",
"deepseek/deepseek-r1-distill-llama-8b.description": "DeepSeek R1 Distill Llama 8B es un modelo LLM destilado basado en Llama-3.1-8B-Instruct, entrenado con salidas de DeepSeek R1.",
"deepseek/deepseek-r1-distill-qwen-14b.description": "DeepSeek R1 Distill Qwen 14B es un modelo LLM destilado basado en Qwen 2.5 14B, entrenado con salidas de DeepSeek R1. Supera a OpenAI o1-mini en múltiples pruebas, logrando resultados de vanguardia entre modelos densos. Resultados destacados:\nAIME 2024 pass@1: 69.7\nMATH-500 pass@1: 93.9\nPuntaje CodeForces: 1481\nEl ajuste fino con salidas de DeepSeek R1 ofrece un rendimiento competitivo con modelos de frontera más grandes.",
"deepseek/deepseek-r1-distill-qwen-32b.description": "DeepSeek R1 Distill Qwen 32B es un modelo LLM destilado basado en Qwen 2.5 32B, entrenado con salidas de DeepSeek R1. Supera a OpenAI o1-mini en múltiples pruebas, logrando resultados de vanguardia entre modelos densos. Resultados destacados:\nAIME 2024 pass@1: 72.6\nMATH-500 pass@1: 94.3\nPuntaje CodeForces: 1691\nEl ajuste fino con salidas de DeepSeek R1 ofrece un rendimiento competitivo con modelos de frontera más grandes.",
"deepseek/deepseek-r1.description": "DeepSeek R1 ha sido actualizado a DeepSeek-R1-0528. Con mayor capacidad de cómputo y optimizaciones algorítmicas posteriores al entrenamiento, mejora significativamente la profundidad y capacidad de razonamiento. Tiene un rendimiento sólido en matemáticas, programación y pruebas de lógica general, acercándose a líderes como o3 y Gemini 2.5 Pro.",
"deepseek/deepseek-r1/community.description": "DeepSeek R1 es el último modelo de código abierto lanzado por el equipo de DeepSeek, con un rendimiento de razonamiento muy sólido, especialmente en matemáticas, programación y tareas de lógica, comparable a OpenAI o1.",
"deepseek/deepseek-reasoner.description": "DeepSeek-V3 Thinking (reasoner) es el modelo experimental de razonamiento de DeepSeek, adecuado para tareas de razonamiento de alta complejidad.",
"deepseek/deepseek-v3.description": "Un modelo LLM rápido de propósito general con razonamiento mejorado.",
"deepseek/deepseek-v3/community.description": "DeepSeek-V3 representa un gran avance en velocidad de razonamiento respecto a modelos anteriores. Ocupa el primer lugar entre los modelos de código abierto y rivaliza con los modelos cerrados más avanzados. DeepSeek-V3 adopta Multi-Head Latent Attention (MLA) y la arquitectura DeepSeekMoE, ambas validadas en DeepSeek-V2. También introduce una estrategia auxiliar sin pérdida para balanceo de carga y un objetivo de entrenamiento de predicción multi-token para un rendimiento más sólido.",
"deepseek_r1.description": "DeepSeek-R1 es un modelo de razonamiento impulsado por aprendizaje por refuerzo que aborda problemas de repetición y legibilidad. Antes del RL, utiliza datos de arranque en frío para mejorar aún más el rendimiento de razonamiento. Igual a OpenAI-o1 en tareas de matemáticas, programación y razonamiento, con un entrenamiento cuidadosamente diseñado que mejora los resultados generales.",
"deepseek_r1_distill_llama_70b.description": "DeepSeek-R1-Distill-Llama-70B es una versión destilada de Llama-3.3-70B-Instruct. Como parte de la serie DeepSeek-R1, está ajustado finamente con muestras generadas por DeepSeek-R1 y ofrece un rendimiento sólido en matemáticas, programación y razonamiento.",
"deepseek_r1_distill_qwen_14b.description": "DeepSeek-R1-Distill-Qwen-14B es una versión destilada de Qwen2.5-14B y ajustada finamente con 800K muestras seleccionadas generadas por DeepSeek-R1, ofreciendo un razonamiento sólido.",
"deepseek_r1_distill_qwen_32b.description": "DeepSeek-R1-Distill-Qwen-32B es una versión destilada de Qwen2.5-32B y ajustada finamente con 800K muestras seleccionadas generadas por DeepSeek-R1, destacando en matemáticas, programación y razonamiento.",
"devstral-2512.description": "Devstral 2 es un modelo de texto a nivel empresarial que sobresale en el uso de herramientas para explorar bases de código, editar múltiples archivos y potenciar agentes de ingeniería de software.",
"devstral-2:123b.description": "Devstral 2 123B destaca en el uso de herramientas para explorar bases de código, editar múltiples archivos y asistir a agentes de ingeniería de software.",
"doubao-1.5-lite-32k.description": "Doubao-1.5-lite es un nuevo modelo ligero con respuesta ultrarrápida, que ofrece calidad y latencia de primer nivel.",
"doubao-1.5-pro-256k.description": "Doubao-1.5-pro-256k es una mejora integral de Doubao-1.5-Pro, con un rendimiento general un 10% superior. Admite una ventana de contexto de 256k y hasta 12k tokens de salida, ofreciendo mayor rendimiento, una ventana más amplia y un gran valor para casos de uso más amplios.",
"doubao-1.5-pro-32k.description": "Doubao-1.5-pro es un modelo insignia de nueva generación con mejoras en todos los aspectos, sobresaliendo en conocimiento, programación y razonamiento.",
"doubao-1.5-vision-pro-32k.description": "Doubao-1.5-vision-pro es un modelo multimodal mejorado que admite imágenes de cualquier resolución y proporciones extremas, mejorando el razonamiento visual, reconocimiento de documentos, comprensión de detalles y seguimiento de instrucciones.",
"doubao-lite-32k.description": "Respuesta ultrarrápida con mejor relación calidad-precio, ofreciendo opciones más flexibles en distintos escenarios. Admite razonamiento y ajuste fino con una ventana de contexto de 32k.",
"doubao-pro-32k.description": "El modelo insignia de mejor rendimiento para tareas complejas, con excelentes resultados en preguntas con referencia, resumen, creación, clasificación de texto y juegos de rol. Admite razonamiento y ajuste fino con una ventana de contexto de 32k.",
"doubao-seed-1.6-flash.description": "Doubao-Seed-1.6-flash es un modelo multimodal de razonamiento profundo ultrarrápido con TPOT de hasta 10ms. Admite texto y visión, supera al modelo lite anterior en comprensión de texto y se equipara a modelos pro en visión. Admite una ventana de contexto de 256k y hasta 16k tokens de salida.",
"doubao-seed-1.6-vision.description": "Doubao-Seed-1.6-vision es un modelo visual de razonamiento profundo que ofrece mayor comprensión y razonamiento multimodal para educación, revisión de imágenes, inspección/seguridad y búsqueda de IA con preguntas y respuestas. Admite una ventana de contexto de 256k y hasta 64k tokens de salida.",
"doubao-seed-1.6.description": "Doubao-Seed-1.6 es un nuevo modelo multimodal de razonamiento profundo con modos automático, de razonamiento y sin razonamiento. En modo sin razonamiento, supera significativamente a Doubao-1.5-pro/250115. Admite una ventana de contexto de 256k y hasta 16k tokens de salida.",
"doubao-seed-1.8.description": "Doubao-Seed-1.8 ofrece una comprensión multimodal más sólida y capacidades avanzadas de agente. Admite entrada de texto, imagen y video, así como almacenamiento de contexto, y puede ofrecer un rendimiento excelente en tareas complejas.",
"doubao-seed-2.0-code.description": "Doubao-Seed-2.0-code está profundamente optimizado para codificación agentiva, admite entradas multimodales y una ventana de contexto de 256k, adaptándose a flujos de trabajo de codificación, comprensión visual y agentes.",
"doubao-seed-2.0-lite.description": "Doubao-Seed-2.0-lite es un nuevo modelo de razonamiento profundo multimodal que ofrece mejor valor y es una opción sólida para tareas comunes, con una ventana de contexto de hasta 256k.",
"doubao-seed-2.0-mini.description": "Doubao-Seed-2.0-mini es un modelo ligero con respuesta rápida y alto rendimiento, adecuado para tareas pequeñas y escenarios de alta concurrencia.",
"doubao-seed-2.0-pro.description": "Doubao-Seed-2.0-pro es el modelo general insignia de ByteDance para agentes, con avances integrales en planificación y ejecución de tareas complejas.",
"doubao-seed-code.description": "Doubao-Seed-Code está profundamente optimizado para programación con agentes, admite entradas multimodales (texto/imagen/video) y una ventana de contexto de 256k, es compatible con la API de Anthropic y se adapta a flujos de trabajo de programación, comprensión visual y agentes.",
"doubao-seedance-1-0-pro-250528.description": "Seedance 1.0 Pro es un modelo base de generación de videos que admite narrativas de múltiples tomas. Ofrece un rendimiento sólido en múltiples dimensiones. El modelo logra avances en comprensión semántica y seguimiento de instrucciones, permitiéndole generar videos en alta definición 1080P con movimientos fluidos, detalles ricos, estilos diversos y una estética visual de nivel cinematográfico.",
"doubao-seedance-1-0-pro-fast-251015.description": "Seedance 1.0 Pro Fast es un modelo integral diseñado para minimizar costos mientras maximiza el rendimiento, logrando un excelente equilibrio entre calidad de generación de video, velocidad y precio. Hereda las fortalezas principales de Seedance 1.0 Pro, mientras ofrece velocidades de generación más rápidas y precios más competitivos, brindando a los creadores una doble optimización de eficiencia y costo.",
"doubao-seedance-1-5-pro-251215.description": "Seedance 1.5 Pro de ByteDance admite generación de texto a video, imagen a video (primer fotograma, primer+último fotograma) y generación de audio sincronizado con los visuales.",
"doubao-seedance-2-0-260128.description": "Seedance 2.0 de ByteDance es el modelo de generación de video más poderoso, soportando generación de video multimodal de referencia, edición de video, extensión de video, texto a video e imagen a video con audio sincronizado.",
"doubao-seedance-2-0-fast-260128.description": "Seedance 2.0 Fast de ByteDance ofrece las mismas capacidades que Seedance 2.0 con velocidades de generación más rápidas a un precio más competitivo.",
"doubao-seedream-4-0-250828.description": "Seedream 4.0 es un modelo de generación de imágenes de ByteDance Seed que admite entradas de texto e imagen con generación de imágenes de alta calidad y altamente controlable. Genera imágenes a partir de indicaciones de texto.",
"doubao-seedream-4-5-251128.description": "Seedream 4.5 es el último modelo multimodal de imágenes de ByteDance, que integra capacidades de texto a imagen, imagen a imagen y generación de imágenes por lotes, mientras incorpora sentido común y habilidades de razonamiento. En comparación con la versión 4.0 anterior, ofrece una calidad de generación significativamente mejorada, con mayor consistencia en la edición y fusión de múltiples imágenes. Proporciona un control más preciso sobre los detalles visuales, produciendo texto y rostros pequeños de manera más natural, y logra una disposición y color más armoniosos, mejorando la estética general.",
"doubao-seedream-5-0-260128.description": "Doubao-Seedream-5.0-lite es el último modelo de generación de imágenes de ByteDance. Por primera vez, integra capacidades de recuperación en línea, permitiendo incorporar información web en tiempo real y mejorar la actualidad de las imágenes generadas. La inteligencia del modelo también ha sido mejorada, permitiendo una interpretación precisa de instrucciones complejas y contenido visual. Además, ofrece una mejor cobertura de conocimiento global, consistencia de referencia y calidad de generación en escenarios profesionales, satisfaciendo mejor las necesidades de creación visual a nivel empresarial.",
"dreamina-seedance-2-0-260128.description": "Seedance 2.0 de ByteDance es el modelo de generación de video más potente, compatible con generación de video multimodal de referencia, edición de video, extensión de video, texto a video e imagen a video con audio sincronizado.",
"dreamina-seedance-2-0-fast-260128.description": "Seedance 2.0 Fast de ByteDance ofrece las mismas capacidades que Seedance 2.0 con velocidades de generación más rápidas a un precio más competitivo.",
"emohaa.description": "Emohaa es un modelo de salud mental con capacidades profesionales de asesoramiento para ayudar a los usuarios a comprender problemas emocionales.",
"ernie-4.5-0.3b.description": "ERNIE 4.5 0.3B es un modelo ligero de código abierto para implementación local y personalizada.",
"ernie-4.5-8k-preview.description": "ERNIE 4.5 8K Preview es un modelo de vista previa con contexto de 8K para evaluar ERNIE 4.5.",
"ernie-4.5-turbo-128k.description": "ERNIE 4.5 Turbo 128K es un modelo general de alto rendimiento con aumento de búsqueda y uso de herramientas para preguntas y respuestas, programación y escenarios de agentes.",
"ernie-4.5-turbo-20260402.description": "ERNIE 4.5 Turbo 20260402 es un modelo general de alto rendimiento con aumento de búsqueda y uso de herramientas para QA, codificación y escenarios de agentes.",
"ernie-4.5-turbo-32k.description": "ERNIE 4.5 Turbo 32K es una versión de contexto medio para preguntas y respuestas, recuperación de bases de conocimiento y diálogo de múltiples turnos.",
"ernie-4.5-turbo-latest.description": "Última versión de ERNIE 4.5 Turbo con rendimiento general optimizado, ideal como modelo principal de producción.",
"ernie-4.5-turbo-vl-32k.description": "ERNIE 4.5 Turbo VL 32K es una versión multimodal de contexto medio-largo para comprensión combinada de documentos largos e imágenes.",
"ernie-4.5-turbo-vl-latest.description": "ERNIE 4.5 Turbo VL Latest es la versión multimodal más reciente con mejor comprensión y razonamiento imagen-texto.",
"ernie-4.5-turbo-vl.description": "ERNIE 4.5 Turbo VL es un modelo multimodal maduro para comprensión y reconocimiento imagen-texto en producción.",
"ernie-5.0-thinking-latest.description": "Wenxin 5.0 Thinking es un modelo insignia nativo multimodal con modelado unificado de texto, imagen, audio y video. Ofrece mejoras amplias en capacidades para preguntas complejas, creación y escenarios de agentes.",
"ernie-5.0-thinking-preview.description": "Wenxin 5.0 Thinking Preview es un modelo insignia nativo multimodal con modelado unificado de texto, imagen, audio y video. Ofrece mejoras amplias en capacidades para preguntas complejas, creación y escenarios de agentes.",
"ernie-5.0.description": "ERNIE 5.0, el modelo de nueva generación de la serie ERNIE, es un modelo multimodal nativo. Adopta un enfoque unificado de modelado multimodal, integrando texto, imágenes, audio y vídeo para ofrecer capacidades completas. Sus habilidades fundamentales han sido significativamente mejoradas, logrando un sólido rendimiento en benchmarks. Destaca en comprensión multimodal, seguimiento de instrucciones, redacción creativa, precisión factual, planificación agéntica y uso de herramientas.",
"ernie-5.1.description": "ERNIE 5.1 es el modelo más reciente de la serie ERNIE, con mejoras integrales en sus capacidades fundamentales. Demuestra avances significativos en áreas como agentes, procesamiento de conocimiento, razonamiento y búsqueda profunda. Esta versión adopta una arquitectura de aprendizaje por refuerzo completamente asincrónica y desacoplada, diseñada específicamente para abordar desafíos clave en la evolución de modelos grandes hacia la toma de decisiones autónoma por parte de agentes, incluyendo discrepancias numéricas entre entrenamiento e inferencia, baja utilización de recursos informáticos heterogéneos y problemas globales causados por efectos de larga cola. Además, se emplean técnicas de post-entrenamiento a gran escala para agentes, lo que mejora aún más las capacidades y el rendimiento de generalización del modelo. A través de un marco colaborativo de tres etapas que involucra procesos de entorno, experto y fusión, el enfoque no solo garantiza la eficiencia del entrenamiento, sino que también mejora significativamente la estabilidad y el rendimiento del modelo en tareas complejas.",
"ernie-char-fiction-8k-preview.description": "ERNIE Character Fiction 8K Preview es un modelo preliminar para la creación de personajes y tramas, diseñado para evaluación y pruebas.",
"ernie-char-fiction-8k.description": "ERNIE Character Fiction 8K es un modelo de personajes para novelas y creación de tramas, ideal para generación de historias extensas.",
"ernie-image-turbo.description": "ERNIEImage es un modelo de texto a imagen de 8B parámetros desarrollado por Baidu. Se sitúa entre los mejores en múltiples benchmarks, logrando el primer puesto compartido en SuperCLUE en China y liderando la categoría de código abierto.",
"ernie-irag-edit.description": "ERNIE iRAG Edit es un modelo de edición de imágenes que permite borrar, repintar y generar variantes.",
"ernie-lite-pro-128k.description": "ERNIE Lite Pro 128K es un modelo ligero de alto rendimiento para escenarios sensibles a la latencia y al costo.",
"ernie-novel-8k.description": "ERNIE Novel 8K está diseñado para novelas extensas y tramas de propiedad intelectual con narrativas de múltiples personajes.",
"ernie-speed-pro-128k.description": "ERNIE Speed Pro 128K es un modelo de alto valor y concurrencia para servicios en línea a gran escala y aplicaciones empresariales.",
"ernie-x1-turbo-32k-preview.description": "ERNIE X1 Turbo 32K Preview es un modelo de pensamiento rápido con un contexto de 32K para razonamientos complejos y chats de múltiples turnos.",
"ernie-x1-turbo-32k.description": "ERNIE X1 Turbo 32K es un modelo de pensamiento rápido con contexto de 32K para razonamiento complejo y chat de múltiples turnos.",
"ernie-x1.1-preview.description": "ERNIE X1.1 Preview es una vista previa del modelo de pensamiento para evaluación y pruebas.",
"ernie-x1.1.description": "ERNIE X1.1 es un modelo de pensamiento en vista previa para evaluación y pruebas.",
"fal-ai/bytedance/seedream/v4.5.description": "Seedream 4.5, desarrollado por el equipo Seed de ByteDance, soporta edición y composición de múltiples imágenes. Presenta consistencia mejorada de sujetos, seguimiento preciso de instrucciones, comprensión de lógica espacial, expresión estética, diseño de carteles y logotipos con renderizado de texto-imagen de alta precisión.",
"fal-ai/bytedance/seedream/v4.description": "Seedream 4.0 es un modelo de generación de imágenes de ByteDance Seed, que admite entradas de texto e imagen con generación de imágenes altamente controlable y de alta calidad. Genera imágenes a partir de indicaciones de texto.",
"fal-ai/flux-kontext/dev.description": "Modelo FLUX.1 centrado en la edición de imágenes, compatible con entradas de texto e imagen.",
"fal-ai/flux-pro/kontext.description": "FLUX.1 Kontext [pro] acepta texto e imágenes de referencia como entrada, permitiendo ediciones locales dirigidas y transformaciones globales complejas de escenas.",
"fal-ai/flux/krea.description": "Flux Krea [dev] es un modelo de generación de imágenes con una inclinación estética hacia imágenes más realistas y naturales.",
"fal-ai/flux/schnell.description": "FLUX.1 [schnell] es un modelo de generación de imágenes con 12 mil millones de parámetros, diseñado para una salida rápida y de alta calidad.",
"fal-ai/hunyuan-image/v3.description": "Un potente modelo nativo multimodal de generación de imágenes.",
"fal-ai/imagen4/preview.description": "Modelo de generación de imágenes de alta calidad de Google.",
"fal-ai/nano-banana.description": "Nano Banana es el modelo multimodal nativo más nuevo, rápido y eficiente de Google, que permite generación y edición de imágenes mediante conversación.",
"fal-ai/qwen-image-edit.description": "Un modelo profesional de edición de imágenes del equipo Qwen que admite ediciones semánticas y de apariencia, edita con precisión texto en chino e inglés, y permite ediciones de alta calidad como transferencia de estilo y rotación de objetos.",
"fal-ai/qwen-image.description": "Un modelo poderoso de generación de imágenes del equipo Qwen con una impresionante representación de texto en chino y estilos visuales diversos.",
"flux-1-schnell.description": "Modelo de texto a imagen con 12 mil millones de parámetros de Black Forest Labs que utiliza destilación difusiva adversarial latente para generar imágenes de alta calidad en 1 a 4 pasos. Compite con alternativas cerradas y se lanza bajo licencia Apache-2.0 para uso personal, de investigación y comercial.",
"flux-dev.description": "Modelo de generación de imágenes de I+D de código abierto, optimizado de forma eficiente para investigación innovadora no comercial.",
"flux-kontext-max.description": "Generación y edición de imágenes contextual de última generación, combinando texto e imágenes para resultados precisos y coherentes.",
"flux-kontext-pro.description": "Generación y edición de imágenes contextual de última generación, combinando texto e imágenes para resultados precisos y coherentes.",
"flux-pro-1.1-ultra.description": "Generación de imágenes de ultra alta resolución con salida de 4MP, produciendo imágenes nítidas en 10 segundos.",
"flux-pro-1.1.description": "Modelo de generación de imágenes de nivel profesional mejorado con excelente calidad de imagen y adherencia precisa a las indicaciones.",
"flux-pro.description": "Modelo comercial de generación de imágenes de primer nivel con calidad de imagen inigualable y salidas diversas.",
"flux.1-schnell.description": "FLUX.1-schnell es un modelo de generación de imágenes de alto rendimiento para salidas rápidas y de múltiples estilos.",
"gemini-1.0-pro-001.description": "Gemini 1.0 Pro 001 (Tuning) ofrece un rendimiento estable y ajustable para tareas complejas.",
"gemini-1.0-pro-002.description": "Gemini 1.0 Pro 002 (Tuning) proporciona un sólido soporte multimodal para tareas complejas.",
"gemini-1.0-pro-latest.description": "Gemini 1.0 Pro es el modelo de IA de alto rendimiento de Google diseñado para escalar tareas de forma amplia.",
"gemini-1.5-flash-001.description": "Gemini 1.5 Flash 001 es un modelo multimodal eficiente para escalar aplicaciones de forma amplia.",
"gemini-1.5-flash-002.description": "Gemini 1.5 Flash 002 es un modelo multimodal eficiente diseñado para implementaciones a gran escala.",
"gemini-1.5-flash-8b-exp-0924.description": "Gemini 1.5 Flash 8B 0924 es el modelo experimental más reciente con mejoras notables en casos de uso de texto y multimodales.",
"gemini-1.5-flash-8b.description": "Gemini 1.5 Flash 8B es un modelo multimodal eficiente para escalar aplicaciones de forma amplia.",
"gemini-1.5-flash-exp-0827.description": "Gemini 1.5 Flash 0827 ofrece procesamiento multimodal optimizado para tareas complejas.",
"gemini-1.5-flash-latest.description": "Gemini 1.5 Flash es el modelo de IA multimodal más reciente de Google con procesamiento rápido, compatible con entradas de texto, imagen y video para escalar tareas de manera eficiente.",
"gemini-1.5-pro-001.description": "Gemini 1.5 Pro 001 es una solución de IA multimodal escalable para tareas complejas.",
"gemini-1.5-pro-002.description": "Gemini 1.5 Pro 002 es el modelo más reciente listo para producción con salida de mayor calidad, especialmente en matemáticas, contexto largo y tareas visuales.",
"gemini-1.5-pro-exp-0801.description": "Gemini 1.5 Pro 0801 ofrece procesamiento multimodal sólido con mayor flexibilidad para el desarrollo de aplicaciones.",
"gemini-1.5-pro-exp-0827.description": "Gemini 1.5 Pro 0827 aplica las últimas optimizaciones para un procesamiento multimodal más eficiente.",
"gemini-1.5-pro-latest.description": "Gemini 1.5 Pro admite hasta 2 millones de tokens, siendo un modelo multimodal de tamaño medio ideal para tareas complejas.",
"gemini-2.0-flash-001.description": "Gemini 2.0 Flash ofrece funciones de nueva generación como velocidad excepcional, uso nativo de herramientas, generación multimodal y una ventana de contexto de 1 millón de tokens.",
"gemini-2.0-flash-lite-001.description": "Una variante de Gemini 2.0 Flash optimizada para eficiencia de costos y baja latencia.",
"gemini-2.0-flash-lite.description": "Una variante de Gemini 2.0 Flash optimizada para eficiencia de costos y baja latencia.",
"gemini-2.0-flash.description": "Gemini 2.0 Flash ofrece funciones de nueva generación como velocidad excepcional, uso nativo de herramientas, generación multimodal y una ventana de contexto de 1 millón de tokens.",
"gemini-2.5-flash-image.description": "Nano Banana es el modelo multimodal nativo más nuevo, rápido y eficiente de Google, que permite generación y edición de imágenes conversacionales.",
"gemini-2.5-flash-image:image.description": "Nano Banana es el modelo multimodal nativo más nuevo, rápido y eficiente de Google, que permite generación y edición de imágenes conversacionales.",
"gemini-2.5-flash-lite-preview-06-17.description": "Gemini 2.5 Flash-Lite Preview es el modelo más pequeño y rentable de Google, diseñado para uso a gran escala.",
"gemini-2.5-flash-lite.description": "Gemini 2.5 Flash-Lite es el modelo más pequeño y rentable de Google, diseñado para uso a gran escala.",
"gemini-2.5-flash-preview-04-17.description": "Gemini 2.5 Flash Preview es el modelo más rentable de Google con capacidades completas.",
"gemini-2.5-flash.description": "Gemini 2.5 Flash es el modelo más rentable de Google con capacidades completas.",
"gemini-2.5-pro-preview-03-25.description": "Gemini 2.5 Pro Preview es el modelo de razonamiento más avanzado de Google, capaz de razonar sobre código, matemáticas y problemas STEM, y analizar grandes conjuntos de datos, bases de código y documentos con contexto largo.",
"gemini-2.5-pro-preview-05-06.description": "Gemini 2.5 Pro Preview es el modelo de razonamiento más avanzado de Google, capaz de razonar sobre código, matemáticas y problemas STEM, y analizar grandes conjuntos de datos, bases de código y documentos con contexto largo.",
"gemini-2.5-pro.description": "Gemini 2.5 Pro es el modelo de razonamiento más avanzado de Google, capaz de razonar sobre código, matemáticas y problemas STEM, y analizar grandes conjuntos de datos, bases de código y documentos con contexto largo.",
"gemini-3-flash-preview.description": "Gemini 3 Flash es el modelo más inteligente diseñado para la velocidad, combinando inteligencia de vanguardia con una excelente fundamentación en búsquedas.",
"gemini-3-flash.description": "Gemini 3 Flash de Google: modelo ultrarrápido con soporte multimodal.",
"gemini-3-pro-image-preview.description": "Gemini 3 Pro Image (Nano Banana Pro) es el modelo de generación de imágenes de Google que también admite diálogo multimodal.",
"gemini-3-pro-image-preview:image.description": "Gemini 3 Pro Image (Nano Banana Pro) es el modelo de generación de imágenes de Google y también admite chat multimodal.",
"gemini-3-pro-preview.description": "Gemini 3 Pro es el agente más potente de Google y modelo de codificación emocional, que ofrece visuales más ricos e interacción más profunda sobre un razonamiento de última generación.",
"gemini-3.1-flash-image-preview.description": "Gemini 3.1 Flash Image (Nano Banana 2) es el modelo nativo de generación de imágenes más rápido de Google con soporte de pensamiento, generación conversacional de imágenes y edición.",
"gemini-3.1-flash-image-preview:image.description": "Gemini 3.1 Flash Image (Nano Banana 2) es el modelo nativo de generación de imágenes más rápido de Google, con soporte para razonamiento, generación conversacional de imágenes y edición.",
"gemini-3.1-flash-lite-preview.description": "Gemini 3.1 Flash-Lite Preview es el modelo multimodal más rentable de Google, optimizado para tareas agentivas de alto volumen, traducción y procesamiento de datos.",
"gemini-3.1-flash-lite.description": "Gemini 3.1 Flash-Lite es el modelo multimodal más eficiente en costos de Google, optimizado para tareas agentivas de alto volumen, traducción y procesamiento de datos.",
"gemini-3.1-pro-preview.description": "Gemini 3.1 Pro Preview mejora las capacidades de razonamiento de Gemini 3 Pro y añade soporte para un nivel de pensamiento medio.",
"gemini-3.1-pro.description": "Gemini 3.1 Pro de Google: modelo multimodal premium con ventana de contexto de 1M.",
"gemini-3.5-flash.description": "El modelo más inteligente de Gemini diseñado para velocidad, combinando inteligencia de vanguardia con búsqueda y fundamentación superiores.",
"gemini-flash-latest.description": "Apunta a gemini-3-flash-preview",
"gemini-flash-lite-latest.description": "Apunta a gemini-3.1-flash-lite",
"gemini-pro-latest.description": "Apunta a gemini-3.1-pro-preview",
"gemma-7b-it.description": "Gemma 7B es rentable para tareas de pequeña a mediana escala.",
"gemma2-9b-it.description": "Gemma 2 9B está optimizado para tareas específicas e integración con herramientas.",
"gemma2.description": "Gemma 2 es el modelo eficiente de Google, adecuado para casos de uso que van desde aplicaciones pequeñas hasta procesamiento de datos complejos.",
"gemma2:27b.description": "Gemma 2 es el modelo eficiente de Google, adecuado para casos de uso que van desde aplicaciones pequeñas hasta procesamiento de datos complejos.",
"gemma2:2b.description": "Gemma 2 es el modelo eficiente de Google, adecuado para casos de uso que van desde aplicaciones pequeñas hasta procesamiento de datos complejos.",
"generalv3.5.description": "Spark Max es la versión más completa, con búsqueda web y numerosos complementos integrados. Sus capacidades centrales optimizadas, roles de sistema y llamadas a funciones ofrecen un rendimiento excelente en escenarios de aplicación complejos.",
"generalv3.description": "Spark Pro es un modelo LLM de alto rendimiento optimizado para dominios profesionales, centrado en matemáticas, programación, salud y educación, con búsqueda web y complementos integrados como clima y fecha. Ofrece un rendimiento sólido y eficiente en preguntas complejas, comprensión del lenguaje y creación avanzada de texto, siendo ideal para usos profesionales.",
"glm-4-0520.description": "GLM-4-0520 es la versión más reciente del modelo, diseñado para tareas altamente complejas y diversas con un rendimiento excelente.",
"glm-4-7.description": "GLM-4.7 es el modelo insignia más reciente de Zhipu AI. Mejora las capacidades de programación, planificación de tareas a largo plazo y colaboración con herramientas para escenarios de codificación agente, logrando un rendimiento líder entre los modelos de código abierto en múltiples pruebas públicas. Las capacidades generales se han mejorado, con respuestas más concisas y naturales, y una escritura más inmersiva. En tareas complejas de agentes, el seguimiento de instrucciones es más sólido durante las llamadas a herramientas, y se mejora la estética del frontend de Artifacts y Agentic Coding, así como la eficiencia en la finalización de tareas a largo plazo.",
"glm-4-9b-chat.description": "GLM-4-9B-Chat ofrece un rendimiento sólido en semántica, matemáticas, razonamiento, código y conocimiento. También admite navegación web, ejecución de código, llamadas a herramientas personalizadas y razonamiento de texto largo, con soporte para 26 idiomas, incluidos japonés, coreano y alemán.",
"glm-4-air-250414.description": "GLM-4-Air es una opción de alto valor con rendimiento cercano a GLM-4, velocidad rápida y menor costo.",
"glm-4-air.description": "GLM-4-Air es una opción de alto valor con rendimiento cercano a GLM-4, velocidad rápida y menor costo.",
"glm-4-airx.description": "GLM-4-AirX es una variante más eficiente de GLM-4-Air con razonamiento hasta 2.6 veces más rápido.",
"glm-4-alltools.description": "GLM-4-AllTools es un modelo de agente versátil optimizado para planificación de instrucciones complejas y uso de herramientas como navegación web, explicación de código y generación de texto, adecuado para ejecución multitarea.",
"glm-4-flash-250414.description": "GLM-4-Flash es ideal para tareas simples: el más rápido y gratuito.",
"glm-4-flash.description": "GLM-4-Flash es ideal para tareas simples: el más rápido y gratuito.",
"glm-4-flashx.description": "GLM-4-FlashX es una versión mejorada de Flash con razonamiento ultrarrápido.",
"glm-4-long.description": "GLM-4-Long admite entradas ultralargas para tareas de tipo memoria y procesamiento de documentos a gran escala.",
"glm-4-plus.description": "GLM-4-Plus es un buque insignia de alta inteligencia con manejo sólido de texto largo y tareas complejas, y rendimiento general mejorado.",
"glm-4.1v-thinking-flash.description": "GLM-4.1V-Thinking es el modelo VLM de ~10B más potente conocido, cubriendo tareas SOTA como comprensión de video, preguntas visuales, resolución de materias, OCR, lectura de documentos y gráficos, agentes GUI, codificación frontend y grounding. Supera incluso al Qwen2.5-VL-72B, 8 veces más grande, en muchas tareas. Con aprendizaje por refuerzo avanzado, utiliza razonamiento en cadena para mejorar precisión y riqueza, superando a modelos tradicionales sin razonamiento en resultados y explicabilidad.",
"glm-4.1v-thinking-flashx.description": "GLM-4.1V-Thinking es el modelo VLM de ~10B más potente conocido, cubriendo tareas SOTA como comprensión de video, preguntas visuales, resolución de materias, OCR, lectura de documentos y gráficos, agentes GUI, codificación frontend y grounding. Supera incluso al Qwen2.5-VL-72B, 8 veces más grande, en muchas tareas. Con aprendizaje por refuerzo avanzado, utiliza razonamiento en cadena para mejorar precisión y riqueza, superando a modelos tradicionales sin razonamiento en resultados y explicabilidad.",
"glm-4.5-air.description": "Edición ligera de GLM-4.5 que equilibra rendimiento y costo, con modos de razonamiento híbrido flexibles.",
"glm-4.5-airx.description": "Edición rápida de GLM-4.5-Air con respuestas más veloces para usos de gran escala y alta velocidad.",
"glm-4.5-x.description": "Edición rápida de GLM-4.5, con rendimiento sólido y velocidades de generación de hasta 100 tokens/segundo.",
"glm-4.5.description": "Modelo insignia de Zhipu con modo de razonamiento conmutable, ofreciendo SOTA de código abierto y hasta 128K de contexto.",
"glm-4.5v.description": "Modelo de razonamiento visual de próxima generación de Zhipu con arquitectura MoE, 106B parámetros totales y 12B activos, logrando SOTA entre modelos multimodales de código abierto de tamaño similar en imagen, video, comprensión de documentos y tareas GUI.",
"glm-4.6.description": "GLM-4.6 (355B), el último modelo insignia de Zhipu, supera completamente a sus predecesores en codificación avanzada, procesamiento de textos largos, razonamiento y capacidades de agente. Se alinea especialmente con Claude Sonnet 4 en habilidades de programación, convirtiéndose en el modelo de codificación líder en China.",
"glm-4.6v-flash.description": "La serie GLM-4.6V representa una importante iteración de la familia GLM en la dirección multimodal, que incluye GLM-4.6V (insignia), GLM-4.6V-FlashX (ligero y de alta velocidad) y GLM-4.6V-Flash (completamente gratuito). Amplía la ventana de contexto de tiempo de entrenamiento a 128k tokens, logra una precisión de comprensión visual de última generación en escalas de parámetros comparables y, por primera vez, integra de forma nativa capacidades de Llamada de Función (invocación de herramientas) en la arquitectura del modelo visual. Esto unifica el flujo desde la “percepción visual” hasta las “acciones ejecutables,” proporcionando una base técnica consistente para agentes multimodales en escenarios de producción del mundo real.",
"glm-4.6v-flashx.description": "La serie GLM-4.6V representa una importante iteración de la familia GLM en la dirección multimodal, que incluye GLM-4.6V (insignia), GLM-4.6V-FlashX (ligero y de alta velocidad) y GLM-4.6V-Flash (completamente gratuito). Amplía la ventana de contexto de tiempo de entrenamiento a 128k tokens, logra una precisión de comprensión visual de última generación en escalas de parámetros comparables y, por primera vez, integra de forma nativa capacidades de Llamada de Función (invocación de herramientas) en la arquitectura del modelo visual. Esto unifica el flujo desde la “percepción visual” hasta las “acciones ejecutables,” proporcionando una base técnica consistente para agentes multimodales en escenarios de producción del mundo real.",
"glm-4.6v.description": "La serie GLM-4.6V representa una importante iteración de la familia GLM en la dirección multimodal, que incluye GLM-4.6V (insignia), GLM-4.6V-FlashX (ligero y de alta velocidad) y GLM-4.6V-Flash (completamente gratuito). Amplía la ventana de contexto de tiempo de entrenamiento a 128k tokens, logra una precisión de comprensión visual de última generación en escalas de parámetros comparables y, por primera vez, integra de forma nativa capacidades de Llamada de Función (invocación de herramientas) en la arquitectura del modelo visual. Esto unifica el flujo desde la “percepción visual” hasta las “acciones ejecutables,” proporcionando una base técnica consistente para agentes multimodales en escenarios de producción del mundo real.",
"glm-4.7-flash.description": "GLM-4.7-Flash, como modelo SOTA de nivel 30B, ofrece una nueva opción que equilibra rendimiento y eficiencia. Mejora las capacidades de programación, planificación de tareas a largo plazo y colaboración con herramientas para escenarios de codificación agente, logrando un rendimiento líder entre modelos de código abierto de su tamaño en múltiples clasificaciones actuales. En la ejecución de tareas complejas de agentes inteligentes, tiene un mayor cumplimiento de instrucciones durante las llamadas a herramientas, y mejora aún más la estética del frontend y la eficiencia en la finalización de tareas a largo plazo para Artifacts y Agentic Coding.",
"glm-4.7-flashx.description": "GLM-4.7-Flash, como modelo SOTA de nivel 30B, ofrece una nueva opción que equilibra rendimiento y eficiencia. Mejora las capacidades de programación, planificación de tareas a largo plazo y colaboración con herramientas para escenarios de codificación agente, logrando un rendimiento líder entre modelos de código abierto de su tamaño en múltiples clasificaciones actuales. En la ejecución de tareas complejas de agentes inteligentes, tiene un mayor cumplimiento de instrucciones durante las llamadas a herramientas, y mejora aún más la estética del frontend y la eficiencia en la finalización de tareas a largo plazo para Artifacts y Agentic Coding.",
"glm-4.7.description": "GLM-4.7 es el modelo insignia más reciente de Zhipu, mejorado para escenarios de Codificación Agéntica con capacidades de programación avanzadas, planificación de tareas a largo plazo y colaboración con herramientas. Logra un rendimiento líder entre los modelos de código abierto en múltiples benchmarks públicos. Sus capacidades generales se han mejorado con respuestas más concisas y naturales, y una escritura más inmersiva. En tareas complejas de agente, sigue mejor las instrucciones durante el uso de herramientas, y se han optimizado la estética del frontend y la eficiencia en la finalización de tareas a largo plazo en Artifacts y Codificación Agéntica.",
"glm-4.description": "GLM-4 es el modelo insignia anterior lanzado en enero de 2024, ahora reemplazado por el más potente GLM-4-0520.",
"glm-4v-flash.description": "GLM-4V-Flash se centra en la comprensión eficiente de imágenes individuales para análisis rápidos en escenarios como procesamiento de imágenes en tiempo real o por lotes.",
"glm-4v-plus-0111.description": "GLM-4V-Plus comprende video e imágenes múltiples, adecuado para tareas multimodales.",
"glm-4v-plus.description": "GLM-4V-Plus comprende video e imágenes múltiples, adecuado para tareas multimodales.",
"glm-4v.description": "GLM-4V ofrece sólida comprensión y razonamiento visual en tareas visuales.",
"glm-5-turbo.description": "GLM-5-Turbo es un modelo base profundamente optimizado para escenarios agentivos. Ha sido específicamente optimizado para los requisitos principales de tareas de agentes desde la fase de entrenamiento, mejorando capacidades clave como invocación de herramientas, seguimiento de comandos y ejecución de cadenas largas. Es ideal para construir asistentes de agentes de alto rendimiento.",
"glm-5.1.description": "GLM-5.1 es el modelo insignia más reciente de Zhipu, alineado con Claude Opus 4.6 en capacidades generales y de programación. Destaca en tareas de largo alcance, siendo capaz de planificar, ejecutar e iterar de forma autónoma durante hasta 8 horas en una sola tarea, lo que lo convierte en una base ideal para Agentes Autónomos y Agentes de Programación de largo alcance.",
"glm-5.description": "GLM-5 es el modelo base insignia de próxima generación de Zhipu, diseñado específicamente para la Ingeniería Agente. Ofrece productividad confiable en sistemas de ingeniería complejos y tareas de agentes de largo alcance. En capacidades de codificación y agentes, GLM-5 logra un rendimiento de última generación entre los modelos de código abierto. En escenarios de programación del mundo real, su experiencia de usuario se acerca a la de Claude Opus 4.5. Sobresale en ingeniería de sistemas complejos y tareas de agentes de largo alcance, convirtiéndolo en un modelo base ideal para asistentes agentes de propósito general.",
"glm-5v-turbo.description": "GLM-5V-Turbo es el modelo base de codificación multimodal de Zhipu para tareas de programación visual. Maneja de forma nativa imágenes, videos, texto y archivos, y está optimizado para planificación a largo plazo, codificación compleja y ejecución de agentes en flujos de trabajo multimodales.",
"glm-image.description": "GLM-Image es el nuevo modelo insignia de generación de imágenes de Zhipu. El modelo fue entrenado de principio a fin en chips producidos localmente y adopta una arquitectura híbrida original que combina modelado autorregresivo con un decodificador de difusión. Este diseño permite una sólida comprensión de instrucciones globales junto con un renderizado detallado a nivel local, superando desafíos de larga data en la generación de contenido denso en conocimiento, como carteles, presentaciones y diagramas educativos. Representa una importante exploración hacia una nueva generación de paradigmas tecnológicos “generativos cognitivos,” ejemplificados por Nano Banana Pro.",
"glm-z1-air.description": "Modelo de razonamiento con gran capacidad de inferencia profunda para tareas complejas.",
"glm-z1-airx.description": "Razonamiento ultrarrápido con alta calidad de inferencia.",
"glm-z1-flash.description": "La serie GLM-Z1 ofrece razonamiento complejo sólido, destacando en lógica, matemáticas y programación.",
"glm-z1-flashx.description": "Rápido y de bajo costo: versión Flash mejorada con razonamiento ultrarrápido y mayor concurrencia.",
"glm-zero-preview.description": "GLM-Zero-Preview ofrece razonamiento complejo sólido, destacando en lógica, matemáticas y programación.",
"global.anthropic.claude-haiku-4-5-20251001-v1:0.description": "Claude Haiku 4.5 es el modelo Haiku más rápido e inteligente de Anthropic, con velocidad relámpago y pensamiento extendido.",
"global.anthropic.claude-opus-4-5-20251101-v1:0.description": "Claude Opus 4.5 es el modelo insignia de Anthropic, que combina inteligencia excepcional y rendimiento escalable para tareas complejas que requieren respuestas y razonamiento de la más alta calidad.",
"global.anthropic.claude-opus-4-6-v1.description": "Claude Opus 4.6 es el modelo más inteligente de Anthropic para construir agentes y codificación.",
"global.anthropic.claude-opus-4-7.description": "Claude Opus 4.7 es el modelo más capaz de Anthropic disponible de forma general para razonamiento complejo y programación agéntica.",
"global.anthropic.claude-sonnet-4-5-20250929-v1:0.description": "Claude Sonnet 4.5 es el modelo más inteligente de Anthropic hasta la fecha.",
"global.anthropic.claude-sonnet-4-6.description": "Claude Sonnet 4.6 es la mejor combinación de velocidad e inteligencia de Anthropic.",
"google/gemini-2.0-flash-001.description": "Gemini 2.0 Flash ofrece capacidades de nueva generación, incluyendo excelente velocidad, uso nativo de herramientas, generación multimodal y una ventana de contexto de 1 millón de tokens.",
"google/gemini-2.0-flash-lite-001.description": "Gemini 2.0 Flash Lite es una variante ligera de Gemini con el razonamiento desactivado por defecto para mejorar la latencia y el costo, aunque puede activarse mediante parámetros.",
"google/gemini-2.0-flash-lite.description": "Gemini 2.0 Flash Lite ofrece funciones de nueva generación como velocidad excepcional, uso integrado de herramientas, generación multimodal y una ventana de contexto de 1 millón de tokens.",
"google/gemini-2.0-flash.description": "Gemini 2.0 Flash es el modelo de razonamiento de alto rendimiento de Google para tareas multimodales extendidas.",
"google/gemini-2.5-flash-image.description": "Gemini 2.5 Flash Image (Nano Banana) es el modelo de generación de imágenes de Google con soporte para conversación multimodal.",
"google/gemini-2.5-flash-lite.description": "Gemini 2.5 Flash Lite es la variante ligera de Gemini 2.5 optimizada para latencia y costo, ideal para escenarios de alto rendimiento.",
"google/gemini-2.5-flash.description": "Gemini 2.5 Flash es la familia de Google que abarca desde baja latencia hasta razonamiento de alto rendimiento.",
"google/gemini-2.5-pro-preview.description": "Gemini 2.5 Pro Preview es el modelo de razonamiento más avanzado de Google para resolver problemas complejos en código, matemáticas y STEM, y para analizar grandes conjuntos de datos, bases de código y documentos con contexto largo.",
"google/gemini-2.5-pro.description": "Gemini 2.5 Pro es el modelo insignia de razonamiento de Google con soporte de contexto largo para tareas complejas.",
"google/gemini-3-pro-image-preview.description": "Gemini 3 Pro Image (Nano Banana Pro) es el modelo de generación de imágenes de Google con soporte para conversación multimodal.",
"google/gemini-3-pro-preview.description": "Gemini 3 Pro es el modelo de razonamiento multimodal de nueva generación de la familia Gemini, capaz de comprender texto, audio, imágenes y video, y manejar tareas complejas y grandes bases de código.",
"google/gemini-3.1-flash-image-preview.description": "Gemini 3.1 Flash Image Preview, también conocido como \"Nano Banana 2\", es el modelo más reciente de generación y edición de imágenes de Google, ofreciendo calidad visual a nivel profesional a velocidad Flash. Combina comprensión contextual avanzada con inferencia rápida y rentable, haciendo que la generación de imágenes complejas y las ediciones iterativas sean significativamente más accesibles.",
"google/gemini-embedding-001.description": "Modelo de embedding de última generación con alto rendimiento en tareas en inglés, multilingües y de código.",
"google/gemma-2-27b-it.description": "Gemma 2 27B es un modelo de lenguaje de propósito general con alto rendimiento en múltiples escenarios.",
"google/gemma-2-27b.description": "Gemma 2 es la familia de modelos eficientes de Google para casos de uso que van desde aplicaciones pequeñas hasta procesamiento de datos complejos.",
"google/gemma-2-2b-it.description": "Un modelo de lenguaje pequeño y avanzado diseñado para aplicaciones en el borde.",
"google/gemma-2-9b-it.description": "Gemma 2 9B, desarrollado por Google, ofrece seguimiento eficiente de instrucciones y una capacidad general sólida.",
"google/gemma-2-9b.description": "Gemma 2 es la familia de modelos eficientes de Google para casos de uso que van desde aplicaciones pequeñas hasta procesamiento de datos complejos.",
"google/gemma-2b-it.description": "Gemma Instruct (2B) proporciona manejo básico de instrucciones para aplicaciones ligeras.",
"google/gemma-3-12b-it.description": "Gemma 3 12B es un modelo de lenguaje de código abierto de Google que establece un nuevo estándar en eficiencia y rendimiento.",
"google/gemma-3-27b-it.description": "Gemma 3 27B es un modelo de lenguaje de código abierto de Google que establece un nuevo estándar en eficiencia y rendimiento.",
"google/text-embedding-005.description": "Modelo de embedding de texto enfocado en inglés, optimizado para tareas de código y lenguaje en inglés.",
"google/text-multilingual-embedding-002.description": "Modelo de embedding de texto multilingüe optimizado para tareas interlingüísticas en muchos idiomas.",
"gpt-3.5-turbo-0125.description": "GPT 3.5 Turbo para generación y comprensión de texto; actualmente apunta a gpt-3.5-turbo-0125.",
"gpt-3.5-turbo-1106.description": "GPT 3.5 Turbo para generación y comprensión de texto; actualmente apunta a gpt-3.5-turbo-0125.",
"gpt-3.5-turbo-instruct.description": "GPT 3.5 Turbo para tareas de generación y comprensión de texto, optimizado para seguir instrucciones.",
"gpt-3.5-turbo.description": "GPT 3.5 Turbo para generación y comprensión de texto; actualmente apunta a gpt-3.5-turbo-0125.",
"gpt-35-turbo-16k.description": "GPT-3.5 Turbo 16k es un modelo de generación de texto de alta capacidad para tareas complejas.",
"gpt-35-turbo.description": "GPT-3.5 Turbo es el modelo eficiente de OpenAI para chat y generación de texto, con soporte para llamadas de función en paralelo.",
"gpt-4-0125-preview.description": "El último modelo GPT-4 Turbo incluye visión. Las solicitudes de visión pueden usar el modo JSON y llamadas a funciones. GPT-4 Turbo es una versión mejorada que equilibra precisión y eficiencia para tareas multimodales rentables e interacciones en tiempo real.",
"gpt-4-0613.description": "GPT-4 ofrece una ventana de contexto más amplia para manejar entradas más largas, adecuado para síntesis de información y análisis de datos.",
"gpt-4-1106-preview.description": "El último modelo GPT-4 Turbo incluye visión. Las solicitudes de visión pueden usar el modo JSON y llamadas a funciones. GPT-4 Turbo es una versión mejorada que equilibra precisión y eficiencia para tareas multimodales rentables e interacciones en tiempo real.",
"gpt-4-32k-0613.description": "GPT-4 ofrece una ventana de contexto más amplia para manejar entradas más largas en escenarios que requieren integración de información y análisis de datos.",
"gpt-4-32k.description": "GPT-4 ofrece una ventana de contexto más amplia para manejar entradas más largas en escenarios que requieren integración de información y análisis de datos.",
"gpt-4-turbo-2024-04-09.description": "El último GPT-4 Turbo añade visión. Las solicitudes visuales admiten modo JSON y llamadas de función. Es un modelo multimodal rentable que equilibra precisión y eficiencia para aplicaciones en tiempo real.",
"gpt-4-turbo-preview.description": "El último modelo GPT-4 Turbo incluye visión. Las solicitudes de visión pueden usar el modo JSON y llamadas a funciones. GPT-4 Turbo es una versión mejorada que equilibra precisión y eficiencia para tareas multimodales rentables e interacciones en tiempo real.",
"gpt-4-turbo.description": "El último GPT-4 Turbo añade visión. Las solicitudes visuales admiten modo JSON y llamadas de función. Es un modelo multimodal rentable que equilibra precisión y eficiencia para aplicaciones en tiempo real.",
"gpt-4-vision-preview.description": "Vista previa de GPT-4 Vision, diseñado para tareas de análisis y procesamiento de imágenes.",
"gpt-4.1-mini.description": "GPT-4.1 mini equilibra inteligencia, velocidad y costo, siendo atractivo para muchos casos de uso.",
"gpt-4.1-nano.description": "GPT-4.1 nano es el modelo GPT-4.1 más rápido y rentable.",
"gpt-4.1.description": "GPT-4.1 es nuestro modelo insignia para tareas complejas y resolución de problemas interdisciplinares.",
"gpt-4.5-preview.description": "GPT-4.5-preview es el último modelo de propósito general con profundo conocimiento del mundo y mejor comprensión de intenciones, fuerte en tareas creativas y planificación de agentes. Su límite de conocimiento es octubre de 2023.",
"gpt-4.description": "GPT-4 ofrece una ventana de contexto más amplia para manejar entradas más largas, adecuado para síntesis de información y análisis de datos.",
"gpt-4o-2024-05-13.description": "ChatGPT-4o es un modelo dinámico actualizado en tiempo real, que combina una sólida comprensión y generación para casos de uso a gran escala como atención al cliente, educación y soporte técnico.",
"gpt-4o-2024-08-06.description": "ChatGPT-4o es un modelo dinámico actualizado en tiempo real. Combina una sólida comprensión del lenguaje y generación para casos de uso a gran escala como atención al cliente, educación y asistencia técnica.",
"gpt-4o-2024-11-20.description": "ChatGPT-4o es un modelo dinámico actualizado en tiempo real, que combina una sólida comprensión y generación para casos de uso a gran escala como atención al cliente, educación y soporte técnico.",
"gpt-4o-mini-realtime-preview.description": "Variante en tiempo real de GPT-4o-mini con entrada/salida de audio y texto en tiempo real.",
"gpt-4o-mini-search-preview.description": "GPT-4o mini Search Preview está entrenado para comprender y ejecutar consultas de búsqueda web a través de la API de Chat Completions. La búsqueda web se factura por cada llamada a herramienta además del costo por tokens.",
"gpt-4o-mini-transcribe.description": "GPT-4o Mini Transcribe es un modelo de voz a texto que transcribe audio con GPT-4o, mejorando la tasa de error de palabras, la identificación de idioma y la precisión en comparación con el modelo Whisper original.",
"gpt-4o-mini-tts.description": "GPT-4o mini TTS es un modelo de texto a voz basado en GPT-4o mini, que convierte texto en voz natural con un máximo de entrada de 2000 tokens.",
"gpt-4o-mini.description": "GPT-4o mini es el modelo más reciente de OpenAI tras GPT-4 Omni, compatible con entrada de texto+imagen y salida de texto. Es su modelo pequeño más avanzado, mucho más económico que los modelos de frontera recientes y más de un 60% más barato que GPT-3.5 Turbo, manteniendo una inteligencia de primer nivel (82% MMLU).",
"gpt-4o-realtime-preview-2024-10-01.description": "Variante en tiempo real de GPT-4o con entrada/salida de audio y texto en tiempo real.",
"gpt-4o-realtime-preview-2025-06-03.description": "Variante en tiempo real de GPT-4o con entrada/salida de audio y texto en tiempo real.",
"gpt-4o-realtime-preview.description": "Variante en tiempo real de GPT-4o con entrada/salida de audio y texto en tiempo real.",
"gpt-4o-search-preview.description": "GPT-4o Search Preview está entrenado para comprender y ejecutar consultas de búsqueda web a través de la API de Chat Completions. La búsqueda web se factura por cada llamada a herramienta además del costo por tokens.",
"gpt-4o-transcribe.description": "GPT-4o Transcribe es un modelo de voz a texto que transcribe audio con GPT-4o, mejorando la tasa de error de palabras, la identificación de idioma y la precisión en comparación con el modelo Whisper original.",
"gpt-4o.description": "ChatGPT-4o es un modelo dinámico actualizado en tiempo real, que combina una sólida comprensión y generación para casos de uso a gran escala como atención al cliente, educación y soporte técnico.",
"gpt-5-chat-latest.description": "El modelo GPT-5 utilizado en ChatGPT, que combina una sólida comprensión y generación para aplicaciones conversacionales.",
"gpt-5-chat.description": "GPT-5 Chat es un modelo de vista previa optimizado para escenarios conversacionales. Admite entrada de texto e imagen, salida solo de texto, y es ideal para chatbots y aplicaciones de IA conversacional.",
"gpt-5-codex.description": "GPT5 Codex de OpenAI: variante especializada en programación con soporte para herramientas.",
"gpt-5-mini.description": "Una variante de GPT-5 más rápida y rentable para tareas bien definidas, que ofrece respuestas más rápidas manteniendo la calidad.",
"gpt-5-nano.description": "GPT5 Nano de OpenAI: modelo ligero y rentable.",
"gpt-5-pro.description": "GPT-5 pro utiliza más recursos de cómputo para pensar más profundamente y ofrecer respuestas consistentemente mejores.",
"gpt-5.1-chat-latest.description": "GPT-5.1 Chat: la variante de ChatGPT de GPT-5.1, diseñada para escenarios de conversación.",
"gpt-5.1-codex-max.description": "GPT5.1 Codex Max de OpenAI: variante Codex con capacidad máxima.",
"gpt-5.1-codex-mini.description": "GPT5.1 Codex Mini de OpenAI: modelo compacto de programación con sólidas capacidades.",
"gpt-5.1-codex.description": "GPT5.1 Codex de OpenAI: variante centrada en programación con uso de herramientas mejorado.",
"gpt-5.1.description": "GPT5.1 de OpenAI: versión mejorada de GPT5 con mayor precisión de razonamiento.",
"gpt-5.2-chat-latest.description": "GPT-5.2 Chat es la variante de ChatGPT (chat-latest) con las últimas mejoras en conversación.",
"gpt-5.2-codex.description": "GPT5.2 Codex de OpenAI: especializado en programación con mayor precisión en llamadas a herramientas.",
"gpt-5.2-pro.description": "GPT-5.2 Pro: una variante más inteligente y precisa de GPT-5.2 (solo API de respuestas), adecuada para problemas difíciles y razonamiento prolongado en múltiples turnos.",
"gpt-5.2.description": "GPT5.2 de OpenAI: razonamiento y procesamiento multimodal mejorados.",
"gpt-5.3-chat-latest.description": "GPT-5.3 Chat es el último modelo de ChatGPT utilizado en ChatGPT con experiencias de conversación mejoradas.",
"gpt-5.3-codex-spark.description": "GPT5.3 Codex Spark de OpenAI: modelo compacto optimizado para velocidad.",
"gpt-5.3-codex.description": "GPT5.3 Codex de OpenAI: último Codex con mejor comprensión de código.",
"gpt-5.4-mini.description": "GPT5.4 Mini de OpenAI: modelo eficiente que equilibra costo y rendimiento.",
"gpt-5.4-nano.description": "GPT5.4 Nano de OpenAI: modelo ultraligero para tareas de alto rendimiento.",
"gpt-5.4-pro.description": "GPT5.4 Pro de OpenAI: modelo más capaz con máximo contexto y razonamiento.",
"gpt-5.4.description": "GPT5.4 de OpenAI: modelo de nueva generación con ventana de contexto de más de 1M y entrada multimodal.",
"gpt-5.5-pro.description": "GPT5.5 Pro utiliza más cómputo para ofrecer razonamientos más profundos y respuestas consistentemente superiores.",
"gpt-5.5.description": "GPT-5.5 es nuestro modelo de frontera más reciente para el trabajo profesional más complejo.",
"gpt-5.description": "GPT5 de OpenAI: modelo insignia con razonamiento avanzado y entrada multimodal.",
"gpt-audio.description": "GPT Audio es un modelo general de chat con entrada/salida de audio, compatible con la API de Chat Completions.",
"gpt-image-1-mini.description": "Una variante de menor costo de GPT Image 1 con entrada nativa de texto e imagen y salida de imagen.",
"gpt-image-1.5.description": "Un modelo mejorado de GPT Image 1 con generación 4× más rápida, edición más precisa y mejor renderizado de texto.",
"gpt-image-1.description": "Modelo nativo de generación de imágenes multimodal de ChatGPT.",
"gpt-image-2.description": "Modelo de imagen multimodal de nueva generación de OpenAI, con razonamiento nativo, resolución de hasta 4K, renderizado casi perfecto de texto y compatibilidad multilingüe de alta fidelidad.",
"gpt-oss-120b.description": "Se requiere solicitud de acceso. GPT-OSS-120B es un modelo de lenguaje de código abierto de OpenAI con gran capacidad de generación de texto.",
"gpt-oss-20b.description": "Se requiere solicitud de acceso. GPT-OSS-20B es un modelo de lenguaje de tamaño medio de código abierto de OpenAI con generación de texto eficiente.",
"gpt-oss:120b.description": "GPT-OSS 120B es el LLM de código abierto de gran tamaño de OpenAI que utiliza cuantización MXFP4 y se posiciona como modelo insignia. Requiere entornos con múltiples GPU o estaciones de trabajo de alto rendimiento y ofrece un excelente rendimiento en razonamiento complejo, generación de código y procesamiento multilingüe, con funciones avanzadas de llamadas a funciones e integración de herramientas.",
"gpt-oss:20b.description": "GPT-OSS 20B es un LLM de código abierto de OpenAI que utiliza cuantización MXFP4, adecuado para GPU de consumo de gama alta o Macs con Apple Silicon. Tiene buen rendimiento en generación de diálogos, codificación y tareas de razonamiento, y admite llamadas a funciones y uso de herramientas.",
"gpt-realtime.description": "Un modelo general en tiempo real que admite entrada/salida de texto y audio en tiempo real, además de entrada de imagen.",
"grok-3-mini.description": "Grok 3 Mini de xAI: razonamiento sólido y respuestas rápidas.",
"grok-3.description": "Grok 3 de xAI: modelo con gran capacidad de razonamiento.",
"grok-4-0709.description": "Grok 4 de xAI con gran capacidad de razonamiento.",
"grok-4-20-non-reasoning.description": "Variante sin razonamiento para casos de uso simples.",
"grok-4-20-reasoning.description": "Modelo inteligente y rapidísimo que razona antes de responder.",
"grok-4.20-0309-non-reasoning.description": "Variante sin razonamiento para casos de uso simples.",
"grok-4.20-0309-reasoning.description": "Modelo inteligente y rapidísimo que razona antes de responder.",
"grok-4.20-beta-0309-non-reasoning.description": "Una variante sin razonamiento para casos de uso simples.",
"grok-4.20-beta-0309-reasoning.description": "Modelo inteligente y ultrarrápido que razona antes de responder.",
"grok-4.20-multi-agent-0309.description": "Equipo de 4 o 16 agentes. Destaca en casos de investigación. No admite herramientas del lado del cliente. Solo admite herramientas del lado del servidor de xAI (como X Search, Web Search) y herramientas MCP remotas.",
"grok-4.3.description": "El modelo de lenguaje grande más orientado a la verdad en el mundo.",
"grok-imagine-image-quality.description": "Genera imágenes a partir de indicaciones de texto, edita imágenes existentes con lenguaje natural o refina imágenes de manera iterativa a través de conversaciones de múltiples turnos.",
"grok-imagine-image.description": "Genera imágenes a partir de indicaciones de texto, edita imágenes existentes con lenguaje natural o refina imágenes de manera iterativa a través de conversaciones de múltiples turnos.",
"grok-imagine-video.description": "Generación de video de última generación en calidad, costo y latencia.",
"groq/compound-mini.description": "Compound-mini es un sistema de IA compuesto impulsado por modelos públicos disponibles en GroqCloud, que utiliza herramientas de forma inteligente y selectiva para responder a las consultas de los usuarios.",
"groq/compound.description": "Compound es un sistema de IA compuesto impulsado por múltiples modelos públicos disponibles en GroqCloud, que utiliza herramientas de forma inteligente y selectiva para responder a las consultas de los usuarios.",
"gryphe/mythomax-l2-13b.description": "MythoMax L2 13B es un modelo de lenguaje creativo e inteligente, resultado de la fusión de varios modelos de alto nivel.",
"happyhorse-1.0-i2v.description": "HappyHorse1.0I2V admite generación de video a partir de imágenes, ofreciendo resultados dinámicos altamente fieles. Comprende con precisión la semántica textual y produce vídeos fluidos, naturales y ricos en detalles.",
"happyhorse-1.0-r2v.description": "HappyHorse1.0R2V admite generación de video basada en referencias, proporcionando mayor consistencia en sujetos y escenas. Admite hasta 9 imágenes de referencia, preserva con precisión la intención creativa y ofrece mayor capacidad expresiva.",
"happyhorse-1.0-t2v.description": "HappyHorse1.0T2V admite generación de video a partir de texto, produciendo secuencias dinámicas altamente fieles. Comprende con precisión la semántica textual y genera videos suaves, naturales y detallados.",
"hunyuan-2.0-instruct-20251111.description": "La base del modelo ha sido mejorada de forma integral, con capacidades fundamentales más sólidas. Ofrece un rendimiento de primer nivel en conocimiento, matemáticas, redacción y razonamiento. También muestra un excelente desempeño en seguimiento de instrucciones, interacción multiturno y comprensión de contexto largo.",
"hunyuan-2.0-thinking-20251109.description": "Especializado en contenido creativo, interacciones multiturno y escenarios prácticos de seguimiento de instrucciones. Capacidades significativamente mejoradas en matemáticas, programación y tareas basadas en agentes.",
"hunyuan-code.description": "El último modelo de código de Hunyuan entrenado con 200 mil millones de datos de código de alta calidad más seis meses de datos SFT, con un contexto de 8K. Se ubica cerca de la cima en los benchmarks automatizados de código y en evaluaciones humanas expertas en cinco idiomas.",
"hunyuan-functioncall.description": "El último modelo MoE FunctionCall de Hunyuan entrenado con datos de llamadas de herramientas de alta calidad, con una ventana de contexto de 32K y benchmarks líderes en múltiples dimensiones.",
"hunyuan-lite.description": "Actualizado a una arquitectura MoE con ventana de contexto de 256K, superando a muchos modelos de código abierto en benchmarks de NLP, programación, matemáticas y dominios específicos.",
"hunyuan-pro.description": "Modelo MoE de un billón de parámetros con contexto largo de 32K, líder en benchmarks, fuerte en instrucciones complejas y razonamiento, matemáticas avanzadas, llamadas a funciones y optimizado para traducción multilingüe, finanzas, derecho y medicina.",
"hunyuan-role-latest.description": "Diseñado para escenarios de rol, ofrece una alineación de personaje altamente consistente y un estilo conversacional excepcionalmente natural y humano. Proporciona desarrollo narrativo atractivo, progresión de trama y acompañamiento emocional.",
"hunyuan-role.description": "El último modelo de rol de Hunyuan, ajustado oficialmente con datos de rol, ofreciendo un rendimiento base más sólido en escenarios de rol.",
"hunyuan-standard-256K.description": "Utiliza enrutamiento mejorado para mitigar problemas de balanceo de carga y colapso de expertos. En tareas de texto largo, “needle in a haystack” alcanza el 99.9%. MOE256K aumenta aún más la longitud y calidad, ampliando considerablemente la entrada posible.",
"hunyuan-standard.description": "Utiliza enrutamiento mejorado para mitigar problemas de balanceo de carga y colapso de expertos. En tareas de texto largo, “needle in a haystack” alcanza el 99.9%. MOE32K ofrece mejor relación calidadprecio equilibrando calidad y costo para entradas extensas.",
"hunyuan-turbo.description": "Vista previa del LLM de próxima generación de Hunyuan con nueva arquitectura MoE, que ofrece razonamiento más rápido y mejores resultados que hunyuan-pro.",
"hunyuan-vision.description": "El último modelo multimodal de Hunyuan que admite entradas de imagen + texto para generar texto.",
"hy-image-lite.description": "Utiliza un códec de ultraalta compresión para generar imágenes rápidamente manteniendo alta calidad. Admite casos como mejora de imágenes de ecommerce, recursos de diseño para herramientas creativas y desarrollo iterativo de escenas de videojuegos.",
"hy-image-v3.0.description": "Basado en el modelo Hunyuan, puede razonar sobre composición, disposición y estilo de imágenes, utilizando conocimiento del mundo para inferir escenas visuales plausibles. También interpreta semánticas complejas de miles de caracteres, genera contenido textual extenso, cómics complejos, memes e ilustraciones educativas vivas.",
"hy-video-1.5.description": "Admite entradas multimodales de texto e imagen para generar vídeos de alta calidad con transiciones de escena e interacción entre múltiples personajes. Optimiza flujos de trabajo de producción y reduce costos, ideal para publicidad empresarial, marketing y creadores individuales.",
"hy3-preview.description": "Hunyuan Hy3 Preview está diseñado para cargas de trabajo agénticas y adopta una arquitectura MixtureofExperts (MoE) con 295B de parámetros totales y 21B activados. Ofrece tres modos dentro de un único modelo—no_think (respuesta ultrarrápida), think_low (razonamiento rápido) y think_high (razonamiento profundo)—para cubrir necesidades de latencia y complejidad. Logra rendimiento cercano al estado del arte en benchmarks de programación como SWEbench Verified y admite una ventana de contexto de 256K para refactorización entre archivos y análisis de documentos largos.",
"image-01-live.description": "Un modelo de generación de imágenes con gran nivel de detalle, compatible con texto a imagen y estilos predefinidos controlables.",
"image-01.description": "Un nuevo modelo de generación de imágenes con gran nivel de detalle, compatible con texto a imagen e imagen a imagen.",
"imagen-4.0-fast-generate-001.description": "Versión rápida de la serie de modelos de texto a imagen de cuarta generación de Imagen.",
"imagen-4.0-generate-001.description": "Serie de modelos de texto a imagen de cuarta generación de Imagen.",
"imagen-4.0-ultra-generate-001.description": "Versión Ultra de la serie de modelos de texto a imagen de cuarta generación de Imagen.",
"inception/mercury-coder-small.description": "Mercury Coder Small es ideal para generación de código, depuración y refactorización con latencia mínima.",
"inclusionAI/Ling-flash-2.0.description": "Ling-flash-2.0 es el tercer modelo de arquitectura Ling 2.0 del equipo Bailing de Ant Group. Es un modelo MoE con 100 mil millones de parámetros totales pero solo 6.1 mil millones activos por token (4.8 mil millones sin incluir embeddings). A pesar de su configuración ligera, iguala o supera a modelos densos de 40 mil millones y modelos MoE aún más grandes en múltiples pruebas, explorando alta eficiencia mediante arquitectura y estrategia de entrenamiento.",
"inclusionAI/Ling-mini-2.0.description": "Ling-mini-2.0 es un modelo MoE pequeño y de alto rendimiento con 16 mil millones de parámetros totales y solo 1.4 mil millones activos por token (789 millones sin embeddings), ofreciendo generación muy rápida. Con un diseño MoE eficiente y grandes datos de entrenamiento de alta calidad, logra un rendimiento de primer nivel comparable a modelos densos de menos de 10 mil millones y modelos MoE más grandes.",
"inclusionai/ling-1t.description": "Ling-1T es el modelo MoE de 1T de inclusionAI, optimizado para tareas de razonamiento de alta intensidad y cargas de trabajo de gran contexto.",
"inclusionai/ling-flash-2.0.description": "Ling-flash-2.0 es el modelo MoE de inclusionAI optimizado para eficiencia y rendimiento en razonamiento, adecuado para tareas de tamaño medio a grande.",
"inclusionai/ling-mini-2.0.description": "Ling-mini-2.0 es el modelo MoE ligero de inclusionAI, que reduce significativamente los costos manteniendo la capacidad de razonamiento.",
"inclusionai/ming-flash-omini-preview.description": "Ming-flash-omni Preview es el modelo multimodal de inclusionAI, compatible con entradas de voz, imagen y video, con mejoras en renderizado de imágenes y reconocimiento de voz.",
"inclusionai/ring-1t.description": "Ring-1T es el modelo de razonamiento MoE de un billón de parámetros de inclusionAI, adecuado para tareas de razonamiento a gran escala e investigación.",
"inclusionai/ring-flash-2.0.description": "Ring-flash-2.0 es una variante del modelo Ring de inclusionAI para escenarios de alto rendimiento, con énfasis en velocidad y eficiencia de costos.",
"inclusionai/ring-mini-2.0.description": "Ring-mini-2.0 es el modelo MoE ligero de alto rendimiento de inclusionAI, diseñado para concurrencia.",
"intern-latest.description": "Por defecto, apunta a nuestro último modelo lanzado de la serie Intern, actualmente configurado en intern-s2-preview.",
"intern-s1-mini.description": "Un modelo multimodal ligero con fuertes capacidades de razonamiento científico.",
"intern-s1-pro.description": "Hemos lanzado nuestro modelo de razonamiento multimodal más avanzado de código abierto, actualmente el modelo de lenguaje multimodal de código abierto con mejor rendimiento general.",
"intern-s1.description": "El modelo de razonamiento multimodal de código abierto no solo demuestra fuertes capacidades de propósito general, sino que también logra un rendimiento de vanguardia en una amplia gama de tareas científicas.",
"intern-s2-preview.description": "Nuestro modelo recién lanzado de razonamiento científico multimodal 35B-A3B admite una ventana de contexto de 256K. A través de la escalabilidad de tareas y la optimización arquitectónica, está diseñado específicamente para mejorar el descubrimiento científico y las capacidades de agentes de propósito general.",
"internvl2.5-38b-mpo.description": "InternVL2.5 38B MPO es un modelo multimodal preentrenado para razonamiento complejo imagen-texto.",
"internvl3-14b.description": "InternVL3 14B es un modelo multimodal de tamaño medio que equilibra rendimiento y costo.",
"internvl3-1b.description": "InternVL3 1B es un modelo multimodal ligero para implementaciones con recursos limitados.",
"internvl3-38b.description": "InternVL3 38B es un modelo multimodal de código abierto de gran tamaño para comprensión imagen-texto de alta precisión.",
"internvl3.5-241b-a28b.description": "Nuestro modelo multimodal grande recién lanzado presenta una comprensión mejorada de imagen y texto y capacidades de comprensión de imágenes de secuencia larga, logrando un rendimiento comparable a los modelos cerrados líderes.",
"internvl3.5-latest.description": "Por defecto, apunta al último modelo de la serie InternVL3.5, actualmente configurado en internvl3.5-241b-a28b.",
"irag-1.0.description": "ERNIE iRAG es un modelo de generación aumentada con recuperación de imágenes para búsqueda de imágenes, recuperación imagen-texto y generación de contenido.",
"jamba-large.description": "Nuestro modelo más potente y avanzado, diseñado para tareas empresariales complejas con un rendimiento sobresaliente.",
"jamba-mini.description": "El modelo más eficiente de su clase, equilibrando velocidad y calidad con un tamaño reducido.",
"jina-deepsearch-v1.description": "DeepSearch combina búsqueda web, lectura y razonamiento para investigaciones exhaustivas. Funciona como un agente que toma tu tarea de investigación, realiza búsquedas amplias con múltiples iteraciones y luego produce una respuesta. El proceso implica investigación continua, razonamiento y resolución de problemas desde múltiples ángulos, diferenciándose fundamentalmente de los LLM estándar que responden desde datos preentrenados o sistemas RAG tradicionales que dependen de búsquedas superficiales de una sola vez.",
"kimi-k2-instruct.description": "Kimi K2 Instruct es el modelo oficial de razonamiento de Kimi con contexto largo para código, preguntas y respuestas, y más.",
"kimi-k2-thinking.description": "kimi-k2-thinking es un modelo reflexivo de Moonshot AI con habilidades generales de razonamiento y agente. Destaca en razonamiento profundo y puede resolver problemas difíciles mediante el uso de herramientas en múltiples pasos.",
"kimi-k2.5.description": "Kimi K2.5 es el modelo más versátil de Kimi hasta la fecha, con una arquitectura multimodal nativa que admite entradas de visión y texto, modos de 'pensamiento' y 'no pensamiento', y tareas tanto conversacionales como de agentes.",
"kimi-k2.6.description": "Kimi-K2.6 es un modelo de lenguaje grande lanzado por Moonshot AI, con excelentes capacidades de codificación y uso de herramientas. El despliegue del servicio solo se admite en China continental.",
"kimi-k2:1t.description": "Kimi K2 es un gran modelo MoE LLM de Moonshot AI con 1T de parámetros totales y 32B activos por pasada. Está optimizado para capacidades de agentes, incluyendo uso avanzado de herramientas, razonamiento y síntesis de código.",
"kling/kling-v3-image-generation.description": "Soporta hasta 10 imágenes de referencia, permitiendo bloquear sujetos, elementos y tonos de color para garantizar un estilo consistente. Combina transferencia de estilo, referencia de retratos/personajes, fusión de múltiples imágenes y pintura localizada para un control flexible. Ofrece detalles realistas de retratos, con visuales generales delicados y ricamente estratificados, con color y atmósfera cinematográficos.",
"kling/kling-v3-omni-image-generation.description": "Desbloquea visuales narrativos cinematográficos con generación de imágenes de nueva serie y salida directa en 2K/4K. Analiza profundamente elementos audiovisuales en indicaciones para ejecutar instrucciones creativas con precisión. Soporta entradas de múltiples referencias flexibles y mejoras de calidad integrales, ideal para guiones gráficos, arte conceptual narrativo y diseño de escenas.",
"kling/kling-v3-omni-video-generation.description": "La nueva función \"Referencia Todo en Uno\" soporta videos de 38 segundos o múltiples imágenes para anclar elementos de personajes. Puede coincidir con audio original y movimientos de labios para una representación auténtica de personajes. Mejora la consistencia del video y la expresión dinámica. Soporta sincronización audiovisual y guiones gráficos inteligentes.",
"kling/kling-v3-video-generation.description": "La creación de guiones gráficos inteligentes comprende transiciones de escenas dentro de guiones, organizando automáticamente posiciones de cámara y tipos de tomas. Un marco multimodal nativo asegura consistencia audiovisual. Elimina restricciones de duración, permitiendo una narración más flexible de múltiples tomas.",
"kuaishou/kat-coder-pro-v1.description": "KAT-Coder-Pro-V1 (gratis por tiempo limitado) se enfoca en la comprensión de código y automatización para agentes de programación eficientes.",
"labs-devstral-small-2512.description": "Devstral Small 2 sobresale en el uso de herramientas para explorar bases de código, editar múltiples archivos y potenciar agentes de ingeniería de software.",
"labs-leanstral-2603.description": "El primer agente de código de código abierto de Mistral diseñado para Lean 4, construido para ingeniería de pruebas formales en repositorios realistas. 119B parámetros con 6.5B activos.",
"lite.description": "Spark Lite es un LLM ligero con latencia ultra baja y procesamiento eficiente. Es completamente gratuito y admite búsqueda web en tiempo real. Sus respuestas rápidas funcionan bien en dispositivos con pocos recursos y para ajuste fino de modelos, ofreciendo una experiencia inteligente y rentable, especialmente para preguntas y respuestas de conocimiento, generación de contenido y escenarios de búsqueda.",
"llama-3.1-70b-versatile.description": "Llama 3.1 70B ofrece un razonamiento de IA más sólido para aplicaciones complejas, compatible con procesamiento intensivo con alta eficiencia y precisión.",
"llama-3.1-8b-instant.description": "Llama 3.1 8B es un modelo de alta eficiencia con generación de texto rápida, ideal para aplicaciones a gran escala y rentables.",
"llama-3.1-instruct.description": "El modelo Llama 3.1 ajustado por instrucciones está optimizado para chat y supera a muchos modelos de chat abiertos en benchmarks de la industria.",
"llama-3.2-11b-vision-instruct.description": "Razonamiento visual sólido en imágenes de alta resolución, ideal para aplicaciones de comprensión visual.",
"llama-3.2-11b-vision-preview.description": "Llama 3.2 está diseñado para tareas que combinan visión y texto, destacando en subtitulado de imágenes y preguntas visuales para unir generación de lenguaje y razonamiento visual.",
"llama-3.2-90b-vision-instruct.description": "Razonamiento visual avanzado para aplicaciones de agentes con comprensión visual.",
"llama-3.2-90b-vision-preview.description": "Llama 3.2 está diseñado para tareas que combinan visión y texto, destacando en subtitulado de imágenes y preguntas visuales para unir generación de lenguaje y razonamiento visual.",
"llama-3.2-vision-instruct.description": "El modelo Llama 3.2-Vision ajustado por instrucciones está optimizado para reconocimiento visual, razonamiento de imágenes, subtitulado y preguntas generales sobre imágenes.",
"llama-3.3-70b-versatile.description": "Meta Llama 3.3 es un LLM multilingüe con 70B de parámetros (entrada/salida de texto), disponible en variantes preentrenadas y ajustadas por instrucciones. La versión ajustada por instrucciones está optimizada para diálogos multilingües y supera a muchos modelos de chat abiertos y cerrados en benchmarks de la industria.",
"llama-3.3-instruct.description": "El modelo Llama 3.3 ajustado por instrucciones está optimizado para chat y supera a muchos modelos de chat abiertos en benchmarks de la industria.",
"llama3-70b-8192.description": "Meta Llama 3 70B ofrece una gestión excepcional de la complejidad para proyectos exigentes.",
"llama3-8b-8192.description": "Meta Llama 3 8B ofrece un rendimiento sólido en razonamiento para escenarios diversos.",
"llama3-groq-70b-8192-tool-use-preview.description": "Llama 3 Groq 70B Tool Use ofrece llamadas a herramientas sólidas para manejar tareas complejas de manera eficiente.",
"llama3-groq-8b-8192-tool-use-preview.description": "Llama 3 Groq 8B Tool Use está optimizado para uso eficiente de herramientas con procesamiento paralelo rápido.",
"llama3.1.description": "Llama 3.1 es el modelo líder de Meta, escalando hasta 405B parámetros para diálogo complejo, traducción multilingüe y análisis de datos.",
"llama3.1:405b.description": "Llama 3.1 es el modelo líder de Meta, escalando hasta 405B parámetros para diálogo complejo, traducción multilingüe y análisis de datos.",
"llama3.1:70b.description": "Llama 3.1 es el modelo líder de Meta, escalando hasta 405B parámetros para diálogo complejo, traducción multilingüe y análisis de datos.",
"llava-v1.5-7b-4096-preview.description": "LLaVA 1.5 7B fusiona procesamiento visual para generar salidas complejas a partir de entradas visuales.",
"llava.description": "LLaVA es un modelo multimodal que combina un codificador visual y Vicuna para una sólida comprensión visión-lenguaje.",
"llava:13b.description": "LLaVA es un modelo multimodal que combina un codificador visual y Vicuna para una sólida comprensión visión-lenguaje.",
"llava:34b.description": "LLaVA es un modelo multimodal que combina un codificador visual y Vicuna para una sólida comprensión visión-lenguaje.",
"magistral-medium-2509.description": "Magistral Medium 1.2 es un modelo de razonamiento de frontera de Mistral AI (sep 2025) con soporte de visión.",
"magistral-small-2509.description": "Magistral Small 1.2 es un modelo de razonamiento pequeño y de código abierto de Mistral AI (sep. 2025) con soporte de visión.",
"mathstral.description": "MathΣtral está diseñado para investigación científica y razonamiento matemático, con gran capacidad de cálculo y explicación.",
"max-32k.description": "Spark Max 32K ofrece procesamiento de contexto amplio con mejor comprensión contextual y razonamiento lógico, admitiendo entradas de hasta 32K tokens para lectura de documentos largos y preguntas sobre conocimiento privado.",
"megrez-3b-instruct.description": "Megrez 3B Instruct es un modelo pequeño y eficiente de Wuwen Xinqiong.",
"meituan/longcat-flash-chat.description": "Un modelo base sin razonamiento de código abierto de Meituan, optimizado para diálogo y tareas de agentes, con gran capacidad en el uso de herramientas e interacciones complejas de múltiples turnos.",
"meta-llama-3-70b-instruct.description": "Un potente modelo de 70 mil millones de parámetros que destaca en razonamiento, programación y tareas lingüísticas amplias.",
"meta-llama-3-8b-instruct.description": "Un modelo versátil de 8 mil millones de parámetros optimizado para chat y generación de texto.",
"meta-llama-3.1-405b-instruct.description": "Llama 3.1 es un modelo de texto ajustado por instrucciones, optimizado para chat multilingüe, con alto rendimiento en los principales benchmarks de la industria entre modelos abiertos y cerrados.",
"meta-llama-3.1-70b-instruct.description": "Llama 3.1 es un modelo de texto ajustado por instrucciones, optimizado para chat multilingüe, con alto rendimiento en los principales benchmarks de la industria entre modelos abiertos y cerrados.",
"meta-llama-3.1-8b-instruct.description": "Llama 3.1 es un modelo de texto ajustado por instrucciones, optimizado para chat multilingüe, con alto rendimiento en los principales benchmarks de la industria entre modelos abiertos y cerrados.",
"meta-llama/Llama-2-13b-chat-hf.description": "LLaMA-2 Chat (13B) ofrece un sólido manejo del lenguaje y una experiencia de chat confiable.",
"meta-llama/Llama-2-70b-hf.description": "LLaMA-2 ofrece un sólido manejo del lenguaje y una experiencia de interacción fluida.",
"meta-llama/Llama-3-70b-chat-hf.description": "Llama 3 70B Instruct Reference es un potente modelo de chat para diálogos complejos.",
"meta-llama/Llama-3-8b-chat-hf.description": "Llama 3 8B Instruct Reference ofrece soporte multilingüe y amplio conocimiento de dominio.",
"meta-llama/Llama-3.2-11B-Vision-Instruct-Turbo.description": "LLaMA 3.2 está diseñado para tareas que combinan visión y texto. Destaca en subtitulado de imágenes y preguntas visuales, uniendo generación de lenguaje y razonamiento visual.",
"meta-llama/Llama-3.2-3B-Instruct-Turbo.description": "LLaMA 3.2 está diseñado para tareas que combinan visión y texto. Destaca en subtitulado de imágenes y preguntas visuales, uniendo generación de lenguaje y razonamiento visual.",
"meta-llama/Llama-3.2-90B-Vision-Instruct-Turbo.description": "LLaMA 3.2 está diseñado para tareas que combinan visión y texto. Destaca en subtitulado de imágenes y preguntas visuales, uniendo generación de lenguaje y razonamiento visual.",
"meta-llama/Llama-3.3-70B-Instruct-Turbo.description": "Meta Llama 3.3 es un LLM multilingüe de 70B (entrada/salida de texto) preentrenado y ajustado por instrucciones. La versión ajustada por instrucciones está optimizada para chat multilingüe y supera a muchos modelos abiertos y cerrados en benchmarks de la industria.",
"meta-llama/Llama-Vision-Free.description": "LLaMA 3.2 está diseñado para tareas que combinan visión y texto. Destaca en subtitulado de imágenes y preguntas visuales, uniendo generación de lenguaje y razonamiento visual.",
"meta-llama/Meta-Llama-3-70B-Instruct-Lite.description": "Llama 3 70B Instruct Lite está diseñado para alto rendimiento con menor latencia.",
"meta-llama/Meta-Llama-3-70B-Instruct-Turbo.description": "Llama 3 70B Instruct Turbo ofrece gran comprensión y generación para las cargas de trabajo más exigentes.",
"meta-llama/Meta-Llama-3-8B-Instruct-Lite.description": "Llama 3 8B Instruct Lite equilibra rendimiento para entornos con recursos limitados.",
"meta-llama/Meta-Llama-3-8B-Instruct-Turbo.description": "Llama 3 8B Instruct Turbo es un LLM de alto rendimiento para una amplia gama de casos de uso.",
"meta-llama/Meta-Llama-3.1-405B-Instruct-Turbo.description": "El modelo Turbo de 405B de Llama 3.1 ofrece una enorme capacidad de contexto para procesamiento de big data y destaca en aplicaciones de IA a ultra escala.",
"meta-llama/Meta-Llama-3.1-405B-Instruct.description": "Llama 3.1 es la familia de modelos líder de Meta, escalando hasta 405B parámetros para diálogo complejo, traducción multilingüe y análisis de datos.",
"meta-llama/Meta-Llama-3.1-70B-Instruct-Turbo.description": "Llama 3.1 70B está finamente ajustado para aplicaciones de alta carga; la cuantización FP8 ofrece cómputo eficiente y precisión en escenarios complejos.",
"meta-llama/Meta-Llama-3.1-70B.description": "Llama 3.1 es la familia de modelos líder de Meta, escalando hasta 405B parámetros para diálogo complejo, traducción multilingüe y análisis de datos.",
"meta-llama/Meta-Llama-3.1-8B-Instruct-Turbo.description": "Llama 3.1 8B usa cuantización FP8, admite hasta 131,072 tokens de contexto y se ubica entre los mejores modelos abiertos para tareas complejas en múltiples benchmarks.",
"meta-llama/llama-3-70b-instruct.description": "Llama 3 70B Instruct está optimizado para diálogos de alta calidad y tiene un rendimiento destacado en evaluaciones humanas.",
"meta-llama/llama-3-8b-instruct.description": "Llama 3 8B Instruct está optimizado para diálogos de alta calidad, superando a muchos modelos cerrados.",
"meta-llama/llama-3.1-70b-instruct.description": "La última serie Llama 3.1 de Meta, la variante de 70B ajustada por instrucciones, optimizada para diálogos de alta calidad. En evaluaciones de la industria, muestra un rendimiento sólido frente a modelos cerrados líderes. (Disponible solo para entidades verificadas empresarialmente.)",
"meta-llama/llama-3.1-8b-instruct.description": "La última serie Llama 3.1 de Meta, la variante de 8B ajustada por instrucciones, es especialmente rápida y eficiente. En evaluaciones de la industria, ofrece un rendimiento sólido, superando a muchos modelos cerrados líderes. (Disponible solo para entidades verificadas empresarialmente.)",
"meta-llama/llama-3.2-11b-vision-instruct.description": "LLaMA 3.2 está diseñado para tareas que combinan visión y texto. Destaca en subtitulación de imágenes y preguntas visuales, uniendo la generación de lenguaje con el razonamiento visual.",
"meta-llama/llama-3.2-3b-instruct.description": "meta-llama/llama-3.2-3b-instruct",
"meta-llama/llama-3.3-70b-instruct.description": "Llama 3.3 es el modelo Llama multilingüe de código abierto más avanzado, con un rendimiento cercano al de modelos de 405B a un costo muy bajo. Está basado en Transformer y mejorado con SFT y RLHF para mayor utilidad y seguridad. La versión ajustada por instrucciones está optimizada para chat multilingüe y supera a muchos modelos abiertos y cerrados en pruebas de referencia de la industria. Fecha de corte de conocimiento: diciembre de 2023.",
"meta-llama/llama-3.3-70b-instruct:free.description": "Llama 3.3 es el modelo Llama multilingüe de código abierto más avanzado, con un rendimiento cercano al de modelos de 405B a un costo muy bajo. Está basado en Transformer y mejorado con SFT y RLHF para mayor utilidad y seguridad. La versión ajustada por instrucciones está optimizada para chat multilingüe y supera a muchos modelos abiertos y cerrados en pruebas de referencia de la industria. Fecha de corte de conocimiento: diciembre de 2023.",
"meta.llama3-1-405b-instruct-v1:0.description": "Meta Llama 3.1 405B Instruct es el modelo Llama 3.1 Instruct más grande y potente, altamente avanzado para razonamiento en diálogos y generación de datos sintéticos, y una base sólida para preentrenamiento o ajuste fino en dominios específicos. Los LLMs multilingües Llama 3.1 son modelos de generación preentrenados y ajustados por instrucciones en tamaños de 8B, 70B y 405B (texto de entrada/salida). Los modelos ajustados están optimizados para diálogos multilingües y superan a muchos modelos de chat abiertos en pruebas de referencia comunes. Llama 3.1 está diseñado para uso comercial y de investigación en múltiples idiomas. Los modelos ajustados son ideales para chat estilo asistente, mientras que los preentrenados se adaptan a tareas más amplias de generación de lenguaje natural. Las salidas de Llama 3.1 también pueden utilizarse para mejorar otros modelos, incluida la generación y refinamiento de datos sintéticos. Llama 3.1 es un modelo Transformer autorregresivo con una arquitectura optimizada. Las versiones ajustadas utilizan ajuste fino supervisado (SFT) y aprendizaje por refuerzo con retroalimentación humana (RLHF) para alinearse con las preferencias humanas en cuanto a utilidad y seguridad.",
"meta.llama3-1-70b-instruct-v1:0.description": "Una versión actualizada de Meta Llama 3.1 70B Instruct con una ventana de contexto extendida de 128K, soporte multilingüe y razonamiento mejorado. Los LLMs multilingües Llama 3.1 son modelos de generación preentrenados y ajustados por instrucciones en tamaños de 8B, 70B y 405B (texto de entrada/salida). Los modelos ajustados están optimizados para diálogos multilingües y superan a muchos modelos de chat abiertos en pruebas de referencia comunes. Llama 3.1 está diseñado para uso comercial y de investigación en múltiples idiomas. Los modelos ajustados son ideales para chat estilo asistente, mientras que los preentrenados se adaptan a tareas más amplias de generación de lenguaje natural. Las salidas de Llama 3.1 también pueden utilizarse para mejorar otros modelos, incluida la generación y refinamiento de datos sintéticos. Llama 3.1 es un modelo Transformer autorregresivo con una arquitectura optimizada. Las versiones ajustadas utilizan ajuste fino supervisado (SFT) y aprendizaje por refuerzo con retroalimentación humana (RLHF) para alinearse con las preferencias humanas en cuanto a utilidad y seguridad.",
"meta.llama3-1-8b-instruct-v1:0.description": "Una versión actualizada de Meta Llama 3.1 8B Instruct con una ventana de contexto de 128K, soporte multilingüe y razonamiento mejorado. La familia Llama 3.1 incluye modelos de texto ajustados por instrucciones de 8B, 70B y 405B optimizados para chat multilingüe y alto rendimiento en pruebas de referencia. Está diseñado para uso comercial y de investigación en múltiples idiomas; los modelos ajustados son ideales para chat estilo asistente, mientras que los preentrenados se adaptan a tareas más amplias de generación. Las salidas de Llama 3.1 también pueden utilizarse para mejorar otros modelos (por ejemplo, datos sintéticos y refinamiento). Es un modelo Transformer autorregresivo, con SFT y RLHF para alinearse con la utilidad y seguridad.",
"meta.llama3-70b-instruct-v1:0.description": "Meta Llama 3 es un LLM abierto para desarrolladores, investigadores y empresas, diseñado para ayudarles a construir, experimentar y escalar de forma responsable ideas de IA generativa. Como parte de la base para la innovación de la comunidad global, es ideal para creación de contenido, IA conversacional, comprensión del lenguaje, I+D y aplicaciones empresariales.",
"meta.llama3-8b-instruct-v1:0.description": "Meta Llama 3 es un modelo LLM abierto para desarrolladores, investigadores y empresas, diseñado para ayudarles a construir, experimentar y escalar de manera responsable ideas de IA generativa. Como parte de la base para la innovación de la comunidad global, es ideal para entornos con recursos y capacidad de cómputo limitados, dispositivos en el borde y tiempos de entrenamiento más rápidos.",
"meta/Llama-3.2-11B-Vision-Instruct.description": "Razonamiento visual sólido en imágenes de alta resolución, ideal para aplicaciones de comprensión visual.",
"meta/Llama-3.2-90B-Vision-Instruct.description": "Razonamiento visual avanzado para aplicaciones de agentes con comprensión visual.",
"meta/Llama-3.3-70B-Instruct.description": "Llama 3.3 es el modelo Llama multilingüe de código abierto más avanzado, con un rendimiento cercano al de modelos de 405B a un costo muy bajo. Basado en Transformer y mejorado con SFT y RLHF para mayor utilidad y seguridad. La versión ajustada por instrucciones está optimizada para chat multilingüe y supera a muchos modelos abiertos y cerrados en pruebas de referencia de la industria. Fecha de corte de conocimiento: diciembre de 2023.",
"meta/Meta-Llama-3-70B-Instruct.description": "Un potente modelo de 70 mil millones de parámetros que destaca en razonamiento, programación y tareas lingüísticas generales.",
"meta/Meta-Llama-3-8B-Instruct.description": "Un modelo versátil de 8 mil millones de parámetros optimizado para chat y generación de texto.",
"meta/Meta-Llama-3.1-405B-Instruct.description": "Modelo de texto Llama 3.1 ajustado por instrucciones, optimizado para chat multilingüe, con alto rendimiento en pruebas de referencia comunes entre modelos abiertos y cerrados.",
"meta/Meta-Llama-3.1-70B-Instruct.description": "Modelo de texto Llama 3.1 ajustado por instrucciones, optimizado para chat multilingüe, con alto rendimiento en pruebas de referencia comunes entre modelos abiertos y cerrados.",
"meta/Meta-Llama-3.1-8B-Instruct.description": "Modelo de texto Llama 3.1 ajustado por instrucciones, optimizado para chat multilingüe, con alto rendimiento en pruebas de referencia comunes entre modelos abiertos y cerrados.",
"meta/llama-3.1-70b-instruct.description": "Diseñado para diálogos complejos con excelente comprensión de contexto, razonamiento y generación de texto.",
"meta/llama-3.1-70b.description": "Una versión actualizada de Meta Llama 3 70B Instruct con contexto de 128K, soporte multilingüe y razonamiento mejorado.",
"meta/llama-3.1-8b-instruct.description": "Un modelo de vanguardia con sólida comprensión del lenguaje, razonamiento y generación de texto.",
"meta/llama-3.1-8b.description": "Llama 3.1 8B admite una ventana de contexto de 128K, ideal para chat en tiempo real y análisis de datos, y ofrece un ahorro significativo de costos frente a modelos más grandes. Servido por Groq en hardware LPU para inferencia rápida y eficiente.",
"meta/llama-3.2-11b-vision-instruct.description": "Un modelo de vanguardia en visión y lenguaje que destaca en razonamiento de alta calidad a partir de imágenes.",
"meta/llama-3.2-11b.description": "Modelo de razonamiento visual ajustado por instrucciones (entrada de texto + imagen, salida de texto) optimizado para reconocimiento visual, razonamiento de imágenes, subtitulado y preguntas y respuestas generales sobre imágenes.",
"meta/llama-3.2-1b.description": "Modelo solo de texto para casos de uso en dispositivos como recuperación local multilingüe, resumen y reescritura.",
"meta/llama-3.2-3b.description": "Modelo solo de texto afinado para casos de uso en dispositivos como recuperación local multilingüe, resumen y reescritura.",
"meta/llama-3.2-90b-vision-instruct.description": "Un modelo de vanguardia en visión y lenguaje que destaca en razonamiento de alta calidad a partir de imágenes.",
"meta/llama-3.2-90b.description": "Modelo de razonamiento visual ajustado por instrucciones (entrada de texto + imagen, salida de texto) optimizado para reconocimiento visual, razonamiento de imágenes, subtitulado y preguntas y respuestas generales sobre imágenes.",
"meta/llama-3.3-70b-instruct.description": "Un modelo LLM avanzado con gran capacidad de razonamiento, matemáticas, sentido común y llamadas a funciones.",
"meta/llama-3.3-70b.description": "Un equilibrio perfecto entre rendimiento y eficiencia. Diseñado para IA conversacional de alto rendimiento en creación de contenido, aplicaciones empresariales e investigación, con sólida comprensión del lenguaje para resumen, clasificación, análisis de sentimientos y generación de código.",
"meta/llama-4-maverick.description": "La familia Llama 4 es un conjunto de modelos de IA multimodal nativos que admiten experiencias de texto y multimodales, utilizando MoE para una comprensión líder de texto e imagen. Llama 4 Maverick es un modelo de 17B con 128 expertos, servido por DeepInfra.",
"meta/llama-4-scout.description": "La familia Llama 4 es un conjunto de modelos de IA multimodal nativos que admiten experiencias de texto y multimodales, utilizando MoE para una comprensión líder de texto e imagen. Llama 4 Scout es un modelo de 17B con 16 expertos, servido por DeepInfra.",
"microsoft/Phi-3-medium-128k-instruct.description": "El mismo modelo Phi-3-medium con una ventana de contexto ampliada para RAG o indicaciones de pocos ejemplos.",
"microsoft/Phi-3-medium-4k-instruct.description": "Modelo de 14 mil millones de parámetros con mayor calidad que Phi-3-mini, centrado en datos de alta calidad y razonamiento intensivo.",
"microsoft/Phi-3-mini-128k-instruct.description": "El mismo modelo Phi-3-mini con una ventana de contexto ampliada para RAG o indicaciones de pocos ejemplos.",
"microsoft/Phi-3-mini-4k-instruct.description": "El miembro más pequeño de la familia Phi-3, optimizado para calidad y baja latencia.",
"microsoft/Phi-3-small-128k-instruct.description": "El mismo modelo Phi-3-small con una ventana de contexto más amplia para RAG o prompts de pocos ejemplos.",
"microsoft/Phi-3-small-8k-instruct.description": "Un modelo de 7 mil millones de parámetros con mayor calidad que Phi-3-mini, enfocado en datos de alta calidad y razonamiento intensivo.",
"microsoft/Phi-3.5-mini-instruct.description": "Una versión actualizada del modelo Phi-3-mini.",
"microsoft/Phi-3.5-vision-instruct.description": "Una versión actualizada del modelo Phi-3-vision.",
"microsoft/WizardLM-2-8x22B.description": "WizardLM 2 es un modelo de lenguaje de Microsoft AI que destaca en diálogos complejos, tareas multilingües, razonamiento y asistentes.",
"microsoft/wizardlm-2-8x22b.description": "WizardLM-2 8x22B es el modelo Wizard más avanzado de Microsoft AI, con un rendimiento altamente competitivo.",
"mimo-v2-flash.description": "¡MiMo-V2-Flash ahora es oficialmente de código abierto! Este es un modelo MoE (Mixture-of-Experts) diseñado específicamente para una eficiencia extrema en la inferencia, con 309 mil millones de parámetros totales (15 mil millones activados). A través de innovaciones en una arquitectura híbrida de atención y aceleración de inferencia MTP multicapa, se encuentra entre los 2 mejores modelos de código abierto a nivel mundial en múltiples suites de evaluación de agentes. Sus capacidades de codificación superan a todos los modelos de código abierto y rivalizan con los principales modelos de código cerrado como Claude 4.5 Sonnet, mientras que solo incurre en un 2.5% del costo de inferencia y ofrece una velocidad de generación 2× más rápida, llevando la eficiencia de inferencia de modelos grandes al límite.",
"mimo-v2-pro.description": "MiMo-V2-Pro es el modelo base insignia de Xiaomi para razonamiento complejo, procesamiento de documentos largos y flujos de trabajo de agentes. Utiliza una arquitectura MoE de un billón de parámetros con 32B de parámetros activos, admite una ventana de contexto de 256K y está optimizado para APIs compatibles con Claude, codificación y planificación de múltiples pasos.",
"mimo-v2.5-pro.description": "MiMoV2.5Pro es el modelo insignia más avanzado de Xiaomi, con mejoras notables en capacidades agénticas generales, ingeniería de software compleja y tareas de largo horizonte. Mantiene la arquitectura híbrida de 1T total / 42B activos con una ventana de contexto de 1M y puede manejar tareas prolongadas que requieren miles de llamadas a herramientas. Su rendimiento en benchmarks agénticos exigentes (ClawEval, GDPVal, SWEbench Pro) es comparable a Claude Opus 4.6.",
"mimo-v2.5.description": "MiMoV2.5 es un modelo base agéntico omnimodal nativo que comprende imágenes, vídeo, audio y texto en una arquitectura unificada, con ventana de contexto de 1M. Ofrece rendimiento agéntico de nivel Pro con aproximadamente la mitad del coste de inferencia de MiMoV2.5Pro, con mejor percepción multimodal que MiMoV2Omni. Sus capacidades agénticas integradas (navegación, comprensión, razonamiento, ejecución) y su inferencia más rápida lo hacen ideal para marcos de agentes sensibles a la latencia como OpenClaw.",
"minicpm-v.description": "MiniCPM-V es el modelo multimodal de próxima generación de OpenBMB, con excelente OCR y comprensión multimodal para una amplia gama de casos de uso.",
"minimax-m2.1.description": "MiniMax-M2.1 es la versión más reciente de la serie MiniMax, optimizada para programación multilingüe y tareas complejas del mundo real. Como modelo nativo de IA, MiniMax-M2.1 logra mejoras significativas en rendimiento, soporte de marcos de agentes y adaptación a múltiples escenarios, ayudando a empresas e individuos a adoptar rápidamente un estilo de vida y trabajo nativo de IA.",
"minimax-m2.5-free.description": "MiniMax M2.5 Free: modelo de programación gratuito con capacidades completas de razonamiento.",
"minimax-m2.5.description": "MiniMax M2.5: modelo de programación eficiente con sólidas capacidades de razonamiento.",
"minimax-m2.7.description": "MiniMax M2.7: último modelo de programación MiniMax con razonamiento mejorado y uso de herramientas.",
"minimax-m2.description": "MiniMax M2 es un modelo de lenguaje grande eficiente diseñado específicamente para programación y flujos de trabajo de agentes.",
"minimax-m3.description": "MiniMax M3: el último modelo MiniMax con soporte de visión, razonamiento sólido y uso mejorado de herramientas.",
"minimax/minimax-m2.1.description": "MiniMax-M2.1 es un modelo de lenguaje grande de última generación y peso ligero, optimizado para programación, flujos de trabajo de agentes y desarrollo moderno de aplicaciones, ofreciendo salidas más limpias, concisas y tiempos de respuesta más rápidos.",
"minimax/minimax-m2.description": "MiniMax-M2 es un modelo de alto valor que sobresale en tareas de codificación y agentes para muchos escenarios de ingeniería.",
"ministral-3:14b.description": "Ministral 3 14B es el modelo más grande de la serie Ministral 3, ofreciendo rendimiento de última generación comparable al modelo más grande Mistral Small 3.2 24B. Optimizado para despliegue local, ofrece alto rendimiento en varios hardware, incluyendo configuraciones locales.",
"ministral-3:3b.description": "Ministral 3 3B es el modelo más pequeño y eficiente de la serie Ministral 3, ofreciendo fuertes capacidades de lenguaje y visión en un paquete compacto. Diseñado para despliegue en el borde, ofrece alto rendimiento en varios hardware, incluyendo configuraciones locales.",
"ministral-3:8b.description": "Ministral 3 8B es un modelo poderoso y eficiente de la serie Ministral 3, ofreciendo capacidades de texto y visión de primer nivel. Construido para despliegue en el borde, ofrece alto rendimiento en varios hardware, incluyendo configuraciones locales.",
"ministral-3b-latest.description": "Ministral 3B es el modelo de borde de más alto nivel de Mistral.",
"ministral-8b-latest.description": "Ministral 8B es un modelo de borde altamente rentable de Mistral.",
"mistral-ai/Mistral-Large-2411.description": "El modelo insignia de Mistral para tareas complejas que requieren razonamiento a gran escala o especialización (generación de texto sintético, generación de código, RAG o agentes).",
"mistral-ai/Mistral-Nemo.description": "Mistral Nemo es un LLM de vanguardia con razonamiento de última generación, conocimiento del mundo y codificación para su tamaño.",
"mistral-ai/mistral-small-2503.description": "Mistral Small es adecuado para cualquier tarea basada en lenguaje que requiera alta eficiencia y baja latencia.",
"mistral-large-2411.description": "Mistral Large es el modelo insignia, fuerte en tareas multilingües, razonamiento complejo y generación de código—ideal para aplicaciones de alta gama.",
"mistral-large-2512.description": "Mistral Large 3, es un modelo multimodal de propósito general de última generación, con pesos abiertos y una arquitectura granular de Mixture-of-Experts. Cuenta con 41B parámetros activos y 675B parámetros totales.",
"mistral-large-3:675b.description": "Mistral Large 3 es un modelo multimodal de propósito general de última generación con pesos abiertos y una arquitectura refinada de Mixture of Experts. Tiene 41B parámetros activos y 675B parámetros totales.",
"mistral-large-instruct.description": "Mistral-Large-Instruct-2407 es un LLM denso avanzado con 123 mil millones de parámetros y razonamiento, conocimiento y codificación de última generación.",
"mistral-large-latest.description": "Mistral Large es el modelo insignia, destacando en tareas multilingües, razonamiento complejo y generación de código para aplicaciones de alta gama.",
"mistral-large.description": "Mixtral Large es el modelo insignia de Mistral, que combina generación de código, matemáticas y razonamiento con una ventana de contexto de 128K.",
"mistral-medium-2508.description": "Mistral Medium 3.1 ofrece rendimiento de última generación a un costo 8× menor y simplifica el despliegue empresarial.",
"mistral-medium-3.5.description": "Mistral Medium 3.5 es un modelo multimodal de clase frontera optimizado para casos de uso de agentes y codificación, lanzado como pesos abiertos bajo una licencia MIT modificada.",
"mistral-nemo-instruct.description": "Mistral-Nemo-Instruct-2407 es la versión ajustada por instrucciones de Mistral-Nemo-Base-2407.",
"mistral-nemo.description": "Mistral Nemo es un modelo de 12 mil millones de parámetros de alta eficiencia de Mistral AI y NVIDIA.",
"mistral-small-2506.description": "Mistral Small es una opción rentable, rápida y confiable para traducción, resumen y análisis de sentimientos.",
"mistral-small-2603.description": "El modelo híbrido poderoso de Mistral que unifica capacidades de instrucción, razonamiento y codificación en un solo modelo. 119B parámetros con 6.5B activos.",
"mistral-small-latest.description": "Mistral Small es una opción rentable, rápida y confiable para traducción, resumen y análisis de sentimientos.",
"mistral-small.description": "Mistral Small es adecuado para cualquier tarea basada en lenguaje que requiera alta eficiencia y baja latencia.",
"mistral.description": "Mistral es el modelo de 7 mil millones de parámetros de Mistral AI, adecuado para tareas lingüísticas variadas.",
"mistral/codestral-embed.description": "Un modelo de incrustación de código para indexar bases de código y repositorios, compatible con asistentes de programación.",
"mistral/codestral.description": "Mistral Codestral 25.01 es un modelo de codificación de última generación optimizado para baja latencia y uso frecuente. Soporta más de 80 lenguajes y destaca en FIM, corrección de código y generación de pruebas.",
"mistral/devstral-small.description": "Devstral es un LLM orientado a agentes para tareas de ingeniería de software, lo que lo convierte en una opción sólida para agentes de desarrollo.",
"mistral/magistral-medium.description": "Pensamiento complejo respaldado por una comprensión profunda con razonamiento transparente que puedes seguir y verificar. Mantiene un razonamiento de alta fidelidad en varios idiomas, incluso a mitad de tarea.",
"mistral/magistral-small.description": "Pensamiento complejo respaldado por una comprensión profunda con razonamiento transparente que puedes seguir y verificar. Mantiene un razonamiento de alta fidelidad en varios idiomas, incluso a mitad de tarea.",
"mistral/ministral-3b.description": "Un modelo compacto y eficiente para tareas en dispositivos como asistentes y análisis locales, con rendimiento de baja latencia.",
"mistral/ministral-8b.description": "Un modelo más potente con inferencia rápida y eficiente en memoria, ideal para flujos de trabajo complejos y aplicaciones exigentes en el borde.",
"mistral/mistral-embed.description": "Un modelo general de incrustación de texto para búsqueda semántica, similitud, agrupamiento y flujos de trabajo RAG.",
"mistral/mistral-large.description": "Mistral Large es ideal para tareas complejas que requieren razonamiento sólido o especialización: generación de texto sintético, generación de código, RAG o agentes.",
"mistral/mistral-small.description": "Mistral Small es ideal para tareas simples y por lotes como clasificación, soporte al cliente o generación de texto, ofreciendo gran rendimiento a un precio accesible.",
"mistral/mixtral-8x22b-instruct.description": "Modelo Instruct 8x22B. 8x22B es un modelo MoE abierto servido por Mistral.",
"mistral/pixtral-12b.description": "Un modelo de 12 mil millones de parámetros con comprensión de imágenes y texto.",
"mistral/pixtral-large.description": "Pixtral Large es el segundo modelo de nuestra familia multimodal con comprensión de imágenes de vanguardia. Maneja documentos, gráficos e imágenes naturales mientras mantiene la comprensión textual líder de Mistral Large 2.",
"mistralai/Mistral-7B-Instruct-v0.1.description": "Mistral (7B) Instruct es conocido por su sólido rendimiento en muchas tareas lingüísticas.",
"mistralai/Mistral-7B-Instruct-v0.2.description": "Mistral (7B) Instruct v0.2 mejora el manejo de instrucciones y la precisión de los resultados.",
"mistralai/Mistral-7B-Instruct-v0.3.description": "Mistral (7B) Instruct v0.3 ofrece cómputo eficiente y sólida comprensión del lenguaje para muchos casos de uso.",
"mistralai/Mistral-7B-v0.1.description": "Mistral 7B es compacto pero de alto rendimiento, fuerte para procesamiento por lotes y tareas simples como clasificación y generación de texto, con razonamiento sólido.",
"mistralai/Mixtral-8x22B-Instruct-v0.1.description": "Mixtral-8x22B Instruct (141B) es un LLM muy grande para cargas de trabajo pesadas.",
"mistralai/Mixtral-8x7B-Instruct-v0.1.description": "Mixtral-8x7B Instruct (46.7B) ofrece alta capacidad para procesamiento de datos a gran escala.",
"mistralai/Mixtral-8x7B-v0.1.description": "Mixtral 8x7B es un modelo MoE disperso que acelera la inferencia, adecuado para tareas multilingües y generación de código.",
"mistralai/mistral-nemo.description": "Mistral Nemo es un modelo de 7.3B con soporte multilingüe y sólido rendimiento en codificación.",
"mixtral-8x7b-32768.description": "Mixtral 8x7B ofrece computación paralela tolerante a fallos para tareas complejas.",
"mixtral.description": "Mixtral es el modelo MoE de Mistral AI con pesos abiertos, compatible con generación de código y comprensión del lenguaje.",
"mixtral:8x22b.description": "Mixtral es el modelo MoE de Mistral AI con pesos abiertos, compatible con generación de código y comprensión del lenguaje.",
"moonshot-v1-128k-vision-preview.description": "Los modelos de visión Kimi (incluidos moonshot-v1-8k-vision-preview/moonshot-v1-32k-vision-preview/moonshot-v1-128k-vision-preview) pueden comprender contenido de imágenes como texto, colores y formas de objetos.",
"moonshot-v1-128k.description": "Moonshot V1 128K ofrece contexto ultra largo para generación de texto muy extensa, manejando hasta 128,000 tokens para investigación, entornos académicos y documentos extensos.",
"moonshot-v1-32k-vision-preview.description": "Los modelos de visión Kimi (incluidos moonshot-v1-8k-vision-preview/moonshot-v1-32k-vision-preview/moonshot-v1-128k-vision-preview) pueden comprender contenido de imágenes como texto, colores y formas de objetos.",
"moonshot-v1-32k.description": "Moonshot V1 32K admite 32,768 tokens para contextos de longitud media, ideal para documentos largos y diálogos complejos en creación de contenido, informes y sistemas de chat.",
"moonshot-v1-8k-vision-preview.description": "Los modelos de visión Kimi (incluidos moonshot-v1-8k-vision-preview/moonshot-v1-32k-vision-preview/moonshot-v1-128k-vision-preview) pueden comprender contenido de imágenes como texto, colores y formas de objetos.",
"moonshot-v1-8k.description": "Moonshot V1 8K está optimizado para generación de texto corto con rendimiento eficiente, manejando 8,192 tokens para chats breves, notas y contenido rápido.",
"moonshotai/kimi-k2-0711.description": "Kimi K2 0711 es la variante instructiva de la serie Kimi, adecuada para el uso de herramientas y generación de código de alta calidad.",
"moonshotai/kimi-k2-0905.description": "Kimi K2 0905 es una actualización que amplía el contexto y mejora el rendimiento en razonamiento con optimizaciones para programación.",
"moonshotai/kimi-k2-thinking-turbo.description": "Kimi K2 Thinking Turbo es una versión de alta velocidad de Kimi K2 Thinking, que reduce significativamente la latencia sin sacrificar el razonamiento profundo.",
"moonshotai/kimi-k2-thinking.description": "Kimi K2 Thinking es el modelo de razonamiento de Moonshot optimizado para tareas de razonamiento profundo, con capacidades generales de agente.",
"moonshotai/kimi-k2.description": "Kimi K2 es un modelo MoE de gran escala de Moonshot AI con 1T de parámetros totales y 32B activos por paso, optimizado para capacidades de agente como uso avanzado de herramientas, razonamiento y síntesis de código.",
"morph/morph-v3-fast.description": "Morph ofrece un modelo especializado para aplicar cambios de código sugeridos por modelos avanzados (por ejemplo, Claude o GPT-4o) a tus archivos existentes a una velocidad RÁPIDA de más de 4500 tokens/seg. Es el paso final en un flujo de trabajo de codificación con IA y admite 16k tokens de entrada/salida.",
"morph/morph-v3-large.description": "Morph ofrece un modelo especializado para aplicar cambios de código sugeridos por modelos avanzados (por ejemplo, Claude o GPT-4o) a tus archivos existentes a una velocidad RÁPIDA de más de 2500 tokens/seg. Es el paso final en un flujo de trabajo de codificación con IA y admite 16k tokens de entrada/salida.",
"musesteamer-2.0-lite-i2v.description": "En comparación con Turbo, ofrece un rendimiento superior con excelente relación costo-efectividad.",
"musesteamer-2.0-pro-i2v.description": "Basado en Turbo, soporta generación de video dinámico 1080P, ofreciendo mayor calidad visual y expresividad de video mejorada.",
"musesteamer-2.0-turbo-i2v-audio.description": "Soporta generación de video dinámico 720P de 5s y 10s con sonido. Permite creación audiovisual conversacional de múltiples personas, con sonido y visuales sincronizados, imágenes de calidad cinematográfica y movimientos de cámara a nivel maestro.",
"musesteamer-2.0-turbo-i2v.description": "Soporta generación de video dinámico silencioso 720P de 5 segundos, con visuales de calidad cinematográfica, movimientos de cámara complejos y emociones y acciones de personajes realistas.",
"musesteamer-air-i2v.description": "El modelo de generación de video Baidu MuseSteamer Air ofrece un buen rendimiento en consistencia de sujetos, realismo físico, efectos de movimiento de cámara y velocidad de generación. Soporta generación de video dinámico silencioso 720P de 5 segundos, entregando visuales de calidad cinematográfica, generación rápida y excelente relación costo-efectividad.",
"musesteamer-air-image.description": "musesteamer-air-image es un modelo de generación de imágenes desarrollado por el equipo de búsqueda de Baidu para ofrecer un rendimiento excepcional en costo-beneficio. Puede generar rápidamente imágenes claras y coherentes en acción basadas en indicaciones del usuario, convirtiendo descripciones en visuales sin esfuerzo.",
"nemotron-3-super-free.description": "Nemotron 3 Super Free de Nvidia: modelo gratuito de razonamiento con sólido soporte de programación.",
"nousresearch/hermes-2-pro-llama-3-8b.description": "Hermes 2 Pro Llama 3 8B es una versión actualizada de Nous Hermes 2 con los últimos conjuntos de datos desarrollados internamente.",
"nvidia/Llama-3.1-Nemotron-70B-Instruct-HF.description": "Llama 3.1 Nemotron 70B es un modelo LLM personalizado por NVIDIA para mejorar la utilidad. Tiene un rendimiento destacado en Arena Hard, AlpacaEval 2 LC y GPT-4-Turbo MT-Bench, ocupando el puesto #1 en los tres benchmarks de autoalineación al 1 de octubre de 2024. Está entrenado a partir de Llama-3.1-70B-Instruct usando RLHF (REINFORCE), Llama-3.1-Nemotron-70B-Reward y prompts de HelpSteer2-Preference.",
"nvidia/llama-3.1-nemotron-51b-instruct.description": "Un modelo de lenguaje distintivo que ofrece precisión y eficiencia excepcionales.",
"nvidia/llama-3.1-nemotron-70b-instruct.description": "Llama-3.1-Nemotron-70B-Instruct es un modelo personalizado de NVIDIA diseñado para mejorar la utilidad de las respuestas de los LLM.",
"o1-mini.description": "o1-mini es un modelo de razonamiento rápido y rentable diseñado para codificación, matemáticas y ciencia. Tiene un contexto de 128K y un límite de conocimiento de octubre de 2023.",
"o1-preview.description": "o1 es el nuevo modelo de razonamiento de OpenAI para tareas complejas que requieren un conocimiento amplio. Tiene un contexto de 128K y un límite de conocimiento de octubre de 2023.",
"o1-pro.description": "La serie o1 está entrenada con aprendizaje por refuerzo para pensar antes de responder y manejar razonamiento complejo. o1-pro utiliza más recursos computacionales para un pensamiento más profundo y respuestas de mayor calidad de forma constante.",
"o1.description": "o1 es el nuevo modelo de razonamiento de OpenAI con entrada de texto+imagen y salida de texto, adecuado para tareas complejas que requieren conocimiento amplio. Tiene una ventana de contexto de 200K y un límite de conocimiento de octubre de 2023.",
"o3-2025-04-16.description": "o3 es el nuevo modelo de razonamiento de OpenAI con entrada de texto+imagen y salida de texto para tareas complejas que requieren conocimiento amplio.",
"o3-deep-research.description": "o3-deep-research es nuestro modelo más avanzado para investigación profunda en tareas complejas de múltiples pasos. Puede buscar en la web y acceder a tus datos mediante conectores MCP.",
"o3-mini.description": "o3-mini es nuestro último modelo pequeño de razonamiento, que ofrece mayor inteligencia con el mismo costo y latencia que o1-mini.",
"o3-pro-2025-06-10.description": "o3 Pro es el nuevo modelo de razonamiento de OpenAI con entrada de texto+imagen y salida de texto para tareas complejas que requieren conocimiento amplio.",
"o3-pro.description": "o3-pro utiliza más recursos computacionales para pensar más profundamente y ofrecer respuestas de mejor calidad de forma constante; disponible solo a través de la API de Respuestas.",
"o3.description": "o3 es un modelo versátil y potente que establece un nuevo estándar en matemáticas, ciencia, programación y razonamiento visual. Destaca en redacción técnica y seguimiento de instrucciones, y puede analizar texto, código e imágenes para resolver problemas de múltiples pasos.",
"o4-mini-2025-04-16.description": "o4-mini es un modelo de razonamiento de OpenAI con entrada de texto+imagen y salida de texto, adecuado para tareas complejas que requieren conocimiento amplio, con una ventana de contexto de 200K.",
"o4-mini-deep-research.description": "o4-mini-deep-research es un modelo de investigación profunda más rápido y asequible para investigaciones complejas de múltiples pasos. Puede buscar en la web y también acceder a tus datos mediante conectores MCP.",
"o4-mini.description": "o4-mini es el último modelo pequeño de la serie o, optimizado para razonamiento rápido y eficaz con alta eficiencia en tareas de codificación y visión.",
"open-codestral-mamba.description": "Codestral Mamba es un modelo de lenguaje Mamba 2 enfocado en la generación de código, compatible con tareas avanzadas de programación y razonamiento.",
"open-mistral-7b.description": "Mistral 7B es compacto pero de alto rendimiento, ideal para procesamiento por lotes y tareas simples como clasificación y generación de texto, con un razonamiento sólido.",
"open-mistral-nemo.description": "Mistral Nemo es un modelo de 12B desarrollado en conjunto con Nvidia, que ofrece un rendimiento sólido en razonamiento y codificación con integración sencilla.",
"open-mixtral-8x22b.description": "Mixtral 8x22B es un modelo MoE de gran tamaño para tareas complejas, que ofrece un razonamiento sólido y mayor rendimiento.",
"open-mixtral-8x7b.description": "Mixtral 8x7B es un modelo MoE disperso que mejora la velocidad de inferencia, adecuado para tareas multilingües y de generación de código.",
"openai/gpt-3.5-turbo-instruct.description": "Capacidades similares a los modelos de la era GPT-3, compatible con endpoints de completado heredados en lugar de chat.",
"openai/gpt-3.5-turbo.description": "El modelo GPT-3.5 más capaz y rentable de OpenAI, optimizado para chat pero aún fuerte en completados clásicos.",
"openai/gpt-4-turbo.description": "gpt-4-turbo de OpenAI posee un amplio conocimiento general y experiencia en dominios, sigue instrucciones complejas en lenguaje natural y resuelve problemas difíciles con precisión. Su límite de conocimiento es abril de 2023 y cuenta con una ventana de contexto de 128k.",
"openai/gpt-4.1-mini.description": "GPT-4.1 Mini ofrece menor latencia y mejor relación calidad-precio para cargas de trabajo de contexto medio.",
"openai/gpt-4.1-nano.description": "GPT-4.1 Nano es una opción de muy bajo costo y baja latencia para chats cortos de alta frecuencia o clasificación.",
"openai/gpt-4.1.description": "La serie GPT-4.1 ofrece ventanas de contexto más amplias y capacidades más sólidas de ingeniería y razonamiento.",
"openai/gpt-4o-mini.description": "GPT-4o-mini es una variante pequeña y rápida de GPT-4o para uso multimodal de baja latencia.",
"openai/gpt-4o.description": "La familia GPT-4o es el modelo Omni de OpenAI con entrada de texto + imagen y salida de texto.",
"openai/gpt-5-chat.description": "GPT-5 Chat es una variante de GPT-5 optimizada para conversaciones con menor latencia y mejor interactividad.",
"openai/gpt-5-codex.description": "GPT-5-Codex es una variante de GPT-5 optimizada aún más para programación y flujos de trabajo de código a gran escala.",
"openai/gpt-5-mini.description": "GPT-5 Mini es una variante más pequeña de GPT-5 para escenarios de baja latencia y bajo costo.",
"openai/gpt-5-nano.description": "GPT-5 Nano es la variante ultra pequeña para escenarios con restricciones estrictas de costo y latencia.",
"openai/gpt-5-pro.description": "GPT-5 Pro es el modelo insignia de OpenAI, que ofrece razonamiento avanzado, generación de código y funciones de nivel empresarial, con enrutamiento en tiempo de prueba y políticas de seguridad más estrictas.",
"openai/gpt-5.1-chat.description": "GPT-5.1 Chat es el miembro liviano de la familia GPT-5.1, optimizado para conversaciones de baja latencia sin perder capacidad de razonamiento ni ejecución de instrucciones.",
"openai/gpt-5.1-codex-mini.description": "GPT-5.1-Codex-Mini es una versión más pequeña y rápida de GPT-5.1-Codex, ideal para escenarios de programación sensibles a latencia y costo.",
"openai/gpt-5.1-codex.description": "GPT-5.1-Codex es una variante de GPT-5.1 optimizada para ingeniería de software y flujos de trabajo de codificación, adecuada para refactorizaciones grandes, depuración compleja y tareas autónomas prolongadas.",
"openai/gpt-5.1.description": "GPT-5.1 es el modelo insignia más reciente de la serie GPT-5, con mejoras significativas sobre GPT-5 en razonamiento general, seguimiento de instrucciones y naturalidad conversacional, adecuado para tareas amplias.",
"openai/gpt-5.2-chat.description": "GPT-5.2 Chat es la variante de ChatGPT para experimentar las mejoras más recientes en conversación.",
"openai/gpt-5.2-pro.description": "GPT-5.2 Pro: una variante más inteligente y precisa de GPT-5.2 (solo API de respuestas), adecuada para problemas complejos y razonamiento prolongado en múltiples turnos.",
"openai/gpt-5.2.description": "GPT-5.2 es un modelo insignia para programación y flujos de trabajo de agentes, con razonamiento mejorado y rendimiento en contextos largos.",
"openai/gpt-5.description": "GPT-5 es el modelo de alto rendimiento de OpenAI para una amplia gama de tareas de producción e investigación.",
"openai/gpt-oss-120b.description": "Un modelo de lenguaje de propósito general altamente capaz con razonamiento sólido y controlable.",
"openai/gpt-oss-20b.description": "Un modelo de lenguaje compacto con pesos abiertos, optimizado para baja latencia y entornos con recursos limitados, incluyendo implementaciones locales y en el borde.",
"openai/o1-mini.description": "o1-mini es un modelo de razonamiento rápido y rentable diseñado para casos de uso en codificación, matemáticas y ciencia. Tiene un contexto de 128K y un límite de conocimiento de octubre de 2023.",
"openai/o1-preview.description": "o1 es el nuevo modelo de razonamiento de OpenAI para tareas complejas que requieren amplio conocimiento. Tiene un contexto de 128K y un límite de conocimiento de octubre de 2023.",
"openai/o1.description": "OpenAI o1 es un modelo insignia de razonamiento diseñado para resolver problemas complejos que requieren pensamiento profundo, ofreciendo razonamiento sólido y mayor precisión en tareas de múltiples pasos.",
"openai/o3-mini-high.description": "o3-mini (alto razonamiento) ofrece mayor inteligencia con los mismos objetivos de costo y latencia que o1-mini.",
"openai/o3-mini.description": "o3-mini es el último modelo pequeño de razonamiento de OpenAI, que ofrece mayor inteligencia con los mismos objetivos de costo y latencia que o1-mini.",
"openai/o3.description": "OpenAI o3 es el modelo de razonamiento más potente, estableciendo un nuevo SOTA en programación, matemáticas, ciencia y percepción visual. Destaca en consultas complejas y multifacéticas, y es especialmente fuerte en el análisis de imágenes, gráficos y diagramas.",
"openai/o4-mini-high.description": "o4-mini de alto razonamiento, optimizado para razonamiento rápido y eficiente con un rendimiento sólido en programación y visión.",
"openai/o4-mini.description": "OpenAI o4-mini es un modelo pequeño y eficiente de razonamiento para escenarios de baja latencia.",
"openai/text-embedding-3-large.description": "El modelo de embedding más capaz de OpenAI para tareas en inglés y otros idiomas.",
"openai/text-embedding-3-small.description": "Variante mejorada del modelo ada de embedding, con mayor rendimiento.",
"openai/text-embedding-ada-002.description": "Modelo de embedding de texto heredado de OpenAI.",
"openrouter/auto.description": "Según la longitud del contexto, el tema y la complejidad, tu solicitud se enruta a Llama 3 70B Instruct, Claude 3.5 Sonnet (auto-moderado) o GPT-4o.",
"oswe-vscode-prime.description": "Raptor mini es un modelo preliminar optimizado para tareas relacionadas con código.",
"oswe-vscode-secondary.description": "Raptor mini es un modelo preliminar optimizado para tareas relacionadas con código.",
"paratera/deepseek-v3.2.description": "DeepSeek V3.2 es un modelo que equilibra alta eficiencia computacional con un excelente rendimiento en razonamiento y agentes.",
"perplexity/sonar-pro.description": "Producto insignia de Perplexity con búsqueda fundamentada, compatible con consultas avanzadas y seguimientos.",
"perplexity/sonar-reasoning-pro.description": "Modelo avanzado centrado en razonamiento que genera cadenas de pensamiento (CoT) con búsqueda mejorada, incluyendo múltiples consultas por solicitud.",
"perplexity/sonar-reasoning.description": "Modelo centrado en razonamiento que genera cadenas de pensamiento (CoT) con explicaciones detalladas fundamentadas en búsqueda.",
"perplexity/sonar.description": "Producto liviano de Perplexity con búsqueda fundamentada, más rápido y económico que Sonar Pro.",
"phi3.description": "Phi-3 es el modelo abierto liviano de Microsoft para integración eficiente y razonamiento a gran escala.",
"phi3:14b.description": "Phi-3 es el modelo abierto liviano de Microsoft para integración eficiente y razonamiento a gran escala.",
"pixtral-12b-2409.description": "Pixtral destaca en comprensión de gráficos/imágenes, preguntas y respuestas en documentos, razonamiento multimodal y seguimiento de instrucciones. Procesa imágenes en resolución/aspecto nativo y maneja cualquier número de imágenes dentro de una ventana de contexto de 128K.",
"pixtral-large-latest.description": "Pixtral Large es un modelo multimodal abierto de 124B parámetros basado en Mistral Large 2, el segundo de nuestra familia multimodal con comprensión de imágenes de nivel frontera.",
"pixverse/pixverse-c1-it2v.description": "C1 es un modelo a gran escala para la industria cinematográfica y televisiva lanzado por PixVerse a finales de marzo de 2026. Su capacidad it2v (imagen a video) no solo ofrece un control de indicaciones similar al t2v (texto a video), sino que también preserva con gran fidelidad el color, la saturación, las escenas y las características de los personajes de las imágenes de referencia. En comparación con V6, ofrece una interpretación de indicaciones mejorada, mayor creatividad y coreografías de combate y efectos visuales (como hechizos) más cercanos a los estándares cinematográficos profesionales. El modelo permite generar videos de hasta 15 segundos, integra música con salida directa de video y admite múltiples idiomas. Es especialmente adecuado para planos de corta duración, como primeros planos de una sola persona, monólogos, secuencias en cámara lenta o congelada y planos de establecimiento de transición.",
"pixverse/pixverse-c1-kf2v.description": "C1 es un modelo a gran escala para la industria cinematográfica y televisiva lanzado por PixVerse a finales de marzo de 2026. Su capacidad kf2v (fotograma clave a video) permite transiciones suaves y naturales entre dos imágenes de entrada cualesquiera. El modelo admite generación de videos de hasta 15 segundos, integra música con salida directa de video y admite múltiples idiomas.",
"pixverse/pixverse-c1-r2v.description": "C1 es un modelo a gran escala para la industria cinematográfica y televisiva lanzado por PixVerse a finales de marzo de 2026. Su capacidad r2v (referencia a video) permite introducir de 2 a 7 imágenes, combinando inteligentemente múltiples sujetos mientras conserva el control por indicaciones similar al t2v (texto a video), así como la coherencia y creatividad del it2v (imagen a video). Ofrece coreografías de combate y efectos visuales (por ejemplo, hechizos y secuencias de acción) más cercanos a los estándares cinematográficos profesionales. El modelo permite generar videos de hasta 15 segundos, integra música con salida directa de video y maneja múltiples idiomas. Es especialmente adecuado para escenas complejas como planos grupales de varios personajes, diálogos e interacciones, particularmente en planos medios y generales. Si se proporciona una sola imagen tipo storyboard de varias viñetas (hasta una cuadrícula de 9 paneles), puede generar una secuencia continua de múltiples planos con un solo clic.",
"pixverse/pixverse-c1-t2v.description": "C1 es un modelo a gran escala para la industria cinematográfica y televisiva lanzado por PixVerse a finales de marzo de 2026. Su capacidad t2v (texto a video) permite un control preciso sobre la generación de video mediante indicaciones, reproduciendo con exactitud diversas técnicas del lenguaje cinematográfico como los movimientos de cámara de avance, retroceso, paneo, inclinación y travelling, con transiciones de perspectiva fluidas y bien controladas. El modelo permite generar videos de hasta 15 segundos, integra música con salida directa de video y admite múltiples idiomas.",
"pixverse/pixverse-v5.6-it2v.description": "Sube cualquier imagen para personalizar libremente la historia, el ritmo y el estilo, generando videos vívidos y coherentes. PixVerse V5.6 es un modelo grande de generación de video autodesarrollado por Aishi Technology, ofreciendo mejoras integrales tanto en capacidades de texto a video como de imagen a video. El modelo mejora significativamente la claridad de imagen, la estabilidad en movimientos complejos y la sincronización audiovisual. La precisión de sincronización labial y la expresión emocional natural se mejoran en escenas de diálogo de múltiples personajes. La composición, iluminación y consistencia de textura también se optimizan, elevando aún más la calidad general de generación. PixVerse V5.6 se ubica en el nivel global superior en la clasificación de texto a video e imagen a video de Artificial Analysis.",
"pixverse/pixverse-v5.6-kf2v.description": "Logra transiciones fluidas entre cualquier dos imágenes, creando cambios de escena más suaves y naturales con efectos visuales impactantes. PixVerse V5.6 es un modelo grande de generación de video autodesarrollado por Aishi Technology, ofreciendo mejoras integrales tanto en capacidades de texto a video como de imagen a video. El modelo mejora significativamente la claridad de imagen, la estabilidad en movimientos complejos y la sincronización audiovisual. La precisión de sincronización labial y la expresión emocional natural se mejoran en escenas de diálogo de múltiples personajes. La composición, iluminación y consistencia de textura también se optimizan, elevando aún más la calidad general de generación. PixVerse V5.6 se ubica en el nivel global superior en la clasificación de texto a video e imagen a video de Artificial Analysis.",
"pixverse/pixverse-v5.6-r2v.description": "Introduce de 2 a 7 imágenes para fusionar inteligentemente diferentes sujetos mientras se mantiene un estilo unificado y un movimiento coordinado, construyendo fácilmente escenas narrativas ricas y mejorando la controlabilidad del contenido y la libertad creativa. PixVerse V5.6 es un modelo grande de generación de video autodesarrollado por Aishi Technology, ofreciendo mejoras integrales tanto en capacidades de texto a video como de imagen a video. El modelo mejora significativamente la claridad de imagen, la estabilidad en movimientos complejos y la sincronización audiovisual. La precisión de sincronización labial y la expresión emocional natural se mejoran en escenas de diálogo de múltiples personajes. La composición, iluminación y consistencia de textura también se optimizan, elevando aún más la calidad general de generación. PixVerse V5.6 se ubica en el nivel global superior en la clasificación de texto a video e imagen a video de Artificial Analysis.",
"pixverse/pixverse-v5.6-t2v.description": "Introduce una descripción de texto para generar videos de alta calidad con velocidad de nivel segundo y alineación semántica precisa, soportando múltiples estilos. PixVerse V5.6 es un modelo grande de generación de video autodesarrollado por Aishi Technology, ofreciendo mejoras integrales tanto en capacidades de texto a video como de imagen a video. El modelo mejora significativamente la claridad de imagen, la estabilidad en movimientos complejos y la sincronización audiovisual. La precisión de sincronización labial y la expresión emocional natural se mejoran en escenas de diálogo de múltiples personajes. La composición, iluminación y consistencia de textura también se optimizan, elevando aún más la calidad general de generación. PixVerse V5.6 se ubica en el nivel global superior en la clasificación de texto a video e imagen a video de Artificial Analysis.",
"pixverse/pixverse-v6-it2v.description": "V6 es el nuevo modelo de PixVerse lanzado a finales de marzo de 2026. Su modelo it2v (imagen a video) ocupa el segundo lugar a nivel mundial. Además de las capacidades de control de indicaciones de t2v (texto a video), it2v puede reproducir con precisión los colores, saturación, escenas y características de los personajes de las imágenes de referencia, ofreciendo emociones más fuertes de los personajes y un rendimiento de movimiento de alta velocidad. Soporta videos de hasta 15 segundos, salida directa de música y video, y múltiples idiomas. Ideal para escenarios como primeros planos de productos de comercio electrónico, promociones publicitarias y modelado simulado C4D para mostrar estructuras de productos, con salida directa con un solo clic.",
"pixverse/pixverse-v6-kf2v.description": "V6 es el nuevo modelo de PixVerse lanzado a finales de marzo de 2026. Su modelo kf2v (fotograma clave a video) puede conectar sin problemas cualquier dos imágenes, produciendo transiciones de video más suaves y naturales. Soporta videos de hasta 15 segundos, salida directa de música y video, y múltiples idiomas.",
"pixverse/pixverse-v6-t2v.description": "V6 es el nuevo modelo de PixVerse lanzado a finales de marzo de 2026. Su modelo t2v (texto a video) permite un control preciso de los visuales del video a través de indicaciones, reproduciendo con precisión diversas técnicas cinematográficas. Los movimientos de cámara como empujar, tirar, panorámica, inclinación, seguimiento y seguimiento son suaves y naturales, con cambios de perspectiva precisos y controlables. Soporta videos de hasta 15 segundos, salida directa de música y video, y múltiples idiomas.",
"pro-128k.description": "Spark Pro 128K ofrece una capacidad de contexto muy grande, manejando hasta 128K, ideal para documentos extensos que requieren análisis de texto completo y coherencia a largo plazo, con lógica fluida y soporte diverso de citas en discusiones complejas.",
"pro-deepseek-r1.description": "Modelo de servicio dedicado empresarial con concurrencia incluida.",
"pro-deepseek-v3.description": "Modelo de servicio dedicado empresarial con concurrencia incluida.",
"qianfan-70b.description": "Qianfan 70B es un modelo chino de gran escala para generación de alta calidad y razonamiento complejo.",
"qianfan-8b.description": "Qianfan 8B es un modelo general de tamaño medio que equilibra costo y calidad para generación de texto y preguntas y respuestas.",
"qianfan-agent-intent-32k.description": "Qianfan Agent Intent 32K está orientado al reconocimiento de intención y orquestación de agentes con soporte para contexto largo.",
"qianfan-agent-lite-8k.description": "Qianfan Agent Lite 8K es un modelo de agente ligero para diálogos de múltiples turnos y flujos de trabajo de bajo costo.",
"qianfan-check-vl.description": "Qianfan Check VL es un modelo de revisión de contenido multimodal para tareas de cumplimiento y reconocimiento de imagen-texto.",
"qianfan-composition.description": "Qianfan Composition es un modelo de creación multimodal para comprensión y generación combinada de imagen y texto.",
"qianfan-engcard-vl.description": "Qianfan EngCard VL es un modelo de reconocimiento multimodal enfocado en escenarios en inglés.",
"qianfan-multipicocr.description": "Qianfan MultiPicOCR es un modelo OCR para múltiples imágenes que detecta y reconoce texto en varias imágenes.",
"qianfan-qi-vl.description": "Qianfan QI VL es un modelo de preguntas y respuestas multimodal para recuperación precisa y QA en escenarios complejos de imagen y texto.",
"qianfan-singlepicocr.description": "Qianfan SinglePicOCR es un modelo OCR para una sola imagen con reconocimiento de caracteres de alta precisión.",
"qianfan-vl-70b.description": "Qianfan VL 70B es un modelo VLM de gran escala para comprensión compleja de imagen y texto.",
"qianfan-vl-8b.description": "Qianfan VL 8B es un VLM ligero para preguntas y respuestas diarias de imagen y texto y análisis.",
"qvq-72b-preview.description": "QVQ-72B-Preview es un modelo de investigación experimental de Qwen enfocado en mejorar el razonamiento visual.",
"qvq-max.description": "El modelo de razonamiento visual Qwen QVQ admite entrada visual y salida con cadena de pensamiento, con mejor rendimiento en matemáticas, programación, análisis visual, creatividad y tareas generales.",
"qvq-plus.description": "Modelo de razonamiento visual con entrada visual y salida con cadena de pensamiento. La serie qvq-plus sigue a qvq-max y ofrece razonamiento más rápido con mejor equilibrio entre calidad y costo.",
"qwen-coder-plus.description": "Modelo de código Qwen.",
"qwen-coder-turbo-latest.description": "Modelo de código Qwen.",
"qwen-coder-turbo.description": "Modelo de código Qwen.",
"qwen-flash.description": "El modelo Qwen más rápido y económico, ideal para tareas simples.",
"qwen-image-2.0-pro-2026-04-22.description": "La versión completa de QwenImage2.0 integra generación y edición de imágenes en una única capacidad. Admite renderizado de texto profesional con hasta 1k tokens de instrucción, ofrece texturas visuales más detalladas y realistas, permite descripciones precisas de escenas reales y muestra mayor alineación semántica con las indicaciones. La versión completa proporciona el mejor renderizado de texto y el mayor realismo dentro de la serie 2.0.",
"qwen-image-2.0-pro.description": "El modelo de versión completa de la serie Qwen-Image-2.0 integra generación y edición de imágenes en una capacidad unificada. Admite una renderización de texto más profesional con una capacidad de instrucción de hasta 1k tokens, ofrece texturas visuales más delicadas y realistas, permite una representación detallada de escenas realistas y demuestra una mayor alineación semántica con las indicaciones. El modelo de versión completa proporciona la capacidad de renderización de texto más avanzada y el nivel más alto de realismo dentro de la serie 2.0.",
"qwen-image-2.0.description": "El modelo de versión acelerada de la serie Qwen-Image-2.0 integra generación y edición de imágenes en una capacidad unificada. Admite una renderización de texto más profesional con una capacidad de instrucción de hasta 1k tokens, ofrece texturas visuales más refinadas y realistas, permite una representación detallada de escenas realistas y demuestra una mayor adherencia semántica a las indicaciones. La versión acelerada logra de manera efectiva el equilibrio óptimo entre calidad y rendimiento del modelo.",
"qwen-image-edit-max.description": "El modelo de edición de imágenes Qwen admite entrada y salida de múltiples imágenes, permitiendo ediciones precisas de texto en imágenes, adición, eliminación o reubicación de objetos, modificación de acciones de sujetos, transferencia de estilo de imagen y detalles visuales mejorados.",
"qwen-image-edit-plus.description": "El modelo de edición de imágenes Qwen admite entrada y salida de múltiples imágenes, permitiendo ediciones precisas de texto en imágenes, adición, eliminación o reubicación de objetos, modificación de acciones de sujetos, transferencia de estilo de imagen y detalles visuales mejorados.",
"qwen-image-edit.description": "Qwen Image Edit es un modelo de imagen a imagen que edita imágenes basándose en imágenes de entrada y prompts de texto, permitiendo ajustes precisos y transformaciones creativas.",
"qwen-image-max.description": "El modelo de generación de imágenes Qwen (serie Max) ofrece un realismo mejorado y una naturalidad visual superior en comparación con la serie Plus, reduciendo eficazmente los artefactos generados por IA y demostrando un rendimiento sobresaliente en apariencia humana, detalles de textura y renderizado de texto.",
"qwen-image-plus.description": "Admite una amplia gama de estilos artísticos y es particularmente competente en renderizar texto complejo dentro de imágenes, permitiendo un diseño integrado de disposición de imagen y texto.",
"qwen-image.description": "Qwen-Image es un modelo general de generación de imágenes que admite múltiples estilos artísticos y una sólida representación de texto complejo, especialmente en chino e inglés. Soporta diseños de múltiples líneas, texto a nivel de párrafo y detalles finos para composiciones complejas de texto e imagen.",
"qwen-long.description": "Modelo Qwen ultra grande con contexto largo y chat en escenarios de múltiples documentos.",
"qwen-math-plus-latest.description": "Qwen Math es un modelo de lenguaje especializado en resolver problemas matemáticos.",
"qwen-math-plus.description": "Qwen Math es un modelo de lenguaje especializado en resolver problemas matemáticos.",
"qwen-math-turbo-latest.description": "Qwen Math es un modelo de lenguaje especializado en resolver problemas matemáticos.",
"qwen-math-turbo.description": "Qwen Math es un modelo de lenguaje especializado en resolver problemas matemáticos.",
"qwen-max.description": "Modelo Qwen ultra grande a escala de cientos de miles de millones que admite chino, inglés y otros idiomas; es el modelo API detrás de los productos actuales Qwen2.5.",
"qwen-omni-turbo.description": "Los modelos Qwen-Omni admiten entradas multimodales (video, audio, imágenes, texto) y salida de audio y texto.",
"qwen-plus.description": "Modelo Qwen ultra grande mejorado que admite chino, inglés y otros idiomas.",
"qwen-turbo.description": "Qwen Turbo ya no se actualizará; reemplázalo con Qwen Flash. Modelo Qwen ultra grande que admite chino, inglés y otros idiomas.",
"qwen-vl-chat-v1.description": "Qwen VL admite interacciones flexibles, incluyendo entrada de múltiples imágenes, preguntas y respuestas de múltiples turnos y tareas creativas.",
"qwen-vl-max-latest.description": "Modelo Qwen visión-lenguaje ultra grande. En comparación con la versión mejorada, mejora aún más el razonamiento visual y el seguimiento de instrucciones para una percepción y cognición más sólidas.",
"qwen-vl-max.description": "Modelo Qwen visión-lenguaje ultra grande. En comparación con la versión mejorada, mejora aún más el razonamiento visual y el seguimiento de instrucciones para una percepción y cognición visual más sólidas.",
"qwen-vl-ocr.description": "Qwen OCR es un modelo de extracción de texto para documentos, tablas, imágenes de exámenes y escritura a mano. Admite chino, inglés, francés, japonés, coreano, alemán, ruso, italiano, vietnamita y árabe.",
"qwen-vl-plus-latest.description": "Modelo Qwen visión-lenguaje mejorado a gran escala con importantes mejoras en detalle y reconocimiento de texto, compatible con resoluciones superiores a un megapíxel y relaciones de aspecto arbitrarias.",
"qwen-vl-plus.description": "Modelo Qwen visión-lenguaje mejorado a gran escala con importantes mejoras en detalle y reconocimiento de texto, compatible con resoluciones superiores a un megapíxel y relaciones de aspecto arbitrarias.",
"qwen-vl-v1.description": "Modelo preentrenado inicializado desde Qwen-7B con un módulo de visión añadido y entrada de imagen de resolución 448.",
"qwen/qwen-2-7b-instruct.description": "Qwen2 es la nueva serie de modelos LLM de Qwen. Qwen2 7B es un modelo basado en transformadores que destaca en comprensión del lenguaje, capacidad multilingüe, programación, matemáticas y razonamiento.",
"qwen/qwen-2-vl-72b-instruct.description": "Qwen2-VL es la última iteración de Qwen-VL, alcanzando un rendimiento de vanguardia en pruebas de visión como MathVista, DocVQA, RealWorldQA y MTVQA. Puede comprender más de 20 minutos de video para preguntas y respuestas de alta calidad, diálogos y creación de contenido. También maneja razonamiento complejo y toma de decisiones, integrándose con dispositivos móviles y robots para actuar según el contexto visual e instrucciones de texto. Además del inglés y chino, también lee texto en imágenes en muchos idiomas, incluidos la mayoría de los idiomas europeos, japonés, coreano, árabe y vietnamita.",
"qwen/qwen-2.5-72b-instruct.description": "Qwen2.5-72B-Instruct es uno de los últimos lanzamientos de modelos LLM de Alibaba Cloud. El modelo de 72B ofrece mejoras notables en programación y matemáticas, admite más de 29 idiomas (incluidos chino e inglés) y mejora significativamente el seguimiento de instrucciones, la comprensión de datos estructurados y la generación de salidas estructuradas (especialmente JSON).",
"qwen/qwen2.5-32b-instruct.description": "Qwen2.5-32B-Instruct es uno de los últimos lanzamientos de modelos LLM de Alibaba Cloud. El modelo de 32B ofrece mejoras notables en programación y matemáticas, admite más de 29 idiomas (incluidos chino e inglés) y mejora significativamente el seguimiento de instrucciones, la comprensión de datos estructurados y la generación de salidas estructuradas (especialmente JSON).",
"qwen/qwen3-14b.description": "Qwen3-14B es la variante de 14B para razonamiento general y escenarios de conversación.",
"qwen/qwen3-235b-a22b-2507.description": "Qwen3-235B-A22B-Instruct-2507 es la variante Instruct de la serie Qwen3, equilibrando el uso multilingüe de instrucciones con escenarios de contexto largo.",
"qwen/qwen3-235b-a22b-thinking-2507.description": "Qwen3-235B-A22B-Thinking-2507 es la variante de pensamiento de Qwen3, reforzada para tareas complejas de matemáticas y razonamiento.",
"qwen/qwen3-235b-a22b.description": "Qwen3-235B-A22B es un modelo MoE de 235 mil millones de parámetros de Qwen, con 22 mil millones activos por pasada. Alterna entre un modo de pensamiento para razonamiento complejo, matemáticas y programación, y un modo sin pensamiento para chats eficientes. Ofrece un razonamiento sólido, soporte multilingüe (más de 100 idiomas y dialectos), seguimiento avanzado de instrucciones y uso de herramientas de agentes. Maneja de forma nativa contextos de 32K y escala hasta 131K con YaRN.",
"qwen/qwen3-30b-a3b.description": "Qwen3 es la última generación de modelos LLM de Qwen con arquitecturas densas y MoE, destacando en razonamiento, soporte multilingüe y tareas avanzadas de agentes. Su capacidad única de alternar entre un modo de pensamiento para razonamiento complejo y un modo sin pensamiento para chats eficientes garantiza un rendimiento versátil y de alta calidad.\n\nQwen3 supera significativamente a modelos anteriores como QwQ y Qwen2.5, ofreciendo excelentes resultados en matemáticas, programación, razonamiento de sentido común, escritura creativa y chat interactivo. La variante Qwen3-30B-A3B tiene 30.5 mil millones de parámetros (3.3 mil millones activos), 48 capas, 128 expertos (8 activos por tarea) y admite contextos de hasta 131K con YaRN, estableciendo un nuevo estándar para modelos abiertos.",
"qwen/qwen3-32b.description": "Qwen3-32B es un modelo LLM causal denso de 32.8 mil millones de parámetros optimizado para razonamiento complejo y chat eficiente. Alterna entre un modo de pensamiento para matemáticas, programación y lógica, y un modo sin pensamiento para chats generales más rápidos. Tiene un rendimiento destacado en seguimiento de instrucciones, uso de herramientas de agentes y escritura creativa en más de 100 idiomas y dialectos. Maneja de forma nativa contextos de 32K y escala hasta 131K con YaRN.",
"qwen/qwen3-coder-plus.description": "Qwen3-Coder-Plus es un modelo de agente de programación de la serie Qwen optimizado para un uso más complejo de herramientas y sesiones prolongadas.",
"qwen/qwen3-coder.description": "Qwen3-Coder es la familia de modelos de generación de código de Qwen3, destacando en comprensión y generación de código en documentos extensos.",
"qwen/qwen3-max-preview.description": "Qwen3 Max (vista previa) es la variante Max para razonamiento avanzado e integración de herramientas.",
"qwen/qwen3-max.description": "Qwen3 Max es el modelo de razonamiento de gama alta de la serie Qwen3, diseñado para razonamiento multilingüe e integración de herramientas.",
"qwen/qwen3-vl-plus.description": "Qwen3 VL-Plus es la variante de Qwen3 mejorada con visión, con razonamiento multimodal mejorado y procesamiento de video.",
"qwen2.5-14b-instruct-1m.description": "Modelo Qwen2.5 de código abierto con 72 mil millones de parámetros.",
"qwen2.5-14b-instruct.description": "Modelo Qwen2.5 de código abierto con 14 mil millones de parámetros.",
"qwen2.5-32b-instruct.description": "Modelo Qwen2.5 de código abierto con 32 mil millones de parámetros.",
"qwen2.5-72b-instruct.description": "Modelo Qwen2.5 de código abierto con 72 mil millones de parámetros.",
"qwen2.5-7b-instruct.description": "Modelo de código abierto Qwen2.5 de 7B.",
"qwen2.5-coder-1.5b-instruct.description": "Modelo de código Qwen de código abierto.",
"qwen2.5-coder-14b-instruct.description": "Modelo de código Qwen de código abierto.",
"qwen2.5-coder-32b-instruct.description": "Modelo de código Qwen de código abierto.",
"qwen2.5-coder-7b-instruct.description": "Modelo de código Qwen de código abierto.",
"qwen2.5-coder-instruct.description": "Qwen2.5-Coder es el último modelo LLM enfocado en código de la familia Qwen (anteriormente CodeQwen).",
"qwen2.5-instruct.description": "Qwen2.5 es la última serie de modelos LLM de Qwen, con modelos base y ajustados por instrucciones que van desde 0.5B hasta 72B parámetros.",
"qwen2.5-math-1.5b-instruct.description": "Qwen-Math ofrece una sólida capacidad para resolver problemas matemáticos.",
"qwen2.5-math-72b-instruct.description": "Qwen-Math ofrece una sólida capacidad para resolver problemas matemáticos.",
"qwen2.5-math-7b-instruct.description": "Qwen-Math ofrece una sólida capacidad para resolver problemas matemáticos.",
"qwen2.5-omni-7b.description": "Los modelos Qwen-Omni admiten entradas multimodales (video, audio, imágenes, texto) y generan audio y texto.",
"qwen2.5-vl-32b-instruct.description": "Modelo de la serie Qwen2.5VL que alcanza un rendimiento cercano al Qwen2.5VL-72B en matemáticas y preguntas objetivas. El estilo de respuesta está ajustado para la preferencia humana, especialmente para consultas objetivas como matemáticas, razonamiento lógico y preguntas de conocimiento, con salidas más claras y detalladas. Esta es la versión de 32B.",
"qwen2.5-vl-72b-instruct.description": "Mejora en seguimiento de instrucciones, matemáticas, resolución de problemas y programación, con mejor reconocimiento general de objetos. Soporta localización precisa de elementos visuales en varios formatos, comprensión de videos largos (hasta 10 minutos) con temporización de eventos a nivel de segundo, orden temporal y comprensión de velocidad, y agentes que pueden controlar sistemas operativos o móviles mediante análisis y localización. Fuerte extracción de información clave y salida en formato JSON. Esta es la versión más potente de la serie, con 72B.",
"qwen2.5-vl-7b-instruct.description": "Mejor seguimiento de instrucciones, matemáticas, resolución de problemas y codificación, con un reconocimiento general de objetos más sólido. Admite localización precisa de elementos visuales en varios formatos, comprensión de videos largos (hasta 10 minutos) con temporización de eventos a nivel de segundos, ordenamiento temporal y comprensión de velocidad, y agentes que pueden controlar sistemas operativos o móviles mediante análisis y localización. Extracción sólida de información clave y salida en JSON. Esta es la versión más fuerte de la serie con 72B.",
"qwen2.5-vl-instruct.description": "Qwen2.5-VL es el último modelo de visión y lenguaje de la familia Qwen.",
"qwen2.5.description": "Qwen2.5 es el modelo de lenguaje de nueva generación de Alibaba con un rendimiento sólido en diversos casos de uso.",
"qwen2.5:0.5b.description": "Qwen2.5 es el modelo de lenguaje de nueva generación de Alibaba con un rendimiento sólido en diversos casos de uso.",
"qwen2.5:1.5b.description": "Qwen2.5 es el modelo de lenguaje de nueva generación de Alibaba con un rendimiento sólido en diversos casos de uso.",
"qwen2.5:72b.description": "Qwen2.5 es el modelo de lenguaje de nueva generación de Alibaba con un rendimiento sólido en diversos casos de uso.",
"qwen2.description": "Qwen2 es el modelo de lenguaje de nueva generación de Alibaba con un rendimiento sólido en diversos casos de uso.",
"qwen2:0.5b.description": "Qwen2 es el modelo de lenguaje de nueva generación de Alibaba con un rendimiento sólido en diversos casos de uso.",
"qwen2:1.5b.description": "Qwen2 es el modelo de lenguaje de nueva generación de Alibaba con un rendimiento sólido en diversos casos de uso.",
"qwen2:72b.description": "Qwen2 es el modelo de lenguaje de nueva generación de Alibaba con un rendimiento sólido en diversos casos de uso.",
"qwen3-0.6b.description": "Qwen3 es un modelo Tongyi Qwen de próxima generación con grandes avances en razonamiento, capacidad general, capacidades de agente y rendimiento multilingüe, y admite el cambio de modos de pensamiento.",
"qwen3-1.7b.description": "Qwen3 es un modelo Tongyi Qwen de próxima generación con grandes avances en razonamiento, capacidad general, capacidades de agente y rendimiento multilingüe, y admite el cambio de modos de pensamiento.",
"qwen3-14b.description": "Qwen3 14B es un modelo de tamaño medio para preguntas y respuestas multilingües y generación de texto.",
"qwen3-235b-a22b-instruct-2507.description": "Qwen3 235B A22B Instruct 2507 es un modelo instructivo insignia para una amplia gama de tareas de generación y razonamiento.",
"qwen3-235b-a22b-thinking-2507.description": "Qwen3 235B A22B Thinking 2507 es un modelo de pensamiento ultra grande para razonamiento complejo.",
"qwen3-235b-a22b.description": "Qwen3 es un modelo Tongyi Qwen de nueva generación con grandes avances en razonamiento, capacidad general, habilidades de agente y rendimiento multilingüe, y permite cambiar entre modos de pensamiento.",
"qwen3-30b-a3b-instruct-2507.description": "Qwen3 30B A3B Instruct 2507 es un modelo instructivo de tamaño medio-grande para generación de alta calidad y preguntas y respuestas.",
"qwen3-30b-a3b-thinking-2507.description": "Qwen3 30B A3B Thinking 2507 es un modelo de pensamiento de tamaño medio-grande que equilibra precisión y coste.",
"qwen3-30b-a3b.description": "Qwen3 30B A3B es un modelo general de tamaño medio-grande que equilibra coste y calidad.",
"qwen3-32b.description": "Qwen3 32B es adecuado para tareas generales que requieren mayor comprensión.",
"qwen3-4b.description": "Qwen3 es un modelo Tongyi Qwen de próxima generación con grandes avances en razonamiento, capacidad general, capacidades de agente y rendimiento multilingüe, y admite el cambio de modos de pensamiento.",
"qwen3-8b.description": "Qwen3 8B es un modelo ligero con implementación flexible para cargas de trabajo de alta concurrencia.",
"qwen3-coder-30b-a3b-instruct.description": "Modelo de código Qwen de código abierto. El último qwen3-coder-30b-a3b-instruct se basa en Qwen3 y ofrece sólidas capacidades de agente de codificación, uso de herramientas e interacción con entornos para programación autónoma, con excelente rendimiento en código y capacidad general sólida.",
"qwen3-coder-480b-a35b-instruct.description": "Qwen3 Coder 480B A35B Instruct es un modelo de código insignia para programación multilingüe y comprensión de código complejo.",
"qwen3-coder-flash.description": "Modelo de código Qwen. La última serie Qwen3-Coder se basa en Qwen3 y ofrece sólidas capacidades de agente de codificación, uso de herramientas e interacción con entornos para programación autónoma, con excelente rendimiento en código y capacidad general sólida.",
"qwen3-coder-next.description": "El próximo generador de código Qwen optimizado para generación de código complejo de múltiples archivos, depuración y flujos de trabajo de agentes de alto rendimiento. Diseñado para una fuerte integración de herramientas y un rendimiento de razonamiento mejorado.",
"qwen3-coder-plus.description": "Modelo de código Qwen. La última serie Qwen3-Coder se basa en Qwen3 y ofrece sólidas capacidades de agente de codificación, uso de herramientas e interacción con entornos para programación autónoma, con excelente rendimiento en código y capacidad general sólida.",
"qwen3-coder:480b.description": "Modelo de alto rendimiento de Alibaba para tareas de agente y programación con contexto largo.",
"qwen3-max-2026-01-23.description": "Qwen3 Max: Modelo Qwen con mejor rendimiento para tareas de programación complejas y de múltiples pasos con soporte de pensamiento.",
"qwen3-max-preview.description": "Modelo Qwen con mejor rendimiento para tareas complejas y de múltiples pasos. La vista previa admite razonamiento.",
"qwen3-max.description": "Los modelos Qwen3 Max ofrecen grandes mejoras sobre la serie 2.5 en capacidad general, comprensión en chino/inglés, seguimiento de instrucciones complejas, tareas abiertas subjetivas, capacidad multilingüe y uso de herramientas, con menos alucinaciones. La última versión qwen3-max mejora la programación agente y el uso de herramientas respecto a qwen3-max-preview. Este lanzamiento alcanza el estado del arte en el campo y está dirigido a necesidades de agentes más complejas.",
"qwen3-next-80b-a3b-instruct.description": "Modelo de próxima generación Qwen3 de código abierto sin razonamiento. En comparación con la versión anterior (Qwen3-235B-A22B-Instruct-2507), mejora la comprensión del chino, el razonamiento lógico y la generación de texto.",
"qwen3-next-80b-a3b-thinking.description": "Qwen3 Next 80B A3B Thinking es una versión insignia de razonamiento para tareas complejas.",
"qwen3-omni-flash.description": "Qwen3-Omni-Flash es un modelo multimodal construido sobre una arquitectura de Mezcla de Expertos (MoE) ThinkerTalker. Admite una comprensión eficiente de texto, imágenes, audio y video, junto con capacidades de generación de voz. El modelo permite interacción basada en texto en 119 idiomas e interacción por voz en 20 idiomas, produciendo un habla similar a la humana para una comunicación precisa entre idiomas. Cuenta con sólidas capacidades de seguimiento de instrucciones y admite indicaciones de sistema personalizables, permitiendo una adaptación flexible a diferentes estilos de conversación y configuraciones de roles. Es ampliamente aplicable en escenarios como creación de texto, asistentes de voz y análisis multimedia, ofreciendo una experiencia de interacción multimodal natural y fluida.",
"qwen3-vl-235b-a22b-instruct.description": "Qwen3 VL 235B A22B Instruct es un modelo multimodal insignia para comprensión y creación exigentes.",
"qwen3-vl-235b-a22b-thinking.description": "Qwen3 VL 235B A22B Thinking es la versión de razonamiento insignia para planificación y razonamiento multimodal complejo.",
"qwen3-vl-30b-a3b-instruct.description": "Qwen3 VL 30B A3B Instruct es un modelo multimodal grande que equilibra precisión y rendimiento en razonamiento.",
"qwen3-vl-30b-a3b-thinking.description": "Qwen3 VL 30B A3B Thinking es una versión de pensamiento profundo para tareas multimodales complejas.",
"qwen3-vl-32b-instruct.description": "Qwen3 VL 32B Instruct es un modelo multimodal ajustado para instrucciones, ideal para preguntas y respuestas imagen-texto de alta calidad y creación.",
"qwen3-vl-32b-thinking.description": "Qwen3 VL 32B Thinking es una versión multimodal de pensamiento profundo para razonamiento complejo y análisis de cadenas largas.",
"qwen3-vl-8b-instruct.description": "Qwen3 VL 8B Instruct es un modelo multimodal ligero para preguntas visuales diarias e integración en aplicaciones.",
"qwen3-vl-8b-thinking.description": "Qwen3 VL 8B Thinking es un modelo multimodal de cadena de pensamiento para razonamiento visual detallado.",
"qwen3-vl-flash.description": "Qwen3 VL Flash: versión ligera y de razonamiento rápido para solicitudes sensibles a la latencia o de alto volumen.",
"qwen3-vl-plus.description": "Qwen VL es un modelo de generación de texto con comprensión visual. Puede realizar OCR, resumir y razonar, como extraer atributos de fotos de productos o resolver problemas a partir de imágenes.",
"qwen3.5-122b-a10b.description": "Admite entradas de texto, imagen y video. Para tareas solo de texto, su rendimiento es comparable al de Qwen3 Max, ofreciendo mayor eficiencia y menor costo. En capacidades multimodales, ofrece mejoras significativas sobre la serie Qwen3 VL.",
"qwen3.5-27b.description": "Admite entradas de texto, imagen y video. Para tareas solo de texto, su rendimiento es comparable al de Qwen3 Max, ofreciendo mayor eficiencia y menor costo. En capacidades multimodales, ofrece mejoras significativas sobre la serie Qwen3 VL.",
"qwen3.5-35b-a3b.description": "Admite entradas de texto, imagen y video. Para tareas solo de texto, su rendimiento es comparable al de Qwen3 Max, ofreciendo mayor eficiencia y menor costo. En capacidades multimodales, ofrece mejoras significativas sobre la serie Qwen3 VL.",
"qwen3.5-397b-a17b.description": "Admite entradas de texto, imagen y video. Para tareas solo de texto, su rendimiento es comparable al de Qwen3 Max, ofreciendo mayor eficiencia y menor costo. En capacidades multimodales, ofrece mejoras significativas sobre la serie Qwen3 VL.",
"qwen3.5-flash.description": "El modelo nativo visiónlenguaje Qwen3.5 Flash se basa en una arquitectura híbrida que combina un mecanismo de atención lineal con un diseño MixtureofExperts (MoE) disperso, logrando mayor eficiencia en la inferencia. En comparación con la serie 3, ofrece mejoras sustanciales tanto en rendimiento de texto puro como multimodal. También proporciona tiempos de respuesta rápidos, equilibrando velocidad de inferencia y capacidad general.",
"qwen3.5-omni-flash.description": "Qwen3.5 Omni Flash es un modelo Qwen completo, rápido y rentable que admite entrada de texto, imagen y video.",
"qwen3.5-omni-plus.description": "Qwen3.5 Omni Plus admite entrada de texto, imagen y video. Es el último modelo Qwen completo para una comprensión y generación multimodal de alta calidad.",
"qwen3.5-plus-2026-04-20.description": "Qwen 3.5 es un modelo nativo visiónlenguaje Plus. En comparación con la versión del 15 de febrero, esta edición mejora significativamente las capacidades de programación agéntica y acelera sustancialmente la inferencia. Sus capacidades de conocimiento, razonamiento y contexto largo se mantienen en un nivel alto, adecuadas para tareas agénticas complejas. Esta versión corresponde a la instantánea del 20 de abril de 2026.",
"qwen3.5-plus.description": "Qwen3.5 Plus admite entrada de texto, imagen y video. Su rendimiento en tareas de texto puro es comparable al de Qwen3 Max, con mejor rendimiento y menor costo. Sus capacidades multimodales están significativamente mejoradas en comparación con la serie Qwen3 VL.",
"qwen3.5:397b.description": "Qwen3.5 es un modelo fundacional unificado de visión-lenguaje con una arquitectura híbrida (Mixture-of-Experts + atención lineal), que ofrece un razonamiento multimodal sólido, codificación y capacidades de contexto largo con una ventana de contexto de 256K.",
"qwen3.6-27b.description": "Qwen3.6 27B es un modelo denso de código abierto con un rendimiento sólido en razonamiento, codificación y capacidades generales. Admite el modo reflexivo por defecto, ofreciendo un equilibrio entre rendimiento y eficiencia.",
"qwen3.6-35b-a3b.description": "El modelo nativo visiónlenguaje Qwen3.6 35BA3B se basa en una arquitectura híbrida que integra un mecanismo de atención lineal con un diseño MixtureofExperts (MoE) disperso, logrando mayor eficiencia en la inferencia. En comparación con el modelo 3.535BA3B, ofrece mejoras significativas en capacidades de codificación agentiva, razonamiento matemático, razonamiento de código, inteligencia espacial, así como en localización de objetos y detección de objetivos.",
"qwen3.6-flash.description": "El modelo nativo visiónlenguaje Qwen3.6 Flash ofrece un rendimiento significativamente mejorado en comparación con la versión 3.5Flash. Este modelo se centra en mejorar las capacidades de codificación agentiva (superando ampliamente a su predecesor en múltiples pruebas de agentes de código), además de mejorar el razonamiento matemático y el razonamiento de código. En el aspecto visual, muestra avances notables en inteligencia espacial, con mejoras especialmente fuertes en localización de objetos y detección de objetivos.",
"qwen3.6-max-preview.description": "El modelo de mayor tamaño y de código cerrado de la serie Qwen3.6. Ofrece mayor conocimiento del mundo, mejor seguimiento de instrucciones y un rendimiento superior en codificación agentiva para tareas complejas. Es solo de texto, admite el modo de pensamiento por defecto, almacenamiento en caché explícito y llamadas a funciones.",
"qwen3.6-plus.description": "Qwen3.6 Plus admite entrada de texto, imagen y video. Ofrece un rendimiento equilibrado en calidad, velocidad y costo. Sus capacidades multimodales están significativamente mejoradas en comparación con la serie Qwen3 VL.",
"qwen3.7-max.description": "Qwen3.7 Max es el modelo insignia omnipotente de la era de los agentes de IA, que ofrece capacidades integrales en comprensión de texto, imagen y video. Proporciona un rendimiento superior en razonamiento, llamadas de funciones y ejecución de tareas de agentes.",
"qwen3.7-plus.description": "Qwen3.7 Plus es un modelo híbrido interactivo multimodal, basado en las capacidades de texto de la serie Qwen3.7 para unificar visión y lenguaje. Destaca en operación de GUI, codificación visual y flujos de trabajo complejos de agentes.",
"qwen3.description": "Qwen3 es el modelo de lenguaje de próxima generación de Alibaba con alto rendimiento en diversos casos de uso.",
"qwq-32b-preview.description": "QwQ es un modelo experimental de investigación de Qwen centrado en mejorar el razonamiento.",
"qwq-32b.description": "QwQ es un modelo de razonamiento de la familia Qwen. En comparación con los modelos estándar ajustados por instrucciones, ofrece capacidades de pensamiento y razonamiento que mejoran significativamente el rendimiento en tareas complejas. QwQ-32B es un modelo de razonamiento de tamaño medio que rivaliza con los mejores modelos como DeepSeek-R1 y o1-mini.",
"qwq-plus.description": "El modelo de razonamiento QwQ entrenado sobre Qwen2.5 utiliza aprendizaje por refuerzo (RL) para mejorar significativamente el razonamiento. Las métricas clave en matemáticas/código (AIME 24/25, LiveCodeBench) y algunos benchmarks generales (IFEval, LiveBench) alcanzan el nivel completo de DeepSeek-R1.",
"qwq.description": "QwQ es un modelo de razonamiento de la familia Qwen. En comparación con los modelos estándar ajustados por instrucciones, ofrece capacidades de pensamiento y razonamiento que mejoran significativamente el rendimiento en tareas difíciles. QwQ-32B es un modelo de razonamiento de tamaño medio que compite con los mejores modelos como DeepSeek-R1 y o1-mini.",
"qwq_32b.description": "Modelo de razonamiento de tamaño medio de la familia Qwen. En comparación con los modelos estándar ajustados por instrucciones, las capacidades de pensamiento y razonamiento de QwQ mejoran significativamente el rendimiento en tareas difíciles.",
"r1-1776.description": "R1-1776 es una variante postentrenada de DeepSeek R1 diseñada para proporcionar información factual sin censura ni sesgo.",
"seedance-1-5-pro-251215.description": "Seedance 1.5 Pro de ByteDance soporta texto a video, imagen a video (primer cuadro, primer+último cuadro) y generación de audio sincronizado con visuales.",
"seedream-5-0-260128.description": "ByteDance-Seedream-5.0-lite de BytePlus presenta generación aumentada con recuperación web para información en tiempo real, interpretación mejorada de indicaciones complejas y mayor consistencia de referencia para creación visual profesional.",
"sensenova-6.7-flash-lite.description": "Un modelo de agente multimodal ligero diseñado para flujos de trabajo del mundo real, que admite tanto conversaciones basadas en texto como comprensión de imágenes. Ligero y eficiente, equilibrando rendimiento, costo y capacidad de implementación. Arquitectura multimodal nativa con soporte para comprensión de imágenes, incluyendo OCR e interpretación de gráficos. Mejorado para escenarios de oficina y productividad, con soporte estable para tareas complejas de cadena larga. Eficiencia mejorada de tokens, permitiendo un mejor control de costos para cargas de trabajo complejas. Longitud de contexto de 256K tokens (entrada máxima: 252K, salida máxima: 64K).",
"sensenova-u1-fast.description": "Una versión acelerada basada en SenseNova U1, específicamente optimizada para la generación de infografías.",
"solar-mini-ja.description": "Solar Mini (Ja) amplía Solar Mini con un enfoque en japonés, manteniendo un rendimiento eficiente y sólido en inglés y coreano.",
"solar-mini.description": "Solar Mini es un modelo LLM compacto que supera a GPT-3.5, con una sólida capacidad multilingüe compatible con inglés y coreano, ofreciendo una solución eficiente de bajo consumo.",
"solar-pro.description": "Solar Pro es un LLM de alta inteligencia de Upstage, enfocado en el seguimiento de instrucciones en una sola GPU, con puntuaciones IFEval superiores a 80. Actualmente admite inglés; el lanzamiento completo estaba previsto para noviembre de 2024 con soporte de idiomas ampliado y contexto más largo.",
"sonar-deep-research.description": "Deep Research realiza investigaciones expertas exhaustivas y las sintetiza en informes accesibles y accionables.",
"sonar-pro.description": "Un producto de búsqueda avanzada con fundamentos de búsqueda para consultas complejas y seguimientos.",
"sonar-reasoning-pro.description": "Un producto de búsqueda avanzada con fundamentos de búsqueda para consultas complejas y seguimientos.",
"sonar-reasoning.description": "Un producto de búsqueda avanzada con fundamentos de búsqueda para consultas complejas y seguimientos.",
"sonar.description": "Un producto ligero con búsqueda fundamentada, más rápido y económico que Sonar Pro.",
"sophnet/deepseek-v3.2.description": "DeepSeek V3.2 es un modelo que equilibra alta eficiencia computacional con un excelente rendimiento en razonamiento y agentes.",
"sora-2-pro.description": "Sora 2 Pro es nuestro modelo de generación de medios más avanzado, generando videos con audio sincronizado. Puede crear clips dinámicos y detallados a partir de lenguaje natural o imágenes.",
"sora-2.description": "Sora 2 es nuestro nuevo modelo poderoso de generación de medios, generando videos con audio sincronizado. Puede crear clips dinámicos y detallados a partir de lenguaje natural o imágenes.",
"spark-x1.5.description": "Actualizaciones de X1.5: (1) añade un modo de pensamiento dinámico controlado por el campo `thinking`; (2) mayor longitud de contexto con 64K de entrada y 64K de salida; (3) admite FunctionCall.",
"spark-x2-flash.description": "Spark X2-Flash adopta una arquitectura MoE (Mixture of Experts) con un total de 30 mil millones de parámetros y admite hasta una ventana de contexto de 256K. Ofrece mejoras significativas en capacidades de agencia y codificación, y fue entrenado en un clúster de procesadores Ascend 910B AI.",
"spark-x2.description": "Resumen de capacidades de X2: 1. Introduce un ajuste dinámico del modo de razonamiento, controlado mediante el campo `thinking`. 2. Longitud de contexto ampliada: 64K tokens de entrada y 128K tokens de salida. 3. Admite funcionalidad de Function Call.",
"stable-diffusion-3-medium.description": "El último modelo de texto a imagen de Stability AI. Esta versión mejora significativamente la calidad de imagen, la comprensión del texto y la diversidad de estilos, interpretando indicaciones en lenguaje natural complejas con mayor precisión y generando imágenes más precisas y variadas.",
"stable-diffusion-3.5-large-turbo.description": "Stable Diffusion 3.5 Large Turbo se centra en la generación de imágenes de alta calidad con un fuerte nivel de detalle y fidelidad de escena.",
"stable-diffusion-xl-base-1.0.description": "Un modelo de texto a imagen de código abierto de Stability AI con generación creativa de imágenes líder en la industria. Posee una sólida comprensión de instrucciones y admite definiciones inversas de prompts para una generación precisa.",
"step-1-128k.description": "Equilibra rendimiento y costo para escenarios generales.",
"step-1-256k.description": "Manejo de contexto extra largo, ideal para análisis de documentos extensos.",
"step-1-32k.description": "Admite conversaciones de longitud media para una amplia gama de escenarios.",
"step-1-8k.description": "Modelo pequeño adecuado para tareas ligeras.",
"step-1-flash.description": "Modelo de alta velocidad adecuado para chat en tiempo real.",
"step-1.5v-mini.description": "Capacidades sólidas de comprensión de video.",
"step-1o-turbo-vision.description": "Fuerte comprensión de imágenes, supera al modelo 1o en matemáticas y programación. Más pequeño que 1o y con salida más rápida.",
"step-1o-vision-32k.description": "Fuerte comprensión visual con mejor rendimiento que la serie Step-1V.",
"step-1v-32k.description": "Admite entradas visuales para una interacción multimodal más rica.",
"step-1v-8k.description": "Modelo visual pequeño para tareas básicas de imagen y texto.",
"step-1x-edit.description": "Este modelo se centra en la edición de imágenes, modificando y mejorando imágenes a partir de texto e imágenes proporcionadas por el usuario. Admite múltiples formatos de entrada y genera ediciones alineadas con la intención del usuario.",
"step-1x-medium.description": "Este modelo ofrece una sólida generación de imágenes a partir de texto. Con soporte nativo para chino, comprende mejor las descripciones en ese idioma, capturando su semántica y transformándola en características visuales para una generación más precisa. Produce imágenes de alta resolución y calidad, y admite cierto grado de transferencia de estilo.",
"step-2-16k-exp.description": "Versión experimental de Step-2 con las últimas funciones y actualizaciones continuas. No se recomienda para producción.",
"step-2-16k.description": "Admite interacciones de gran contexto para diálogos complejos.",
"step-2-mini.description": "Basado en la arquitectura de atención MFA de próxima generación, ofrece resultados similares a Step-1 con menor costo, mayor rendimiento y menor latencia. Maneja tareas generales con gran capacidad de programación.",
"step-2x-large.description": "Modelo de imagen de nueva generación StepFun centrado en la generación de imágenes, produce imágenes de alta calidad a partir de texto. Ofrece texturas más realistas y mejor representación de texto en chino e inglés.",
"step-3.5-flash-2603.description": "Basado en Step 3.5 Flash y optimizado para escenarios de agentes de alta frecuencia, mejora aún más la eficiencia por token y la velocidad de inferencia, manteniendo capacidades de razonamiento y uso de herramientas de nivel insignia. También admite cambiar a un modo de razonamiento bajo para reducir el consumo de recursos. Incluye optimizaciones específicas para mejorar la compatibilidad con tareas de programación y marcos de agentes.",
"step-3.5-flash.description": "El modelo insignia de razonamiento lingüístico de Stepfun. Este modelo tiene capacidades de razonamiento de primer nivel y capacidades de ejecución rápidas y confiables. Es capaz de descomponer y planificar tareas complejas, llamar herramientas de manera rápida y confiable para realizar tareas, y ser competente en diversas tareas complejas como razonamiento lógico, matemáticas, ingeniería de software e investigación profunda.",
"step-3.7-flash.description": "El modelo insignia de razonamiento multimodal de StepFun. Basado en las capacidades de razonamiento de alta velocidad y llamadas de herramientas de step-3.5-flash, agrega soporte nativo para entrada multimodal, permitiendo la comprensión directa de contenido de imágenes y videos sin depender de MCPs visuales o modelos de visión adicionales. El modelo admite tres niveles de razonamiento (bajo / medio / alto), lo que lo convierte en una opción rápida y confiable para flujos de trabajo de agentes, tareas de codificación y aplicaciones multimodales.",
"step-3.description": "Este modelo posee una fuerte percepción visual y razonamiento complejo, manejando con precisión el entendimiento de conocimientos multidominio, análisis matemático-visual y una amplia gama de tareas de análisis visual cotidiano.",
"step-image-edit-2.description": "Un modelo de edición ligero de la última iteración de Stepfun que admite tanto la generación de imágenes a partir de texto como la edición de imágenes en un solo modelo. A pesar de tener menos de 6 mil millones de parámetros, logra un rendimiento de vanguardia a su escala, rivalizando con modelos de código abierto en el rango de 12B20B parámetros en todos los niveles. Cada tarea de edición toma solo 12 segundos, redefiniendo la experiencia de edición de imágenes interactiva en tiempo real.",
"step-r1-v-mini.description": "Modelo de razonamiento con sólida comprensión de imágenes que puede procesar imágenes y texto, y luego generar texto tras un razonamiento profundo. Destaca en razonamiento visual y ofrece rendimiento de primer nivel en matemáticas, programación y razonamiento textual, con una ventana de contexto de 100K.",
"stepfun-ai/Step-3.5-Flash.description": "Step 3.5 Flash es el modelo base de código abierto más poderoso de StepFun, utilizando arquitectura de Mixture of Experts (MoE) dispersa con 196B de parámetros totales, solo 11B de parámetros activos por token. El modelo admite una ventana de contexto de 256K, logrando un rendimiento de generación de 100-300 tok/s mediante Predicción Multi-Token de 3 vías (MTP-3). Excelente rendimiento en tareas de programación y agentes, verificado por SWE-bench alcanza el 74.4%.",
"taichu4_vl_2b_nothinking.description": "La versión sin pensamiento del modelo Taichu4.0-VL 2B presenta un menor uso de memoria, un diseño ligero, velocidad de respuesta rápida y fuertes capacidades de comprensión multimodal.",
"taichu4_vl_32b.description": "La versión con pensamiento del modelo Taichu4.0-VL 32B es adecuada para tareas complejas de comprensión y razonamiento multimodal, demostrando un rendimiento sobresaliente en razonamiento matemático multimodal, capacidades de agente multimodal y comprensión general de imágenes y visuales.",
"taichu4_vl_32b_nothinking.description": "La versión sin pensamiento del modelo Taichu4.0-VL 32B está diseñada para escenarios complejos de comprensión de imagen y texto y preguntas y respuestas de conocimiento visual, destacándose en subtitulado de imágenes, preguntas y respuestas visuales, comprensión de videos y tareas de localización visual.",
"taichu4_vl_3b.description": "La versión con pensamiento del modelo Taichu4.0-VL 3B realiza eficientemente tareas de comprensión y razonamiento multimodal, con mejoras integrales en comprensión visual, localización visual, reconocimiento OCR y capacidades relacionadas.",
"taichu_llm.description": "El modelo de lenguaje grande Zidong Taichu es un modelo de generación de texto de alto rendimiento desarrollado utilizando tecnologías nacionales de pila completa. A través de la compresión estructurada de un modelo base de cien mil millones de parámetros y la optimización específica de tareas, mejora significativamente la comprensión de texto complejo y las capacidades de razonamiento de conocimiento. Sobresale en escenarios como análisis de documentos largos, extracción de información multilingüe y generación restringida por conocimiento.",
"taichu_llm_14b.description": "El modelo de lenguaje grande Zidong Taichu es un modelo de generación de texto de alto rendimiento desarrollado utilizando tecnologías nacionales de pila completa. A través de la compresión estructurada de un modelo base de cien mil millones de parámetros y la optimización específica de tareas, mejora significativamente la comprensión de texto complejo y las capacidades de razonamiento de conocimiento. Sobresale en escenarios como análisis de documentos largos, extracción de información multilingüe y generación restringida por conocimiento.",
"taichu_llm_2b.description": "El modelo de lenguaje grande Zidong Taichu es un modelo de generación de texto de alto rendimiento desarrollado utilizando tecnologías nacionales de pila completa. A través de la compresión estructurada de un modelo base de cien mil millones de parámetros y la optimización específica de tareas, mejora significativamente la comprensión de texto complejo y las capacidades de razonamiento de conocimiento. Sobresale en escenarios como análisis de documentos largos, extracción de información multilingüe y generación restringida por conocimiento.",
"taichu_o1.description": "taichu_o1 es un modelo de razonamiento de próxima generación que logra cadenas de pensamiento similares a las humanas a través de interacción multimodal y aprendizaje por refuerzo. Admite simulaciones de toma de decisiones complejas y, mientras mantiene una salida de alta precisión, revela vías de razonamiento interpretables. Es adecuado para análisis estratégico, pensamiento profundo y escenarios similares.",
"tencent/Hunyuan-A13B-Instruct.description": "Hunyuan-A13B-Instruct utiliza 80B parámetros totales con 13B activos para igualar modelos más grandes. Admite razonamiento híbrido rápido/lento, comprensión estable de textos largos y capacidad líder de agentes en BFCL-v3 y τ-Bench. GQA y formatos multi-cuánticos permiten inferencia eficiente.",
"tencent/Hunyuan-MT-7B.description": "El modelo de traducción Hunyuan incluye Hunyuan-MT-7B y el conjunto Hunyuan-MT-Chimera. Hunyuan-MT-7B es un modelo ligero de 7B que admite 33 idiomas y 5 lenguas minoritarias chinas. En WMT25 obtuvo 30 primeros lugares en 31 pares de idiomas. Tencent Hunyuan utiliza una canalización completa de entrenamiento desde preentrenamiento hasta SFT, RL de traducción y RL en conjunto, logrando un rendimiento líder en su tamaño con implementación eficiente y sencilla.",
"text-embedding-3-large.description": "El modelo de embedding más potente para tareas en inglés y otros idiomas.",
"text-embedding-3-small.description": "Modelo de embedding de próxima generación eficiente y rentable para recuperación y escenarios RAG.",
"thudm/glm-4-32b.description": "GLM-4-32B-0414 es un modelo bilingüe (chino/inglés) de 32B con pesos abiertos, optimizado para generación de código, llamadas a funciones y tareas de agentes. Preentrenado con 15T de datos de alta calidad y centrados en razonamiento, afinado con alineación de preferencias humanas, muestreo de rechazo y RL. Destaca en razonamiento complejo, generación de artefactos y salida estructurada, alcanzando el nivel de rendimiento de GPT-4o y DeepSeek-V3-0324 en múltiples benchmarks.",
"thudm/glm-4-9b-chat.description": "Versión de código abierto del último modelo preentrenado GLM-4 de Zhipu AI.",
"togethercomputer/StripedHyena-Nous-7B.description": "StripedHyena Nous (7B) ofrece mayor eficiencia computacional gracias a su arquitectura y estrategia.",
"tts-1-hd.description": "El último modelo de texto a voz optimizado para calidad.",
"tts-1.description": "El último modelo de texto a voz optimizado para velocidad en tiempo real.",
"upstage/SOLAR-10.7B-Instruct-v1.0.description": "Upstage SOLAR Instruct v1 (11B) está ajustado para tareas de instrucciones precisas con un sólido rendimiento lingüístico.",
"us.anthropic.claude-3-5-sonnet-20241022-v2:0.description": "Claude 3.5 Sonnet eleva el estándar de la industria, superando a sus competidores y a Claude 3 Opus en amplias evaluaciones, manteniendo velocidad y costo de nivel medio.",
"us.anthropic.claude-3-7-sonnet-20250219-v1:0.description": "Claude 3.7 Sonnet es el modelo de próxima generación más rápido de Anthropic. En comparación con Claude 3 Haiku, mejora en múltiples habilidades y supera al anterior modelo insignia Claude 3 Opus en muchos benchmarks de inteligencia.",
"v0-1.0-md.description": "v0-1.0-md es un modelo heredado disponible a través de la API v0.",
"v0-1.5-lg.description": "v0-1.5-lg es adecuado para tareas avanzadas de pensamiento o razonamiento.",
"v0-1.5-md.description": "v0-1.5-md es adecuado para tareas cotidianas y generación de interfaces de usuario.",
"veo-2.0-generate-001.description": "Nuestro modelo de generación de video de última generación, disponible para desarrolladores en el nivel de pago de la API de Gemini.",
"veo-3.0-fast-generate-001.description": "Nuestro modelo estable de generación de video, disponible para desarrolladores en el nivel de pago de la API de Gemini.",
"veo-3.0-generate-001.description": "Nuestro modelo estable de generación de video, disponible para desarrolladores en el nivel de pago de la API de Gemini.",
"veo-3.1-fast-generate-preview.description": "Nuestro modelo más reciente de generación de video, disponible para desarrolladores en el nivel de pago de la API de Gemini.",
"veo-3.1-generate-preview.description": "Nuestro modelo más reciente de generación de video, disponible para desarrolladores en el nivel de pago de la API de Gemini.",
"vercel/v0-1.0-md.description": "Accede a los modelos detrás de v0 para generar, corregir y optimizar aplicaciones web modernas con razonamiento específico de framework y conocimiento actualizado.",
"vercel/v0-1.5-md.description": "Accede a los modelos detrás de v0 para generar, corregir y optimizar aplicaciones web modernas con razonamiento específico de framework y conocimiento actualizado.",
"vidu/viduq2-pro_img2video.description": "Introduce una imagen y una descripción de texto para generar video. ViduQ2-Pro imagen a video es el primer modelo de video \"Todo Puede Ser Referenciado\" del mundo. Soporta seis dimensiones de referencia: efectos, expresiones, texturas, acciones, personajes y escenas, permitiendo edición de video completamente evolucionada. A través de adición, eliminación y modificación controlables, logra edición de video de grano fino, diseñado como un motor de creación de nivel de producción para series animadas, dramas cortos y producción cinematográfica.",
"vidu/viduq2-pro_reference2video.description": "Introduce videos de referencia, imágenes y una descripción de texto para generar video. ViduQ2-Pro referencia a video es el primer modelo de video \"Todo Puede Ser Referenciado\" del mundo. Soporta seis dimensiones de referencia: efectos, expresiones, texturas, acciones, personajes y escenas, permitiendo edición de video completamente evolucionada. A través de adición, eliminación y modificación controlables, logra edición de video de grano fino, diseñado como un motor de creación de nivel de producción para series animadas, dramas cortos y producción cinematográfica.",
"vidu/viduq2-pro_start-end2video.description": "Introduce las imágenes del primer y último fotograma junto con una descripción de texto para generar video. ViduQ2-Pro fotograma clave a video es el primer modelo de video \"Todo Puede Ser Referenciado\" del mundo. Soporta seis dimensiones de referencia: efectos, expresiones, texturas, acciones, personajes y escenas, permitiendo edición de video completamente evolucionada. A través de adición, eliminación y modificación controlables, logra edición de video de grano fino, diseñado como un motor de creación de nivel de producción para series animadas, dramas cortos y producción cinematográfica.",
"vidu/viduq2-turbo_img2video.description": "Introduce una imagen y una descripción de texto para generar video. ViduQ2-Turbo imagen a video es un motor de generación ultra rápido. Un video de 5 segundos en 720P puede generarse en tan solo 19 segundos, y un video de 5 segundos en 1080P en aproximadamente 27 segundos. Las acciones y expresiones de los personajes son naturales y realistas, ofreciendo una fuerte autenticidad y excelente rendimiento en escenas de alta dinámica como secuencias de acción, con movimiento amplio.",
"vidu/viduq2-turbo_start-end2video.description": "Introduce las imágenes del primer y último fotograma junto con una descripción de texto para generar video. ViduQ2-Turbo fotograma clave a video es un motor de generación ultra rápido. Un video de 5 segundos en 720P puede producirse en tan solo 19 segundos, y un video de 5 segundos en 1080P en aproximadamente 27 segundos. Las acciones y expresiones de los personajes son naturales y realistas, con fuerte autenticidad, destacando en escenas de alta dinámica como secuencias de acción, y soportando movimiento amplio.",
"vidu/viduq2_reference2video.description": "Introduce imágenes de referencia junto con una descripción de texto para generar video. ViduQ2 referencia a video es un modelo diseñado para seguimiento preciso de instrucciones y captura matizada de emociones. Ofrece un control narrativo sobresaliente, interpretando y expresando con precisión cambios de microexpresión; presenta un lenguaje cinematográfico rico, movimientos de cámara suaves y una fuerte tensión visual. Ampliamente aplicable a cine y animación, publicidad y comercio electrónico, dramas cortos e industrias de turismo cultural.",
"vidu/viduq2_text2video.description": "Introduce una indicación de texto para generar video. ViduQ2 texto a video es un modelo diseñado para seguimiento preciso de instrucciones y captura matizada de emociones. Ofrece un control narrativo sobresaliente, interpretando y expresando con precisión cambios de microexpresión; presenta un lenguaje cinematográfico rico, movimientos de cámara suaves y una fuerte tensión visual. Ampliamente aplicable a cine y animación, publicidad y comercio electrónico, dramas cortos e industrias de turismo cultural.",
"vidu/viduq3-pro_img2video.description": "Introduce una imagen y una descripción de texto para generar video. ViduQ3-Pro imagen a video es un modelo nativo audiovisual de nivel insignia. Soporta hasta 16 segundos de generación audiovisual sincronizada, permitiendo cambios de toma libres mientras controla con precisión el ritmo, la emoción y la continuidad narrativa. Con una escala de parámetros líder, ofrece calidad de imagen excepcional, consistencia de personajes y expresión emocional, cumpliendo estándares cinematográficos. Ideal para escenarios de producción profesional como publicidad (comercio electrónico, TVC, campañas de rendimiento), series animadas, dramas de acción en vivo y juegos.",
"vidu/viduq3-pro_start-end2video.description": "Introduce las imágenes del primer y último fotograma junto con una descripción de texto para generar video. ViduQ3-Pro fotograma clave a video es un modelo nativo audiovisual de nivel insignia. Soporta hasta 16 segundos de generación audiovisual sincronizada, permitiendo cambios de toma libres mientras controla con precisión el ritmo, la emoción y la continuidad narrativa. Con una escala de parámetros líder, ofrece calidad de imagen excepcional, consistencia de personajes y expresión emocional, cumpliendo estándares cinematográficos. Ideal para escenarios de producción profesional como publicidad (comercio electrónico, TVC, campañas de rendimiento), series animadas, dramas de acción en vivo y juegos.",
"vidu/viduq3-pro_text2video.description": "Introduce una indicación de texto para generar video. ViduQ3-Pro texto a video es un modelo nativo audiovisual de nivel insignia. Soporta hasta 16 segundos de generación audiovisual sincronizada, permitiendo cambios de toma libres mientras controla con precisión el ritmo, la emoción y la continuidad narrativa. Con una escala de parámetros líder, ofrece calidad de imagen excepcional, consistencia de personajes y expresión emocional, cumpliendo estándares cinematográficos. Ideal para escenarios de producción profesional como publicidad (comercio electrónico, TVC, campañas de rendimiento), series animadas, dramas de acción en vivo y juegos.",
"vidu/viduq3-turbo_img2video.description": "Introduce una imagen y una descripción de texto para generar video. ViduQ3-Turbo imagen a video es un modelo acelerado de alto rendimiento. Ofrece generación extremadamente rápida mientras mantiene visuales de alta calidad y expresión dinámica, destacando en escenas de acción, renderización emocional y comprensión semántica. Rentable e ideal para escenarios de entretenimiento casual como imágenes de redes sociales, compañeros de IA y activos de efectos especiales.",
"vidu/viduq3-turbo_start-end2video.description": "Introduce las imágenes del primer y último fotograma junto con una descripción de texto para generar video. ViduQ3-Turbo fotograma clave a video es un modelo acelerado de alto rendimiento. Ofrece generación extremadamente rápida mientras mantiene visuales de alta calidad y expresión dinámica, destacando en escenas de acción, renderización emocional y comprensión semántica. Rentable e ideal para escenarios de entretenimiento casual como imágenes de redes sociales, compañeros de IA y activos de efectos especiales.",
"vidu/viduq3-turbo_text2video.description": "Introduce una indicación de texto para generar video. ViduQ3-Turbo texto a video es un modelo acelerado de alto rendimiento. Ofrece generación extremadamente rápida mientras mantiene visuales de alta calidad y expresión dinámica, destacando en escenas de acción, renderización emocional y comprensión semántica. Rentable y bien adaptado para escenarios de entretenimiento casual como imágenes de redes sociales, compañeros de IA y activos de efectos especiales.",
"vidu2-image.description": "Vidu 2 es un modelo base de generación de video diseñado para equilibrar velocidad y calidad. Se centra en generación de imagen a video y control de fotogramas iniciales y finales, soportando videos de 4 segundos a resolución 720P. La velocidad de generación se mejora significativamente mientras los costos se reducen sustancialmente. La generación de imagen a video soluciona problemas previos de cambio de color, entregando visuales estables y controlables adecuados para comercio electrónico y aplicaciones similares. Además, la comprensión semántica de fotogramas iniciales y finales y la consistencia entre múltiples imágenes de referencia se han mejorado, convirtiéndolo en una herramienta eficiente para producción de contenido a gran escala en entretenimiento general, medios de internet, dramas animados cortos y publicidad.",
"vidu2-reference.description": "Vidu 2 es un modelo base de generación de video diseñado para equilibrar velocidad y calidad. Se centra en generación de imagen a video y control de fotogramas iniciales y finales, soportando videos de 4 segundos a resolución 720P. La velocidad de generación se mejora significativamente mientras los costos se reducen sustancialmente. La generación de imagen a video soluciona problemas previos de cambio de color, entregando visuales estables y controlables adecuados para comercio electrónico y aplicaciones similares. Además, la comprensión semántica de fotogramas iniciales y finales y la consistencia entre múltiples imágenes de referencia se han mejorado, convirtiéndolo en una herramienta eficiente para producción de contenido a gran escala en entretenimiento general, medios de internet, dramas animados cortos y publicidad.",
"vidu2-start-end.description": "Vidu 2 es un modelo base de generación de video diseñado para equilibrar velocidad y calidad. Se centra en generación de imagen a video y control de fotogramas iniciales y finales, soportando videos de 4 segundos a resolución 720P. La velocidad de generación se mejora significativamente mientras los costos se reducen sustancialmente. La generación de imagen a video soluciona problemas previos de cambio de color, entregando visuales estables y controlables adecuados para comercio electrónico y aplicaciones similares. Además, la comprensión semántica de fotogramas iniciales y finales y la consistencia entre múltiples imágenes de referencia se han mejorado, convirtiéndolo en una herramienta eficiente para producción de contenido a gran escala en entretenimiento general, medios de internet, dramas animados cortos y publicidad.",
"viduq1-image.description": "Vidu Q1 es el modelo base de generación de video de próxima generación de Vidu, centrado en creación de video de alta calidad. Produce contenido con especificaciones fijas de 5 segundos, 24 FPS y resolución 1080P. A través de una optimización profunda de la claridad visual, la calidad general de imagen y textura se mejoran significativamente, mientras que problemas como deformación de manos y vibración de fotogramas se reducen en gran medida. El estilo realista se acerca mucho a escenas del mundo real, y los estilos de animación 2D se preservan con alta fidelidad. Las transiciones entre fotogramas iniciales y finales son más suaves, haciéndolo adecuado para escenarios creativos de alta demanda como producción cinematográfica, publicidad y dramas animados cortos.",
"viduq1-start-end.description": "Vidu Q1 es el modelo base de generación de video de próxima generación de Vidu, centrado en creación de video de alta calidad. Produce contenido con especificaciones fijas de 5 segundos, 24 FPS y resolución 1080P. A través de una optimización profunda de la claridad visual, la calidad general de imagen y textura se mejoran significativamente, mientras que problemas como deformación de manos y vibración de fotogramas se reducen en gran medida. El estilo realista se acerca mucho a escenas del mundo real, y los estilos de animación 2D se preservan con alta fidelidad. Las transiciones entre fotogramas iniciales y finales son más suaves, haciéndolo adecuado para escenarios creativos de alta demanda como producción cinematográfica, publicidad y dramas animados cortos.",
"viduq1-text.description": "Vidu Q1 es el modelo base de generación de video de próxima generación de Vidu, centrado en creación de video de alta calidad. Produce contenido con especificaciones fijas de 5 segundos, 24 FPS y resolución 1080P. A través de una optimización profunda de la claridad visual, la calidad general de imagen y textura se mejoran significativamente, mientras que problemas como deformación de manos y vibración de fotogramas se reducen en gran medida. El estilo realista se acerca mucho a escenas del mundo real, y los estilos de animación 2D se preservan con alta fidelidad. Las transiciones entre fotogramas iniciales y finales son más suaves, haciéndolo adecuado para escenarios creativos de alta demanda como producción cinematográfica, publicidad y dramas animados cortos.",
"volcengine/doubao-seed-2-0-code.description": "Doubao-Seed-2.0-Code está optimizado para las necesidades de programación a nivel empresarial. Basado en las excelentes capacidades de Agente y VLM de Seed 2.0, mejora especialmente las habilidades de codificación con un rendimiento frontend sobresaliente y una optimización específica para los requisitos comunes de codificación multilingüe empresarial, lo que lo hace ideal para la integración con diversas herramientas de programación con IA.",
"volcengine/doubao-seed-2-0-lite.description": "Equilibra la calidad de generación y la velocidad de respuesta, adecuado como modelo de propósito general de grado de producción.",
"volcengine/doubao-seed-2-0-mini.description": "Apunta a la última versión de doubao-seed-2-0-mini.",
"volcengine/doubao-seed-2-0-pro.description": "Apunta a la última versión de doubao-seed-2-0-pro.",
"volcengine/doubao-seed-code.description": "Doubao-Seed-Code es el modelo LLM de ByteDance Volcano Engine optimizado para programación agente, con un sólido rendimiento en benchmarks de programación y agentes, y soporte de contexto de 256K.",
"wan2.2-i2v-flash.description": "Wanxiang 2.2 Edición Rápida ofrece generación ultra rápida, con comprensión de indicaciones y control de cámara más precisos. Mantiene la consistencia de elementos visuales mientras mejora significativamente la estabilidad general y la tasa de éxito.",
"wan2.2-i2v-plus.description": "Wanxiang 2.2 Edición Pro ofrece comprensión de indicaciones más precisa y movimientos de cámara controlables. Mantiene la consistencia de elementos visuales mientras mejora significativamente la estabilidad y la tasa de éxito, y genera contenido más rico y detallado.",
"wan2.2-kf2v-flash.description": "Wanxiang 2.2 Edición Rápida",
"wan2.2-kf2v-plus.description": "Wanxiang 2.2 Edición Plus",
"wan2.2-t2i-flash.description": "Wanxiang 2.2 Flash es el último modelo con mejoras en creatividad, estabilidad y realismo, ofreciendo generación rápida y de alto valor.",
"wan2.2-t2i-plus.description": "Wanxiang 2.2 Plus es el último modelo con mejoras en creatividad, estabilidad y realismo, produciendo detalles más ricos.",
"wan2.2-t2v-plus.description": "Wanxiang 2.2 Edición Pro proporciona comprensión de indicaciones más precisa, genera movimientos suaves y estables, y produce visuales más ricos y detallados.",
"wan2.5-i2i-preview.description": "Wanxiang 2.5 I2I Preview admite edición de imágenes individuales y fusión de múltiples imágenes.",
"wan2.5-i2v-preview.description": "Wanxiang 2.5 Vista Previa soporta generación automática de narración y la capacidad de incorporar archivos de audio personalizados.",
"wan2.5-t2i-preview.description": "Wanxiang 2.5 T2I admite selección flexible de dimensiones de imagen dentro de las restricciones de área total de píxeles y proporciones de aspecto.",
"wan2.5-t2v-preview.description": "Wanxiang 2.5 Vista Previa soporta generación automática de narración y la capacidad de incorporar archivos de audio personalizados.",
"wan2.6-i2v-flash.description": "Wanxiang 2.6 introduce capacidades narrativas de múltiples tomas, además de soportar generación automática de narración y la capacidad de incorporar archivos de audio personalizados.",
"wan2.6-i2v.description": "Wanxiang 2.6 introduce capacidades narrativas de múltiples tomas, además de soportar generación automática de narración y la capacidad de incorporar archivos de audio personalizados.",
"wan2.6-image.description": "Wanxiang 2.6 Image admite edición de imágenes y salida de diseño mixto de imagen y texto.",
"wan2.6-r2v-flash.description": "Wanxiang 2.6 Referencia a Video Flash ofrece generación más rápida y mejor rendimiento de costos. Soporta referencia de personajes específicos o cualquier objeto, manteniendo con precisión la consistencia en apariencia y voz, y permite referencia de múltiples personajes para co-actuación.",
"wan2.6-r2v.description": "Wanxiang 2.6 Referencia a Video soporta referencia de personajes específicos o cualquier objeto, manteniendo con precisión la consistencia en apariencia y voz, y permitiendo referencia de múltiples personajes para co-actuación. Nota: Al usar videos como referencias, el video de entrada también se contará en el costo. Por favor, consulte la documentación de precios del modelo para más detalles.",
"wan2.6-t2i.description": "Wanxiang 2.6 T2I admite selección flexible de dimensiones de imagen dentro de las restricciones de área total de píxeles y proporciones de aspecto (igual que Wanxiang 2.5).",
"wan2.6-t2v.description": "Wanxiang 2.6 introduce capacidades narrativas de múltiples tomas, además de soportar generación automática de narración y la capacidad de incorporar archivos de audio personalizados.",
"wan2.7-i2v-2026-04-25.description": "Wanxiang 2.7 ImagetoVideo ofrece una mejora integral en capacidades de rendimiento. Las escenas dramáticas presentan expresiones emocionales delicadas y naturales, mientras que las secuencias de acción son intensas e impactantes. Combinado con transiciones más dinámicas y rítmicas, logra un rendimiento visual y narrativo más sólido.",
"wan2.7-i2v.description": "Wanxiang 2.7 Imagen a Video ofrece una mejora integral en capacidades de rendimiento. Las escenas dramáticas presentan expresión emocional delicada y natural, mientras que las secuencias de acción son intensas e impactantes. Combinado con transiciones de tomas más dinámicas y rítmicas, logra un rendimiento general más fuerte y narración.",
"wan2.7-image-pro.description": "Wanxiang 2.7 Imagen Edición Profesional, soporta salida en alta definición 4K.",
"wan2.7-image.description": "Wanxiang 2.7 Imagen, velocidad de generación de imágenes más rápida.",
"wan2.7-r2v.description": "Wanxiang 2.7 Referencia a Video ofrece referencias más estables para personajes, objetos y escenas. Soporta hasta 5 imágenes o videos de referencia mezclados, junto con referencia de tono de audio. Combinado con capacidades centrales mejoradas, ofrece un rendimiento más fuerte y poder expresivo.",
"wan2.7-t2v-2026-04-25.description": "Wanxiang 2.7 TexttoVideo presenta una mejora integral en capacidades de rendimiento. Las escenas dramáticas destacan por expresiones emocionales delicadas y naturales, mientras que las secuencias de acción son intensas e impactantes. Con transiciones más dinámicas y fluidez narrativa, ofrece un rendimiento actoral y expresivo más fuerte.",
"wan2.7-t2v.description": "Wanxiang 2.7 Texto a Video ofrece una mejora integral en capacidades de rendimiento. Las escenas dramáticas presentan expresión emocional delicada y natural, mientras que las secuencias de acción son intensas e impactantes. Mejorado con transiciones de tomas más dinámicas y rítmicas, logra un rendimiento de actuación y narración más fuerte.",
"wanx-v1.description": "Modelo base de texto a imagen. Corresponde a Tongyi Wanxiang 1.0 General.",
"wanx2.0-t2i-turbo.description": "Destaca en retratos con textura, velocidad moderada y menor costo. Corresponde a Tongyi Wanxiang 2.0 Speed.",
"wanx2.1-i2v-plus.description": "Wanxiang 2.1 Edición Pro ofrece imágenes más refinadas y de mayor calidad visual.",
"wanx2.1-i2v-turbo.description": "Wanxiang 2.1 Edición Rápida ofrece alto rendimiento de costos.",
"wanx2.1-t2i-plus.description": "Versión completamente mejorada con detalles de imagen más ricos y velocidad ligeramente menor. Corresponde a Tongyi Wanxiang 2.1 Pro.",
"wanx2.1-t2i-turbo.description": "Versión completamente mejorada con generación rápida, alta calidad general y gran valor. Corresponde a Tongyi Wanxiang 2.1 Speed.",
"wanx2.1-t2v-plus.description": "Wanxiang 2.1 Edición Pro ofrece textura visual más rica e imágenes de mayor calidad.",
"wanx2.1-t2v-turbo.description": "Wanxiang 2.1 Edición Rápida ofrece excelente rendimiento de costos.",
"whisper-1.description": "Un modelo general de reconocimiento de voz que admite ASR multilingüe, traducción de voz y detección de idioma.",
"wizardlm2.description": "WizardLM 2 es un modelo de lenguaje de Microsoft AI que sobresale en diálogos complejos, tareas multilingües, razonamiento y asistentes.",
"wizardlm2:8x22b.description": "WizardLM 2 es un modelo de lenguaje de Microsoft AI que sobresale en diálogos complejos, tareas multilingües, razonamiento y asistentes.",
"x-ai/grok-4.1-fast-non-reasoning.description": "Grok 4 Fast (Sin Razonamiento) es el modelo multimodal de alta capacidad y bajo costo de xAI (admite ventana de contexto de 2M) para escenarios sensibles a la latencia y el costo que no requieren razonamiento en el modelo. Se encuentra junto a la versión con razonamiento de Grok 4 Fast, y el razonamiento puede habilitarse mediante el parámetro reasoning de la API cuando sea necesario. Las indicaciones y respuestas pueden ser utilizadas por xAI u OpenRouter para mejorar modelos futuros.",
"x-ai/grok-4.1-fast.description": "Grok 4 Fast es el modelo de alta capacidad y bajo costo de xAI (admite ventana de contexto de 2M), ideal para casos de uso de alta concurrencia y contexto largo.",
"xai/grok-2-vision.description": "Grok 2 Vision sobresale en tareas visuales, ofreciendo rendimiento SOTA en razonamiento visual matemático (MathVista) y preguntas sobre documentos (DocVQA). Maneja documentos, gráficos, diagramas, capturas de pantalla y fotos.",
"xai/grok-2.description": "Grok 2 es un modelo de vanguardia con razonamiento de última generación, excelente en chat, codificación y rendimiento de razonamiento, superando a Claude 3.5 Sonnet y GPT-4 Turbo en LMSYS.",
"xai/grok-3-fast.description": "El modelo insignia de xAI sobresale en casos de uso empresariales como extracción de datos, codificación y resumen, con profundo conocimiento en finanzas, salud, derecho y ciencia. La variante rápida se ejecuta en infraestructura más veloz para respuestas mucho más rápidas con mayor costo por token.",
"xai/grok-3-mini-fast.description": "Modelo ligero de xAI que piensa antes de responder, ideal para tareas simples o basadas en lógica sin necesidad de conocimiento especializado. Se dispone de trazas de razonamiento en bruto. La variante rápida se ejecuta en infraestructura más veloz para respuestas mucho más rápidas con mayor costo por token.",
"xai/grok-3-mini.description": "Modelo ligero de xAI que piensa antes de responder, ideal para tareas simples o basadas en lógica sin necesidad de conocimiento especializado. Se dispone de trazas de razonamiento en bruto.",
"xai/grok-3.description": "El modelo insignia de xAI sobresale en casos de uso empresariales como extracción de datos, codificación y resumen, con profundo conocimiento en finanzas, salud, derecho y ciencia.",
"xai/grok-4.description": "El modelo insignia más reciente de xAI con un rendimiento inigualable en lenguaje natural, matemáticas y razonamiento: un todoterreno ideal.",
"yi-large-fc.description": "Basado en yi-large con llamadas a herramientas mejoradas, adecuado para escenarios de agentes y flujos de trabajo.",
"yi-large-preview.description": "Una versión preliminar; se recomienda yi-large (más reciente).",
"yi-large-rag.description": "Un servicio avanzado basado en yi-large, que combina recuperación y generación para respuestas precisas con búsqueda web en tiempo real.",
"yi-large-turbo.description": "Valor y rendimiento excepcionales, ajustado para un sólido equilibrio entre calidad, velocidad y costo.",
"yi-large.description": "Un nuevo modelo de 100 mil millones de parámetros con sólidas capacidades de preguntas y respuestas y generación de texto.",
"yi-lightning-lite.description": "Una versión ligera; se recomienda yi-lightning.",
"yi-lightning.description": "Un modelo de alto rendimiento más reciente con inferencia más rápida y salida de alta calidad.",
"yi-medium-200k.description": "Un modelo de contexto largo de 200K para comprensión y generación profunda de textos extensos.",
"yi-medium.description": "Un modelo de tamaño medio ajustado con capacidad y valor equilibrados, optimizado para el seguimiento de instrucciones.",
"yi-spark.description": "Un modelo compacto y rápido con capacidades mejoradas en matemáticas y programación.",
"yi-vision-v2.description": "Un modelo de visión para tareas complejas con sólida comprensión y análisis de múltiples imágenes.",
"yi-vision.description": "Un modelo de visión para tareas complejas con sólida comprensión y análisis de imágenes.",
"youtu-vita.description": "VITA es un modelo de comprensión multimodal que admite análisis de contenido de vídeo e imágenes. Se utiliza para tareas como análisis estructural de vídeo y detección de objetos en imágenes.",
"yt-video-2.0.description": "Genera vídeos con alta coherencia temporal a partir de imágenes, adecuado para aplicaciones exigentes como publicidad, clips cinematográficos y videos de presentación de productos.",
"z-ai/glm-4.5-air.description": "GLM 4.5 Air es una variante ligera de GLM 4.5 para escenarios sensibles al costo, manteniendo un sólido razonamiento.",
"z-ai/glm-4.5.description": "GLM 4.5 es el modelo insignia de Z.AI con razonamiento híbrido optimizado para ingeniería y tareas de contexto largo.",
"z-ai/glm-4.6.description": "GLM 4.6 es el modelo insignia de Z.AI, con una longitud de contexto ampliada y capacidades avanzadas de programación.",
"z-ai/glm-4.7.description": "GLM-4.7 es el modelo insignia más reciente de Zhipu, que ofrece capacidades generales mejoradas, respuestas más simples y naturales, y una experiencia de escritura más inmersiva.",
"z-image-turbo.description": "Z-Image es un modelo ligero de generación de texto a imagen que puede producir imágenes rápidamente, admite renderizado de texto en chino e inglés y se adapta de manera flexible a múltiples resoluciones y proporciones de aspecto.",
"zai-glm-4.7.description": "GLM-4.7 es el modelo insignia de nueva generación de Zhipu con 355B de parámetros totales y 32B de parámetros activos, completamente mejorado en diálogo general, razonamiento y capacidades de agentes. GLM-4.7 mejora el Pensamiento Intercalado e introduce el Pensamiento Preservado y el Pensamiento a Nivel de Turno.",
"zai-org/GLM-4.5-Air.description": "GLM-4.5-Air es un modelo base para aplicaciones de agentes que utiliza una arquitectura de Mezcla de Expertos (MoE). Está optimizado para el uso de herramientas, navegación web, ingeniería de software y programación frontend, e integra agentes de código como Claude Code y Roo Code. Emplea razonamiento híbrido para abordar tanto escenarios complejos como situaciones cotidianas.",
"zai-org/GLM-4.5V.description": "GLM-4.5V es el último modelo VLM de Zhipu AI, basado en el modelo de texto insignia GLM-4.5-Air (106B en total, 12B activos) con una arquitectura MoE que ofrece alto rendimiento a menor costo. Sigue la línea de pensamiento de GLM-4.1V-Thinking y añade 3D-RoPE para mejorar el razonamiento espacial en 3D. Optimizado mediante preentrenamiento, SFT y RL, maneja imágenes, videos y documentos extensos, y se posiciona entre los mejores modelos abiertos en 41 benchmarks multimodales públicos. Un modo de pensamiento configurable permite equilibrar velocidad y profundidad.",
"zai/glm-4.5-air.description": "GLM-4.5 y GLM-4.5-Air son nuestros modelos insignia más recientes para aplicaciones de agentes, ambos con arquitectura MoE. GLM-4.5 cuenta con 355B en total y 32B activos por pasada; GLM-4.5-Air es más liviano, con 106B en total y 12B activos.",
"zai/glm-4.5.description": "La serie GLM-4.5 está diseñada para agentes. El modelo insignia GLM-4.5 combina razonamiento, programación y habilidades de agente con 355B de parámetros totales (32B activos) y ofrece modos de operación dual como sistema de razonamiento híbrido.",
"zai/glm-4.5v.description": "GLM-4.5V se basa en GLM-4.5-Air, heredando técnicas comprobadas de GLM-4.1V-Thinking y escalando con una sólida arquitectura MoE de 106B parámetros.",
"zenmux/auto.description": "El enrutamiento automático de ZenMux selecciona el modelo con mejor relación calidad-rendimiento entre las opciones compatibles según tu solicitud."
}