mirror of
https://github.com/lobehub/lobe-chat.git
synced 2026-06-13 19:20:04 +00:00
d8deaddedd
* ✨ feat: support to show working dir
* fix style
* update docs
* update topic
* refactor to use chat config
* inject working Directory
* update i18n
* fix tests
624 lines
157 KiB
JSON
624 lines
157 KiB
JSON
{
|
||
"01-ai/yi-1.5-34b-chat.description": "El modelo ajustado de código abierto más reciente de 01.AI con 34 mil millones de parámetros, compatible con múltiples escenarios de diálogo, entrenado con datos de alta calidad y alineado con las preferencias humanas.",
|
||
"01-ai/yi-1.5-9b-chat.description": "El modelo ajustado de código abierto más reciente de 01.AI con 9 mil millones de parámetros, compatible con múltiples escenarios de diálogo, entrenado con datos de alta calidad y alineado con las preferencias humanas.",
|
||
"360/deepseek-r1.description": "DeepSeek-R1, desplegado a gran escala por 360, utiliza aprendizaje por refuerzo (RL) en la etapa de postentrenamiento para mejorar significativamente el razonamiento con una mínima cantidad de datos etiquetados. Alcanza el nivel del modelo OpenAI o1 en tareas de matemáticas, programación y razonamiento en lenguaje natural.",
|
||
"360gpt-pro-trans.description": "Modelo especializado en traducción, ajustado en profundidad para ofrecer una calidad de traducción líder en su clase.",
|
||
"360gpt-pro.description": "360GPT Pro es un modelo clave de IA de 360 con procesamiento de texto eficiente para diversos escenarios de PLN, compatible con comprensión de textos largos y diálogos de múltiples turnos.",
|
||
"360gpt-turbo-responsibility-8k.description": "360GPT Turbo Responsibility 8K pone énfasis en la seguridad semántica y la responsabilidad en aplicaciones sensibles al contenido, garantizando experiencias precisas y sólidas para el usuario.",
|
||
"360gpt-turbo.description": "360GPT Turbo ofrece gran capacidad de cómputo y conversación con excelente comprensión semántica y eficiencia en generación, ideal para empresas y desarrolladores.",
|
||
"360gpt2-o1.description": "360gpt2-o1 construye cadenas de pensamiento mediante búsqueda en árbol con un mecanismo de reflexión y entrenamiento por RL, lo que permite autorreflexión y autocorrección.",
|
||
"360gpt2-pro.description": "360GPT2 Pro es un modelo avanzado de PLN de 360 con excelente generación y comprensión de texto, especialmente para tareas creativas, transformaciones complejas y simulación de roles.",
|
||
"360zhinao2-o1.description": "360zhinao2-o1 construye cadenas de pensamiento mediante búsqueda en árbol con un mecanismo de reflexión y entrenamiento por RL, lo que permite autorreflexión y autocorrección.",
|
||
"4.0Ultra.description": "Spark Ultra es el modelo más potente de la serie Spark, mejorando la comprensión y resumen de texto, además de optimizar la búsqueda web. Es una solución integral para aumentar la productividad en el trabajo y ofrecer respuestas precisas, posicionándose como un producto inteligente líder.",
|
||
"AnimeSharp.description": "AnimeSharp (también conocido como \"4x-AnimeSharp\") es un modelo de superresolución de código abierto basado en ESRGAN desarrollado por Kim2091, enfocado en escalar y mejorar imágenes de estilo anime. Fue renombrado desde \"4x-TextSharpV1\" en febrero de 2022, originalmente también para imágenes de texto, pero optimizado fuertemente para contenido anime.",
|
||
"Baichuan2-Turbo.description": "Utiliza aumento por búsqueda para conectar el modelo con conocimiento de dominio y de la web. Admite cargas de archivos PDF/Word e ingreso de URLs para una recuperación oportuna y completa, con resultados profesionales y precisos.",
|
||
"Baichuan3-Turbo-128k.description": "Con una ventana de contexto ultra larga de 128K, está optimizado para escenarios empresariales de alta frecuencia con grandes mejoras y alto valor. En comparación con Baichuan2, la creación de contenido mejora un 20 %, las preguntas y respuestas de conocimiento un 17 % y la simulación de roles un 40 %. Su rendimiento general supera al de GPT-3.5.",
|
||
"Baichuan3-Turbo.description": "Optimizado para escenarios empresariales de alta frecuencia con grandes mejoras y alto valor. En comparación con Baichuan2, la creación de contenido mejora un 20 %, las preguntas y respuestas de conocimiento un 17 % y la simulación de roles un 40 %. Su rendimiento general supera al de GPT-3.5.",
|
||
"Baichuan4-Air.description": "Modelo de alto rendimiento en China, que supera a modelos internacionales en tareas en chino como conocimiento, texto largo y generación creativa. También cuenta con capacidades multimodales líderes en la industria con resultados sólidos en pruebas de referencia autorizadas.",
|
||
"Baichuan4-Turbo.description": "Modelo de alto rendimiento en China, que supera a modelos internacionales en tareas en chino como conocimiento, texto largo y generación creativa. También cuenta con capacidades multimodales líderes en la industria con resultados sólidos en pruebas de referencia autorizadas.",
|
||
"Baichuan4.description": "Rendimiento nacional líder, superando a modelos internacionales en tareas en chino como conocimiento enciclopédico, texto largo y generación creativa. También ofrece capacidades multimodales líderes en la industria y resultados sólidos en pruebas de referencia.",
|
||
"ByteDance-Seed/Seed-OSS-36B-Instruct.description": "Seed-OSS es una familia de modelos LLM de código abierto de ByteDance Seed, diseñados para manejar contextos largos, razonamiento, agentes y habilidades generales. Seed-OSS-36B-Instruct es un modelo de 36B ajustado por instrucciones con contexto ultra largo nativo para procesar documentos o bases de código extensas. Está optimizado para razonamiento, generación de código y tareas de agente (uso de herramientas), manteniendo una gran capacidad general. Una característica clave es el \"Presupuesto de Pensamiento\", que permite una longitud de razonamiento flexible para mejorar la eficiencia.",
|
||
"DeepSeek-R1-Distill-Llama-70B.description": "DeepSeek R1, el modelo más grande e inteligente de la suite DeepSeek, ha sido destilado en la arquitectura Llama 70B. Las pruebas de referencia y evaluaciones humanas muestran que es más inteligente que el Llama 70B base, especialmente en tareas de matemáticas y precisión factual.",
|
||
"DeepSeek-R1-Distill-Qwen-1.5B.description": "Modelo destilado de DeepSeek-R1 basado en Qwen2.5-Math-1.5B. El aprendizaje por refuerzo y los datos de arranque en frío optimizan el rendimiento en razonamiento, estableciendo nuevos estándares de referencia multitarea para modelos abiertos.",
|
||
"DeepSeek-R1-Distill-Qwen-14B.description": "Los modelos DeepSeek-R1-Distill están ajustados a partir de modelos de código abierto utilizando datos de muestra generados por DeepSeek-R1.",
|
||
"DeepSeek-R1-Distill-Qwen-32B.description": "Los modelos DeepSeek-R1-Distill están ajustados a partir de modelos de código abierto utilizando datos de muestra generados por DeepSeek-R1.",
|
||
"DeepSeek-R1-Distill-Qwen-7B.description": "Modelo destilado de DeepSeek-R1 basado en Qwen2.5-Math-7B. El aprendizaje por refuerzo y los datos de arranque en frío optimizan el rendimiento en razonamiento, estableciendo nuevos estándares de referencia multitarea para modelos abiertos.",
|
||
"DeepSeek-R1.description": "DeepSeek-R1 aplica aprendizaje por refuerzo a gran escala durante el postentrenamiento, mejorando significativamente el razonamiento con muy pocos datos etiquetados. Alcanza el nivel del modelo de producción OpenAI o1 en tareas de matemáticas, programación y razonamiento en lenguaje natural.",
|
||
"DeepSeek-V3-1.description": "DeepSeek V3.1 es un modelo de razonamiento de nueva generación con mejoras en razonamiento complejo y cadenas de pensamiento, adecuado para tareas de análisis profundo.",
|
||
"DeepSeek-V3-Fast.description": "Proveedor: sophnet. DeepSeek V3 Fast es la versión de alta velocidad de DeepSeek V3 0324, de precisión completa (sin cuantización), con mejor rendimiento en código y matemáticas y respuestas más rápidas.",
|
||
"DeepSeek-V3.1-Fast.description": "DeepSeek V3.1 Fast es la variante rápida de alta velocidad de DeepSeek V3.1. Modo de pensamiento híbrido: mediante plantillas de chat, un solo modelo admite modos de pensamiento y no pensamiento. Uso de herramientas más inteligente: el postentrenamiento mejora el rendimiento en tareas de herramientas y agentes.",
|
||
"DeepSeek-V3.1-Think.description": "Modo de pensamiento de DeepSeek-V3.1: un nuevo modelo de razonamiento híbrido con modos de pensamiento y no pensamiento, más eficiente que DeepSeek-R1-0528. Las optimizaciones posteriores al entrenamiento mejoran significativamente el uso de herramientas de agente y el rendimiento en tareas de agente.",
|
||
"DeepSeek-V3.description": "DeepSeek-V3 es un modelo MoE desarrollado por DeepSeek. Supera a otros modelos abiertos como Qwen2.5-72B y Llama-3.1-405B en muchas pruebas de referencia y compite con modelos cerrados líderes como GPT-4o y Claude 3.5 Sonnet.",
|
||
"Doubao-lite-128k.description": "Doubao-lite ofrece respuestas ultra rápidas y mejor relación calidad-precio, con opciones flexibles para distintos escenarios. Admite contexto de 128K para inferencia y ajuste fino.",
|
||
"Doubao-lite-32k.description": "Doubao-lite ofrece respuestas ultra rápidas y mejor relación calidad-precio, con opciones flexibles para distintos escenarios. Admite contexto de 32K para inferencia y ajuste fino.",
|
||
"Doubao-lite-4k.description": "Doubao-lite ofrece respuestas ultra rápidas y mejor relación calidad-precio, con opciones flexibles para distintos escenarios. Admite contexto de 4K para inferencia y ajuste fino.",
|
||
"Doubao-pro-128k.description": "Modelo insignia de mejor rendimiento para tareas complejas, con gran capacidad en preguntas y respuestas con referencia, resumen, creación, clasificación y simulación de roles. Admite contexto de 128K para inferencia y ajuste fino.",
|
||
"Doubao-pro-32k.description": "Modelo insignia de mejor rendimiento para tareas complejas, con gran capacidad en preguntas y respuestas con referencia, resumen, creación, clasificación y simulación de roles. Admite contexto de 32K para inferencia y ajuste fino.",
|
||
"Doubao-pro-4k.description": "Modelo insignia de mejor rendimiento para tareas complejas, con gran capacidad en preguntas y respuestas con referencia, resumen, creación, clasificación y simulación de roles. Admite contexto de 4K para inferencia y ajuste fino.",
|
||
"DreamO.description": "DreamO es un modelo de personalización de imágenes de código abierto desarrollado conjuntamente por ByteDance y la Universidad de Pekín, que utiliza una arquitectura unificada para admitir generación de imágenes multitarea. Emplea modelado composicional eficiente para generar imágenes altamente coherentes y personalizadas según identidad, tema, estilo, fondo y otras condiciones especificadas por el usuario.",
|
||
"ERNIE-3.5-128K.description": "Modelo LLM insignia de Baidu, entrenado con grandes corpus en chino e inglés. Posee sólidas capacidades generales para chat, creación y uso de complementos. Admite integración automática con el complemento de búsqueda de Baidu para ofrecer respuestas actualizadas.",
|
||
"ERNIE-3.5-8K-Preview.description": "Modelo LLM insignia de Baidu, entrenado con grandes corpus en chino e inglés. Posee sólidas capacidades generales para chat, creación y uso de complementos. Admite integración automática con el complemento de búsqueda de Baidu para ofrecer respuestas actualizadas.",
|
||
"ERNIE-3.5-8K.description": "Modelo LLM insignia de Baidu, entrenado con grandes corpus en chino e inglés. Posee sólidas capacidades generales para chat, creación y uso de complementos. Admite integración automática con el complemento de búsqueda de Baidu para ofrecer respuestas actualizadas.",
|
||
"ERNIE-4.0-8K-Latest.description": "Modelo LLM ultra grande insignia de Baidu con mejoras integrales respecto a ERNIE 3.5, adecuado para tareas complejas en múltiples dominios. Admite integración con el complemento de búsqueda de Baidu para respuestas actualizadas.",
|
||
"ERNIE-4.0-8K-Preview.description": "Modelo LLM ultra grande insignia de Baidu con mejoras integrales respecto a ERNIE 3.5, adecuado para tareas complejas en múltiples dominios. Admite integración con el complemento de búsqueda de Baidu para respuestas actualizadas.",
|
||
"ERNIE-4.0-Turbo-8K-Latest.description": "Modelo LLM ultra grande insignia de Baidu con un rendimiento general sólido para tareas complejas. Incluye integración con el complemento de búsqueda de Baidu para respuestas actualizadas. Supera a ERNIE 4.0.",
|
||
"ERNIE-4.0-Turbo-8K-Preview.description": "Modelo LLM ultra grande insignia de Baidu con un rendimiento general sólido para tareas complejas. Incluye integración con el complemento de búsqueda de Baidu para respuestas actualizadas. Supera a ERNIE 4.0.",
|
||
"ERNIE-Character-8K.description": "Modelo LLM de dominio vertical de Baidu para NPCs de videojuegos, atención al cliente y juegos de rol. Ofrece mayor coherencia de personaje, mejor seguimiento de instrucciones y razonamiento más sólido.",
|
||
"ERNIE-Lite-Pro-128K.description": "Modelo LLM ligero de Baidu que equilibra calidad y rendimiento de inferencia. Supera a ERNIE Lite y es adecuado para aceleradores de bajo consumo.",
|
||
"ERNIE-Speed-128K.description": "Modelo LLM de alto rendimiento más reciente de Baidu (2024), con sólidas capacidades generales. Ideal como base para ajustes finos en escenarios específicos, con excelente rendimiento en razonamiento.",
|
||
"ERNIE-Speed-Pro-128K.description": "Modelo LLM de alto rendimiento más reciente de Baidu (2024), con sólidas capacidades generales. Supera a ERNIE Speed y es ideal como base para ajustes finos, con excelente rendimiento en razonamiento.",
|
||
"FLUX-1.1-pro.description": "FLUX.1.1 Pro",
|
||
"FLUX.1-Kontext-dev.description": "FLUX.1-Kontext-dev es un modelo multimodal de generación y edición de imágenes de Black Forest Labs, basado en una arquitectura Rectified Flow Transformer con 12 mil millones de parámetros. Se centra en generar, reconstruir, mejorar o editar imágenes bajo condiciones contextuales dadas. Combina la generación controlada de los modelos de difusión con el modelado contextual de Transformers, ofreciendo resultados de alta calidad para tareas como inpainting, outpainting y reconstrucción de escenas visuales.",
|
||
"FLUX.1-Kontext-pro.description": "FLUX.1 Kontext [pro]",
|
||
"FLUX.1-dev.description": "FLUX.1-dev es un modelo de lenguaje multimodal de código abierto (MLLM) de Black Forest Labs, optimizado para tareas de imagen y texto. Combina comprensión y generación de imagen/texto. Basado en LLMs avanzados (como Mistral-7B), utiliza un codificador visual cuidadosamente diseñado y ajuste por etapas para lograr coordinación multimodal y razonamiento complejo.",
|
||
"Gryphe/MythoMax-L2-13b.description": "MythoMax-L2 (13B) es un modelo innovador para dominios diversos y tareas complejas.",
|
||
"HelloMeme.description": "HelloMeme es una herramienta de IA que genera memes, GIFs o videos cortos a partir de imágenes o movimientos proporcionados. No requiere habilidades de dibujo ni programación: solo una imagen de referencia para crear contenido divertido, atractivo y estilísticamente coherente.",
|
||
"HiDream-I1-Full.description": "HiDream-E1-Full es un modelo de edición de imágenes multimodal de código abierto de HiDream.ai, basado en una arquitectura avanzada Diffusion Transformer y una sólida comprensión del lenguaje (con LLaMA 3.1-8B-Instruct incorporado). Admite generación de imágenes guiada por lenguaje natural, transferencia de estilo, ediciones locales y repintado, con excelente comprensión y ejecución imagen-texto.",
|
||
"HunyuanDiT-v1.2-Diffusers-Distilled.description": "hunyuandit-v1.2-distilled es un modelo ligero de texto a imagen optimizado mediante destilación para generar imágenes de alta calidad rápidamente, especialmente adecuado para entornos con pocos recursos y generación en tiempo real.",
|
||
"InstantCharacter.description": "InstantCharacter es un modelo de generación de personajes personalizados sin necesidad de ajuste, lanzado por Tencent AI en 2025. Permite generar personajes con alta fidelidad y consistencia entre escenarios. Puede modelar un personaje a partir de una sola imagen de referencia y transferirlo con flexibilidad entre estilos, acciones y fondos.",
|
||
"InternVL2-8B.description": "InternVL2-8B es un potente modelo visión-lenguaje que admite procesamiento multimodal imagen-texto, reconociendo con precisión el contenido visual y generando descripciones o respuestas relevantes.",
|
||
"InternVL2.5-26B.description": "InternVL2.5-26B es un potente modelo visión-lenguaje que admite procesamiento multimodal imagen-texto, reconociendo con precisión el contenido visual y generando descripciones o respuestas relevantes.",
|
||
"Kolors.description": "Kolors es un modelo de texto a imagen desarrollado por el equipo Kolors de Kuaishou. Entrenado con miles de millones de parámetros, destaca por su calidad visual, comprensión semántica en chino y renderizado de texto.",
|
||
"Kwai-Kolors/Kolors.description": "Kolors es un modelo de difusión latente a gran escala de texto a imagen del equipo Kolors de Kuaishou. Entrenado con miles de millones de pares texto-imagen, sobresale en calidad visual, precisión semántica compleja y renderizado de texto en chino/inglés, con sólida comprensión y generación de contenido en chino.",
|
||
"Kwaipilot/KAT-Dev.description": "KAT-Dev (32B) es un modelo de código abierto de 32B para tareas de ingeniería de software. Logra una tasa de resolución del 62.4% en SWE-Bench Verified, ocupando el 5.º lugar entre los modelos abiertos. Está optimizado mediante entrenamiento intermedio, SFT y RL para completar código, corregir errores y revisar código.",
|
||
"Llama-3.2-11B-Vision-Instruct.description": "Razonamiento visual sólido en imágenes de alta resolución, ideal para aplicaciones de comprensión visual.",
|
||
"Llama-3.2-90B-Vision-Instruct\t.description": "Razonamiento visual avanzado para aplicaciones de agentes con comprensión visual.",
|
||
"Meta-Llama-3-3-70B-Instruct.description": "Llama 3.3 70B es un modelo Transformer versátil para tareas de chat y generación.",
|
||
"Meta-Llama-3.1-405B-Instruct.description": "Modelo de texto ajustado por instrucciones Llama 3.1, optimizado para chat multilingüe. Destaca en los principales benchmarks de la industria entre modelos abiertos y cerrados.",
|
||
"Meta-Llama-3.1-70B-Instruct.description": "Modelo de texto ajustado por instrucciones Llama 3.1, optimizado para chat multilingüe. Destaca en los principales benchmarks de la industria entre modelos abiertos y cerrados.",
|
||
"Meta-Llama-3.1-8B-Instruct.description": "Modelo de texto ajustado por instrucciones Llama 3.1, optimizado para chat multilingüe. Destaca en los principales benchmarks de la industria entre modelos abiertos y cerrados.",
|
||
"Meta-Llama-3.2-1B-Instruct.description": "Modelo de lenguaje pequeño de última generación con sólida comprensión del lenguaje, excelente razonamiento y generación de texto.",
|
||
"Meta-Llama-3.2-3B-Instruct.description": "Modelo de lenguaje pequeño de última generación con sólida comprensión del lenguaje, excelente razonamiento y generación de texto.",
|
||
"Meta-Llama-3.3-70B-Instruct.description": "Llama 3.3 es el modelo Llama multilingüe de código abierto más avanzado, con rendimiento cercano al de modelos de 405B a un costo muy bajo. Basado en Transformer y mejorado con SFT y RLHF para utilidad y seguridad. La versión ajustada por instrucciones está optimizada para chat multilingüe y supera a muchos modelos abiertos y cerrados en benchmarks de la industria. Fecha de corte de conocimiento: diciembre de 2023.",
|
||
"Meta-Llama-4-Maverick-17B-128E-Instruct-FP8.description": "Llama 4 Maverick es un modelo MoE grande con activación eficiente de expertos para un rendimiento sólido en razonamiento.",
|
||
"MiniMax-M1.description": "Nuevo modelo de razonamiento interno con 80K de cadena de pensamiento y 1M de entrada, con rendimiento comparable a los mejores modelos globales.",
|
||
"MiniMax-M2-Stable.description": "Diseñado para codificación eficiente y flujos de trabajo de agentes, con mayor concurrencia para uso comercial.",
|
||
"MiniMax-M2.1-Lightning.description": "Potente capacidad de programación multilingüe para una experiencia de codificación completamente mejorada. Más rápido y más eficiente.",
|
||
"MiniMax-M2.1.description": "Potente capacidad de programación multilingüe para una experiencia de codificación completamente mejorada",
|
||
"MiniMax-M2.description": "Diseñado para una codificación eficiente y flujos de trabajo con agentes",
|
||
"MiniMax-Text-01.description": "MiniMax-01 introduce atención lineal a gran escala más allá de los Transformers clásicos, con 456B de parámetros y 45.9B activados por paso. Logra rendimiento de primer nivel y admite hasta 4M tokens de contexto (32× GPT-4o, 20× Claude-3.5-Sonnet).",
|
||
"MiniMaxAI/MiniMax-M1-80k.description": "MiniMax-M1 es un modelo de razonamiento híbrido de gran escala con pesos abiertos, 456B de parámetros totales y ~45.9B activos por token. Admite nativamente 1M de contexto y utiliza Flash Attention para reducir FLOPs en un 75% en generación de 100K tokens frente a DeepSeek R1. Con arquitectura MoE más CISPO y entrenamiento híbrido con atención y RL, logra rendimiento líder en razonamiento con entradas largas y tareas reales de ingeniería de software.",
|
||
"MiniMaxAI/MiniMax-M2.description": "MiniMax-M2 redefine la eficiencia de los agentes. Es un modelo MoE compacto, rápido y rentable con 230B totales y 10B parámetros activos, diseñado para tareas de codificación y agentes de alto nivel, manteniendo una inteligencia general sólida. Con solo 10B activos, rivaliza con modelos mucho más grandes, ideal para aplicaciones de alta eficiencia.",
|
||
"Moonshot-Kimi-K2-Instruct.description": "1 billón de parámetros totales con 32 mil millones activos. Entre los modelos sin modo de razonamiento, es de los mejores en conocimiento avanzado, matemáticas y programación, y destaca en tareas generales de agentes. Optimizado para cargas de trabajo de agentes, puede ejecutar acciones, no solo responder preguntas. Ideal para conversaciones improvisadas, chat general y experiencias con agentes como un modelo de reflejo sin razonamiento prolongado.",
|
||
"NousResearch/Nous-Hermes-2-Mixtral-8x7B-DPO.description": "Nous Hermes 2 - Mixtral 8x7B-DPO (46,7 mil millones) es un modelo de instrucciones de alta precisión para cálculos complejos.",
|
||
"OmniConsistency.description": "OmniConsistency mejora la coherencia de estilo y la generalización en tareas de imagen a imagen mediante la introducción de Transformadores de Difusión a gran escala (DiTs) y datos estilizados emparejados, evitando la degradación del estilo.",
|
||
"Phi-3-medium-128k-instruct.description": "El mismo modelo Phi-3-medium con una ventana de contexto ampliada para RAG o indicaciones de pocos ejemplos.",
|
||
"Phi-3-medium-4k-instruct.description": "Un modelo de 14 mil millones de parámetros con mayor calidad que Phi-3-mini, centrado en datos de alta calidad y razonamiento intensivo.",
|
||
"Phi-3-mini-128k-instruct.description": "El mismo modelo Phi-3-mini con una ventana de contexto ampliada para RAG o indicaciones de pocos ejemplos.",
|
||
"Phi-3-mini-4k-instruct.description": "El miembro más pequeño de la familia Phi-3, optimizado para calidad y baja latencia.",
|
||
"Phi-3-small-128k-instruct.description": "El mismo modelo Phi-3-small con una ventana de contexto ampliada para RAG o indicaciones de pocos ejemplos.",
|
||
"Phi-3-small-8k-instruct.description": "Un modelo de 7 mil millones de parámetros con mayor calidad que Phi-3-mini, centrado en datos de alta calidad y razonamiento intensivo.",
|
||
"Phi-3.5-mini-instruct.description": "Una versión actualizada del modelo Phi-3-mini.",
|
||
"Phi-3.5-vision-instrust.description": "Una versión actualizada del modelo Phi-3-vision.",
|
||
"Pro/Qwen/Qwen2-7B-Instruct.description": "Qwen2-7B-Instruct es un modelo LLM de 7 mil millones de parámetros ajustado para instrucciones de la serie Qwen2. Utiliza arquitectura Transformer con SwiGLU, sesgo QKV en atención y atención de consulta agrupada, y maneja entradas extensas. Tiene un rendimiento destacado en comprensión del lenguaje, generación, tareas multilingües, programación, matemáticas y razonamiento, superando a la mayoría de los modelos abiertos y compitiendo con modelos propietarios. Supera a Qwen1.5-7B-Chat en múltiples pruebas.",
|
||
"Pro/Qwen/Qwen2.5-7B-Instruct.description": "Qwen2.5-7B-Instruct forma parte de la última serie de LLM de Alibaba Cloud. El modelo de 7 mil millones ofrece mejoras notables en programación y matemáticas, admite más de 29 idiomas y mejora el seguimiento de instrucciones, la comprensión de datos estructurados y la generación de salidas estructuradas (especialmente JSON).",
|
||
"Pro/Qwen/Qwen2.5-Coder-7B-Instruct.description": "Qwen2.5-Coder-7B-Instruct es el último modelo LLM de Alibaba Cloud enfocado en programación. Basado en Qwen2.5 y entrenado con 5,5 billones de tokens, mejora significativamente la generación, razonamiento y corrección de código, manteniendo fortalezas en matemáticas y tareas generales, proporcionando una base sólida para agentes de programación.",
|
||
"Pro/Qwen/Qwen2.5-VL-7B-Instruct.description": "Qwen2.5-VL es un nuevo modelo visión-lenguaje de Qwen con gran capacidad de comprensión visual. Analiza texto, gráficos y diseños en imágenes, comprende videos largos y eventos, admite razonamiento y uso de herramientas, anclaje de objetos en múltiples formatos y salidas estructuradas. Mejora la resolución dinámica y el entrenamiento con tasa de fotogramas para comprensión de video y aumenta la eficiencia del codificador visual.",
|
||
"Pro/THUDM/GLM-4.1V-9B-Thinking.description": "GLM-4.1V-9B-Thinking es un modelo VLM de código abierto de Zhipu AI y el Laboratorio KEG de Tsinghua, diseñado para cognición multimodal compleja. Basado en GLM-4-9B-0414, añade razonamiento en cadena y aprendizaje por refuerzo para mejorar significativamente el razonamiento entre modalidades y la estabilidad.",
|
||
"Pro/THUDM/glm-4-9b-chat.description": "GLM-4-9B-Chat es el modelo GLM-4 de código abierto de Zhipu AI. Tiene un rendimiento sólido en semántica, matemáticas, razonamiento, programación y conocimiento. Más allá del chat multivuelta, admite navegación web, ejecución de código, llamadas a herramientas personalizadas y razonamiento con textos largos. Soporta 26 idiomas (incluidos chino, inglés, japonés, coreano y alemán). Tiene buenos resultados en AlignBench-v2, MT-Bench, MMLU y C-Eval, y admite hasta 128K de contexto para uso académico y empresarial.",
|
||
"Pro/deepseek-ai/DeepSeek-R1-Distill-Qwen-7B.description": "DeepSeek-R1-Distill-Qwen-7B es una destilación de Qwen2.5-Math-7B ajustada con 800 mil muestras seleccionadas de DeepSeek-R1. Tiene un rendimiento destacado, con 92,8% en MATH-500, 55,5% en AIME 2024 y una puntuación de 1189 en CodeForces para un modelo de 7 mil millones.",
|
||
"Pro/deepseek-ai/DeepSeek-R1.description": "DeepSeek-R1 es un modelo de razonamiento impulsado por aprendizaje por refuerzo que reduce la repetición y mejora la legibilidad. Utiliza datos de arranque en frío antes del RL para potenciar aún más el razonamiento, iguala a OpenAI-o1 en tareas de matemáticas, programación y razonamiento, y mejora los resultados generales mediante un entrenamiento cuidadoso.",
|
||
"Pro/deepseek-ai/DeepSeek-V3.1-Terminus.description": "DeepSeek-V3.1-Terminus es una versión actualizada del modelo V3.1, posicionado como un LLM híbrido para agentes. Corrige problemas reportados por usuarios y mejora la estabilidad, coherencia lingüística y reduce caracteres anómalos o mezclas de chino/inglés. Integra modos de razonamiento y no razonamiento con plantillas de chat para cambiar de forma flexible. También mejora el rendimiento de los agentes de código y búsqueda para un uso más fiable de herramientas y tareas de múltiples pasos.",
|
||
"Pro/deepseek-ai/DeepSeek-V3.2-Exp.description": "DeepSeek-V3.2-Exp es una versión experimental de V3.2 que sirve de puente hacia la próxima arquitectura. Añade DeepSeek Sparse Attention (DSA) sobre V3.1-Terminus para mejorar el entrenamiento e inferencia en contextos largos, con optimizaciones para uso de herramientas, comprensión de documentos extensos y razonamiento de múltiples pasos. Ideal para explorar mayor eficiencia de razonamiento con presupuestos de contexto amplios.",
|
||
"Pro/deepseek-ai/DeepSeek-V3.description": "DeepSeek-V3 es un modelo MoE de 671 mil millones de parámetros que utiliza MLA y DeepSeekMoE con balanceo de carga sin pérdida para inferencia y entrenamiento eficientes. Preentrenado con 14,8 billones de tokens de alta calidad y ajustado con SFT y RL, supera a otros modelos abiertos y se acerca al rendimiento de modelos cerrados líderes.",
|
||
"Pro/moonshotai/Kimi-K2-Instruct-0905.description": "Kimi K2-Instruct-0905 es la versión más reciente y potente de Kimi K2. Es un modelo MoE de primer nivel con 1 billón de parámetros totales y 32 mil millones activos. Sus características clave incluyen mayor inteligencia en programación con agentes, mejoras significativas en pruebas de referencia y tareas reales de agentes, además de una estética y usabilidad mejoradas en programación frontend.",
|
||
"Pro/moonshotai/Kimi-K2-Thinking.description": "Kimi K2 Thinking Turbo es la variante Turbo optimizada para velocidad de razonamiento y rendimiento, manteniendo el razonamiento de múltiples pasos y uso de herramientas de K2 Thinking. Es un modelo MoE con aproximadamente 1 billón de parámetros totales, contexto nativo de 256K y llamadas a herramientas estables a gran escala para escenarios de producción con necesidades estrictas de latencia y concurrencia.",
|
||
"Pro/zai-org/glm-4.7.description": "GLM-4.7 es el modelo insignia de nueva generación de Zhipu, con 355 mil millones de parámetros totales y 32 mil millones de parámetros activos. Ofrece mejoras integrales en conversación general, razonamiento e inteligencia de agentes. GLM-4.7 refuerza el Pensamiento Intercalado (Interleaved Thinking), e introduce el Pensamiento Preservado (Preserved Thinking) y el Pensamiento por Turnos (Turn-level Thinking).",
|
||
"QwQ-32B-Preview.description": "Qwen QwQ es un modelo de investigación experimental centrado en mejorar el razonamiento.",
|
||
"Qwen/QVQ-72B-Preview.description": "QVQ-72B-Preview es un modelo de investigación de Qwen enfocado en razonamiento visual, con fortalezas en comprensión de escenas complejas y problemas visuales de matemáticas.",
|
||
"Qwen/QwQ-32B-Preview.description": "Qwen QwQ es un modelo de investigación experimental centrado en mejorar el razonamiento de IA.",
|
||
"Qwen/QwQ-32B.description": "QwQ es un modelo de razonamiento de la familia Qwen. En comparación con los modelos estándar ajustados para instrucciones, añade capacidades de pensamiento y razonamiento que mejoran significativamente el rendimiento en tareas complejas. QwQ-32B es un modelo de razonamiento de tamaño medio competitivo con modelos líderes como DeepSeek-R1 y o1-mini. Utiliza RoPE, SwiGLU, RMSNorm y sesgo QKV en atención, con 64 capas y 40 cabezales de atención Q (8 KV en GQA).",
|
||
"Qwen/Qwen-Image-Edit-2509.description": "Qwen-Image-Edit-2509 es la última versión de edición de Qwen-Image del equipo Qwen. Basado en el modelo Qwen-Image de 20 mil millones de parámetros, amplía su potente renderizado de texto hacia la edición de imágenes para realizar ediciones textuales precisas. Utiliza una arquitectura de control dual, enviando entradas a Qwen2.5-VL para control semántico y a un codificador VAE para control de apariencia, permitiendo ediciones tanto a nivel semántico como visual. Admite ediciones locales (agregar/quitar/modificar) y ediciones semánticas de alto nivel como creación de IP y transferencia de estilo, preservando el significado. Logra resultados SOTA en múltiples pruebas de referencia.",
|
||
"Qwen/Qwen-Image.description": "Qwen-Image es un modelo base de generación de imágenes de 20 mil millones de parámetros del equipo Qwen. Logra avances importantes en renderizado de texto complejo y edición precisa de imágenes, especialmente para texto en chino/inglés de alta fidelidad. Admite diseños de múltiples líneas y párrafos manteniendo la coherencia tipográfica. Más allá del renderizado de texto, admite una amplia gama de estilos desde fotorrealismo hasta anime, y edición avanzada como transferencia de estilo, adición/eliminación de objetos, mejora de detalles, edición de texto y control de poses, con el objetivo de ser una base integral para la creación visual.",
|
||
"Qwen/Qwen2-72B-Instruct.description": "Qwen 2 Instruct (72B) ofrece un seguimiento preciso de instrucciones para cargas de trabajo empresariales.",
|
||
"Qwen/Qwen2-7B-Instruct.description": "Qwen2-7B-Instruct es un modelo de 7B ajustado con instrucciones de la serie Qwen2 que utiliza Transformer, SwiGLU, sesgo QKV y atención de consulta agrupada. Maneja entradas extensas y ofrece un rendimiento destacado en comprensión, generación, multilingüismo, programación, matemáticas y razonamiento, superando a la mayoría de los modelos abiertos y superando a Qwen1.5-7B-Chat en múltiples evaluaciones.",
|
||
"Qwen/Qwen2-VL-72B-Instruct.description": "Qwen2-VL es el modelo más reciente de Qwen-VL, alcanzando el estado del arte en pruebas de visión como MathVista, DocVQA, RealWorldQA y MTVQA. Puede comprender videos de más de 20 minutos para preguntas sobre video, diálogos y creación de contenido. También admite razonamiento complejo y toma de decisiones, integrándose con dispositivos/robots para acciones guiadas por visión. Además del inglés y el chino, puede leer texto en muchos idiomas, incluidos la mayoría de los idiomas europeos, japonés, coreano, árabe y vietnamita.",
|
||
"Qwen/Qwen2.5-14B-Instruct.description": "Qwen2.5-14B-Instruct forma parte de la última serie de LLM de Alibaba Cloud. El modelo de 14B ofrece mejoras notables en programación y matemáticas, admite más de 29 idiomas y mejora el seguimiento de instrucciones, la comprensión de datos estructurados y la generación de salidas estructuradas (especialmente en formato JSON).",
|
||
"Qwen/Qwen2.5-32B-Instruct.description": "Qwen2.5-32B-Instruct forma parte de la última serie de LLM de Alibaba Cloud. El modelo de 32B ofrece mejoras notables en programación y matemáticas, admite más de 29 idiomas y mejora el seguimiento de instrucciones, la comprensión de datos estructurados y la generación de salidas estructuradas (especialmente en formato JSON).",
|
||
"Qwen/Qwen2.5-72B-Instruct-128K.description": "Qwen2.5-72B-Instruct forma parte de la última serie de LLM de Alibaba Cloud. El modelo de 72B mejora la programación y las matemáticas, admite hasta 128K de entrada y más de 8K de salida, ofrece soporte para más de 29 idiomas y mejora el seguimiento de instrucciones y la salida estructurada (especialmente en formato JSON).",
|
||
"Qwen/Qwen2.5-72B-Instruct-Turbo.description": "Qwen2.5 es una nueva familia de LLM optimizada para tareas basadas en instrucciones.",
|
||
"Qwen/Qwen2.5-72B-Instruct.description": "Qwen2.5-72B-Instruct forma parte de la última serie de LLM de Alibaba Cloud. El modelo de 72B ofrece mejoras notables en programación y matemáticas, admite más de 29 idiomas y mejora el seguimiento de instrucciones, la comprensión de datos estructurados y la generación de salidas estructuradas (especialmente en formato JSON).",
|
||
"Qwen/Qwen2.5-7B-Instruct-Turbo.description": "Qwen2.5 es una nueva familia de LLM optimizada para tareas basadas en instrucciones.",
|
||
"Qwen/Qwen2.5-7B-Instruct.description": "Qwen2.5-7B-Instruct forma parte de la última serie de LLM de Alibaba Cloud. El modelo de 7B ofrece mejoras notables en programación y matemáticas, admite más de 29 idiomas y mejora el seguimiento de instrucciones, la comprensión de datos estructurados y la generación de salidas estructuradas (especialmente en formato JSON).",
|
||
"Qwen/Qwen2.5-Coder-32B-Instruct.description": "Qwen2.5 Coder 32B Instruct es el último LLM de Alibaba Cloud enfocado en programación. Basado en Qwen2.5 y entrenado con 5.5T tokens, mejora significativamente la generación, el razonamiento y la corrección de código, manteniendo fortalezas en matemáticas y capacidades generales, proporcionando una base sólida para agentes de programación.",
|
||
"Qwen/Qwen2.5-Coder-7B-Instruct.description": "Qwen2.5-Coder-7B-Instruct es el último LLM de Alibaba Cloud enfocado en programación. Basado en Qwen2.5 y entrenado con 5.5T tokens, mejora significativamente la generación, el razonamiento y la corrección de código, manteniendo fortalezas en matemáticas y capacidades generales, proporcionando una base sólida para agentes de programación.",
|
||
"Qwen/Qwen2.5-VL-32B-Instruct.description": "Qwen2.5-VL-32B-Instruct es un modelo multimodal del equipo Qwen. Reconoce objetos comunes y analiza texto, gráficos, íconos, imágenes y diseños. Como agente visual, puede razonar y controlar herramientas dinámicamente, incluyendo el uso de computadoras y teléfonos. Localiza objetos con precisión y genera salidas estructuradas para facturas y tablas. En comparación con Qwen2-VL, el aprendizaje por refuerzo mejora aún más las matemáticas y la resolución de problemas, con respuestas más preferidas por humanos.",
|
||
"Qwen/Qwen2.5-VL-72B-Instruct.description": "Qwen2.5-VL es el modelo de visión y lenguaje de la serie Qwen2.5 con importantes mejoras: mejor comprensión visual de objetos, texto, gráficos y diseños; razonamiento como agente visual con uso dinámico de herramientas; comprensión de videos de más de una hora y detección de eventos clave; localización precisa de objetos mediante cajas o puntos; y salidas estructuradas para datos escaneados como facturas y tablas.",
|
||
"Qwen/Qwen3-14B.description": "Qwen3 es un modelo Tongyi Qwen de nueva generación con grandes avances en razonamiento, capacidad general, habilidades de agente y rendimiento multilingüe, y permite cambiar entre modos de pensamiento.",
|
||
"Qwen/Qwen3-235B-A22B-Instruct-2507.description": "Qwen3-235B-A22B-Instruct-2507 es un modelo insignia MoE de Qwen3 con 235B parámetros totales y 22B activos. Es una versión sin modo de pensamiento centrada en mejorar el seguimiento de instrucciones, el razonamiento lógico, la comprensión de texto, matemáticas, ciencia, programación y uso de herramientas. También amplía el conocimiento multilingüe de nicho y se alinea mejor con las preferencias del usuario en tareas abiertas y subjetivas.",
|
||
"Qwen/Qwen3-235B-A22B-Thinking-2507.description": "Qwen3-235B-A22B-Thinking-2507 es un modelo Qwen3 centrado en razonamiento complejo. Utiliza una arquitectura MoE con 235B parámetros totales y ~22B activos por token para mejorar la eficiencia. Como modelo dedicado al pensamiento, muestra grandes avances en lógica, matemáticas, ciencia, programación y pruebas académicas, alcanzando un rendimiento de primer nivel en razonamiento abierto. También mejora el seguimiento de instrucciones, el uso de herramientas y la generación de texto, y admite de forma nativa un contexto de 256K para razonamiento profundo y documentos extensos.",
|
||
"Qwen/Qwen3-235B-A22B.description": "Qwen3 es un modelo Tongyi Qwen de nueva generación con grandes avances en razonamiento, capacidad general, habilidades de agente y rendimiento multilingüe, y permite cambiar entre modos de pensamiento.",
|
||
"Qwen/Qwen3-30B-A3B-Instruct-2507.description": "Qwen3-30B-A3B-Instruct-2507 es la versión sin modo de pensamiento actualizada de Qwen3-30B-A3B. Es un modelo MoE con 30.5B parámetros totales y 3.3B activos. Mejora significativamente el seguimiento de instrucciones, el razonamiento lógico, la comprensión de texto, matemáticas, ciencia, programación y uso de herramientas, amplía el conocimiento multilingüe de nicho y se alinea mejor con las preferencias del usuario en tareas abiertas y subjetivas. Admite contexto de 256K. Este modelo es solo sin pensamiento y no generará etiquetas `<think></think>`.",
|
||
"Qwen/Qwen3-30B-A3B-Thinking-2507.description": "Qwen3-30B-A3B-Thinking-2507 es el modelo de pensamiento más reciente de la serie Qwen3. Es un modelo MoE con 30.5B parámetros totales y 3.3B activos, centrado en tareas complejas. Muestra avances significativos en lógica, matemáticas, ciencia, programación y pruebas académicas, y mejora el seguimiento de instrucciones, el uso de herramientas, la generación de texto y la alineación con preferencias. Admite de forma nativa contexto de 256K y puede extenderse hasta 1M tokens. Esta versión está diseñada para el modo de pensamiento con razonamiento detallado paso a paso y sólidas capacidades de agente.",
|
||
"Qwen/Qwen3-30B-A3B.description": "Qwen3 es un modelo Tongyi Qwen de nueva generación con grandes avances en razonamiento, capacidad general, habilidades de agente y rendimiento multilingüe, y permite cambiar entre modos de pensamiento.",
|
||
"Qwen/Qwen3-32B.description": "Qwen3 es un modelo Tongyi Qwen de nueva generación con grandes avances en razonamiento, capacidad general, habilidades de agente y rendimiento multilingüe, y permite cambiar entre modos de pensamiento.",
|
||
"Qwen/Qwen3-8B.description": "Qwen3 es un modelo Tongyi Qwen de nueva generación con grandes avances en razonamiento, capacidad general, habilidades de agente y rendimiento multilingüe, y permite cambiar entre modos de pensamiento.",
|
||
"Qwen/Qwen3-Coder-30B-A3B-Instruct.description": "Qwen3-Coder-30B-A3B-Instruct es un modelo de código de la serie Qwen3. Está optimizado para alto rendimiento y eficiencia, mejorando las capacidades de programación. Muestra ventajas destacadas en codificación con agentes, operaciones automatizadas de navegador y uso de herramientas entre modelos abiertos. Admite de forma nativa contexto de 256K y puede extenderse hasta 1M tokens para comprensión a nivel de base de código. Impulsa la codificación con agentes en plataformas como Qwen Code y CLINE con un formato dedicado de llamadas a funciones.",
|
||
"Qwen/Qwen3-Coder-480B-A35B-Instruct.description": "Qwen3-Coder-480B-A35B-Instruct es el modelo de código más avanzado de Alibaba hasta la fecha. Es un modelo MoE con 480B parámetros totales y 35B activos, equilibrando eficiencia y rendimiento. Admite de forma nativa contexto de 256K y puede extenderse hasta 1M tokens mediante YaRN, lo que permite manejar grandes bases de código. Diseñado para flujos de trabajo de codificación con agentes, puede interactuar con herramientas y entornos para resolver tareas de programación complejas. Logra resultados líderes entre modelos abiertos en pruebas de codificación y agentes, comparable a modelos como Claude Sonnet 4.",
|
||
"Qwen/Qwen3-Next-80B-A3B-Instruct.description": "Qwen3-Next-80B-A3B-Instruct es un modelo base de próxima generación que utiliza la arquitectura Qwen3-Next para lograr una eficiencia extrema en entrenamiento e inferencia. Combina atención híbrida (Gated DeltaNet + Gated Attention), MoE altamente disperso y optimizaciones de estabilidad en el entrenamiento. Con 80 mil millones de parámetros totales pero solo ~3 mil millones activos durante la inferencia, reduce el cómputo y ofrece más de 10 veces el rendimiento de Qwen3-32B en contextos superiores a 32K. Esta versión ajustada para instrucciones está orientada a tareas generales (sin modo de pensamiento). Su rendimiento es comparable al de Qwen3-235B en algunos benchmarks y muestra claras ventajas en tareas de contexto ultra largo.",
|
||
"Qwen/Qwen3-Next-80B-A3B-Thinking.description": "Qwen3-Next-80B-A3B-Thinking es un modelo base de próxima generación diseñado para razonamiento complejo. Utiliza la arquitectura Qwen3-Next con atención híbrida (Gated DeltaNet + Gated Attention) y MoE altamente disperso para una eficiencia extrema en entrenamiento e inferencia. Con 80 mil millones de parámetros totales pero solo ~3 mil millones activos durante la inferencia, reduce el cómputo y ofrece más de 10 veces el rendimiento de Qwen3-32B en contextos superiores a 32K. Esta versión Thinking está orientada a tareas de múltiples pasos como demostraciones, síntesis de código, análisis lógico y planificación, generando cadenas de pensamiento estructuradas. Supera a Qwen3-32B-Thinking y vence a Gemini-2.5-Flash-Thinking en varios benchmarks.",
|
||
"Qwen/Qwen3-Omni-30B-A3B-Captioner.description": "Qwen3-Omni-30B-A3B-Captioner es un modelo VLM de la serie Qwen3 diseñado para generar descripciones de imágenes detalladas, precisas y de alta calidad. Utiliza una arquitectura MoE de 30 mil millones de parámetros para comprender profundamente las imágenes y producir descripciones fluidas, destacándose en la captura de detalles, comprensión de escenas, reconocimiento de objetos y razonamiento relacional.",
|
||
"Qwen/Qwen3-Omni-30B-A3B-Instruct.description": "Qwen3-Omni-30B-A3B-Instruct es un modelo MoE de la serie Qwen3 con 30 mil millones de parámetros totales y 3 mil millones activos, que ofrece un rendimiento sólido con menor costo de inferencia. Entrenado con datos multilingües de alta calidad y múltiples fuentes, admite entradas multimodales completas (texto, imágenes, audio, video) y comprensión y generación entre modalidades.",
|
||
"Qwen/Qwen3-Omni-30B-A3B-Thinking.description": "Qwen3-Omni-30B-A3B-Thinking es el componente central \"Thinker\" de Qwen3-Omni. Procesa entradas multimodales (texto, audio, imágenes, video) y realiza razonamiento complejo en cadena de pensamiento, unificando las entradas en una representación compartida para una comprensión profunda entre modalidades. Es un modelo MoE con 30 mil millones de parámetros totales y 3 mil millones activos, equilibrando razonamiento potente y eficiencia computacional.",
|
||
"Qwen/Qwen3-VL-235B-A22B-Instruct.description": "Qwen3-VL-235B-A22B-Instruct es un modelo Qwen3-VL de gran escala ajustado para instrucciones, basado en MoE, que ofrece una excelente comprensión y generación multimodal. Admite de forma nativa contextos de hasta 256K y es adecuado para servicios multimodales de producción con alta concurrencia.",
|
||
"Qwen/Qwen3-VL-235B-A22B-Thinking.description": "Qwen3-VL-235B-A22B-Thinking es la versión insignia de razonamiento de Qwen3-VL, optimizada para razonamiento multimodal complejo, razonamiento de contexto largo e interacción con agentes en escenarios empresariales.",
|
||
"Qwen/Qwen3-VL-30B-A3B-Instruct.description": "Qwen3-VL-30B-A3B-Instruct es el modelo Qwen3-VL ajustado para instrucciones con sólida comprensión y generación visión-lenguaje. Admite de forma nativa contextos de hasta 256K para chat multimodal y generación condicionada por imágenes.",
|
||
"Qwen/Qwen3-VL-30B-A3B-Thinking.description": "Qwen3-VL-30B-A3B-Thinking es la versión mejorada para razonamiento de Qwen3-VL, optimizada para razonamiento multimodal, conversión de imágenes a código y comprensión visual compleja. Admite contextos de hasta 256K con una capacidad de cadena de pensamiento más sólida.",
|
||
"Qwen/Qwen3-VL-32B-Instruct.description": "Qwen3-VL-32B-Instruct es un modelo visión-lenguaje del equipo Qwen con resultados SOTA líderes en múltiples benchmarks VL. Admite imágenes de resolución megapíxel y ofrece una sólida comprensión visual, OCR multilingüe, anclaje visual detallado y diálogo visual. Maneja tareas multimodales complejas y admite llamadas a herramientas y completado por prefijo.",
|
||
"Qwen/Qwen3-VL-32B-Thinking.description": "Qwen3-VL-32B-Thinking está optimizado para razonamiento visual complejo. Incluye un modo de pensamiento incorporado que genera pasos intermedios de razonamiento antes de las respuestas, mejorando la lógica de múltiples pasos, la planificación y el razonamiento complejo. Admite imágenes de megapíxeles, comprensión visual sólida, OCR multilingüe, anclaje detallado, diálogo visual, llamadas a herramientas y completado por prefijo.",
|
||
"Qwen/Qwen3-VL-8B-Instruct.description": "Qwen3-VL-8B-Instruct es un modelo visión-lenguaje Qwen3 basado en Qwen3-8B-Instruct y entrenado con grandes cantidades de datos imagen-texto. Destaca en comprensión visual general, diálogo centrado en visión y reconocimiento de texto multilingüe en imágenes, siendo adecuado para preguntas visuales, subtitulado, seguimiento de instrucciones multimodales y uso de herramientas.",
|
||
"Qwen/Qwen3-VL-8B-Thinking.description": "Qwen3-VL-8B-Thinking es la versión de pensamiento visual de Qwen3, optimizada para razonamiento complejo de múltiples pasos. Genera una cadena de pensamiento antes de las respuestas para mejorar la precisión, ideal para preguntas visuales profundas y análisis detallado de imágenes.",
|
||
"Qwen2-72B-Instruct.description": "Qwen2 es la última serie Qwen, compatible con una ventana de contexto de 128k. En comparación con los mejores modelos abiertos actuales, Qwen2-72B supera significativamente a los modelos líderes en comprensión del lenguaje natural, conocimiento, código, matemáticas y capacidades multilingües.",
|
||
"Qwen2-7B-Instruct.description": "Qwen2 es la última serie Qwen, que supera a los mejores modelos abiertos de tamaño similar e incluso a modelos más grandes. Qwen2 7B muestra ventajas significativas en múltiples benchmarks, especialmente en programación y comprensión del chino.",
|
||
"Qwen2-VL-72B.description": "Qwen2-VL-72B es un potente modelo visión-lenguaje que admite procesamiento multimodal imagen-texto, reconociendo con precisión el contenido de las imágenes y generando descripciones o respuestas relevantes.",
|
||
"Qwen2.5-14B-Instruct.description": "Qwen2.5-14B-Instruct es un LLM de 14 mil millones de parámetros con un rendimiento sólido, optimizado para escenarios en chino y multilingües, compatible con preguntas y respuestas inteligentes y generación de contenido.",
|
||
"Qwen2.5-32B-Instruct.description": "Qwen2.5-32B-Instruct es un LLM de 32 mil millones de parámetros con rendimiento equilibrado, optimizado para escenarios en chino y multilingües, compatible con preguntas y respuestas inteligentes y generación de contenido.",
|
||
"Qwen2.5-72B-Instruct.description": "LLM para chino e inglés, ajustado para lenguaje, programación, matemáticas y razonamiento.",
|
||
"Qwen2.5-7B-Instruct.description": "Qwen2.5-7B-Instruct es un LLM de 7 mil millones de parámetros que admite llamadas a funciones e integración fluida con sistemas externos, mejorando enormemente la flexibilidad y extensibilidad. Está optimizado para escenarios en chino y multilingües, compatible con preguntas y respuestas inteligentes y generación de contenido.",
|
||
"Qwen2.5-Coder-14B-Instruct.description": "Qwen2.5-Coder-14B-Instruct es un modelo de instrucciones de codificación preentrenado a gran escala con sólida comprensión y generación de código. Maneja eficientemente una amplia gama de tareas de programación, ideal para codificación inteligente, generación automática de scripts y preguntas y respuestas sobre programación.",
|
||
"Qwen2.5-Coder-32B-Instruct.description": "LLM avanzado para generación de código, razonamiento y corrección de errores en los principales lenguajes de programación.",
|
||
"Qwen3-235B-A22B-Instruct-2507-FP8.description": "Qwen3 235B A22B Instruct 2507 está optimizado para razonamiento avanzado y seguimiento de instrucciones, utilizando MoE para mantener la eficiencia del razonamiento a gran escala.",
|
||
"Qwen3-235B.description": "Qwen3-235B-A22B es un modelo MoE que introduce un modo de razonamiento híbrido, permitiendo a los usuarios cambiar sin problemas entre pensamiento y no pensamiento. Admite comprensión y razonamiento en 119 idiomas y dialectos, y tiene sólidas capacidades de llamada a herramientas, compitiendo con modelos como DeepSeek R1, OpenAI o1, o3-mini, Grok 3 y Google Gemini 2.5 Pro en benchmarks de capacidad general, código y matemáticas, capacidad multilingüe y razonamiento de conocimiento.",
|
||
"Qwen3-32B.description": "Qwen3-32B es un modelo denso que introduce un modo de razonamiento híbrido, permitiendo a los usuarios cambiar entre pensamiento y no pensamiento. Con mejoras en la arquitectura, más datos y mejor entrenamiento, su rendimiento es comparable al de Qwen2.5-72B.",
|
||
"SenseChat-128K.description": "Base V4 con contexto de 128K, excelente en comprensión y generación de textos largos.",
|
||
"SenseChat-32K.description": "Base V4 con contexto de 32K, flexible para múltiples escenarios.",
|
||
"SenseChat-5-1202.description": "Versión más reciente basada en V5.5, con mejoras significativas en fundamentos de chino/inglés, conversación, conocimientos STEM, humanidades, redacción, matemáticas/lógica y control de longitud.",
|
||
"SenseChat-5-Cantonese.description": "Diseñado para los hábitos de conversación, jerga y conocimientos locales de Hong Kong; supera a GPT-4 en comprensión del cantonés y rivaliza con GPT-4 Turbo en conocimientos, razonamiento, matemáticas y programación.",
|
||
"SenseChat-5-beta.description": "En algunos aspectos, su rendimiento supera al de SenseChat-5-1202.",
|
||
"SenseChat-5.description": "Última versión V5.5 con contexto de 128K; grandes avances en razonamiento matemático, conversación en inglés, seguimiento de instrucciones y comprensión de textos largos, comparable a GPT-4o.",
|
||
"SenseChat-Character-Pro.description": "Modelo avanzado de conversación con personajes, con contexto de 32K, mayor capacidad y soporte en chino/inglés.",
|
||
"SenseChat-Character.description": "Modelo estándar de conversación con personajes, con contexto de 8K y alta velocidad de respuesta.",
|
||
"SenseChat-Turbo-1202.description": "Último modelo liviano que alcanza más del 90% de la capacidad del modelo completo con un costo de inferencia significativamente menor.",
|
||
"SenseChat-Turbo.description": "Adecuado para preguntas y respuestas rápidas y escenarios de ajuste fino del modelo.",
|
||
"SenseChat-Vision.description": "Última versión V5.5 con entrada de múltiples imágenes y amplias mejoras en reconocimiento de atributos, relaciones espaciales, detección de acciones/eventos, comprensión de escenas, reconocimiento de emociones, razonamiento de sentido común y comprensión/generación de texto.",
|
||
"SenseChat.description": "Base V4 con contexto de 4K y gran capacidad general.",
|
||
"SenseNova-V6-5-Pro.description": "Con actualizaciones integrales en datos multimodales, lingüísticos y de razonamiento, además de optimización de estrategias de entrenamiento, el nuevo modelo mejora significativamente el razonamiento multimodal y el seguimiento de instrucciones generalizadas, admite hasta 128K de contexto y destaca en tareas de OCR y reconocimiento de IP de turismo cultural.",
|
||
"SenseNova-V6-5-Turbo.description": "Con actualizaciones integrales en datos multimodales, lingüísticos y de razonamiento, además de optimización de estrategias de entrenamiento, el nuevo modelo mejora significativamente el razonamiento multimodal y el seguimiento de instrucciones generalizadas, admite hasta 128K de contexto y destaca en tareas de OCR y reconocimiento de IP de turismo cultural.",
|
||
"SenseNova-V6-Pro.description": "Unifica de forma nativa imagen, texto y video, rompiendo los silos multimodales tradicionales; lidera en OpenCompass y SuperCLUE.",
|
||
"SenseNova-V6-Reasoner.description": "Combina visión y lenguaje con razonamiento profundo, compatible con pensamiento lento y cadena completa de razonamiento.",
|
||
"SenseNova-V6-Turbo.description": "Unifica de forma nativa imagen, texto y video, rompiendo los silos multimodales tradicionales. Lidera en capacidades lingüísticas y multimodales clave, y se ubica en el nivel superior en múltiples evaluaciones.",
|
||
"Skylark2-lite-8k.description": "Modelo Skylark de segunda generación. Skylark2-lite ofrece respuestas rápidas para escenarios en tiempo real y sensibles al costo, con menores requisitos de precisión y una ventana de contexto de 8K.",
|
||
"Skylark2-pro-32k.description": "Modelo Skylark de segunda generación. Skylark2-pro ofrece mayor precisión para generación de texto compleja como redacción profesional, escritura de novelas y traducción de alta calidad, con una ventana de contexto de 32K.",
|
||
"Skylark2-pro-4k.description": "Modelo Skylark de segunda generación. Skylark2-pro ofrece mayor precisión para generación de texto compleja como redacción profesional, escritura de novelas y traducción de alta calidad, con una ventana de contexto de 4K.",
|
||
"Skylark2-pro-character-4k.description": "Modelo Skylark de segunda generación. Skylark2-pro-character destaca en juegos de rol y conversación, adaptando los mensajes a estilos de personajes distintivos y diálogos naturales para chatbots, asistentes virtuales y atención al cliente, con respuestas rápidas.",
|
||
"Skylark2-pro-turbo-8k.description": "Modelo Skylark de segunda generación. Skylark2-pro-turbo-8k ofrece inferencia más rápida a menor costo con una ventana de contexto de 8K.",
|
||
"THUDM/GLM-4-32B-0414.description": "GLM-4-32B-0414 es un modelo GLM de próxima generación con 32 mil millones de parámetros, comparable en rendimiento a OpenAI GPT y la serie DeepSeek V3/R1.",
|
||
"THUDM/GLM-4-9B-0414.description": "GLM-4-9B-0414 es un modelo GLM de 9 mil millones de parámetros que hereda las técnicas de GLM-4-32B, ofreciendo una implementación más ligera. Tiene buen rendimiento en generación de código, diseño web, generación de SVG y redacción basada en búsqueda.",
|
||
"THUDM/GLM-4.1V-9B-Thinking.description": "GLM-4.1V-9B-Thinking es un modelo VLM de código abierto de Zhipu AI y el Laboratorio KEG de Tsinghua, diseñado para cognición multimodal compleja. Basado en GLM-4-9B-0414, añade razonamiento en cadena y aprendizaje por refuerzo para mejorar significativamente el razonamiento entre modalidades y la estabilidad.",
|
||
"THUDM/GLM-Z1-32B-0414.description": "GLM-Z1-32B-0414 es un modelo de razonamiento profundo construido a partir de GLM-4-32B-0414 con datos de arranque en frío y aprendizaje por refuerzo ampliado, entrenado adicionalmente en matemáticas, código y lógica. Mejora significativamente la capacidad matemática y la resolución de tareas complejas respecto al modelo base.",
|
||
"THUDM/GLM-Z1-9B-0414.description": "GLM-Z1-9B-0414 es un modelo GLM pequeño de 9 mil millones de parámetros que conserva las fortalezas del código abierto y ofrece una capacidad impresionante. Tiene un rendimiento destacado en razonamiento matemático y tareas generales, liderando su clase de tamaño entre los modelos abiertos.",
|
||
"THUDM/GLM-Z1-Rumination-32B-0414.description": "GLM-Z1-Rumination-32B-0414 es un modelo de razonamiento profundo con capacidades de reflexión (comparado con OpenAI Deep Research). A diferencia de los modelos de pensamiento profundo típicos, dedica más tiempo a deliberar para resolver problemas abiertos y complejos.",
|
||
"THUDM/glm-4-9b-chat.description": "GLM-4-9B-Chat es el modelo GLM-4 de código abierto de Zhipu AI. Tiene un rendimiento sólido en semántica, matemáticas, razonamiento, código y conocimiento. Además de conversación multivuelta, admite navegación web, ejecución de código, llamadas a herramientas personalizadas y razonamiento de textos largos. Soporta 26 idiomas (incluidos chino, inglés, japonés, coreano y alemán). Tiene buen rendimiento en AlignBench-v2, MT-Bench, MMLU y C-Eval, y admite hasta 128K de contexto para uso académico y empresarial.",
|
||
"Tongyi-Zhiwen/QwenLong-L1-32B.description": "QwenLong-L1-32B es el primer modelo de razonamiento de contexto largo (LRM) entrenado con aprendizaje por refuerzo, optimizado para razonamiento en textos extensos. Su RL de expansión progresiva de contexto permite una transferencia estable de contexto corto a largo. Supera a OpenAI-o3-mini y Qwen3-235B-A22B en siete benchmarks de preguntas y respuestas con documentos de contexto largo, rivalizando con Claude-3.7-Sonnet-Thinking. Es especialmente fuerte en matemáticas, lógica y razonamiento de múltiples pasos.",
|
||
"Yi-34B-Chat.description": "Yi-1.5-34B mantiene las sólidas capacidades lingüísticas generales de la serie, mientras que el entrenamiento incremental con 500 mil millones de tokens de alta calidad mejora significativamente la lógica matemática y la programación.",
|
||
"abab5.5-chat.description": "Diseñado para escenarios de productividad con manejo de tareas complejas y generación eficiente de texto para uso profesional.",
|
||
"abab5.5s-chat.description": "Diseñado para conversación con personajes en chino, ofreciendo diálogos de alta calidad en chino para diversas aplicaciones.",
|
||
"abab6.5g-chat.description": "Diseñado para conversación con personajes multilingües, compatible con generación de diálogos de alta calidad en inglés y otros idiomas.",
|
||
"abab6.5s-chat.description": "Adecuado para una amplia gama de tareas de PLN, incluida la generación de texto y sistemas de diálogo.",
|
||
"abab6.5t-chat.description": "Optimizado para conversación con personajes en chino, proporcionando diálogos fluidos que se ajustan a los hábitos de expresión en chino.",
|
||
"accounts/fireworks/models/deepseek-r1.description": "DeepSeek-R1 es un modelo de lenguaje de última generación optimizado con aprendizaje por refuerzo y datos de arranque en frío, que ofrece un rendimiento sobresaliente en razonamiento, matemáticas y programación.",
|
||
"accounts/fireworks/models/deepseek-v3.description": "Un potente modelo de lenguaje Mixture-of-Experts (MoE) de DeepSeek con 671 mil millones de parámetros totales y 37 mil millones de parámetros activos por token.",
|
||
"accounts/fireworks/models/llama-v3-70b-instruct.description": "Meta desarrolló y lanzó la serie de modelos LLM Meta Llama 3, que incluye modelos de generación de texto preentrenados y ajustados por instrucciones en tamaños de 8B y 70B. Los modelos Llama 3 ajustados por instrucciones están optimizados para uso conversacional y superan a muchos modelos de chat abiertos existentes en los principales estándares de la industria.",
|
||
"accounts/fireworks/models/llama-v3-8b-instruct-hf.description": "Los modelos Llama 3 de Meta ajustados por instrucciones están optimizados para uso conversacional y superan a muchos modelos de chat abiertos existentes en los principales estándares de la industria. Llama 3 8B Instruct (versión HF) es la versión original en FP16 de Llama 3 8B Instruct, con resultados esperados que coinciden con la implementación oficial de Hugging Face.",
|
||
"accounts/fireworks/models/llama-v3-8b-instruct.description": "Meta desarrolló y lanzó la serie de modelos LLM Meta Llama 3, una colección de modelos de generación de texto preentrenados y ajustados por instrucciones en tamaños de 8B y 70B. Los modelos Llama 3 ajustados por instrucciones están optimizados para uso conversacional y superan a muchos modelos de chat abiertos existentes en los principales estándares de la industria.",
|
||
"accounts/fireworks/models/llama-v3p1-405b-instruct.description": "Meta Llama 3.1 es una familia de modelos LLM multilingües con modelos de generación preentrenados y ajustados por instrucciones en tamaños de 8B, 70B y 405B. Los modelos de texto ajustados por instrucciones están optimizados para diálogos multilingües y superan a muchos modelos de chat abiertos y cerrados en los principales estándares de la industria. El modelo de 405B es el más potente de la familia Llama 3.1, utilizando inferencia FP8 que se aproxima estrechamente a la implementación de referencia.",
|
||
"accounts/fireworks/models/llama-v3p1-70b-instruct.description": "Meta Llama 3.1 es una familia de modelos LLM multilingües con modelos de generación preentrenados y ajustados por instrucciones en tamaños de 8B, 70B y 405B. Los modelos de texto ajustados por instrucciones están optimizados para diálogos multilingües y superan a muchos modelos de chat abiertos y cerrados en los principales estándares de la industria.",
|
||
"accounts/fireworks/models/llama-v3p1-8b-instruct.description": "Meta Llama 3.1 es una familia de modelos LLM multilingües con modelos de generación preentrenados y ajustados por instrucciones en tamaños de 8B, 70B y 405B. Los modelos de texto ajustados por instrucciones están optimizados para diálogos multilingües y superan a muchos modelos de chat abiertos y cerrados en los principales estándares de la industria.",
|
||
"accounts/fireworks/models/llama-v3p2-11b-vision-instruct.description": "Un modelo de razonamiento visual ajustado por instrucciones de Meta con 11 mil millones de parámetros, optimizado para reconocimiento visual, razonamiento sobre imágenes, generación de descripciones y preguntas y respuestas relacionadas con imágenes. Comprende datos visuales como gráficos y diagramas, y conecta visión y lenguaje generando descripciones textuales de los detalles de las imágenes.",
|
||
"accounts/fireworks/models/llama-v3p2-3b-instruct.description": "Llama 3.2 3B Instruct es un modelo multilingüe ligero de Meta, diseñado para una ejecución eficiente con ventajas significativas en latencia y costo frente a modelos más grandes. Los casos de uso típicos incluyen reescritura de consultas/prompts y asistencia en redacción.",
|
||
"accounts/fireworks/models/llama-v3p2-90b-vision-instruct.description": "Un modelo de razonamiento visual ajustado por instrucciones de Meta con 90 mil millones de parámetros, optimizado para reconocimiento visual, razonamiento sobre imágenes, generación de descripciones y preguntas y respuestas relacionadas con imágenes. Comprende datos visuales como gráficos y diagramas, y conecta visión y lenguaje generando descripciones textuales de los detalles de las imágenes. Nota: este modelo se ofrece actualmente de forma experimental como modelo sin servidor. Para uso en producción, tenga en cuenta que Fireworks podría retirar su despliegue sin previo aviso.",
|
||
"accounts/fireworks/models/llama-v3p3-70b-instruct.description": "Llama 3.3 70B Instruct es la actualización de diciembre del modelo Llama 3.1 70B. Mejora el uso de herramientas, el soporte multilingüe, las matemáticas y la programación respecto a la versión de julio de 2024. Alcanza un rendimiento líder en la industria en razonamiento, matemáticas y seguimiento de instrucciones, ofreciendo un rendimiento comparable al modelo 3.1 405B con ventajas significativas en velocidad y costo.",
|
||
"accounts/fireworks/models/mistral-small-24b-instruct-2501.description": "Un modelo de 24 mil millones de parámetros con capacidades de vanguardia comparables a modelos más grandes.",
|
||
"accounts/fireworks/models/mixtral-8x22b-instruct.description": "Mixtral MoE 8x22B Instruct v0.1 es la versión ajustada por instrucciones de Mixtral MoE 8x22B v0.1, con la API de finalización de chat habilitada.",
|
||
"accounts/fireworks/models/mixtral-8x7b-instruct.description": "Mixtral MoE 8x7B Instruct es la versión ajustada por instrucciones de Mixtral MoE 8x7B, con la API de finalización de chat habilitada.",
|
||
"accounts/fireworks/models/mythomax-l2-13b.description": "Una variante mejorada de MythoMix, posiblemente su forma más refinada, que fusiona MythoLogic-L2 y Huginn mediante una técnica de fusión de tensores altamente experimental. Su naturaleza única lo hace excelente para narración y juegos de rol.",
|
||
"accounts/fireworks/models/phi-3-vision-128k-instruct.description": "Phi-3-Vision-128K-Instruct es un modelo multimodal ligero y de última generación construido a partir de datos sintéticos y conjuntos de datos públicos seleccionados, centrado en datos de texto y visión de alta calidad y con gran carga de razonamiento. Pertenece a la familia Phi-3, con una versión multimodal que admite una longitud de contexto de 128K (en tokens). El modelo se somete a mejoras rigurosas, incluyendo ajuste supervisado y optimización directa de preferencias, para garantizar un seguimiento preciso de instrucciones y sólidas medidas de seguridad.",
|
||
"accounts/fireworks/models/qwen-qwq-32b-preview.description": "El modelo Qwen QwQ se centra en avanzar en el razonamiento de IA, demostrando que los modelos abiertos pueden rivalizar con los modelos cerrados de vanguardia en razonamiento. QwQ-32B-Preview es una versión experimental que iguala a o1 y supera a GPT-4o y Claude 3.5 Sonnet en razonamiento y análisis en GPQA, AIME, MATH-500 y LiveCodeBench. Nota: este modelo se ofrece actualmente de forma experimental como modelo sin servidor. Para uso en producción, tenga en cuenta que Fireworks podría retirar su despliegue sin previo aviso.",
|
||
"accounts/fireworks/models/qwen2-vl-72b-instruct.description": "El modelo Qwen-VL de 72B es la última iteración de Alibaba, reflejando casi un año de innovación.",
|
||
"accounts/fireworks/models/qwen2p5-72b-instruct.description": "Qwen2.5 es una serie de modelos LLM solo decodificadores desarrollada por el equipo de Qwen y Alibaba Cloud, que ofrece tamaños de 0.5B, 1.5B, 3B, 7B, 14B, 32B y 72B, con variantes base y ajustadas por instrucciones.",
|
||
"accounts/fireworks/models/qwen2p5-coder-32b-instruct.description": "Qwen2.5-Coder es el modelo LLM más reciente de Qwen diseñado para programación (anteriormente CodeQwen). Nota: este modelo se ofrece actualmente de forma experimental como modelo sin servidor. Para uso en producción, tenga en cuenta que Fireworks podría retirar su despliegue sin previo aviso.",
|
||
"accounts/yi-01-ai/models/yi-large.description": "Yi-Large es un modelo LLM de primer nivel que se sitúa justo por debajo de GPT-4, Gemini 1.5 Pro y Claude 3 Opus en el ranking de LMSYS. Destaca por su capacidad multilingüe, especialmente en español, chino, japonés, alemán y francés. Yi-Large también es amigable para desarrolladores, utilizando el mismo esquema de API que OpenAI para facilitar la integración.",
|
||
"ai21-jamba-1.5-large.description": "Un modelo multilingüe de 398 mil millones de parámetros (94B activos) con una ventana de contexto de 256K, llamadas a funciones, salida estructurada y generación fundamentada.",
|
||
"ai21-jamba-1.5-mini.description": "Un modelo multilingüe de 52 mil millones de parámetros (12B activos) con una ventana de contexto de 256K, llamadas a funciones, salida estructurada y generación fundamentada.",
|
||
"ai21-labs/AI21-Jamba-1.5-Large.description": "Un modelo multilingüe de 398 mil millones de parámetros (94B activos) con una ventana de contexto de 256K, llamadas a funciones, salida estructurada y generación fundamentada.",
|
||
"ai21-labs/AI21-Jamba-1.5-Mini.description": "Un modelo multilingüe de 52 mil millones de parámetros (12B activos) con una ventana de contexto de 256K, llamadas a funciones, salida estructurada y generación fundamentada.",
|
||
"alibaba/qwen-3-14b.description": "Qwen3 es la última generación de la serie Qwen, que ofrece un conjunto completo de modelos densos y MoE. Basado en un entrenamiento exhaustivo, aporta avances en razonamiento, seguimiento de instrucciones, capacidades de agente y soporte multilingüe.",
|
||
"alibaba/qwen-3-235b.description": "Qwen3 es la última generación de la serie Qwen, que ofrece un conjunto completo de modelos densos y MoE. Basado en un entrenamiento exhaustivo, aporta avances en razonamiento, seguimiento de instrucciones, capacidades de agente y soporte multilingüe.",
|
||
"alibaba/qwen-3-30b.description": "Qwen3 es la última generación de la serie Qwen, que ofrece un conjunto completo de modelos densos y MoE. Basado en un entrenamiento exhaustivo, aporta avances en razonamiento, seguimiento de instrucciones, capacidades de agente y soporte multilingüe.",
|
||
"alibaba/qwen-3-32b.description": "Qwen3 es la última generación de la serie Qwen, que ofrece un conjunto completo de modelos densos y MoE. Basado en un entrenamiento exhaustivo, aporta avances en razonamiento, seguimiento de instrucciones, capacidades de agente y soporte multilingüe.",
|
||
"alibaba/qwen3-coder.description": "Qwen3-Coder-480B-A35B-Instruct es el modelo de código más agente de Qwen, con un rendimiento destacado en codificación autónoma, uso de navegador por agentes y otras tareas clave de programación, alcanzando resultados comparables al nivel de Claude Sonnet.",
|
||
"amazon/nova-lite.description": "Un modelo multimodal de muy bajo costo con procesamiento extremadamente rápido de entradas de imagen, video y texto.",
|
||
"amazon/nova-micro.description": "Un modelo solo de texto que ofrece una latencia ultra baja a un costo muy reducido.",
|
||
"amazon/nova-pro.description": "Un modelo multimodal altamente capaz con el mejor equilibrio entre precisión, velocidad y costo para una amplia gama de tareas.",
|
||
"amazon/titan-embed-text-v2.description": "Amazon Titan Text Embeddings V2 es un modelo de incrustación multilingüe ligero y eficiente que admite dimensiones de 1024, 512 y 256.",
|
||
"anthropic.claude-3-5-sonnet-20240620-v1:0.description": "Claude 3.5 Sonnet eleva el estándar de la industria, superando a sus competidores y a Claude 3 Opus en evaluaciones amplias, manteniendo velocidad y costo de nivel medio.",
|
||
"anthropic.claude-3-5-sonnet-20241022-v2:0.description": "Claude 3.5 Sonnet eleva el estándar de la industria, superando a sus competidores y a Claude 3 Opus en evaluaciones amplias, manteniendo velocidad y costo de nivel medio.",
|
||
"anthropic.claude-3-haiku-20240307-v1:0.description": "Claude 3 Haiku es el modelo más rápido y compacto de Anthropic, que ofrece respuestas casi instantáneas para consultas simples. Permite experiencias de IA fluidas y naturales, y admite entrada de imágenes con una ventana de contexto de 200K.",
|
||
"anthropic.claude-3-opus-20240229-v1:0.description": "Claude 3 Opus es el modelo de IA más potente de Anthropic, con un rendimiento de vanguardia en tareas altamente complejas. Maneja indicaciones abiertas y escenarios novedosos con fluidez excepcional y comprensión similar a la humana, y admite entrada de imágenes con una ventana de contexto de 200K.",
|
||
"anthropic.claude-3-sonnet-20240229-v1:0.description": "Claude 3 Sonnet equilibra inteligencia y velocidad para cargas de trabajo empresariales, ofreciendo un alto valor a menor costo. Está diseñado como un modelo confiable para implementaciones de IA a gran escala y admite entrada de imágenes con una ventana de contexto de 200K.",
|
||
"anthropic.claude-instant-v1.description": "Un modelo rápido, económico y capaz para chat diario, análisis de texto, resúmenes y preguntas sobre documentos.",
|
||
"anthropic.claude-v2.description": "Un modelo altamente competente en tareas que van desde diálogos complejos y generación creativa hasta el seguimiento detallado de instrucciones.",
|
||
"anthropic.claude-v2:1.description": "Una versión actualizada de Claude 2 con el doble de ventana de contexto y mejoras en fiabilidad, reducción de alucinaciones y precisión basada en evidencia para documentos largos y RAG.",
|
||
"anthropic/claude-3-haiku.description": "Claude 3 Haiku es el modelo más rápido de Anthropic, diseñado para cargas de trabajo empresariales con indicaciones extensas. Puede analizar rápidamente documentos grandes como informes trimestrales, contratos o casos legales a la mitad del costo de sus pares.",
|
||
"anthropic/claude-3-opus.description": "Claude 3 Opus es el modelo más inteligente de Anthropic, con un rendimiento líder en el mercado en tareas altamente complejas, manejando indicaciones abiertas y escenarios novedosos con fluidez excepcional y comprensión similar a la humana.",
|
||
"anthropic/claude-3.5-haiku.description": "Claude 3.5 Haiku ofrece mayor velocidad, precisión en programación y uso de herramientas, adecuado para escenarios con altos requerimientos de velocidad e interacción con herramientas.",
|
||
"anthropic/claude-3.5-sonnet.description": "Claude 3.5 Sonnet es el modelo rápido y eficiente de la familia Sonnet, con mejor rendimiento en programación y razonamiento, con algunas versiones reemplazadas gradualmente por Sonnet 3.7 y posteriores.",
|
||
"anthropic/claude-3.7-sonnet.description": "Claude 3.7 Sonnet es una versión mejorada del modelo Sonnet con mayor capacidad de razonamiento y programación, adecuado para tareas empresariales complejas.",
|
||
"anthropic/claude-haiku-4.5.description": "Claude Haiku 4.5 es el modelo rápido de alto rendimiento de Anthropic, con latencia muy baja y alta precisión.",
|
||
"anthropic/claude-opus-4.1.description": "Opus 4.1 es el modelo de gama alta de Anthropic, optimizado para programación, razonamiento complejo y tareas de larga duración.",
|
||
"anthropic/claude-opus-4.5.description": "Claude Opus 4.5 es el modelo insignia de Anthropic, que combina inteligencia de primer nivel con rendimiento escalable para tareas complejas de razonamiento de alta calidad.",
|
||
"anthropic/claude-opus-4.description": "Opus 4 es el modelo insignia de Anthropic, diseñado para tareas complejas y aplicaciones empresariales.",
|
||
"anthropic/claude-sonnet-4.5.description": "Claude Sonnet 4.5 es el último modelo híbrido de razonamiento de Anthropic, optimizado para razonamiento complejo y programación.",
|
||
"anthropic/claude-sonnet-4.description": "Claude Sonnet 4 es el modelo híbrido de razonamiento de Anthropic con capacidad de pensamiento mixto y no pensante.",
|
||
"ascend-tribe/pangu-pro-moe.description": "Pangu-Pro-MoE 72B-A16B es un LLM disperso con 72B parámetros totales y 16B activos, basado en una arquitectura MoE agrupada (MoGE). Agrupa expertos durante la selección y restringe los tokens para activar expertos iguales por grupo, equilibrando la carga y mejorando la eficiencia de implementación en Ascend.",
|
||
"aya.description": "Aya 23 es el modelo multilingüe de Cohere que admite 23 idiomas para diversos casos de uso.",
|
||
"aya:35b.description": "Aya 23 es el modelo multilingüe de Cohere que admite 23 idiomas para diversos casos de uso.",
|
||
"azure-DeepSeek-R1-0528.description": "Desplegado por Microsoft; DeepSeek R1 ha sido actualizado a DeepSeek-R1-0528. La actualización mejora el cómputo y las optimizaciones del algoritmo de postentrenamiento, mejorando significativamente la profundidad de razonamiento y la inferencia. Tiene un rendimiento destacado en matemáticas, programación y lógica general, acercándose a modelos líderes como O3 y Gemini 2.5 Pro.",
|
||
"baichuan-m2-32b.description": "Baichuan M2 32B es un modelo MoE de Baichuan Intelligence con gran capacidad de razonamiento.",
|
||
"baichuan/baichuan2-13b-chat.description": "Baichuan-13B es un modelo LLM de código abierto y uso comercial con 13 mil millones de parámetros de Baichuan, que logra resultados líderes en su clase en pruebas de referencia autorizadas en chino e inglés.",
|
||
"baidu/ERNIE-4.5-300B-A47B.description": "ERNIE-4.5-300B-A47B es un modelo LLM MoE de Baidu con 300 mil millones de parámetros totales y 47 mil millones activos por token, equilibrando un alto rendimiento con eficiencia computacional. Como modelo central de ERNIE 4.5, destaca en comprensión, generación, razonamiento y programación. Utiliza un método de preentrenamiento multimodal heterogéneo MoE con entrenamiento conjunto texto-visión para mejorar su capacidad general, especialmente en seguimiento de instrucciones y conocimiento del mundo.",
|
||
"baidu/ernie-5.0-thinking-preview.description": "Vista previa de ERNIE 5.0 Thinking, el modelo ERNIE multimodal nativo de próxima generación de Baidu, con gran capacidad en comprensión multimodal, seguimiento de instrucciones, creación, preguntas y respuestas basadas en hechos y uso de herramientas.",
|
||
"black-forest-labs/flux-1.1-pro.description": "FLUX 1.1 Pro es una versión más rápida y mejorada de FLUX Pro, con excelente calidad de imagen y fidelidad a las instrucciones.",
|
||
"black-forest-labs/flux-dev.description": "FLUX Dev es la versión de desarrollo de FLUX para uso no comercial.",
|
||
"black-forest-labs/flux-pro.description": "FLUX Pro es el modelo profesional de FLUX para generación de imágenes de alta calidad.",
|
||
"black-forest-labs/flux-schnell.description": "FLUX Schnell es un modelo de generación de imágenes optimizado para velocidad.",
|
||
"c4ai-aya-expanse-32b.description": "Aya Expanse es un modelo multilingüe de alto rendimiento con 32 mil millones de parámetros que utiliza ajuste por instrucciones, arbitraje de datos, entrenamiento por preferencias y fusión de modelos para competir con modelos monolingües. Soporta 23 idiomas.",
|
||
"c4ai-aya-expanse-8b.description": "Aya Expanse es un modelo multilingüe de alto rendimiento con 8 mil millones de parámetros que utiliza ajuste por instrucciones, arbitraje de datos, entrenamiento por preferencias y fusión de modelos para competir con modelos monolingües. Soporta 23 idiomas.",
|
||
"c4ai-aya-vision-32b.description": "Aya Vision es un modelo multimodal de última generación con excelente rendimiento en pruebas clave de lenguaje, texto y visión. Soporta 23 idiomas. Esta versión de 32 mil millones se enfoca en un rendimiento multilingüe de primer nivel.",
|
||
"c4ai-aya-vision-8b.description": "Aya Vision es un modelo multimodal de última generación con excelente rendimiento en pruebas clave de lenguaje, texto y visión. Esta versión de 8 mil millones se enfoca en baja latencia y alto rendimiento.",
|
||
"charglm-3.description": "CharGLM-3 está diseñado para juegos de rol y compañía emocional, con soporte para memoria de múltiples turnos ultra larga y diálogo personalizado.",
|
||
"charglm-4.description": "CharGLM-4 está diseñado para juegos de rol y compañía emocional, con soporte para memoria de múltiples turnos ultra larga y diálogo personalizado.",
|
||
"chatgpt-4o-latest.description": "ChatGPT-4o es un modelo dinámico actualizado en tiempo real, que combina gran capacidad de comprensión y generación para casos de uso a gran escala como atención al cliente, educación y soporte técnico.",
|
||
"claude-2.0.description": "Claude 2 ofrece mejoras clave para empresas, incluyendo un contexto líder de 200 mil tokens, reducción de alucinaciones, indicaciones del sistema y una nueva función de prueba: uso de herramientas.",
|
||
"claude-2.1.description": "Claude 2 ofrece mejoras clave para empresas, incluyendo un contexto líder de 200 mil tokens, reducción de alucinaciones, indicaciones del sistema y una nueva función de prueba: uso de herramientas.",
|
||
"claude-3-5-haiku-20241022.description": "Claude 3.5 Haiku es el modelo de próxima generación más rápido de Anthropic. En comparación con Claude 3 Haiku, mejora en múltiples habilidades y supera al anterior modelo más grande, Claude 3 Opus, en muchos indicadores de inteligencia.",
|
||
"claude-3-5-haiku-latest.description": "Claude 3.5 Haiku ofrece respuestas rápidas para tareas ligeras.",
|
||
"claude-3-7-sonnet-20250219.description": "Claude 3.7 Sonnet es el modelo más inteligente de Anthropic y el primer modelo de razonamiento híbrido del mercado. Puede generar respuestas casi instantáneas o razonamientos paso a paso visibles para el usuario. Sonnet destaca especialmente en programación, ciencia de datos, visión y tareas de agentes.",
|
||
"claude-3-7-sonnet-latest.description": "Claude 3.7 Sonnet es el modelo más reciente y potente de Anthropic para tareas altamente complejas, destacando en rendimiento, inteligencia, fluidez y comprensión.",
|
||
"claude-3-haiku-20240307.description": "Claude 3 Haiku es el modelo más rápido y compacto de Anthropic, diseñado para respuestas casi instantáneas con rendimiento rápido y preciso.",
|
||
"claude-3-opus-20240229.description": "Claude 3 Opus es el modelo más potente de Anthropic para tareas altamente complejas, destacando en rendimiento, inteligencia, fluidez y comprensión.",
|
||
"claude-3-sonnet-20240229.description": "Claude 3 Sonnet equilibra inteligencia y velocidad para cargas de trabajo empresariales, ofreciendo alta utilidad a menor costo y despliegue confiable a gran escala.",
|
||
"claude-haiku-4-5-20251001.description": "Claude Haiku 4.5 es el modelo Haiku más rápido e inteligente de Anthropic, con velocidad relámpago y razonamiento extendido.",
|
||
"claude-opus-4-1-20250805-thinking.description": "Claude Opus 4.1 Thinking es una variante avanzada que puede mostrar su proceso de razonamiento.",
|
||
"claude-opus-4-1-20250805.description": "Claude Opus 4.1 es el modelo más reciente y potente de Anthropic para tareas altamente complejas, destacando en rendimiento, inteligencia, fluidez y comprensión.",
|
||
"claude-opus-4-20250514.description": "Claude Opus 4 es el modelo más potente de Anthropic para tareas altamente complejas, sobresaliendo en rendimiento, inteligencia, fluidez y comprensión.",
|
||
"claude-opus-4-5-20251101.description": "Claude Opus 4.5 es el modelo insignia de Anthropic, combinando inteligencia excepcional con rendimiento escalable, ideal para tareas complejas que requieren respuestas y razonamiento de la más alta calidad.",
|
||
"claude-sonnet-4-20250514-thinking.description": "Claude Sonnet 4 Thinking puede generar respuestas casi instantáneas o pensamiento paso a paso extendido con proceso visible.",
|
||
"claude-sonnet-4-20250514.description": "Claude Sonnet 4 puede generar respuestas casi instantáneas o razonamientos detallados paso a paso con un proceso visible.",
|
||
"claude-sonnet-4-5-20250929.description": "Claude Sonnet 4.5 es el modelo más inteligente de Anthropic hasta la fecha.",
|
||
"codegeex-4.description": "CodeGeeX-4 es un potente asistente de codificación con soporte multilingüe para preguntas y respuestas y autocompletado de código, mejorando la productividad de los desarrolladores.",
|
||
"codegeex4-all-9b.description": "CodeGeeX4-ALL-9B es un modelo multilingüe de generación de código que admite autocompletado y generación de código, interpretación de código, búsqueda web, llamadas a funciones y preguntas y respuestas a nivel de repositorio, cubriendo una amplia gama de escenarios de desarrollo de software. Es un modelo de código de primer nivel con menos de 10 mil millones de parámetros.",
|
||
"codegemma.description": "CodeGemma es un modelo ligero para tareas de programación variadas, que permite iteración rápida e integración sencilla.",
|
||
"codegemma:2b.description": "CodeGemma es un modelo ligero para tareas de programación variadas, que permite iteración rápida e integración sencilla.",
|
||
"codellama.description": "Code Llama es un modelo LLM enfocado en generación y discusión de código, con amplio soporte de lenguajes para flujos de trabajo de desarrollo.",
|
||
"codellama/CodeLlama-34b-Instruct-hf.description": "Code Llama es un modelo LLM enfocado en generación y discusión de código, con amplio soporte de lenguajes para flujos de trabajo de desarrollo.",
|
||
"codellama:13b.description": "Code Llama es un modelo LLM enfocado en generación y discusión de código, con amplio soporte de lenguajes para flujos de trabajo de desarrollo.",
|
||
"codellama:34b.description": "Code Llama es un modelo LLM enfocado en generación y discusión de código, con amplio soporte de lenguajes para flujos de trabajo de desarrollo.",
|
||
"codellama:70b.description": "Code Llama es un modelo LLM enfocado en generación y discusión de código, con amplio soporte de lenguajes para flujos de trabajo de desarrollo.",
|
||
"codeqwen.description": "CodeQwen1.5 es un modelo de lenguaje grande entrenado con datos extensos de código, diseñado para tareas de programación complejas.",
|
||
"codestral-latest.description": "Codestral es nuestro modelo de codificación más avanzado; la versión v2 (enero 2025) está orientada a tareas de baja latencia y alta frecuencia como FIM, corrección de código y generación de pruebas.",
|
||
"codestral.description": "Codestral es el primer modelo de código de Mistral AI, ofreciendo un sólido soporte para generación de código.",
|
||
"codex-mini-latest.description": "codex-mini-latest es un modelo o4-mini ajustado para la CLI de Codex. Para uso directo con API, se recomienda comenzar con gpt-4.1.",
|
||
"cogito-2.1:671b.description": "Cogito v2.1 671B es un modelo de lenguaje abierto de EE. UU. de uso comercial gratuito, con un rendimiento comparable a los mejores modelos, mayor eficiencia en razonamiento por tokens, contexto largo de 128k y gran capacidad general.",
|
||
"cogview-4.description": "CogView-4 es el primer modelo de texto a imagen de código abierto de Zhipu que puede generar caracteres chinos. Mejora la comprensión semántica, la calidad de imagen y la representación de texto en chino/inglés, admite entradas bilingües de longitud arbitraria y puede generar imágenes en cualquier resolución dentro de los rangos especificados.",
|
||
"cohere-command-r-plus.description": "Command R+ es un modelo avanzado optimizado para RAG, diseñado para cargas de trabajo empresariales.",
|
||
"cohere-command-r.description": "Command R es un modelo generativo escalable diseñado para RAG y uso de herramientas, permitiendo IA de nivel de producción.",
|
||
"cohere/Cohere-command-r-plus.description": "Command R+ es un modelo avanzado optimizado para RAG, diseñado para cargas de trabajo empresariales.",
|
||
"cohere/Cohere-command-r.description": "Command R es un modelo generativo escalable diseñado para RAG y uso de herramientas, permitiendo IA de nivel de producción.",
|
||
"cohere/command-a.description": "Command A es el modelo más potente de Cohere hasta la fecha, sobresaliendo en uso de herramientas, agentes, RAG y casos multilingües. Tiene una ventana de contexto de 256K, funciona con solo dos GPUs y ofrece un rendimiento 150% superior al de Command R+ 08-2024.",
|
||
"cohere/command-r-plus.description": "Command R+ es el último modelo LLM de Cohere optimizado para chat y contexto largo, con el objetivo de ofrecer un rendimiento excepcional para que las empresas pasen de prototipos a producción.",
|
||
"cohere/command-r.description": "Command R está optimizado para tareas de chat y contexto largo, posicionado como un modelo “escalable” que equilibra alto rendimiento y precisión para que las empresas avancen más allá de los prototipos.",
|
||
"cohere/embed-v4.0.description": "Un modelo que clasifica o convierte texto, imágenes o contenido mixto en embeddings.",
|
||
"comfyui/flux-dev.description": "FLUX.1 Dev es un modelo de texto a imagen de alta calidad (10–50 pasos), ideal para resultados creativos y artísticos premium.",
|
||
"comfyui/flux-kontext-dev.description": "FLUX.1 Kontext-dev es un modelo de edición de imágenes que admite ediciones guiadas por texto, incluidas ediciones locales y transferencia de estilo.",
|
||
"comfyui/flux-krea-dev.description": "FLUX.1 Krea-dev es un modelo de texto a imagen con mejoras de seguridad, co-desarrollado con Krea, con filtros de seguridad integrados.",
|
||
"comfyui/flux-schnell.description": "FLUX.1 Schnell es un modelo de texto a imagen ultrarrápido que genera imágenes de alta calidad en 1-4 pasos, ideal para uso en tiempo real y prototipado rápido.",
|
||
"comfyui/stable-diffusion-15.description": "Stable Diffusion 1.5 es un modelo clásico de texto a imagen 512x512, ideal para prototipado rápido y experimentación creativa.",
|
||
"comfyui/stable-diffusion-35-inclclip.description": "Stable Diffusion 3.5 con codificadores CLIP/T5 integrados no necesita archivos de codificador externos, adecuado para modelos como sd3.5_medium_incl_clips con menor uso de recursos.",
|
||
"comfyui/stable-diffusion-35.description": "Stable Diffusion 3.5 es un modelo de texto a imagen de próxima generación con variantes Large y Medium. Requiere archivos de codificador CLIP externos y ofrece excelente calidad de imagen y fidelidad al prompt.",
|
||
"comfyui/stable-diffusion-custom-refiner.description": "Modelo personalizado SDXL de imagen a imagen. Usa custom_sd_lobe.safetensors como nombre de archivo del modelo; si tienes un VAE, usa custom_sd_vae_lobe.safetensors. Coloca los archivos del modelo en las carpetas requeridas de Comfy.",
|
||
"comfyui/stable-diffusion-custom.description": "Modelo personalizado SD de texto a imagen. Usa custom_sd_lobe.safetensors como nombre de archivo del modelo; si tienes un VAE, usa custom_sd_vae_lobe.safetensors. Coloca los archivos del modelo en las carpetas requeridas de Comfy.",
|
||
"comfyui/stable-diffusion-refiner.description": "Modelo SDXL de imagen a imagen que realiza transformaciones de alta calidad a partir de imágenes de entrada, compatible con transferencia de estilo, restauración y variaciones creativas.",
|
||
"comfyui/stable-diffusion-xl.description": "SDXL es un modelo de texto a imagen que admite generación de alta resolución 1024x1024 con mejor calidad de imagen y detalle.",
|
||
"command-a-03-2025.description": "Command A es nuestro modelo más capaz hasta la fecha, sobresaliendo en uso de herramientas, agentes, RAG y escenarios multilingües. Tiene una ventana de contexto de 256K, funciona con solo dos GPUs y ofrece un rendimiento 150% superior al de Command R+ 08-2024.",
|
||
"command-light-nightly.description": "Para acortar el tiempo entre versiones principales, ofrecemos compilaciones nocturnas de Command. Para la serie command-light, se llama command-light-nightly. Es la versión más nueva y experimental (y potencialmente inestable), actualizada regularmente sin previo aviso, por lo que no se recomienda para producción.",
|
||
"command-light.description": "Una variante más pequeña y rápida de Command que es casi igual de capaz pero más veloz.",
|
||
"command-nightly.description": "Para acortar el tiempo entre versiones principales, ofrecemos compilaciones nocturnas de Command. Para la serie Command, se llama command-nightly. Es la versión más nueva y experimental (y potencialmente inestable), actualizada regularmente sin previo aviso, por lo que no se recomienda para producción.",
|
||
"command-r-03-2024.description": "Command R es un modelo de chat que sigue instrucciones con mayor calidad, fiabilidad y una ventana de contexto más larga que modelos anteriores. Admite flujos de trabajo complejos como generación de código, RAG, uso de herramientas y agentes.",
|
||
"command-r-08-2024.description": "command-r-08-2024 es una versión actualizada del modelo Command R lanzada en agosto de 2024.",
|
||
"command-r-plus-04-2024.description": "command-r-plus es un alias de command-r-plus-04-2024, por lo que usar command-r-plus en la API apunta a ese modelo.",
|
||
"command-r-plus-08-2024.description": "Command R+ es un modelo de chat que sigue instrucciones con mayor calidad, fiabilidad y una ventana de contexto más larga que modelos anteriores. Es ideal para flujos de trabajo RAG complejos y uso de herramientas en múltiples pasos.",
|
||
"command-r-plus.description": "Command R+ es un LLM de alto rendimiento diseñado para escenarios empresariales reales y aplicaciones complejas.",
|
||
"command-r.description": "Command R es un LLM optimizado para tareas de chat y contexto largo, ideal para interacción dinámica y gestión del conocimiento.",
|
||
"command-r7b-12-2024.description": "command-r7b-12-2024 es una actualización pequeña y eficiente lanzada en diciembre de 2024. Destaca en RAG, uso de herramientas y tareas de agentes que requieren razonamiento complejo en múltiples pasos.",
|
||
"command.description": "Un modelo de chat que sigue instrucciones y ofrece mayor calidad y fiabilidad en tareas lingüísticas, con una ventana de contexto más larga que nuestros modelos generativos base.",
|
||
"computer-use-preview.description": "computer-use-preview es un modelo especializado para la herramienta \"uso de computadora\", entrenado para comprender y ejecutar tareas relacionadas con computadoras.",
|
||
"dall-e-2.description": "Modelo DALL·E de segunda generación con generación de imágenes más realista y precisa, y 4× la resolución de la primera generación.",
|
||
"dall-e-3.description": "El modelo DALL·E más reciente, lanzado en noviembre de 2023, admite generación de imágenes más realista y precisa con mayor nivel de detalle.",
|
||
"databricks/dbrx-instruct.description": "DBRX Instruct ofrece una gestión de instrucciones altamente confiable en múltiples industrias.",
|
||
"deepseek-ai/DeepSeek-OCR.description": "DeepSeek-OCR es un modelo visión-lenguaje de DeepSeek AI centrado en OCR y \"compresión óptica contextual\". Explora la compresión del contexto a partir de imágenes, procesa documentos de forma eficiente y los convierte en texto estructurado (por ejemplo, Markdown). Reconoce texto en imágenes con gran precisión, ideal para digitalización de documentos, extracción de texto y procesamiento estructurado.",
|
||
"deepseek-ai/DeepSeek-R1-0528-Qwen3-8B.description": "DeepSeek-R1-0528-Qwen3-8B destila el razonamiento en cadena de DeepSeek-R1-0528 en Qwen3 8B Base. Alcanza el estado del arte entre los modelos abiertos, superando a Qwen3 8B en un 10% en AIME 2024 y equiparando el rendimiento de Qwen3-235B-thinking. Destaca en razonamiento matemático, programación y lógica general. Comparte la arquitectura de Qwen3-8B pero utiliza el tokenizador de DeepSeek-R1-0528.",
|
||
"deepseek-ai/DeepSeek-R1-0528.description": "DeepSeek R1 aprovecha mayor capacidad de cómputo y optimizaciones algorítmicas post-entrenamiento para profundizar el razonamiento. Tiene un rendimiento destacado en pruebas de matemáticas, programación y lógica general, acercándose a líderes como o3 y Gemini 2.5 Pro.",
|
||
"deepseek-ai/DeepSeek-R1-Distill-Llama-70B.description": "Los modelos destilados DeepSeek-R1 utilizan aprendizaje por refuerzo (RL) y datos de arranque en frío para mejorar el razonamiento y establecer nuevos estándares en tareas múltiples con modelos abiertos.",
|
||
"deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B.description": "Los modelos destilados DeepSeek-R1 utilizan aprendizaje por refuerzo (RL) y datos de arranque en frío para mejorar el razonamiento y establecer nuevos estándares en tareas múltiples con modelos abiertos.",
|
||
"deepseek-ai/DeepSeek-R1-Distill-Qwen-14B.description": "Los modelos destilados DeepSeek-R1 utilizan aprendizaje por refuerzo (RL) y datos de arranque en frío para mejorar el razonamiento y establecer nuevos estándares en tareas múltiples con modelos abiertos.",
|
||
"deepseek-ai/DeepSeek-R1-Distill-Qwen-32B.description": "DeepSeek-R1-Distill-Qwen-32B está destilado de Qwen2.5-32B y ajustado finamente con 800K muestras curadas de DeepSeek-R1. Destaca en matemáticas, programación y razonamiento, logrando excelentes resultados en AIME 2024, MATH-500 (94.3% de precisión) y GPQA Diamond.",
|
||
"deepseek-ai/DeepSeek-R1-Distill-Qwen-7B.description": "DeepSeek-R1-Distill-Qwen-7B está destilado de Qwen2.5-Math-7B y ajustado finamente con 800K muestras curadas de DeepSeek-R1. Tiene un rendimiento destacado, con 92.8% en MATH-500, 55.5% en AIME 2024 y una puntuación de 1189 en CodeForces para un modelo de 7B.",
|
||
"deepseek-ai/DeepSeek-R1.description": "DeepSeek-R1 mejora el razonamiento mediante aprendizaje por refuerzo (RL) y datos de arranque en frío, estableciendo nuevos estándares en tareas múltiples con modelos abiertos y superando a OpenAI-o1-mini.",
|
||
"deepseek-ai/DeepSeek-V2.5.description": "DeepSeek-V2.5 mejora DeepSeek-V2-Chat y DeepSeek-Coder-V2-Instruct, combinando capacidades generales y de programación. Mejora la redacción y el seguimiento de instrucciones para una mejor alineación con las preferencias, mostrando avances significativos en AlpacaEval 2.0, ArenaHard, AlignBench y MT-Bench.",
|
||
"deepseek-ai/DeepSeek-V3.1-Terminus.description": "DeepSeek-V3.1-Terminus es una versión actualizada del modelo V3.1, concebido como un agente híbrido. Corrige problemas reportados por usuarios y mejora la estabilidad, coherencia lingüística y reduce caracteres anómalos o mezclas de chino/inglés. Integra modos de pensamiento y no pensamiento con plantillas de chat para cambiar de forma flexible. También mejora el rendimiento de los agentes de código y búsqueda para un uso más confiable de herramientas y tareas de múltiples pasos.",
|
||
"deepseek-ai/DeepSeek-V3.1.description": "DeepSeek V3.1 utiliza una arquitectura de razonamiento híbrido y admite modos de pensamiento y no pensamiento.",
|
||
"deepseek-ai/DeepSeek-V3.2-Exp.description": "DeepSeek-V3.2-Exp es una versión experimental de V3.2 que sirve de puente hacia la próxima arquitectura. Añade DeepSeek Sparse Attention (DSA) sobre V3.1-Terminus para mejorar el entrenamiento y la inferencia en contextos largos, con optimizaciones para el uso de herramientas, comprensión de documentos extensos y razonamiento de múltiples pasos. Ideal para explorar mayor eficiencia de razonamiento con presupuestos de contexto amplios.",
|
||
"deepseek-ai/DeepSeek-V3.description": "DeepSeek-V3 es un modelo MoE con 671 mil millones de parámetros que utiliza MLA y DeepSeekMoE con balanceo de carga sin pérdida para un entrenamiento e inferencia eficientes. Preentrenado con 14.8T tokens de alta calidad, SFT y RL, supera a otros modelos abiertos y se acerca a los modelos cerrados líderes.",
|
||
"deepseek-ai/deepseek-llm-67b-chat.description": "DeepSeek LLM Chat (67B) es un modelo innovador que ofrece una comprensión profunda del lenguaje y una interacción avanzada.",
|
||
"deepseek-ai/deepseek-r1.description": "Un modelo LLM de última generación, eficiente y fuerte en razonamiento, matemáticas y programación.",
|
||
"deepseek-ai/deepseek-v3.1-terminus.description": "DeepSeek V3.1 es un modelo de razonamiento de nueva generación con capacidades mejoradas para razonamiento complejo y cadenas de pensamiento en tareas de análisis profundo.",
|
||
"deepseek-ai/deepseek-v3.1.description": "DeepSeek V3.1 es un modelo de razonamiento de nueva generación con capacidades mejoradas para razonamiento complejo y cadenas de pensamiento en tareas de análisis profundo.",
|
||
"deepseek-ai/deepseek-vl2.description": "DeepSeek-VL2 es un modelo visión-lenguaje MoE basado en DeepSeekMoE-27B con activación dispersa, logrando un alto rendimiento con solo 4.5B parámetros activos. Destaca en preguntas visuales, OCR, comprensión de documentos/tablas/gráficos y anclaje visual.",
|
||
"deepseek-chat.description": "Un nuevo modelo de código abierto que combina capacidades generales y de programación. Conserva el diálogo general del modelo de chat y la sólida programación del modelo coder, con mejor alineación de preferencias. DeepSeek-V2.5 también mejora la redacción y el seguimiento de instrucciones.",
|
||
"deepseek-coder-33B-instruct.description": "DeepSeek Coder 33B es un modelo de lenguaje para programación entrenado con 2T tokens (87% código, 13% texto en chino/inglés). Introduce una ventana de contexto de 16K y tareas de completado intermedio, ofreciendo completado de código a nivel de proyecto y relleno de fragmentos.",
|
||
"deepseek-coder-v2.description": "DeepSeek Coder V2 es un modelo de código MoE de código abierto que rinde fuertemente en tareas de programación, comparable a GPT-4 Turbo.",
|
||
"deepseek-coder-v2:236b.description": "DeepSeek Coder V2 es un modelo de código MoE de código abierto que rinde fuertemente en tareas de programación, comparable a GPT-4 Turbo.",
|
||
"deepseek-ocr.description": "DeepSeek-OCR es un modelo visión-lenguaje de DeepSeek AI centrado en OCR y \"compresión óptica contextual\". Explora la compresión de información contextual a partir de imágenes, procesa documentos de forma eficiente y los convierte en formatos de texto estructurado como Markdown. Reconoce texto en imágenes con gran precisión, ideal para digitalización de documentos, extracción de texto y procesamiento estructurado.",
|
||
"deepseek-r1-0528.description": "Modelo completo de 685B lanzado el 28-05-2025. DeepSeek-R1 utiliza aprendizaje por refuerzo a gran escala en la fase post-entrenamiento, mejorando significativamente el razonamiento con datos etiquetados mínimos, y rinde fuertemente en matemáticas, programación y razonamiento en lenguaje natural.",
|
||
"deepseek-r1-250528.description": "DeepSeek R1 250528 es el modelo completo de razonamiento DeepSeek-R1 para tareas complejas de matemáticas y lógica.",
|
||
"deepseek-r1-70b-fast-online.description": "Edición rápida de DeepSeek R1 70B con búsqueda web en tiempo real, ofreciendo respuestas más rápidas sin sacrificar rendimiento.",
|
||
"deepseek-r1-70b-online.description": "Edición estándar de DeepSeek R1 70B con búsqueda web en tiempo real, ideal para tareas de chat y texto actualizadas.",
|
||
"deepseek-r1-distill-llama-70b.description": "DeepSeek R1 Distill Llama 70B combina el razonamiento de R1 con el ecosistema Llama.",
|
||
"deepseek-r1-distill-llama-8b.description": "DeepSeek-R1-Distill-Llama-8B está destilado de Llama-3.1-8B utilizando salidas de DeepSeek R1.",
|
||
"deepseek-r1-distill-llama.description": "deepseek-r1-distill-llama está destilado de DeepSeek-R1 sobre Llama.",
|
||
"deepseek-r1-distill-qianfan-70b.description": "DeepSeek R1 Distill Qianfan 70B es una destilación R1 basada en Qianfan-70B con gran valor.",
|
||
"deepseek-r1-distill-qianfan-8b.description": "DeepSeek R1 Distill Qianfan 8B es una destilación R1 basada en Qianfan-8B para aplicaciones pequeñas y medianas.",
|
||
"deepseek-r1-distill-qianfan-llama-70b.description": "DeepSeek R1 Distill Qianfan Llama 70B es una destilación R1 basada en Llama-70B.",
|
||
"deepseek-r1-distill-qwen-1.5b.description": "DeepSeek R1 Distill Qwen 1.5B es un modelo destilado ultraligero para entornos con muy pocos recursos.",
|
||
"deepseek-r1-distill-qwen-14b.description": "DeepSeek R1 Distill Qwen 14B es un modelo destilado de tamaño medio para despliegue en múltiples escenarios.",
|
||
"deepseek-r1-distill-qwen-32b.description": "DeepSeek R1 Distill Qwen 32B es una destilación R1 basada en Qwen-32B, equilibrando rendimiento y coste.",
|
||
"deepseek-r1-distill-qwen-7b.description": "DeepSeek R1 Distill Qwen 7B es un modelo destilado ligero para entornos empresariales privados y en el borde.",
|
||
"deepseek-r1-distill-qwen.description": "deepseek-r1-distill-qwen está destilado de DeepSeek-R1 sobre Qwen.",
|
||
"deepseek-r1-fast-online.description": "Versión completa rápida de DeepSeek R1 con búsqueda web en tiempo real, combinando capacidad a escala 671B y respuesta ágil.",
|
||
"deepseek-r1-online.description": "Versión completa de DeepSeek R1 con 671B parámetros y búsqueda web en tiempo real, ofreciendo mejor comprensión y generación.",
|
||
"deepseek-r1.description": "DeepSeek-R1 utiliza datos de arranque en frío antes del aprendizaje por refuerzo y rinde de forma comparable a OpenAI-o1 en matemáticas, programación y razonamiento.",
|
||
"deepseek-reasoner.description": "El modo de pensamiento de DeepSeek V3.2 genera una cadena de razonamiento antes de la respuesta final para mejorar la precisión.",
|
||
"deepseek-v2.description": "DeepSeek V2 es un modelo MoE eficiente para procesamiento rentable.",
|
||
"deepseek-v2:236b.description": "DeepSeek V2 236B es el modelo de DeepSeek centrado en código con fuerte generación de código.",
|
||
"deepseek-v3-0324.description": "DeepSeek-V3-0324 es un modelo MoE con 671B parámetros, con fortalezas destacadas en programación, capacidad técnica, comprensión de contexto y manejo de textos largos.",
|
||
"deepseek-v3.1-terminus.description": "DeepSeek-V3.1-Terminus es un modelo LLM optimizado para terminales de DeepSeek, diseñado específicamente para dispositivos de terminal.",
|
||
"deepseek-v3.1-think-250821.description": "DeepSeek V3.1 Think 250821 es el modelo de pensamiento profundo correspondiente a la versión Terminus, creado para un razonamiento de alto rendimiento.",
|
||
"deepseek-v3.1.description": "DeepSeek-V3.1 es un nuevo modelo híbrido de razonamiento de DeepSeek, que admite modos de pensamiento y no pensamiento, y ofrece una mayor eficiencia de razonamiento que DeepSeek-R1-0528. Las optimizaciones posteriores al entrenamiento mejoran significativamente el uso de herramientas por parte de agentes y el rendimiento en tareas. Admite una ventana de contexto de 128k y hasta 64k tokens de salida.",
|
||
"deepseek-v3.1:671b.description": "DeepSeek V3.1 es un modelo de razonamiento de nueva generación con mejoras en razonamiento complejo y cadena de pensamiento, ideal para tareas que requieren análisis profundo.",
|
||
"deepseek-v3.2-exp.description": "deepseek-v3.2-exp introduce atención dispersa para mejorar la eficiencia de entrenamiento e inferencia en textos largos, a un precio inferior al de deepseek-v3.1.",
|
||
"deepseek-v3.2-think.description": "DeepSeek V3.2 Think es un modelo de pensamiento profundo completo con razonamiento de cadenas largas más sólido.",
|
||
"deepseek-v3.2.description": "DeepSeek-V3.2 es el primer modelo de razonamiento híbrido de DeepSeek que integra el pensamiento en el uso de herramientas. Con una arquitectura eficiente que ahorra recursos, aprendizaje reforzado a gran escala para mejorar capacidades y datos sintéticos masivos para una fuerte generalización, su rendimiento es comparable al de GPT-5-High. La longitud de salida se ha reducido considerablemente, disminuyendo el coste computacional y el tiempo de espera del usuario.",
|
||
"deepseek-v3.description": "DeepSeek-V3 es un potente modelo MoE con 671 mil millones de parámetros totales y 37 mil millones activos por token.",
|
||
"deepseek-vl2-small.description": "DeepSeek VL2 Small es una versión multimodal ligera para entornos con recursos limitados y alta concurrencia.",
|
||
"deepseek-vl2.description": "DeepSeek VL2 es un modelo multimodal para comprensión imagen-texto y preguntas visuales detalladas.",
|
||
"deepseek/deepseek-chat-v3-0324.description": "DeepSeek V3 es un modelo MoE de 685 mil millones de parámetros y la última iteración de la serie de chat insignia de DeepSeek.\n\nSe basa en [DeepSeek V3](/deepseek/deepseek-chat-v3) y ofrece un rendimiento sólido en diversas tareas.",
|
||
"deepseek/deepseek-chat-v3-0324:free.description": "DeepSeek V3 es un modelo MoE de 685 mil millones de parámetros y la última iteración de la serie de chat insignia de DeepSeek.\n\nSe basa en [DeepSeek V3](/deepseek/deepseek-chat-v3) y ofrece un rendimiento sólido en diversas tareas.",
|
||
"deepseek/deepseek-chat-v3.1.description": "DeepSeek-V3.1 es el modelo de razonamiento híbrido de largo contexto de DeepSeek, compatible con modos mixtos de pensamiento/no pensamiento e integración de herramientas.",
|
||
"deepseek/deepseek-chat.description": "DeepSeek-V3 es el modelo de razonamiento híbrido de alto rendimiento de DeepSeek para tareas complejas e integración de herramientas.",
|
||
"deepseek/deepseek-r1-0528.description": "DeepSeek R1 0528 es una variante actualizada centrada en disponibilidad abierta y razonamiento más profundo.",
|
||
"deepseek/deepseek-r1-0528:free.description": "DeepSeek-R1 mejora significativamente el razonamiento con datos etiquetados mínimos y genera una cadena de pensamiento antes de la respuesta final para mejorar la precisión.",
|
||
"deepseek/deepseek-r1-distill-llama-70b.description": "DeepSeek R1 Distill Llama 70B es un modelo LLM destilado basado en Llama 3.3 70B, ajustado con salidas de DeepSeek R1 para lograr un rendimiento competitivo con modelos de frontera de gran tamaño.",
|
||
"deepseek/deepseek-r1-distill-llama-8b.description": "DeepSeek R1 Distill Llama 8B es un modelo LLM destilado basado en Llama-3.1-8B-Instruct, entrenado con salidas de DeepSeek R1.",
|
||
"deepseek/deepseek-r1-distill-qwen-14b.description": "DeepSeek R1 Distill Qwen 14B es un modelo LLM destilado basado en Qwen 2.5 14B, entrenado con salidas de DeepSeek R1. Supera a OpenAI o1-mini en múltiples pruebas, logrando resultados de vanguardia entre modelos densos. Resultados destacados:\nAIME 2024 pass@1: 69.7\nMATH-500 pass@1: 93.9\nPuntuación CodeForces: 1481\nEl ajuste fino con salidas de DeepSeek R1 ofrece un rendimiento competitivo frente a modelos de frontera más grandes.",
|
||
"deepseek/deepseek-r1-distill-qwen-32b.description": "DeepSeek R1 Distill Qwen 32B es un modelo LLM destilado basado en Qwen 2.5 32B, entrenado con salidas de DeepSeek R1. Supera a OpenAI o1-mini en múltiples pruebas, logrando resultados de vanguardia entre modelos densos. Resultados destacados:\nAIME 2024 pass@1: 72.6\nMATH-500 pass@1: 94.3\nPuntuación CodeForces: 1691\nEl ajuste fino con salidas de DeepSeek R1 ofrece un rendimiento competitivo frente a modelos de frontera más grandes.",
|
||
"deepseek/deepseek-r1.description": "DeepSeek R1 ha sido actualizado a DeepSeek-R1-0528. Con mayor capacidad de cómputo y optimizaciones algorítmicas posteriores al entrenamiento, mejora significativamente la profundidad y capacidad de razonamiento. Tiene un rendimiento sólido en matemáticas, programación y pruebas de lógica general, acercándose a líderes como o3 y Gemini 2.5 Pro.",
|
||
"deepseek/deepseek-r1/community.description": "DeepSeek R1 es el último modelo de código abierto lanzado por el equipo de DeepSeek, con un rendimiento de razonamiento muy sólido, especialmente en matemáticas, programación y tareas de lógica, comparable a OpenAI o1.",
|
||
"deepseek/deepseek-r1:free.description": "DeepSeek-R1 mejora significativamente el razonamiento con datos etiquetados mínimos y genera una cadena de pensamiento antes de la respuesta final para mejorar la precisión.",
|
||
"deepseek/deepseek-reasoner.description": "DeepSeek-V3 Thinking (reasoner) es el modelo experimental de razonamiento de DeepSeek, adecuado para tareas de razonamiento de alta complejidad.",
|
||
"deepseek/deepseek-v3.1-base.description": "DeepSeek V3.1 Base es una versión mejorada del modelo DeepSeek V3.",
|
||
"deepseek/deepseek-v3.description": "Un modelo LLM rápido de propósito general con razonamiento mejorado.",
|
||
"deepseek/deepseek-v3/community.description": "DeepSeek-V3 representa un gran avance en velocidad de razonamiento respecto a modelos anteriores. Ocupa el primer lugar entre los modelos de código abierto y rivaliza con los modelos cerrados más avanzados. DeepSeek-V3 adopta Multi-Head Latent Attention (MLA) y la arquitectura DeepSeekMoE, ambas validadas en DeepSeek-V2. También introduce una estrategia auxiliar sin pérdida para el balanceo de carga y un objetivo de entrenamiento de predicción multi-token para un rendimiento más sólido.",
|
||
"deepseek_r1.description": "DeepSeek-R1 es un modelo de razonamiento impulsado por aprendizaje por refuerzo que aborda problemas de repetición y legibilidad. Antes del RL, utiliza datos de arranque en frío para mejorar aún más el rendimiento de razonamiento. Igual a OpenAI-o1 en tareas de matemáticas, programación y razonamiento, con un entrenamiento cuidadosamente diseñado que mejora los resultados generales.",
|
||
"deepseek_r1_distill_llama_70b.description": "DeepSeek-R1-Distill-Llama-70B es una versión destilada de Llama-3.3-70B-Instruct. Como parte de la serie DeepSeek-R1, está ajustado con muestras generadas por DeepSeek-R1 y ofrece un rendimiento sólido en matemáticas, programación y razonamiento.",
|
||
"deepseek_r1_distill_qwen_14b.description": "DeepSeek-R1-Distill-Qwen-14B es una versión destilada de Qwen2.5-14B y ajustada con 800K muestras seleccionadas generadas por DeepSeek-R1, ofreciendo un razonamiento sólido.",
|
||
"deepseek_r1_distill_qwen_32b.description": "DeepSeek-R1-Distill-Qwen-32B es una versión destilada de Qwen2.5-32B y ajustada con 800K muestras seleccionadas generadas por DeepSeek-R1, destacando en matemáticas, programación y razonamiento.",
|
||
"meta.llama3-8b-instruct-v1:0.description": "Meta Llama 3 es un modelo LLM abierto para desarrolladores, investigadores y empresas, diseñado para ayudarles a construir, experimentar y escalar de manera responsable ideas de IA generativa. Como parte de la base para la innovación de la comunidad global, es ideal para entornos con recursos y capacidad de cómputo limitados, dispositivos en el borde y tiempos de entrenamiento más rápidos.",
|
||
"meta/Llama-3.2-11B-Vision-Instruct.description": "Razonamiento visual sólido en imágenes de alta resolución, ideal para aplicaciones de comprensión visual.",
|
||
"meta/Llama-3.2-90B-Vision-Instruct.description": "Razonamiento visual avanzado para aplicaciones de agentes con comprensión visual.",
|
||
"meta/Llama-3.3-70B-Instruct.description": "Llama 3.3 es el modelo Llama multilingüe de código abierto más avanzado, con un rendimiento cercano al de modelos de 405B a un costo muy bajo. Basado en Transformer y mejorado con SFT y RLHF para mayor utilidad y seguridad. La versión ajustada por instrucciones está optimizada para chat multilingüe y supera a muchos modelos abiertos y cerrados en pruebas de referencia de la industria. Fecha de corte de conocimiento: diciembre de 2023.",
|
||
"meta/Meta-Llama-3-70B-Instruct.description": "Un potente modelo de 70 mil millones de parámetros que destaca en razonamiento, programación y tareas lingüísticas generales.",
|
||
"meta/Meta-Llama-3-8B-Instruct.description": "Un modelo versátil de 8 mil millones de parámetros optimizado para chat y generación de texto.",
|
||
"meta/Meta-Llama-3.1-405B-Instruct.description": "Modelo de texto Llama 3.1 ajustado por instrucciones, optimizado para chat multilingüe, con alto rendimiento en pruebas de referencia comunes entre modelos abiertos y cerrados.",
|
||
"meta/Meta-Llama-3.1-70B-Instruct.description": "Modelo de texto Llama 3.1 ajustado por instrucciones, optimizado para chat multilingüe, con alto rendimiento en pruebas de referencia comunes entre modelos abiertos y cerrados.",
|
||
"meta/Meta-Llama-3.1-8B-Instruct.description": "Modelo de texto Llama 3.1 ajustado por instrucciones, optimizado para chat multilingüe, con alto rendimiento en pruebas de referencia comunes entre modelos abiertos y cerrados.",
|
||
"meta/llama-3-70b.description": "Un modelo de 70 mil millones de parámetros de código abierto afinado por Meta para seguir instrucciones, servido por Groq en hardware LPU para inferencia rápida y eficiente.",
|
||
"meta/llama-3-8b.description": "Un modelo de 8 mil millones de parámetros de código abierto afinado por Meta para seguir instrucciones, servido por Groq en hardware LPU para inferencia rápida y eficiente.",
|
||
"meta/llama-3.1-405b-instruct.description": "Un modelo LLM avanzado que admite generación de datos sintéticos, destilación de conocimiento y razonamiento para chatbots, programación y tareas especializadas.",
|
||
"meta/llama-3.1-70b-instruct.description": "Diseñado para diálogos complejos con excelente comprensión de contexto, razonamiento y generación de texto.",
|
||
"meta/llama-3.1-70b.description": "Una versión actualizada de Meta Llama 3 70B Instruct con contexto de 128K, soporte multilingüe y razonamiento mejorado.",
|
||
"meta/llama-3.1-8b-instruct.description": "Un modelo de vanguardia con sólida comprensión del lenguaje, razonamiento y generación de texto.",
|
||
"meta/llama-3.1-8b.description": "Llama 3.1 8B admite una ventana de contexto de 128K, ideal para chat en tiempo real y análisis de datos, y ofrece un ahorro significativo de costos frente a modelos más grandes. Servido por Groq en hardware LPU para inferencia rápida y eficiente.",
|
||
"meta/llama-3.2-11b-vision-instruct.description": "Un modelo de vanguardia en visión y lenguaje que destaca en razonamiento de alta calidad a partir de imágenes.",
|
||
"meta/llama-3.2-11b.description": "Modelo de razonamiento visual ajustado por instrucciones (entrada de texto + imagen, salida de texto) optimizado para reconocimiento visual, razonamiento de imágenes, subtitulado y preguntas y respuestas generales sobre imágenes.",
|
||
"meta/llama-3.2-1b-instruct.description": "Un modelo lingüístico pequeño de vanguardia con sólida comprensión, razonamiento y generación de texto.",
|
||
"meta/llama-3.2-1b.description": "Modelo solo de texto para casos de uso en dispositivos como recuperación local multilingüe, resumen y reescritura.",
|
||
"meta/llama-3.2-3b-instruct.description": "Un modelo lingüístico pequeño de vanguardia con sólida comprensión, razonamiento y generación de texto.",
|
||
"meta/llama-3.2-3b.description": "Modelo solo de texto afinado para casos de uso en dispositivos como recuperación local multilingüe, resumen y reescritura.",
|
||
"meta/llama-3.2-90b-vision-instruct.description": "Un modelo de vanguardia en visión y lenguaje que destaca en razonamiento de alta calidad a partir de imágenes.",
|
||
"meta/llama-3.2-90b.description": "Modelo de razonamiento visual ajustado por instrucciones (entrada de texto + imagen, salida de texto) optimizado para reconocimiento visual, razonamiento de imágenes, subtitulado y preguntas y respuestas generales sobre imágenes.",
|
||
"meta/llama-3.3-70b-instruct.description": "Un modelo LLM avanzado con gran capacidad de razonamiento, matemáticas, sentido común y llamadas a funciones.",
|
||
"meta/llama-3.3-70b.description": "Un equilibrio perfecto entre rendimiento y eficiencia. Diseñado para IA conversacional de alto rendimiento en creación de contenido, aplicaciones empresariales e investigación, con sólida comprensión del lenguaje para resumen, clasificación, análisis de sentimientos y generación de código.",
|
||
"meta/llama-4-maverick.description": "La familia Llama 4 es un conjunto de modelos de IA multimodal nativos que admiten experiencias de texto y multimodales, utilizando MoE para una comprensión líder de texto e imagen. Llama 4 Maverick es un modelo de 17B con 128 expertos, servido por DeepInfra.",
|
||
"meta/llama-4-scout.description": "La familia Llama 4 es un conjunto de modelos de IA multimodal nativos que admiten experiencias de texto y multimodales, utilizando MoE para una comprensión líder de texto e imagen. Llama 4 Scout es un modelo de 17B con 16 expertos, servido por DeepInfra.",
|
||
"microsoft/Phi-3-mini-4k-instruct.description": "El miembro más pequeño de la familia Phi-3, optimizado para calidad y baja latencia.",
|
||
"microsoft/Phi-3-small-128k-instruct.description": "El mismo modelo Phi-3-small con una ventana de contexto más amplia para RAG o prompts de pocos ejemplos.",
|
||
"microsoft/Phi-3-small-8k-instruct.description": "Un modelo de 7 mil millones de parámetros con mayor calidad que Phi-3-mini, enfocado en datos de alta calidad y razonamiento intensivo.",
|
||
"microsoft/Phi-3.5-mini-instruct.description": "Una versión actualizada del modelo Phi-3-mini.",
|
||
"microsoft/Phi-3.5-vision-instruct.description": "Una versión actualizada del modelo Phi-3-vision.",
|
||
"microsoft/WizardLM-2-8x22B.description": "WizardLM 2 es un modelo de lenguaje de Microsoft AI que destaca en diálogos complejos, tareas multilingües, razonamiento y asistentes.",
|
||
"microsoft/wizardlm-2-8x22b.description": "WizardLM-2 8x22B es el modelo Wizard más avanzado de Microsoft AI, con un rendimiento altamente competitivo.",
|
||
"minicpm-v.description": "MiniCPM-V es el modelo multimodal de próxima generación de OpenBMB, con excelente OCR y comprensión multimodal para una amplia gama de casos de uso.",
|
||
"minimax/minimax-m2.description": "MiniMax-M2 es un modelo de alto valor que sobresale en tareas de codificación y agentes para muchos escenarios de ingeniería.",
|
||
"minimaxai/minimax-m2.description": "MiniMax-M2 es un modelo MoE compacto, rápido y rentable (230B en total, 10B activos) diseñado para un rendimiento de primer nivel en codificación y agentes, manteniendo una sólida inteligencia general. Destaca en ediciones de múltiples archivos, ciclos de ejecución y corrección de código, validación de pruebas y cadenas de herramientas complejas.",
|
||
"ministral-3b-latest.description": "Ministral 3B es el modelo de borde de más alto nivel de Mistral.",
|
||
"ministral-8b-latest.description": "Ministral 8B es un modelo de borde altamente rentable de Mistral.",
|
||
"mistral-ai/Mistral-Large-2411.description": "El modelo insignia de Mistral para tareas complejas que requieren razonamiento a gran escala o especialización (generación de texto sintético, generación de código, RAG o agentes).",
|
||
"mistral-ai/Mistral-Nemo.description": "Mistral Nemo es un LLM de vanguardia con razonamiento de última generación, conocimiento del mundo y codificación para su tamaño.",
|
||
"mistral-ai/mistral-small-2503.description": "Mistral Small es adecuado para cualquier tarea basada en lenguaje que requiera alta eficiencia y baja latencia.",
|
||
"mistral-large-instruct.description": "Mistral-Large-Instruct-2407 es un LLM denso avanzado con 123 mil millones de parámetros y razonamiento, conocimiento y codificación de última generación.",
|
||
"mistral-large-latest.description": "Mistral Large es el modelo insignia, fuerte en tareas multilingües, razonamiento complejo y generación de código, ideal para aplicaciones de alto nivel.",
|
||
"mistral-large.description": "Mixtral Large es el modelo insignia de Mistral, que combina generación de código, matemáticas y razonamiento con una ventana de contexto de 128K.",
|
||
"mistral-medium-latest.description": "Mistral Medium 3 ofrece un rendimiento de última generación a un costo 8× menor y simplifica el despliegue empresarial.",
|
||
"mistral-nemo-instruct.description": "Mistral-Nemo-Instruct-2407 es la versión ajustada por instrucciones de Mistral-Nemo-Base-2407.",
|
||
"mistral-nemo.description": "Mistral Nemo es un modelo de 12 mil millones de parámetros de alta eficiencia de Mistral AI y NVIDIA.",
|
||
"mistral-small-latest.description": "Mistral Small es una opción rentable, rápida y confiable para traducción, resumen y análisis de sentimientos.",
|
||
"mistral-small.description": "Mistral Small es adecuado para cualquier tarea basada en lenguaje que requiera alta eficiencia y baja latencia.",
|
||
"mistral.description": "Mistral es el modelo de 7 mil millones de parámetros de Mistral AI, adecuado para tareas lingüísticas variadas.",
|
||
"mistral/codestral-embed.description": "Un modelo de incrustación de código para indexar bases de código y repositorios, compatible con asistentes de programación.",
|
||
"mistral/codestral.description": "Mistral Codestral 25.01 es un modelo de codificación de última generación optimizado para baja latencia y uso frecuente. Soporta más de 80 lenguajes y destaca en FIM, corrección de código y generación de pruebas.",
|
||
"mistral/devstral-small.description": "Devstral es un LLM orientado a agentes para tareas de ingeniería de software, lo que lo convierte en una opción sólida para agentes de desarrollo.",
|
||
"mistral/magistral-medium.description": "Pensamiento complejo respaldado por una comprensión profunda con razonamiento transparente que puedes seguir y verificar. Mantiene un razonamiento de alta fidelidad en varios idiomas, incluso a mitad de tarea.",
|
||
"mistral/magistral-small.description": "Pensamiento complejo respaldado por una comprensión profunda con razonamiento transparente que puedes seguir y verificar. Mantiene un razonamiento de alta fidelidad en varios idiomas, incluso a mitad de tarea.",
|
||
"mistral/ministral-3b.description": "Un modelo compacto y eficiente para tareas en dispositivos como asistentes y análisis locales, con rendimiento de baja latencia.",
|
||
"mistral/ministral-8b.description": "Un modelo más potente con inferencia rápida y eficiente en memoria, ideal para flujos de trabajo complejos y aplicaciones exigentes en el borde.",
|
||
"mistral/mistral-embed.description": "Un modelo general de incrustación de texto para búsqueda semántica, similitud, agrupamiento y flujos de trabajo RAG.",
|
||
"mistral/mistral-large.description": "Mistral Large es ideal para tareas complejas que requieren razonamiento sólido o especialización: generación de texto sintético, generación de código, RAG o agentes.",
|
||
"mistral/mistral-small.description": "Mistral Small es ideal para tareas simples y por lotes como clasificación, soporte al cliente o generación de texto, ofreciendo gran rendimiento a un precio accesible.",
|
||
"mistral/mixtral-8x22b-instruct.description": "Modelo Instruct 8x22B. 8x22B es un modelo MoE abierto servido por Mistral.",
|
||
"mistral/pixtral-12b.description": "Un modelo de 12 mil millones de parámetros con comprensión de imágenes y texto.",
|
||
"mistral/pixtral-large.description": "Pixtral Large es el segundo modelo de nuestra familia multimodal con comprensión de imágenes de vanguardia. Maneja documentos, gráficos e imágenes naturales mientras mantiene la comprensión textual líder de Mistral Large 2.",
|
||
"mistralai/Mistral-7B-Instruct-v0.1.description": "Mistral (7B) Instruct es conocido por su sólido rendimiento en muchas tareas lingüísticas.",
|
||
"mistralai/Mistral-7B-Instruct-v0.2.description": "Mistral (7B) Instruct v0.2 mejora el manejo de instrucciones y la precisión de los resultados.",
|
||
"mistralai/Mistral-7B-Instruct-v0.3.description": "Mistral (7B) Instruct v0.3 ofrece cómputo eficiente y sólida comprensión del lenguaje para muchos casos de uso.",
|
||
"mistralai/Mistral-7B-v0.1.description": "Mistral 7B es compacto pero de alto rendimiento, fuerte para procesamiento por lotes y tareas simples como clasificación y generación de texto, con razonamiento sólido.",
|
||
"mistralai/Mixtral-8x22B-Instruct-v0.1.description": "Mixtral-8x22B Instruct (141B) es un LLM muy grande para cargas de trabajo pesadas.",
|
||
"mistralai/Mixtral-8x7B-Instruct-v0.1.description": "Mixtral-8x7B Instruct (46.7B) ofrece alta capacidad para procesamiento de datos a gran escala.",
|
||
"mistralai/Mixtral-8x7B-v0.1.description": "Mixtral 8x7B es un modelo MoE disperso que acelera la inferencia, adecuado para tareas multilingües y generación de código.",
|
||
"mistralai/mistral-nemo.description": "Mistral Nemo es un modelo de 7.3B con soporte multilingüe y sólido rendimiento en codificación.",
|
||
"o4-mini-deep-research.description": "o4-mini-deep-research es un modelo de investigación profunda más rápido y asequible para investigaciones complejas de múltiples pasos. Puede buscar en la web y también acceder a tus datos mediante conectores MCP.",
|
||
"o4-mini.description": "o4-mini es el último modelo pequeño de la serie o, optimizado para razonamiento rápido y eficaz con alta eficiencia en tareas de codificación y visión.",
|
||
"open-codestral-mamba.description": "Codestral Mamba es un modelo de lenguaje Mamba 2 enfocado en la generación de código, compatible con tareas avanzadas de programación y razonamiento.",
|
||
"open-mistral-7b.description": "Mistral 7B es compacto pero de alto rendimiento, ideal para procesamiento por lotes y tareas simples como clasificación y generación de texto, con un razonamiento sólido.",
|
||
"open-mistral-nemo.description": "Mistral Nemo es un modelo de 12B desarrollado en conjunto con Nvidia, que ofrece un rendimiento sólido en razonamiento y codificación con integración sencilla.",
|
||
"open-mixtral-8x22b.description": "Mixtral 8x22B es un modelo MoE de gran tamaño para tareas complejas, que ofrece un razonamiento sólido y mayor rendimiento.",
|
||
"open-mixtral-8x7b.description": "Mixtral 8x7B es un modelo MoE disperso que mejora la velocidad de inferencia, adecuado para tareas multilingües y de generación de código.",
|
||
"openai/gpt-3.5-turbo-instruct.description": "Capacidades similares a los modelos de la era GPT-3, compatible con endpoints de completado heredados en lugar de chat.",
|
||
"openai/gpt-3.5-turbo.description": "El modelo GPT-3.5 más capaz y rentable de OpenAI, optimizado para chat pero aún fuerte en completados clásicos.",
|
||
"openai/gpt-4-turbo.description": "gpt-4-turbo de OpenAI posee un amplio conocimiento general y experiencia en dominios, sigue instrucciones complejas en lenguaje natural y resuelve problemas difíciles con precisión. Su límite de conocimiento es abril de 2023 y cuenta con una ventana de contexto de 128k.",
|
||
"openai/gpt-4.1-mini.description": "GPT-4.1 Mini ofrece menor latencia y mejor relación calidad-precio para cargas de trabajo de contexto medio.",
|
||
"openai/gpt-4.1-nano.description": "GPT-4.1 Nano es una opción de muy bajo costo y baja latencia para chats cortos de alta frecuencia o clasificación.",
|
||
"openai/gpt-4.1.description": "La serie GPT-4.1 ofrece ventanas de contexto más amplias y capacidades más sólidas de ingeniería y razonamiento.",
|
||
"openai/gpt-4o-mini.description": "GPT-4o-mini es una variante pequeña y rápida de GPT-4o para uso multimodal de baja latencia.",
|
||
"openai/gpt-4o.description": "La familia GPT-4o es el modelo Omni de OpenAI con entrada de texto + imagen y salida de texto.",
|
||
"openai/gpt-5-chat.description": "GPT-5 Chat es una variante de GPT-5 optimizada para conversaciones con menor latencia y mejor interactividad.",
|
||
"openai/gpt-5-codex.description": "GPT-5-Codex es una variante de GPT-5 optimizada aún más para programación y flujos de trabajo de código a gran escala.",
|
||
"openai/gpt-5-mini.description": "GPT-5 Mini es una variante más pequeña de GPT-5 para escenarios de baja latencia y bajo costo.",
|
||
"openai/gpt-5-nano.description": "GPT-5 Nano es la variante ultra pequeña para escenarios con restricciones estrictas de costo y latencia.",
|
||
"openai/gpt-5-pro.description": "GPT-5 Pro es el modelo insignia de OpenAI, que ofrece razonamiento avanzado, generación de código y funciones de nivel empresarial, con enrutamiento en tiempo de prueba y políticas de seguridad más estrictas.",
|
||
"openai/gpt-5.1-chat.description": "GPT-5.1 Chat es el miembro liviano de la familia GPT-5.1, optimizado para conversaciones de baja latencia sin perder capacidad de razonamiento ni ejecución de instrucciones.",
|
||
"openai/gpt-5.1-codex-mini.description": "GPT-5.1-Codex-Mini es una versión más pequeña y rápida de GPT-5.1-Codex, ideal para escenarios de programación sensibles a latencia y costo.",
|
||
"openai/gpt-5.1-codex.description": "GPT-5.1-Codex es una variante de GPT-5.1 optimizada para ingeniería de software y flujos de trabajo de codificación, adecuada para refactorizaciones grandes, depuración compleja y tareas autónomas prolongadas.",
|
||
"openai/gpt-5.1.description": "GPT-5.1 es el modelo insignia más reciente de la serie GPT-5, con mejoras significativas sobre GPT-5 en razonamiento general, seguimiento de instrucciones y naturalidad conversacional, adecuado para tareas amplias.",
|
||
"openai/gpt-5.description": "GPT-5 es el modelo de alto rendimiento de OpenAI para una amplia gama de tareas de producción e investigación.",
|
||
"openai/gpt-oss-120b.description": "Un modelo de lenguaje de propósito general altamente capaz con razonamiento sólido y controlable.",
|
||
"openai/gpt-oss-20b.description": "Un modelo de lenguaje compacto con pesos abiertos, optimizado para baja latencia y entornos con recursos limitados, incluyendo implementaciones locales y en el borde.",
|
||
"openai/o1-mini.description": "o1-mini es un modelo de razonamiento rápido y rentable diseñado para programación, matemáticas y ciencia. Tiene un contexto de 128K y un límite de conocimiento de octubre de 2023.",
|
||
"openai/o1-preview.description": "o1 es el nuevo modelo de razonamiento de OpenAI para tareas complejas que requieren amplio conocimiento. Tiene un contexto de 128K y un límite de conocimiento de octubre de 2023.",
|
||
"openai/o1.description": "OpenAI o1 es un modelo insignia de razonamiento diseñado para resolver problemas complejos que requieren pensamiento profundo, ofreciendo razonamiento sólido y mayor precisión en tareas de múltiples pasos.",
|
||
"openai/o3-mini-high.description": "o3-mini (alto razonamiento) ofrece mayor inteligencia con los mismos objetivos de costo y latencia que o1-mini.",
|
||
"openai/o3-mini.description": "o3-mini es el último modelo pequeño de razonamiento de OpenAI, que ofrece mayor inteligencia con los mismos objetivos de costo y latencia que o1-mini.",
|
||
"openai/o3.description": "OpenAI o3 es el modelo de razonamiento más potente, estableciendo un nuevo SOTA en programación, matemáticas, ciencia y percepción visual. Destaca en consultas complejas y multifacéticas, y es especialmente fuerte en el análisis de imágenes, gráficos y diagramas.",
|
||
"openai/o4-mini-high.description": "o4-mini de alto razonamiento, optimizado para razonamiento rápido y eficiente con un rendimiento sólido en programación y visión.",
|
||
"openai/o4-mini.description": "OpenAI o4-mini es un modelo pequeño y eficiente de razonamiento para escenarios de baja latencia.",
|
||
"openai/text-embedding-3-large.description": "El modelo de embedding más capaz de OpenAI para tareas en inglés y otros idiomas.",
|
||
"openai/text-embedding-3-small.description": "Variante mejorada del modelo ada de embedding, con mayor rendimiento.",
|
||
"openai/text-embedding-ada-002.description": "Modelo de embedding de texto heredado de OpenAI.",
|
||
"openrouter/auto.description": "Según la longitud del contexto, el tema y la complejidad, tu solicitud se enruta a Llama 3 70B Instruct, Claude 3.5 Sonnet (auto-moderado) o GPT-4o.",
|
||
"perplexity/sonar-pro.description": "Producto insignia de Perplexity con búsqueda fundamentada, compatible con consultas avanzadas y seguimientos.",
|
||
"perplexity/sonar-reasoning-pro.description": "Modelo avanzado centrado en razonamiento que genera cadenas de pensamiento (CoT) con búsqueda mejorada, incluyendo múltiples consultas por solicitud.",
|
||
"perplexity/sonar-reasoning.description": "Modelo centrado en razonamiento que genera cadenas de pensamiento (CoT) con explicaciones detalladas fundamentadas en búsqueda.",
|
||
"perplexity/sonar.description": "Producto liviano de Perplexity con búsqueda fundamentada, más rápido y económico que Sonar Pro.",
|
||
"phi3.description": "Phi-3 es el modelo abierto liviano de Microsoft para integración eficiente y razonamiento a gran escala.",
|
||
"phi3:14b.description": "Phi-3 es el modelo abierto liviano de Microsoft para integración eficiente y razonamiento a gran escala.",
|
||
"pixtral-12b-2409.description": "Pixtral destaca en comprensión de gráficos/imágenes, preguntas y respuestas en documentos, razonamiento multimodal y seguimiento de instrucciones. Procesa imágenes en resolución/aspecto nativo y maneja cualquier número de imágenes dentro de una ventana de contexto de 128K.",
|
||
"pixtral-large-latest.description": "Pixtral Large es un modelo multimodal abierto de 124B parámetros basado en Mistral Large 2, el segundo de nuestra familia multimodal con comprensión de imágenes de nivel frontera.",
|
||
"pro-128k.description": "Spark Pro 128K ofrece una capacidad de contexto muy grande, manejando hasta 128K, ideal para documentos extensos que requieren análisis de texto completo y coherencia a largo plazo, con lógica fluida y soporte diverso de citas en discusiones complejas.",
|
||
"pro-deepseek-r1.description": "Modelo de servicio dedicado empresarial con concurrencia incluida.",
|
||
"pro-deepseek-v3.description": "Modelo de servicio dedicado empresarial con concurrencia incluida.",
|
||
"qwen/qwen3-235b-a22b.description": "Qwen3-235B-A22B es un modelo MoE de 235 mil millones de parámetros de Qwen, con 22 mil millones activos por pasada. Alterna entre un modo de pensamiento para razonamiento complejo, matemáticas y programación, y un modo sin pensamiento para chats eficientes. Ofrece un razonamiento sólido, soporte multilingüe (más de 100 idiomas y dialectos), seguimiento avanzado de instrucciones y uso de herramientas de agentes. Maneja de forma nativa contextos de 32K y escala hasta 131K con YaRN.",
|
||
"qwen/qwen3-235b-a22b:free.description": "Qwen3-235B-A22B es un modelo MoE de 235 mil millones de parámetros de Qwen, con 22 mil millones activos por pasada. Alterna entre un modo de pensamiento para razonamiento complejo, matemáticas y programación, y un modo sin pensamiento para chats eficientes. Ofrece un razonamiento sólido, soporte multilingüe (más de 100 idiomas y dialectos), seguimiento avanzado de instrucciones y uso de herramientas de agentes. Maneja de forma nativa contextos de 32K y escala hasta 131K con YaRN.",
|
||
"qwen/qwen3-30b-a3b.description": "Qwen3 es la última generación de modelos LLM de Qwen con arquitecturas densas y MoE, destacando en razonamiento, soporte multilingüe y tareas avanzadas de agentes. Su capacidad única de alternar entre un modo de pensamiento para razonamiento complejo y un modo sin pensamiento para chats eficientes garantiza un rendimiento versátil y de alta calidad.\n\nQwen3 supera significativamente a modelos anteriores como QwQ y Qwen2.5, ofreciendo excelentes resultados en matemáticas, programación, razonamiento de sentido común, escritura creativa y chat interactivo. La variante Qwen3-30B-A3B tiene 30.5 mil millones de parámetros (3.3 mil millones activos), 48 capas, 128 expertos (8 activos por tarea) y admite contextos de hasta 131K con YaRN, estableciendo un nuevo estándar para modelos abiertos.",
|
||
"qwen/qwen3-30b-a3b:free.description": "Qwen3 es la última generación de modelos LLM de Qwen con arquitecturas densas y MoE, destacando en razonamiento, soporte multilingüe y tareas avanzadas de agentes. Su capacidad única de alternar entre un modo de pensamiento para razonamiento complejo y un modo sin pensamiento para chats eficientes garantiza un rendimiento versátil y de alta calidad.\n\nQwen3 supera significativamente a modelos anteriores como QwQ y Qwen2.5, ofreciendo excelentes resultados en matemáticas, programación, razonamiento de sentido común, escritura creativa y chat interactivo. La variante Qwen3-30B-A3B tiene 30.5 mil millones de parámetros (3.3 mil millones activos), 48 capas, 128 expertos (8 activos por tarea) y admite contextos de hasta 131K con YaRN, estableciendo un nuevo estándar para modelos abiertos.",
|
||
"qwen/qwen3-32b.description": "Qwen3-32B es un modelo LLM causal denso de 32.8 mil millones de parámetros optimizado para razonamiento complejo y chat eficiente. Alterna entre un modo de pensamiento para matemáticas, programación y lógica, y un modo sin pensamiento para chats generales más rápidos. Tiene un rendimiento destacado en seguimiento de instrucciones, uso de herramientas de agentes y escritura creativa en más de 100 idiomas y dialectos. Maneja de forma nativa contextos de 32K y escala hasta 131K con YaRN.",
|
||
"qwen/qwen3-32b:free.description": "Qwen3-32B es un modelo LLM causal denso de 32.8 mil millones de parámetros optimizado para razonamiento complejo y chat eficiente. Alterna entre un modo de pensamiento para matemáticas, programación y lógica, y un modo sin pensamiento para chats generales más rápidos. Tiene un rendimiento destacado en seguimiento de instrucciones, uso de herramientas de agentes y escritura creativa en más de 100 idiomas y dialectos. Maneja de forma nativa contextos de 32K y escala hasta 131K con YaRN.",
|
||
"qwen/qwen3-8b:free.description": "Qwen3-8B es un modelo LLM causal denso de 8.2 mil millones de parámetros diseñado para tareas con alto requerimiento de razonamiento y chat eficiente. Alterna entre un modo de pensamiento para matemáticas, programación y lógica, y un modo sin pensamiento para chat general. Ajustado finamente para seguimiento de instrucciones, integración con agentes y escritura creativa en más de 100 idiomas y dialectos. Soporta de forma nativa contextos de 32K y escala hasta 131K con YaRN.",
|
||
"qwen/qwen3-coder-plus.description": "Qwen3-Coder-Plus es un modelo de agente de programación de la serie Qwen optimizado para un uso más complejo de herramientas y sesiones prolongadas.",
|
||
"qwen/qwen3-coder.description": "Qwen3-Coder es la familia de modelos de generación de código de Qwen3, destacando en comprensión y generación de código en documentos extensos.",
|
||
"qwen/qwen3-max-preview.description": "Qwen3 Max (vista previa) es la variante Max para razonamiento avanzado e integración de herramientas.",
|
||
"qwen/qwen3-max.description": "Qwen3 Max es el modelo de razonamiento de gama alta de la serie Qwen3, diseñado para razonamiento multilingüe e integración de herramientas.",
|
||
"qwen/qwen3-vl-plus.description": "Qwen3 VL-Plus es la variante de Qwen3 mejorada con visión, con razonamiento multimodal mejorado y procesamiento de video.",
|
||
"qwen2.5-14b-instruct-1m.description": "Modelo Qwen2.5 de código abierto con 72 mil millones de parámetros.",
|
||
"qwen2.5-14b-instruct.description": "Modelo Qwen2.5 de código abierto con 14 mil millones de parámetros.",
|
||
"qwen2.5-32b-instruct.description": "Modelo Qwen2.5 de código abierto con 32 mil millones de parámetros.",
|
||
"qwen2.5-72b-instruct.description": "Modelo Qwen2.5 de código abierto con 72 mil millones de parámetros.",
|
||
"qwen2.5-7b-instruct.description": "Qwen2.5 7B Instruct es un modelo de instrucciones de código abierto maduro para chat y generación en múltiples escenarios.",
|
||
"qwen2.5-coder-1.5b-instruct.description": "Modelo de código Qwen de código abierto.",
|
||
"qwen2.5-coder-14b-instruct.description": "Modelo de código Qwen de código abierto.",
|
||
"qwen2.5-coder-32b-instruct.description": "Modelo de código Qwen de código abierto.",
|
||
"qwen2.5-coder-7b-instruct.description": "Modelo de código Qwen de código abierto.",
|
||
"qwen2.5-coder-instruct.description": "Qwen2.5-Coder es el último modelo LLM enfocado en código de la familia Qwen (anteriormente CodeQwen).",
|
||
"qwen2.5-instruct.description": "Qwen2.5 es la última serie de modelos LLM de Qwen, con modelos base y ajustados por instrucciones que van desde 0.5B hasta 72B parámetros.",
|
||
"qwen2.5-math-1.5b-instruct.description": "Qwen-Math ofrece una sólida capacidad para resolver problemas matemáticos.",
|
||
"qwen2.5-math-72b-instruct.description": "Qwen-Math ofrece una sólida capacidad para resolver problemas matemáticos.",
|
||
"qwen2.5-math-7b-instruct.description": "Qwen-Math ofrece una sólida capacidad para resolver problemas matemáticos.",
|
||
"qwen2.5-omni-7b.description": "Los modelos Qwen-Omni admiten entradas multimodales (video, audio, imágenes, texto) y generan audio y texto.",
|
||
"qwen2.5-vl-32b-instruct.description": "Qwen2.5 VL 32B Instruct es un modelo multimodal de código abierto adecuado para despliegue privado y uso en múltiples escenarios.",
|
||
"qwen2.5-vl-72b-instruct.description": "Mejora en seguimiento de instrucciones, matemáticas, resolución de problemas y programación, con mejor reconocimiento general de objetos. Soporta localización precisa de elementos visuales en varios formatos, comprensión de videos largos (hasta 10 minutos) con temporización de eventos a nivel de segundo, orden temporal y comprensión de velocidad, y agentes que pueden controlar sistemas operativos o móviles mediante análisis y localización. Fuerte extracción de información clave y salida en formato JSON. Esta es la versión más potente de la serie, con 72B.",
|
||
"qwen2.5-vl-7b-instruct.description": "Qwen2.5 VL 7B Instruct es un modelo multimodal ligero que equilibra el costo de despliegue y la capacidad de reconocimiento.",
|
||
"qwen2.5-vl-instruct.description": "Qwen2.5-VL es el último modelo de visión y lenguaje de la familia Qwen.",
|
||
"qwen2.5.description": "Qwen2.5 es el modelo de lenguaje de nueva generación de Alibaba con un rendimiento sólido en diversos casos de uso.",
|
||
"qwen2.5:0.5b.description": "Qwen2.5 es el modelo de lenguaje de nueva generación de Alibaba con un rendimiento sólido en diversos casos de uso.",
|
||
"qwen2.5:1.5b.description": "Qwen2.5 es el modelo de lenguaje de nueva generación de Alibaba con un rendimiento sólido en diversos casos de uso.",
|
||
"qwen2.5:72b.description": "Qwen2.5 es el modelo de lenguaje de nueva generación de Alibaba con un rendimiento sólido en diversos casos de uso.",
|
||
"qwen2.description": "Qwen2 es el modelo de lenguaje de nueva generación de Alibaba con un rendimiento sólido en diversos casos de uso.",
|
||
"qwen2:0.5b.description": "Qwen2 es el modelo de lenguaje de nueva generación de Alibaba con un rendimiento sólido en diversos casos de uso.",
|
||
"qwen2:1.5b.description": "Qwen2 es el modelo de lenguaje de nueva generación de Alibaba con un rendimiento sólido en diversos casos de uso.",
|
||
"qwen2:72b.description": "Qwen2 es el modelo de lenguaje de nueva generación de Alibaba con un rendimiento sólido en diversos casos de uso.",
|
||
"stable-diffusion-3.5-large.description": "stable-diffusion-3.5-large es un modelo de texto a imagen MMDiT con 800 millones de parámetros que ofrece una excelente calidad y alineación con los prompts, compatible con imágenes de 1 megapíxel y ejecución eficiente en hardware de consumo.",
|
||
"stable-diffusion-v1.5.description": "stable-diffusion-v1.5 se inicializa desde el checkpoint v1.2 y se afina durante 595k pasos en \"laion-aesthetics v2 5+\" a una resolución de 512x512, reduciendo el condicionamiento de texto en un 10% para mejorar el muestreo sin clasificador.",
|
||
"stable-diffusion-xl-base-1.0.description": "Un modelo de texto a imagen de código abierto de Stability AI con generación creativa de imágenes líder en la industria. Posee una sólida comprensión de instrucciones y admite definiciones inversas de prompts para una generación precisa.",
|
||
"stable-diffusion-xl.description": "stable-diffusion-xl presenta mejoras significativas respecto a la versión v1.5 y alcanza resultados comparables con los mejores modelos de texto a imagen de código abierto. Las mejoras incluyen una red UNet 3 veces más grande, un módulo de refinamiento para mayor calidad de imagen y técnicas de entrenamiento más eficientes.",
|
||
"step-1-128k.description": "Equilibra rendimiento y costo para escenarios generales.",
|
||
"step-1-256k.description": "Manejo de contexto extra largo, ideal para análisis de documentos extensos.",
|
||
"step-1-32k.description": "Admite conversaciones de longitud media para una amplia gama de escenarios.",
|
||
"step-1-8k.description": "Modelo pequeño adecuado para tareas ligeras.",
|
||
"step-1-flash.description": "Modelo de alta velocidad adecuado para chat en tiempo real.",
|
||
"step-1.5v-mini.description": "Capacidades sólidas de comprensión de video.",
|
||
"step-1o-turbo-vision.description": "Fuerte comprensión de imágenes, supera al modelo 1o en matemáticas y programación. Más pequeño que 1o y con salida más rápida.",
|
||
"step-1o-vision-32k.description": "Fuerte comprensión visual con mejor rendimiento que la serie Step-1V.",
|
||
"step-1v-32k.description": "Admite entradas visuales para una interacción multimodal más rica.",
|
||
"step-1v-8k.description": "Modelo visual pequeño para tareas básicas de imagen y texto.",
|
||
"step-1x-edit.description": "Este modelo se centra en la edición de imágenes, modificando y mejorando imágenes a partir de texto e imágenes proporcionadas por el usuario. Admite múltiples formatos de entrada y genera ediciones alineadas con la intención del usuario.",
|
||
"step-1x-medium.description": "Este modelo ofrece una sólida generación de imágenes a partir de texto. Con soporte nativo para chino, comprende mejor las descripciones en ese idioma, capturando su semántica y transformándola en características visuales para una generación más precisa. Produce imágenes de alta resolución y calidad, y admite cierto grado de transferencia de estilo.",
|
||
"step-2-16k-exp.description": "Versión experimental de Step-2 con las últimas funciones y actualizaciones continuas. No se recomienda para producción.",
|
||
"step-2-16k.description": "Admite interacciones de gran contexto para diálogos complejos.",
|
||
"step-2-mini.description": "Basado en la arquitectura de atención MFA de próxima generación, ofrece resultados similares a Step-1 con menor costo, mayor rendimiento y menor latencia. Maneja tareas generales con gran capacidad de programación.",
|
||
"step-2x-large.description": "Modelo de imagen de nueva generación StepFun centrado en la generación de imágenes, produce imágenes de alta calidad a partir de texto. Ofrece texturas más realistas y mejor representación de texto en chino e inglés.",
|
||
"step-3.description": "Este modelo posee una fuerte percepción visual y razonamiento complejo, manejando con precisión el entendimiento de conocimientos multidominio, análisis matemático-visual y una amplia gama de tareas de análisis visual cotidiano.",
|
||
"step-r1-v-mini.description": "Modelo de razonamiento con sólida comprensión de imágenes que puede procesar imágenes y texto, y luego generar texto tras un razonamiento profundo. Destaca en razonamiento visual y ofrece rendimiento de primer nivel en matemáticas, programación y razonamiento textual, con una ventana de contexto de 100K.",
|
||
"stepfun-ai/step3.description": "Step3 es un modelo de razonamiento multimodal de vanguardia de StepFun, basado en una arquitectura MoE con 321B parámetros totales y 38B activos. Su diseño de extremo a extremo minimiza el costo de decodificación mientras ofrece razonamiento visión-lenguaje de primer nivel. Con diseño MFA y AFD, es eficiente tanto en aceleradores de gama alta como baja. Su preentrenamiento incluye más de 20T de tokens de texto y 4T de tokens imagen-texto en múltiples idiomas. Alcanza un rendimiento líder entre modelos abiertos en matemáticas, código y benchmarks multimodales.",
|
||
"taichu_llm.description": "Entrenado con datos masivos de alta calidad, con mejor comprensión de texto, creación de contenido y preguntas y respuestas conversacionales.",
|
||
"taichu_o1.description": "taichu_o1 es un modelo de razonamiento de nueva generación que utiliza interacción multimodal y aprendizaje por refuerzo para lograr un pensamiento en cadena similar al humano, admite simulación de decisiones complejas y expone rutas de razonamiento manteniendo alta precisión, ideal para análisis estratégico y pensamiento profundo.",
|
||
"taichu_vl.description": "Combina comprensión de imágenes, transferencia de conocimiento y atribución lógica, destacando en preguntas y respuestas imagen-texto.",
|
||
"tencent/Hunyuan-A13B-Instruct.description": "Hunyuan-A13B-Instruct utiliza 80B parámetros totales con 13B activos para igualar modelos más grandes. Admite razonamiento híbrido rápido/lento, comprensión estable de textos largos y capacidad líder de agentes en BFCL-v3 y τ-Bench. GQA y formatos multi-cuánticos permiten inferencia eficiente.",
|
||
"tencent/Hunyuan-MT-7B.description": "El modelo de traducción Hunyuan incluye Hunyuan-MT-7B y el conjunto Hunyuan-MT-Chimera. Hunyuan-MT-7B es un modelo ligero de 7B que admite 33 idiomas y 5 lenguas minoritarias chinas. En WMT25 obtuvo 30 primeros lugares en 31 pares de idiomas. Tencent Hunyuan utiliza una canalización completa de entrenamiento desde preentrenamiento hasta SFT, RL de traducción y RL en conjunto, logrando un rendimiento líder en su tamaño con implementación eficiente y sencilla.",
|
||
"text-embedding-3-large.description": "El modelo de embedding más potente para tareas en inglés y otros idiomas.",
|
||
"text-embedding-3-small.description": "Modelo de embedding de próxima generación eficiente y rentable para recuperación y escenarios RAG.",
|
||
"thudm/glm-4-32b.description": "GLM-4-32B-0414 es un modelo bilingüe (chino/inglés) de 32B con pesos abiertos, optimizado para generación de código, llamadas a funciones y tareas de agentes. Preentrenado con 15T de datos de alta calidad y centrados en razonamiento, afinado con alineación de preferencias humanas, muestreo de rechazo y RL. Destaca en razonamiento complejo, generación de artefactos y salida estructurada, alcanzando el nivel de rendimiento de GPT-4o y DeepSeek-V3-0324 en múltiples benchmarks.",
|
||
"thudm/glm-4-32b:free.description": "GLM-4-32B-0414 es un modelo bilingüe (chino/inglés) de 32B con pesos abiertos, optimizado para generación de código, llamadas a funciones y tareas de agentes. Preentrenado con 15T de datos de alta calidad y centrados en razonamiento, afinado con alineación de preferencias humanas, muestreo de rechazo y RL. Destaca en razonamiento complejo, generación de artefactos y salida estructurada, alcanzando el nivel de rendimiento de GPT-4o y DeepSeek-V3-0324 en múltiples benchmarks.",
|
||
"thudm/glm-4-9b-chat.description": "Versión de código abierto del último modelo preentrenado GLM-4 de Zhipu AI.",
|
||
"thudm/glm-z1-32b.description": "GLM-Z1-32B-0414 es una variante de razonamiento mejorado de GLM-4-32B, diseñada para resolver problemas profundos centrados en matemáticas, lógica y código. Aplica RL ampliado (preferencias específicas de tarea y generales) para mejorar tareas complejas de múltiples pasos. En comparación con GLM-4-32B, Z1 mejora significativamente el razonamiento estructurado y la capacidad en dominios formales.\n\nAdmite pasos de “pensamiento” mediante ingeniería de prompts, mejora la coherencia en salidas largas y está optimizado para flujos de trabajo de agentes con contexto largo (vía YaRN), llamadas a herramientas JSON y muestreo detallado para razonamiento estable. Ideal para casos que requieren derivaciones formales o de múltiples pasos cuidadosas.",
|
||
"thudm/glm-z1-rumination-32b.description": "GLM Z1 Rumination 32B es un modelo de razonamiento profundo de 32B de la serie GLM-4-Z1, optimizado para tareas abiertas complejas que requieren pensamiento prolongado. Basado en glm-4-32b-0414, añade etapas adicionales de RL y alineación multietapa, introduciendo una capacidad de “rumiación” que simula procesamiento cognitivo extendido. Esto incluye razonamiento iterativo, análisis multi-hop y flujos de trabajo aumentados con herramientas como búsqueda, recuperación y síntesis con conciencia de citas.\n\nDestaca en redacción de investigaciones, análisis comparativo y preguntas complejas. Admite llamadas a funciones para primitivas de búsqueda/navegación (`search`, `click`, `open`, `finish`) para flujos de agentes. El comportamiento de rumiación se controla mediante bucles multironda con modelado de recompensas basado en reglas y mecanismos de decisión diferida, evaluado frente a marcos de investigación profunda como el stack de alineación interno de OpenAI. Esta variante prioriza la profundidad sobre la velocidad.",
|
||
"z-ai/glm-4.6.description": "GLM 4.6 es el modelo insignia de Z.AI, con una longitud de contexto ampliada y capacidades avanzadas de programación.",
|
||
"zai-glm-4.6.description": "Destaca en tareas de programación y razonamiento, admite transmisión en tiempo real y llamadas a herramientas, y se adapta a la codificación agente y al razonamiento complejo.",
|
||
"zai-org/GLM-4.5-Air.description": "GLM-4.5-Air es un modelo base para aplicaciones de agentes que utiliza una arquitectura de Mezcla de Expertos (MoE). Está optimizado para el uso de herramientas, navegación web, ingeniería de software y programación frontend, e integra agentes de código como Claude Code y Roo Code. Emplea razonamiento híbrido para abordar tanto escenarios complejos como situaciones cotidianas.",
|
||
"zai-org/GLM-4.5.description": "GLM-4.5 es un modelo base diseñado para aplicaciones de agentes con una arquitectura de Mezcla de Expertos (MoE). Está profundamente optimizado para el uso de herramientas, navegación web, ingeniería de software y programación frontend, e integra agentes de código como Claude Code y Roo Code. Utiliza razonamiento híbrido para manejar tanto razonamientos complejos como escenarios cotidianos.",
|
||
"zai-org/GLM-4.5V.description": "GLM-4.5V es el último modelo VLM de Zhipu AI, basado en el modelo de texto insignia GLM-4.5-Air (106B en total, 12B activos) con una arquitectura MoE que ofrece alto rendimiento a menor costo. Sigue la línea de pensamiento de GLM-4.1V-Thinking y añade 3D-RoPE para mejorar el razonamiento espacial en 3D. Optimizado mediante preentrenamiento, SFT y RL, maneja imágenes, videos y documentos extensos, y se posiciona entre los mejores modelos abiertos en 41 benchmarks multimodales públicos. Un modo de pensamiento configurable permite equilibrar velocidad y profundidad.",
|
||
"zai-org/GLM-4.6.description": "En comparación con GLM-4.5, GLM-4.6 amplía el contexto de 128K a 200K para abordar tareas de agentes más complejas. Obtiene mejores puntuaciones en benchmarks de código y muestra un rendimiento superior en aplicaciones reales como Claude Code, Cline, Roo Code y Kilo Code, incluyendo una mejor generación de páginas frontend. El razonamiento ha sido mejorado y se admite el uso de herramientas durante el proceso, fortaleciendo su capacidad general. Se integra mejor en marcos de trabajo de agentes, mejora los agentes de búsqueda y herramientas, y ofrece un estilo de escritura más natural y preferido por los usuarios, así como una mayor naturalidad en la simulación de roles.",
|
||
"zai/glm-4.5-air.description": "GLM-4.5 y GLM-4.5-Air son nuestros modelos insignia más recientes para aplicaciones de agentes, ambos con arquitectura MoE. GLM-4.5 cuenta con 355B en total y 32B activos por pasada; GLM-4.5-Air es más liviano, con 106B en total y 12B activos.",
|
||
"zai/glm-4.5.description": "La serie GLM-4.5 está diseñada para agentes. El modelo insignia GLM-4.5 combina razonamiento, programación y habilidades de agente con 355B de parámetros totales (32B activos) y ofrece modos de operación dual como sistema de razonamiento híbrido.",
|
||
"zai/glm-4.5v.description": "GLM-4.5V se basa en GLM-4.5-Air, heredando técnicas comprobadas de GLM-4.1V-Thinking y escalando con una sólida arquitectura MoE de 106B parámetros.",
|
||
"zenmux/auto.description": "El enrutamiento automático de ZenMux selecciona el modelo con mejor relación calidad-rendimiento entre las opciones compatibles según tu solicitud."
|
||
}
|