Files
Rdmclin2 60bed5782f chore: update i18n (#15712)
chore: update i18n files
2026-06-12 16:21:34 +08:00

1350 lines
333 KiB
JSON
Raw Permalink Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
{
"01-ai/yi-1.5-34b-chat.description": "O modelo open-source mais recente da 01.AI, ajustado com 34 bilhões de parâmetros. Suporta múltiplos cenários de diálogo, treinado com dados de alta qualidade e alinhado às preferências humanas.",
"01-ai/yi-1.5-9b-chat.description": "O modelo open-source mais recente da 01.AI, ajustado com 9 bilhões de parâmetros. Suporta múltiplos cenários de diálogo, treinado com dados de alta qualidade e alinhado às preferências humanas.",
"360/deepseek-r1.description": "O DeepSeek-R1 implantado pela 360 utiliza aprendizado por reforço em larga escala no pós-treinamento para melhorar significativamente o raciocínio com poucos rótulos. Alcança desempenho comparável ao OpenAI o1 em tarefas de matemática, programação e raciocínio em linguagem natural.",
"360gpt-pro-trans.description": "Modelo especializado em tradução, profundamente ajustado para oferecer qualidade de tradução de ponta.",
"360gpt-pro.description": "O 360GPT Pro é um modelo central da 360 AI com processamento de texto eficiente para diversos cenários de PLN, com suporte à compreensão de textos longos e diálogos de múltiplas interações.",
"360gpt-turbo-responsibility-8k.description": "O 360GPT Turbo Responsibility 8K enfatiza a segurança semântica e a responsabilidade em aplicações sensíveis a conteúdo, garantindo experiências precisas e robustas para o usuário.",
"360gpt-turbo.description": "O 360GPT Turbo oferece forte capacidade de computação e chat com excelente compreensão semântica e eficiência de geração, ideal para empresas e desenvolvedores.",
"360gpt2-o1.description": "O 360gpt2-o1 constrói cadeias de raciocínio por meio de busca em árvore com mecanismo de reflexão e treinamento por reforço, permitindo autorreflexão e autocorreção.",
"360gpt2-pro.description": "O 360GPT2 Pro é um modelo avançado de PLN da 360 com excelente geração e compreensão de texto, especialmente para tarefas criativas, transformações complexas e simulações de papéis.",
"360zhinao2-o1.5.description": "360 Zhinao, o modelo de raciocínio mais poderoso, com as capacidades mais avançadas, suportando tanto chamadas de ferramentas quanto raciocínio avançado.",
"360zhinao2-o1.description": "O 360zhinao2-o1 constrói cadeias de raciocínio por meio de busca em árvore com mecanismo de reflexão e treinamento por reforço, permitindo autorreflexão e autocorreção.",
"360zhinao3-o1.5.description": "360 Zhinao, modelo de raciocínio de próxima geração.",
"4.0Ultra.description": "O Spark Ultra é o modelo mais poderoso da série Spark, aprimorando a compreensão e a sumarização de texto, além de melhorar a busca na web. É uma solução completa para aumentar a produtividade no trabalho e fornecer respostas precisas, posicionando-se como um produto inteligente de destaque.",
"AnimeSharp.description": "AnimeSharp (também conhecido como \"4x-AnimeSharp\") é um modelo open-source de super-resolução baseado no ESRGAN de Kim2091, focado em ampliar e aprimorar imagens no estilo anime. Foi renomeado de \"4x-TextSharpV1\" em fevereiro de 2022, originalmente também voltado para imagens de texto, mas fortemente otimizado para conteúdo de anime.",
"Baichuan-M2-Plus.description": "Apresentamos o Baichuan-M2, um modelo de raciocínio aprimorado para aplicações médicas, projetado para tarefas reais de raciocínio clínico. Partindo de questões médicas reais, conduzimos treinamento por reforço baseado em um sistema de verificação em larga escala. Mantendo as capacidades gerais do modelo, a efetividade médica do Baichuan-M2 alcançou um avanço significativo. Até o momento, Baichuan-M2 é o melhor modelo médico de código aberto do mundo. Ele supera todos os modelos open-source, incluindo o gpt-oss-120b, assim como muitos modelos fechados de ponta no benchmark HealthBench. É o modelo open-source mais próximo do GPT-5 em capacidades médicas. Nossa prática demonstra que um verificador robusto é essencial para conectar as capacidades do modelo ao mundo real, e que uma abordagem de aprendizado por reforço ponta a ponta aprimora fundamentalmente as habilidades de raciocínio médico do modelo. A liberação do Baichuan-M2 avança o estado da arte na área de inteligência artificial médica.",
"Baichuan-M2.description": "Apresentamos o Baichuan-M2, um modelo de raciocínio aprimorado para aplicações médicas, projetado para tarefas reais de raciocínio clínico. Partindo de questões médicas reais, conduzimos treinamento por reforço baseado em um sistema de verificação em larga escala. Mantendo as capacidades gerais do modelo, a efetividade médica do Baichuan-M2 alcançou um avanço significativo. Até o momento, Baichuan-M2 é o melhor modelo médico de código aberto do mundo. Ele supera todos os modelos open-source, incluindo o gpt-oss-120b, assim como muitos modelos fechados de ponta no benchmark HealthBench. É o modelo open-source mais próximo do GPT-5 em capacidades médicas. Nossa prática demonstra que um verificador robusto é essencial para conectar as capacidades do modelo ao mundo real, e que uma abordagem de aprendizado por reforço ponta a ponta aprimora fundamentalmente as habilidades de raciocínio médico do modelo. A liberação do Baichuan-M2 avança o estado da arte na área de inteligência artificial médica.",
"Baichuan-M3-Plus.description": "Apresentamos o Baichuan-M3, um modelo de linguagem de nova geração, aprimorado para aplicações médicas e projetado para oferecer suporte clínico de nível profissional. Diferente de abordagens anteriores centradas apenas em perguntas e respostas estáticas ou interações superficiais, o Baichuan-M3 é treinado para modelar explicitamente o processo de tomada de decisão clínica, visando melhorar a usabilidade e a confiabilidade na prática médica real. Em vez de apenas gerar respostas plausíveis, perguntas em estilo médico ou recomendações genéricas como “procure atendimento médico o mais rápido possível”, o Baichuan-M3 é treinado para adquirir proativamente informações clínicas críticas, construir linhas de raciocínio médico coerentes e restringir sistematicamente comportamentos propensos a alucinações ao longo do processo decisório. Esse design confere ao modelo capacidades intrinsecamente aprimoradas alinhadas ao fluxo de trabalho clínico real. Em avaliações de investigação clínica, robustez contra alucinações médicas, HealthBench e HealthBench-Hard, o Baichuan-M3 supera o mais novo modelo de ponta da OpenAI, o GPT-5.2, estabelecendo um novo patamar para modelos de linguagem avançados em medicina.",
"Baichuan-M3.description": "Apresentamos o Baichuan-M3, um modelo de linguagem de nova geração, aprimorado para aplicações médicas e projetado para oferecer suporte clínico de nível profissional. Diferente de abordagens anteriores centradas apenas em perguntas e respostas estáticas ou interações superficiais, o Baichuan-M3 é treinado para modelar explicitamente o processo de tomada de decisão clínica, visando melhorar a usabilidade e a confiabilidade na prática médica real. Em vez de apenas gerar respostas plausíveis, perguntas em estilo médico ou recomendações genéricas como “procure atendimento médico o mais rápido possível”, o Baichuan-M3 é treinado para adquirir proativamente informações clínicas críticas, construir linhas de raciocínio médico coerentes e restringir sistematicamente comportamentos propensos a alucinações ao longo do processo decisório. Esse design confere ao modelo capacidades intrinsecamente aprimoradas alinhadas ao fluxo de trabalho clínico real. Em avaliações de investigação clínica, robustez contra alucinações médicas, HealthBench e HealthBench-Hard, o Baichuan-M3 supera o mais novo modelo de ponta da OpenAI, o GPT-5.2, estabelecendo um novo patamar para modelos de linguagem avançados em medicina.",
"Baichuan2-Turbo.description": "Utiliza aumento por busca para conectar o modelo ao conhecimento de domínio e da web. Suporta upload de arquivos PDF/Word e entrada de URLs para recuperação abrangente e atualizada, com saídas profissionais e precisas.",
"Baichuan3-Turbo-128k.description": "Com uma janela de contexto ultra longa de 128K, é otimizado para cenários empresariais de alta frequência, com ganhos significativos e alto valor. Em comparação com o Baichuan2, a criação de conteúdo melhora em 20%, perguntas e respostas em 17% e simulação de papéis em 40%. O desempenho geral supera o GPT-3.5.",
"Baichuan3-Turbo.description": "Otimizado para cenários empresariais de alta frequência, com ganhos significativos e alto valor. Em comparação com o Baichuan2, a criação de conteúdo melhora em 20%, perguntas e respostas em 17% e simulação de papéis em 40%. O desempenho geral supera o GPT-3.5.",
"Baichuan4-Air.description": "Modelo de alto desempenho na China, superando modelos internacionais em tarefas em chinês como conhecimento, textos longos e geração criativa. Também possui capacidades multimodais líderes do setor com resultados fortes em benchmarks reconhecidos.",
"Baichuan4-Turbo.description": "Modelo de alto desempenho na China, superando modelos internacionais em tarefas em chinês como conhecimento, textos longos e geração criativa. Também possui capacidades multimodais líderes do setor com resultados fortes em benchmarks reconhecidos.",
"Baichuan4.description": "Desempenho doméstico de ponta, superando modelos internacionais líderes em tarefas em chinês como conhecimento enciclopédico, textos longos e geração criativa. Também oferece capacidades multimodais líderes do setor e resultados sólidos em benchmarks.",
"ByteDance-Seed/Seed-OSS-36B-Instruct.description": "Seed-OSS é uma família de LLMs open-source da ByteDance Seed, projetada para lidar com contextos longos, raciocínio, agentes e habilidades gerais. O Seed-OSS-36B-Instruct é um modelo de 36B ajustado por instruções com suporte nativo a contextos ultra longos, ideal para processar grandes documentos ou bases de código. É otimizado para raciocínio, geração de código e tarefas de agente (uso de ferramentas), mantendo forte capacidade geral. Um recurso-chave é o \"Orçamento de Pensamento\", que permite flexibilidade no comprimento do raciocínio para melhorar a eficiência.",
"DeepSeek-OCR.description": "DeepSeek-OCR é um modelo visãolinguagem da DeepSeek AI focado em OCR e \"compressão óptica de contexto\". Ele explora a compressão de contexto a partir de imagens, processa documentos de forma eficiente e os converte em texto estruturado (por exemplo, Markdown). Reconhece texto em imagens com alta precisão, sendo ideal para digitalização de documentos, extração de texto e processamento estruturado.",
"DeepSeek-R1-Distill-Llama-70B.description": "DeepSeek R1, o modelo maior e mais inteligente da suíte DeepSeek, foi destilado na arquitetura Llama 70B. Benchmarks e avaliações humanas mostram que é mais inteligente que o Llama 70B base, especialmente em tarefas de matemática e precisão factual.",
"DeepSeek-R1-Distill-Qwen-1.5B.description": "Modelo destilado do DeepSeek-R1 baseado no Qwen2.5-Math-1.5B. Aprendizado por reforço e dados de inicialização a frio otimizam o desempenho em raciocínio, estabelecendo novos benchmarks multitarefa para modelos open-source.",
"DeepSeek-R1-Distill-Qwen-14B.description": "Um modelo destilado DeepSeek-R1 baseado no Qwen2.5-14B. Aprendizado por reforço e dados de inicialização a frio otimizam o desempenho de raciocínio, estabelecendo novos benchmarks de multitarefa para modelos abertos.",
"DeepSeek-R1-Distill-Qwen-32B.description": "A série DeepSeek-R1 melhora o desempenho de raciocínio com aprendizado por reforço e dados de inicialização a frio, estabelecendo novos benchmarks de multitarefa para modelos abertos e superando o OpenAI o1-mini.",
"DeepSeek-R1-Distill-Qwen-7B.description": "Modelo destilado do DeepSeek-R1 baseado no Qwen2.5-Math-7B. Aprendizado por reforço e dados de inicialização a frio otimizam o desempenho em raciocínio, estabelecendo novos benchmarks multitarefa para modelos open-source.",
"DeepSeek-R1.description": "LLM eficiente de última geração, forte em raciocínio, matemática e programação.",
"DeepSeek-V3-1.description": "O DeepSeek V3.1 é um modelo de raciocínio de próxima geração com raciocínio complexo aprimorado e cadeia de pensamento, adequado para tarefas de análise profunda.",
"DeepSeek-V3-Fast.description": "Fornecedor: sophnet. O DeepSeek V3 Fast é a versão de alta TPS do DeepSeek V3 0324, com precisão total (não quantizado), respostas mais rápidas e desempenho superior em código e matemática.",
"DeepSeek-V3.1-Think.description": "Modo de pensamento do DeepSeek-V3.1: um novo modelo híbrido de raciocínio com modos de pensamento e não pensamento, mais eficiente que o DeepSeek-R1-0528. Otimizações no pós-treinamento melhoram significativamente o uso de ferramentas de agente e o desempenho em tarefas de agente.",
"DeepSeek-V3.2.description": "deepseek-v3.2 introduz um mecanismo de atenção esparsa, com o objetivo de melhorar a eficiência de treinamento e inferência no processamento de textos longos, com preço menor que o deepseek-v3.1.",
"DeepSeek-V3.description": "A implantação aberta do Volcengine da ByteDance é atualmente a mais estável; recomendada. Foi automaticamente atualizada para a versão mais recente (250324).",
"Doubao-lite-128k.description": "O Doubao-lite oferece respostas ultra rápidas e melhor custo-benefício, com opções flexíveis para diversos cenários. Suporta contexto de 128K para inferência e ajuste fino.",
"Doubao-lite-32k.description": "O Doubao-lite oferece respostas ultra rápidas e melhor custo-benefício, com opções flexíveis para diversos cenários. Suporta contexto de 32K para inferência e ajuste fino.",
"Doubao-lite-4k.description": "O Doubao-lite oferece respostas ultra rápidas e melhor custo-benefício, com opções flexíveis para diversos cenários. Suporta contexto de 4K para inferência e ajuste fino.",
"Doubao-pro-128k.description": "Modelo carro-chefe de melhor desempenho para tarefas complexas, com excelência em perguntas e respostas com referência, sumarização, criação, classificação e simulação de papéis. Suporta contexto de 128K para inferência e ajuste fino.",
"Doubao-pro-32k.description": "Modelo carro-chefe de melhor desempenho para tarefas complexas, com excelência em perguntas e respostas com referência, sumarização, criação, classificação e simulação de papéis. Suporta contexto de 32K para inferência e ajuste fino.",
"Doubao-pro-4k.description": "Modelo carro-chefe de melhor desempenho para tarefas complexas, com excelência em perguntas e respostas com referência, sumarização, criação, classificação e simulação de papéis. Suporta contexto de 4K para inferência e ajuste fino.",
"DreamO.description": "DreamO é um modelo open-source de personalização de imagens desenvolvido em conjunto pela ByteDance e pela Universidade de Pequim, utilizando uma arquitetura unificada para suportar geração de imagens multitarefa. Emprega modelagem composicional eficiente para gerar imagens altamente consistentes e personalizadas com base em identidade, tema, estilo, fundo e outras condições especificadas pelo usuário.",
"ERNIE-3.5-128K.description": "Modelo LLM de grande escala da Baidu, treinado com vastos corpora em chinês/inglês, com forte capacidade geral para conversas, criação e uso de plugins; suporta integração automática com o plugin de busca Baidu para respostas atualizadas.",
"ERNIE-3.5-8K-Preview.description": "Modelo LLM de grande escala da Baidu, treinado com vastos corpora em chinês/inglês, com forte capacidade geral para conversas, criação e uso de plugins; suporta integração automática com o plugin de busca Baidu para respostas atualizadas.",
"ERNIE-3.5-8K.description": "Modelo LLM de grande escala da Baidu, treinado com vastos corpora em chinês/inglês, com forte capacidade geral para conversas, criação e uso de plugins; suporta integração automática com o plugin de busca Baidu para respostas atualizadas.",
"ERNIE-4.0-8K-Latest.description": "Modelo LLM ultra-avançado da Baidu com melhorias abrangentes em relação ao ERNIE 3.5, adequado para tarefas complexas em diversos domínios; suporta integração com o plugin de busca Baidu para respostas atualizadas.",
"ERNIE-4.0-8K-Preview.description": "Modelo LLM ultra-avançado da Baidu com melhorias abrangentes em relação ao ERNIE 3.5, adequado para tarefas complexas em diversos domínios; suporta integração com o plugin de busca Baidu para respostas atualizadas.",
"ERNIE-4.0-Turbo-8K-Latest.description": "Modelo LLM ultra-avançado da Baidu com desempenho geral robusto para tarefas complexas, com integração ao plugin de busca Baidu para respostas atualizadas. Supera o ERNIE 4.0.",
"ERNIE-4.0-Turbo-8K-Preview.description": "Modelo LLM ultra-avançado da Baidu com desempenho geral robusto para tarefas complexas, com integração ao plugin de busca Baidu para respostas atualizadas. Supera o ERNIE 4.0.",
"ERNIE-Character-8K.description": "Modelo LLM da Baidu voltado para domínios específicos como NPCs de jogos, atendimento ao cliente e interpretação de personagens, com maior consistência de persona, melhor seguimento de instruções e raciocínio aprimorado.",
"ERNIE-Lite-Pro-128K.description": "Modelo LLM leve da Baidu que equilibra qualidade e desempenho de inferência, superior ao ERNIE Lite e adequado para aceleradores de baixo custo computacional.",
"ERNIE-Speed-128K.description": "Modelo LLM de alto desempenho mais recente da Baidu (2024), com forte capacidade geral, ideal como base para ajustes finos em cenários específicos, com excelente desempenho em raciocínio.",
"ERNIE-Speed-Pro-128K.description": "Modelo LLM de alto desempenho mais recente da Baidu (2024), com forte capacidade geral, superior ao ERNIE Speed, ideal como base para ajustes finos com excelente desempenho em raciocínio.",
"FLUX-1.1-pro.description": "FLUX.1.1 Pro",
"FLUX.1-Kontext-dev.description": "FLUX.1-Kontext-dev é um modelo multimodal de geração e edição de imagens do Black Forest Labs baseado em uma arquitetura Rectified Flow Transformer com 12 bilhões de parâmetros. Foca na geração, reconstrução, aprimoramento ou edição de imagens sob condições contextuais específicas. Combina os pontos fortes da geração controlável dos modelos de difusão com o modelamento de contexto dos Transformers, oferecendo saídas de alta qualidade para tarefas como inpainting, outpainting e reconstrução de cenas visuais.",
"FLUX.1-Kontext-pro.description": "FLUX.1 Kontext [pro]",
"FLUX.1-dev.description": "FLUX.1-dev é um modelo de linguagem multimodal de código aberto (MLLM) do Black Forest Labs, otimizado para tarefas de imagem e texto, combinando compreensão e geração de imagem/texto. Baseado em LLMs avançados (como Mistral-7B), utiliza um codificador visual cuidadosamente projetado e ajuste de instruções em múltiplas etapas para permitir coordenação multimodal e raciocínio em tarefas complexas.",
"GLM-4.5-Air.description": "GLM-4.5-Air: Versão leve para respostas rápidas.",
"GLM-4.5.description": "GLM-4.5: Modelo de alto desempenho para raciocínio, programação e tarefas de agentes.",
"GLM-4.6.description": "GLM-4.6: Modelo da geração anterior.",
"GLM-4.7.description": "GLM-4.7 é o modelo principal mais recente da Zhipu, aprimorado para cenários de Codificação Agente com capacidades de programação melhoradas, planejamento de tarefas de longo prazo e colaboração com ferramentas.",
"GLM-5-Turbo.description": "GLM-5-Turbo é um modelo base profundamente otimizado para cenários agentivos. Foi especificamente ajustado desde a fase de treinamento para atender aos requisitos centrais de tarefas de agentes, aprimorando capacidades como invocação de ferramentas, seguir comandos e execução de cadeias longas. É ideal para construir assistentes agentes de alto desempenho.",
"GLM-5.1.description": "GLM-5.1 é o mais recente modelo carro-chefe da Zhipu, uma iteração aprimorada do GLM-5 com capacidades de engenharia agêntica melhoradas para engenharia de sistemas complexos e tarefas de longo prazo.",
"GLM-5.description": "GLM-5 é o modelo base de próxima geração da Zhipu, desenvolvido para Agentic Engineering. Ele oferece produtividade confiável em engenharia de sistemas complexos e tarefas agentivas de longo horizonte. Em programação e capacidades de agente, o GLM-5 atinge desempenho de ponta entre modelos open-source. Em cenários reais de programação, sua experiência de uso se aproxima da do Claude Opus 4.5. Ele se destaca em engenharia de sistemas complexos e tarefas agentivas prolongadas, sendo uma base ideal para assistentes agentes de uso geral.",
"Gryphe/MythoMax-L2-13b.description": "MythoMax-L2 (13B) é um modelo inovador para diversos domínios e tarefas complexas.",
"HelloMeme.description": "HelloMeme é uma ferramenta de IA que gera memes, GIFs ou vídeos curtos a partir de imagens ou movimentos fornecidos. Não requer habilidades de desenho ou programação—basta uma imagem de referência para criar conteúdo divertido, atrativo e estilisticamente consistente.",
"HiDream-E1-Full.description": "HiDream-E1-Full é um modelo de edição de imagens multimodal de código aberto da HiDream.ai, baseado em uma arquitetura avançada de Transformer de Difusão e com forte compreensão de linguagem (LLaMA 3.1-8B-Instruct embutido). Ele suporta geração de imagens orientada por linguagem natural, transferência de estilo, edições locais e repintura, com excelente compreensão e execução de texto e imagem.",
"HiDream-I1-Full.description": "HiDream-I1 é um novo modelo base de geração de imagens de código aberto lançado pela HiDream. Com 17 bilhões de parâmetros (Flux possui 12 bilhões), ele pode oferecer qualidade de imagem líder na indústria em segundos.",
"HunyuanDiT-v1.2-Diffusers-Distilled.description": "hunyuandit-v1.2-distilled é um modelo leve de texto para imagem otimizado via destilação para gerar imagens de alta qualidade rapidamente, especialmente adequado para ambientes com poucos recursos e geração em tempo real.",
"I2V-01-Director.description": "Um modelo de geração de vídeo em nível de diretor foi oficialmente lançado, oferecendo maior aderência às instruções de movimento de câmera e linguagem cinematográfica de narrativa.",
"I2V-01-live.description": "Desempenho aprimorado de personagens: mais estável, suave e vívido.",
"I2V-01.description": "O modelo básico de imagem-para-vídeo da série 01.",
"InstantCharacter.description": "InstantCharacter é um modelo de geração de personagens personalizados sem necessidade de ajuste, lançado pela Tencent AI em 2025, com foco em geração de personagens de alta fidelidade e consistência entre cenários. Pode modelar um personagem a partir de uma única imagem de referência e transferi-lo com flexibilidade entre estilos, ações e cenários.",
"InternVL2-8B.description": "InternVL2-8B é um poderoso modelo visão-linguagem que suporta processamento multimodal de imagem e texto, reconhecendo com precisão o conteúdo visual e gerando descrições ou respostas relevantes.",
"InternVL2.5-26B.description": "InternVL2.5-26B é um poderoso modelo visão-linguagem que suporta processamento multimodal de imagem e texto, reconhecendo com precisão o conteúdo visual e gerando descrições ou respostas relevantes.",
"KAT-Coder-Air-V1.description": "Uma versão leve da série KAT-Coder. Projetada especificamente para Agentic Coding, cobre de forma abrangente tarefas e cenários de programação. Com uso de aprendizado por reforço em larga escala baseado em agentes, possibilita comportamentos inteligentes emergentes e supera significativamente modelos comparáveis em desempenho de codificação.",
"KAT-Coder-Exp-72B-1010.description": "KAT-Coder-Exp-72B é a versão experimental de inovação em RL da série KAT-Coder, alcançando um desempenho notável de 74,6% no benchmark SWE-Bench Verified, estabelecendo um novo recorde entre modelos open-source. Focado em Agentic Coding, atualmente oferece suporte apenas ao framework SWE-Agent, mas também pode ser usado para conversas simples.",
"KAT-Coder-Pro-V1.description": "Projetado para Agentic Coding, cobre de forma abrangente tarefas e cenários de programação, alcançando comportamentos inteligentes emergentes por meio de aprendizado por reforço em larga escala, superando significativamente modelos semelhantes em desempenho de escrita de código.",
"KAT-Coder-Pro-V2.description": "O mais novo modelo de alto desempenho da equipe Kuaishou Kwaipilot, projetado para projetos empresariais complexos e integração SaaS. Ele se destaca em cenários relacionados a código e é compatível com vários tipos de frameworks de agentes (Claude Code, OpenCode, KiloCode), possui suporte nativo ao OpenClaw e é otimizado especialmente para estética de páginas front-end.",
"Kimi-K2.5.description": "Kimi K2.5 é o modelo mais avançado da linha Kimi, oferecendo desempenho SOTA open-source em tarefas agentivas, programação e compreensão visual. Suporta entradas multimodais e modos com e sem raciocínio.",
"Kolors.description": "Kolors é um modelo de texto para imagem desenvolvido pela equipe Kolors da Kuaishou. Treinado com bilhões de parâmetros, apresenta vantagens notáveis em qualidade visual, compreensão semântica do chinês e renderização de texto.",
"Kwai-Kolors/Kolors.description": "Kolors é um modelo de texto para imagem de difusão latente em larga escala da equipe Kolors da Kuaishou. Treinado com bilhões de pares texto-imagem, destaca-se em qualidade visual, precisão semântica complexa e renderização de texto em chinês/inglês, com forte compreensão e geração de conteúdo em chinês.",
"Ling-2.5-1T.description": "Como o mais recente modelo em tempo real da série Ling, o Ling-2.5-1T apresenta atualizações abrangentes na arquitetura do modelo, eficiência de tokens e alinhamento de preferências, com o objetivo de elevar a qualidade da IA acessível a um novo nível.",
"Ling-2.6-1T.description": "O mais recente modelo de linguagem de grande escala, com suporte para uma janela de contexto de 1M tokens, permitindo um fluxo de trabalho completo desde o raciocínio lógico até a execução de tarefas.",
"Ling-2.6-flash.description": "Ling-2.6-flash é a última geração de modelo de alto custo-benefício da série Ling. Adota uma arquitetura Mixture-of-Experts (MoE), com um total de 100B parâmetros e 6.1B parâmetros ativados por token, alcançando um equilíbrio ideal entre desempenho de inferência e custo computacional.",
"Llama-3.2-11B-Vision-Instruct.description": "Raciocínio visual avançado em imagens de alta resolução, adequado para aplicações de compreensão visual.",
"Llama-3.2-90B-Vision-Instruct.description": "Raciocínio avançado de imagens para aplicações de agentes de compreensão visual.",
"LongCat-2.0-Preview.description": "Os principais recursos do LongCat-2.0-Preview são: projetado para cenários de desenvolvimento de agentes, com suporte nativo para uso de ferramentas, raciocínio em múltiplas etapas e tarefas de longo contexto; excelente em geração de código, fluxos de trabalho automatizados e execução de instruções complexas; profundamente integrado com ferramentas de produtividade como Claude Code, OpenClaw, OpenCode e Kilo Code.",
"M2-her.description": "Um modelo de diálogo em texto projetado para interpretação de papéis e conversas de múltiplas interações, com personalização de personagens e expressão emocional.",
"Meta-Llama-3-3-70B-Instruct.description": "Llama 3.3 70B é um modelo Transformer versátil para tarefas de conversa e geração.",
"Meta-Llama-3.1-405B-Instruct.description": "Modelo de texto ajustado por instruções Llama 3.1, otimizado para conversas multilíngues, com desempenho destacado em benchmarks da indústria entre modelos abertos e fechados.",
"Meta-Llama-3.1-70B-Instruct.description": "Modelo de texto ajustado por instruções Llama 3.1, otimizado para conversas multilíngues, com desempenho destacado em benchmarks da indústria entre modelos abertos e fechados.",
"Meta-Llama-3.1-8B-Instruct.description": "Modelo de texto ajustado por instruções Llama 3.1, otimizado para conversas multilíngues, com desempenho destacado em benchmarks da indústria entre modelos abertos e fechados.",
"Meta-Llama-3.2-1B-Instruct.description": "Modelo de linguagem pequeno e de ponta com forte compreensão linguística, excelente raciocínio e geração de texto.",
"Meta-Llama-3.2-3B-Instruct.description": "Modelo de linguagem pequeno e de ponta com forte compreensão linguística, excelente raciocínio e geração de texto.",
"Meta-Llama-3.3-70B-Instruct.description": "Llama 3.3 é o modelo Llama multilíngue de código aberto mais avançado, oferecendo desempenho próximo ao de modelos de 405B a um custo muito baixo. Baseado em Transformer e aprimorado com SFT e RLHF para utilidade e segurança. A versão ajustada por instruções é otimizada para conversas multilíngues e supera muitos modelos abertos e fechados em benchmarks da indústria. Data de corte do conhecimento: dezembro de 2023.",
"Meta-Llama-4-Maverick-17B-128E-Instruct-FP8.description": "Llama 4 Maverick é um modelo MoE de grande porte com ativação eficiente de especialistas para desempenho robusto em raciocínio.",
"MiMo-V2-Pro.description": "MiMo-V2-Pro é projetado especificamente para fluxos de trabalho agentivos de alta intensidade em cenários do mundo real. Possui mais de 1 trilhão de parâmetros totais (42B ativados), adota uma arquitetura inovadora de atenção híbrida e suporta um comprimento de contexto ultralongo de até 1 milhão de tokens. Baseado em um modelo fundamental poderoso, ampliamos continuamente os recursos computacionais em um conjunto mais amplo de cenários agentivos, expandindo o espaço de ação da inteligência e alcançando forte generalização — da codificação à execução de tarefas reais (\"claw\").",
"MiniMax-Hailuo-02.description": "O modelo de geração de vídeo de próxima geração, MiniMax Hailuo 02, foi oficialmente lançado, suportando resolução 1080P e geração de vídeos de 10 segundos.",
"MiniMax-Hailuo-2.3-Fast.description": "Novo modelo de geração de vídeo com melhorias abrangentes em movimento corporal, realismo físico e seguimento de instruções.",
"MiniMax-Hailuo-2.3.description": "Novo modelo de geração de vídeo com melhorias abrangentes em movimento corporal, realismo físico e seguimento de instruções.",
"MiniMax-M1.description": "Um novo modelo de raciocínio interno com 80 mil cadeias de pensamento e 1 milhão de tokens de entrada, oferecendo desempenho comparável aos principais modelos globais.",
"MiniMax-M2-Stable.description": "Projetado para fluxos de trabalho de codificação e agentes eficientes, com maior concorrência para uso comercial.",
"MiniMax-M2.1-Lightning.description": "Capacidades poderosas de programação multilíngue com inferência mais rápida e eficiente.",
"MiniMax-M2.1-highspeed.description": "Poderosas capacidades de programação multilíngue, experiência de programação amplamente aprimorada. Mais rápido e eficiente.",
"MiniMax-M2.1.description": "MiniMax-M2.1 é o principal modelo open-source da MiniMax, focado em resolver tarefas complexas do mundo real. Seus principais pontos fortes são as capacidades de programação multilíngue e a habilidade de atuar como um Agente para resolver tarefas complexas.",
"MiniMax-M2.5-highspeed.description": "MiniMax M2.5 Highspeed: Mesmo desempenho do M2.5 com inferência mais rápida.",
"MiniMax-M2.5.description": "MiniMax-M2.5 é um modelo de grande porte de código aberto da MiniMax, focado em resolver tarefas complexas do mundo real. Seus principais pontos fortes são as capacidades de programação multilíngue e a habilidade de resolver tarefas complexas como um Agente.",
"MiniMax-M2.7-highspeed.description": "MiniMax M2.7 Highspeed: Mesmo desempenho do M2.7 com inferência significativamente mais rápida.",
"MiniMax-M2.7.description": "Primeiro modelo autoevolutivo com desempenho de topo em programação e tarefas agentivas (~60 tps).",
"MiniMax-M2.description": "MiniMax M2: Modelo da geração anterior.",
"MiniMax-M3.description": "Modelo de codificação multimodal de fronteira e modelo agente com uma janela de contexto de 1M, compreensão nativa de imagens/vídeos e pensamento controlável.",
"MiniMax-Text-01.description": "O MiniMax-01 introduz atenção linear em larga escala além dos Transformers clássicos, com 456 bilhões de parâmetros e 45,9 bilhões ativados por passagem. Alcança desempenho de ponta e suporta até 4 milhões de tokens de contexto (32× GPT-4o, 20× Claude-3.5-Sonnet).",
"MiniMaxAI/MiniMax-M2.5.description": "MiniMax-M2.5 é o mais recente modelo de linguagem de grande porte desenvolvido pela MiniMax, treinado por meio de aprendizado por reforço em larga escala em centenas de milhares de ambientes complexos e do mundo real. Com uma arquitetura MoE e 229 bilhões de parâmetros, alcança desempenho líder na indústria em tarefas como programação, uso de ferramentas por agentes, busca e cenários de escritório.",
"Moonshot-Kimi-K2-Instruct.description": "1 trilhão de parâmetros totais com 32 bilhões ativos. Entre os modelos sem modo de pensamento, é de ponta em conhecimento avançado, matemática e codificação, com desempenho superior em tarefas gerais de agentes. Otimizado para cargas de trabalho de agentes, pode agir, não apenas responder perguntas. Ideal para conversas improvisadas, bate-papo geral e experiências com agentes como um modelo de reflexo, sem pensamento prolongado.",
"NousResearch/Nous-Hermes-2-Mixtral-8x7B-DPO.description": "Nous Hermes 2 - Mixtral 8x7B-DPO (46,7B) é um modelo de instrução de alta precisão para cálculos complexos.",
"OmniConsistency.description": "OmniConsistency melhora a consistência de estilo e a generalização em tarefas de imagem para imagem ao introduzir Diffusion Transformers (DiTs) em larga escala e dados estilizados pareados, evitando a degradação de estilo.",
"PaddlePaddle/PaddleOCR-VL-1.5.description": "PaddleOCR-VL-1.5 é uma versão aprimorada da série PaddleOCR-VL, alcançando 94,5% de precisão no benchmark de análise de documentos OmniDocBench v1.5, superando modelos grandes generalistas e modelos especializados em análise de documentos. Inova ao oferecer suporte à localização de caixas delimitadoras irregulares para elementos de documentos, lidando de forma eficaz com imagens escaneadas, inclinadas e capturadas de tela.",
"Phi-3-medium-128k-instruct.description": "O mesmo modelo Phi-3-medium com uma janela de contexto maior para RAG ou prompts de poucos exemplos.",
"Phi-3-medium-4k-instruct.description": "Um modelo com 14 bilhões de parâmetros e qualidade superior ao Phi-3-mini, focado em dados de alta qualidade e raciocínio intensivo.",
"Phi-3-mini-128k-instruct.description": "O mesmo modelo Phi-3-mini com uma janela de contexto maior para RAG ou prompts de poucos exemplos.",
"Phi-3-mini-4k-instruct.description": "O menor membro da família Phi-3, otimizado para qualidade e baixa latência.",
"Phi-3-small-128k-instruct.description": "O mesmo modelo Phi-3-small com uma janela de contexto maior para RAG ou prompts de poucos exemplos.",
"Phi-3-small-8k-instruct.description": "Um modelo com 7 bilhões de parâmetros e qualidade superior ao Phi-3-mini, focado em dados de alta qualidade e raciocínio intensivo.",
"Phi-3.5-mini-instruct.description": "Uma versão atualizada do modelo Phi-3-mini.",
"Phi-3.5-vision-instrust.description": "Uma versão atualizada do modelo Phi-3-vision.",
"Pro/MiniMaxAI/MiniMax-M2.5.description": "MiniMax-M2.5 é o mais recente modelo de linguagem desenvolvido pela MiniMax, treinado por meio de aprendizado por reforço em larga escala em centenas de milhares de ambientes complexos e reais. Com uma arquitetura MoE de 229 bilhões de parâmetros, ele alcança desempenho líder na indústria em tarefas como programação, uso de ferramentas de agentes, busca e cenários de escritório.",
"Pro/Qwen/Qwen2.5-7B-Instruct.description": "Qwen2.5-7B-Instruct faz parte da mais recente série de LLMs da Alibaba Cloud. O modelo de 7 bilhões traz ganhos notáveis em codificação e matemática, suporta mais de 29 idiomas e melhora o seguimento de instruções, compreensão de dados estruturados e geração de saídas estruturadas (especialmente JSON).",
"Pro/deepseek-ai/DeepSeek-R1.description": "DeepSeek-R1 é um modelo de raciocínio orientado por RL que reduz repetições e melhora a legibilidade. Utiliza dados de início a frio antes do RL para impulsionar ainda mais o raciocínio, iguala o OpenAI-o1 em tarefas de matemática, código e raciocínio, e melhora os resultados gerais por meio de treinamento cuidadoso.",
"Pro/deepseek-ai/DeepSeek-V3.1-Terminus.description": "DeepSeek-V3.1-Terminus é uma versão atualizada do modelo V3.1, posicionado como um LLM híbrido para agentes. Corrige problemas relatados por usuários e melhora a estabilidade, consistência linguística e reduz caracteres anormais e mistura de chinês/inglês. Integra modos de pensamento e não-pensamento com templates de chat para alternância flexível. Também melhora o desempenho dos agentes de código e de busca para uso mais confiável de ferramentas e tarefas em múltiplas etapas.",
"Pro/deepseek-ai/DeepSeek-V3.2.description": "DeepSeek-V3.2 é um modelo que combina alta eficiência computacional com excelente desempenho em raciocínio e como Agente. Sua abordagem é baseada em três avanços tecnológicos principais: DeepSeek Sparse Attention (DSA), um mecanismo de atenção eficiente que reduz significativamente a complexidade computacional enquanto mantém o desempenho do modelo, otimizado especificamente para cenários de longo contexto; uma estrutura escalável de aprendizado por reforço, através da qual o desempenho do modelo pode rivalizar com o GPT-5, e sua versão de alta computação pode igualar o Gemini-3.0-Pro em capacidades de raciocínio; e um pipeline de síntese de tarefas de Agente em larga escala, projetado para integrar capacidades de raciocínio em cenários de uso de ferramentas, melhorando o seguimento de instruções e a generalização em ambientes interativos complexos. O modelo alcançou desempenho medalha de ouro na Olimpíada Internacional de Matemática (IMO) e na Olimpíada Internacional de Informática (IOI) de 2025.",
"Pro/deepseek-ai/DeepSeek-V3.description": "DeepSeek-V3 é um modelo MoE com 671 bilhões de parâmetros, utilizando MLA e DeepSeekMoE com balanceamento de carga sem perdas para inferência e treinamento eficientes. Pré-treinado com 14,8 trilhões de tokens de alta qualidade e ajustado com SFT e RL, supera outros modelos abertos e se aproxima dos modelos fechados líderes.",
"Pro/moonshotai/Kimi-K2.5.description": "Kimi K2.5 é um modelo agente multimodal nativo open-source, baseado no Kimi-K2-Base, treinado com aproximadamente 1,5 trilhão de tokens mistos de visão e texto. O modelo adota uma arquitetura MoE com 1 trilhão de parâmetros totais e 32 bilhões de parâmetros ativos, suportando uma janela de contexto de 256K, integrando perfeitamente capacidades de compreensão visual e linguística.",
"Pro/moonshotai/Kimi-K2.6.description": "Kimi K2.6 é um modelo agente multimodal nativo de código aberto da Moonshot AI, alcançando desempenho de ponta em código aberto em vários benchmarks principais, incluindo HLE (com ferramentas), SWE-Bench Pro e BrowseComp. O modelo adota uma arquitetura MoE com 1T de parâmetros totais e 32B de parâmetros ativos, suporta uma janela de contexto de 256K tokens e integra capacidades multimodais nativas.",
"Pro/zai-org/GLM-4.7.description": "GLM-4.7 é o modelo carro-chefe de nova geração da Zhipu, com 355B de parâmetros totais e 32B de parâmetros ativos, totalmente aprimorado em diálogo geral, raciocínio e capacidades de agente. O GLM-4.7 melhora o Pensamento Intercalado e introduz o Pensamento Preservado e o Pensamento em Nível de Turno.",
"Pro/zai-org/GLM-5.1.description": "GLM-5.1 é um modelo carro-chefe de próxima geração projetado para engenharia de agentes, utilizando uma arquitetura Mixture of Experts (MoE) com 754B parâmetros. Ele aprimora significativamente as capacidades de programação, alcançando resultados líderes no SWE-Bench Pro, e supera amplamente seu predecessor em benchmarks como NL2Repo e Terminal-Bench 2.0. Projetado para tarefas agentivas longas, lida com perguntas ambíguas com melhor discernimento, decompõe tarefas complexas, executa experimentos, analisa resultados e otimiza continuamente ao longo de centenas de iterações e milhares de chamadas de ferramentas.",
"Pro/zai-org/glm-5.1.description": "GLM-5.1 é o modelo de agente de engenharia inteligente de próxima geração da Zhipu. Ele utiliza uma arquitetura Mixture-of-Experts de 754B com chamadas de ferramentas nativas, conclusão de prefixos, suporte a FIM e uma janela de contexto de 200K para fluxos de trabalho de longo prazo.",
"Pro/zai-org/glm-5.description": "GLM-5 é o modelo de linguagem de próxima geração da Zhipu, focado em engenharia de sistemas complexos e tarefas de Agente de longa duração. Os parâmetros do modelo foram expandidos para 744 bilhões (40 bilhões ativos) e integram DeepSeek Sparse Attention.",
"QwQ-32B-Preview.description": "Qwen QwQ é um modelo de pesquisa experimental focado em aprimorar o raciocínio.",
"Qwen/QwQ-32B-Preview.description": "Qwen QwQ é um modelo de pesquisa experimental focado em aprimorar o raciocínio da IA.",
"Qwen/Qwen-Image-Edit-2509.description": "Qwen-Image-Edit-2509 é a versão mais recente de edição de imagens da Qwen-Image, desenvolvida pela equipe Qwen. Baseado no modelo Qwen-Image de 20B, ele estende a renderização de texto de alta qualidade para edição de imagens com precisão textual. Utiliza uma arquitetura de controle duplo, enviando entradas para o Qwen2.5-VL para controle semântico e para um codificador VAE para controle de aparência, permitindo edições tanto no nível semântico quanto visual. Suporta edições locais (adicionar/remover/modificar) e edições semânticas de alto nível como criação de IP e transferência de estilo, preservando o significado. Alcança resultados SOTA em diversos benchmarks.",
"Qwen/Qwen-Image.description": "Qwen-Image é um modelo base de geração de imagens com 20 bilhões de parâmetros da equipe Qwen. Apresenta avanços significativos na renderização de texto complexo e edição precisa de imagens, especialmente para textos em chinês/inglês de alta fidelidade. Suporta layouts de múltiplas linhas e parágrafos mantendo a coerência tipográfica. Além da renderização de texto, oferece uma ampla gama de estilos, desde fotorrealismo até anime, e edições avançadas como transferência de estilo, adição/remoção de objetos, aprimoramento de detalhes, edição de texto e controle de pose, visando ser uma base abrangente para criação visual.",
"Qwen/Qwen2-72B-Instruct.description": "Qwen 2 Instruct (72B) oferece seguimento preciso de instruções para cargas de trabalho empresariais.",
"Qwen/Qwen2-7B-Instruct.description": "Qwen2-7B-Instruct é um modelo ajustado por instruções com 7 bilhões de parâmetros da série Qwen2, utilizando Transformer, SwiGLU, viés QKV e atenção com consulta agrupada. Lida com entradas grandes e apresenta desempenho sólido em benchmarks de compreensão, geração, multilinguismo, programação, matemática e raciocínio, superando a maioria dos modelos abertos e ultrapassando o Qwen1.5-7B-Chat em várias avaliações.",
"Qwen/Qwen2.5-14B-Instruct.description": "Qwen2.5-14B-Instruct faz parte da mais recente série de LLMs da Alibaba Cloud. O modelo de 14 bilhões de parâmetros apresenta ganhos notáveis em programação e matemática, suporta mais de 29 idiomas e melhora o seguimento de instruções, compreensão de dados estruturados e geração de saídas estruturadas (especialmente JSON).",
"Qwen/Qwen2.5-32B-Instruct.description": "Qwen2.5-32B-Instruct faz parte da mais recente série de LLMs da Alibaba Cloud. O modelo de 32 bilhões de parâmetros apresenta ganhos notáveis em programação e matemática, suporta mais de 29 idiomas e melhora o seguimento de instruções, compreensão de dados estruturados e geração de saídas estruturadas (especialmente JSON).",
"Qwen/Qwen2.5-72B-Instruct-128K.description": "Qwen2.5-72B-Instruct faz parte da mais recente série de LLMs da Alibaba Cloud. O modelo de 72 bilhões de parâmetros melhora a programação e a matemática, suporta até 128K de entrada e mais de 8K de saída, oferece suporte a mais de 29 idiomas e aprimora o seguimento de instruções e a geração de saídas estruturadas (especialmente JSON).",
"Qwen/Qwen2.5-72B-Instruct-Turbo.description": "Qwen2.5 é uma nova família de LLMs otimizada para tarefas baseadas em instruções.",
"Qwen/Qwen2.5-72B-Instruct.description": "Qwen2.5-72B-Instruct faz parte da mais recente série de LLMs da Alibaba Cloud. O modelo de 72 bilhões de parâmetros apresenta ganhos notáveis em programação e matemática, suporta mais de 29 idiomas e melhora o seguimento de instruções, compreensão de dados estruturados e geração de saídas estruturadas (especialmente JSON).",
"Qwen/Qwen2.5-7B-Instruct-Turbo.description": "Qwen2.5 é uma nova família de LLMs otimizada para tarefas baseadas em instruções.",
"Qwen/Qwen2.5-7B-Instruct.description": "Qwen2.5-7B-Instruct faz parte da mais recente série de LLMs da Alibaba Cloud. O modelo de 7 bilhões de parâmetros apresenta ganhos notáveis em programação e matemática, suporta mais de 29 idiomas e melhora o seguimento de instruções, compreensão de dados estruturados e geração de saídas estruturadas (especialmente JSON).",
"Qwen/Qwen2.5-Coder-32B-Instruct.description": "Qwen2.5 Coder 32B Instruct é o mais recente LLM da Alibaba Cloud focado em código. Baseado no Qwen2.5 e treinado com 5,5 trilhões de tokens, melhora significativamente a geração, raciocínio e correção de código, mantendo pontos fortes em matemática e tarefas gerais, oferecendo uma base sólida para agentes de programação.",
"Qwen/Qwen3-14B.description": "Qwen3 é um modelo Tongyi Qwen de nova geração com avanços significativos em raciocínio, capacidade geral, habilidades de agente e desempenho multilíngue, além de suportar a alternância entre modos de pensamento.",
"Qwen/Qwen3-235B-A22B.description": "Qwen3 235B A22B é o modelo ultra-escalável Qwen3 que oferece capacidade de IA de ponta.",
"Qwen/Qwen3-30B-A3B-Instruct-2507.description": "Qwen3-30B-A3B-Instruct-2507 é a versão atualizada não-pensante do Qwen3-30B-A3B. É um modelo MoE com 30,5B de parâmetros totais e 3,3B de parâmetros ativos. Melhora significativamente o seguimento de instruções, raciocínio lógico, compreensão de texto, matemática, ciência, codificação e uso de ferramentas, expande o conhecimento multilíngue de nicho e se alinha melhor às preferências dos usuários em tarefas abertas subjetivas. Suporta contexto de 256K. Este modelo é apenas não-pensante e não produzirá tags `נקוד`.",
"Qwen/Qwen3-32B.description": "Qwen3 é um modelo Tongyi Qwen de nova geração com avanços significativos em raciocínio, capacidade geral, habilidades de agente e desempenho multilíngue, além de suportar a alternância entre modos de pensamento.",
"Qwen/Qwen3-8B.description": "Qwen3 é um modelo Tongyi Qwen de nova geração com avanços significativos em raciocínio, capacidade geral, habilidades de agente e desempenho multilíngue, além de suportar a alternância entre modos de pensamento.",
"Qwen/Qwen3-Coder-30B-A3B-Instruct.description": "Qwen3-Coder-30B-A3B-Instruct é um modelo de código da série Qwen3 desenvolvido pela equipe Qwen. Foi otimizado para alto desempenho e eficiência, com foco em capacidades de programação. Apresenta vantagens notáveis em codificação agente, operações automatizadas de navegador e uso de ferramentas entre os modelos abertos. Suporta nativamente contexto de 256K e pode ser estendido para 1 milhão de tokens para compreensão em nível de base de código. Alimenta codificação agente em plataformas como Qwen Code e CLINE com um formato dedicado de chamada de funções.",
"Qwen/Qwen3-Omni-30B-A3B-Captioner.description": "Qwen3-Omni-30B-A3B-Captioner é um modelo VLM da série Qwen3 desenvolvido para gerar legendas de imagem de alta qualidade, detalhadas e precisas. Utiliza uma arquitetura MoE com 30 bilhões de parâmetros para compreender profundamente imagens e produzir descrições fluentes, destacando-se na captura de detalhes, compreensão de cenas, reconhecimento de objetos e raciocínio relacional.",
"Qwen/Qwen3-Omni-30B-A3B-Instruct.description": "Qwen3-Omni-30B-A3B-Instruct é um modelo MoE da série Qwen3 com 30 bilhões de parâmetros totais e 3 bilhões ativos, oferecendo alto desempenho com menor custo de inferência. Treinado com dados multilíngues de alta qualidade e múltiplas fontes, suporta entradas multimodais completas (texto, imagens, áudio, vídeo) e compreensão e geração entre modalidades.",
"Qwen/Qwen3-Omni-30B-A3B-Thinking.description": "Qwen3-Omni-30B-A3B-Thinking é o componente central \"pensante\" do Qwen3-Omni. Processa entradas multimodais (texto, áudio, imagens, vídeo) e realiza raciocínio complexo em cadeia, unificando as entradas em uma representação compartilhada para compreensão profunda entre modalidades. É um modelo MoE com 30 bilhões de parâmetros totais e 3 bilhões ativos, equilibrando raciocínio avançado e eficiência computacional.",
"Qwen/Qwen3-VL-30B-A3B-Instruct.description": "Qwen3-VL-30B-A3B-Instruct é o modelo Qwen3-VL ajustado para instruções, com forte compreensão e geração visão-linguagem. Suporta nativamente contexto de 256K para chat multimodal e geração condicionada por imagem.",
"Qwen/Qwen3-VL-30B-A3B-Thinking.description": "Qwen3-VL-30B-A3B-Thinking é a versão aprimorada para raciocínio do Qwen3-VL, otimizada para raciocínio multimodal, conversão de imagem para código e compreensão visual complexa. Suporta contexto de 256K com maior capacidade de raciocínio em cadeia.",
"Qwen/Qwen3-VL-32B-Instruct.description": "Qwen3-VL-32B-Instruct é um modelo visão-linguagem da equipe Qwen com resultados SOTA em vários benchmarks VL. Suporta imagens em resolução megapixel e oferece forte compreensão visual, OCR multilíngue, ancoragem visual detalhada e diálogo visual. Lida com tarefas multimodais complexas e suporta chamadas de ferramentas e preenchimento de prefixo.",
"Qwen/Qwen3-VL-32B-Thinking.description": "Qwen3-VL-32B-Thinking é otimizado para raciocínio visual complexo. Inclui um modo de pensamento embutido que gera etapas intermediárias de raciocínio antes das respostas, aprimorando lógica em múltiplas etapas, planejamento e raciocínio complexo. Suporta imagens em megapixel, forte compreensão visual, OCR multilíngue, ancoragem detalhada, diálogo visual, chamadas de ferramentas e preenchimento de prefixo.",
"Qwen/Qwen3-VL-8B-Instruct.description": "Qwen3-VL-8B-Instruct é um modelo visão-linguagem baseado no Qwen3-8B-Instruct e treinado com grandes volumes de dados imagem-texto. Destaca-se em compreensão visual geral, diálogo centrado em visão e reconhecimento de texto multilíngue em imagens, sendo adequado para QA visual, legendagem, seguimento de instruções multimodais e uso de ferramentas.",
"Qwen/Qwen3-VL-8B-Thinking.description": "Qwen3-VL-8B-Thinking é a versão visual pensante do Qwen3, otimizada para raciocínio complexo em múltiplas etapas. Gera uma cadeia de pensamento antes das respostas para melhorar a precisão, sendo ideal para QA visual profundo e análise detalhada de imagens.",
"Qwen/Qwen3.5-122B-A10B.description": "Qwen3.5-122B-A10B é um modelo de linguagem multimodal nativo da equipe Qwen com 122 bilhões de parâmetros totais e apenas 10 bilhões de parâmetros ativos. Ele adota uma arquitetura híbrida eficiente que combina Redes Delta Controladas e Mistura de Especialistas (MoE), suportando nativamente um comprimento de contexto de 256K com extensibilidade para aproximadamente 1 milhão de tokens.",
"Qwen/Qwen3.5-27B.description": "Qwen3.5-27B é um modelo de linguagem multimodal nativo da equipe Qwen com 27 bilhões de parâmetros. Ele adota uma arquitetura híbrida eficiente que combina Redes Delta Controladas e Atenção Controlada, suportando nativamente um comprimento de contexto de 256K com extensibilidade para aproximadamente 1 milhão de tokens.",
"Qwen/Qwen3.5-35B-A3B.description": "Qwen3.5-35B-A3B é um modelo de linguagem multimodal nativo da equipe Qwen com 35 bilhões de parâmetros totais e apenas 3 bilhões de parâmetros ativos. Ele adota uma arquitetura híbrida eficiente que combina Redes Delta Controladas e Mistura de Especialistas (MoE), suportando nativamente um comprimento de contexto de 256K com extensibilidade para aproximadamente 1 milhão de tokens.",
"Qwen/Qwen3.5-397B-A17B.description": "Qwen3.5-397B-A17B é o mais recente modelo de visão-linguagem da série Qwen3.5, utilizando uma arquitetura de Mistura de Especialistas (MoE) com 397 bilhões de parâmetros totais e 17 bilhões de parâmetros ativos. Ele suporta nativamente um comprimento de contexto de 256K com extensibilidade para aproximadamente 1 milhão de tokens, suporta 201 idiomas e oferece compreensão unificada de visão-linguagem, chamada de ferramentas e capacidades de raciocínio.",
"Qwen/Qwen3.5-4B.description": "Qwen3.5-4B é um modelo de linguagem multimodal nativo da equipe Qwen com 4 bilhões de parâmetros, o modelo Denso mais leve da série Qwen3.5. Ele adota uma arquitetura híbrida eficiente que combina Redes Delta Controladas e Atenção Controlada, suportando nativamente um comprimento de contexto de 256K com extensibilidade para aproximadamente 1 milhão de tokens.",
"Qwen/Qwen3.5-9B.description": "Qwen3.5-9B é um modelo de linguagem multimodal nativo da equipe Qwen com 9 bilhões de parâmetros. Como um modelo Denso leve na série Qwen3.5, ele adota uma arquitetura híbrida eficiente que combina Redes Delta Controladas e Atenção Controlada, suportando nativamente um comprimento de contexto de 256K com extensibilidade para aproximadamente 1 milhão de tokens.",
"Qwen/Qwen3.6-27B.description": "Qwen3.6-27B é o primeiro modelo denso de médio porte de código aberto da série Qwen3.6, com melhorias importantes para geração de código, fluxos de trabalho de agentes e cenários de desenvolvimento do mundo real. Comparado ao Qwen3.5-27B, este modelo apresenta melhorias significativas no desenvolvimento front-end, raciocínio em nível de repositório, uso de ferramentas e resolução de problemas complexos, com otimizações recém-adicionadas para raciocínio histórico.",
"Qwen/Qwen3.6-35B-A3B.description": "Qwen3.6-35B-A3B é um modelo de linguagem de grande porte da equipe Qwen na série Qwen3.6, utilizando uma arquitetura Mixture-of-Experts (MoE) com 35B de parâmetros totais e 3B de parâmetros ativos. Ele equilibra inferência eficiente com excelente desempenho e oferece modos com e sem raciocínio, permitindo alternância flexível entre respostas rápidas e raciocínio profundo.",
"Qwen2-72B-Instruct.description": "Qwen2 é a versão mais recente da série Qwen, com suporte a uma janela de contexto de 128k. Em comparação com os melhores modelos abertos atuais, o Qwen2-72B supera significativamente os principais modelos em compreensão de linguagem natural, conhecimento, programação, matemática e capacidades multilíngues.",
"Qwen2-7B-Instruct.description": "Qwen2 é a versão mais recente da série Qwen, superando os melhores modelos abertos de tamanho semelhante e até mesmo modelos maiores. O Qwen2 7B apresenta vantagens significativas em diversos benchmarks, especialmente em programação e compreensão do chinês.",
"Qwen2-VL-72B.description": "Qwen2-VL-72B é um poderoso modelo de linguagem e visão que oferece suporte ao processamento multimodal de imagem e texto, reconhecendo com precisão o conteúdo visual e gerando descrições ou respostas relevantes.",
"Qwen2.5-14B-Instruct.description": "Qwen2.5-14B-Instruct é um modelo de linguagem com 14 bilhões de parâmetros e alto desempenho, otimizado para cenários em chinês e multilíngues, com suporte a perguntas e respostas inteligentes e geração de conteúdo.",
"Qwen2.5-32B-Instruct.description": "Qwen2.5-32B-Instruct é um modelo de linguagem com 32 bilhões de parâmetros e desempenho equilibrado, otimizado para cenários em chinês e multilíngues, com suporte a perguntas e respostas inteligentes e geração de conteúdo.",
"Qwen2.5-72B-Instruct.description": "Modelo de linguagem para chinês e inglês, ajustado para linguagem, programação, matemática e raciocínio.",
"Qwen2.5-7B-Instruct.description": "Qwen2.5-7B-Instruct é um modelo de linguagem com 7 bilhões de parâmetros que oferece suporte a chamadas de função e integração fluida com sistemas externos, aumentando significativamente a flexibilidade e a extensibilidade. É otimizado para cenários em chinês e multilíngues, com suporte a perguntas e respostas inteligentes e geração de conteúdo.",
"Qwen2.5-Coder-14B-Instruct.description": "Qwen2.5-Coder-14B-Instruct é um modelo de instrução para programação em larga escala, com forte capacidade de compreensão e geração de código. Ele lida eficientemente com uma ampla gama de tarefas de programação, sendo ideal para codificação inteligente, geração automatizada de scripts e perguntas e respostas sobre programação.",
"Qwen2.5-Coder-32B-Instruct.description": "Modelo avançado de linguagem para geração de código, raciocínio e correção de bugs em diversas linguagens de programação.",
"Qwen3-235B-A22B-Instruct-2507-FP8.description": "Qwen3 235B A22B Instruct 2507 é otimizado para raciocínio avançado e seguimento de instruções, utilizando MoE para manter a eficiência em escala.",
"Qwen3.5-Plus.description": "Qwen3.5 Plus suporta entrada de texto, imagem e vídeo. Seu desempenho em tarefas puramente textuais é comparável ao Qwen3 Max, com melhor performance e menor custo. Suas capacidades multimodais são significativamente aprimoradas em comparação com a série Qwen3 VL.",
"Ring-2.5-1T.description": "Comparado ao Ring-1T lançado anteriormente, o Ring-2.5-1T alcança melhorias significativas em três dimensões principais: Eficiência de Geração**: Utilizando uma alta proporção de mecanismos de atenção linear, o Ring-2.5-1T reduz a sobrecarga de acesso à memória em mais de 10×. Ao processar sequências que excedem 32K tokens, oferece mais de 3× maior rendimento de geração, tornando-o particularmente adequado para raciocínio profundo e execução de tarefas de longo prazo. Raciocínio Profundo**: Com base no RLVR, um mecanismo de recompensa densa é introduzido para fornecer feedback sobre o rigor do processo de raciocínio. Isso permite que o Ring-2.5-1T alcance desempenho de nível medalha de ouro tanto no IMO 2025 quanto no CMO 2025 (autoavaliado). Execução de Tarefas de Longo Prazo**: Por meio de treinamento de aprendizado por reforço totalmente assíncrono em larga escala baseado em agentes, o modelo melhora significativamente sua capacidade de executar tarefas complexas de forma autônoma por períodos prolongados. Isso permite que o Ring-2.5-1T se integre perfeitamente a frameworks de programação de agentes como Claude Code e assistentes pessoais de IA OpenClaw.",
"Ring-2.6-1T.description": "Ring-2.6-1T é um modelo de raciocínio em escala de trilhões de parâmetros que ativa aproximadamente 63B parâmetros por inferência. Projetado para fluxos de trabalho de agentes, foca em capacidades de agentes, uso de ferramentas e execução de tarefas de longo prazo, alcançando desempenho líder em benchmarks como PinchBench, ClawEval, TAU2-Bench e GAIA2-search. O modelo é otimizado em qualidade de execução, latência e custo, tornando-o bem adequado para agentes avançados de programação, pipelines complexos de raciocínio e sistemas autônomos em larga escala.",
"S2V-01.description": "O modelo básico de referência-para-vídeo da série 01.",
"Skylark2-lite-8k.description": "Segunda geração do modelo Skylark. O Skylark2-lite oferece respostas rápidas para cenários em tempo real e sensíveis a custo, com menor necessidade de precisão e janela de contexto de 8K.",
"Skylark2-pro-32k.description": "Segunda geração do modelo Skylark. O Skylark2-pro oferece maior precisão para geração de textos complexos, como redação profissional, escrita de romances e tradução de alta qualidade, com janela de contexto de 32K.",
"Skylark2-pro-4k.description": "Segunda geração do modelo Skylark. O Skylark2-pro oferece maior precisão para geração de textos complexos, como redação profissional, escrita de romances e tradução de alta qualidade, com janela de contexto de 4K.",
"Skylark2-pro-character-4k.description": "Segunda geração do modelo Skylark. O Skylark2-pro-character se destaca em interpretação de papéis e conversação, combinando prompts com estilos de persona distintos e diálogo natural para chatbots, assistentes virtuais e atendimento ao cliente, com respostas rápidas.",
"Skylark2-pro-turbo-8k.description": "Segunda geração do modelo Skylark. O Skylark2-pro-turbo-8k oferece inferência mais rápida com menor custo e janela de contexto de 8K.",
"T2V-01-Director.description": "Um modelo de geração de vídeo em nível de diretor foi oficialmente lançado, oferecendo maior aderência às instruções de movimento de câmera e linguagem cinematográfica de narrativa.",
"T2V-01.description": "O modelo básico de texto-para-vídeo da série 01.",
"THUDM/GLM-4-32B-0414.description": "GLM-4-32B-0414 é um modelo GLM de próxima geração com 32 bilhões de parâmetros, com desempenho comparável ao OpenAI GPT e à série DeepSeek V3/R1.",
"THUDM/GLM-4-9B-0414.description": "GLM-4-9B-0414 é um modelo GLM com 9 bilhões de parâmetros que herda as técnicas do GLM-4-32B, oferecendo implantação mais leve. Apresenta bom desempenho em geração de código, design web, geração de SVG e redação baseada em busca.",
"THUDM/GLM-Z1-9B-0414.description": "GLM-Z1-9B-0414 é um modelo GLM compacto com 9 bilhões de parâmetros que mantém as vantagens do código aberto e oferece capacidade impressionante. Apresenta forte desempenho em raciocínio matemático e tarefas gerais, liderando sua categoria de tamanho entre os modelos abertos.",
"Wan-AI/Wan2.2-I2V-A14B.description": "Wan2.2-I2V-A14B é um dos primeiros modelos de geração de imagem-para-vídeo (I2V) de código aberto lançados pela Wan-AI, uma iniciativa de IA da Alibaba, a adotar uma arquitetura de Mistura de Especialistas (MoE). O modelo foca em gerar sequências de vídeo dinâmicas suaves e naturais combinando imagens estáticas com prompts de texto. Sua inovação central reside na arquitetura MoE: um especialista de alto ruído é responsável por lidar com a estrutura grosseira nas etapas iniciais da geração de vídeo, enquanto um especialista de baixo ruído refina os detalhes nas etapas posteriores. Esse design melhora o desempenho geral do modelo sem aumentar o custo de inferência. Comparado às versões anteriores, o Wan2.2 é treinado em um conjunto de dados significativamente maior, levando a melhorias notáveis na compreensão de movimentos complexos, estilos estéticos e conteúdo semântico. Ele produz vídeos mais estáveis e reduz movimentos de câmera irreais.",
"Wan-AI/Wan2.2-T2V-A14B.description": "Wan2.2-T2V-A14B é o primeiro modelo de geração de vídeo de código aberto lançado pela Alibaba a adotar uma arquitetura de Mistura de Especialistas (MoE). O modelo é projetado para tarefas de geração de texto-para-vídeo (T2V) e é capaz de produzir vídeos de até 5 segundos de duração em resoluções de 480P ou 720P. Ao introduzir a arquitetura MoE, o modelo aumenta significativamente sua capacidade geral enquanto mantém os custos de inferência quase inalterados. Inclui um especialista de alto ruído que lida com a estrutura global nas etapas iniciais da geração e um especialista de baixo ruído que refina os detalhes nas etapas posteriores do vídeo. Além disso, o Wan2.2 incorpora dados estéticos cuidadosamente selecionados, com anotações detalhadas em dimensões como iluminação, composição e cor. Isso permite uma geração mais precisa e controlável de visuais de qualidade cinematográfica. Comparado às versões anteriores, o modelo é treinado em um conjunto de dados maior, resultando em melhorias significativas na generalização de movimento, semântica e estética, e melhor manejo de efeitos dinâmicos complexos.",
"Yi-34B-Chat.description": "Yi-1.5-34B mantém as fortes habilidades linguísticas gerais da série, utilizando treinamento incremental com 500 bilhões de tokens de alta qualidade para melhorar significativamente lógica matemática e programação.",
"abab5.5-chat.description": "Projetado para cenários de produtividade, com capacidade de lidar com tarefas complexas e geração eficiente de texto para uso profissional.",
"abab5.5s-chat.description": "Projetado para conversas com personas em chinês, oferecendo diálogos de alta qualidade em chinês para diversas aplicações.",
"abab6.5g-chat.description": "Projetado para conversas com personas multilíngues, com suporte à geração de diálogos de alta qualidade em inglês e outros idiomas.",
"abab6.5s-chat.description": "Adequado para uma ampla gama de tarefas de PLN, incluindo geração de texto e sistemas de diálogo.",
"abab6.5t-chat.description": "Otimizado para conversas com personas em chinês, oferecendo diálogos fluentes que se adequam aos hábitos de expressão do idioma.",
"accounts/fireworks/models/deepseek-r1.description": "DeepSeek-R1 é um modelo de linguagem de última geração otimizado com aprendizado por reforço e dados de início a frio, oferecendo excelente desempenho em raciocínio, matemática e programação.",
"accounts/fireworks/models/deepseek-v3.description": "Um poderoso modelo de linguagem Mixture-of-Experts (MoE) da DeepSeek com 671 bilhões de parâmetros totais e 37 bilhões de parâmetros ativos por token.",
"accounts/fireworks/models/llama-v3-70b-instruct.description": "A Meta desenvolveu e lançou a série de modelos LLM Meta Llama 3, que inclui modelos de geração de texto pré-treinados e ajustados por instrução com 8B e 70B parâmetros. Os modelos Llama 3 ajustados por instrução são otimizados para uso conversacional e superam muitos modelos de chat abertos existentes em benchmarks amplamente utilizados na indústria.",
"accounts/fireworks/models/llama-v3-8b-instruct-hf.description": "Os modelos Llama 3 da Meta ajustados por instrução são otimizados para uso conversacional e superam muitos modelos de chat abertos existentes em benchmarks amplamente utilizados na indústria. O Llama 3 8B Instruct (versão HF) é a versão original em FP16 do Llama 3 8B Instruct, com resultados esperados equivalentes à implementação oficial do Hugging Face.",
"accounts/fireworks/models/llama-v3-8b-instruct.description": "A Meta desenvolveu e lançou a série de modelos LLM Meta Llama 3, uma coleção de modelos de geração de texto pré-treinados e ajustados por instrução com 8B e 70B parâmetros. Os modelos Llama 3 ajustados por instrução são otimizados para uso conversacional e superam muitos modelos de chat abertos existentes em benchmarks amplamente utilizados na indústria.",
"accounts/fireworks/models/llama-v3p1-405b-instruct.description": "O Meta Llama 3.1 é uma família de modelos LLM multilíngues com modelos de geração pré-treinados e ajustados por instrução nos tamanhos 8B, 70B e 405B. Os modelos de texto ajustados por instrução são otimizados para diálogos multilíngues e superam muitos modelos de chat abertos e fechados em benchmarks amplamente utilizados na indústria. O modelo 405B é o mais avançado da família Llama 3.1, utilizando inferência em FP8 que se aproxima da implementação de referência.",
"accounts/fireworks/models/llama-v3p1-70b-instruct.description": "O Meta Llama 3.1 é uma família de modelos LLM multilíngues com modelos de geração pré-treinados e ajustados por instrução nos tamanhos 8B, 70B e 405B. Os modelos de texto ajustados por instrução são otimizados para diálogos multilíngues e superam muitos modelos de chat abertos e fechados em benchmarks amplamente utilizados na indústria.",
"accounts/fireworks/models/llama-v3p1-8b-instruct.description": "O Meta Llama 3.1 é uma família de modelos LLM multilíngues com modelos de geração pré-treinados e ajustados por instrução nos tamanhos 8B, 70B e 405B. Os modelos de texto ajustados por instrução são otimizados para diálogos multilíngues e superam muitos modelos de chat abertos e fechados em benchmarks amplamente utilizados na indústria.",
"accounts/fireworks/models/llama-v3p2-11b-vision-instruct.description": "Um modelo de raciocínio visual ajustado por instrução da Meta com 11 bilhões de parâmetros, otimizado para reconhecimento visual, raciocínio com imagens, legendagem e perguntas e respostas relacionadas a imagens. Ele compreende dados visuais como gráficos e tabelas e conecta visão e linguagem ao gerar descrições textuais de detalhes visuais.",
"accounts/fireworks/models/llama-v3p2-3b-instruct.description": "O Llama 3.2 3B Instruct é um modelo multilíngue leve da Meta, projetado para execução eficiente com vantagens significativas de latência e custo em relação a modelos maiores. Casos de uso típicos incluem reescrita de consultas/prompts e assistência na escrita.",
"accounts/fireworks/models/llama-v3p2-90b-vision-instruct.description": "Um modelo de raciocínio visual ajustado por instrução da Meta com 90 bilhões de parâmetros, otimizado para reconhecimento visual, raciocínio com imagens, legendagem e perguntas e respostas relacionadas a imagens. Ele compreende dados visuais como gráficos e tabelas e conecta visão e linguagem ao gerar descrições textuais de detalhes visuais. Observação: este modelo é atualmente fornecido de forma experimental como um modelo serverless. Para uso em produção, observe que a Fireworks pode descontinuar a implantação sem aviso prévio.",
"accounts/fireworks/models/llama-v3p3-70b-instruct.description": "O Llama 3.3 70B Instruct é a atualização de dezembro do Llama 3.1 70B. Ele melhora o uso de ferramentas, suporte a texto multilíngue, matemática e programação em relação à versão de julho de 2024. Alcança desempenho líder da indústria em raciocínio, matemática e seguimento de instruções, oferecendo desempenho comparável ao 3.1 405B com vantagens significativas de velocidade e custo.",
"accounts/fireworks/models/mistral-small-24b-instruct-2501.description": "Um modelo com 24 bilhões de parâmetros com capacidade de ponta comparável a modelos maiores.",
"accounts/fireworks/models/mixtral-8x22b-instruct.description": "Mixtral MoE 8x22B Instruct v0.1 é a versão ajustada por instrução do Mixtral MoE 8x22B v0.1, com a API de conclusão de chat ativada.",
"accounts/fireworks/models/mixtral-8x7b-instruct.description": "Mixtral MoE 8x7B Instruct é a versão ajustada por instrução do Mixtral MoE 8x7B, com a API de conclusão de chat ativada.",
"accounts/fireworks/models/mythomax-l2-13b.description": "Uma variante aprimorada do MythoMix, possivelmente sua forma mais refinada, combinando MythoLogic-L2 e Huginn com uma técnica altamente experimental de fusão de tensores. Sua natureza única o torna excelente para contar histórias e interpretação de papéis.",
"accounts/fireworks/models/phi-3-vision-128k-instruct.description": "Phi-3-Vision-128K-Instruct é um modelo multimodal leve e de última geração construído a partir de dados sintéticos e conjuntos de dados públicos selecionados da web, com foco em dados de texto e visão de alta qualidade e intensivos em raciocínio. Pertence à família Phi-3, com uma versão multimodal que suporta um contexto de 128K tokens. O modelo passa por aprimoramentos rigorosos, incluindo ajuste supervisionado e otimização direta de preferências, para garantir seguimento preciso de instruções e fortes medidas de segurança.",
"accounts/fireworks/models/qwen-qwq-32b-preview.description": "O modelo Qwen QwQ foca no avanço do raciocínio em IA, demonstrando que modelos abertos podem rivalizar com modelos fechados de ponta em raciocínio. QwQ-32B-Preview é uma versão experimental que iguala o o1 e supera o GPT-4o e Claude 3.5 Sonnet em raciocínio e análise nos benchmarks GPQA, AIME, MATH-500 e LiveCodeBench. Observação: este modelo é atualmente fornecido de forma experimental como um modelo serverless. Para uso em produção, observe que a Fireworks pode descontinuar a implantação sem aviso prévio.",
"accounts/fireworks/models/qwen2-vl-72b-instruct.description": "O modelo Qwen-VL 72B é a iteração mais recente da Alibaba, refletindo quase um ano de inovação.",
"accounts/fireworks/models/qwen2p5-72b-instruct.description": "Qwen2.5 é uma série de modelos LLM apenas com decodificador desenvolvida pela equipe Qwen e Alibaba Cloud, oferecendo tamanhos de 0.5B, 1.5B, 3B, 7B, 14B, 32B e 72B, com variantes base e ajustadas por instrução.",
"accounts/fireworks/models/qwen2p5-coder-32b-instruct.description": "Qwen2.5-Coder é o mais recente modelo LLM da Qwen projetado para programação (anteriormente CodeQwen). Observação: este modelo é atualmente fornecido de forma experimental como um modelo serverless. Para uso em produção, observe que a Fireworks pode descontinuar a implantação sem aviso prévio.",
"accounts/yi-01-ai/models/yi-large.description": "Yi-Large é um modelo LLM de alto nível que ocupa posição logo abaixo do GPT-4, Gemini 1.5 Pro e Claude 3 Opus no ranking LMSYS. Ele se destaca em capacidade multilíngue, especialmente em espanhol, chinês, japonês, alemão e francês. Yi-Large também é amigável para desenvolvedores, utilizando o mesmo esquema de API do OpenAI para fácil integração.",
"ai21-jamba-1.5-large.description": "Um modelo multilíngue com 398 bilhões de parâmetros (94B ativos), janela de contexto de 256K, chamadas de função, saída estruturada e geração fundamentada.",
"ai21-jamba-1.5-mini.description": "Um modelo multilíngue com 52 bilhões de parâmetros (12B ativos), janela de contexto de 256K, chamadas de função, saída estruturada e geração fundamentada.",
"ai21-labs/AI21-Jamba-1.5-Large.description": "Um modelo multilíngue com 398 bilhões de parâmetros (94B ativos), janela de contexto de 256K, chamadas de função, saída estruturada e geração fundamentada.",
"ai21-labs/AI21-Jamba-1.5-Mini.description": "Um modelo multilíngue com 52 bilhões de parâmetros (12B ativos), janela de contexto de 256K, chamadas de função, saída estruturada e geração fundamentada.",
"alibaba/qwen-3-14b.description": "Qwen3 é a geração mais recente da série Qwen, oferecendo um conjunto abrangente de modelos densos e MoE. Baseado em treinamento extensivo, traz avanços em raciocínio, seguimento de instruções, capacidades de agente e suporte multilíngue.",
"alibaba/qwen-3-235b.description": "Qwen3 é a geração mais recente da série Qwen, oferecendo um conjunto abrangente de modelos densos e MoE. Baseado em treinamento extensivo, traz avanços em raciocínio, seguimento de instruções, capacidades de agente e suporte multilíngue.",
"alibaba/qwen-3-30b.description": "Qwen3 é a geração mais recente da série Qwen, oferecendo um conjunto abrangente de modelos densos e MoE. Baseado em treinamento extensivo, traz avanços em raciocínio, seguimento de instruções, capacidades de agente e suporte multilíngue.",
"alibaba/qwen-3-32b.description": "Qwen3 é a geração mais recente da série Qwen, oferecendo um conjunto abrangente de modelos densos e MoE. Baseado em treinamento extensivo, traz avanços em raciocínio, seguimento de instruções, capacidades de agente e suporte multilíngue.",
"alibaba/qwen3-coder.description": "Qwen3-Coder-480B-A35B-Instruct é o modelo de código mais agente da Qwen, com excelente desempenho em programação autônoma, uso de navegador por agentes e outras tarefas centrais de codificação, alcançando resultados comparáveis ao nível do Claude Sonnet.",
"amazon/nova-lite.description": "Um modelo multimodal de baixíssimo custo com processamento extremamente rápido de entradas de imagem, vídeo e texto.",
"amazon/nova-micro.description": "Um modelo apenas de texto que oferece latência ultrabaixa a um custo muito reduzido.",
"amazon/nova-pro.description": "Um modelo multimodal altamente capaz com o melhor equilíbrio entre precisão, velocidade e custo para uma ampla gama de tarefas.",
"amazon/titan-embed-text-v2.description": "Amazon Titan Text Embeddings V2 é um modelo de embeddings multilíngue leve e eficiente, com suporte para dimensões de 1024, 512 e 256.",
"anthropic.claude-3-5-sonnet-20240620-v1:0.description": "Claude 3.5 Sonnet eleva o padrão da indústria, superando concorrentes e o Claude 3 Opus em avaliações amplas, mantendo velocidade e custo intermediários.",
"anthropic.claude-3-5-sonnet-20241022-v2:0.description": "Claude 3.5 Sonnet eleva o padrão da indústria, superando concorrentes e o Claude 3 Opus em avaliações amplas, mantendo velocidade e custo intermediários.",
"anthropic.claude-3-haiku-20240307-v1:0.description": "Claude 3 Haiku é o modelo mais rápido e compacto da Anthropic, oferecendo respostas quase instantâneas para consultas simples. Proporciona experiências de IA naturais e fluídas, com suporte a entrada de imagem e janela de contexto de 200 mil tokens.",
"anthropic.claude-3-opus-20240229-v1:0.description": "Claude 3 Opus é o modelo de IA mais poderoso da Anthropic, com desempenho de ponta em tarefas altamente complexas. Lida com prompts abertos e cenários inéditos com fluência excepcional e compreensão semelhante à humana, além de suportar entrada de imagem com janela de contexto de 200 mil tokens.",
"anthropic.claude-3-sonnet-20240229-v1:0.description": "Claude 3 Sonnet equilibra inteligência e velocidade para cargas de trabalho corporativas, oferecendo alto valor a um custo reduzido. Foi projetado como um modelo confiável para implantações de IA em escala e suporta entrada de imagem com janela de contexto de 200 mil tokens.",
"anthropic.claude-instant-v1.description": "Um modelo rápido, econômico e ainda assim capaz para conversas cotidianas, análise de texto, resumo e perguntas e respostas sobre documentos.",
"anthropic.claude-v2.description": "Um modelo altamente capaz para tarefas que vão de diálogos complexos e geração criativa até seguimento detalhado de instruções.",
"anthropic.claude-v2:1.description": "Uma versão atualizada do Claude 2 com o dobro da janela de contexto e melhorias em confiabilidade, taxa de alucinação e precisão baseada em evidências para documentos longos e RAG.",
"anthropic/claude-3-haiku.description": "Claude 3 Haiku é o modelo mais rápido da Anthropic, projetado para cargas de trabalho corporativas com prompts longos. Analisa rapidamente documentos extensos como relatórios trimestrais, contratos ou casos jurídicos a metade do custo de modelos similares.",
"anthropic/claude-3-opus.description": "Claude 3 Opus é o modelo mais inteligente da Anthropic, com desempenho líder de mercado em tarefas altamente complexas, lidando com prompts abertos e cenários inéditos com fluência excepcional e compreensão semelhante à humana.",
"anthropic/claude-3.5-haiku.description": "Claude 3.5 Haiku apresenta velocidade aprimorada, maior precisão em codificação e uso de ferramentas, ideal para cenários com exigências elevadas de velocidade e interação com ferramentas.",
"anthropic/claude-3.5-sonnet.description": "Claude 3.5 Sonnet é o modelo rápido e eficiente da família Sonnet, oferecendo melhor desempenho em codificação e raciocínio, com algumas versões sendo gradualmente substituídas pelo Sonnet 3.7 e posteriores.",
"anthropic/claude-3.7-sonnet.description": "Claude 3.7 Sonnet é um modelo Sonnet aprimorado com raciocínio e codificação mais robustos, adequado para tarefas complexas em nível corporativo.",
"anthropic/claude-haiku-4.5.description": "Claude Haiku 4.5 é o modelo rápido de alto desempenho da Anthropic, oferecendo latência muito baixa com alta precisão.",
"anthropic/claude-opus-4.1.description": "Opus 4.1 é o modelo de ponta da Anthropic, otimizado para programação, raciocínio complexo e tarefas de longa duração.",
"anthropic/claude-opus-4.5.description": "Claude Opus 4.5 é o modelo principal da Anthropic, combinando inteligência de alto nível com desempenho escalável para tarefas complexas e raciocínio de alta qualidade.",
"anthropic/claude-opus-4.description": "Opus 4 é o modelo principal da Anthropic, projetado para tarefas complexas e aplicações corporativas.",
"anthropic/claude-sonnet-4.5.description": "Claude Sonnet 4.5 é o mais recente modelo híbrido de raciocínio da Anthropic, otimizado para raciocínio complexo e codificação.",
"anthropic/claude-sonnet-4.description": "Claude Sonnet 4 é o modelo híbrido de raciocínio da Anthropic com capacidade mista de pensamento e não-pensamento.",
"aya.description": "Aya 23 é o modelo multilíngue da Cohere com suporte a 23 idiomas para diversos casos de uso.",
"aya:35b.description": "Aya 23 é o modelo multilíngue da Cohere com suporte a 23 idiomas para diversos casos de uso.",
"azure-DeepSeek-R1-0528.description": "Implantado pela Microsoft; o DeepSeek R1 foi atualizado para DeepSeek-R1-0528. A atualização aumenta o poder computacional e otimizações no algoritmo pós-treinamento, melhorando significativamente a profundidade de raciocínio e inferência. Apresenta ótimo desempenho em benchmarks de matemática, programação e lógica geral, aproximando-se de modelos líderes como o O3 e Gemini 2.5 Pro.",
"baichuan-m2-32b.description": "Baichuan M2 32B é um modelo MoE da Baichuan Intelligence com forte capacidade de raciocínio.",
"baichuan/baichuan2-13b-chat.description": "Baichuan-13B é um LLM de 13 bilhões de parâmetros de código aberto e uso comercial da Baichuan, alcançando resultados de ponta para seu tamanho em benchmarks autoritativos em chinês e inglês.",
"baidu/ernie-5.0-thinking-preview.description": "ERNIE 5.0 Thinking Preview é o modelo ERNIE multimodal nativo de próxima geração da Baidu, com forte compreensão multimodal, seguimento de instruções, criação, perguntas e respostas factuais e uso de ferramentas.",
"big-pickle.description": "Big Pickle da OpenCode — modelo open-weights gratuito com fortes capacidades em programação.",
"black-forest-labs/flux-1.1-pro.description": "FLUX 1.1 Pro é uma versão mais rápida e aprimorada do FLUX Pro, com excelente qualidade de imagem e aderência ao prompt.",
"black-forest-labs/flux-dev.description": "FLUX Dev é a versão de desenvolvimento do FLUX para uso não comercial.",
"black-forest-labs/flux-pro.description": "FLUX Pro é o modelo profissional do FLUX para geração de imagens de alta qualidade.",
"black-forest-labs/flux-schnell.description": "FLUX Schnell é um modelo de geração de imagens rápido, otimizado para velocidade.",
"c4ai-aya-expanse-32b.description": "Aya Expanse é um modelo multilíngue de alto desempenho com 32 bilhões de parâmetros que utiliza ajuste por instrução, arbitragem de dados, treinamento por preferência e fusão de modelos para rivalizar com modelos monolíngues. Suporta 23 idiomas.",
"c4ai-aya-expanse-8b.description": "Aya Expanse é um modelo multilíngue de alto desempenho com 8 bilhões de parâmetros que utiliza ajuste por instrução, arbitragem de dados, treinamento por preferência e fusão de modelos para rivalizar com modelos monolíngues. Suporta 23 idiomas.",
"c4ai-aya-vision-32b.description": "Aya Vision é um modelo multimodal de última geração com forte desempenho em benchmarks de linguagem, texto e visão. Suporta 23 idiomas. Esta versão de 32B foca em desempenho multilíngue de alto nível.",
"c4ai-aya-vision-8b.description": "Aya Vision é um modelo multimodal de última geração com forte desempenho em benchmarks de linguagem, texto e visão. Esta versão de 8B foca em baixa latência e desempenho robusto.",
"charglm-3.description": "CharGLM-3 foi desenvolvido para simulação de papéis e companhia emocional, com suporte a memória de múltiplas interações de longo prazo e diálogo personalizado.",
"charglm-4.description": "CharGLM-4 foi desenvolvido para simulação de papéis e companhia emocional, com suporte a memória de múltiplas interações de longo prazo e diálogo personalizado.",
"chat-latest.description": "Modelo Instantâneo mais recente usado no ChatGPT.",
"chatgpt-4o-latest.description": "ChatGPT-4o é um modelo dinâmico atualizado em tempo real. Combina forte compreensão e geração de linguagem para casos de uso em larga escala, como suporte ao cliente, educação e assistência técnica.",
"claude-2.0.description": "Claude 2 oferece melhorias importantes para empresas, incluindo um contexto líder de 200 mil tokens, menos alucinações, prompts de sistema e um novo recurso de teste: chamadas de ferramentas.",
"claude-2.1.description": "Claude 2 oferece melhorias importantes para empresas, incluindo um contexto líder de 200 mil tokens, menos alucinações, prompts de sistema e um novo recurso de teste: chamadas de ferramentas.",
"claude-3-5-haiku-20241022.description": "Claude 3.5 Haiku é o modelo de próxima geração mais rápido da Anthropic. Comparado ao Claude 3 Haiku, ele apresenta melhorias em várias habilidades e supera o maior modelo anterior, Claude 3 Opus, em muitos benchmarks de inteligência.",
"claude-3-5-haiku-latest.description": "Claude 3.5 Haiku oferece respostas rápidas para tarefas leves.",
"claude-3-5-haiku.description": "Claude Haiku 3.5 da Anthropic — modelo rápido e econômico com suporte a visão.",
"claude-3-7-sonnet-20250219.description": "Claude 3.7 Sonnet é o modelo mais inteligente da Anthropic e o primeiro modelo de raciocínio híbrido do mercado. Ele pode produzir respostas quase instantâneas ou raciocínios detalhados passo a passo que os usuários podem acompanhar. O Sonnet é especialmente forte em codificação, ciência de dados, visão e tarefas de agentes.",
"claude-3-7-sonnet-latest.description": "Claude 3.7 Sonnet é o modelo mais recente e avançado da Anthropic para tarefas altamente complexas, com excelência em desempenho, inteligência, fluência e compreensão.",
"claude-3-haiku-20240307.description": "Claude 3 Haiku é o modelo mais rápido e compacto da Anthropic, projetado para respostas quase instantâneas com desempenho rápido e preciso.",
"claude-3-opus-20240229.description": "Claude 3 Opus é o modelo mais poderoso da Anthropic para tarefas altamente complexas, com excelência em desempenho, inteligência, fluência e compreensão.",
"claude-3-sonnet-20240229.description": "Claude 3 Sonnet equilibra inteligência e velocidade para cargas de trabalho empresariais, oferecendo alta utilidade com menor custo e implantação confiável em larga escala.",
"claude-fable-5.description": "Claude Fable 5 é o modelo mais avançado da Anthropic — um novo nível acima do Opus para os trabalhos mais exigentes de raciocínio e agentes de longo prazo.",
"claude-haiku-4-5-20251001.description": "Claude Haiku 4.5 é o modelo Haiku mais rápido e inteligente da Anthropic, com velocidade relâmpago e raciocínio ampliado.",
"claude-haiku-4-5.description": "Claude Haiku 4.5 da Anthropic — nova geração do Haiku, com raciocínio e visão aprimorados.",
"claude-haiku-4.5.description": "Claude Haiku 4.5 é o modelo Haiku mais rápido e inteligente da Anthropic, com velocidade relâmpago e raciocínio ampliado.",
"claude-opus-4-1-20250805-thinking.description": "Claude Opus 4.1 Thinking é uma variante avançada que pode revelar seu processo de raciocínio.",
"claude-opus-4-1-20250805.description": "Claude Opus 4.1 é o modelo mais recente e avançado da Anthropic para tarefas altamente complexas, destacando-se em desempenho, inteligência, fluência e compreensão.",
"claude-opus-4-1.description": "Claude Opus 4.1 da Anthropic — modelo premium de raciocínio com capacidades avançadas de análise.",
"claude-opus-4-20250514.description": "Claude Opus 4 é o modelo mais poderoso da Anthropic para tarefas altamente complexas, destacando-se em desempenho, inteligência, fluência e compreensão.",
"claude-opus-4-5-20251101.description": "Claude Opus 4.5 é o modelo principal da Anthropic, combinando inteligência excepcional com desempenho escalável, ideal para tarefas complexas que exigem respostas e raciocínio da mais alta qualidade.",
"claude-opus-4-5.description": "Claude Opus 4.5 da Anthropic — modelo principal com raciocínio e programação de alto nível.",
"claude-opus-4-6.description": "Claude Opus 4.6 da Anthropic — modelo principal com janela de contexto de 1M e raciocínio avançado.",
"claude-opus-4-7.description": "Claude Opus 4.7 da Anthropic — última geração do Opus com raciocínio e programação de ponta.",
"claude-opus-4-8.description": "Claude Opus 4.8 é o modelo mais avançado da Anthropic, baseado no Opus 4.7 com melhorias em raciocínio, codificação agente e uso de ferramentas.",
"claude-opus-4.5.description": "Claude Opus 4.5 é o modelo principal da Anthropic, combinando inteligência de ponta com desempenho escalável para tarefas complexas de raciocínio de alta qualidade.",
"claude-opus-4.6-fast.description": "Claude Opus 4.6 é o modelo mais inteligente da Anthropic para criação de agentes e codificação.",
"claude-opus-4.6.description": "Claude Opus 4.6 é o modelo mais inteligente da Anthropic para criação de agentes e codificação.",
"claude-sonnet-4-20250514-thinking.description": "Claude Sonnet 4 Thinking pode produzir respostas quase instantâneas ou pensamento passo a passo estendido com processo visível.",
"claude-sonnet-4-20250514.description": "Claude Sonnet 4 pode produzir respostas quase instantâneas ou raciocínio passo a passo detalhado com processo visível.",
"claude-sonnet-4-5-20250929.description": "Claude Sonnet 4.5 é o modelo mais inteligente da Anthropic até o momento.",
"claude-sonnet-4-5.description": "Claude Sonnet 4.5 da Anthropic — versão aprimorada do Sonnet com desempenho superior em programação.",
"claude-sonnet-4-6.description": "Claude Sonnet 4.6 da Anthropic — última geração do Sonnet, com alta qualidade em programação e uso de ferramentas.",
"claude-sonnet-4.5.description": "Claude Sonnet 4.5 é o modelo mais inteligente da Anthropic até o momento.",
"claude-sonnet-4.6.description": "Claude Sonnet 4.6 é a melhor combinação de velocidade e inteligência da Anthropic.",
"claude-sonnet-4.description": "Claude Sonnet 4 da Anthropic — modelo equilibrado com fortes habilidades em raciocínio e programação.",
"codegeex-4.description": "CodeGeeX-4 é um assistente de codificação com IA poderoso que oferece suporte a perguntas e respostas multilíngues e autocompletar código para aumentar a produtividade dos desenvolvedores.",
"codegeex4-all-9b.description": "CodeGeeX4-ALL-9B é um modelo de geração de código multilíngue que oferece suporte a autocompletar e geração de código, interpretação de código, busca na web, chamadas de função e perguntas e respostas em nível de repositório, cobrindo uma ampla gama de cenários de desenvolvimento de software. É um modelo de código de alto nível com menos de 10 bilhões de parâmetros.",
"codegemma.description": "CodeGemma é um modelo leve para tarefas variadas de programação, permitindo iteração rápida e fácil integração.",
"codegemma:2b.description": "CodeGemma é um modelo leve para tarefas variadas de programação, permitindo iteração rápida e fácil integração.",
"codellama.description": "Code Llama é um modelo de linguagem grande (LLM) focado em geração e discussão de código, com amplo suporte a linguagens para fluxos de trabalho de desenvolvedores.",
"codellama/CodeLlama-34b-Instruct-hf.description": "Code Llama é um modelo de linguagem grande (LLM) focado em geração e discussão de código, com amplo suporte a linguagens para fluxos de trabalho de desenvolvedores.",
"codellama:13b.description": "Code Llama é um modelo de linguagem grande (LLM) focado em geração e discussão de código, com amplo suporte a linguagens para fluxos de trabalho de desenvolvedores.",
"codellama:34b.description": "Code Llama é um modelo de linguagem grande (LLM) focado em geração e discussão de código, com amplo suporte a linguagens para fluxos de trabalho de desenvolvedores.",
"codellama:70b.description": "Code Llama é um modelo de linguagem grande (LLM) focado em geração e discussão de código, com amplo suporte a linguagens para fluxos de trabalho de desenvolvedores.",
"codeqwen.description": "CodeQwen1.5 é um modelo de linguagem grande treinado com uma ampla base de dados de código, projetado para tarefas complexas de programação.",
"codestral-latest.description": "Codestral é nosso modelo de codificação mais avançado; a versão v2 (jan 2025) é voltada para tarefas de baixa latência e alta frequência como FIM, correção de código e geração de testes.",
"codestral.description": "Codestral é o primeiro modelo de código da Mistral AI, oferecendo suporte robusto à geração de código.",
"cogito-2.1:671b.description": "Cogito v2.1 671B é um modelo de linguagem grande de código aberto dos EUA, gratuito para uso comercial, com desempenho comparável aos melhores modelos, maior eficiência de raciocínio por token, contexto longo de 128k e capacidade geral robusta.",
"cogvideox-2.description": "CogVideoX-2 é o modelo de fundação de geração de vídeo de nova geração da Zhipu, com capacidades de imagem-para-vídeo melhoradas em 38%. Ele oferece melhorias significativas no manejo de movimentos em larga escala, estabilidade visual, aderência a instruções, estilo artístico e estética visual geral.",
"cogvideox-3.description": "CogVideoX-3 adiciona um recurso de geração de quadros inicial e final, melhorando significativamente a estabilidade e clareza visual. Ele permite movimentos suaves e naturais de sujeitos em larga escala, oferece melhor aderência a instruções e simulação física mais realista, além de aprimorar o desempenho em cenas realistas de alta definição e estilo 3D.",
"cogvideox-flash.description": "CogVideoX-Flash é um modelo gratuito de geração de vídeo lançado pela Zhipu, capaz de gerar vídeos que seguem as instruções do usuário enquanto alcançam pontuações mais altas de qualidade estética.",
"cogview-3-flash.description": "CogView-3-Flash é um modelo gratuito de geração de imagens lançado pela Zhipu. Ele gera imagens que estão alinhadas com as instruções do usuário, ao mesmo tempo em que alcança pontuações mais altas de qualidade estética. O CogView-3-Flash é amplamente utilizado em áreas como criação artística, referência de design, desenvolvimento de jogos e realidade virtual, ajudando os usuários a converter rapidamente descrições de texto em imagens.",
"cogview-4.description": "CogView-4 é o primeiro modelo de texto para imagem de código aberto da Zhipu que pode gerar caracteres chineses. Ele melhora a compreensão semântica, a qualidade da imagem e a renderização de texto em chinês/inglês, suporta prompts bilíngues de qualquer comprimento e pode gerar imagens em qualquer resolução dentro de faixas especificadas.",
"cohere-command-r-plus.description": "Command R+ é um modelo avançado otimizado para RAG, desenvolvido para cargas de trabalho empresariais.",
"cohere-command-r.description": "Command R é um modelo generativo escalável projetado para uso com RAG e ferramentas, permitindo IA em nível de produção.",
"cohere/Cohere-command-r-plus.description": "Command R+ é um modelo avançado otimizado para RAG, desenvolvido para cargas de trabalho empresariais.",
"cohere/Cohere-command-r.description": "Command R é um modelo generativo escalável projetado para uso com RAG e ferramentas, permitindo IA em nível de produção.",
"cohere/command-a.description": "Command A é o modelo mais poderoso da Cohere até o momento, com excelência no uso de ferramentas, agentes, RAG e casos de uso multilíngues. Possui janela de contexto de 256K, roda em apenas duas GPUs e oferece 150% mais rendimento que o Command R+ 08-2024.",
"cohere/embed-v4.0.description": "Um modelo que classifica ou converte texto, imagens ou conteúdo misto em embeddings.",
"comfyui/flux-dev.description": "FLUX.1 Dev é um modelo de texto para imagem de alta qualidade (1050 etapas), ideal para resultados criativos e artísticos premium.",
"comfyui/flux-kontext-dev.description": "FLUX.1 Kontext-dev é um modelo de edição de imagem que permite edições guiadas por texto, incluindo edições locais e transferência de estilo.",
"comfyui/flux-krea-dev.description": "FLUX.1 Krea-dev é um modelo de texto para imagem com filtros de segurança integrados, co-desenvolvido com a Krea.",
"comfyui/flux-schnell.description": "FLUX.1 Schnell é um modelo de texto para imagem ultrarrápido que gera imagens de alta qualidade em 14 etapas, ideal para uso em tempo real e prototipagem rápida.",
"comfyui/stable-diffusion-15.description": "Stable Diffusion 1.5 é um modelo clássico de texto para imagem 512x512, ideal para prototipagem rápida e experimentos criativos.",
"comfyui/stable-diffusion-35-inclclip.description": "Stable Diffusion 3.5 com codificadores CLIP/T5 integrados, não requer arquivos de codificador externos, adequado para modelos como sd3.5_medium_incl_clips com menor uso de recursos.",
"comfyui/stable-diffusion-35.description": "Stable Diffusion 3.5 é um modelo de texto para imagem de nova geração com variantes Large e Medium. Requer arquivos de codificador CLIP externos e oferece excelente qualidade de imagem e aderência ao prompt.",
"comfyui/stable-diffusion-custom-refiner.description": "Modelo personalizado SDXL de imagem para imagem. Use custom_sd_lobe.safetensors como nome do arquivo do modelo; se tiver um VAE, use custom_sd_vae_lobe.safetensors. Coloque os arquivos do modelo nas pastas exigidas pelo Comfy.",
"comfyui/stable-diffusion-custom.description": "Modelo personalizado SD de texto para imagem. Use custom_sd_lobe.safetensors como nome do arquivo do modelo; se tiver um VAE, use custom_sd_vae_lobe.safetensors. Coloque os arquivos do modelo nas pastas exigidas pelo Comfy.",
"comfyui/stable-diffusion-refiner.description": "Modelo SDXL de imagem para imagem que realiza transformações de alta qualidade a partir de imagens de entrada, com suporte a transferência de estilo, restauração e variações criativas.",
"comfyui/stable-diffusion-xl.description": "SDXL é um modelo de texto para imagem que suporta geração em alta resolução 1024x1024 com melhor qualidade de imagem e detalhes.",
"command-a-03-2025.description": "O Command A é o nosso modelo mais avançado até o momento, com excelente desempenho no uso de ferramentas, agentes, RAG e cenários multilíngues. Possui uma janela de contexto de 256K, opera com apenas duas GPUs e oferece 150% mais rendimento do que o Command R+ 08-2024.",
"command-light-nightly.description": "Para reduzir o intervalo entre grandes lançamentos, oferecemos versões noturnas do Command. Na série command-light, essa versão é chamada de command-light-nightly. É a versão mais recente e experimental (e potencialmente instável), atualizada regularmente sem aviso prévio, portanto não é recomendada para ambientes de produção.",
"command-light.description": "Uma variante menor e mais rápida do Command, quase tão capaz quanto, mas com maior velocidade.",
"command-nightly.description": "Para reduzir o intervalo entre grandes lançamentos, oferecemos versões noturnas do Command. Na série Command, essa versão é chamada de command-nightly. É a versão mais recente e experimental (e potencialmente instável), atualizada regularmente sem aviso prévio, portanto não é recomendada para ambientes de produção.",
"command-r-03-2024.description": "command-r é um modelo de chat orientado por instruções que realiza tarefas de linguagem com maior qualidade, confiabilidade aprimorada e contexto mais longo do que modelos anteriores. Ele suporta fluxos de trabalho complexos, como geração de código, RAG, uso de ferramentas e agentes.",
"command-r-08-2024.description": "command-r-08-2024 é uma versão atualizada do modelo Command R, lançada em agosto de 2024.",
"command-r-plus-04-2024.description": "command-r-plus é um alias de command-r-plus-04-2024, portanto, ao usar command-r-plus na API, você estará acessando esse modelo.",
"command-r-plus-08-2024.description": "O Command R+ é um modelo de chat que segue instruções, com maior qualidade, confiabilidade e uma janela de contexto mais longa do que os modelos anteriores. É ideal para fluxos de trabalho RAG complexos e uso de ferramentas em múltiplas etapas.",
"command-r-plus.description": "O Command R+ é um LLM de alto desempenho projetado para cenários empresariais reais e aplicativos complexos.",
"command-r.description": "O Command R é um LLM otimizado para chat e tarefas com contexto longo, ideal para interações dinâmicas e gestão de conhecimento.",
"command-r7b-12-2024.description": "command-r7b-12-2024 é uma atualização pequena e eficiente lançada em dezembro de 2024. Destaca-se em tarefas de RAG, uso de ferramentas e agentes que exigem raciocínio complexo em múltiplas etapas.",
"command.description": "Um modelo de chat que segue instruções, oferecendo maior qualidade e confiabilidade em tarefas de linguagem, com uma janela de contexto mais longa do que nossos modelos generativos básicos.",
"computer-use-preview.description": "computer-use-preview é um modelo especializado para a ferramenta \"uso de computador\", treinado para compreender e executar tarefas relacionadas ao uso de computadores.",
"dall-e-3.description": "DALL·E 3",
"databricks/dbrx-instruct.description": "O DBRX Instruct oferece manuseio de instruções altamente confiável em diversos setores.",
"deepseek-ai/DeepSeek-OCR.description": "O DeepSeek-OCR é um modelo de visão e linguagem da DeepSeek AI focado em OCR e \"compressão óptica contextual\". Explora a compressão de contexto a partir de imagens, processa documentos de forma eficiente e os converte em texto estruturado (por exemplo, Markdown). Reconhece texto em imagens com precisão, sendo ideal para digitalização de documentos, extração de texto e processamento estruturado.",
"deepseek-ai/DeepSeek-R1-0528-Qwen3-8B.description": "O DeepSeek-R1-0528-Qwen3-8B destila o raciocínio em cadeia do DeepSeek-R1-0528 no Qwen3 8B Base. Alcança SOTA entre modelos abertos, superando o Qwen3 8B em 10% no AIME 2024 e igualando o desempenho do Qwen3-235B-thinking. Destaca-se em raciocínio matemático, programação e benchmarks de lógica geral. Compartilha a arquitetura do Qwen3-8B, mas usa o tokenizador do DeepSeek-R1-0528.",
"deepseek-ai/DeepSeek-R1-0528.description": "O DeepSeek R1 aproveita maior capacidade computacional e otimizações algorítmicas pós-treinamento para aprofundar o raciocínio. Apresenta desempenho sólido em benchmarks de matemática, programação e lógica geral, aproximando-se de líderes como o o3 e o Gemini 2.5 Pro.",
"deepseek-ai/DeepSeek-R1-Distill-Llama-70B.description": "Os modelos destilados DeepSeek-R1 utilizam aprendizado por reforço (RL) e dados de inicialização a frio para melhorar o raciocínio e estabelecer novos benchmarks multitarefa entre modelos abertos.",
"deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B.description": "Os modelos destilados DeepSeek-R1 utilizam aprendizado por reforço (RL) e dados de inicialização a frio para melhorar o raciocínio e estabelecer novos benchmarks multitarefa entre modelos abertos.",
"deepseek-ai/DeepSeek-R1-Distill-Qwen-14B.description": "Os modelos destilados DeepSeek-R1 utilizam aprendizado por reforço (RL) e dados de inicialização a frio para melhorar o raciocínio e estabelecer novos benchmarks multitarefa entre modelos abertos.",
"deepseek-ai/DeepSeek-R1.description": "O DeepSeek-R1 melhora o raciocínio com dados de inicialização a frio e aprendizado por reforço, estabelecendo novos benchmarks multitarefa entre modelos abertos e superando o OpenAI-o1-mini.",
"deepseek-ai/DeepSeek-V3.1-Terminus.description": "O DeepSeek-V3.1-Terminus é uma versão atualizada do modelo V3.1, posicionado como um LLM híbrido com foco em agentes. Corrige problemas relatados por usuários e melhora a estabilidade, consistência linguística e reduz caracteres anômalos e mistura de idiomas. Integra modos de pensamento e não-pensamento com templates de chat para alternância flexível. Também aprimora o desempenho dos agentes de código e busca para uso mais confiável de ferramentas e tarefas em múltiplas etapas.",
"deepseek-ai/DeepSeek-V3.1.description": "O DeepSeek V3.1 utiliza uma arquitetura de raciocínio híbrida e suporta modos de pensamento e não-pensamento.",
"deepseek-ai/DeepSeek-V3.2-Exp.description": "DeepSeek V3.2 Exp utiliza uma arquitetura de raciocínio híbrida e suporta modos de pensamento e não-pensamento.",
"deepseek-ai/DeepSeek-V3.2.description": "DeepSeek-V3.2 é um modelo que combina alta eficiência computacional com excelente desempenho em raciocínio e como Agente. Sua abordagem é baseada em três avanços tecnológicos principais: DeepSeek Sparse Attention (DSA), um mecanismo de atenção eficiente que reduz significativamente a complexidade computacional enquanto mantém o desempenho do modelo, otimizado especificamente para cenários de longo contexto; uma estrutura escalável de aprendizado por reforço, através da qual o desempenho do modelo pode rivalizar com o GPT-5, e sua versão de alta computação pode igualar o Gemini-3.0-Pro em capacidades de raciocínio; e um pipeline de síntese de tarefas de Agente em larga escala, projetado para integrar capacidades de raciocínio em cenários de uso de ferramentas, melhorando o seguimento de instruções e a generalização em ambientes interativos complexos. O modelo alcançou desempenho medalha de ouro na Olimpíada Internacional de Matemática (IMO) e na Olimpíada Internacional de Informática (IOI) de 2025.",
"deepseek-ai/DeepSeek-V3.description": "O DeepSeek-V3 é um modelo MoE com 671 bilhões de parâmetros, utilizando MLA e DeepSeekMoE com balanceamento de carga sem perdas para treinamento e inferência eficientes. Pré-treinado com 14,8 trilhões de tokens de alta qualidade, com SFT e RL, supera outros modelos abertos e se aproxima dos modelos fechados líderes.",
"deepseek-ai/DeepSeek-V4-Flash.description": "DeepSeek-V4-Flash é uma versão de pré-visualização do modelo de linguagem MoE na série DeepSeek-V4. O tamanho total dos parâmetros é de 284B, o tamanho dos parâmetros de ativação é de 13B e suporta contexto ultra-longo de 1M tokens. O modelo utiliza uma arquitetura de atenção híbrida que combina CSA e HCA, e introduz mHC e Muon Optimizer para melhorar a eficiência do raciocínio em contexto longo, a estabilidade do treinamento e o desempenho geral.",
"deepseek-ai/DeepSeek-V4-Pro.description": "DeepSeek-V4-Pro é o modelo de linguagem MoE carro-chefe da série DeepSeek-V4, com 1,6T de parâmetros totais e 49B de parâmetros ativos, suportando nativamente um contexto ultralongo de 1 milhão de tokens. O modelo adota uma arquitetura inovadora de atenção híbrida que combina Compressed Sparse Attention (CSA) e Highly Compressed Attention (HCA), exigindo apenas 27% dos FLOPs de inferência por token do DeepSeek-V3.2 e 10% do cache KV em um contexto de 1M. Ele também introduz Conexões Hiper Manifold-Constrained (mHC) para melhorar a estabilidade da propagação de sinais entre camadas e emprega o otimizador Muon para acelerar a convergência. O DeepSeek-V4-Pro é pré-treinado em mais de 32T de tokens diversos de alta qualidade, com pós-treinamento usando um paradigma de duas etapas: cultivo independente de especialistas em domínios e destilação de políticas online para integração unificada. Seu modo de intensidade máxima de raciocínio, DeepSeek-V4-Pro-Max, alcança desempenho de ponta em benchmarks de codificação e reduz significativamente a diferença com os principais modelos de código fechado em tarefas de raciocínio e agentes, tornando-o um dos modelos de código aberto mais fortes atualmente, suportando os modos de intensidade de raciocínio Non-think, Think High e Think Max.",
"deepseek-ai/deepseek-llm-67b-chat.description": "O DeepSeek LLM Chat (67B) é um modelo inovador que oferece compreensão profunda da linguagem e interação.",
"deepseek-chat.description": "Um novo modelo de código aberto que combina habilidades gerais e de codificação. Ele preserva o diálogo geral do modelo de chat e a forte capacidade de codificação do modelo de programador, com melhor alinhamento de preferências. O DeepSeek-V2.5 também melhora a escrita e o seguimento de instruções.",
"deepseek-coder-33B-instruct.description": "O DeepSeek Coder 33B é um modelo de linguagem para código treinado com 2 trilhões de tokens (87% código, 13% texto em chinês/inglês). Introduz uma janela de contexto de 16K e tarefas de preenchimento intermediário, oferecendo preenchimento de código em nível de projeto e inserção de trechos.",
"deepseek-coder-v2.description": "O DeepSeek Coder V2 é um modelo de código MoE open-source com forte desempenho em tarefas de programação, comparável ao GPT-4 Turbo.",
"deepseek-coder-v2:236b.description": "O DeepSeek Coder V2 é um modelo de código MoE open-source com forte desempenho em tarefas de programação, comparável ao GPT-4 Turbo.",
"deepseek-r1-0528.description": "Modelo completo de 685B lançado em 28/05/2025. O DeepSeek-R1 utiliza RL em larga escala no pós-treinamento, melhorando significativamente o raciocínio com dados rotulados mínimos, com forte desempenho em matemática, programação e raciocínio em linguagem natural.",
"deepseek-r1-250528.description": "O DeepSeek R1 250528 é o modelo completo de raciocínio DeepSeek-R1 para tarefas difíceis de matemática e lógica.",
"deepseek-r1-70b-fast-online.description": "Edição rápida do DeepSeek R1 70B com busca em tempo real na web, oferecendo respostas mais rápidas sem comprometer o desempenho.",
"deepseek-r1-70b-online.description": "Edição padrão do DeepSeek R1 70B com busca em tempo real na web, ideal para chat e tarefas de texto atualizadas.",
"deepseek-r1-distill-llama-70b.description": "O DeepSeek R1 Distill Llama 70B combina o raciocínio do R1 com o ecossistema Llama.",
"deepseek-r1-distill-llama-8b.description": "O DeepSeek-R1-Distill-Llama-8B é destilado do Llama-3.1-8B usando saídas do DeepSeek R1.",
"deepseek-r1-distill-llama.description": "deepseek-r1-distill-llama é destilado do DeepSeek-R1 sobre o Llama.",
"deepseek-r1-distill-qianfan-70b.description": "O DeepSeek R1 Distill Qianfan 70B é uma destilação do R1 baseada no Qianfan-70B com alto valor.",
"deepseek-r1-distill-qianfan-8b.description": "O DeepSeek R1 Distill Qianfan 8B é uma destilação do R1 baseada no Qianfan-8B para aplicativos de pequeno e médio porte.",
"deepseek-r1-distill-qianfan-llama-70b.description": "O DeepSeek R1 Distill Qianfan Llama 70B é uma destilação do R1 baseada no Llama-70B.",
"deepseek-r1-distill-qwen-1.5b.description": "O DeepSeek R1 Distill Qwen 1.5B é um modelo de destilação ultraleve para ambientes com recursos muito limitados.",
"deepseek-r1-distill-qwen-14b.description": "O DeepSeek R1 Distill Qwen 14B é um modelo de destilação de porte médio para implantação em múltiplos cenários.",
"deepseek-r1-distill-qwen-32b.description": "O DeepSeek R1 Distill Qwen 32B é uma destilação do R1 baseada no Qwen-32B, equilibrando desempenho e custo.",
"deepseek-r1-distill-qwen-7b.description": "O DeepSeek R1 Distill Qwen 7B é um modelo de destilação leve para ambientes de borda e empresas privadas.",
"deepseek-r1-distill-qwen.description": "deepseek-r1-distill-qwen é destilado do DeepSeek-R1 sobre o Qwen.",
"deepseek-r1-fast-online.description": "Versão completa e rápida do DeepSeek R1 com busca em tempo real na web, combinando capacidade de 671B com respostas mais ágeis.",
"deepseek-r1-online.description": "Versão completa do DeepSeek R1 com 671B de parâmetros e busca em tempo real na web, oferecendo compreensão e geração mais robustas.",
"deepseek-r1.description": "O DeepSeek-R1 usa dados de inicialização a frio antes do RL e apresenta desempenho comparável ao OpenAI-o1 em matemática, programação e raciocínio.",
"deepseek-reasoner.description": "Um modelo de raciocínio DeepSeek focado em tarefas complexas de raciocínio lógico.",
"deepseek-v2.description": "O DeepSeek V2 é um modelo MoE eficiente para processamento econômico.",
"deepseek-v2:236b.description": "O DeepSeek V2 236B é o modelo da DeepSeek focado em código com forte geração de código.",
"deepseek-v3-0324.description": "O DeepSeek-V3-0324 é um modelo MoE com 671B de parâmetros, com destaque em programação, capacidade técnica, compreensão de contexto e manipulação de textos longos.",
"deepseek-v3.1-terminus.description": "DeepSeek-V3.1-Terminus é um modelo LLM otimizado para terminais da DeepSeek, desenvolvido especialmente para dispositivos de terminal.",
"deepseek-v3.1-think-250821.description": "DeepSeek V3.1 Think 250821 é o modelo de raciocínio profundo correspondente à versão Terminus, projetado para desempenho elevado em tarefas de raciocínio.",
"deepseek-v3.1.description": "DeepSeek V3.1 utiliza uma arquitetura de raciocínio híbrida com modos de pensamento e não-pensamento.",
"deepseek-v3.1:671b.description": "DeepSeek V3.1 é um modelo de raciocínio de nova geração com melhorias em raciocínio complexo e cadeia de pensamento, ideal para tarefas que exigem análise profunda.",
"deepseek-v3.2-exp.description": "deepseek-v3.2-exp introduz atenção esparsa para melhorar a eficiência de treinamento e inferência em textos longos, com custo inferior ao deepseek-v3.1.",
"deepseek-v3.2-speciale.description": "Em tarefas altamente complexas, o modelo Speciale supera significativamente a versão padrão, mas consome consideravelmente mais tokens e gera custos mais altos. Atualmente, o DeepSeek-V3.2-Speciale é destinado apenas para uso em pesquisa, não suporta chamadas de ferramentas e não foi especificamente otimizado para conversas ou tarefas de escrita do dia a dia.",
"deepseek-v3.2-think.description": "DeepSeek V3.2 Think é um modelo completo de raciocínio profundo com raciocínio em cadeias longas mais robusto.",
"deepseek-v3.2-thinking.description": "DeepSeek-V3.2 Thinking é a variante de modo de raciocínio do DeepSeek-V3.2, focada em tarefas de raciocínio.",
"deepseek-v3.2.description": "DeepSeek-V3.2 é o mais recente modelo de programação da DeepSeek com fortes capacidades de raciocínio.",
"deepseek-v3.description": "DeepSeek-V3 é um poderoso modelo MoE com 671 bilhões de parâmetros totais e 37 bilhões ativos por token.",
"deepseek-v4-flash.description": "DeepSeek-V4-Flash é o modelo eficiente de contexto de 1M do DeepSeek na Volcano Ark, equilibrando velocidade e custo enquanto mantém fortes capacidades de raciocínio e agente.",
"deepseek-v4-pro.description": "DeepSeek-V4-Pro é o modelo MoE principal do DeepSeek na Volcano Ark, suportando modos de pensamento e não-pensamento para raciocínio avançado, geração de código e fluxos de trabalho complexos de agentes.",
"deepseek-vl2-small.description": "DeepSeek VL2 Small é uma versão multimodal leve, ideal para ambientes com recursos limitados e alta concorrência.",
"deepseek-vl2.description": "DeepSeek VL2 é um modelo multimodal para compreensão de imagem-texto e perguntas e respostas visuais detalhadas.",
"deepseek/deepseek-chat-v3-0324.description": "DeepSeek V3 é um modelo MoE com 685 bilhões de parâmetros e a mais recente iteração da série de chat principal da DeepSeek.\n\nBaseado no [DeepSeek V3](/deepseek/deepseek-chat-v3), apresenta excelente desempenho em diversas tarefas.",
"deepseek/deepseek-chat-v3.1.description": "DeepSeek-V3.1 é o modelo híbrido de raciocínio com longo contexto da DeepSeek, com suporte a modos mistos de pensamento/não pensamento e integração com ferramentas.",
"deepseek/deepseek-chat.description": "DeepSeek-V3 é o modelo híbrido de raciocínio de alto desempenho da DeepSeek para tarefas complexas e integração com ferramentas.",
"deepseek/deepseek-math-v2.description": "DeepSeek Math V2 é um modelo que alcançou avanços significativos em capacidades de raciocínio matemático. Sua principal inovação está no mecanismo de treinamento de \"autoverificação\", tendo conquistado níveis de medalha de ouro em diversas competições de matemática de alto nível.",
"deepseek/deepseek-r1-0528.description": "DeepSeek R1 0528 é uma variante atualizada com foco em disponibilidade aberta e raciocínio mais profundo.",
"deepseek/deepseek-r1-distill-llama-70b.description": "DeepSeek R1 Distill Llama 70B é um LLM destilado baseado no Llama 3.3 70B, ajustado com saídas do DeepSeek R1 para alcançar desempenho competitivo com modelos de ponta.",
"deepseek/deepseek-r1-distill-llama-8b.description": "DeepSeek R1 Distill Llama 8B é um LLM destilado baseado no Llama-3.1-8B-Instruct, treinado com saídas do DeepSeek R1.",
"deepseek/deepseek-r1-distill-qwen-14b.description": "DeepSeek R1 Distill Qwen 14B é um LLM destilado baseado no Qwen 2.5 14B, treinado com saídas do DeepSeek R1. Supera o OpenAI o1-mini em vários benchmarks, alcançando resultados de ponta entre modelos densos. Destaques de benchmark:\nAIME 2024 pass@1: 69.7\nMATH-500 pass@1: 93.9\nCodeForces Rating: 1481\nO ajuste fino com saídas do DeepSeek R1 oferece desempenho competitivo com modelos de ponta maiores.",
"deepseek/deepseek-r1-distill-qwen-32b.description": "DeepSeek R1 Distill Qwen 32B é um LLM destilado baseado no Qwen 2.5 32B, treinado com saídas do DeepSeek R1. Supera o OpenAI o1-mini em vários benchmarks, alcançando resultados de ponta entre modelos densos. Destaques de benchmark:\nAIME 2024 pass@1: 72.6\nMATH-500 pass@1: 94.3\nCodeForces Rating: 1691\nO ajuste fino com saídas do DeepSeek R1 oferece desempenho competitivo com modelos de ponta maiores.",
"deepseek/deepseek-r1.description": "DeepSeek R1 foi atualizado para DeepSeek-R1-0528. Com mais capacidade computacional e otimizações algorítmicas pós-treinamento, melhora significativamente a profundidade e capacidade de raciocínio. Apresenta forte desempenho em benchmarks de matemática, programação e lógica geral, aproximando-se de líderes como o o3 e Gemini 2.5 Pro.",
"deepseek/deepseek-r1/community.description": "DeepSeek R1 é o mais recente modelo de código aberto lançado pela equipe DeepSeek, com desempenho de raciocínio muito forte, especialmente em matemática, programação e tarefas de lógica, comparável ao OpenAI o1.",
"deepseek/deepseek-reasoner.description": "DeepSeek-V3 Thinking (reasoner) é o modelo experimental de raciocínio da DeepSeek, adequado para tarefas de alta complexidade.",
"deepseek/deepseek-v3.description": "Um LLM rápido e de uso geral com raciocínio aprimorado.",
"deepseek/deepseek-v3/community.description": "DeepSeek-V3 representa um grande avanço na velocidade de raciocínio em relação aos modelos anteriores. Classifica-se em primeiro lugar entre os modelos de código aberto e rivaliza com os modelos fechados mais avançados. Adota Multi-Head Latent Attention (MLA) e a arquitetura DeepSeekMoE, ambas validadas no DeepSeek-V2. Também introduz uma estratégia auxiliar sem perdas para balanceamento de carga e um objetivo de treinamento com previsão de múltiplos tokens para desempenho superior.",
"deepseek_r1.description": "DeepSeek-R1 é um modelo de raciocínio orientado por aprendizado por reforço que resolve problemas de repetição e legibilidade. Antes do RL, utiliza dados de início a frio para melhorar ainda mais o desempenho de raciocínio. Alcança desempenho comparável ao OpenAI-o1 em tarefas de matemática, programação e raciocínio, com treinamento cuidadosamente projetado para melhorar os resultados gerais.",
"deepseek_r1_distill_llama_70b.description": "DeepSeek-R1-Distill-Llama-70B é destilado do Llama-3.3-70B-Instruct. Como parte da série DeepSeek-R1, é ajustado com amostras geradas pelo DeepSeek-R1 e apresenta forte desempenho em matemática, programação e raciocínio.",
"deepseek_r1_distill_qwen_14b.description": "DeepSeek-R1-Distill-Qwen-14B é destilado do Qwen2.5-14B e ajustado com 800 mil amostras selecionadas geradas pelo DeepSeek-R1, oferecendo raciocínio robusto.",
"deepseek_r1_distill_qwen_32b.description": "DeepSeek-R1-Distill-Qwen-32B é destilado do Qwen2.5-32B e ajustado com 800 mil amostras selecionadas geradas pelo DeepSeek-R1, destacando-se em matemática, programação e raciocínio.",
"devstral-2512.description": "Devstral 2 é um modelo de texto em nível empresarial que se destaca no uso de ferramentas para explorar bases de código, editar múltiplos arquivos e alimentar agentes de engenharia de software.",
"devstral-2:123b.description": "O Devstral 2 123B se destaca no uso de ferramentas para explorar bases de código, editar múltiplos arquivos e oferecer suporte a agentes de engenharia de software.",
"doubao-1.5-lite-32k.description": "O Doubao-1.5-lite é um novo modelo leve com resposta ultrarrápida, oferecendo qualidade e latência de alto nível.",
"doubao-1.5-pro-256k.description": "O Doubao-1.5-pro-256k é uma atualização abrangente do Doubao-1.5-Pro, com melhoria de 10% no desempenho geral. Suporta uma janela de contexto de 256k e até 12k tokens de saída, oferecendo maior desempenho, janela expandida e excelente custo-benefício para casos de uso mais amplos.",
"doubao-1.5-pro-32k.description": "O Doubao-1.5-pro é um modelo carro-chefe de nova geração com melhorias em todas as áreas, destacando-se em conhecimento, programação e raciocínio.",
"doubao-1.5-vision-pro-32k.description": "O Doubao-1.5-vision-pro é um modelo multimodal aprimorado que suporta imagens em qualquer resolução e proporções extremas, melhorando o raciocínio visual, reconhecimento de documentos, compreensão de detalhes e seguimento de instruções.",
"doubao-lite-32k.description": "Resposta ultrarrápida com melhor custo-benefício, oferecendo mais flexibilidade em diversos cenários. Suporta raciocínio e ajuste fino com janela de contexto de 32k.",
"doubao-pro-32k.description": "O modelo carro-chefe com melhor desempenho para tarefas complexas, com excelentes resultados em QA com referência, sumarização, criação, classificação de texto e simulação de papéis. Suporta raciocínio e ajuste fino com janela de contexto de 32k.",
"doubao-seed-1.6-flash.description": "O Doubao-Seed-1.6-flash é um modelo multimodal de raciocínio profundo ultrarrápido com TPOT de até 10ms. Suporta entrada de texto e imagem, supera o modelo lite anterior em compreensão de texto e se equipara aos modelos pro concorrentes em visão. Suporta janela de contexto de 256k e até 16k tokens de saída.",
"doubao-seed-1.6-vision.description": "O Doubao-Seed-1.6-vision é um modelo visual de raciocínio profundo que oferece compreensão e raciocínio multimodal mais robustos para educação, revisão de imagens, inspeção/segurança e perguntas e respostas com busca por IA. Suporta janela de contexto de 256k e até 64k tokens de saída.",
"doubao-seed-1.6.description": "O Doubao-Seed-1.6 é um novo modelo multimodal de raciocínio profundo com modos automático, com raciocínio e sem raciocínio. No modo sem raciocínio, supera significativamente o Doubao-1.5-pro/250115. Suporta janela de contexto de 256k e até 16k tokens de saída.",
"doubao-seed-1.8.description": "Doubao-Seed-1.8 possui compreensão multimodal e capacidades de agente mais robustas, com suporte a entrada de texto/imagem/vídeo e cache de contexto, oferecendo desempenho excelente em tarefas complexas.",
"doubao-seed-2.0-code.description": "Doubao-Seed-2.0-code é profundamente otimizado para codificação agentiva, suporta entradas multimodais e uma janela de contexto de 256k, adequado para codificação, compreensão visual e fluxos de trabalho de agentes.",
"doubao-seed-2.0-lite.description": "Doubao-Seed-2.0-lite é um novo modelo de raciocínio profundo multimodal que oferece melhor custo-benefício e é uma escolha forte para tarefas comuns, com uma janela de contexto de até 256k.",
"doubao-seed-2.0-mini.description": "Doubao-Seed-2.0-mini é um modelo leve com resposta rápida e alto desempenho, adequado para pequenas tarefas e cenários de alta concorrência.",
"doubao-seed-2.0-pro.description": "Doubao-Seed-2.0-pro é o modelo geral de Agente principal da ByteDance, com avanços abrangentes em planejamento e execução de tarefas complexas.",
"doubao-seed-code.description": "O Doubao-Seed-Code é profundamente otimizado para programação com agentes, suporta entradas multimodais (texto/imagem/vídeo) e janela de contexto de 256k, é compatível com a API da Anthropic e adequado para fluxos de trabalho de programação, compreensão visual e agentes.",
"doubao-seedance-1-0-pro-250528.description": "Seedance 1.0 Pro é um modelo de geração de vídeos que suporta narrativa multi-shot. Ele oferece desempenho robusto em múltiplas dimensões. O modelo alcança avanços na compreensão semântica e no seguimento de instruções, permitindo a geração de vídeos em alta definição 1080P com movimentos suaves, ricos detalhes, estilos diversos e estética visual de nível cinematográfico.",
"doubao-seedance-1-0-pro-fast-251015.description": "Seedance 1.0 Pro Fast é um modelo abrangente projetado para minimizar custos enquanto maximiza o desempenho, alcançando um excelente equilíbrio entre qualidade de geração de vídeo, velocidade e preço. Ele herda os pontos fortes principais do Seedance 1.0 Pro, oferecendo velocidades de geração mais rápidas e preços mais competitivos, proporcionando aos criadores uma dupla otimização de eficiência e custo.",
"doubao-seedance-1-5-pro-251215.description": "Seedance 1.5 Pro da ByteDance suporta geração de vídeo a partir de texto, imagem para vídeo (primeiro quadro, primeiro+último quadro) e geração de áudio sincronizado com os visuais.",
"doubao-seedance-2-0-260128.description": "Seedance 2.0 da ByteDance é o modelo de geração de vídeo mais poderoso, suportando geração de vídeo multimodal de referência, edição de vídeo, extensão de vídeo, texto-para-vídeo e imagem-para-vídeo com áudio sincronizado.",
"doubao-seedance-2-0-fast-260128.description": "Seedance 2.0 Fast da ByteDance oferece as mesmas capacidades do Seedance 2.0 com velocidades de geração mais rápidas a um preço mais competitivo.",
"doubao-seedream-4-0-250828.description": "O Seedream 4.0 é um modelo de geração de imagem da ByteDance Seed, que suporta entradas de texto e imagem com geração de imagem altamente controlável e de alta qualidade. Gera imagens a partir de comandos de texto.",
"doubao-seedream-4-5-251128.description": "Seedream 4.5 é o mais recente modelo multimodal de imagem da ByteDance, integrando capacidades de texto-para-imagem, imagem-para-imagem e geração de imagens em lote, enquanto incorpora senso comum e habilidades de raciocínio. Comparado à versão anterior 4.0, oferece qualidade de geração significativamente melhorada, com maior consistência de edição e fusão de múltiplas imagens. Oferece controle mais preciso sobre detalhes visuais, produzindo texto pequeno e rostos pequenos de forma mais natural, além de alcançar layouts e cores mais harmoniosos, melhorando a estética geral.",
"doubao-seedream-5-0-260128.description": "Doubao-Seedream-5.0-lite é o mais recente modelo de geração de imagens da ByteDance. Pela primeira vez, integra capacidades de recuperação online, permitindo incorporar informações da web em tempo real e melhorar a atualidade das imagens geradas. A inteligência do modelo também foi aprimorada, permitindo interpretação precisa de instruções complexas e conteúdo visual. Além disso, oferece melhor cobertura de conhecimento global, consistência de referência e qualidade de geração em cenários profissionais, atendendo melhor às necessidades de criação visual em nível empresarial.",
"dreamina-seedance-2-0-260128.description": "Seedance 2.0 da ByteDance é o modelo de geração de vídeo mais poderoso, suportando geração de vídeo multimodal de referência, edição de vídeo, extensão de vídeo, texto para vídeo e imagem para vídeo com áudio sincronizado.",
"dreamina-seedance-2-0-fast-260128.description": "Seedance 2.0 Fast da ByteDance oferece as mesmas capacidades do Seedance 2.0 com velocidades de geração mais rápidas a um preço mais competitivo.",
"emohaa.description": "O Emohaa é um modelo voltado para saúde mental com habilidades profissionais de aconselhamento para ajudar os usuários a compreender questões emocionais.",
"ernie-4.5-0.3b.description": "ERNIE 4.5 0.3B é um modelo leve de código aberto para implantação local e personalizada.",
"ernie-4.5-8k-preview.description": "ERNIE 4.5 8K Preview é um modelo de pré-visualização com contexto de 8K para avaliação do ERNIE 4.5.",
"ernie-4.5-turbo-128k.description": "ERNIE 4.5 Turbo 128K é um modelo geral de alto desempenho com aumento por busca e uso de ferramentas para perguntas e respostas, programação e cenários com agentes.",
"ernie-4.5-turbo-20260402.description": "ERNIE 4.5 Turbo 20260402 é um modelo geral de alto desempenho com aumento de busca e chamadas de ferramentas para QA, codificação e cenários de agentes.",
"ernie-4.5-turbo-32k.description": "ERNIE 4.5 Turbo 32K é uma versão com contexto médio para perguntas e respostas, recuperação de base de conhecimento e diálogos de múltiplas interações.",
"ernie-4.5-turbo-latest.description": "Última versão do ERNIE 4.5 Turbo com desempenho geral otimizado, ideal como modelo principal de produção.",
"ernie-4.5-turbo-vl-32k.description": "ERNIE 4.5 Turbo VL 32K é uma versão multimodal de contexto médio-longo para compreensão combinada de documentos longos e imagens.",
"ernie-4.5-turbo-vl-latest.description": "ERNIE 4.5 Turbo VL Latest é a versão multimodal mais recente com melhor compreensão e raciocínio entre imagem e texto.",
"ernie-4.5-turbo-vl.description": "ERNIE 4.5 Turbo VL é um modelo multimodal maduro para compreensão e reconhecimento de imagem-texto em produção.",
"ernie-5.0-thinking-latest.description": "Wenxin 5.0 Thinking é um modelo nativo multimodal de ponta com modelagem unificada de texto, imagem, áudio e vídeo. Oferece amplas melhorias de capacidade para perguntas e respostas complexas, criação e cenários com agentes.",
"ernie-5.0-thinking-preview.description": "Pré-visualização do Wenxin 5.0 Thinking, modelo nativo multimodal de ponta com modelagem unificada de texto, imagem, áudio e vídeo. Oferece amplas melhorias de capacidade para perguntas e respostas complexas, criação e cenários com agentes.",
"ernie-5.0.description": "ERNIE 5.0, o modelo de nova geração da série ERNIE, é um modelo multimodal nativo. Ele adota uma abordagem unificada de modelagem multimodal, combinando texto, imagens, áudio e vídeo para oferecer capacidades abrangentes. Suas habilidades fundamentais foram significativamente aprimoradas, com forte desempenho em avaliações de benchmark. Destaca-se em compreensão multimodal, seguimento de instruções, escrita criativa, precisão factual, planejamento de agentes e uso de ferramentas.",
"ernie-5.1.description": "ERNIE 5.1 é o modelo mais recente da série ERNIE, com atualizações abrangentes em suas capacidades fundamentais. Ele demonstra melhorias significativas em áreas como agentes, processamento de conhecimento, raciocínio e busca profunda. Esta versão adota uma arquitetura de aprendizado por reforço totalmente assíncrona e desacoplada, projetada especificamente para abordar desafios-chave na evolução de grandes modelos em direção à tomada de decisão autônoma por agentes, incluindo discrepâncias numéricas entre treinamento e inferência, baixa utilização de recursos computacionais heterogêneos e problemas globais causados por efeitos de cauda longa. Além disso, técnicas de pós-treinamento em larga escala para agentes são empregadas para aprimorar ainda mais as capacidades e o desempenho de generalização do modelo. Por meio de uma estrutura colaborativa de três estágios envolvendo processos de ambiente, especialista e fusão, a abordagem não apenas garante eficiência no treinamento, mas também melhora significativamente a estabilidade e o desempenho do modelo em tarefas complexas.",
"ernie-char-fiction-8k-preview.description": "Pré-visualização do ERNIE Character Fiction 8K, modelo para criação de personagens e enredos, voltado para avaliação e testes de recursos.",
"ernie-char-fiction-8k.description": "ERNIE Character Fiction 8K é um modelo de personagem para romances e criação de enredos, adequado para geração de histórias longas.",
"ernie-image-turbo.description": "ERNIE-Image é um modelo de texto-para-imagem de 8B parâmetros desenvolvido pela Baidu. Está entre os melhores em vários benchmarks, alcançando primeiro lugar no SuperCLUE na China e liderança na categoria open-source.",
"ernie-irag-edit.description": "ERNIE iRAG Edit é um modelo de edição de imagem que suporta apagar, repintar e gerar variantes.",
"ernie-lite-pro-128k.description": "ERNIE Lite Pro 128K é um modelo leve de alto desempenho para cenários sensíveis à latência e ao custo.",
"ernie-novel-8k.description": "ERNIE Novel 8K é projetado para romances longos e enredos de IP com narrativas de múltiplos personagens.",
"ernie-speed-pro-128k.description": "ERNIE Speed Pro 128K é um modelo de alto valor e alta concorrência para serviços online em larga escala e aplicativos corporativos.",
"ernie-x1-turbo-32k-preview.description": "ERNIE X1 Turbo 32K Preview é um modelo de pensamento rápido com 32K de contexto para raciocínio complexo e conversas de múltiplas interações.",
"ernie-x1-turbo-32k.description": "ERNIE X1 Turbo 32K é um modelo de raciocínio rápido com contexto de 32K para raciocínio complexo e bate-papo de múltiplas interações.",
"ernie-x1.1-preview.description": "Pré-visualização do modelo de raciocínio ERNIE X1.1 para avaliação e testes.",
"ernie-x1.1.description": "ERNIE X1.1 é um modelo de pensamento em pré-visualização para avaliação e testes.",
"fal-ai/bytedance/seedream/v4.5.description": "Seedream 4.5, desenvolvido pela equipe Seed da ByteDance, suporta edição e composição de múltiplas imagens. Apresenta consistência aprimorada de sujeito, seguimento preciso de instruções, compreensão de lógica espacial, expressão estética, layout de pôster e design de logotipo com renderização de texto-imagem de alta precisão.",
"fal-ai/bytedance/seedream/v4.description": "Seedream 4.0 é um modelo de geração de imagens da ByteDance Seed, que suporta entradas de texto e imagem com geração de imagens altamente controlável e de alta qualidade. Ele gera imagens a partir de comandos de texto.",
"fal-ai/flux-kontext/dev.description": "Modelo FLUX.1 focado em edição de imagens, com suporte a entradas de texto e imagem.",
"fal-ai/flux-pro/kontext.description": "FLUX.1 Kontext [pro] aceita texto e imagens de referência como entrada, permitindo edições locais direcionadas e transformações complexas de cena.",
"fal-ai/flux/krea.description": "Flux Krea [dev] é um modelo de geração de imagens com viés estético para imagens mais realistas e naturais.",
"fal-ai/flux/schnell.description": "FLUX.1 [schnell] é um modelo de geração de imagens com 12 bilhões de parâmetros, projetado para saída rápida e de alta qualidade.",
"fal-ai/hunyuan-image/v3.description": "Um poderoso modelo multimodal nativo de geração de imagens.",
"fal-ai/imagen4/preview.description": "Modelo de geração de imagens de alta qualidade do Google.",
"fal-ai/nano-banana.description": "Nano Banana é o modelo multimodal nativo mais novo, rápido e eficiente do Google, permitindo geração e edição de imagens por meio de conversas.",
"fal-ai/qwen-image-edit.description": "Um modelo profissional de edição de imagens da equipe Qwen que suporta edições semânticas e de aparência, edita com precisão textos em chinês e inglês, e permite edições de alta qualidade, como transferência de estilo e rotação de objetos.",
"fal-ai/qwen-image.description": "Um poderoso modelo de geração de imagens da equipe Qwen com impressionante renderização de texto em chinês e estilos visuais diversos.",
"flux-1-schnell.description": "Modelo de texto para imagem com 12 bilhões de parâmetros da Black Forest Labs, usando difusão adversarial latente para gerar imagens de alta qualidade em 1 a 4 etapas. Rivaliza com alternativas fechadas e é lançado sob licença Apache-2.0 para uso pessoal, acadêmico e comercial.",
"flux-dev.description": "Modelo open-source de geração de imagens para P&D, otimizado de forma eficiente para pesquisa inovadora não comercial.",
"flux-kontext-max.description": "Geração e edição de imagens contextuais de última geração, combinando texto e imagens para resultados precisos e coerentes.",
"flux-kontext-pro.description": "Geração e edição de imagens contextuais de última geração, combinando texto e imagens para resultados precisos e coerentes.",
"flux-pro-1.1-ultra.description": "Geração de imagens em ultra-alta resolução com saída de 4MP, produzindo imagens nítidas em 10 segundos.",
"flux-pro-1.1.description": "Modelo profissional de geração de imagens atualizado, com excelente qualidade e aderência precisa aos comandos.",
"flux-pro.description": "Modelo comercial de geração de imagens de alto nível, com qualidade incomparável e saídas diversas.",
"flux.1-schnell.description": "FLUX.1-schnell é um modelo de geração de imagens de alto desempenho para saídas rápidas e com múltiplos estilos.",
"gemini-1.0-pro-001.description": "Gemini 1.0 Pro 001 (Tuning) oferece desempenho estável e ajustável para tarefas complexas.",
"gemini-1.0-pro-002.description": "Gemini 1.0 Pro 002 (Tuning) oferece suporte multimodal robusto para tarefas complexas.",
"gemini-1.0-pro-latest.description": "Gemini 1.0 Pro é o modelo de IA de alto desempenho do Google, projetado para escalabilidade em tarefas amplas.",
"gemini-1.5-flash-001.description": "Gemini 1.5 Flash 001 é um modelo multimodal eficiente para escalabilidade em aplicações amplas.",
"gemini-1.5-flash-002.description": "Gemini 1.5 Flash 002 é um modelo multimodal eficiente, projetado para implantação em larga escala.",
"gemini-1.5-flash-8b-exp-0924.description": "Gemini 1.5 Flash 8B 0924 é o modelo experimental mais recente, com avanços notáveis em casos de uso de texto e multimodais.",
"gemini-1.5-flash-8b.description": "Gemini 1.5 Flash 8B é um modelo multimodal eficiente para escalabilidade em aplicações amplas.",
"gemini-1.5-flash-exp-0827.description": "Gemini 1.5 Flash 0827 oferece processamento multimodal otimizado para tarefas complexas.",
"gemini-1.5-flash-latest.description": "Gemini 1.5 Flash é o modelo multimodal mais recente do Google, com processamento rápido e suporte a entradas de texto, imagem e vídeo para escalabilidade eficiente em tarefas.",
"gemini-1.5-pro-001.description": "Gemini 1.5 Pro 001 é uma solução de IA multimodal escalável para tarefas complexas.",
"gemini-1.5-pro-002.description": "Gemini 1.5 Pro 002 é o modelo mais recente pronto para produção, com saída de maior qualidade, especialmente em matemática, contexto longo e tarefas visuais.",
"gemini-1.5-pro-exp-0801.description": "Gemini 1.5 Pro 0801 oferece processamento multimodal robusto com maior flexibilidade para desenvolvimento de aplicativos.",
"gemini-1.5-pro-exp-0827.description": "Gemini 1.5 Pro 0827 aplica as otimizações mais recentes para processamento multimodal mais eficiente.",
"gemini-1.5-pro-latest.description": "Gemini 1.5 Pro suporta até 2 milhões de tokens, sendo um modelo multimodal de porte médio ideal para tarefas complexas.",
"gemini-2.0-flash-001.description": "Gemini 2.0 Flash oferece recursos de próxima geração, incluindo velocidade excepcional, uso nativo de ferramentas, geração multimodal e janela de contexto de 1 milhão de tokens.",
"gemini-2.0-flash-lite-001.description": "Uma variante do Gemini 2.0 Flash otimizada para eficiência de custo e baixa latência.",
"gemini-2.0-flash-lite.description": "Uma variante do Gemini 2.0 Flash otimizada para eficiência de custo e baixa latência.",
"gemini-2.0-flash.description": "Gemini 2.0 Flash oferece recursos de próxima geração, incluindo velocidade excepcional, uso nativo de ferramentas, geração multimodal e janela de contexto de 1 milhão de tokens.",
"gemini-2.5-flash-image.description": "Nano Banana é o modelo multimodal nativo mais novo, rápido e eficiente do Google, permitindo geração e edição de imagens por meio de conversas.",
"gemini-2.5-flash-image:image.description": "Nano Banana é o modelo multimodal nativo mais novo, rápido e eficiente do Google, permitindo geração e edição de imagens por meio de conversas.",
"gemini-2.5-flash-lite-preview-06-17.description": "Gemini 2.5 Flash-Lite Preview é o menor e mais econômico modelo do Google, projetado para uso em larga escala.",
"gemini-2.5-flash-lite.description": "Gemini 2.5 Flash-Lite é o menor e mais econômico modelo do Google, projetado para uso em larga escala.",
"gemini-2.5-flash-preview-04-17.description": "Gemini 2.5 Flash Preview é o modelo com melhor custo-benefício do Google, com capacidades completas.",
"gemini-2.5-flash.description": "Gemini 2.5 Flash é o modelo com melhor custo-benefício do Google, com capacidades completas.",
"gemini-2.5-pro-preview-03-25.description": "Gemini 2.5 Pro Preview é o modelo de raciocínio mais avançado do Google, capaz de raciocinar sobre código, matemática e problemas STEM, além de analisar grandes conjuntos de dados, bases de código e documentos com contexto longo.",
"gemini-2.5-pro-preview-05-06.description": "Gemini 2.5 Pro Preview é o modelo de raciocínio mais avançado do Google, capaz de raciocinar sobre código, matemática e problemas STEM, além de analisar grandes conjuntos de dados, bases de código e documentos com contexto longo.",
"gemini-2.5-pro.description": "Gemini 2.5 Pro é o modelo de raciocínio mais avançado do Google, capaz de raciocinar sobre código, matemática e problemas STEM, além de analisar grandes conjuntos de dados, bases de código e documentos com contexto longo.",
"gemini-3-flash-preview.description": "Gemini 3 Flash é o modelo mais inteligente desenvolvido para velocidade, combinando inteligência de ponta com excelente fundamentação em buscas.",
"gemini-3-flash.description": "Gemini 3 Flash do Google — modelo ultrarrápido com suporte multimodal.",
"gemini-3-pro-image-preview.description": "Gemini 3 Pro Image (Nano Banana Pro) é o modelo de geração de imagens do Google que também suporta diálogo multimodal.",
"gemini-3-pro-image-preview:image.description": "Gemini 3 Pro Image (Nano Banana Pro) é o modelo de geração de imagens do Google e também suporta chat multimodal.",
"gemini-3-pro-preview.description": "Gemini 3 Pro é o agente mais poderoso do Google, com capacidades de codificação emocional e visuais aprimoradas, além de raciocínio de última geração.",
"gemini-3.1-flash-image-preview.description": "Gemini 3.1 Flash Image (Nano Banana 2) é o modelo de geração de imagens nativo mais rápido do Google, com suporte a raciocínio, geração e edição de imagens conversacionais.",
"gemini-3.1-flash-image-preview:image.description": "Gemini 3.1 Flash Image (Nano Banana 2) é o modelo nativo de geração de imagens mais rápido do Google, com suporte a raciocínio, geração e edição de imagens em conversas.",
"gemini-3.1-flash-lite-preview.description": "Gemini 3.1 Flash-Lite Preview é o modelo multimodal mais econômico do Google, otimizado para tarefas agentivas de alto volume, tradução e processamento de dados.",
"gemini-3.1-flash-lite.description": "Gemini 3.1 Flash-Lite é o modelo multimodal mais econômico do Google, otimizado para tarefas agentivas de alto volume, tradução e processamento de dados.",
"gemini-3.1-pro-preview.description": "Gemini 3.1 Pro Preview melhora o Gemini 3 Pro com capacidades de raciocínio aprimoradas e adiciona suporte a nível médio de pensamento.",
"gemini-3.1-pro.description": "Gemini 3.1 Pro do Google — modelo multimodal premium com janela de contexto de 1M.",
"gemini-3.5-flash.description": "O modelo mais inteligente da Gemini, construído para velocidade, combinando inteligência de ponta com busca e fundamentação superiores.",
"gemini-flash-latest.description": "Aponta para gemini-3-flash-preview",
"gemini-flash-lite-latest.description": "Aponta para gemini-3.1-flash-lite",
"gemini-pro-latest.description": "Aponta para gemini-3.1-pro-preview",
"gemma-7b-it.description": "Gemma 7B é uma opção econômica para tarefas de pequena a média escala.",
"gemma2-9b-it.description": "Gemma 2 9B é otimizado para tarefas específicas e integração com ferramentas.",
"gemma2.description": "Gemma 2 é o modelo eficiente do Google, cobrindo desde aplicativos simples até processamento de dados complexos.",
"gemma2:27b.description": "Gemma 2 é o modelo eficiente do Google, cobrindo desde aplicativos simples até processamento de dados complexos.",
"gemma2:2b.description": "Gemma 2 é o modelo eficiente do Google, cobrindo desde aplicativos simples até processamento de dados complexos.",
"generalv3.5.description": "Spark Max é a versão mais completa, com suporte a busca na web e diversos plugins integrados. Suas capacidades otimizadas, papéis de sistema e chamadas de função oferecem desempenho excelente em cenários de aplicação complexos.",
"generalv3.description": "Spark Pro é um LLM de alto desempenho otimizado para domínios profissionais, com foco em matemática, programação, saúde e educação. Inclui busca na web e plugins integrados como clima e data. Oferece desempenho forte e eficiente em perguntas e respostas complexas, compreensão de linguagem e criação avançada de texto, sendo ideal para usos profissionais.",
"glm-4-0520.description": "GLM-4-0520 é a versão mais recente do modelo, projetado para tarefas altamente complexas e diversas, com desempenho excelente.",
"glm-4-7.description": "GLM-4.7 é o modelo carro-chefe mais recente da Zhipu AI. O GLM-4.7 aprimora as capacidades de programação, planejamento de tarefas de longo prazo e colaboração com ferramentas para cenários de Programação Agente, alcançando desempenho líder entre modelos de código aberto em diversos benchmarks públicos. As capacidades gerais foram aprimoradas, com respostas mais concisas e naturais, e escrita mais envolvente. Em tarefas complexas de agentes, o seguimento de instruções durante chamadas de ferramentas é mais forte, e a estética do front-end de Artifacts e Programação Agente, bem como a eficiência na conclusão de tarefas de longo prazo, foram ainda mais aprimoradas. • Capacidades de programação mais fortes: Melhorias significativas em codificação multilíngue e desempenho de agentes em terminal; o GLM-4.7 agora implementa mecanismos de \"pensar antes de agir\" em frameworks como Claude Code, Kilo Code, TRAE, Cline e Roo Code, com desempenho mais estável em tarefas complexas. • Melhoria na estética do front-end: O GLM-4.7 apresenta avanços significativos na qualidade de geração de front-end, sendo capaz de criar sites, apresentações e cartazes com melhor apelo visual. • Capacidades aprimoradas de chamada de ferramentas: O GLM-4.7 melhora a habilidade de chamar ferramentas, com pontuação de 67 na avaliação BrowseComp e 84,7 na avaliação τ²-Bench de chamadas interativas, superando o Claude Sonnet 4.5 como o novo SOTA de código aberto. • Melhoria no raciocínio: Habilidades matemáticas e de raciocínio significativamente aprimoradas, com pontuação de 42,8% no benchmark HLE (\"Última Prova da Humanidade\"), uma melhoria de 41% em relação ao GLM-4.6, superando o GPT-5.1. • Aprimoramento geral: As conversas com o GLM-4.7 são mais concisas, inteligentes e humanas; a escrita e a simulação de papéis são mais literárias e imersivas.",
"glm-4-9b-chat.description": "GLM-4-9B-Chat tem desempenho forte em semântica, matemática, raciocínio, código e conhecimento. Também oferece navegação na web, execução de código, chamadas de ferramentas personalizadas e raciocínio com textos longos, com suporte a 26 idiomas, incluindo japonês, coreano e alemão.",
"glm-4-air-250414.description": "GLM-4-Air é uma opção de alto valor com desempenho próximo ao GLM-4, velocidade rápida e menor custo.",
"glm-4-air.description": "GLM-4-Air é uma opção de alto valor com desempenho próximo ao GLM-4, velocidade rápida e menor custo.",
"glm-4-airx.description": "GLM-4-AirX é uma variante mais eficiente do GLM-4-Air, com raciocínio até 2,6x mais rápido.",
"glm-4-alltools.description": "GLM-4-AllTools é um modelo de agente versátil otimizado para planejamento de instruções complexas e uso de ferramentas como navegação na web, explicação de código e geração de texto, adequado para execução multitarefa.",
"glm-4-flash-250414.description": "GLM-4-Flash é ideal para tarefas simples: o mais rápido e gratuito.",
"glm-4-flash.description": "GLM-4-Flash é ideal para tarefas simples: o mais rápido e gratuito.",
"glm-4-flashx.description": "GLM-4-FlashX é uma versão aprimorada do Flash com raciocínio ultrarrápido.",
"glm-4-long.description": "GLM-4-Long oferece suporte a entradas ultralongas para tarefas de memória e processamento de documentos em larga escala.",
"glm-4-plus.description": "GLM-4-Plus é um modelo carro-chefe de alta inteligência com forte capacidade para textos longos e tarefas complexas, além de desempenho geral aprimorado.",
"glm-4.1v-thinking-flash.description": "GLM-4.1V-Thinking é o modelo VLM de ~10B mais forte conhecido, cobrindo tarefas SOTA como compreensão de vídeo, perguntas visuais, resolução de problemas, OCR, leitura de documentos e gráficos, agentes de interface gráfica, codificação frontend e grounding. Supera até o Qwen2.5-VL-72B, 8x maior, em muitas tarefas. Com RL avançado, usa raciocínio em cadeia para melhorar precisão e riqueza, superando modelos tradicionais sem raciocínio em resultados e explicabilidade.",
"glm-4.1v-thinking-flashx.description": "GLM-4.1V-Thinking é o modelo VLM de ~10B mais forte conhecido, cobrindo tarefas SOTA como compreensão de vídeo, perguntas visuais, resolução de problemas, OCR, leitura de documentos e gráficos, agentes de interface gráfica, codificação frontend e grounding. Supera até o Qwen2.5-VL-72B, 8x maior, em muitas tarefas. Com RL avançado, usa raciocínio em cadeia para melhorar precisão e riqueza, superando modelos tradicionais sem raciocínio em resultados e explicabilidade.",
"glm-4.5-air.description": "Edição leve do GLM-4.5 que equilibra desempenho e custo, com modos de raciocínio híbrido flexíveis.",
"glm-4.5-airx.description": "Edição rápida do GLM-4.5-Air com respostas mais ágeis para uso em larga escala e alta velocidade.",
"glm-4.5-x.description": "Edição rápida do GLM-4.5, com desempenho robusto e velocidade de geração de até 100 tokens/segundo.",
"glm-4.5.description": "Modelo principal da Zhipu com modo de raciocínio alternável, oferecendo SOTA de código aberto e suporte a contexto de até 128K tokens.",
"glm-4.5v.description": "Modelo de raciocínio visual de próxima geração da Zhipu com arquitetura MoE, totalizando 106B parâmetros (12B ativos), atingindo SOTA entre modelos multimodais de código aberto de tamanho semelhante em tarefas de imagem, vídeo, documentos e interfaces gráficas.",
"glm-4.6.description": "GLM-4.6 (355B), o mais recente modelo carro-chefe da Zhipu, supera totalmente seus antecessores em codificação avançada, processamento de textos longos, raciocínio e capacidades de agente. Destaca-se especialmente em programação, alinhando-se ao Claude Sonnet 4, tornando-se o principal modelo de codificação da China.",
"glm-4.6v-flash.description": "A série GLM-4.6V representa uma grande iteração da família GLM na direção multimodal, composta por GLM-4.6V (principal), GLM-4.6V-FlashX (leve e de alta velocidade) e GLM-4.6V-Flash (totalmente gratuito). Ela amplia a janela de contexto de tempo de treinamento para 128k tokens, alcança precisão de compreensão visual de última geração em escalas de parâmetros comparáveis e, pela primeira vez, integra nativamente as capacidades de Function Call (invocação de ferramentas) na arquitetura do modelo visual. Isso unifica o pipeline de “percepção visual” para “ações executáveis”, fornecendo uma base técnica consistente para agentes multimodais em cenários de produção no mundo real.",
"glm-4.6v-flashx.description": "A série GLM-4.6V representa uma grande iteração da família GLM na direção multimodal, composta por GLM-4.6V (principal), GLM-4.6V-FlashX (leve e de alta velocidade) e GLM-4.6V-Flash (totalmente gratuito). Ela amplia a janela de contexto de tempo de treinamento para 128k tokens, alcança precisão de compreensão visual de última geração em escalas de parâmetros comparáveis e, pela primeira vez, integra nativamente as capacidades de Function Call (invocação de ferramentas) na arquitetura do modelo visual. Isso unifica o pipeline de “percepção visual” para “ações executáveis”, fornecendo uma base técnica consistente para agentes multimodais em cenários de produção no mundo real.",
"glm-4.6v.description": "A série GLM-4.6V representa uma grande iteração da família GLM na direção multimodal, composta por GLM-4.6V (principal), GLM-4.6V-FlashX (leve e de alta velocidade) e GLM-4.6V-Flash (totalmente gratuito). Ela amplia a janela de contexto de tempo de treinamento para 128k tokens, alcança precisão de compreensão visual de última geração em escalas de parâmetros comparáveis e, pela primeira vez, integra nativamente as capacidades de Function Call (invocação de ferramentas) na arquitetura do modelo visual. Isso unifica o pipeline de “percepção visual” para “ações executáveis”, fornecendo uma base técnica consistente para agentes multimodais em cenários de produção no mundo real.",
"glm-4.7-flash.description": "GLM-4.7-Flash, como um modelo SOTA de 30B, oferece uma nova opção que equilibra desempenho e eficiência. Aprimora as capacidades de programação, planejamento de tarefas de longo prazo e colaboração com ferramentas para cenários de Programação Agente, alcançando desempenho líder entre modelos de código aberto do mesmo porte em diversos benchmarks atuais. Na execução de tarefas complexas de agentes inteligentes, apresenta maior conformidade com instruções durante chamadas de ferramentas, além de melhorar ainda mais a estética do front-end e a eficiência na conclusão de tarefas de longo prazo para Artifacts e Programação Agente.",
"glm-4.7-flashx.description": "GLM-4.7-Flash, como um modelo SOTA de 30B, oferece uma nova opção que equilibra desempenho e eficiência. Aprimora as capacidades de programação, planejamento de tarefas de longo prazo e colaboração com ferramentas para cenários de Programação Agente, alcançando desempenho líder entre modelos de código aberto do mesmo porte em diversos benchmarks atuais. Na execução de tarefas complexas de agentes inteligentes, apresenta maior conformidade com instruções durante chamadas de ferramentas, além de melhorar ainda mais a estética do front-end e a eficiência na conclusão de tarefas de longo prazo para Artifacts e Programação Agente.",
"glm-4.7.description": "GLM-4.7 é o mais recente modelo carro-chefe da Zhipu, aprimorado para cenários de Codificação Agente com melhorias em capacidades de programação, planejamento de tarefas de longo prazo e colaboração com ferramentas. Alcança desempenho líder entre modelos open-source em diversos benchmarks públicos. Suas capacidades gerais foram aprimoradas com respostas mais concisas e naturais e escrita mais envolvente. Para tarefas complexas de agente, o seguimento de instruções durante chamadas de ferramentas é mais forte, e a estética da interface e a eficiência na conclusão de tarefas de longo prazo em Artifacts e Codificação Agente foram ainda mais otimizadas.",
"glm-4.description": "GLM-4 é o modelo principal anterior lançado em janeiro de 2024, agora substituído pelo mais forte GLM-4-0520.",
"glm-4v-flash.description": "GLM-4V-Flash é focado em compreensão eficiente de imagens únicas para cenários de análise rápida, como processamento de imagens em tempo real ou em lote.",
"glm-4v-plus-0111.description": "GLM-4V-Plus compreende vídeos e múltiplas imagens, adequado para tarefas multimodais.",
"glm-4v-plus.description": "GLM-4V-Plus compreende vídeos e múltiplas imagens, adequado para tarefas multimodais.",
"glm-4v.description": "GLM-4V oferece forte compreensão e raciocínio visual em diversas tarefas visuais.",
"glm-5-turbo.description": "GLM-5-Turbo é um modelo de fundação profundamente otimizado para cenários agentivos. Foi especificamente otimizado para os requisitos principais de tarefas de agentes desde a fase de treinamento, aprimorando capacidades-chave como invocação de ferramentas, seguimento de comandos e execução de cadeias longas. É ideal para construir assistentes de agentes de alto desempenho.",
"glm-5.1.description": "O GLM-5.1 é o mais recente modelo flagship da Zhipu, alinhado ao Claude Opus 4.6 em capacidades gerais e de programação. Ele se destaca em tarefas de longo prazo, sendo capaz de planejar, executar e iterar de forma autônoma por até 8 horas em uma única tarefa, tornando-se uma base ideal para Agentes Autônomos e Agentes de Programação de Longo Prazo.",
"glm-5.description": "GLM-5 é o modelo base de próxima geração da Zhipu, projetado especificamente para Engenharia Agente. Ele oferece produtividade confiável em engenharia de sistemas complexos e tarefas agentes de longo prazo. Em codificação e capacidades de agentes, o GLM-5 alcança desempenho de última geração entre os modelos de código aberto. Em cenários reais de programação, sua experiência do usuário se aproxima da do Claude Opus 4.5. Ele se destaca em engenharia de sistemas complexos e tarefas agentes de longo prazo, tornando-se um modelo base ideal para assistentes agentes de uso geral.",
"glm-5v-turbo.description": "GLM-5V-Turbo é o modelo de fundação de codificação multimodal da Zhipu para tarefas de programação visual. Ele lida nativamente com imagens, vídeos, textos e arquivos, e é otimizado para planejamento de longo prazo, codificação complexa e execução de agentes em fluxos de trabalho multimodais.",
"glm-image.description": "GLM-Image é o novo modelo principal de geração de imagens da Zhipu. O modelo foi treinado de ponta a ponta em chips produzidos nacionalmente e adota uma arquitetura híbrida original que combina modelagem autorregressiva com um decodificador de difusão. Esse design permite uma forte compreensão global das instruções, juntamente com a renderização detalhada de elementos locais, superando desafios de longa data na geração de conteúdo denso em conhecimento, como pôsteres, apresentações e diagramas educacionais. Ele representa uma importante exploração em direção a uma nova geração de paradigmas tecnológicos “cognitivos generativos”, exemplificados pelo Nano Banana Pro.",
"glm-z1-air.description": "Modelo de raciocínio com forte capacidade de inferência para tarefas que exigem dedução profunda.",
"glm-z1-airx.description": "Raciocínio ultrarrápido com alta qualidade de inferência.",
"glm-z1-flash.description": "A série GLM-Z1 oferece raciocínio complexo robusto, com destaque em lógica, matemática e programação.",
"glm-z1-flashx.description": "Rápido e de baixo custo: versão Flash com raciocínio ultrarrápido e maior concorrência.",
"glm-zero-preview.description": "GLM-Zero-Preview oferece raciocínio complexo robusto, com destaque em lógica, matemática e programação.",
"global.anthropic.claude-haiku-4-5-20251001-v1:0.description": "Claude Haiku 4.5 é o modelo Haiku mais rápido e inteligente da Anthropic, com velocidade relâmpago e pensamento ampliado.",
"global.anthropic.claude-opus-4-5-20251101-v1:0.description": "Claude Opus 4.5 é o modelo principal da Anthropic, combinando inteligência excepcional e desempenho escalável para tarefas complexas que exigem respostas e raciocínio da mais alta qualidade.",
"global.anthropic.claude-opus-4-6-v1.description": "Claude Opus 4.6 é o modelo mais inteligente da Anthropic para construção de agentes e codificação.",
"global.anthropic.claude-opus-4-7.description": "Claude Opus 4.7 é o modelo mais capaz da Anthropic disponível amplamente para raciocínio complexo e programação agentiva.",
"global.anthropic.claude-sonnet-4-5-20250929-v1:0.description": "Claude Sonnet 4.5 é o modelo mais inteligente da Anthropic até o momento.",
"global.anthropic.claude-sonnet-4-6.description": "Claude Sonnet 4.6 é a melhor combinação de velocidade e inteligência da Anthropic.",
"google/gemini-2.0-flash-001.description": "Gemini 2.0 Flash oferece capacidades de nova geração, incluindo excelente velocidade, uso nativo de ferramentas, geração multimodal e janela de contexto de 1 milhão de tokens.",
"google/gemini-2.0-flash-lite-001.description": "Gemini 2.0 Flash Lite é uma variante leve do Gemini com raciocínio desativado por padrão para melhorar latência e custo, podendo ser ativado via parâmetros.",
"google/gemini-2.0-flash-lite.description": "Gemini 2.0 Flash Lite oferece recursos de nova geração, incluindo velocidade excepcional, uso integrado de ferramentas, geração multimodal e janela de contexto de 1 milhão de tokens.",
"google/gemini-2.0-flash.description": "Gemini 2.0 Flash é o modelo de raciocínio de alto desempenho do Google para tarefas multimodais estendidas.",
"google/gemini-2.5-flash-image.description": "Gemini 2.5 Flash Image (Nano Banana) é o modelo de geração de imagens do Google com suporte a conversas multimodais.",
"google/gemini-2.5-flash-lite.description": "Gemini 2.5 Flash Lite é a variante leve do Gemini 2.5, otimizada para latência e custo, ideal para cenários de alto volume.",
"google/gemini-2.5-flash.description": "Gemini 2.5 Flash é a família do Google que abrange desde baixa latência até raciocínio de alto desempenho.",
"google/gemini-2.5-pro-preview.description": "Gemini 2.5 Pro Preview é o modelo de raciocínio mais avançado do Google para resolver problemas complexos em código, matemática e STEM, além de analisar grandes conjuntos de dados, bases de código e documentos com contexto longo.",
"google/gemini-2.5-pro.description": "Gemini 2.5 Pro é o modelo principal de raciocínio do Google com suporte a contexto longo para tarefas complexas.",
"google/gemini-3-pro-image-preview.description": "Gemini 3 Pro Image (Nano Banana Pro) é o modelo de geração de imagens do Google com suporte a conversas multimodais.",
"google/gemini-3-pro-preview.description": "Gemini 3 Pro é o modelo de raciocínio multimodal de próxima geração da família Gemini, com compreensão de texto, áudio, imagens e vídeo, capaz de lidar com tarefas complexas e grandes bases de código.",
"google/gemini-3.1-flash-image-preview.description": "Gemini 3.1 Flash Image Preview, também conhecido como \"Nano Banana 2\", é o mais recente modelo de geração e edição de imagens de última geração do Google, oferecendo qualidade visual em nível Pro com velocidade Flash. Combina compreensão contextual avançada com inferência rápida e econômica, tornando a geração de imagens complexas e edições iterativas significativamente mais acessíveis.",
"google/gemini-embedding-001.description": "Modelo de embedding de última geração com desempenho robusto em tarefas em inglês, multilíngues e de código.",
"google/gemma-2-27b-it.description": "Gemma 2 27B é um modelo de linguagem de uso geral com desempenho sólido em diversos cenários.",
"google/gemma-2-27b.description": "Gemma 2 é a família de modelos eficientes da Google para casos de uso que vão de aplicativos simples a processamento de dados complexos.",
"google/gemma-2-2b-it.description": "Um modelo de linguagem pequeno e avançado projetado para aplicações em dispositivos de borda.",
"google/gemma-2-9b-it.description": "Gemma 2 9B, desenvolvido pela Google, oferece seguimento de instruções eficiente e capacidade geral sólida.",
"google/gemma-2-9b.description": "Gemma 2 é a família de modelos eficientes da Google para casos de uso que vão de aplicativos simples a processamento de dados complexos.",
"google/gemma-2b-it.description": "Gemma Instruct (2B) oferece manipulação básica de instruções para aplicações leves.",
"google/gemma-3-12b-it.description": "Gemma 3 12B é um modelo de linguagem open-source da Google que estabelece um novo padrão de eficiência e desempenho.",
"google/gemma-3-27b-it.description": "Gemma 3 27B é um modelo de linguagem open-source da Google que estabelece um novo padrão de eficiência e desempenho.",
"google/text-embedding-005.description": "Modelo de embedding de texto focado em inglês, otimizado para tarefas de código e linguagem inglesa.",
"google/text-multilingual-embedding-002.description": "Modelo de embedding de texto multilíngue otimizado para tarefas interlinguísticas em diversos idiomas.",
"gpt-3.5-turbo-0125.description": "GPT 3.5 Turbo para geração e compreensão de texto; atualmente aponta para gpt-3.5-turbo-0125.",
"gpt-3.5-turbo-1106.description": "GPT 3.5 Turbo para geração e compreensão de texto; atualmente aponta para gpt-3.5-turbo-0125.",
"gpt-3.5-turbo-instruct.description": "GPT 3.5 Turbo para tarefas de geração e compreensão de texto, otimizado para seguir instruções.",
"gpt-3.5-turbo.description": "GPT 3.5 Turbo para geração e compreensão de texto; atualmente aponta para gpt-3.5-turbo-0125.",
"gpt-35-turbo-16k.description": "GPT-3.5 Turbo 16k é um modelo de geração de texto de alta capacidade para tarefas complexas.",
"gpt-35-turbo.description": "GPT-3.5 Turbo é o modelo eficiente da OpenAI para chat e geração de texto, com suporte a chamadas de função em paralelo.",
"gpt-4-0125-preview.description": "O modelo mais recente GPT-4 Turbo inclui visão. Solicitações de visão podem usar o modo JSON e chamadas de função. GPT-4 Turbo é uma versão aprimorada que equilibra precisão e eficiência para tarefas multimodais econômicas e interações em tempo real.",
"gpt-4-0613.description": "GPT-4 oferece uma janela de contexto maior para lidar com entradas mais longas, adequado para síntese ampla de informações e análise de dados.",
"gpt-4-1106-preview.description": "O modelo mais recente GPT-4 Turbo inclui visão. Solicitações de visão podem usar o modo JSON e chamadas de função. GPT-4 Turbo é uma versão aprimorada que equilibra precisão e eficiência para tarefas multimodais econômicas e interações em tempo real.",
"gpt-4-32k-0613.description": "GPT-4 oferece uma janela de contexto maior para lidar com entradas mais longas em cenários que exigem integração ampla de informações e análise de dados.",
"gpt-4-32k.description": "GPT-4 oferece uma janela de contexto maior para lidar com entradas mais longas em cenários que exigem integração ampla de informações e análise de dados.",
"gpt-4-turbo-2024-04-09.description": "O mais recente GPT-4 Turbo adiciona visão. Solicitações visuais suportam modo JSON e chamadas de função. É um modelo multimodal econômico que equilibra precisão e eficiência para aplicações em tempo real.",
"gpt-4-turbo-preview.description": "O modelo mais recente GPT-4 Turbo inclui visão. Solicitações de visão podem usar o modo JSON e chamadas de função. GPT-4 Turbo é uma versão aprimorada que equilibra precisão e eficiência para tarefas multimodais econômicas e interações em tempo real.",
"gpt-4-turbo.description": "O mais recente GPT-4 Turbo adiciona visão. Solicitações visuais suportam modo JSON e chamadas de função. É um modelo multimodal econômico que equilibra precisão e eficiência para aplicações em tempo real.",
"gpt-4-vision-preview.description": "Prévia do GPT-4 Vision, projetado para tarefas de análise e processamento de imagens.",
"gpt-4.1-mini.description": "GPT-4.1 mini equilibra inteligência, velocidade e custo, sendo atraente para diversos casos de uso.",
"gpt-4.1-nano.description": "GPT-4.1 nano é o modelo GPT-4.1 mais rápido e econômico.",
"gpt-4.1.description": "GPT-4.1 é nosso modelo carro-chefe para tarefas complexas e resolução de problemas interdisciplinares.",
"gpt-4.5-preview.description": "GPT-4.5-preview é o mais recente modelo de uso geral com profundo conhecimento de mundo e melhor compreensão de intenções, forte em tarefas criativas e planejamento de agentes. Seu corte de conhecimento é outubro de 2023.",
"gpt-4.description": "GPT-4 oferece uma janela de contexto maior para lidar com entradas mais longas, adequado para síntese ampla de informações e análise de dados.",
"gpt-4o-2024-05-13.description": "ChatGPT-4o é um modelo dinâmico atualizado em tempo real, combinando forte compreensão e geração para casos de uso em larga escala como suporte ao cliente, educação e suporte técnico.",
"gpt-4o-2024-08-06.description": "ChatGPT-4o é um modelo dinâmico atualizado em tempo real. Ele combina forte compreensão e geração de linguagem para casos de uso em larga escala como suporte ao cliente, educação e assistência técnica.",
"gpt-4o-2024-11-20.description": "ChatGPT-4o é um modelo dinâmico atualizado em tempo real, combinando forte compreensão e geração para casos de uso em larga escala como suporte ao cliente, educação e suporte técnico.",
"gpt-4o-mini-realtime-preview.description": "Variante em tempo real do GPT-4o-mini com entrada e saída de texto e áudio em tempo real.",
"gpt-4o-mini-search-preview.description": "Prévia de busca do GPT-4o mini, treinado para entender e executar consultas de busca na web via API de Conclusões de Chat. A busca na web é cobrada por chamada de ferramenta além dos custos de tokens.",
"gpt-4o-mini-transcribe.description": "GPT-4o Mini Transcribe é um modelo de transcrição de fala para texto que transcreve áudio com GPT-4o, melhorando a taxa de erro de palavras, identificação de idioma e precisão em relação ao modelo Whisper original.",
"gpt-4o-mini-tts.description": "GPT-4o mini TTS é um modelo de texto para fala baseado no GPT-4o mini, que converte texto em fala natural com entrada máxima de 2000 tokens.",
"gpt-4o-mini.description": "GPT-4o mini é o modelo mais recente da OpenAI após o GPT-4 Omni, com suporte a entrada de texto+imagem e saída de texto. É o modelo pequeno mais avançado da empresa, muito mais barato que os modelos de ponta recentes e mais de 60% mais barato que o GPT-3.5 Turbo, mantendo inteligência de alto nível (82% MMLU).",
"gpt-4o-realtime-preview-2024-10-01.description": "Variante em tempo real do GPT-4o com entrada e saída de áudio e texto em tempo real.",
"gpt-4o-realtime-preview-2025-06-03.description": "Variante em tempo real do GPT-4o com entrada e saída de áudio e texto em tempo real.",
"gpt-4o-realtime-preview.description": "Variante em tempo real do GPT-4o com entrada e saída de áudio e texto em tempo real.",
"gpt-4o-search-preview.description": "GPT-4o Search Preview é treinado para entender e executar buscas na web via a API Chat Completions. A busca na web é cobrada por chamada de ferramenta, além do custo por tokens.",
"gpt-4o-transcribe.description": "GPT-4o Transcribe é um modelo de transcrição de fala para texto que utiliza o GPT-4o, melhorando a taxa de erro de palavras, identificação de idioma e precisão em relação ao modelo Whisper original.",
"gpt-4o.description": "ChatGPT-4o é um modelo dinâmico atualizado em tempo real, combinando forte compreensão e geração para casos de uso em larga escala como suporte ao cliente, educação e suporte técnico.",
"gpt-5-chat-latest.description": "O modelo GPT-5 usado no ChatGPT, combinando forte compreensão e geração para aplicações conversacionais.",
"gpt-5-chat.description": "GPT-5 Chat é um modelo de prévia otimizado para cenários conversacionais. Suporta entrada de texto e imagem, gera apenas texto e é ideal para chatbots e aplicações de IA conversacional.",
"gpt-5-codex.description": "GPT-5 Codex da OpenAI — variante especializada em programação com suporte a ferramentas.",
"gpt-5-mini.description": "Uma variante mais rápida e econômica do GPT-5 para tarefas bem definidas, oferecendo respostas mais ágeis sem comprometer a qualidade.",
"gpt-5-nano.description": "GPT-5 Nano da OpenAI — modelo leve e econômico.",
"gpt-5-pro.description": "GPT-5 Pro utiliza mais recursos computacionais para pensar de forma mais profunda e fornecer respostas consistentemente melhores.",
"gpt-5.1-chat-latest.description": "GPT-5.1 Chat: a variante do ChatGPT baseada no GPT-5.1, desenvolvida para cenários de conversa.",
"gpt-5.1-codex-max.description": "GPT-5.1 Codex Max da OpenAI — variante Codex de capacidade máxima.",
"gpt-5.1-codex-mini.description": "GPT-5.1 Codex Mini da OpenAI — modelo compacto de programação com fortes capacidades.",
"gpt-5.1-codex.description": "GPT-5.1 Codex da OpenAI — variante focada em programação com uso avançado de ferramentas.",
"gpt-5.1.description": "GPT-5.1 da OpenAI — versão aprimorada do GPT-5 com maior precisão de raciocínio.",
"gpt-5.2-chat-latest.description": "GPT-5.2 Chat é a variante do ChatGPT (chat-latest) com as melhorias mais recentes em conversação.",
"gpt-5.2-codex.description": "GPT-5.2 Codex da OpenAI — especializado em programação com maior precisão em chamadas de ferramentas.",
"gpt-5.2-pro.description": "GPT-5.2 Pro: uma variante mais inteligente e precisa do GPT-5.2 (somente API de Respostas), ideal para problemas difíceis e raciocínio prolongado em múltiplas interações.",
"gpt-5.2.description": "GPT-5.2 da OpenAI — raciocínio aprimorado e processamento multimodal.",
"gpt-5.3-chat-latest.description": "GPT-5.3 Chat é o modelo mais recente do ChatGPT usado no ChatGPT, com experiências de conversa aprimoradas.",
"gpt-5.3-codex-spark.description": "GPT-5.3 Codex Spark da OpenAI — modelo compacto de programação otimizado para velocidade.",
"gpt-5.3-codex.description": "GPT-5.3 Codex da OpenAI — versão mais recente do Codex com entendimento aprimorado de código.",
"gpt-5.4-mini.description": "GPT-5.4 Mini da OpenAI — modelo eficiente que equilibra custo e desempenho.",
"gpt-5.4-nano.description": "GPT-5.4 Nano da OpenAI — modelo ultraleve para tarefas de alta escala.",
"gpt-5.4-pro.description": "GPT-5.4 Pro da OpenAI — modelo mais capaz, com contexto máximo e raciocínio avançado.",
"gpt-5.4.description": "GPT-5.4 da OpenAI — modelo de próxima geração com janela de contexto superior a 1M e entrada multimodal.",
"gpt-5.5-pro.description": "GPT-5.5 Pro usa mais computação para pensar de forma mais profunda e oferecer respostas consistentemente melhores.",
"gpt-5.5.description": "GPT-5.5 é nosso modelo de fronteira mais recente para os trabalhos profissionais mais complexos.",
"gpt-5.description": "GPT-5 da OpenAI — modelo principal com raciocínio avançado e entrada multimodal.",
"gpt-audio.description": "GPT Audio é um modelo geral de chat com suporte a entrada/saída de áudio, disponível na API Chat Completions.",
"gpt-image-1-mini.description": "Uma variante de menor custo do GPT Image 1 com entrada nativa de texto e imagem e saída de imagem.",
"gpt-image-1.5.description": "Uma versão aprimorada do GPT Image 1 com geração 4× mais rápida, edição mais precisa e renderização de texto melhorada.",
"gpt-image-1.description": "Modelo nativo de geração de imagens multimodal do ChatGPT.",
"gpt-image-2.description": "Modelo multimodal de próxima geração da OpenAI com raciocínio nativo, resolução de até 4K, renderização quase perfeita de texto e suporte multilíngue de alta fidelidade.",
"gpt-oss-120b.description": "O acesso requer uma solicitação. GPT-OSS-120B é um modelo de linguagem de código aberto da OpenAI com forte capacidade de geração de texto.",
"gpt-oss-20b.description": "O acesso requer uma solicitação. GPT-OSS-20B é um modelo de linguagem de médio porte de código aberto da OpenAI com geração de texto eficiente.",
"gpt-oss:120b.description": "GPT-OSS 120B é o LLM de código aberto de grande porte da OpenAI, utilizando quantização MXFP4 e posicionado como modelo principal. Requer ambientes com múltiplas GPUs ou estações de trabalho de alto desempenho, oferecendo excelente desempenho em raciocínio complexo, geração de código e processamento multilíngue, com chamadas de função avançadas e integração de ferramentas.",
"gpt-oss:20b.description": "GPT-OSS 20B é um LLM de código aberto da OpenAI com quantização MXFP4, adequado para GPUs de alto desempenho para consumidores ou Macs com Apple Silicon. Apresenta bom desempenho em geração de diálogos, codificação e tarefas de raciocínio, com suporte a chamadas de função e uso de ferramentas.",
"gpt-realtime.description": "Um modelo geral em tempo real com suporte a entrada/saída de texto e áudio em tempo real, além de entrada de imagem.",
"grok-3-mini.description": "Grok 3 Mini da xAI com forte raciocínio e respostas rápidas.",
"grok-3.description": "Grok 3 da xAI com forte capacidade de raciocínio.",
"grok-4-0709.description": "Grok 4 da xAI com forte capacidade de raciocínio.",
"grok-4-20-non-reasoning.description": "Variante sem raciocínio para casos de uso simples.",
"grok-4-20-reasoning.description": "Modelo inteligente e extremamente rápido que raciocina antes de responder.",
"grok-4.20-0309-non-reasoning.description": "Variante sem raciocínio para casos de uso simples.",
"grok-4.20-0309-reasoning.description": "Modelo inteligente e extremamente rápido que raciocina antes de responder.",
"grok-4.20-beta-0309-non-reasoning.description": "Uma variante sem raciocínio para casos de uso simples",
"grok-4.20-beta-0309-reasoning.description": "Modelo inteligente e extremamente rápido que raciocina antes de responder",
"grok-4.20-multi-agent-0309.description": "Equipe de 4 ou 16 agentes. Excelente para pesquisas, sem suporte atual a ferramentas do lado do cliente. Suporta apenas ferramentas do servidor xAI (como X Search e Web Search) e ferramentas MCP remotas.",
"grok-4.3.description": "O modelo de linguagem de grande porte mais comprometido com a verdade no mundo.",
"grok-imagine-image-quality.description": "Gere imagens a partir de prompts de texto, edite imagens existentes com linguagem natural ou refine imagens iterativamente por meio de conversas de múltiplos turnos.",
"grok-imagine-image.description": "Gere imagens a partir de prompts de texto, edite imagens existentes com linguagem natural ou refine imagens iterativamente por meio de conversas de múltiplas interações.",
"grok-imagine-video.description": "Geração de vídeo de última geração em qualidade, custo e latência.",
"groq/compound-mini.description": "Compound-mini é um sistema de IA composto alimentado por modelos públicos disponíveis no GroqCloud, utilizando ferramentas de forma inteligente e seletiva para responder às perguntas dos usuários.",
"groq/compound.description": "Compound é um sistema de IA composto alimentado por múltiplos modelos públicos disponíveis no GroqCloud, utilizando ferramentas de forma inteligente e seletiva para responder às perguntas dos usuários.",
"gryphe/mythomax-l2-13b.description": "MythoMax L2 13B é um modelo de linguagem criativo e inteligente, fundido a partir de diversos modelos de ponta.",
"happyhorse-1.0-i2v.description": "HappyHorse-1.0-I2V suporta geração de vídeo a partir de imagens, produzindo visuais dinâmicos altamente fiéis. Compreende com precisão a semântica textual e gera vídeos suaves, naturais e ricos em detalhes.",
"happyhorse-1.0-r2v.description": "HappyHorse-1.0-R2V suporta geração de vídeo com base em referências, oferecendo maior consistência de personagem e cenário. Aceita até nove imagens de referência, preserva com precisão a intenção criativa e oferece capacidade expressiva aprimorada.",
"happyhorse-1.0-t2v.description": "HappyHorse-1.0-T2V suporta geração de vídeo a partir de texto, entregando visuais dinâmicos altamente fiéis. Compreende com precisão a semântica textual e gera vídeos suaves, naturais e ricos em detalhes.",
"hunyuan-2.0-instruct-20251111.description": "A arquitetura do modelo foi amplamente aprimorada, com capacidades fundamentais mais robustas. Apresenta desempenho de ponta em conhecimento, matemática, escrita e raciocínio. Também se destaca em seguimento de instruções, interações de múltiplas etapas e compreensão de longo contexto.",
"hunyuan-2.0-thinking-20251109.description": "Especializado em conteúdo criativo, interações de múltiplas etapas e cenários práticos de seguimento de instruções. Capacidades significativamente aprimoradas em matemática, programação e tarefas baseadas em agentes.",
"hunyuan-code.description": "O mais recente modelo de código Hunyuan treinado com 200 bilhões de dados de código de alta qualidade e seis meses de dados SFT, com contexto de 8K. Classifica-se próximo ao topo em benchmarks automatizados de código e em avaliações humanas especializadas em cinco idiomas.",
"hunyuan-functioncall.description": "O mais recente modelo MoE FunctionCall da Hunyuan treinado com dados de chamadas de ferramentas de alta qualidade, com uma janela de contexto de 32K e benchmarks líderes em várias dimensões.",
"hunyuan-lite.description": "Atualizado para uma arquitetura MoE com janela de contexto de 256K, superando muitos modelos open-source em benchmarks de NLP, programação, matemática e tarefas especializadas.",
"hunyuan-pro.description": "Modelo MoE com trilhões de parâmetros e contexto longo de 32K, líder em benchmarks, excelente em instruções complexas e raciocínio, matemática avançada, chamadas de função e otimizado para tradução multilíngue, finanças, direito e medicina.",
"hunyuan-role-latest.description": "Para cenários de roleplay, oferece alinhamento altamente consistente de personagem e estilo de conversação notavelmente natural. Fornece desenvolvimento narrativo envolvente, além de interação emocional e suporte.",
"hunyuan-role.description": "O mais recente modelo de interpretação de papéis da Hunyuan, ajustado oficialmente com dados de interpretação de papéis, oferecendo desempenho base mais forte em cenários de interpretação.",
"hunyuan-standard-256K.description": "Utiliza roteamento aprimorado para mitigar desequilíbrios e colapso de experts. O desempenho em longos textos do tipo “agulha no palheiro” atinge 99,9%. O MOE-256K avança ainda mais em extensão e qualidade, expandindo significativamente o comprimento de entrada suportado.",
"hunyuan-standard.description": "Utiliza roteamento aprimorado para mitigar desequilíbrios e colapso de experts. O desempenho em longos textos do tipo “agulha no palheiro” atinge 99,9%. O MOE-32K oferece ótima relação entre custo e desempenho para entradas longas.",
"hunyuan-turbo.description": "Prévia do LLM de próxima geração da Hunyuan com nova arquitetura MoE, oferecendo raciocínio mais rápido e resultados superiores ao hunyuan-pro.",
"hunyuan-vision.description": "O mais recente modelo multimodal da Hunyuan que suporta entradas de imagem + texto para gerar texto.",
"hy-image-lite.description": "Adota um codec de compressão ultracompacto para gerar imagens rapidamente mantendo alta qualidade. Suporta casos de uso como aprimoramento de imagens de e-commerce, geração de materiais de design e desenvolvimento iterativo de cenários de jogos.",
"hy-image-v3.0.description": "Baseado no modelo Hunyuan, é capaz de raciocinar sobre composição, layout e estilo, inferindo cenas visuais realistas a partir de conhecimento de mundo. Interpreta semântica complexa em escala de milhares de caracteres, gera conteúdo textual longo, quadrinhos complexos, memes e ilustrações educacionais envolventes.",
"hy-video-1.5.description": "Suporta entradas multimodais, incluindo texto e imagens, para gerar vídeos de alta qualidade com transições de cena e interações entre vários personagens. Otimiza fluxos de produção e reduz custos, sendo adequado para publicidade empresarial, marketing e criação individual.",
"hy3-preview.description": "Hunyuan Hy3 Preview é projetado para cargas de trabalho de agentes, adotando uma arquitetura Mixture-of-Experts (MoE) com 295B parâmetros totais e 21B ativos. Oferece três modos em um único modelo — **no_think** (resposta ultrarrápida), **think_low** (raciocínio rápido) e **think_high** (raciocínio profundo) — para diferentes demandas de latência e profundidade, desde interações de alta frequência até tarefas de engenharia complexas. Alcança desempenho próximo ao estado da arte em benchmarks de programação como o SWE-bench Verified e suporta janela de contexto de 256K para refatoração entre múltiplos arquivos e análise de documentos extensos. Ideal para desenvolvedores que precisam de execução confiável das tarefas mantendo custo de inferência sob controle.",
"image-01-live.description": "Modelo de geração de imagem com detalhes refinados, suportando geração de imagem a partir de texto e estilos controláveis.",
"image-01.description": "Novo modelo de geração de imagem com detalhes refinados, suportando geração de imagem a partir de texto e de imagem para imagem.",
"imagen-4.0-fast-generate-001.description": "Versão rápida da série de modelos de geração de imagem a partir de texto Imagen de quarta geração.",
"imagen-4.0-generate-001.description": "Série de modelos de geração de imagem a partir de texto Imagen de quarta geração.",
"imagen-4.0-ultra-generate-001.description": "Versão Ultra da série de modelos de geração de imagem a partir de texto Imagen de quarta geração.",
"inception/mercury-coder-small.description": "Mercury Coder Small é ideal para geração de código, depuração e refatoração com latência mínima.",
"inclusionAI/Ling-flash-2.0.description": "Ling-flash-2.0 é o terceiro modelo da arquitetura Ling 2.0 da equipe Bailing do Ant Group. É um modelo MoE com 100 bilhões de parâmetros totais, mas apenas 6,1 bilhões ativos por token (4,8 bilhões sem embeddings). Apesar de sua configuração leve, iguala ou supera modelos densos de 40B e MoEs maiores em diversos benchmarks, explorando alta eficiência por meio de arquitetura e estratégia de treinamento.",
"inclusionAI/Ling-mini-2.0.description": "Ling-mini-2.0 é um LLM MoE pequeno e de alto desempenho com 16 bilhões de parâmetros totais e apenas 1,4 bilhão ativo por token (789 milhões sem embeddings), oferecendo geração muito rápida. Com design MoE eficiente e grandes volumes de dados de treinamento de alta qualidade, atinge desempenho de ponta comparável a modelos densos abaixo de 10B e MoEs maiores.",
"inclusionai/ling-1t.description": "Ling-1T é o modelo MoE de 1 trilhão de parâmetros da inclusionAI, otimizado para tarefas de raciocínio intensivo e cargas de trabalho com contexto extenso.",
"inclusionai/ling-flash-2.0.description": "Ling-flash-2.0 é o modelo MoE da inclusionAI otimizado para eficiência e desempenho em raciocínio, adequado para tarefas de médio a grande porte.",
"inclusionai/ling-mini-2.0.description": "Ling-mini-2.0 é o modelo MoE leve da inclusionAI, que reduz significativamente os custos mantendo a capacidade de raciocínio.",
"inclusionai/ming-flash-omini-preview.description": "Ming-flash-omni Preview é o modelo multimodal da inclusionAI, com suporte a entradas de voz, imagem e vídeo, além de melhorias na renderização de imagens e reconhecimento de fala.",
"inclusionai/ring-1t.description": "Ring-1T é o modelo MoE de raciocínio com um trilhão de parâmetros da inclusionAI, adequado para tarefas de raciocínio em larga escala e pesquisa.",
"inclusionai/ring-flash-2.0.description": "Ring-flash-2.0 é uma variante do modelo Ring da inclusionAI para cenários de alto rendimento, com foco em velocidade e eficiência de custo.",
"inclusionai/ring-mini-2.0.description": "Ring-mini-2.0 é o modelo MoE leve e de alto rendimento da inclusionAI, projetado para alta concorrência.",
"intern-latest.description": "Por padrão, aponta para o modelo mais recente da série Intern, atualmente definido como intern-s2-preview.",
"intern-s1-mini.description": "Um modelo multimodal leve com fortes capacidades de raciocínio científico.",
"intern-s1-pro.description": "Lançamos nosso modelo de raciocínio multimodal mais avançado de código aberto, atualmente o modelo de linguagem multimodal de código aberto com melhor desempenho geral.",
"intern-s1.description": "O modelo de raciocínio multimodal de código aberto não apenas demonstra fortes capacidades de uso geral, mas também alcança desempenho de ponta em uma ampla gama de tarefas científicas.",
"intern-s2-preview.description": "Nosso recém-lançado modelo de raciocínio multimodal científico 35B-A3B suporta uma janela de contexto de 256K. Através de escalonamento de tarefas e otimização arquitetural, foi especificamente projetado para aprimorar a descoberta científica e capacidades gerais de agentes.",
"internvl2.5-38b-mpo.description": "InternVL2.5 38B MPO é um modelo multimodal pré-treinado para raciocínio complexo entre imagem e texto.",
"internvl3-14b.description": "InternVL3 14B é um modelo multimodal de porte médio que equilibra desempenho e custo.",
"internvl3-1b.description": "InternVL3 1B é um modelo multimodal leve para implantação com recursos limitados.",
"internvl3-38b.description": "InternVL3 38B é um modelo multimodal de código aberto de grande porte para compreensão precisa de imagem e texto.",
"internvl3.5-241b-a28b.description": "Nosso modelo multimodal recém-lançado apresenta compreensão aprimorada de imagem e texto e capacidades de compreensão de imagens de sequência longa, alcançando desempenho comparável aos principais modelos de código fechado.",
"internvl3.5-latest.description": "Por padrão, aponta para o modelo mais recente da série InternVL3.5, atualmente definido como internvl3.5-241b-a28b.",
"irag-1.0.description": "ERNIE iRAG é um modelo de geração aumentada por recuperação de imagens para busca de imagens, recuperação imagem-texto e geração de conteúdo.",
"jamba-large.description": "Nosso modelo mais poderoso e avançado, projetado para tarefas empresariais complexas com desempenho excepcional.",
"jamba-mini.description": "O modelo mais eficiente de sua categoria, equilibrando velocidade e qualidade com baixo consumo de recursos.",
"jina-deepsearch-v1.description": "DeepSearch combina busca na web, leitura e raciocínio para investigações aprofundadas. Pense nele como um agente que assume sua tarefa de pesquisa, realiza buscas amplas com múltiplas iterações e só então produz uma resposta. O processo envolve pesquisa contínua, raciocínio e resolução de problemas sob múltiplas perspectivas, diferindo fundamentalmente dos LLMs padrão que respondem com base em dados pré-treinados ou sistemas RAG tradicionais que dependem de buscas superficiais pontuais.",
"kimi-k2-instruct.description": "Kimi K2 Instruct é o modelo oficial de raciocínio da Kimi com contexto longo para código, perguntas e respostas e mais.",
"kimi-k2-thinking.description": "kimi-k2-thinking é um modelo pensante da Moonshot AI com habilidades gerais de agência e raciocínio. Ele se destaca em raciocínio profundo e pode resolver problemas difíceis por meio do uso de ferramentas em várias etapas.",
"kimi-k2.5.description": "Kimi K2.5 é o modelo mais versátil da Kimi até hoje, apresentando uma arquitetura multimodal nativa que suporta entradas de visão e texto, modos de 'pensamento' e 'não-pensamento', e tarefas tanto conversacionais quanto de agentes.",
"kimi-k2.6.description": "Kimi-K2.6 é um modelo de linguagem de grande porte lançado pela Moonshot AI, com excelentes capacidades de codificação e uso de ferramentas. O serviço de implantação é suportado apenas na China continental.",
"kimi-k2:1t.description": "Kimi K2 é um grande modelo MoE LLM da Moonshot AI com 1T de parâmetros totais e 32B ativos por passagem. É otimizado para capacidades de agentes, incluindo uso avançado de ferramentas, raciocínio e síntese de código.",
"kling/kling-v3-image-generation.description": "Suporta até 10 imagens de referência, permitindo bloquear sujeitos, elementos e tons de cor para garantir um estilo consistente. Combina transferência de estilo, referência de retratos/personagens, fusão de múltiplas imagens e pintura localizada para controle flexível. Entrega detalhes realistas de retratos, com visuais gerais delicados e ricamente camadas, apresentando cores e atmosfera cinematográficas.",
"kling/kling-v3-omni-image-generation.description": "Desbloqueie visuais de narrativa cinematográfica com geração de imagens de nova série e saída direta em 2K/4K. Analisa profundamente elementos audiovisuais em prompts para executar instruções criativas com precisão. Suporta entradas flexíveis de múltiplas referências e atualizações abrangentes de qualidade, ideal para storyboards, arte conceitual narrativa e design de cenas.",
"kling/kling-v3-omni-video-generation.description": "O novo recurso \"Referência Tudo-em-Um\" suporta vídeos de 3 a 8 segundos ou várias imagens para ancorar elementos de personagens. Pode combinar áudio original e movimentos labiais para representação autêntica de personagens. Melhora a consistência do vídeo e a expressão dinâmica. Suporta sincronização audiovisual e storyboarding inteligente.",
"kling/kling-v3-video-generation.description": "O storyboarding inteligente entende transições de cena dentro de roteiros, organizando automaticamente posições de câmera e tipos de tomadas. Uma estrutura multimodal nativa garante consistência audiovisual. Remove restrições de duração, permitindo narrativas mais flexíveis com múltiplas tomadas.",
"kuaishou/kat-coder-pro-v1.description": "KAT-Coder-Pro-V1 (gratuito por tempo limitado) foca em compreensão de código e automação para agentes de codificação eficientes.",
"labs-devstral-small-2512.description": "Devstral Small 2 se destaca no uso de ferramentas para explorar bases de código, editar múltiplos arquivos e alimentar agentes de engenharia de software.",
"labs-leanstral-2603.description": "O primeiro agente de código aberto da Mistral projetado para Lean 4, construído para engenharia de provas formais em repositórios realistas. 119B parâmetros com 6.5B ativos.",
"lite.description": "Spark Lite é um LLM leve com latência ultrabaixa e processamento eficiente. É totalmente gratuito e suporta busca em tempo real na web. Suas respostas rápidas funcionam bem em dispositivos com pouca capacidade de computação e para ajuste fino de modelos, oferecendo excelente custo-benefício e uma experiência inteligente, especialmente para perguntas e respostas de conhecimento, geração de conteúdo e cenários de busca.",
"llama-3.1-70b-versatile.description": "Llama 3.1 70B oferece raciocínio de IA mais robusto para aplicações complexas, com suporte a computação intensiva com alta eficiência e precisão.",
"llama-3.1-8b-instant.description": "Llama 3.1 8B é um modelo altamente eficiente com geração de texto rápida, ideal para aplicações em larga escala e com bom custo-benefício.",
"llama-3.1-instruct.description": "O modelo Llama 3.1 ajustado por instruções é otimizado para chat e supera muitos modelos de chat abertos em benchmarks do setor.",
"llama-3.2-11b-vision-instruct.description": "Raciocínio visual avançado em imagens de alta resolução, ideal para aplicativos de compreensão visual.",
"llama-3.2-11b-vision-preview.description": "Llama 3.2 foi projetado para tarefas que combinam visão e texto, com excelência em legendagem de imagens e perguntas e respostas visuais, unindo geração de linguagem e raciocínio visual.",
"llama-3.2-90b-vision-instruct.description": "Raciocínio visual avançado para aplicações de agentes com compreensão visual.",
"llama-3.2-90b-vision-preview.description": "Llama 3.2 foi projetado para tarefas que combinam visão e texto, com excelência em legendagem de imagens e perguntas e respostas visuais, unindo geração de linguagem e raciocínio visual.",
"llama-3.2-vision-instruct.description": "O modelo Llama 3.2-Vision ajustado por instruções é otimizado para reconhecimento visual, raciocínio com imagens, legendagem e perguntas e respostas visuais em geral.",
"llama-3.3-70b-versatile.description": "Meta Llama 3.3 é um LLM multilíngue com 70B de parâmetros (entrada/saída de texto), oferecendo variantes pré-treinadas e ajustadas por instruções. A versão ajustada por instruções é otimizada para diálogos multilíngues e supera muitos modelos de chat abertos e fechados em benchmarks do setor.",
"llama-3.3-instruct.description": "O modelo Llama 3.3 ajustado por instruções é otimizado para chat e supera muitos modelos de chat abertos em benchmarks do setor.",
"llama3-70b-8192.description": "Meta Llama 3 70B oferece excelente capacidade de lidar com tarefas complexas para projetos exigentes.",
"llama3-8b-8192.description": "Meta Llama 3 8B oferece desempenho sólido de raciocínio para cenários diversos.",
"llama3-groq-70b-8192-tool-use-preview.description": "Llama 3 Groq 70B Tool Use oferece chamadas de ferramentas robustas para lidar com tarefas complexas de forma eficiente.",
"llama3-groq-8b-8192-tool-use-preview.description": "Llama 3 Groq 8B Tool Use é otimizado para uso eficiente de ferramentas com computação paralela rápida.",
"llama3.1.description": "Llama 3.1 é o modelo principal da Meta, com escalabilidade de até 405B de parâmetros para diálogos complexos, tradução multilíngue e análise de dados.",
"llama3.1:405b.description": "Llama 3.1 é o modelo principal da Meta, com escalabilidade de até 405B de parâmetros para diálogos complexos, tradução multilíngue e análise de dados.",
"llama3.1:70b.description": "Llama 3.1 é o modelo principal da Meta, com escalabilidade de até 405B de parâmetros para diálogos complexos, tradução multilíngue e análise de dados.",
"llava-v1.5-7b-4096-preview.description": "LLaVA 1.5 7B combina processamento visual para gerar saídas complexas a partir de entradas visuais.",
"llava.description": "LLaVA é um modelo multimodal que combina um codificador de visão e o Vicuna para compreensão robusta de linguagem e visão.",
"llava:13b.description": "LLaVA é um modelo multimodal que combina um codificador de visão e o Vicuna para compreensão robusta de linguagem e visão.",
"llava:34b.description": "LLaVA é um modelo multimodal que combina um codificador de visão e o Vicuna para compreensão robusta de linguagem e visão.",
"magistral-medium-2509.description": "Magistral Medium 1.2 é um modelo de raciocínio de fronteira da Mistral AI (setembro de 2025) com suporte a visão.",
"magistral-small-2509.description": "Magistral Small 1.2 é um modelo de raciocínio pequeno e de código aberto da Mistral AI (setembro de 2025) com suporte a visão.",
"mathstral.description": "MathΣtral foi desenvolvido para pesquisa científica e raciocínio matemático, com forte capacidade de cálculo e explicação.",
"max-32k.description": "Spark Max 32K oferece processamento de contexto ampliado com melhor compreensão e raciocínio lógico, suportando entradas de até 32 mil tokens para leitura de documentos longos e perguntas sobre conhecimento privado.",
"megrez-3b-instruct.description": "Megrez 3B Instruct é um modelo pequeno e eficiente da Wuwen Xinqiong.",
"meituan/longcat-flash-chat.description": "Modelo base de código aberto da Meituan, sem raciocínio, otimizado para diálogos e tarefas de agentes, com forte uso de ferramentas e interações complexas de múltiplas etapas.",
"meta-llama-3-70b-instruct.description": "Um poderoso modelo com 70 bilhões de parâmetros que se destaca em raciocínio, programação e tarefas linguísticas amplas.",
"meta-llama-3-8b-instruct.description": "Um modelo versátil com 8 bilhões de parâmetros, otimizado para conversas e geração de texto.",
"meta-llama-3.1-405b-instruct.description": "Modelo de texto ajustado por instruções Llama 3.1, otimizado para conversas multilíngues, com excelente desempenho em benchmarks do setor entre modelos abertos e fechados.",
"meta-llama-3.1-70b-instruct.description": "Modelo de texto ajustado por instruções Llama 3.1, otimizado para conversas multilíngues, com excelente desempenho em benchmarks do setor entre modelos abertos e fechados.",
"meta-llama-3.1-8b-instruct.description": "Modelo de texto ajustado por instruções Llama 3.1, otimizado para conversas multilíngues, com excelente desempenho em benchmarks do setor entre modelos abertos e fechados.",
"meta-llama/Llama-2-13b-chat-hf.description": "LLaMA-2 Chat (13B) oferece forte capacidade linguística e uma experiência sólida de conversa.",
"meta-llama/Llama-2-70b-hf.description": "LLaMA-2 oferece forte capacidade linguística e uma experiência sólida de interação.",
"meta-llama/Llama-3-70b-chat-hf.description": "Llama 3 70B Instruct Reference é um modelo de conversa poderoso para diálogos complexos.",
"meta-llama/Llama-3-8b-chat-hf.description": "Llama 3 8B Instruct Reference oferece suporte multilíngue e amplo conhecimento de domínio.",
"meta-llama/Llama-3.2-11B-Vision-Instruct-Turbo.description": "LLaMA 3.2 foi projetado para tarefas que combinam visão e texto. Destaca-se em legendagem de imagens e perguntas visuais, unindo geração de linguagem e raciocínio visual.",
"meta-llama/Llama-3.2-3B-Instruct-Turbo.description": "LLaMA 3.2 foi projetado para tarefas que combinam visão e texto. Destaca-se em legendagem de imagens e perguntas visuais, unindo geração de linguagem e raciocínio visual.",
"meta-llama/Llama-3.2-90B-Vision-Instruct-Turbo.description": "LLaMA 3.2 foi projetado para tarefas que combinam visão e texto. Destaca-se em legendagem de imagens e perguntas visuais, unindo geração de linguagem e raciocínio visual.",
"meta-llama/Llama-3.3-70B-Instruct-Turbo.description": "Meta Llama 3.3 é um LLM multilíngue com 70B (entrada/saída de texto), pré-treinado e ajustado por instruções. A versão ajustada por instruções é otimizada para conversas multilíngues e supera muitos modelos abertos e fechados em benchmarks do setor.",
"meta-llama/Llama-Vision-Free.description": "LLaMA 3.2 foi projetado para tarefas que combinam visão e texto. Destaca-se em legendagem de imagens e perguntas visuais, unindo geração de linguagem e raciocínio visual.",
"meta-llama/Meta-Llama-3-70B-Instruct-Lite.description": "Llama 3 70B Instruct Lite foi desenvolvido para alto desempenho com baixa latência.",
"meta-llama/Meta-Llama-3-70B-Instruct-Turbo.description": "Llama 3 70B Instruct Turbo oferece forte compreensão e geração para cargas de trabalho exigentes.",
"meta-llama/Meta-Llama-3-8B-Instruct-Lite.description": "Llama 3 8B Instruct Lite equilibra desempenho para ambientes com recursos limitados.",
"meta-llama/Meta-Llama-3-8B-Instruct-Turbo.description": "Llama 3 8B Instruct Turbo é um LLM de alto desempenho para uma ampla gama de casos de uso.",
"meta-llama/Meta-Llama-3.1-405B-Instruct-Turbo.description": "O modelo Turbo Llama 3.1 405B oferece enorme capacidade de contexto para processamento de grandes volumes de dados e se destaca em aplicações de IA em escala ultra.",
"meta-llama/Meta-Llama-3.1-405B-Instruct.description": "Llama 3.1 é a principal família de modelos da Meta, com até 405 bilhões de parâmetros para diálogos complexos, tradução multilíngue e análise de dados.",
"meta-llama/Meta-Llama-3.1-70B-Instruct-Turbo.description": "Llama 3.1 70B é ajustado para aplicações de alta carga; a quantização FP8 oferece computação eficiente e precisão em cenários complexos.",
"meta-llama/Meta-Llama-3.1-70B.description": "Llama 3.1 é a principal família de modelos da Meta, com até 405 bilhões de parâmetros para diálogos complexos, tradução multilíngue e análise de dados.",
"meta-llama/Meta-Llama-3.1-8B-Instruct-Turbo.description": "Llama 3.1 8B usa quantização FP8, suporta até 131.072 tokens de contexto e está entre os melhores modelos abertos para tarefas complexas em diversos benchmarks.",
"meta-llama/llama-3-70b-instruct.description": "Llama 3 70B Instruct é otimizado para diálogos de alta qualidade e tem forte desempenho em avaliações humanas.",
"meta-llama/llama-3-8b-instruct.description": "Llama 3 8B Instruct é otimizado para diálogos de alta qualidade, superando muitos modelos fechados.",
"meta-llama/llama-3.1-70b-instruct.description": "A mais recente série Llama 3.1 da Meta, a variante de 70B ajustada por instruções, otimizada para diálogos de alta qualidade. Em avaliações do setor, apresenta desempenho superior a modelos fechados líderes. (Disponível apenas para entidades verificadas corporativamente.)",
"meta-llama/llama-3.1-8b-instruct.description": "A mais recente série Llama 3.1 da Meta, a variante de 8B ajustada por instruções, é especialmente rápida e eficiente. Em avaliações do setor, apresenta desempenho superior a muitos modelos fechados líderes. (Disponível apenas para entidades verificadas corporativamente.)",
"meta-llama/llama-3.2-11b-vision-instruct.description": "LLaMA 3.2 foi projetado para tarefas que combinam visão e texto. Destaca-se em legendagem de imagens e perguntas visuais, unindo geração de linguagem e raciocínio visual.",
"meta-llama/llama-3.2-3b-instruct.description": "meta-llama/llama-3.2-3b-instruct",
"meta-llama/llama-3.3-70b-instruct.description": "Llama 3.3 é o modelo Llama multilíngue de código aberto mais avançado, oferecendo desempenho próximo ao de 405B com custo muito baixo. Baseado em Transformer, aprimorado com SFT e RLHF para utilidade e segurança. A versão ajustada por instruções é otimizada para chat multilíngue e supera muitos modelos abertos e fechados em benchmarks do setor. Corte de conhecimento: dez/2023.",
"meta-llama/llama-3.3-70b-instruct:free.description": "Llama 3.3 é o modelo Llama multilíngue de código aberto mais avançado, oferecendo desempenho próximo ao de 405B com custo muito baixo. Baseado em Transformer, aprimorado com SFT e RLHF para utilidade e segurança. A versão ajustada por instruções é otimizada para chat multilíngue e supera muitos modelos abertos e fechados em benchmarks do setor. Corte de conhecimento: dez/2023.",
"meta.llama3-1-405b-instruct-v1:0.description": "Meta Llama 3.1 405B Instruct é o maior e mais poderoso modelo Llama 3.1 Instruct, altamente avançado para raciocínio em diálogos e geração de dados sintéticos, sendo uma base sólida para pré-treinamento ou ajuste fino em domínios específicos. Os LLMs multilíngues Llama 3.1 são modelos de geração pré-treinados e ajustados por instruções nos tamanhos 8B, 70B e 405B (entrada/saída de texto). Os modelos ajustados por instruções são otimizados para diálogos multilíngues e superam muitos modelos de chat abertos disponíveis em benchmarks da indústria. O Llama 3.1 é projetado para uso comercial e de pesquisa em vários idiomas. Os modelos ajustados por instruções são ideais para chat estilo assistente, enquanto os modelos pré-treinados são adequados para tarefas mais amplas de geração de linguagem natural. As saídas do Llama 3.1 também podem ser usadas para melhorar outros modelos, incluindo geração e refinamento de dados sintéticos. O Llama 3.1 é um modelo Transformer autoregressivo com arquitetura otimizada. As versões ajustadas utilizam ajuste supervisionado (SFT) e aprendizado por reforço com feedback humano (RLHF) para alinhar com preferências humanas de utilidade e segurança.",
"meta.llama3-1-70b-instruct-v1:0.description": "Uma versão atualizada do Meta Llama 3.1 70B Instruct com janela de contexto estendida de 128K, suporte multilíngue e raciocínio aprimorado. Os LLMs multilíngues Llama 3.1 são modelos de geração pré-treinados e ajustados por instruções nos tamanhos 8B, 70B e 405B (entrada/saída de texto). Os modelos ajustados por instruções são otimizados para diálogos multilíngues e superam muitos modelos de chat abertos disponíveis em benchmarks da indústria. O Llama 3.1 é projetado para uso comercial e de pesquisa em vários idiomas. Os modelos ajustados por instruções são ideais para chat estilo assistente, enquanto os modelos pré-treinados são adequados para tarefas mais amplas de geração de linguagem natural. As saídas do Llama 3.1 também podem ser usadas para melhorar outros modelos, incluindo geração e refinamento de dados sintéticos. O Llama 3.1 é um modelo Transformer autoregressivo com arquitetura otimizada. As versões ajustadas utilizam ajuste supervisionado (SFT) e aprendizado por reforço com feedback humano (RLHF) para alinhar com preferências humanas de utilidade e segurança.",
"meta.llama3-1-8b-instruct-v1:0.description": "Uma versão atualizada do Meta Llama 3.1 8B Instruct com janela de contexto de 128K, suporte multilíngue e raciocínio aprimorado. A família Llama 3.1 inclui modelos de texto ajustados por instruções de 8B, 70B e 405B otimizados para chat multilíngue e desempenho forte em benchmarks. É projetado para uso comercial e de pesquisa em vários idiomas; os modelos ajustados por instruções são ideais para chat estilo assistente, enquanto os modelos pré-treinados são adequados para tarefas mais amplas de geração. As saídas do Llama 3.1 também podem ser usadas para melhorar outros modelos (por exemplo, dados sintéticos e refinamento). É um modelo Transformer autoregressivo, com SFT e RLHF para alinhamento com utilidade e segurança.",
"meta.llama3-70b-instruct-v1:0.description": "Meta Llama 3 é um LLM aberto para desenvolvedores, pesquisadores e empresas, projetado para ajudá-los a construir, experimentar e escalar ideias de IA generativa de forma responsável. Como parte da base para inovação da comunidade global, é ideal para criação de conteúdo, IA conversacional, compreensão de linguagem, P&D e aplicações empresariais.",
"meta.llama3-8b-instruct-v1:0.description": "O Meta Llama 3 é um modelo de linguagem aberto para desenvolvedores, pesquisadores e empresas, projetado para ajudá-los a construir, experimentar e escalar ideias de IA generativa de forma responsável. Como parte da base para a inovação da comunidade global, é ideal para ambientes com recursos computacionais limitados, dispositivos de borda e tempos de treinamento mais rápidos.",
"meta/Llama-3.2-11B-Vision-Instruct.description": "Raciocínio visual avançado em imagens de alta resolução, ideal para aplicativos de compreensão visual.",
"meta/Llama-3.2-90B-Vision-Instruct.description": "Raciocínio visual avançado para aplicações de agentes com compreensão visual.",
"meta/Llama-3.3-70B-Instruct.description": "Llama 3.3 é o modelo Llama de código aberto multilíngue mais avançado, oferecendo desempenho próximo ao de modelos de 405B a um custo muito menor. Baseado em Transformer, aprimorado com SFT e RLHF para utilidade e segurança. A versão ajustada por instruções é otimizada para chat multilíngue e supera muitos modelos de chat abertos e fechados em benchmarks da indústria. Corte de conhecimento: dezembro de 2023.",
"meta/Meta-Llama-3-70B-Instruct.description": "Um modelo poderoso com 70 bilhões de parâmetros que se destaca em raciocínio, programação e tarefas amplas de linguagem.",
"meta/Meta-Llama-3-8B-Instruct.description": "Um modelo versátil com 8 bilhões de parâmetros, otimizado para chat e geração de texto.",
"meta/Meta-Llama-3.1-405B-Instruct.description": "Modelo de texto Llama 3.1 ajustado por instruções, otimizado para chat multilíngue, com desempenho forte em benchmarks da indústria entre modelos de chat abertos e fechados.",
"meta/Meta-Llama-3.1-70B-Instruct.description": "Modelo de texto Llama 3.1 ajustado por instruções, otimizado para chat multilíngue, com desempenho forte em benchmarks da indústria entre modelos de chat abertos e fechados.",
"meta/Meta-Llama-3.1-8B-Instruct.description": "Modelo de texto Llama 3.1 ajustado por instruções, otimizado para chat multilíngue, com desempenho forte em benchmarks da indústria entre modelos de chat abertos e fechados.",
"meta/llama-3.1-70b-instruct.description": "Projetado para diálogos complexos com excelente compreensão de contexto, raciocínio e geração de texto.",
"meta/llama-3.1-70b.description": "Uma versão atualizada do Meta Llama 3 70B Instruct com contexto de 128K, suporte multilíngue e raciocínio aprimorado.",
"meta/llama-3.1-8b-instruct.description": "Um modelo de ponta com forte compreensão de linguagem, raciocínio e geração de texto.",
"meta/llama-3.1-8b.description": "Llama 3.1 8B oferece uma janela de contexto de 128K, ideal para chat em tempo real e análise de dados, com economia significativa em relação a modelos maiores. Servido pela Groq em hardware LPU para inferência rápida e eficiente.",
"meta/llama-3.2-11b-vision-instruct.description": "Um modelo de ponta em visão e linguagem que se destaca em raciocínio de alta qualidade a partir de imagens.",
"meta/llama-3.2-11b.description": "Modelo de raciocínio visual ajustado por instruções (entrada de texto+imagem, saída de texto), otimizado para reconhecimento visual, raciocínio com imagens, legendagem e perguntas e respostas gerais sobre imagens.",
"meta/llama-3.2-1b.description": "Modelo apenas de texto para uso em dispositivos locais, como recuperação multilíngue, resumo e reescrita.",
"meta/llama-3.2-3b.description": "Modelo apenas de texto ajustado para uso em dispositivos locais, como recuperação multilíngue, resumo e reescrita.",
"meta/llama-3.2-90b-vision-instruct.description": "Um modelo de ponta em visão e linguagem que se destaca em raciocínio de alta qualidade a partir de imagens.",
"meta/llama-3.2-90b.description": "Modelo de raciocínio visual ajustado por instruções (entrada de texto+imagem, saída de texto), otimizado para reconhecimento visual, raciocínio com imagens, legendagem e perguntas e respostas gerais sobre imagens.",
"meta/llama-3.3-70b-instruct.description": "Um LLM avançado com forte desempenho em raciocínio, matemática, senso comum e chamadas de função.",
"meta/llama-3.3-70b.description": "Um equilíbrio perfeito entre desempenho e eficiência. Criado para IA conversacional de alto desempenho em criação de conteúdo, aplicativos corporativos e pesquisa, com forte compreensão de linguagem para resumo, classificação, sentimento e geração de código.",
"meta/llama-4-maverick.description": "A família Llama 4 é um conjunto de modelos de IA multimodal nativos que suportam experiências em texto e multimodalidade, utilizando MoE para compreensão avançada de texto e imagem. O Llama 4 Maverick é um modelo de 17B com 128 especialistas, fornecido pela DeepInfra.",
"meta/llama-4-scout.description": "A família Llama 4 é um conjunto de modelos de IA multimodal nativos que suportam experiências em texto e multimodalidade, utilizando MoE para compreensão avançada de texto e imagem. O Llama 4 Scout é um modelo de 17B com 16 especialistas, fornecido pela DeepInfra.",
"microsoft/Phi-3-medium-128k-instruct.description": "O mesmo modelo Phi-3-medium com uma janela de contexto maior para RAG ou prompts few-shot.",
"microsoft/Phi-3-medium-4k-instruct.description": "Modelo com 14 bilhões de parâmetros e qualidade superior ao Phi-3-mini, focado em dados de alta qualidade e raciocínio intensivo.",
"microsoft/Phi-3-mini-128k-instruct.description": "O mesmo modelo Phi-3-mini com uma janela de contexto maior para RAG ou prompts few-shot.",
"microsoft/Phi-3-mini-4k-instruct.description": "O menor membro da família Phi-3, otimizado para qualidade e baixa latência.",
"microsoft/Phi-3-small-128k-instruct.description": "O mesmo modelo Phi-3-small com uma janela de contexto maior para RAG ou prompts few-shot.",
"microsoft/Phi-3-small-8k-instruct.description": "Modelo com 7 bilhões de parâmetros e qualidade superior ao Phi-3-mini, focado em dados de alta qualidade e raciocínio intensivo.",
"microsoft/Phi-3.5-mini-instruct.description": "Uma versão atualizada do modelo Phi-3-mini.",
"microsoft/Phi-3.5-vision-instruct.description": "Uma versão atualizada do modelo Phi-3-vision.",
"microsoft/WizardLM-2-8x22B.description": "WizardLM 2 é um modelo de linguagem da Microsoft AI que se destaca em diálogos complexos, tarefas multilíngues, raciocínio e assistentes.",
"microsoft/wizardlm-2-8x22b.description": "WizardLM-2 8x22B é o modelo Wizard mais avançado da Microsoft AI, com desempenho altamente competitivo.",
"mimo-v2-flash.description": "MiMo-V2-Flash agora é oficialmente open source! Este é um modelo MoE (Mixture-of-Experts) projetado para eficiência extrema de inferência, com 309 bilhões de parâmetros totais (15 bilhões ativados). Por meio de inovações em uma arquitetura híbrida de atenção e aceleração de inferência MTP em várias camadas, ele está entre os 2 melhores modelos open source globais em várias suítes de benchmarking de agentes. Suas capacidades de codificação superam todos os modelos open source e rivalizam com os principais modelos de código fechado, como Claude 4.5 Sonnet, enquanto incidem apenas 2,5% do custo de inferência e entregam velocidade de geração 2× mais rápida—levando a eficiência de inferência de grandes modelos ao limite.",
"mimo-v2-pro.description": "MiMo-V2-Pro é o modelo base principal da Xiaomi para raciocínio complexo, processamento de documentos longos e fluxos de trabalho de agentes. Ele utiliza uma arquitetura MoE de trilhões de parâmetros com 32B de parâmetros ativos, suporta uma janela de contexto de 256K e é otimizado para APIs compatíveis com Claude, codificação e planejamento em várias etapas.",
"mimo-v2.5-pro.description": "MiMo-V2.5-Pro é o modelo principal da Xiaomi, com fortes melhorias em capacidades agentivas gerais, engenharia de software complexa e tarefas de longo alcance. Mantém a arquitetura híbrida de atenção com 1T de parâmetros totais / 42B ativos e janela de contexto de 1M, sustentando tarefas complexas com mais de mil chamadas de ferramentas. Seu desempenho em benchmarks exigentes (ClawEval, GDPVal, SWE-bench Pro) é comparável ao Claude Opus 4.6.",
"mimo-v2.5.description": "MiMo-V2.5 é um modelo agentivo nativo omni-modal, capaz de entender imagens, vídeo, áudio e texto em uma arquitetura unificada, com janela de contexto de 1M. Oferece desempenho agentivo de nível Pro com metade do custo de inferência do MiMo-V2.5-Pro, além de percepção multimodal aprimorada. Seu conjunto integrado de capacidades agentivas (navegação, compreensão, raciocínio, execução) e inferência mais rápida o tornam ideal para frameworks sensíveis à latência como o OpenClaw.",
"minicpm-v.description": "MiniCPM-V é o modelo multimodal de próxima geração da OpenBMB, com excelente desempenho em OCR e compreensão multimodal para diversos casos de uso.",
"minimax-m2.1.description": "MiniMax-M2.1 é a versão mais recente da série MiniMax, otimizada para programação multilíngue e tarefas complexas do mundo real. Como modelo nativo de IA, o MiniMax-M2.1 apresenta melhorias significativas em desempenho, suporte a frameworks de agentes e adaptação a múltiplos cenários, com o objetivo de ajudar empresas e indivíduos a adotarem rapidamente um estilo de vida e trabalho nativo de IA.",
"minimax-m2.5-free.description": "MiniMax M2.5 Free — modelo gratuito voltado para programação, com capacidades completas de raciocínio.",
"minimax-m2.5.description": "MiniMax M2.5 — modelo eficiente de programação com fortes habilidades de raciocínio.",
"minimax-m2.7.description": "MiniMax M2.7 — modelo mais recente da MiniMax com raciocínio aprimorado e melhor uso de ferramentas.",
"minimax-m2.description": "MiniMax M2 é um modelo de linguagem grande e eficiente, construído especificamente para fluxos de trabalho de programação e agentes.",
"minimax-m3.description": "MiniMax M3 — modelo mais recente da MiniMax com suporte a visão, raciocínio forte e uso aprimorado de ferramentas.",
"minimax/minimax-m2.1.description": "MiniMax-M2.1 é um modelo de linguagem grande, leve e de ponta, otimizado para programação, fluxos de trabalho com agentes e desenvolvimento moderno de aplicações, oferecendo saídas mais limpas, concisas e com tempos de resposta mais rápidos.",
"minimax/minimax-m2.description": "MiniMax-M2 é um modelo de alto valor que se destaca em tarefas de programação e agentes em diversos cenários de engenharia.",
"ministral-3:14b.description": "Ministral 3 14B é o maior modelo da série Ministral 3, oferecendo desempenho de última geração comparável ao seu equivalente maior, o Mistral Small 3.2 24B. Otimizado para implantação local, entrega alto desempenho em diversos hardwares, incluindo configurações locais.",
"ministral-3:3b.description": "Ministral 3 3B é o menor e mais eficiente modelo da série Ministral 3, oferecendo fortes capacidades de linguagem e visão em um pacote compacto. Projetado para implantação em borda, entrega alto desempenho em diversos hardwares, incluindo configurações locais.",
"ministral-3:8b.description": "Ministral 3 8B é um modelo poderoso e eficiente da série Ministral 3, oferecendo capacidades de texto e visão de alto nível. Construído para implantação em borda, entrega alto desempenho em diversos hardwares, incluindo configurações locais.",
"ministral-3b-latest.description": "Ministral 3B é o modelo de ponta da Mistral para uso em borda.",
"ministral-8b-latest.description": "Ministral 8B é um modelo de borda altamente econômico da Mistral.",
"mistral-ai/Mistral-Large-2411.description": "Modelo principal da Mistral para tarefas complexas que exigem raciocínio em larga escala ou especialização (geração de texto sintético, geração de código, RAG ou agentes).",
"mistral-ai/Mistral-Nemo.description": "Mistral Nemo é um LLM de ponta com raciocínio de última geração, conhecimento de mundo e programação, considerando seu tamanho.",
"mistral-ai/mistral-small-2503.description": "Mistral Small é adequado para qualquer tarefa baseada em linguagem que exija alta eficiência e baixa latência.",
"mistral-large-2411.description": "Mistral Large é o modelo carro-chefe, forte em tarefas multilíngues, raciocínio complexo e geração de código—ideal para aplicações de alto nível.",
"mistral-large-2512.description": "Mistral Large 3 é um modelo multimodal de propósito geral de última geração, com pesos abertos e arquitetura granular de Mistura de Especialistas. Apresenta 41B parâmetros ativos e 675B parâmetros totais.",
"mistral-large-3:675b.description": "Mistral Large 3 é um modelo multimodal de propósito geral de última geração com uma arquitetura refinada de Mistura de Especialistas. Possui 41B parâmetros ativos e 675B parâmetros totais.",
"mistral-large-instruct.description": "Mistral-Large-Instruct-2407 é um LLM denso avançado com 123B parâmetros e raciocínio, conhecimento e programação de última geração.",
"mistral-large-latest.description": "Mistral Large é o modelo carro-chefe, destacando-se em tarefas multilíngues, raciocínio complexo e geração de código para aplicações de alto nível.",
"mistral-large.description": "Mixtral Large é o modelo principal da Mistral, combinando geração de código, matemática e raciocínio com uma janela de contexto de 128K.",
"mistral-medium-2508.description": "Mistral Medium 3.1 oferece desempenho de última geração a um custo 8× menor e simplifica a implantação empresarial.",
"mistral-medium-3.5.description": "Mistral Medium 3.5 é um modelo multimodal de classe fronteira otimizado para casos de uso de agência e codificação, lançado como pesos abertos sob uma licença MIT Modificada.",
"mistral-nemo-instruct.description": "Mistral-Nemo-Instruct-2407 é a versão ajustada por instruções do Mistral-Nemo-Base-2407.",
"mistral-nemo.description": "Mistral Nemo é um modelo de alta eficiência com 12B parâmetros, desenvolvido pela Mistral AI e NVIDIA.",
"mistral-small-2506.description": "Mistral Small é uma opção econômica, rápida e confiável para tradução, sumarização e análise de sentimentos.",
"mistral-small-2603.description": "O modelo híbrido poderoso da Mistral unifica capacidades de instrução, raciocínio e codificação em um único modelo. 119B parâmetros com 6.5B ativos.",
"mistral-small-latest.description": "Mistral Small é uma opção econômica, rápida e confiável para tradução, sumarização e análise de sentimento.",
"mistral-small.description": "Mistral Small é adequado para qualquer tarefa baseada em linguagem que exija alta eficiência e baixa latência.",
"mistral.description": "Mistral é o modelo de 7B da Mistral AI, adequado para diversas tarefas linguísticas.",
"mistral/codestral-embed.description": "Modelo de embedding de código para indexação de bases de código e repositórios, ideal para assistentes de programação.",
"mistral/codestral.description": "Mistral Codestral 25.01 é um modelo de programação de última geração, otimizado para baixa latência e uso frequente. Suporta mais de 80 linguagens e se destaca em FIM, correção de código e geração de testes.",
"mistral/devstral-small.description": "Devstral é um LLM com comportamento agente voltado para tarefas de engenharia de software, sendo uma excelente escolha para agentes desenvolvedores.",
"mistral/magistral-medium.description": "Raciocínio complexo apoiado por compreensão profunda, com lógica transparente que pode ser acompanhada e verificada. Mantém raciocínio de alta fidelidade entre idiomas, mesmo durante a tarefa.",
"mistral/magistral-small.description": "Raciocínio complexo apoiado por compreensão profunda, com lógica transparente que pode ser acompanhada e verificada. Mantém raciocínio de alta fidelidade entre idiomas, mesmo durante a tarefa.",
"mistral/ministral-3b.description": "Modelo compacto e eficiente para tarefas locais, como assistentes e análises no dispositivo, com desempenho de baixa latência.",
"mistral/ministral-8b.description": "Modelo mais potente com inferência rápida e eficiente em memória, ideal para fluxos de trabalho complexos e aplicações exigentes em edge.",
"mistral/mistral-embed.description": "Modelo geral de embedding de texto para busca semântica, similaridade, agrupamento e fluxos de RAG.",
"mistral/mistral-large.description": "Mistral Large é ideal para tarefas complexas que exigem raciocínio avançado ou especialização — geração de texto sintético, código, RAG ou agentes.",
"mistral/mistral-small.description": "Mistral Small é ideal para tarefas simples e em lote, como classificação, suporte ao cliente ou geração de texto, com ótimo desempenho a um preço acessível.",
"mistral/mixtral-8x22b-instruct.description": "Modelo Instruct 8x22B. O 8x22B é um modelo MoE aberto disponibilizado pela Mistral.",
"mistral/pixtral-12b.description": "Modelo de 12B com compreensão de imagens e texto.",
"mistral/pixtral-large.description": "Pixtral Large é o segundo modelo da nossa família multimodal com compreensão de imagem em nível de fronteira. Lida com documentos, gráficos e imagens naturais, mantendo a liderança em compreensão textual do Mistral Large 2.",
"mistralai/Mistral-7B-Instruct-v0.1.description": "Mistral (7B) Instruct é conhecido por seu forte desempenho em diversas tarefas linguísticas.",
"mistralai/Mistral-7B-Instruct-v0.2.description": "Mistral (7B) Instruct v0.2 melhora o manuseio de instruções e a precisão dos resultados.",
"mistralai/Mistral-7B-Instruct-v0.3.description": "Mistral (7B) Instruct v0.3 oferece computação eficiente e forte compreensão linguística para diversos casos de uso.",
"mistralai/Mistral-7B-v0.1.description": "Mistral 7B é compacto, mas de alto desempenho, ideal para processamento em lote e tarefas simples como classificação e geração de texto, com raciocínio sólido.",
"mistralai/Mixtral-8x22B-Instruct-v0.1.description": "Mixtral-8x22B Instruct (141B) é um LLM muito grande para cargas de trabalho pesadas.",
"mistralai/Mixtral-8x7B-Instruct-v0.1.description": "Mixtral-8x7B Instruct (46.7B) oferece alta capacidade para processamento de dados em larga escala.",
"mistralai/Mixtral-8x7B-v0.1.description": "Mixtral 8x7B é um modelo MoE esparso que acelera a inferência, adequado para tarefas multilíngues e geração de código.",
"mistralai/mistral-nemo.description": "Mistral Nemo é um modelo de 7.3B com suporte multilíngue e forte desempenho em programação.",
"mixtral-8x7b-32768.description": "Mixtral 8x7B oferece computação paralela tolerante a falhas para tarefas complexas.",
"mixtral.description": "Mixtral é o modelo MoE da Mistral AI com pesos abertos, com suporte à geração de código e compreensão de linguagem.",
"mixtral:8x22b.description": "Mixtral é o modelo MoE da Mistral AI com pesos abertos, com suporte à geração de código e compreensão de linguagem.",
"moonshot-v1-128k-vision-preview.description": "Os modelos de visão Kimi (incluindo moonshot-v1-8k-vision-preview/moonshot-v1-32k-vision-preview/moonshot-v1-128k-vision-preview) compreendem conteúdo de imagem como texto, cores e formas de objetos.",
"moonshot-v1-128k.description": "Moonshot V1 128K oferece contexto ultra-longo para geração de texto muito extensa, lidando com até 128.000 tokens para pesquisa, uso acadêmico e documentos longos.",
"moonshot-v1-32k-vision-preview.description": "Os modelos de visão Kimi (incluindo moonshot-v1-8k-vision-preview/moonshot-v1-32k-vision-preview/moonshot-v1-128k-vision-preview) compreendem conteúdo de imagem como texto, cores e formas de objetos.",
"moonshot-v1-32k.description": "Moonshot V1 32K suporta 32.768 tokens para contexto de comprimento médio, ideal para documentos longos e diálogos complexos em criação de conteúdo, relatórios e sistemas de chat.",
"moonshot-v1-8k-vision-preview.description": "Os modelos de visão Kimi (incluindo moonshot-v1-8k-vision-preview/moonshot-v1-32k-vision-preview/moonshot-v1-128k-vision-preview) compreendem conteúdo de imagem como texto, cores e formas de objetos.",
"moonshot-v1-8k.description": "Moonshot V1 8K é otimizado para geração de texto curta com desempenho eficiente, lidando com 8.192 tokens para conversas rápidas, anotações e conteúdo breve.",
"moonshotai/kimi-k2-0711.description": "Kimi K2 0711 é a variante instruct da série Kimi, ideal para geração de código de alta qualidade e uso de ferramentas.",
"moonshotai/kimi-k2-0905.description": "Kimi K2 0905 é uma atualização que amplia o contexto e melhora o desempenho em raciocínio com otimizações para programação.",
"moonshotai/kimi-k2-thinking-turbo.description": "Kimi K2 Thinking Turbo é a versão de alta velocidade do Kimi K2 Thinking, reduzindo significativamente a latência sem perder profundidade de raciocínio.",
"moonshotai/kimi-k2-thinking.description": "Kimi K2 Thinking é o modelo de raciocínio da Moonshot otimizado para tarefas de raciocínio profundo, com capacidades gerais de agente.",
"moonshotai/kimi-k2.description": "Kimi K2 é um modelo MoE de grande porte da Moonshot AI com 1 trilhão de parâmetros totais e 32 bilhões ativos por passagem, otimizado para capacidades de agente, incluindo uso avançado de ferramentas, raciocínio e síntese de código.",
"morph/morph-v3-fast.description": "Morph oferece um modelo especializado para aplicar alterações de código sugeridas por modelos de ponta (como Claude ou GPT-4o) aos seus arquivos existentes a uma velocidade de 4500+ tokens/seg. É a etapa final em um fluxo de trabalho de codificação com IA e suporta 16k tokens de entrada/saída.",
"morph/morph-v3-large.description": "Morph oferece um modelo especializado para aplicar alterações de código sugeridas por modelos de ponta (como Claude ou GPT-4o) aos seus arquivos existentes a uma velocidade de 2500+ tokens/seg. É a etapa final em um fluxo de trabalho de codificação com IA e suporta 16k tokens de entrada/saída.",
"musesteamer-2.0-lite-i2v.description": "Comparado ao Turbo, oferece desempenho superior com excelente relação custo-benefício.",
"musesteamer-2.0-pro-i2v.description": "Baseado no Turbo, suporta geração de vídeo dinâmico em 1080P, oferecendo maior qualidade visual e expressividade de vídeo aprimorada.",
"musesteamer-2.0-turbo-i2v-audio.description": "Suporta geração de vídeo dinâmico de 5s e 10s em 720P com som. Permite criação audiovisual de conversas com múltiplas pessoas, com som e visuais sincronizados, imagens de qualidade cinematográfica e movimentos de câmera em nível de mestre.",
"musesteamer-2.0-turbo-i2v.description": "Suporta geração de vídeo dinâmico silencioso de 5 segundos em 720P, apresentando visuais de qualidade cinematográfica, movimentos de câmera complexos e emoções e ações realistas de personagens.",
"musesteamer-air-i2v.description": "O modelo de geração de vídeo MuseSteamer Air da Baidu apresenta bom desempenho em consistência de sujeitos, realismo físico, efeitos de movimento de câmera e velocidade de geração. Suporta geração de vídeo dinâmico silencioso de 5 segundos em 720P, entregando visuais de qualidade cinematográfica, geração rápida e excelente relação custo-benefício.",
"musesteamer-air-image.description": "musesteamer-air-image é um modelo de geração de imagens desenvolvido pela equipe de busca da Baidu para oferecer desempenho excepcional em custo-benefício. Ele pode gerar rapidamente imagens claras e coerentes com ações com base em prompts do usuário, transformando descrições em visuais sem esforço.",
"nemotron-3-super-free.description": "Nemotron 3 Super Free da Nvidia — modelo gratuito de raciocínio com forte suporte a programação.",
"nousresearch/hermes-2-pro-llama-3-8b.description": "Hermes 2 Pro Llama 3 8B é uma versão atualizada do Nous Hermes 2 com os mais recentes conjuntos de dados desenvolvidos internamente.",
"nvidia/Llama-3.1-Nemotron-70B-Instruct-HF.description": "Llama 3.1 Nemotron 70B é um LLM personalizado da NVIDIA para melhorar a utilidade. Apresenta desempenho superior nos benchmarks Arena Hard, AlpacaEval 2 LC e GPT-4-Turbo MT-Bench, ocupando o 1º lugar em todos os três benchmarks de autoalinhamento em 1º de outubro de 2024. Treinado a partir do Llama-3.1-70B-Instruct usando RLHF (REINFORCE), Llama-3.1-Nemotron-70B-Reward e prompts HelpSteer2-Preference.",
"nvidia/llama-3.1-nemotron-51b-instruct.description": "Modelo de linguagem distinto com precisão e eficiência excepcionais.",
"nvidia/llama-3.1-nemotron-70b-instruct.description": "Llama-3.1-Nemotron-70B-Instruct é um modelo personalizado da NVIDIA projetado para melhorar a utilidade das respostas de LLMs.",
"o1-mini.description": "o1-mini é um modelo de raciocínio rápido e econômico projetado para codificação, matemática e ciência. Possui contexto de 128K e um limite de conhecimento de outubro de 2023.",
"o1-preview.description": "o1 é o novo modelo de raciocínio da OpenAI para tarefas complexas que exigem amplo conhecimento. Possui contexto de 128K e um limite de conhecimento de outubro de 2023.",
"o1-pro.description": "A série o1 é treinada com aprendizado por reforço para pensar antes de responder e lidar com raciocínio complexo. O o1-pro usa mais recursos computacionais para raciocínio mais profundo e respostas consistentemente melhores.",
"o1.description": "o1 é o novo modelo de raciocínio da OpenAI com entrada de texto+imagem e saída de texto, adequado para tarefas complexas que exigem amplo conhecimento. Possui janela de contexto de 200K e corte de conhecimento em outubro de 2023.",
"o3-2025-04-16.description": "o3 é o novo modelo de raciocínio da OpenAI com entrada de texto+imagem e saída de texto para tarefas complexas que exigem amplo conhecimento.",
"o3-deep-research.description": "o3-deep-research é nosso modelo de pesquisa profunda mais avançado para tarefas complexas em múltiplas etapas. Pode buscar na web e acessar seus dados via conectores MCP.",
"o3-mini.description": "o3-mini é nosso mais novo modelo pequeno de raciocínio, oferecendo maior inteligência com o mesmo custo e latência do o1-mini.",
"o3-pro-2025-06-10.description": "o3 Pro é o novo modelo de raciocínio da OpenAI com entrada de texto+imagem e saída de texto para tarefas complexas que exigem amplo conhecimento.",
"o3-pro.description": "o3-pro usa mais recursos computacionais para pensar mais profundamente e fornecer respostas consistentemente melhores; disponível apenas via API de Respostas.",
"o3.description": "o3 é um modelo versátil e poderoso que estabelece um novo padrão em matemática, ciência, programação e raciocínio visual. Destaca-se em redação técnica, seguimento de instruções e pode analisar texto, código e imagens em problemas de múltiplas etapas.",
"o4-mini-2025-04-16.description": "o4-mini é um modelo de raciocínio da OpenAI com entrada de texto+imagem e saída de texto, adequado para tarefas complexas que exigem amplo conhecimento, com janela de contexto de 200K.",
"o4-mini-deep-research.description": "o4-mini-deep-research é um modelo de pesquisa profunda mais rápido e acessível para tarefas complexas em múltiplas etapas. Pode buscar na web e acessar seus dados via conectores MCP.",
"o4-mini.description": "o4-mini é o mais novo modelo pequeno da série o, otimizado para raciocínio rápido e eficaz com alta eficiência em tarefas de codificação e visão.",
"open-codestral-mamba.description": "Codestral Mamba é um modelo de linguagem Mamba 2 voltado para geração de código, com suporte a tarefas avançadas de programação e raciocínio.",
"open-mistral-7b.description": "Mistral 7B é compacto, mas de alto desempenho, ideal para processamento em lote e tarefas simples como classificação e geração de texto, com raciocínio sólido.",
"open-mistral-nemo.description": "Mistral Nemo é um modelo de 12B co-desenvolvido com a Nvidia, oferecendo desempenho robusto em raciocínio e programação com fácil integração.",
"open-mixtral-8x22b.description": "Mixtral 8x22B é um modelo MoE de grande porte para tarefas complexas, com raciocínio avançado e alta capacidade de processamento.",
"open-mixtral-8x7b.description": "Mixtral 8x7B é um modelo MoE esparso que acelera a inferência, adequado para tarefas multilíngues e de geração de código.",
"openai/gpt-3.5-turbo-instruct.description": "Capacidades semelhantes aos modelos da era GPT-3, compatível com endpoints legados de completions em vez de chat.",
"openai/gpt-3.5-turbo.description": "O modelo GPT-3.5 mais capaz e econômico da OpenAI, otimizado para chat, mas ainda eficaz em completions clássicos.",
"openai/gpt-4-turbo.description": "O gpt-4-turbo da OpenAI possui amplo conhecimento geral e expertise em domínios, segue instruções complexas em linguagem natural e resolve problemas difíceis com precisão. O corte de conhecimento é abril de 2023, com janela de contexto de 128k.",
"openai/gpt-4.1-mini.description": "GPT-4.1 Mini oferece menor latência e melhor custo-benefício para cargas de trabalho de contexto médio.",
"openai/gpt-4.1-nano.description": "GPT-4.1 Nano é uma opção de custo ultrabaixo e baixa latência para conversas curtas de alta frequência ou tarefas de classificação.",
"openai/gpt-4.1.description": "A série GPT-4.1 oferece janelas de contexto maiores e capacidades aprimoradas de engenharia e raciocínio.",
"openai/gpt-4o-mini.description": "GPT-4o-mini é uma variante rápida e compacta do GPT-4o para uso multimodal com baixa latência.",
"openai/gpt-4o.description": "A família GPT-4o é o modelo Omni da OpenAI com entrada de texto + imagem e saída em texto.",
"openai/gpt-5-chat.description": "GPT-5 Chat é uma variante do GPT-5 otimizada para conversas com menor latência e melhor interatividade.",
"openai/gpt-5-codex.description": "GPT-5-Codex é uma variante do GPT-5 ainda mais otimizada para programação e fluxos de trabalho de código em larga escala.",
"openai/gpt-5-mini.description": "GPT-5 Mini é uma variante menor do GPT-5 para cenários de baixo custo e baixa latência.",
"openai/gpt-5-nano.description": "GPT-5 Nano é a variante ultracompacta para cenários com restrições rigorosas de custo e latência.",
"openai/gpt-5-pro.description": "GPT-5 Pro é o modelo principal da OpenAI, oferecendo raciocínio avançado, geração de código e recursos de nível corporativo, com roteamento em tempo de execução e políticas de segurança mais rigorosas.",
"openai/gpt-5.1-chat.description": "GPT-5.1 Chat é o membro leve da família GPT-5.1, otimizado para conversas de baixa latência, mantendo forte raciocínio e execução de instruções.",
"openai/gpt-5.1-codex-mini.description": "GPT-5.1-Codex-Mini é uma versão menor e mais rápida do GPT-5.1-Codex, ideal para cenários de programação sensíveis a latência e custo.",
"openai/gpt-5.1-codex.description": "GPT-5.1-Codex é uma variante do GPT-5.1 otimizada para engenharia de software e fluxos de trabalho de programação, adequada para grandes refatorações, depuração complexa e tarefas autônomas prolongadas.",
"openai/gpt-5.1.description": "GPT-5.1 é o modelo principal mais recente da série GPT-5, com melhorias significativas em raciocínio geral, seguimento de instruções e naturalidade em conversas, adequado para tarefas amplas.",
"openai/gpt-5.2-chat.description": "GPT-5.2 Chat é a variante do ChatGPT para experimentar as melhorias mais recentes em conversação.",
"openai/gpt-5.2-pro.description": "GPT-5.2 Pro: uma variante mais inteligente e precisa do GPT-5.2 (somente API de Respostas), ideal para problemas mais difíceis e raciocínio prolongado em múltiplas interações.",
"openai/gpt-5.2.description": "GPT-5.2 é um modelo carro-chefe para programação e fluxos de trabalho com agentes, com raciocínio mais avançado e desempenho superior em contextos longos.",
"openai/gpt-5.description": "GPT-5 é o modelo de alto desempenho da OpenAI para uma ampla gama de tarefas de produção e pesquisa.",
"openai/gpt-oss-120b.description": "Um modelo de linguagem de uso geral altamente capaz, com raciocínio forte e controlável.",
"openai/gpt-oss-20b.description": "Um modelo de linguagem compacto com pesos abertos, otimizado para baixa latência e ambientes com recursos limitados, incluindo implantações locais e na borda.",
"openai/o1-mini.description": "o1-mini é um modelo de raciocínio rápido e econômico projetado para casos de uso em codificação, matemática e ciência. Possui contexto de 128K e um limite de conhecimento de outubro de 2023.",
"openai/o1-preview.description": "o1 é o novo modelo de raciocínio da OpenAI para tarefas complexas que exigem conhecimento amplo. Possui contexto de 128K e corte de conhecimento em outubro de 2023.",
"openai/o1.description": "OpenAI o1 é um modelo de raciocínio principal desenvolvido para problemas complexos que exigem pensamento profundo, oferecendo raciocínio sólido e maior precisão em tarefas de múltiplas etapas.",
"openai/o3-mini-high.description": "o3-mini (raciocínio avançado) oferece inteligência superior com os mesmos custos e metas de latência do o1-mini.",
"openai/o3-mini.description": "o3-mini é o mais recente modelo de raciocínio compacto da OpenAI, oferecendo inteligência superior com os mesmos custos e metas de latência do o1-mini.",
"openai/o3.description": "OpenAI o3 é o modelo de raciocínio mais poderoso, estabelecendo um novo estado da arte em programação, matemática, ciência e percepção visual. Destaca-se em consultas complexas e multifacetadas, com forte capacidade de análise de imagens, gráficos e diagramas.",
"openai/o4-mini-high.description": "o4-mini com raciocínio avançado, otimizado para raciocínio rápido e eficiente com desempenho sólido em programação e visão computacional.",
"openai/o4-mini.description": "OpenAI o4-mini é um modelo de raciocínio pequeno e eficiente para cenários de baixa latência.",
"openai/text-embedding-3-large.description": "O modelo de embedding mais avançado da OpenAI para tarefas em inglês e outros idiomas.",
"openai/text-embedding-3-small.description": "Variante aprimorada e de alto desempenho do modelo de embedding ada da OpenAI.",
"openai/text-embedding-ada-002.description": "Modelo de embedding de texto legado da OpenAI.",
"openrouter/auto.description": "Com base no comprimento do contexto, tópico e complexidade, sua solicitação é roteada para Llama 3 70B Instruct, Claude 3.5 Sonnet (auto-moderado) ou GPT-4o.",
"oswe-vscode-prime.description": "Raptor mini é um modelo de pré-visualização otimizado para tarefas relacionadas a código.",
"oswe-vscode-secondary.description": "Raptor mini é um modelo de pré-visualização otimizado para tarefas relacionadas a código.",
"paratera/deepseek-v3.2.description": "DeepSeek V3.2 é um modelo que equilibra alta eficiência computacional com excelente desempenho de raciocínio e agentes.",
"perplexity/sonar-pro.description": "Produto principal da Perplexity com base em busca, oferecendo suporte a consultas avançadas e seguimentos.",
"perplexity/sonar-reasoning-pro.description": "Modelo avançado com foco em raciocínio que gera cadeia de pensamento (CoT) com busca aprimorada, incluindo múltiplas consultas por solicitação.",
"perplexity/sonar-reasoning.description": "Modelo com foco em raciocínio que gera cadeia de pensamento (CoT) com explicações detalhadas baseadas em busca.",
"perplexity/sonar.description": "Produto leve da Perplexity com base em busca, mais rápido e econômico que o Sonar Pro.",
"phi3.description": "Phi-3 é o modelo leve e aberto da Microsoft para integração eficiente e raciocínio em larga escala.",
"phi3:14b.description": "Phi-3 é o modelo leve e aberto da Microsoft para integração eficiente e raciocínio em larga escala.",
"pixtral-12b-2409.description": "Pixtral é forte em compreensão de gráficos/imagens, perguntas e respostas em documentos, raciocínio multimodal e seguimento de instruções. Processa imagens em resolução/aspecto nativos e lida com qualquer número de imagens dentro de uma janela de contexto de 128K.",
"pixtral-large-latest.description": "Pixtral Large é um modelo multimodal aberto com 124 bilhões de parâmetros baseado no Mistral Large 2, o segundo da nossa família multimodal com compreensão de imagem de ponta.",
"pixverse/pixverse-c1-it2v.description": "C1 é um modelo de grande escala para a indústria cinematográfica e televisiva lançado pela PixVerse no final de março de 2026. Sua capacidade it2v (imagem para vídeo) não só oferece controle de prompt semelhante ao t2v (texto para vídeo), como também preserva com alta fidelidade as cores, saturação, cenários e características dos personagens das imagens de referência. Em comparação com o V6, apresenta melhor interpretação de prompts, maior criatividade e entrega coreografias de luta e efeitos visuais (como feitiços) mais próximos dos padrões cinematográficos profissionais. O modelo gera vídeos de até 15 segundos, inclui música com saída direta no vídeo e suporta múltiplos idiomas. É especialmente adequado para tomadas de curta duração, como closes individuais, monólogos, sequências em câmera lenta ou de quadro congelado, além de tomadas de transição.",
"pixverse/pixverse-c1-kf2v.description": "C1 é um modelo de grande escala para a indústria cinematográfica e televisiva lançado pela PixVerse no final de março de 2026. Sua capacidade kf2v (keyframe para vídeo) possibilita transições suaves e naturais entre quaisquer duas imagens de entrada. O modelo gera vídeos de até 15 segundos, inclui música com saída direta no vídeo e suporta múltiplos idiomas.",
"pixverse/pixverse-c1-r2v.description": "C1 é um modelo de grande escala para a indústria cinematográfica e televisiva lançado pela PixVerse no final de março de 2026. Sua capacidade r2v (referência para vídeo) suporta a entrada de 2 a 7 imagens, combinando múltiplos sujeitos de forma inteligente enquanto mantém controle de prompt semelhante ao t2v (texto para vídeo), além da consistência e criatividade do it2v (imagem para vídeo). Ele oferece coreografias de luta e efeitos visuais (como feitiços e sequências de ação) mais próximos dos padrões cinematográficos profissionais. O modelo gera vídeos de até 15 segundos, inclui música com saída direta no vídeo e suporta múltiplos idiomas. É ideal para cenas complexas, como tomadas de grupo, diálogos e interações, especialmente em planos médios e abertos. Quando fornecida uma única imagem storyboard com múltiplos quadros (suportando até uma grade de 9 quadros), ele pode gerar uma sequência contínua de múltiplas tomadas com um clique.",
"pixverse/pixverse-c1-t2v.description": "C1 é um modelo de grande escala para a indústria cinematográfica e televisiva lançado pela PixVerse no final de março de 2026. Sua capacidade t2v (texto para vídeo) permite controle preciso da geração de vídeo por meio de prompts, reproduzindo com precisão diversas técnicas de linguagem cinematográfica, como zoom in, zoom out, panorâmicas, tilt e travelling, com movimentos de câmera suaves e transições de perspectiva bem controladas. O modelo gera vídeos de até 15 segundos, inclui música com saída direta no vídeo e suporta múltiplos idiomas.",
"pixverse/pixverse-v5.6-it2v.description": "Envie qualquer imagem para personalizar livremente a história, ritmo e estilo, gerando vídeos vívidos e coerentes. PixVerse V5.6 é um modelo de geração de vídeo de grande porte autodesenvolvido pela Aishi Technology, oferecendo melhorias abrangentes tanto em texto-para-vídeo quanto em imagem-para-vídeo. O modelo melhora significativamente a clareza da imagem, a estabilidade em movimentos complexos e a sincronização audiovisual. A precisão da sincronização labial e a expressão emocional natural são aprimoradas em cenas de diálogo com vários personagens. A composição, iluminação e consistência de textura também são otimizadas, elevando ainda mais a qualidade geral da geração. PixVerse V5.6 está classificado no nível global superior no ranking Artificial Analysis de texto-para-vídeo e imagem-para-vídeo.",
"pixverse/pixverse-v5.6-kf2v.description": "Alcance transições perfeitas entre quaisquer duas imagens, criando mudanças de cena mais suaves e naturais com efeitos visualmente impressionantes. PixVerse V5.6 é um modelo de geração de vídeo de grande porte autodesenvolvido pela Aishi Technology, oferecendo melhorias abrangentes tanto em texto-para-vídeo quanto em imagem-para-vídeo. O modelo melhora significativamente a clareza da imagem, a estabilidade em movimentos complexos e a sincronização audiovisual. A precisão da sincronização labial e a expressão emocional natural são aprimoradas em cenas de diálogo com vários personagens. A composição, iluminação e consistência de textura também são otimizadas, elevando ainda mais a qualidade geral da geração. PixVerse V5.6 está classificado no nível global superior no ranking Artificial Analysis de texto-para-vídeo e imagem-para-vídeo.",
"pixverse/pixverse-v5.6-r2v.description": "Insira de 2 a 7 imagens para mesclar inteligentemente diferentes sujeitos enquanto mantém um estilo unificado e movimento coordenado, construindo facilmente cenas narrativas ricas e aumentando a controlabilidade do conteúdo e a liberdade criativa. PixVerse V5.6 é um modelo de geração de vídeo de grande porte autodesenvolvido pela Aishi Technology, oferecendo melhorias abrangentes tanto em texto-para-vídeo quanto em imagem-para-vídeo. O modelo melhora significativamente a clareza da imagem, a estabilidade em movimentos complexos e a sincronização audiovisual. A precisão da sincronização labial e a expressão emocional natural são aprimoradas em cenas de diálogo com vários personagens. A composição, iluminação e consistência de textura também são otimizadas, elevando ainda mais a qualidade geral da geração. PixVerse V5.6 está classificado no nível global superior no ranking Artificial Analysis de texto-para-vídeo e imagem-para-vídeo.",
"pixverse/pixverse-v5.6-t2v.description": "Insira uma descrição de texto para gerar vídeos de alta qualidade com velocidade em nível de segundos e alinhamento semântico preciso, suportando vários estilos. PixVerse V5.6 é um modelo de geração de vídeo de grande porte autodesenvolvido pela Aishi Technology, oferecendo melhorias abrangentes tanto em texto-para-vídeo quanto em imagem-para-vídeo. O modelo melhora significativamente a clareza da imagem, a estabilidade em movimentos complexos e a sincronização audiovisual. A precisão da sincronização labial e a expressão emocional natural são aprimoradas em cenas de diálogo com vários personagens. A composição, iluminação e consistência de textura também são otimizadas, elevando ainda mais a qualidade geral da geração. PixVerse V5.6 está classificado no nível global superior no ranking Artificial Analysis de texto-para-vídeo e imagem-para-vídeo.",
"pixverse/pixverse-v6-it2v.description": "V6 é o novo modelo da PixVerse lançado no final de março de 2026. Seu modelo it2v (imagem-para-vídeo) está classificado em segundo lugar globalmente. Além das capacidades de controle de prompt do t2v (texto-para-vídeo), o it2v pode reproduzir com precisão as cores, saturação, cenas e características dos personagens das imagens de referência, entregando emoções mais fortes dos personagens e desempenho de movimento em alta velocidade. Suporta vídeos de até 15 segundos, saída direta de música e vídeo, e múltiplos idiomas. Ideal para cenários como close-ups de produtos de e-commerce, promoções publicitárias e modelagem simulada em C4D para exibir estruturas de produtos, com saída direta com um clique.",
"pixverse/pixverse-v6-kf2v.description": "V6 é o novo modelo da PixVerse lançado no final de março de 2026. Seu modelo kf2v (quadro-chave-para-vídeo) pode conectar perfeitamente quaisquer duas imagens, produzindo transições de vídeo mais suaves e naturais. Suporta vídeos de até 15 segundos, saída direta de música e vídeo, e múltiplos idiomas.",
"pixverse/pixverse-v6-t2v.description": "V6 é o novo modelo da PixVerse lançado no final de março de 2026. Seu modelo t2v (texto-para-vídeo) permite controle preciso dos visuais do vídeo por meio de prompts, reproduzindo com precisão várias técnicas cinematográficas. Movimentos de câmera como zoom, panorâmica, inclinação, rastreamento e acompanhamento são suaves e naturais, com troca de perspectiva precisa e controlável. Suporta vídeos de até 15 segundos, saída direta de música e vídeo, e múltiplos idiomas.",
"pro-128k.description": "Spark Pro 128K oferece uma capacidade de contexto muito grande, lidando com até 128K de contexto, ideal para documentos longos que exigem análise de texto completo e coerência de longo alcance, com lógica fluida e suporte a citações diversas em discussões complexas.",
"pro-deepseek-r1.description": "Modelo de serviço dedicado para empresas com concorrência agrupada.",
"pro-deepseek-v3.description": "Modelo de serviço dedicado para empresas com concorrência agrupada.",
"qianfan-70b.description": "Qianfan 70B é um modelo chinês de grande porte para geração de alta qualidade e raciocínio complexo.",
"qianfan-8b.description": "Qianfan 8B é um modelo geral de porte médio que equilibra custo e qualidade para geração de texto e perguntas e respostas.",
"qianfan-agent-intent-32k.description": "Qianfan Agent Intent 32K é voltado para reconhecimento de intenção e orquestração de agentes com suporte a contexto longo.",
"qianfan-agent-lite-8k.description": "Qianfan Agent Lite 8K é um modelo de agente leve para diálogos de múltiplas voltas e fluxos de trabalho de baixo custo.",
"qianfan-check-vl.description": "Qianfan Check VL é um modelo de revisão de conteúdo multimodal para conformidade e reconhecimento de imagem-texto.",
"qianfan-composition.description": "Qianfan Composition é um modelo de criação multimodal para compreensão e geração mista de imagem e texto.",
"qianfan-engcard-vl.description": "Qianfan EngCard VL é um modelo de reconhecimento multimodal focado em cenários em inglês.",
"qianfan-multipicocr.description": "Qianfan MultiPicOCR é um modelo de OCR para múltiplas imagens, detectando e reconhecendo texto em várias imagens.",
"qianfan-qi-vl.description": "Qianfan QI VL é um modelo de perguntas e respostas multimodal para recuperação precisa e respostas em cenários complexos de imagem e texto.",
"qianfan-singlepicocr.description": "Qianfan SinglePicOCR é um modelo de OCR para imagem única com reconhecimento de caracteres de alta precisão.",
"qianfan-vl-70b.description": "Qianfan VL 70B é um grande modelo de linguagem visual para compreensão complexa de imagem e texto.",
"qianfan-vl-8b.description": "Qianfan VL 8B é um modelo leve de linguagem visual para perguntas e respostas e análise de imagem e texto no dia a dia.",
"qvq-72b-preview.description": "QVQ-72B-Preview é um modelo experimental da Qwen focado em aprimorar o raciocínio visual.",
"qvq-max.description": "O modelo de raciocínio visual Qwen QVQ aceita entrada visual e gera saídas com cadeia de raciocínio, com desempenho superior em matemática, programação, análise visual, criatividade e tarefas gerais.",
"qvq-plus.description": "Modelo de raciocínio visual com entrada de imagem e saída com cadeia de raciocínio. A série qvq-plus sucede a qvq-max, oferecendo raciocínio mais rápido com melhor equilíbrio entre qualidade e custo.",
"qwen-coder-plus.description": "Modelo de código Qwen.",
"qwen-coder-turbo-latest.description": "Modelo de código Qwen.",
"qwen-coder-turbo.description": "Modelo de código Qwen.",
"qwen-flash.description": "Modelo Qwen mais rápido e de menor custo, ideal para tarefas simples.",
"qwen-image-2.0-pro-2026-04-22.description": "A versão completa da série Qwen-Image-2.0 integra geração e edição de imagens em uma única capacidade. Suporta renderização de texto mais profissional com capacidade de instrução de até 1k tokens, produz texturas visuais mais detalhadas e realistas, permite representação refinada de cenas reais e apresenta maior alinhamento semântico com os prompts. É a versão com melhor renderização de texto e maior realismo dentro da série 2.0.",
"qwen-image-2.0-pro.description": "O modelo completo da série Qwen-Image-2.0 integra geração e edição de imagens em uma capacidade unificada. Ele suporta renderização de texto mais profissional com capacidade de instrução de até 1k tokens, oferece texturas visuais mais delicadas e realistas, possibilita descrições detalhadas de cenas realistas e demonstra um alinhamento semântico mais forte com os prompts. O modelo completo proporciona a capacidade de renderização de texto mais avançada e o mais alto nível de realismo dentro da série 2.0.",
"qwen-image-2.0.description": "O modelo acelerado da série Qwen-Image-2.0 integra geração e edição de imagens em uma capacidade unificada. Ele suporta renderização de texto mais profissional com capacidade de instrução de até 1k tokens, oferece texturas visuais mais refinadas e realistas, possibilita descrições detalhadas de cenas realistas e demonstra uma aderência semântica mais forte aos prompts. A versão acelerada alcança de forma eficaz o equilíbrio ideal entre qualidade e desempenho do modelo.",
"qwen-image-edit-max.description": "O Modelo de Edição de Imagens Qwen suporta entrada e saída de múltiplas imagens, permitindo edição precisa de texto em imagens, adição, remoção ou realocação de objetos, modificação de ações de sujeitos, transferência de estilo de imagem e detalhes visuais aprimorados.",
"qwen-image-edit-plus.description": "O Modelo de Edição de Imagens Qwen suporta entrada e saída de múltiplas imagens, permitindo edição precisa de texto em imagens, adição, remoção ou realocação de objetos, modificação de ações de sujeitos, transferência de estilo de imagem e detalhes visuais aprimorados.",
"qwen-image-edit.description": "Qwen Image Edit é um modelo de imagem para imagem que edita imagens com base em imagens de entrada e comandos de texto, permitindo ajustes precisos e transformações criativas.",
"qwen-image-max.description": "O Modelo de Geração de Imagens Qwen (série Max) oferece maior realismo e naturalidade visual em comparação com a série Plus, reduzindo efetivamente artefatos gerados por IA e demonstrando desempenho excepcional em aparência humana, detalhes de textura e renderização de texto.",
"qwen-image-plus.description": "Suporta uma ampla gama de estilos artísticos e é particularmente proficiente em renderizar texto complexo dentro de imagens, permitindo design integrado de layout imagem-texto.",
"qwen-image.description": "Qwen-Image é um modelo geral de geração de imagens que suporta múltiplos estilos artísticos e renderização complexa de texto, especialmente em chinês e inglês. Suporta layouts em várias linhas, texto em nível de parágrafo e detalhes refinados para composições complexas de texto e imagem.",
"qwen-long.description": "Modelo Qwen ultra-grande com contexto longo e suporte a chat em cenários com múltiplos documentos.",
"qwen-math-plus-latest.description": "Qwen Math é um modelo de linguagem especializado na resolução de problemas matemáticos.",
"qwen-math-plus.description": "Qwen Math é um modelo de linguagem especializado na resolução de problemas matemáticos.",
"qwen-math-turbo-latest.description": "Qwen Math é um modelo de linguagem especializado na resolução de problemas matemáticos.",
"qwen-math-turbo.description": "Qwen Math é um modelo de linguagem especializado na resolução de problemas matemáticos.",
"qwen-max.description": "Modelo Qwen ultra-grande com escala de centenas de bilhões, com suporte a chinês, inglês e outros idiomas; é o modelo de API por trás dos produtos Qwen2.5 atuais.",
"qwen-omni-turbo.description": "Os modelos Qwen-Omni aceitam entradas multimodais (vídeo, áudio, imagens, texto) e geram saídas em áudio e texto.",
"qwen-plus.description": "Modelo Qwen ultra-grande aprimorado com suporte a chinês, inglês e outros idiomas.",
"qwen-turbo.description": "Qwen Turbo não será mais atualizado; substitua pelo Qwen Flash. Modelo Qwen ultra-grande com suporte a chinês, inglês e outros idiomas.",
"qwen-vl-chat-v1.description": "Qwen VL permite interações flexíveis, incluindo entrada com múltiplas imagens, perguntas e respostas em múltiplas etapas e tarefas criativas.",
"qwen-vl-max-latest.description": "Modelo Qwen de visão e linguagem ultra-grande. Em comparação com a versão aprimorada, melhora ainda mais o raciocínio visual e o seguimento de instruções para percepção e cognição mais fortes.",
"qwen-vl-max.description": "Modelo Qwen de visão e linguagem ultra-grande. Em comparação com a versão aprimorada, melhora ainda mais o raciocínio visual e o seguimento de instruções para percepção visual e cognição mais fortes.",
"qwen-vl-ocr.description": "Qwen OCR é um modelo de extração de texto para documentos, tabelas, imagens de exames e escrita manual. Suporta chinês, inglês, francês, japonês, coreano, alemão, russo, italiano, vietnamita e árabe.",
"qwen-vl-plus-latest.description": "Modelo Qwen de visão e linguagem em larga escala aprimorado, com grandes avanços em reconhecimento de detalhes e texto, suportando resolução acima de um megapixel e proporções arbitrárias.",
"qwen-vl-plus.description": "Modelo Qwen de visão e linguagem em larga escala aprimorado, com grandes avanços em reconhecimento de detalhes e texto, suportando resolução acima de um megapixel e proporções arbitrárias.",
"qwen-vl-v1.description": "Modelo pré-treinado inicializado a partir do Qwen-7B com módulo de visão adicionado e entrada de imagem com resolução de 448.",
"qwen/qwen-2-7b-instruct.description": "Qwen2 é a nova série de LLMs da Qwen. Qwen2 7B é um modelo baseado em transformador que se destaca em compreensão de linguagem, capacidade multilíngue, programação, matemática e raciocínio.",
"qwen/qwen-2-vl-72b-instruct.description": "Qwen2-VL é a iteração mais recente do Qwen-VL, atingindo desempenho de ponta em benchmarks de visão como MathVista, DocVQA, RealWorldQA e MTVQA. Compreende mais de 20 minutos de vídeo para perguntas e respostas, diálogos e criação de conteúdo de alta qualidade. Também lida com raciocínio complexo e tomada de decisão, integrando-se a dispositivos móveis e robôs para agir com base em contexto visual e instruções de texto. Além do inglês e chinês, também lê texto em imagens em diversos idiomas, incluindo a maioria das línguas europeias, japonês, coreano, árabe e vietnamita.",
"qwen/qwen-2.5-72b-instruct.description": "Qwen2.5-72B-Instruct é um dos lançamentos mais recentes de LLMs da Alibaba Cloud. O modelo de 72B traz melhorias notáveis em programação e matemática, suporta mais de 29 idiomas (incluindo chinês e inglês) e melhora significativamente o seguimento de instruções, compreensão de dados estruturados e geração de saídas estruturadas (especialmente JSON).",
"qwen/qwen2.5-32b-instruct.description": "Qwen2.5-32B-Instruct é um dos lançamentos mais recentes de LLMs da Alibaba Cloud. O modelo de 32B traz melhorias notáveis em programação e matemática, suporta mais de 29 idiomas (incluindo chinês e inglês) e melhora significativamente o seguimento de instruções, compreensão de dados estruturados e geração de saídas estruturadas (especialmente JSON).",
"qwen/qwen3-14b.description": "Qwen3-14B é a variante de 14B para raciocínio geral e cenários de chat.",
"qwen/qwen3-235b-a22b-2507.description": "Qwen3-235B-A22B-Instruct-2507 é a variante Instruct da série Qwen3, equilibrando uso multilíngue com cenários de contexto longo.",
"qwen/qwen3-235b-a22b-thinking-2507.description": "Qwen3-235B-A22B-Thinking-2507 é a variante de raciocínio da Qwen3, reforçada para tarefas complexas de matemática e raciocínio.",
"qwen/qwen3-235b-a22b.description": "Qwen3-235B-A22B é um modelo MoE com 235B parâmetros da Qwen, com 22B ativos por passagem. Alterna entre modo de pensamento para raciocínio complexo, matemática e código, e modo não-pensante para chat eficiente. Oferece raciocínio forte, suporte multilíngue (100+ idiomas/dialetos), seguimento avançado de instruções e uso de ferramentas de agentes. Suporta nativamente contexto de 32K e escala até 131K com YaRN.",
"qwen/qwen3-30b-a3b.description": "Qwen3 é a mais recente geração de modelos LLM da série Qwen, com arquiteturas densas e MoE, destacando-se em raciocínio, suporte multilíngue e tarefas avançadas de agentes. Sua capacidade única de alternar entre um modo de pensamento para raciocínio complexo e um modo sem pensamento para conversas eficientes garante desempenho versátil e de alta qualidade.\n\nQwen3 supera significativamente modelos anteriores como QwQ e Qwen2.5, oferecendo excelente desempenho em matemática, programação, raciocínio lógico, escrita criativa e conversas interativas. A variante Qwen3-30B-A3B possui 30,5 bilhões de parâmetros (3,3 bilhões ativos), 48 camadas, 128 especialistas (8 ativos por tarefa) e suporta até 131 mil tokens de contexto com YaRN, estabelecendo um novo padrão para modelos abertos.",
"qwen/qwen3-32b.description": "Qwen3-32B é um modelo LLM denso com 32,8 bilhões de parâmetros, otimizado para raciocínio complexo e conversas eficientes. Alterna entre um modo de pensamento para matemática, programação e lógica, e um modo sem pensamento para conversas gerais mais rápidas. Apresenta forte desempenho em seguir instruções, uso de ferramentas por agentes e escrita criativa em mais de 100 idiomas e dialetos. Suporta nativamente 32 mil tokens de contexto e escala até 131 mil com YaRN.",
"qwen/qwen3-coder-plus.description": "Qwen3-Coder-Plus é um modelo da série Qwen voltado para programação, otimizado para uso de ferramentas mais complexas e sessões prolongadas.",
"qwen/qwen3-coder.description": "Qwen3-Coder é a família de modelos de geração de código da série Qwen3, com forte capacidade de compreensão e geração de código em documentos longos.",
"qwen/qwen3-max-preview.description": "Qwen3 Max (prévia) é a variante Max para raciocínio avançado e integração com ferramentas.",
"qwen/qwen3-max.description": "Qwen3 Max é o modelo de raciocínio de alto desempenho da série Qwen3, voltado para raciocínio multilíngue e integração com ferramentas.",
"qwen/qwen3-vl-plus.description": "Qwen3 VL-Plus é a variante da série Qwen3 com aprimoramento visual, oferecendo raciocínio multimodal avançado e processamento de vídeo.",
"qwen2.5-14b-instruct-1m.description": "Qwen2.5 modelo open-source com 72 bilhões de parâmetros.",
"qwen2.5-14b-instruct.description": "Qwen2.5 modelo open-source com 14 bilhões de parâmetros.",
"qwen2.5-32b-instruct.description": "Qwen2.5 modelo open-source com 32 bilhões de parâmetros.",
"qwen2.5-72b-instruct.description": "Qwen2.5 modelo open-source com 72 bilhões de parâmetros.",
"qwen2.5-7b-instruct.description": "Modelo Qwen2.5 de código aberto com 7B de parâmetros.",
"qwen2.5-coder-1.5b-instruct.description": "Modelo de código Qwen open-source.",
"qwen2.5-coder-14b-instruct.description": "Modelo de código Qwen open-source.",
"qwen2.5-coder-32b-instruct.description": "Modelo de código Qwen open-source.",
"qwen2.5-coder-7b-instruct.description": "Modelo de código Qwen open-source.",
"qwen2.5-coder-instruct.description": "Qwen2.5-Coder é o mais recente modelo LLM focado em código da família Qwen (anteriormente CodeQwen).",
"qwen2.5-instruct.description": "Qwen2.5 é a mais recente série de modelos LLM da Qwen, com modelos base e ajustados por instrução variando de 0,5B a 72B parâmetros.",
"qwen2.5-math-1.5b-instruct.description": "Qwen-Math oferece forte capacidade de resolução de problemas matemáticos.",
"qwen2.5-math-72b-instruct.description": "Qwen-Math oferece forte capacidade de resolução de problemas matemáticos.",
"qwen2.5-math-7b-instruct.description": "Qwen-Math oferece forte capacidade de resolução de problemas matemáticos.",
"qwen2.5-omni-7b.description": "Modelos Qwen-Omni suportam entradas multimodais (vídeo, áudio, imagens, texto) e geram saídas em áudio e texto.",
"qwen2.5-vl-32b-instruct.description": "Modelo da série Qwen2.5VL que alcança desempenho próximo ao Qwen2.5VL-72B em matemática e perguntas objetivas. O estilo de resposta é ajustado para preferência humana, especialmente para consultas objetivas como matemática, raciocínio lógico e perguntas de conhecimento, com saídas mais claras e detalhadas. Esta é a versão de 32B.",
"qwen2.5-vl-72b-instruct.description": "Melhorias em seguir instruções, matemática, resolução de problemas e programação, com reconhecimento geral de objetos mais robusto. Suporta localização precisa de elementos visuais em diversos formatos, compreensão de vídeos longos (até 10 minutos) com temporização de eventos em nível de segundo, ordenação temporal e compreensão de velocidade, além de agentes que podem controlar sistemas operacionais ou dispositivos móveis via análise e localização. Forte extração de informações-chave e saída em JSON. Esta é a versão 72B, a mais poderosa da série.",
"qwen2.5-vl-7b-instruct.description": "Melhorias no seguimento de instruções, matemática, resolução de problemas e codificação, com reconhecimento geral de objetos mais forte. Suporta localização precisa de elementos visuais em vários formatos, compreensão de vídeos longos (até 10 minutos) com temporização de eventos em nível de segundo, ordenação temporal e compreensão de velocidade, além de agentes que podem controlar sistemas operacionais ou dispositivos móveis por meio de análise e localização. Extração de informações-chave robusta e saída em JSON. Esta é a versão mais forte da série, com 72B.",
"qwen2.5-vl-instruct.description": "Qwen2.5-VL é o mais recente modelo de linguagem e visão da família Qwen.",
"qwen2.5.description": "Qwen2.5 é o modelo de linguagem de próxima geração da Alibaba, com desempenho robusto em diversos casos de uso.",
"qwen2.5:0.5b.description": "Qwen2.5 é o modelo de linguagem de próxima geração da Alibaba, com desempenho robusto em diversos casos de uso.",
"qwen2.5:1.5b.description": "Qwen2.5 é o modelo de linguagem de próxima geração da Alibaba, com desempenho robusto em diversos casos de uso.",
"qwen2.5:72b.description": "Qwen2.5 é o modelo de linguagem de próxima geração da Alibaba, com desempenho robusto em diversos casos de uso.",
"qwen2.description": "Qwen2 é o modelo de linguagem de próxima geração da Alibaba, com desempenho robusto em diversos casos de uso.",
"qwen2:0.5b.description": "Qwen2 é o modelo de linguagem de próxima geração da Alibaba, com desempenho robusto em diversos casos de uso.",
"qwen2:1.5b.description": "Qwen2 é o modelo de linguagem de próxima geração da Alibaba, com desempenho robusto em diversos casos de uso.",
"qwen2:72b.description": "Qwen2 é o modelo de linguagem de próxima geração da Alibaba, com desempenho robusto em diversos casos de uso.",
"qwen3-0.6b.description": "Qwen3 é um modelo Tongyi Qwen de próxima geração com grandes avanços em raciocínio, habilidade geral, capacidades de agente e desempenho multilíngue, e suporta alternância de modos de pensamento.",
"qwen3-1.7b.description": "Qwen3 é um modelo Tongyi Qwen de próxima geração com grandes avanços em raciocínio, habilidade geral, capacidades de agente e desempenho multilíngue, e suporta alternância de modos de pensamento.",
"qwen3-14b.description": "Qwen3 14B é um modelo de porte médio para perguntas e respostas multilíngues e geração de texto.",
"qwen3-235b-a22b-instruct-2507.description": "Qwen3 235B A22B Instruct 2507 é um modelo de instrução de ponta para uma ampla gama de tarefas de geração e raciocínio.",
"qwen3-235b-a22b-thinking-2507.description": "Qwen3 235B A22B Thinking 2507 é um modelo de raciocínio ultra grande para tarefas complexas.",
"qwen3-235b-a22b.description": "Qwen3 é a nova geração do modelo Tongyi Qwen, com grandes avanços em raciocínio, capacidade geral, habilidades de agente e desempenho multilíngue, além de suporte à alternância de modos de raciocínio.",
"qwen3-30b-a3b-instruct-2507.description": "Qwen3 30B A3B Instruct 2507 é um modelo de instrução de porte médio-grande para geração de alta qualidade e perguntas e respostas.",
"qwen3-30b-a3b-thinking-2507.description": "Qwen3 30B A3B Thinking 2507 é um modelo de raciocínio de porte médio-grande que equilibra precisão e custo.",
"qwen3-30b-a3b.description": "Qwen3 30B A3B é um modelo geral de porte médio-grande que equilibra custo e qualidade.",
"qwen3-32b.description": "Qwen3 32B é adequado para tarefas gerais que exigem maior capacidade de compreensão.",
"qwen3-4b.description": "Qwen3 é um modelo Tongyi Qwen de próxima geração com grandes avanços em raciocínio, habilidade geral, capacidades de agente e desempenho multilíngue, e suporta alternância de modos de pensamento.",
"qwen3-8b.description": "Qwen3 8B é um modelo leve com implantação flexível para cargas de trabalho com alta concorrência.",
"qwen3-coder-30b-a3b-instruct.description": "Modelo de código Qwen de código aberto. O qwen3-coder-30b-a3b-instruct mais recente é baseado no Qwen3 e oferece fortes habilidades de agente de codificação, uso de ferramentas e interação com o ambiente para programação autônoma, com excelente desempenho de código e sólida capacidade geral.",
"qwen3-coder-480b-a35b-instruct.description": "Qwen3 Coder 480B A35B Instruct é um modelo de código de ponta para programação multilíngue e compreensão de código complexa.",
"qwen3-coder-flash.description": "Modelo de código Qwen. A série Qwen3-Coder mais recente é baseada no Qwen3 e oferece fortes habilidades de agente de codificação, uso de ferramentas e interação com o ambiente para programação autônoma, com excelente desempenho de código e sólida capacidade geral.",
"qwen3-coder-next.description": "Próxima geração do codificador Qwen otimizado para geração de código complexo em múltiplos arquivos, depuração e fluxos de trabalho de agentes de alta produtividade. Projetado para forte integração de ferramentas e desempenho de raciocínio aprimorado.",
"qwen3-coder-plus.description": "Modelo de código Qwen. A série Qwen3-Coder mais recente é baseada no Qwen3 e oferece fortes habilidades de agente de codificação, uso de ferramentas e interação com o ambiente para programação autônoma, com excelente desempenho de código e sólida capacidade geral.",
"qwen3-coder:480b.description": "Modelo de alto desempenho da Alibaba com suporte a contexto longo para tarefas de agente e codificação.",
"qwen3-max-2026-01-23.description": "Qwen3 Max: Modelo Qwen de melhor desempenho para tarefas complexas e de múltiplas etapas de programação com suporte a pensamento.",
"qwen3-max-preview.description": "Modelo Qwen com melhor desempenho para tarefas complexas e de múltiplas etapas. A prévia oferece suporte a raciocínio.",
"qwen3-max.description": "Os modelos Qwen3 Max apresentam grandes avanços em relação à série 2.5 em capacidade geral, compreensão de chinês/inglês, seguimento de instruções complexas, tarefas subjetivas abertas, capacidade multilíngue e uso de ferramentas, com menos alucinações. O qwen3-max mais recente melhora a programação agente e o uso de ferramentas em relação ao qwen3-max-preview. Esta versão atinge o estado da arte e atende a necessidades mais complexas de agentes.",
"qwen3-next-80b-a3b-instruct.description": "Modelo Qwen3 de próxima geração, de código aberto e sem raciocínio. Em comparação com a versão anterior (Qwen3-235B-A22B-Instruct-2507), possui melhor compreensão do chinês, raciocínio lógico mais forte e geração de texto aprimorada.",
"qwen3-next-80b-a3b-thinking.description": "Qwen3 Next 80B A3B Thinking é a versão de raciocínio de ponta para tarefas complexas.",
"qwen3-omni-flash.description": "O Qwen3-Omni-Flash é um modelo multimodal de grande porte baseado em uma arquitetura ThinkerTalker Mixture-of-Experts (MoE). Ele suporta compreensão eficiente de texto, imagens, áudio e vídeo, além de capacidades de geração de fala. O modelo permite interação baseada em texto em 119 idiomas e interação por voz em 20 idiomas, produzindo fala semelhante à humana para comunicação precisa entre idiomas. Apresenta fortes capacidades de seguir instruções e suporta prompts de sistema personalizáveis, permitindo adaptação flexível a diferentes estilos de conversação e configurações de papéis. É amplamente aplicável em cenários como criação de texto, assistentes de voz e análise multimídia, oferecendo uma experiência de interação multimodal natural e fluida.",
"qwen3-vl-235b-a22b-instruct.description": "Qwen3 VL 235B A22B Instruct é um modelo multimodal de ponta para compreensão e criação exigentes.",
"qwen3-vl-235b-a22b-thinking.description": "Qwen3 VL 235B A22B Thinking é a versão de raciocínio de ponta para planejamento e raciocínio multimodal complexos.",
"qwen3-vl-30b-a3b-instruct.description": "Qwen3 VL 30B A3B Instruct é um modelo multimodal de grande porte que equilibra precisão e desempenho de raciocínio.",
"qwen3-vl-30b-a3b-thinking.description": "Qwen3 VL 30B A3B Thinking é uma versão de raciocínio profundo para tarefas multimodais complexas.",
"qwen3-vl-32b-instruct.description": "Qwen3 VL 32B Instruct é um modelo multimodal ajustado por instruções para perguntas e respostas imagem-texto de alta qualidade e criação.",
"qwen3-vl-32b-thinking.description": "Qwen3 VL 32B Thinking é uma versão multimodal de raciocínio profundo para análise complexa e em cadeia.",
"qwen3-vl-8b-instruct.description": "Qwen3 VL 8B Instruct é um modelo multimodal leve para perguntas e respostas visuais do dia a dia e integração com aplicativos.",
"qwen3-vl-8b-thinking.description": "Qwen3 VL 8B Thinking é um modelo multimodal com raciocínio em cadeia para raciocínio visual detalhado.",
"qwen3-vl-flash.description": "Qwen3 VL Flash: versão leve e de raciocínio rápido para solicitações com baixa latência ou alto volume.",
"qwen3-vl-plus.description": "Qwen VL é um modelo de geração de texto com compreensão visual. Pode realizar OCR, além de resumir e raciocinar, como extrair atributos de fotos de produtos ou resolver problemas a partir de imagens.",
"qwen3.5-122b-a10b.description": "Suporta entradas de texto, imagem e vídeo. Para tarefas exclusivamente de texto, seu desempenho é comparável ao Qwen3 Max, oferecendo maior eficiência e menor custo. Em capacidades multimodais, apresenta melhorias significativas em relação à série Qwen3 VL.",
"qwen3.5-27b.description": "Suporta entradas de texto, imagem e vídeo. Para tarefas exclusivamente de texto, seu desempenho é comparável ao Qwen3 Max, oferecendo maior eficiência e menor custo. Em capacidades multimodais, apresenta melhorias significativas em relação à série Qwen3 VL.",
"qwen3.5-35b-a3b.description": "Suporta entradas de texto, imagem e vídeo. Para tarefas exclusivamente de texto, seu desempenho é comparável ao Qwen3 Max, oferecendo maior eficiência e menor custo. Em capacidades multimodais, apresenta melhorias significativas em relação à série Qwen3 VL.",
"qwen3.5-397b-a17b.description": "Suporta entradas de texto, imagem e vídeo. Para tarefas apenas de texto, seu desempenho é comparável ao Qwen3 Max, oferecendo maior eficiência e menor custo. Em capacidades multimodais, oferece melhorias significativas em relação à série Qwen3 VL.",
"qwen3.5-flash.description": "O modelo nativo visão-linguagem Qwen3.5 Flash é construído sobre uma arquitetura híbrida que combina um mecanismo de atenção linear com um design esparso Mixture-of-Experts (MoE), alcançando maior eficiência de inferência. Em comparação com a série 3, apresenta melhorias substanciais tanto em desempenho de texto puro quanto em multimodalidade. Também oferece tempos de resposta rápidos, equilibrando velocidade de inferência e capacidade geral.",
"qwen3.5-omni-flash.description": "O Qwen3.5 Omni Flash é um modelo Qwen completo, rápido e econômico, que suporta entrada de texto, imagem e vídeo.",
"qwen3.5-omni-plus.description": "O Qwen3.5 Omni Plus suporta entrada de texto, imagem e vídeo. É o mais recente modelo Qwen completo para compreensão e geração multimodal de alta qualidade.",
"qwen3.5-plus-2026-04-20.description": "Qwen 3.5 é um modelo Plus nativamente multimodal. Em comparação ao snapshot de 15 de fevereiro, esta versão apresenta melhorias substanciais em capacidades agentivas de programação e velocidade de inferência significativamente maior. Suas capacidades de conhecimento, raciocínio e longo contexto permanecem em nível elevado, atendendo a tarefas agentivas complexas. Esta versão corresponde ao snapshot de 20 de abril de 2026.",
"qwen3.5-plus.description": "Qwen3.5 Plus suporta entrada de texto, imagem e vídeo. Seu desempenho em tarefas puramente textuais é comparável ao Qwen3 Max, com melhor desempenho e menor custo. Suas capacidades multimodais são significativamente aprimoradas em comparação com a série Qwen3 VL.",
"qwen3.5:397b.description": "Qwen3.5 é um modelo de base unificada visão-linguagem com uma arquitetura híbrida (Mixture-of-Experts + atenção linear), oferecendo forte raciocínio multimodal, codificação e capacidades de longo contexto com uma janela de contexto de 256K.",
"qwen3.6-27b.description": "Qwen3.6 27B é um modelo denso de código aberto com forte desempenho em raciocínio, codificação e capacidades gerais. Suporta o modo pensante por padrão, oferecendo desempenho e eficiência equilibrados.",
"qwen3.6-35b-a3b.description": "O modelo nativo visão-linguagem Qwen3.6 35B-A3B é baseado em uma arquitetura híbrida que integra um mecanismo de atenção linear com um design esparso Mixture-of-Experts (MoE), alcançando maior eficiência de inferência. Em comparação com o modelo 3.5-35B-A3B, apresenta melhorias significativas em codificação agentiva, raciocínio matemático, raciocínio sobre código, inteligência espacial, além de localização de objetos e detecção de alvos.",
"qwen3.6-flash.description": "O modelo nativo visão-linguagem Qwen3.6 Flash oferece desempenho significativamente aprimorado em comparação com a versão 3.5-Flash. Este modelo se concentra em aprimorar capacidades de codificação agentiva (superando amplamente seu antecessor em vários benchmarks de code-agents), além de melhorar o raciocínio matemático e o raciocínio sobre código. No aspecto visual, apresenta ganhos notáveis em inteligência espacial, com melhorias especialmente fortes em localização de objetos e detecção de alvos.",
"qwen3.6-max-preview.description": "O maior modelo de código fechado da série Qwen3.6. Ele oferece conhecimento de mundo mais robusto, melhor seguimento de instruções e desempenho aprimorado em codificação agentiva para tarefas complexas. É apenas texto, suporta modo de raciocínio por padrão, caching explícito e function calling.",
"qwen3.6-plus.description": "Qwen3.6 Plus suporta entrada de texto, imagem e vídeo. Ele oferece um desempenho equilibrado entre qualidade, velocidade e custo. Suas capacidades multimodais são significativamente aprimoradas em comparação com a série Qwen3 VL.",
"qwen3.7-max.description": "Qwen3.7 Max é o modelo principal onipotente da era dos agentes de IA, oferecendo capacidades abrangentes em compreensão de texto, imagem e vídeo. Ele fornece desempenho superior em raciocínio, chamadas de função e execução de tarefas de agentes.",
"qwen3.7-plus.description": "Qwen3.7 Plus é um modelo híbrido interativo multimodal de agente, construído sobre as capacidades de texto da série Qwen3.7 para unificar visão e linguagem. Ele se destaca em operação GUI, codificação visual e fluxos de trabalho complexos de agentes.",
"qwen3.description": "Qwen3 é o modelo de linguagem de próxima geração da Alibaba com desempenho robusto em diversos casos de uso.",
"qwq-32b-preview.description": "QwQ é um modelo de pesquisa experimental da Qwen focado em raciocínio aprimorado.",
"qwq-32b.description": "QwQ é um modelo de raciocínio da família Qwen. Em comparação com modelos ajustados por instruções padrão, oferece raciocínio e pensamento que aumentam significativamente o desempenho em tarefas complexas. O QwQ-32B é um modelo de raciocínio de porte médio que rivaliza com os principais modelos como DeepSeek-R1 e o1-mini.",
"qwq-plus.description": "O modelo de raciocínio QwQ treinado com base no Qwen2.5 usa aprendizado por reforço (RL) para melhorar significativamente o raciocínio. Métricas principais em matemática/código (AIME 24/25, LiveCodeBench) e benchmarks gerais (IFEval, LiveBench) atingem o nível completo do DeepSeek-R1.",
"qwq.description": "QwQ é um modelo de raciocínio da família Qwen. Em comparação com modelos ajustados por instruções padrão, oferece habilidades de pensamento e raciocínio que melhoram significativamente o desempenho em tarefas difíceis. O QwQ-32B é um modelo de porte médio que compete com os principais modelos como DeepSeek-R1 e o1-mini.",
"qwq_32b.description": "Modelo de raciocínio de porte médio da família Qwen. Em comparação com modelos ajustados por instruções padrão, as habilidades de pensamento e raciocínio do QwQ aumentam significativamente o desempenho em tarefas difíceis.",
"r1-1776.description": "R1-1776 é uma variante pós-treinada do DeepSeek R1 projetada para fornecer informações factuais sem censura e imparciais.",
"seedance-1-5-pro-251215.description": "Seedance 1.5 Pro da ByteDance suporta texto para vídeo, imagem para vídeo (primeiro quadro, primeiro+último quadro) e geração de áudio sincronizado com visuais.",
"seedream-5-0-260128.description": "ByteDance-Seedream-5.0-lite da BytePlus apresenta geração aumentada por recuperação na web para informações em tempo real, interpretação aprimorada de prompts complexos e consistência de referência melhorada para criação visual profissional.",
"sensenova-6.7-flash-lite.description": "Um modelo de agente multimodal leve projetado para fluxos de trabalho do mundo real, suportando conversas baseadas em texto e compreensão de imagens. Leve e eficiente, equilibrando desempenho, custo e capacidade de implantação. Arquitetura multimodal nativa com suporte para compreensão de imagens, incluindo OCR e interpretação de gráficos. Aprimorado para cenários de escritório e produtividade, com suporte estável para tarefas complexas de cadeia longa. Eficiência de tokens aprimorada, permitindo melhor controle de custos para cargas de trabalho complexas. Comprimento de contexto de 256K tokens (entrada máxima: 252K, saída máxima: 64K).",
"sensenova-u1-fast.description": "Uma versão acelerada baseada no SenseNova U1, especificamente otimizada para geração de infográficos.",
"solar-mini-ja.description": "Solar Mini (Ja) estende o Solar Mini com foco no japonês, mantendo desempenho eficiente e forte em inglês e coreano.",
"solar-mini.description": "Solar Mini é um LLM compacto que supera o GPT-3.5, com forte capacidade multilíngue suportando inglês e coreano, oferecendo uma solução eficiente e de baixo custo.",
"solar-pro.description": "Solar Pro é um LLM de alta inteligência da Upstage, focado em seguir instruções em uma única GPU, com pontuações IFEval acima de 80. Atualmente suporta inglês; o lançamento completo está previsto para novembro de 2024 com suporte expandido a idiomas e contexto mais longo.",
"sonar-deep-research.description": "Deep Research realiza pesquisas abrangentes em nível de especialista e as sintetiza em relatórios acessíveis e acionáveis.",
"sonar-pro.description": "Produto de busca avançada com fundamentação de pesquisa para consultas complexas e seguimentos.",
"sonar-reasoning-pro.description": "Produto de busca avançada com fundamentação de pesquisa para consultas complexas e seguimentos.",
"sonar-reasoning.description": "Produto de busca avançada com fundamentação de pesquisa para consultas complexas e seguimentos.",
"sonar.description": "Produto leve com fundamentação de busca, mais rápido e barato que o Sonar Pro.",
"sophnet/deepseek-v3.2.description": "DeepSeek V3.2 é um modelo que equilibra alta eficiência computacional com excelente desempenho de raciocínio e agentes.",
"sora-2-pro.description": "Sora 2 Pro é nosso modelo de geração de mídia mais avançado, gerando vídeos com áudio sincronizado. Pode criar clipes dinâmicos e ricamente detalhados a partir de linguagem natural ou imagens.",
"sora-2.description": "Sora 2 é nosso novo modelo poderoso de geração de mídia, gerando vídeos com áudio sincronizado. Pode criar clipes dinâmicos e ricamente detalhados a partir de linguagem natural ou imagens.",
"spark-x1.5.description": "Atualizações do X1.5: (1) adiciona modo de raciocínio dinâmico controlado pelo campo `thinking`; (2) maior comprimento de contexto com 64K de entrada e 64K de saída; (3) suporta FunctionCall.",
"spark-x2-flash.description": "Spark X2-Flash adota uma arquitetura MoE (Mixture of Experts) com 30 bilhões de parâmetros totais e suporta até uma janela de contexto de 256K. Ele apresenta melhorias significativas em capacidades de agência e codificação, e foi treinado em um cluster de processadores Ascend 910B AI.",
"spark-x2.description": "Visão geral das capacidades do X2: 1. Introduz ajuste dinâmico do modo de raciocínio, controlado via o campo `thinking`. 2. Comprimento de contexto expandido: 64K tokens de entrada e 128K tokens de saída. 3. Suporta funcionalidade de Function Call.",
"stable-diffusion-3-medium.description": "O mais recente modelo de texto para imagem da Stability AI. Esta versão melhora significativamente a qualidade da imagem, compreensão de texto e diversidade de estilo, interpretando comandos em linguagem natural complexa com mais precisão e gerando imagens mais precisas e diversas.",
"stable-diffusion-3.5-large-turbo.description": "Stable Diffusion 3.5 Large Turbo é focado em geração de imagens de alta qualidade, com forte renderização de detalhes e fidelidade de cena.",
"stable-diffusion-xl-base-1.0.description": "Um modelo de texto para imagem de código aberto da Stability AI com geração criativa de imagens líder na indústria. Possui forte compreensão de instruções e suporta definições de prompt reverso para geração precisa.",
"step-1-128k.description": "Equilibra desempenho e custo para cenários gerais.",
"step-1-256k.description": "Manipulação de contexto extra longo, ideal para análise de documentos extensos.",
"step-1-32k.description": "Suporta conversas de comprimento médio para uma ampla gama de cenários.",
"step-1-8k.description": "Modelo pequeno adequado para tarefas leves.",
"step-1-flash.description": "Modelo de alta velocidade adequado para chat em tempo real.",
"step-1.5v-mini.description": "Capacidades robustas de compreensão de vídeo.",
"step-1o-turbo-vision.description": "Compreensão de imagem avançada, superando o 1o em matemática e programação. Menor que o 1o e com saída mais rápida.",
"step-1o-vision-32k.description": "Compreensão de imagem avançada com desempenho visual superior à série Step-1V.",
"step-1v-32k.description": "Suporta entradas visuais para interações multimodais mais ricas.",
"step-1v-8k.description": "Modelo visual pequeno para tarefas básicas de imagem e texto.",
"step-1x-edit.description": "Este modelo foca em edição de imagens, modificando e aprimorando imagens com base em imagens e textos fornecidos pelo usuário. Suporta múltiplos formatos de entrada, incluindo descrições textuais e imagens de exemplo, gerando edições alinhadas à intenção do usuário.",
"step-1x-medium.description": "Este modelo oferece geração de imagens robusta a partir de prompts de texto. Com suporte nativo ao chinês, compreende melhor descrições nesse idioma, capturando sua semântica e convertendo-as em recursos visuais para uma geração mais precisa. Produz imagens de alta resolução e qualidade, com suporte a certo grau de transferência de estilo.",
"step-2-16k-exp.description": "Versão experimental do Step-2 com os recursos mais recentes e atualizações contínuas. Não recomendado para produção.",
"step-2-16k.description": "Suporta interações com contexto amplo para diálogos complexos.",
"step-2-mini.description": "Baseado na arquitetura de atenção MFA de próxima geração, oferece resultados semelhantes ao Step-1 com custo muito menor, maior rendimento e menor latência. Lida com tarefas gerais com forte capacidade de programação.",
"step-2x-large.description": "Modelo de imagem StepFun de nova geração focado em geração de imagens, produzindo imagens de alta qualidade a partir de prompts de texto. Oferece texturas mais realistas e melhor renderização de texto em chinês/inglês.",
"step-3.5-flash-2603.description": "Construído sobre o Step 3.5 Flash e otimizado para cenários agentivos de alta frequência, melhora ainda mais a eficiência de tokens e a velocidade de inferência, mantendo capacidades de raciocínio e uso de ferramentas em nível principal. Também suporta alternância para um modo de baixo raciocínio para reduzir consumo. Além disso, foram feitas otimizações direcionadas para melhorar compatibilidade com programação e frameworks agentivos.",
"step-3.5-flash.description": "O modelo de raciocínio linguístico carro-chefe da Stepfun. Este modelo possui capacidades de raciocínio de alto nível e execução rápida e confiável. Capaz de decompor e planejar tarefas complexas, chamar ferramentas de forma rápida e confiável para realizar tarefas, e ser competente em várias tarefas complexas, como raciocínio lógico, matemática, engenharia de software e pesquisa aprofundada.",
"step-3.7-flash.description": "O modelo principal de raciocínio multimodal da StepFun. Construído sobre as capacidades de raciocínio de alta velocidade e chamadas de ferramentas do step-3.5-flash, ele adiciona suporte nativo a entrada multimodal, permitindo compreensão direta de conteúdo de imagens e vídeos sem depender de MCPs visuais ou modelos de visão adicionais. O modelo suporta três níveis de raciocínio (baixo / médio / alto), tornando-o uma escolha rápida e confiável para fluxos de trabalho de agentes, tarefas de codificação e aplicações multimodais.",
"step-3.description": "Este modelo possui forte percepção visual e raciocínio complexo, lidando com precisão com compreensão de conhecimento entre domínios, análise cruzada de matemática e visão, e uma ampla gama de tarefas visuais do cotidiano.",
"step-image-edit-2.description": "Um modelo leve de edição da última iteração da Stepfun que suporta tanto geração de imagens a partir de texto quanto edição de imagens em um único modelo. Apesar de ter menos de 6 bilhões de parâmetros, alcança desempenho de ponta em sua escala, rivalizando com modelos de código aberto na faixa de 12B20B parâmetros em várias categorias. Cada tarefa de edição leva apenas 12 segundos, redefinindo a experiência de edição de imagens interativa em tempo real.",
"step-r1-v-mini.description": "Modelo de raciocínio com forte compreensão de imagem que pode processar imagens e textos, gerando texto após raciocínio profundo. Destaca-se em raciocínio visual e oferece desempenho de ponta em matemática, programação e raciocínio textual, com janela de contexto de 100K.",
"stepfun-ai/Step-3.5-Flash.description": "Step 3.5 Flash é o modelo de base de código aberto mais poderoso da StepFun, utilizando arquitetura esparsa Mixture of Experts (MoE) com 196B de parâmetros totais, apenas 11B de parâmetros ativos por token. O modelo suporta janela de contexto de 256K, alcançando throughput de geração de 100-300 tok/s por meio de Previsão Multi-Token de 3 vias (MTP-3). Excelente desempenho em tarefas de programação e agentes, verificado pelo SWE-bench com 74,4%.",
"taichu4_vl_2b_nothinking.description": "A versão Sem Pensamento do modelo Taichu4.0-VL 2B apresenta menor uso de memória, design leve, velocidade de resposta rápida e fortes capacidades de compreensão multimodal.",
"taichu4_vl_32b.description": "A versão Pensante do modelo Taichu4.0-VL 32B é adequada para tarefas complexas de compreensão e raciocínio multimodal, demonstrando desempenho excepcional em raciocínio matemático multimodal, capacidades de agentes multimodais e compreensão geral de imagens e visuais.",
"taichu4_vl_32b_nothinking.description": "A versão Sem Pensamento do modelo Taichu4.0-VL 32B é projetada para cenários complexos de compreensão de imagem e texto e perguntas e respostas de conhecimento visual, destacando-se em legendagem de imagens, perguntas e respostas visuais, compreensão de vídeos e tarefas de localização visual.",
"taichu4_vl_3b.description": "A versão Pensante do modelo Taichu4.0-VL 3B executa eficientemente tarefas de compreensão e raciocínio multimodal, com atualizações abrangentes em compreensão visual, localização visual, reconhecimento OCR e capacidades relacionadas.",
"taichu_llm.description": "O modelo de linguagem Zidong Taichu é um modelo de geração de texto de alto desempenho desenvolvido com tecnologias totalmente nacionais de pilha completa. Por meio de compressão estruturada de um modelo base de cem bilhões de parâmetros e otimização específica para tarefas, melhora significativamente a compreensão de texto complexo e as capacidades de raciocínio de conhecimento. Destaca-se em cenários como análise de documentos longos, extração de informações multilíngues e geração restrita por conhecimento.",
"taichu_llm_14b.description": "O modelo de linguagem Zidong Taichu é um modelo de geração de texto de alto desempenho desenvolvido com tecnologias totalmente nacionais de pilha completa. Por meio de compressão estruturada de um modelo base de cem bilhões de parâmetros e otimização específica para tarefas, melhora significativamente a compreensão de texto complexo e as capacidades de raciocínio de conhecimento. Destaca-se em cenários como análise de documentos longos, extração de informações multilíngues e geração restrita por conhecimento.",
"taichu_llm_2b.description": "O modelo de linguagem Zidong Taichu é um modelo de geração de texto de alto desempenho desenvolvido com tecnologias totalmente nacionais de pilha completa. Por meio de compressão estruturada de um modelo base de cem bilhões de parâmetros e otimização específica para tarefas, melhora significativamente a compreensão de texto complexo e as capacidades de raciocínio de conhecimento. Destaca-se em cenários como análise de documentos longos, extração de informações multilíngues e geração restrita por conhecimento.",
"taichu_o1.description": "taichu_o1 é um modelo de raciocínio de próxima geração que alcança uma cadeia de pensamento semelhante à humana por meio de interação multimodal e aprendizado por reforço. Suporta simulações de tomada de decisão complexas e, enquanto mantém saídas de alta precisão, revela caminhos de raciocínio interpretáveis. É bem adequado para análise estratégica, pensamento profundo e cenários semelhantes.",
"tencent/Hunyuan-A13B-Instruct.description": "Hunyuan-A13B-Instruct utiliza 80B de parâmetros totais com 13B ativos para igualar modelos maiores. Suporta raciocínio híbrido rápido/lento, compreensão estável de textos longos e desempenho líder em agentes nos benchmarks BFCL-v3 e τ-Bench. Formatos GQA e multi-quant permitem inferência eficiente.",
"tencent/Hunyuan-MT-7B.description": "O Modelo de Tradução Hunyuan inclui o Hunyuan-MT-7B e o conjunto Hunyuan-MT-Chimera. O Hunyuan-MT-7B é um modelo leve de tradução com 7B de parâmetros, suportando 33 idiomas e 5 línguas minoritárias chinesas. No WMT25, obteve 30 primeiros lugares em 31 pares de idiomas. A Hunyuan da Tencent utiliza um pipeline completo de pré-treinamento, SFT, RL de tradução e RL em conjunto, alcançando desempenho líder em seu porte com implantação eficiente e fácil.",
"text-embedding-3-large.description": "O modelo de embedding mais avançado para tarefas em inglês e outros idiomas.",
"text-embedding-3-small.description": "Modelo de embedding de próxima geração eficiente e econômico para recuperação e cenários RAG.",
"thudm/glm-4-32b.description": "GLM-4-32B-0414 é um modelo bilíngue (chinês/inglês) de 32B com pesos abertos, otimizado para geração de código, chamadas de função e tarefas de agente. Pré-treinado com 15T de dados de alta qualidade e foco em raciocínio, refinado com alinhamento de preferências humanas, amostragem de rejeição e RL. Destaca-se em raciocínio complexo, geração de artefatos e saída estruturada, alcançando desempenho comparável ao GPT-4o e DeepSeek-V3-0324 em múltiplos benchmarks.",
"thudm/glm-4-9b-chat.description": "Versão de código aberto do mais recente modelo pré-treinado GLM-4 da Zhipu AI.",
"togethercomputer/StripedHyena-Nous-7B.description": "StripedHyena Nous (7B) oferece maior eficiência computacional por meio de sua arquitetura e estratégia.",
"tts-1-hd.description": "O mais recente modelo de texto para fala otimizado para qualidade.",
"tts-1.description": "O mais recente modelo de texto para fala otimizado para velocidade em tempo real.",
"upstage/SOLAR-10.7B-Instruct-v1.0.description": "Upstage SOLAR Instruct v1 (11B) é ajustado para tarefas de instrução precisas com forte desempenho linguístico.",
"us.anthropic.claude-3-5-sonnet-20241022-v2:0.description": "Claude 3.5 Sonnet eleva o padrão da indústria, superando concorrentes e o Claude 3 Opus em avaliações amplas, mantendo velocidade e custo intermediários.",
"us.anthropic.claude-3-7-sonnet-20250219-v1:0.description": "Claude 3.7 Sonnet é o modelo de próxima geração mais rápido da Anthropic. Em comparação com o Claude 3 Haiku, apresenta melhorias em diversas habilidades e supera o modelo principal anterior Claude 3 Opus em muitos benchmarks de inteligência.",
"v0-1.0-md.description": "v0-1.0-md é um modelo legado disponibilizado via API v0.",
"v0-1.5-lg.description": "v0-1.5-lg é adequado para tarefas avançadas de pensamento ou raciocínio.",
"v0-1.5-md.description": "v0-1.5-md é adequado para tarefas cotidianas e geração de interfaces.",
"veo-2.0-generate-001.description": "Nosso modelo de geração de vídeo de última geração, disponível para desenvolvedores no nível pago da API Gemini.",
"veo-3.0-fast-generate-001.description": "Nosso modelo estável de geração de vídeo, disponível para desenvolvedores no nível pago da API Gemini.",
"veo-3.0-generate-001.description": "Nosso modelo estável de geração de vídeo, disponível para desenvolvedores no nível pago da API Gemini.",
"veo-3.1-fast-generate-preview.description": "Nosso modelo mais recente de geração de vídeo, disponível para desenvolvedores no nível pago da API Gemini.",
"veo-3.1-generate-preview.description": "Nosso modelo mais recente de geração de vídeo, disponível para desenvolvedores no nível pago da API Gemini.",
"vercel/v0-1.0-md.description": "Acesse os modelos por trás do v0 para gerar, corrigir e otimizar aplicativos web modernos com raciocínio específico de framework e conhecimento atualizado.",
"vercel/v0-1.5-md.description": "Acesse os modelos por trás do v0 para gerar, corrigir e otimizar aplicativos web modernos com raciocínio específico de framework e conhecimento atualizado.",
"vidu/viduq2-pro_img2video.description": "Insira uma imagem e uma descrição de texto para gerar vídeo. ViduQ2-Pro imagem-para-vídeo é o primeiro modelo de vídeo \"Tudo Pode Ser Referenciado\" do mundo. Suporta seis dimensões de referência—efeitos, expressões, texturas, ações, personagens e cenas—permitindo edição de vídeo totalmente evoluída. Por meio de adição, exclusão e modificação controláveis, alcança edição de vídeo em nível granular, projetado como um motor de criação em nível de produção para séries animadas, curtas dramáticos e produção cinematográfica.",
"vidu/viduq2-pro_reference2video.description": "Insira vídeos de referência, imagens e uma descrição de texto para gerar vídeo. ViduQ2-Pro referência-para-vídeo é o primeiro modelo de vídeo \"Tudo Pode Ser Referenciado\" do mundo. Suporta seis dimensões de referência—efeitos, expressões, texturas, ações, personagens e cenas—permitindo edição de vídeo totalmente evoluída. Por meio de adição, exclusão e modificação controláveis, alcança edição de vídeo em nível granular, projetado como um motor de criação em nível de produção para séries animadas, curtas dramáticos e produção cinematográfica.",
"vidu/viduq2-pro_start-end2video.description": "Insira as imagens do primeiro e último quadro junto com uma descrição de texto para gerar vídeo. ViduQ2-Pro quadro-chave-para-vídeo é o primeiro modelo de vídeo \"Tudo Pode Ser Referenciado\" do mundo. Suporta seis dimensões de referência—efeitos, expressões, texturas, ações, personagens e cenas—permitindo edição de vídeo totalmente evoluída. Por meio de adição, exclusão e modificação controláveis, alcança edição de vídeo em nível granular, projetado como um motor de criação em nível de produção para séries animadas, curtas dramáticos e produção cinematográfica.",
"vidu/viduq2-turbo_img2video.description": "Insira uma imagem e uma descrição de texto para gerar vídeo. ViduQ2-Turbo imagem-para-vídeo é um motor de geração ultrarrápido. Um vídeo de 5 segundos em 720P pode ser gerado em apenas 19 segundos, e um vídeo de 5 segundos em 1080P em cerca de 27 segundos. As ações e expressões dos personagens são naturais e realistas, entregando forte autenticidade e excelente desempenho em cenas de alta dinâmica, como sequências de ação, com ampla gama de movimentos.",
"vidu/viduq2-turbo_start-end2video.description": "Insira as imagens do primeiro e último quadro junto com uma descrição de texto para gerar vídeo. ViduQ2-Turbo quadro-chave-para-vídeo é um motor de geração ultrarrápido. Um vídeo de 5 segundos em 720P pode ser produzido em apenas 19 segundos, e um vídeo de 5 segundos em 1080P em cerca de 27 segundos. As ações e expressões dos personagens são naturais e realistas, com forte autenticidade, destacando-se em cenas de alta dinâmica, como sequências de ação, e suportando ampla gama de movimentos.",
"vidu/viduq2_reference2video.description": "Insira imagens de referência junto com uma descrição de texto para gerar vídeo. ViduQ2 referência-para-vídeo é um modelo projetado para aderência precisa a instruções e captura de emoções sutis. Oferece controle narrativo excepcional, interpretando e expressando com precisão mudanças de microexpressões; apresenta linguagem cinematográfica rica, movimentos de câmera suaves e forte tensão visual. Amplamente aplicável a filmes e animações, publicidade e e-commerce, curtas dramáticos e indústrias de turismo cultural.",
"vidu/viduq2_text2video.description": "Insira um prompt de texto para gerar vídeo. ViduQ2 texto-para-vídeo é um modelo projetado para aderência precisa a instruções e captura de emoções sutis. Oferece controle narrativo excepcional, interpretando e expressando com precisão mudanças de microexpressões; apresenta linguagem cinematográfica rica, movimentos de câmera suaves e forte tensão visual. Amplamente aplicável a filmes e animações, publicidade e e-commerce, curtas dramáticos e indústrias de turismo cultural.",
"vidu/viduq3-pro_img2video.description": "Insira uma imagem e uma descrição de texto para gerar vídeo. ViduQ3-Pro imagem-para-vídeo é um modelo nativo audiovisual em nível de carro-chefe. Suporta até 16 segundos de geração audiovisual sincronizada, permitindo troca livre de múltiplas tomadas enquanto controla com precisão o ritmo, emoção e continuidade narrativa. Com uma escala de parâmetros líder, entrega qualidade de imagem excepcional, consistência de personagens e expressão emocional, atendendo aos padrões cinematográficos. Ideal para cenários de produção profissional, como publicidade (e-commerce, TVC, campanhas de performance), séries animadas, dramas ao vivo e jogos.",
"vidu/viduq3-pro_start-end2video.description": "Insira as imagens do primeiro e último quadro junto com uma descrição de texto para gerar vídeo. ViduQ3-Pro quadro-chave-para-vídeo é um modelo nativo audiovisual em nível de carro-chefe. Suporta até 16 segundos de geração audiovisual sincronizada, permitindo troca livre de múltiplas tomadas enquanto controla com precisão o ritmo, emoção e continuidade narrativa. Com uma escala de parâmetros líder, entrega qualidade de imagem excepcional, consistência de personagens e expressão emocional, atendendo aos padrões cinematográficos. Ideal para cenários de produção profissional, como publicidade (e-commerce, TVC, campanhas de performance), séries animadas, dramas ao vivo e jogos.",
"vidu/viduq3-pro_text2video.description": "Insira um prompt de texto para gerar vídeo. ViduQ3-Pro texto-para-vídeo é um modelo nativo audiovisual em nível de carro-chefe. Suporta até 16 segundos de geração audiovisual sincronizada, permitindo troca livre de múltiplas tomadas enquanto controla com precisão o ritmo, emoção e continuidade narrativa. Com uma escala de parâmetros líder, entrega qualidade de imagem excepcional, consistência de personagens e expressão emocional, atendendo aos padrões cinematográficos. Ideal para cenários de produção profissional, como publicidade (e-commerce, TVC, campanhas de performance), séries animadas, dramas ao vivo e jogos.",
"vidu/viduq3-turbo_img2video.description": "Insira uma imagem e uma descrição de texto para gerar vídeo. ViduQ3-Turbo imagem-para-vídeo é um modelo acelerado de alto desempenho. Oferece geração extremamente rápida enquanto mantém visuais de alta qualidade e expressão dinâmica, destacando-se em cenas de ação, renderização emocional e compreensão semântica. Econômico e ideal para cenários de entretenimento casual, como imagens para redes sociais, companheiros de IA e ativos de efeitos especiais.",
"vidu/viduq3-turbo_start-end2video.description": "Insira as imagens do primeiro e último quadro junto com uma descrição de texto para gerar vídeo. ViduQ3-Turbo quadro-chave-para-vídeo é um modelo acelerado de alto desempenho. Oferece geração extremamente rápida enquanto mantém visuais de alta qualidade e expressão dinâmica, destacando-se em cenas de ação, renderização emocional e compreensão semântica. Econômico e ideal para cenários de entretenimento casual, como imagens para redes sociais, companheiros de IA e ativos de efeitos especiais.",
"vidu/viduq3-turbo_text2video.description": "Insira um prompt de texto para gerar vídeo. ViduQ3-Turbo texto-para-vídeo é um modelo acelerado de alto desempenho. Oferece geração extremamente rápida enquanto mantém visuais de alta qualidade e expressão dinâmica, destacando-se em cenas de ação, renderização emocional e compreensão semântica. Econômico e bem adequado para cenários de entretenimento casual, como imagens para redes sociais, companheiros de IA e ativos de efeitos especiais.",
"vidu2-image.description": "Vidu 2 é um modelo de fundação de geração de vídeo projetado para equilibrar velocidade e qualidade. Foca na geração de imagem-para-vídeo e controle de quadros inicial e final, suportando vídeos de 4 segundos em resolução 720P. A velocidade de geração é significativamente melhorada enquanto os custos são substancialmente reduzidos. A geração de imagem-para-vídeo corrige problemas anteriores de mudança de cor, entregando visuais estáveis e controláveis adequados para e-commerce e aplicações similares. Além disso, a compreensão semântica de quadros inicial e final e a consistência entre várias imagens de referência foram aprimoradas, tornando-o uma ferramenta eficiente para produção de conteúdo em larga escala em entretenimento geral, mídia na internet, curtas animados e publicidade.",
"vidu2-reference.description": "Vidu 2 é um modelo de fundação de geração de vídeo projetado para equilibrar velocidade e qualidade. Foca na geração de imagem-para-vídeo e controle de quadros inicial e final, suportando vídeos de 4 segundos em resolução 720P. A velocidade de geração é significativamente melhorada enquanto os custos são substancialmente reduzidos. A geração de imagem-para-vídeo corrige problemas anteriores de mudança de cor, entregando visuais estáveis e controláveis adequados para e-commerce e aplicações similares. Além disso, a compreensão semântica de quadros inicial e final e a consistência entre várias imagens de referência foram aprimoradas, tornando-o uma ferramenta eficiente para produção de conteúdo em larga escala em entretenimento geral, mídia na internet, curtas animados e publicidade.",
"vidu2-start-end.description": "Vidu 2 é um modelo de fundação de geração de vídeo projetado para equilibrar velocidade e qualidade. Foca na geração de imagem-para-vídeo e controle de quadros inicial e final, suportando vídeos de 4 segundos em resolução 720P. A velocidade de geração é significativamente melhorada enquanto os custos são substancialmente reduzidos. A geração de imagem-para-vídeo corrige problemas anteriores de mudança de cor, entregando visuais estáveis e controláveis adequados para e-commerce e aplicações similares. Além disso, a compreensão semântica de quadros inicial e final e a consistência entre várias imagens de referência foram aprimoradas, tornando-o uma ferramenta eficiente para produção de conteúdo em larga escala em entretenimento geral, mídia na internet, curtas animados e publicidade.",
"viduq1-image.description": "Vidu Q1 é o modelo de fundação de geração de vídeo de próxima geração da Vidu, focado em criação de vídeos de alta qualidade. Produz conteúdo com especificações fixas de 5 segundos, 24 FPS e resolução 1080P. Por meio de otimização profunda da clareza visual, a qualidade geral da imagem e a textura são significativamente melhoradas, enquanto problemas como deformação das mãos e tremores de quadros são amplamente reduzidos. O estilo realista se aproxima de cenas do mundo real, e estilos de animação 2D são preservados com alta fidelidade. As transições entre os quadros inicial e final são mais suaves, tornando-o bem adequado para cenários criativos de alta demanda, como produção cinematográfica, publicidade e curtas animados.",
"viduq1-start-end.description": "Vidu Q1 é o modelo de fundação de geração de vídeo de próxima geração da Vidu, focado em criação de vídeos de alta qualidade. Produz conteúdo com especificações fixas de 5 segundos, 24 FPS e resolução 1080P. Por meio de otimização profunda da clareza visual, a qualidade geral da imagem e a textura são significativamente melhoradas, enquanto problemas como deformação das mãos e tremores de quadros são amplamente reduzidos. O estilo realista se aproxima de cenas do mundo real, e estilos de animação 2D são preservados com alta fidelidade. As transições entre os quadros inicial e final são mais suaves, tornando-o bem adequado para cenários criativos de alta demanda, como produção cinematográfica, publicidade e curtas animados.",
"viduq1-text.description": "Vidu Q1 é o modelo de fundação de geração de vídeo de próxima geração da Vidu, focado em criação de vídeos de alta qualidade. Produz conteúdo com especificações fixas de 5 segundos, 24 FPS e resolução 1080P. Por meio de otimização profunda da clareza visual, a qualidade geral da imagem e a textura são significativamente melhoradas, enquanto problemas como deformação das mãos e tremores de quadros são amplamente reduzidos. O estilo realista se aproxima de cenas do mundo real, e estilos de animação 2D são preservados com alta fidelidade. As transições entre os quadros inicial e final são mais suaves, tornando-o bem adequado para cenários criativos de alta demanda, como produção cinematográfica, publicidade e curtas animados.",
"volcengine/doubao-seed-2-0-code.description": "Doubao-Seed-2.0-Code é otimizado para necessidades de programação em nível empresarial. Baseado nas excelentes capacidades de Agente e VLM do Seed 2.0, ele aprimora especialmente as habilidades de codificação com desempenho excepcional no frontend e otimização direcionada para os requisitos comuns de codificação multilíngue empresarial, tornando-o ideal para integração com diversas ferramentas de programação com IA.",
"volcengine/doubao-seed-2-0-lite.description": "Equilibra a qualidade de geração e a velocidade de resposta, adequado como um modelo de produção de uso geral.",
"volcengine/doubao-seed-2-0-mini.description": "Aponta para a versão mais recente do doubao-seed-2-0-mini.",
"volcengine/doubao-seed-2-0-pro.description": "Aponta para a versão mais recente do doubao-seed-2-0-pro.",
"volcengine/doubao-seed-code.description": "Doubao-Seed-Code é o LLM da Volcano Engine da ByteDance otimizado para programação agente, com forte desempenho em benchmarks de programação e agentes, com suporte a contexto de 256K.",
"wan2.2-i2v-flash.description": "Wanxiang 2.2 Edição Rápida oferece geração ultrarrápida, com compreensão de prompts mais precisa e controle de câmera. Mantém a consistência dos elementos visuais enquanto melhora significativamente a estabilidade geral e a taxa de sucesso.",
"wan2.2-i2v-plus.description": "Wanxiang 2.2 Edição Pro oferece compreensão de prompts mais precisa e movimentos de câmera controláveis. Mantém a consistência dos elementos visuais enquanto melhora significativamente a estabilidade e a taxa de sucesso, gerando conteúdos mais ricos e detalhados.",
"wan2.2-kf2v-flash.description": "Wanxiang 2.2 Edição Rápida",
"wan2.2-kf2v-plus.description": "Wanxiang 2.2 Edição Plus",
"wan2.2-t2i-flash.description": "Wanxiang 2.2 Flash é o modelo mais recente com melhorias em criatividade, estabilidade e realismo, oferecendo geração rápida e alto valor.",
"wan2.2-t2i-plus.description": "Wanxiang 2.2 Plus é o modelo mais recente com melhorias em criatividade, estabilidade e realismo, produzindo detalhes mais ricos.",
"wan2.2-t2v-plus.description": "Wanxiang 2.2 Edição Pro fornece compreensão de prompts mais precisa, entrega geração de movimento estável e suave, e produz visuais mais ricos e detalhados.",
"wan2.5-i2i-preview.description": "Wanxiang 2.5 I2I Preview suporta edição de imagem única e fusão de múltiplas imagens.",
"wan2.5-i2v-preview.description": "Wanxiang 2.5 Preview suporta geração automática de narração e a capacidade de incorporar arquivos de áudio personalizados.",
"wan2.5-t2i-preview.description": "Wanxiang 2.5 T2I suporta seleção flexível de dimensões de imagem dentro de limites de área total de pixels e proporções de aspecto.",
"wan2.5-t2v-preview.description": "Wanxiang 2.5 Preview suporta geração automática de narração e a capacidade de incorporar arquivos de áudio personalizados.",
"wan2.6-i2v-flash.description": "Wanxiang 2.6 introduz capacidades narrativas de múltiplas tomadas, além de suportar geração automática de narração e a capacidade de incorporar arquivos de áudio personalizados.",
"wan2.6-i2v.description": "Wanxiang 2.6 introduz capacidades narrativas de múltiplas tomadas, além de suportar geração automática de narração e a capacidade de incorporar arquivos de áudio personalizados.",
"wan2.6-image.description": "Wanxiang 2.6 Image suporta edição de imagens e saída de layout misto imagem-texto.",
"wan2.6-r2v-flash.description": "Wanxiang 2.6 Referência-para-Vídeo Flash oferece geração mais rápida e melhor relação custo-benefício. Suporta referência a personagens específicos ou quaisquer objetos, mantendo com precisão a consistência na aparência e voz, e permite referência a múltiplos personagens para co-desempenho.",
"wan2.6-r2v.description": "Wanxiang 2.6 Referência-para-Vídeo suporta referência a personagens específicos ou quaisquer objetos, mantendo com precisão a consistência na aparência e voz, e permitindo referência a múltiplos personagens para co-desempenho. Nota: Ao usar vídeos como referências, o vídeo de entrada também será contabilizado no custo. Consulte a documentação de preços do modelo para detalhes.",
"wan2.6-t2i.description": "Wanxiang 2.6 T2I suporta seleção flexível de dimensões de imagem dentro de limites de área total de pixels e proporções de aspecto (igual ao Wanxiang 2.5).",
"wan2.6-t2v.description": "Wanxiang 2.6 introduz capacidades narrativas de múltiplas tomadas, além de suportar geração automática de narração e a capacidade de incorporar arquivos de áudio personalizados.",
"wan2.7-i2v-2026-04-25.description": "Wanxiang 2.7 Image-to-Video oferece uma atualização abrangente em capacidades. Cenas dramáticas apresentam expressão emocional mais delicada e natural, enquanto sequências de ação são intensas e impactantes. Com transições de cena mais dinâmicas e ritmadas, proporciona desempenho e narrativa fortalecidos.",
"wan2.7-i2v.description": "Wanxiang 2.7 Imagem-para-Vídeo oferece uma atualização abrangente nas capacidades de desempenho. Cenas dramáticas apresentam expressão emocional delicada e natural, enquanto sequências de ação são intensas e impactantes. Combinado com transições de tomadas mais dinâmicas e ritmicamente conduzidas, alcança um desempenho geral mais forte e narrativa.",
"wan2.7-image-pro.description": "Wanxiang 2.7 Imagem Edição Profissional, suporta saída em alta definição 4K.",
"wan2.7-image.description": "Wanxiang 2.7 Imagem, velocidade de geração de imagem mais rápida.",
"wan2.7-r2v.description": "Wanxiang 2.7 Referência-para-Vídeo oferece referências mais estáveis para personagens, adereços e cenas. Suporta até 5 imagens ou vídeos de referência mistos, junto com referência de tom de áudio. Combinado com capacidades centrais aprimoradas, entrega desempenho mais forte e poder expressivo.",
"wan2.7-t2v-2026-04-25.description": "Wanxiang 2.7 Text-to-Video oferece uma atualização abrangente em capacidades. Cenas dramáticas apresentam expressão emocional delicada e natural, enquanto sequências de ação são intensas e impactantes. Com transições de cena mais dinâmicas e ritmadas, proporciona desempenho de atuação e narrativa aprimorados.",
"wan2.7-t2v.description": "Wanxiang 2.7 Texto-para-Vídeo oferece uma atualização abrangente nas capacidades de desempenho. Cenas dramáticas apresentam expressão emocional delicada e natural, enquanto sequências de ação são intensas e impactantes. Aprimorado com transições de tomadas mais dinâmicas e ritmicamente conduzidas, alcança um desempenho de atuação e narrativa mais forte.",
"wanx-v1.description": "Modelo base de texto para imagem. Corresponde ao Tongyi Wanxiang 1.0 General.",
"wanx2.0-t2i-turbo.description": "Excelente em retratos texturizados com velocidade moderada e menor custo. Corresponde ao Tongyi Wanxiang 2.0 Speed.",
"wanx2.1-i2v-plus.description": "Wanxiang 2.1 Edição Pro entrega imagens visualmente mais refinadas e de maior qualidade.",
"wanx2.1-i2v-turbo.description": "Wanxiang 2.1 Edição Rápida oferece alto custo-benefício.",
"wanx2.1-t2i-plus.description": "Versão totalmente atualizada com mais detalhes de imagem e velocidade ligeiramente menor. Corresponde ao Tongyi Wanxiang 2.1 Pro.",
"wanx2.1-t2i-turbo.description": "Versão totalmente atualizada com geração rápida, qualidade geral forte e alto valor. Corresponde ao Tongyi Wanxiang 2.1 Speed.",
"wanx2.1-t2v-plus.description": "Wanxiang 2.1 Edição Pro entrega textura visual mais rica e imagens de maior qualidade.",
"wanx2.1-t2v-turbo.description": "Wanxiang 2.1 Edição Rápida oferece excelente relação custo-benefício.",
"whisper-1.description": "Modelo geral de reconhecimento de fala com suporte a ASR multilíngue, tradução de fala e identificação de idioma.",
"wizardlm2.description": "WizardLM 2 é um modelo de linguagem da Microsoft AI que se destaca em diálogos complexos, tarefas multilíngues, raciocínio e assistentes.",
"wizardlm2:8x22b.description": "WizardLM 2 é um modelo de linguagem da Microsoft AI que se destaca em diálogos complexos, tarefas multilíngues, raciocínio e assistentes.",
"x-ai/grok-4.1-fast-non-reasoning.description": "Grok 4 Fast (Sem Raciocínio) é o modelo multimodal de alta vazão e baixo custo da xAI (com suporte a janela de contexto de 2M) para cenários sensíveis à latência e custo que não exigem raciocínio interno. Está ao lado da versão com raciocínio do Grok 4 Fast, e o raciocínio pode ser ativado via parâmetro de API quando necessário. Prompts e respostas podem ser usados pela xAI ou OpenRouter para melhorar modelos futuros.",
"x-ai/grok-4.1-fast.description": "Grok 4 Fast é o modelo de alta vazão e baixo custo da xAI (com suporte a janela de contexto de 2M), ideal para casos de uso com alta concorrência e contexto longo.",
"xai/grok-2-vision.description": "Grok 2 Vision se destaca em tarefas visuais, oferecendo desempenho de ponta em raciocínio visual matemático (MathVista) e perguntas e respostas em documentos (DocVQA). Lida com documentos, gráficos, tabelas, capturas de tela e fotos.",
"xai/grok-2.description": "Grok 2 é um modelo de fronteira com raciocínio de ponta, forte desempenho em chat, codificação e raciocínio, superando Claude 3.5 Sonnet e GPT-4 Turbo no LMSYS.",
"xai/grok-3-fast.description": "Modelo de ponta da xAI que se destaca em casos de uso corporativos como extração de dados, codificação e sumarização, com profundo conhecimento em finanças, saúde, direito e ciência. A variante rápida roda em infraestrutura mais ágil para respostas muito mais rápidas com maior custo por token.",
"xai/grok-3-mini-fast.description": "Modelo leve da xAI que pensa antes de responder, ideal para tarefas simples ou baseadas em lógica sem necessidade de conhecimento profundo. Rastros de raciocínio brutos estão disponíveis. A variante rápida roda em infraestrutura mais ágil para respostas muito mais rápidas com maior custo por token.",
"xai/grok-3-mini.description": "Modelo leve da xAI que pensa antes de responder, ideal para tarefas simples ou baseadas em lógica sem necessidade de conhecimento profundo. Rastros de raciocínio brutos estão disponíveis.",
"xai/grok-3.description": "Modelo de ponta da xAI que se destaca em casos de uso corporativos como extração de dados, codificação e sumarização, com profundo conhecimento em finanças, saúde, direito e ciência.",
"xai/grok-4.description": "O mais novo modelo de ponta da xAI com desempenho incomparável em linguagem natural, matemática e raciocínio — um modelo versátil ideal.",
"yi-large-fc.description": "Baseado no yi-large com chamadas de ferramentas aprimoradas, adequado para cenários de agentes e fluxos de trabalho.",
"yi-large-preview.description": "Uma versão inicial; recomenda-se o uso do yi-large (mais recente).",
"yi-large-rag.description": "Serviço avançado baseado no yi-large, combinando recuperação e geração para respostas precisas com busca em tempo real na web.",
"yi-large-turbo.description": "Valor e desempenho excepcionais, ajustado para um forte equilíbrio entre qualidade, velocidade e custo.",
"yi-large.description": "Novo modelo com 100 bilhões de parâmetros com forte desempenho em perguntas e respostas e geração de texto.",
"yi-lightning-lite.description": "Versão leve; recomenda-se o uso do yi-lightning.",
"yi-lightning.description": "Modelo de alto desempenho mais recente com inferência mais rápida e saída de alta qualidade.",
"yi-medium-200k.description": "Modelo de contexto longo com 200K para compreensão e geração profunda de textos longos.",
"yi-medium.description": "Modelo de porte médio ajustado com capacidade e valor equilibrados, otimizado para seguir instruções.",
"yi-spark.description": "Modelo compacto e rápido com capacidades reforçadas em matemática e codificação.",
"yi-vision-v2.description": "Modelo de visão para tarefas complexas com forte compreensão e análise de múltiplas imagens.",
"yi-vision.description": "Modelo de visão para tarefas complexas com forte compreensão e análise de imagens.",
"youtu-vita.description": "VITA é um modelo multimodal de compreensão que suporta análise de conteúdo de vídeos e imagens. Pode ser utilizado em tarefas como segmentação estrutural de vídeos e detecção de objetos em imagens.",
"yt-video-2.0.description": "Gera vídeos altamente consistentes no tempo a partir de imagens, adequado para aplicações exigentes como publicidade, trechos cinematográficos e vídeos de apresentação de produtos.",
"z-ai/glm-4.5-air.description": "GLM 4.5 Air é uma variante leve do GLM 4.5 para cenários sensíveis a custo, mantendo forte raciocínio.",
"z-ai/glm-4.5.description": "GLM 4.5 é o modelo de ponta da Z.AI com raciocínio híbrido otimizado para engenharia e tarefas com contexto longo.",
"z-ai/glm-4.6.description": "GLM 4.6 é o modelo de ponta da Z.AI com comprimento de contexto estendido e capacidade de codificação.",
"z-ai/glm-4.7.description": "GLM-4.7 é o mais novo modelo de ponta da Zhipu, oferecendo capacidades gerais aprimoradas, respostas mais simples e naturais, e uma experiência de escrita mais imersiva.",
"z-image-turbo.description": "Z-Image é um modelo leve de geração de texto-para-imagem que pode produzir rapidamente imagens, suporta renderização de texto em chinês e inglês e se adapta de forma flexível a múltiplas resoluções e proporções de aspecto.",
"zai-glm-4.7.description": "GLM-4.7 é o modelo principal de nova geração da Zhipu com 355B de parâmetros totais e 32B de parâmetros ativos, totalmente atualizado em diálogo geral, raciocínio e capacidades de agente. GLM-4.7 aprimora o Pensamento Intercalado e introduz Pensamento Preservado e Pensamento em Nível de Turno.",
"zai-org/GLM-4.5-Air.description": "GLM-4.5-Air é um modelo base para aplicações com agentes, utilizando uma arquitetura Mixture-of-Experts. Ele é otimizado para uso de ferramentas, navegação na web, engenharia de software e codificação frontend, e integra-se com agentes de código como Claude Code e Roo Code. Utiliza raciocínio híbrido para lidar tanto com cenários complexos quanto com situações do dia a dia.",
"zai-org/GLM-4.5V.description": "GLM-4.5V é o mais recente VLM da Zhipu AI, baseado no modelo de texto principal GLM-4.5-Air (106B no total, 12B ativos), com uma arquitetura MoE que oferece alto desempenho a um custo reduzido. Segue a linha de desenvolvimento do GLM-4.1V-Thinking e adiciona 3D-RoPE para melhorar o raciocínio espacial em 3D. Otimizado por meio de pré-treinamento, SFT e RL, lida com imagens, vídeos e documentos longos, e está entre os melhores modelos abertos em 41 benchmarks multimodais públicos. Um modo de alternância de raciocínio permite ao usuário equilibrar velocidade e profundidade.",
"zai/glm-4.5-air.description": "GLM-4.5 e GLM-4.5-Air são nossos modelos principais mais recentes para aplicações com agentes, ambos utilizando MoE. O GLM-4.5 possui 355B no total e 32B ativos por passagem; o GLM-4.5-Air é mais enxuto, com 106B no total e 12B ativos.",
"zai/glm-4.5.description": "A série GLM-4.5 foi projetada para agentes. O modelo principal GLM-4.5 combina raciocínio, codificação e habilidades de agente com 355B de parâmetros totais (32B ativos) e oferece modos de operação duplos como um sistema de raciocínio híbrido.",
"zai/glm-4.5v.description": "GLM-4.5V é baseado no GLM-4.5-Air, herdando técnicas comprovadas do GLM-4.1V-Thinking e escalando com uma robusta arquitetura MoE de 106B parâmetros.",
"zenmux/auto.description": "O roteamento automático do ZenMux seleciona o modelo com melhor desempenho e custo-benefício entre as opções suportadas, com base na sua solicitação."
}