Files
lobe-chat/locales/it-IT/models.json
T
Arvin Xu d8deaddedd feat: add work path for local system (#11128)
*  feat: support to show working dir

* fix style

* update docs

* update topic

* refactor to use chat config

* inject working Directory

* update i18n

* fix tests
2026-01-03 16:22:22 +08:00

618 lines
149 KiB
JSON
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
{
"01-ai/yi-1.5-34b-chat.description": "Il più recente modello open-source di 01.AI, ottimizzato con 34 miliardi di parametri. Supporta molteplici scenari di dialogo, è addestrato su dati di alta qualità e allineato alle preferenze umane.",
"01-ai/yi-1.5-9b-chat.description": "Il più recente modello open-source di 01.AI, ottimizzato con 9 miliardi di parametri. Supporta molteplici scenari di dialogo, è addestrato su dati di alta qualità e allineato alle preferenze umane.",
"360/deepseek-r1.description": "DeepSeek-R1 distribuito su 360 utilizza l'apprendimento per rinforzo su larga scala nella fase di post-addestramento per migliorare notevolmente il ragionamento con un numero minimo di etichette. Raggiunge le prestazioni del modello OpenAI o1 nei compiti di matematica, programmazione e ragionamento in linguaggio naturale.",
"360gpt-pro-trans.description": "Modello specializzato nella traduzione, ottimizzato in profondità per offrire una qualità di traduzione di livello superiore.",
"360gpt-pro.description": "360GPT Pro è un modello chiave di 360 AI per l'elaborazione efficiente del testo in scenari NLP diversificati, con supporto per la comprensione di testi lunghi e dialoghi multi-turno.",
"360gpt-turbo-responsibility-8k.description": "360GPT Turbo Responsibility 8K pone l'accento sulla sicurezza semantica e la responsabilità nei contesti sensibili, garantendo esperienze utente accurate e affidabili.",
"360gpt-turbo.description": "360GPT Turbo offre elevate capacità di calcolo e conversazione, con eccellente comprensione semantica ed efficienza generativa, ideale per aziende e sviluppatori.",
"360gpt2-o1.description": "360gpt2-o1 costruisce catene di pensiero tramite ricerca ad albero con meccanismo di riflessione e addestramento con RL, abilitando auto-riflessione e auto-correzione.",
"360gpt2-pro.description": "360GPT2 Pro è un modello NLP avanzato di 360 con eccellenti capacità di generazione e comprensione del testo, particolarmente adatto a compiti creativi, trasformazioni complesse e simulazioni di ruolo.",
"360zhinao2-o1.description": "360zhinao2-o1 costruisce catene di pensiero tramite ricerca ad albero con meccanismo di riflessione e addestramento con RL, abilitando auto-riflessione e auto-correzione.",
"4.0Ultra.description": "Spark Ultra è il modello più potente della serie Spark, migliora la comprensione e il riassunto del testo e potenzia la ricerca web. È una soluzione completa per aumentare la produttività sul lavoro e fornire risposte accurate, posizionandosi come prodotto intelligente leader.",
"AnimeSharp.description": "AnimeSharp (noto anche come \"4x-AnimeSharp\") è un modello open-source di super-risoluzione basato su ESRGAN di Kim2091, focalizzato sull'ingrandimento e la nitidezza delle immagini in stile anime. È stato rinominato da \"4x-TextSharpV1\" nel febbraio 2022, originariamente pensato anche per immagini testuali ma fortemente ottimizzato per contenuti anime.",
"Baichuan2-Turbo.description": "Utilizza l'augmentazione tramite ricerca per collegare il modello alla conoscenza di dominio e del web. Supporta caricamenti PDF/Word e input tramite URL per un recupero tempestivo e completo, con output professionali e accurati.",
"Baichuan3-Turbo-128k.description": "Con una finestra di contesto ultra-lunga da 128K, è ottimizzato per scenari aziendali ad alta frequenza, con miglioramenti significativi. Rispetto a Baichuan2, la creazione di contenuti migliora del 20%, le risposte a domande di conoscenza del 17% e le simulazioni di ruolo del 40%. Le prestazioni complessive superano GPT-3.5.",
"Baichuan3-Turbo.description": "Ottimizzato per scenari aziendali ad alta frequenza, con miglioramenti significativi. Rispetto a Baichuan2, la creazione di contenuti migliora del 20%, le risposte a domande di conoscenza del 17% e le simulazioni di ruolo del 40%. Le prestazioni complessive superano GPT-3.5.",
"Baichuan4-Air.description": "Modello di punta in Cina, supera i principali modelli esteri nei compiti in lingua cinese come conoscenza, testi lunghi e generazione creativa. Presenta anche capacità multimodali all'avanguardia con risultati eccellenti nei benchmark autorevoli.",
"Baichuan4-Turbo.description": "Modello di punta in Cina, supera i principali modelli esteri nei compiti in lingua cinese come conoscenza, testi lunghi e generazione creativa. Presenta anche capacità multimodali all'avanguardia con risultati eccellenti nei benchmark autorevoli.",
"Baichuan4.description": "Prestazioni nazionali al top, superiori ai principali modelli esteri nei compiti in lingua cinese come conoscenza enciclopedica, testi lunghi e generazione creativa. Offre anche capacità multimodali all'avanguardia e risultati eccellenti nei benchmark.",
"ByteDance-Seed/Seed-OSS-36B-Instruct.description": "Seed-OSS è una famiglia di LLM open-source di ByteDance Seed, progettata per una gestione efficace di contesti lunghi, ragionamento, agenti e capacità generali. Seed-OSS-36B-Instruct è un modello da 36B ottimizzato per istruzioni, con contesto ultra-lungo nativo per elaborare documenti o basi di codice estesi. Ottimizzato per ragionamento, generazione di codice e compiti agentici (uso di strumenti), mantiene forti capacità generali. Una caratteristica chiave è il \"Thinking Budget\", che consente una lunghezza di ragionamento flessibile per migliorare l'efficienza.",
"DeepSeek-R1-Distill-Llama-70B.description": "DeepSeek R1, il modello più grande e intelligente della suite DeepSeek, è stato distillato nell'architettura Llama 70B. I benchmark e le valutazioni umane dimostrano che è più intelligente del Llama 70B base, in particolare nei compiti di matematica e precisione dei fatti.",
"DeepSeek-R1-Distill-Qwen-1.5B.description": "Un modello distillato DeepSeek-R1 basato su Qwen2.5-Math-1.5B. L'apprendimento per rinforzo e i dati di avvio a freddo ottimizzano le prestazioni di ragionamento, stabilendo nuovi benchmark multi-task per i modelli open-source.",
"DeepSeek-R1-Distill-Qwen-14B.description": "I modelli DeepSeek-R1-Distill sono ottimizzati a partire da modelli open-source utilizzando dati campione generati da DeepSeek-R1.",
"DeepSeek-R1-Distill-Qwen-32B.description": "I modelli DeepSeek-R1-Distill sono ottimizzati a partire da modelli open-source utilizzando dati campione generati da DeepSeek-R1.",
"DeepSeek-R1-Distill-Qwen-7B.description": "Un modello distillato DeepSeek-R1 basato su Qwen2.5-Math-7B. L'apprendimento per rinforzo e i dati di avvio a freddo ottimizzano le prestazioni di ragionamento, stabilendo nuovi benchmark multi-task per i modelli open-source.",
"DeepSeek-R1.description": "DeepSeek-R1 applica l'apprendimento per rinforzo su larga scala nella fase di post-addestramento, migliorando notevolmente il ragionamento con pochissimi dati etichettati. Raggiunge le prestazioni del modello OpenAI o1 nei compiti di matematica, programmazione e ragionamento in linguaggio naturale.",
"DeepSeek-V3-1.description": "DeepSeek V3.1 è un modello di ragionamento di nuova generazione con miglioramenti nel ragionamento complesso e nella catena di pensiero, adatto ad attività di analisi approfondita.",
"DeepSeek-V3-Fast.description": "Fornitore: sophnet. DeepSeek V3 Fast è la versione ad alta velocità di DeepSeek V3 0324, a precisione completa (non quantizzata), con prestazioni superiori in programmazione e matematica e risposte più rapide.",
"DeepSeek-V3.1-Fast.description": "DeepSeek V3.1 Fast è la variante veloce ad alta velocità di DeepSeek V3.1. Modalità di pensiero ibrida: tramite template di chat, un solo modello supporta modalità con e senza pensiero. Uso più intelligente degli strumenti: il post-addestramento migliora le prestazioni nei compiti agentici e nell'uso degli strumenti.",
"DeepSeek-V3.1-Think.description": "Modalità di pensiero DeepSeek-V3.1: un nuovo modello di ragionamento ibrido con modalità di pensiero e non-pensiero, più efficiente di DeepSeek-R1-0528. Le ottimizzazioni post-addestramento migliorano significativamente l'uso degli strumenti agentici e le prestazioni nei compiti agentici.",
"DeepSeek-V3.description": "DeepSeek-V3 è un modello MoE sviluppato da DeepSeek. Supera altri modelli open-source come Qwen2.5-72B e Llama-3.1-405B in molti benchmark ed è competitivo con i principali modelli chiusi come GPT-4o e Claude 3.5 Sonnet.",
"Doubao-lite-128k.description": "Doubao-lite offre risposte ultra-rapide e un ottimo rapporto qualità/prezzo, con opzioni flessibili per diversi scenari. Supporta un contesto di 128K per inferenza e fine-tuning.",
"Doubao-lite-32k.description": "Doubao-lite offre risposte ultra-rapide e un ottimo rapporto qualità/prezzo, con opzioni flessibili per diversi scenari. Supporta un contesto di 32K per inferenza e fine-tuning.",
"Doubao-lite-4k.description": "Doubao-lite offre risposte ultra-rapide e un ottimo rapporto qualità/prezzo, con opzioni flessibili per diversi scenari. Supporta un contesto di 4K per inferenza e fine-tuning.",
"Doubao-pro-128k.description": "Modello di punta con le migliori prestazioni per compiti complessi, eccellente in QA con fonti, riassunti, creazione, classificazione e simulazioni di ruolo. Supporta un contesto di 128K per inferenza e fine-tuning.",
"Doubao-pro-32k.description": "Modello di punta con le migliori prestazioni per compiti complessi, eccellente in QA con fonti, riassunti, creazione, classificazione e simulazioni di ruolo. Supporta un contesto di 32K per inferenza e fine-tuning.",
"Doubao-pro-4k.description": "Modello di punta con le migliori prestazioni per compiti complessi, eccellente in QA con fonti, riassunti, creazione, classificazione e simulazioni di ruolo. Supporta un contesto di 4K per inferenza e fine-tuning.",
"DreamO.description": "DreamO è un modello open-source per la personalizzazione delle immagini sviluppato congiuntamente da ByteDance e l'Università di Pechino, che utilizza un'architettura unificata per supportare la generazione di immagini multi-task. Impiega una modellazione compositiva efficiente per generare immagini altamente coerenti e personalizzate in base a identità, soggetto, stile, sfondo e altre condizioni specificate dall'utente.",
"ERNIE-3.5-128K.description": "Modello LLM di punta di Baidu, addestrato su vasti corpora in cinese e inglese, con eccellenti capacità generali per chat, creazione e utilizzo di plugin; supporta l'integrazione automatica del plugin Baidu Search per risposte aggiornate.",
"ERNIE-3.5-8K-Preview.description": "Modello LLM di punta di Baidu, addestrato su vasti corpora in cinese e inglese, con eccellenti capacità generali per chat, creazione e utilizzo di plugin; supporta l'integrazione automatica del plugin Baidu Search per risposte aggiornate.",
"ERNIE-3.5-8K.description": "Modello LLM di punta di Baidu, addestrato su vasti corpora in cinese e inglese, con eccellenti capacità generali per chat, creazione e utilizzo di plugin; supporta l'integrazione automatica del plugin Baidu Search per risposte aggiornate.",
"ERNIE-4.0-8K-Latest.description": "Modello LLM ultra-avanzato di Baidu con aggiornamenti completi rispetto a ERNIE 3.5, adatto a compiti complessi in diversi ambiti; supporta l'integrazione del plugin Baidu Search per risposte aggiornate.",
"ERNIE-4.0-8K-Preview.description": "Modello LLM ultra-avanzato di Baidu con aggiornamenti completi rispetto a ERNIE 3.5, adatto a compiti complessi in diversi ambiti; supporta l'integrazione del plugin Baidu Search per risposte aggiornate.",
"ERNIE-4.0-Turbo-8K-Latest.description": "Modello LLM ultra-avanzato di Baidu con prestazioni generali elevate per compiti complessi, con integrazione del plugin Baidu Search per risposte aggiornate. Supera le prestazioni di ERNIE 4.0.",
"ERNIE-4.0-Turbo-8K-Preview.description": "Modello LLM ultra-avanzato di Baidu con prestazioni generali elevate per compiti complessi, con integrazione del plugin Baidu Search per risposte aggiornate. Supera le prestazioni di ERNIE 4.0.",
"ERNIE-Character-8K.description": "Modello LLM di Baidu per domini verticali come NPC nei giochi, assistenza clienti e roleplay, con maggiore coerenza del personaggio, migliore comprensione delle istruzioni e capacità di ragionamento potenziate.",
"ERNIE-Lite-Pro-128K.description": "Modello LLM leggero di Baidu che bilancia qualità e prestazioni di inferenza, superiore a ERNIE Lite e adatto ad acceleratori a bassa potenza.",
"ERNIE-Speed-128K.description": "Ultimo modello LLM ad alte prestazioni di Baidu (2024) con forti capacità generali, ideale come base per il fine-tuning in scenari specifici, con eccellenti prestazioni di ragionamento.",
"ERNIE-Speed-Pro-128K.description": "Ultimo modello LLM ad alte prestazioni di Baidu (2024) con forti capacità generali, superiore a ERNIE Speed, ideale come base per il fine-tuning con eccellenti prestazioni di ragionamento.",
"FLUX-1.1-pro.description": "FLUX.1.1 Pro",
"FLUX.1-Kontext-dev.description": "FLUX.1-Kontext-dev è un modello multimodale per generazione ed editing di immagini sviluppato da Black Forest Labs, basato su un'architettura Rectified Flow Transformer con 12 miliardi di parametri. Si concentra sulla generazione, ricostruzione, miglioramento o modifica di immagini in base a condizioni contestuali. Combina la generazione controllabile dei modelli di diffusione con la modellazione contestuale dei Transformer, supportando output di alta qualità per compiti come inpainting, outpainting e ricostruzione di scene visive.",
"FLUX.1-Kontext-pro.description": "FLUX.1 Kontext [pro]",
"FLUX.1-dev.description": "FLUX.1-dev è un modello linguistico multimodale open-source (MLLM) di Black Forest Labs, ottimizzato per compiti immagine-testo e in grado di comprendere e generare contenuti visivi e testuali. Basato su LLM avanzati (come Mistral-7B), utilizza un encoder visivo progettato con cura e un tuning a più stadi per abilitare il coordinamento multimodale e il ragionamento su compiti complessi.",
"Gryphe/MythoMax-L2-13b.description": "MythoMax-L2 (13B) è un modello innovativo per domini diversificati e compiti complessi.",
"HelloMeme.description": "HelloMeme è uno strumento AI che genera meme, GIF o brevi video a partire da immagini o movimenti forniti. Non richiede abilità di disegno o programmazione: basta un'immagine di riferimento per creare contenuti divertenti, accattivanti e stilisticamente coerenti.",
"HiDream-I1-Full.description": "HiDream-E1-Full è un modello open-source per l'editing multimodale di immagini sviluppato da HiDream.ai, basato su un'architettura Diffusion Transformer avanzata e una solida comprensione linguistica (con LLaMA 3.1-8B-Instruct integrato). Supporta generazione di immagini guidata da linguaggio naturale, trasferimento di stile, modifiche locali e ritinteggiatura, con eccellente comprensione ed esecuzione immagine-testo.",
"HunyuanDiT-v1.2-Diffusers-Distilled.description": "hunyuandit-v1.2-distilled è un modello leggero text-to-image ottimizzato tramite distillazione per generare immagini di alta qualità in modo rapido, particolarmente adatto ad ambienti con risorse limitate e generazione in tempo reale.",
"InstantCharacter.description": "InstantCharacter è un modello di generazione di personaggi personalizzati senza tuning, rilasciato da Tencent AI nel 2025, progettato per una generazione fedele e coerente di personaggi in diversi scenari. Può modellare un personaggio da una singola immagine di riferimento e trasferirlo con flessibilità tra stili, azioni e sfondi.",
"InternVL2-8B.description": "InternVL2-8B è un potente modello visione-linguaggio che supporta l'elaborazione multimodale immagine-testo, riconoscendo accuratamente i contenuti visivi e generando descrizioni o risposte pertinenti.",
"InternVL2.5-26B.description": "InternVL2.5-26B è un potente modello visione-linguaggio che supporta l'elaborazione multimodale immagine-testo, riconoscendo accuratamente i contenuti visivi e generando descrizioni o risposte pertinenti.",
"Kolors.description": "Kolors è un modello text-to-image sviluppato dal team Kuaishou Kolors. Addestrato con miliardi di parametri, offre vantaggi notevoli in qualità visiva, comprensione semantica del cinese e resa del testo.",
"Kwai-Kolors/Kolors.description": "Kolors è un modello text-to-image a diffusione latente su larga scala sviluppato dal team Kuaishou Kolors. Addestrato su miliardi di coppie testo-immagine, eccelle in qualità visiva, accuratezza semantica complessa e resa del testo in cinese/inglese, con forte comprensione e generazione di contenuti in cinese.",
"Kwaipilot/KAT-Dev.description": "KAT-Dev (32B) è un modello open-source da 32 miliardi di parametri per compiti di ingegneria del software. Raggiunge un tasso di risoluzione del 62,4% su SWE-Bench Verified, classificandosi al 5° posto tra i modelli open. È ottimizzato tramite mid-training, SFT e RL per completamento del codice, correzione di bug e revisione del codice.",
"Llama-3.2-11B-Vision-Instruct.description": "Solido ragionamento visivo su immagini ad alta risoluzione, adatto ad applicazioni di comprensione visiva.",
"Llama-3.2-90B-Vision-Instruct\t.description": "Ragionamento visivo avanzato per applicazioni di agenti con comprensione visiva.",
"Meta-Llama-3-3-70B-Instruct.description": "Llama 3.3 70B è un modello Transformer versatile per compiti di chat e generazione.",
"Meta-Llama-3.1-405B-Instruct.description": "Modello testuale Llama 3.1 ottimizzato per chat multilingue, con prestazioni elevate nei benchmark industriali tra modelli open e closed.",
"Meta-Llama-3.1-70B-Instruct.description": "Modello testuale Llama 3.1 ottimizzato per chat multilingue, con prestazioni elevate nei benchmark industriali tra modelli open e closed.",
"Meta-Llama-3.1-8B-Instruct.description": "Modello testuale Llama 3.1 ottimizzato per chat multilingue, con prestazioni elevate nei benchmark industriali tra modelli open e closed.",
"Meta-Llama-3.2-1B-Instruct.description": "Modello linguistico compatto all'avanguardia con forte comprensione del linguaggio, eccellente ragionamento e generazione testuale.",
"Meta-Llama-3.2-3B-Instruct.description": "Modello linguistico compatto all'avanguardia con forte comprensione del linguaggio, eccellente ragionamento e generazione testuale.",
"Meta-Llama-3.3-70B-Instruct.description": "Llama 3.3 è il modello Llama open-source multilingue più avanzato, con prestazioni vicine a quelle del 405B a costi molto contenuti. Basato su Transformer, è migliorato con SFT e RLHF per utilità e sicurezza. La versione instruction-tuned è ottimizzata per chat multilingue e supera molti modelli open e closed nei benchmark industriali. Data di cutoff: dicembre 2023.",
"Meta-Llama-4-Maverick-17B-128E-Instruct-FP8.description": "Llama 4 Maverick è un grande modello MoE con attivazione efficiente degli esperti per prestazioni di ragionamento elevate.",
"MiniMax-M1.description": "Nuovo modello di ragionamento proprietario con 80K chain-of-thought e 1M di input, con prestazioni comparabili ai migliori modelli globali.",
"MiniMax-M2-Stable.description": "Progettato per flussi di lavoro di codifica e agenti efficienti, con maggiore concorrenza per l'uso commerciale.",
"MiniMax-M2.1-Lightning.description": "Potente supporto alla programmazione multilingue, per un'esperienza di codifica completamente rinnovata. Più veloce, più efficiente.",
"MiniMax-M2.1.description": "Potente supporto alla programmazione multilingue, per un'esperienza di codifica completamente rinnovata.",
"MiniMax-M2.description": "Progettato per una codifica efficiente e flussi di lavoro con agenti AI",
"MiniMax-Text-01.description": "MiniMax-01 introduce l'attenzione lineare su larga scala oltre i Transformer classici, con 456B parametri e 45,9B attivati per passaggio. Raggiunge prestazioni di alto livello e supporta fino a 4M token di contesto (32× GPT-4o, 20× Claude-3.5-Sonnet).",
"MiniMaxAI/MiniMax-M1-80k.description": "MiniMax-M1 è un modello di ragionamento ibrido su larga scala con pesi open, 456B parametri totali e ~45,9B attivi per token. Supporta nativamente 1M di contesto e utilizza Flash Attention per ridurre i FLOPs del 75% nella generazione di 100K token rispetto a DeepSeek R1. Con architettura MoE, CISPO e addestramento RL ibrido, raggiunge prestazioni leader su ragionamento con input lunghi e compiti reali di ingegneria del software.",
"MiniMaxAI/MiniMax-M2.description": "MiniMax-M2 ridefinisce l'efficienza degli agenti. È un modello MoE compatto, veloce ed economico con 230B parametri totali e 10B attivi, progettato per compiti di codifica e agenti di alto livello mantenendo una forte intelligenza generale. Con soli 10B parametri attivi, rivaleggia con modelli molto più grandi, rendendolo ideale per applicazioni ad alta efficienza.",
"Moonshot-Kimi-K2-Instruct.description": "1T parametri totali con 32B attivi. Tra i modelli non pensanti, è tra i migliori per conoscenze avanzate, matematica e programmazione, ed è più forte nei compiti generali da agente. Ottimizzato per carichi di lavoro da agente, può eseguire azioni, non solo rispondere a domande. Ideale per conversazioni improvvisate, chat generali e esperienze da agente, come modello reattivo senza riflessione prolungata.",
"NousResearch/Nous-Hermes-2-Mixtral-8x7B-DPO.description": "Nous Hermes 2 - Mixtral 8x7B-DPO (46,7B) è un modello ad alta precisione per istruzioni complesse e calcoli avanzati.",
"OmniConsistency.description": "OmniConsistency migliora la coerenza stilistica e la generalizzazione nei compiti immagine-a-immagine introducendo Diffusion Transformers (DiTs) su larga scala e dati stilizzati accoppiati, evitando il degrado dello stile.",
"Phi-3-medium-128k-instruct.description": "Lo stesso modello Phi-3-medium con una finestra contestuale più ampia per prompt RAG o few-shot.",
"Phi-3-medium-4k-instruct.description": "Un modello da 14B parametri con qualità superiore rispetto a Phi-3-mini, focalizzato su dati di alta qualità e ad alta intensità di ragionamento.",
"Phi-3-mini-128k-instruct.description": "Lo stesso modello Phi-3-mini con una finestra contestuale più ampia per prompt RAG o few-shot.",
"Phi-3-mini-4k-instruct.description": "Il membro più piccolo della famiglia Phi-3, ottimizzato per qualità e bassa latenza.",
"Phi-3-small-128k-instruct.description": "Lo stesso modello Phi-3-small con una finestra contestuale più ampia per prompt RAG o few-shot.",
"Phi-3-small-8k-instruct.description": "Un modello da 7B parametri con qualità superiore rispetto a Phi-3-mini, focalizzato su dati di alta qualità e ad alta intensità di ragionamento.",
"Phi-3.5-mini-instruct.description": "Una versione aggiornata del modello Phi-3-mini.",
"Phi-3.5-vision-instrust.description": "Una versione aggiornata del modello Phi-3-vision.",
"Pro/Qwen/Qwen2-7B-Instruct.description": "Qwen2-7B-Instruct è un LLM da 7B parametri ottimizzato per istruzioni nella serie Qwen2. Utilizza un'architettura Transformer con SwiGLU, bias QKV per l'attenzione e grouped-query attention, ed è in grado di gestire input di grandi dimensioni. Eccelle in comprensione linguistica, generazione, compiti multilingue, programmazione, matematica e ragionamento, superando la maggior parte dei modelli open-source e competendo con quelli proprietari. Supera Qwen1.5-7B-Chat in diversi benchmark.",
"Pro/Qwen/Qwen2.5-7B-Instruct.description": "Qwen2.5-7B-Instruct fa parte della nuova serie LLM di Alibaba Cloud. Il modello da 7B offre miglioramenti significativi in programmazione e matematica, supporta oltre 29 lingue e migliora il rispetto delle istruzioni, la comprensione dei dati strutturati e la generazione di output strutturati (in particolare JSON).",
"Pro/Qwen/Qwen2.5-Coder-7B-Instruct.description": "Qwen2.5-Coder-7B-Instruct è l'ultimo LLM di Alibaba Cloud focalizzato sul codice. Basato su Qwen2.5 e addestrato su 5,5T token, migliora notevolmente la generazione, il ragionamento e la correzione del codice, mantenendo al contempo le capacità matematiche e generali, fornendo una solida base per agenti di programmazione.",
"Pro/Qwen/Qwen2.5-VL-7B-Instruct.description": "Qwen2.5-VL è un nuovo modello visione-linguaggio della serie Qwen con forte comprensione visiva. Analizza testo, grafici e layout nelle immagini, comprende video lunghi ed eventi, supporta il ragionamento e l'uso di strumenti, l'ancoraggio multi-formato degli oggetti e output strutturati. Migliora la risoluzione dinamica e l'addestramento a frame-rate per la comprensione video e aumenta l'efficienza dell'encoder visivo.",
"Pro/THUDM/GLM-4.1V-9B-Thinking.description": "GLM-4.1V-9B-Thinking è un modello VLM open-source sviluppato da Zhipu AI e dal laboratorio KEG della Tsinghua, progettato per la cognizione multimodale complessa. Basato su GLM-4-9B-0414, aggiunge ragionamento a catena e apprendimento per rinforzo (RL) per migliorare significativamente il ragionamento cross-modale e la stabilità.",
"Pro/THUDM/glm-4-9b-chat.description": "GLM-4-9B-Chat è il modello open-source GLM-4 di Zhipu AI. Eccelle in semantica, matematica, ragionamento, codice e conoscenza. Oltre alla chat multi-turno, supporta la navigazione web, l'esecuzione di codice, chiamate a strumenti personalizzati e ragionamento su testi lunghi. Supporta 26 lingue (tra cui cinese, inglese, giapponese, coreano, tedesco). Ottiene buoni risultati su AlignBench-v2, MT-Bench, MMLU e C-Eval, e supporta fino a 128K di contesto per usi accademici e aziendali.",
"Pro/deepseek-ai/DeepSeek-R1-Distill-Qwen-7B.description": "DeepSeek-R1-Distill-Qwen-7B è distillato da Qwen2.5-Math-7B e ottimizzato su 800K campioni curati DeepSeek-R1. Ottiene ottimi risultati: 92,8% su MATH-500, 55,5% su AIME 2024 e un punteggio CodeForces di 1189 per un modello da 7B.",
"Pro/deepseek-ai/DeepSeek-R1.description": "DeepSeek-R1 è un modello di ragionamento guidato da RL che riduce la ripetizione e migliora la leggibilità. Utilizza dati cold-start prima del RL per potenziare ulteriormente il ragionamento, eguaglia OpenAI-o1 in compiti di matematica, codice e ragionamento, migliorando i risultati complessivi grazie a un addestramento accurato.",
"Pro/deepseek-ai/DeepSeek-V3.1-Terminus.description": "DeepSeek-V3.1-Terminus è una versione aggiornata del modello V3.1, posizionato come LLM ibrido per agenti. Risolve problemi segnalati dagli utenti e migliora la stabilità, la coerenza linguistica e riduce caratteri anomali e misti cinese/inglese. Integra modalità di pensiero e non-pensiero con template di chat per passaggi flessibili. Migliora anche le prestazioni di Code Agent e Search Agent per un uso più affidabile degli strumenti e compiti multi-step.",
"Pro/deepseek-ai/DeepSeek-V3.2-Exp.description": "DeepSeek-V3.2-Exp è una versione sperimentale della serie V3.2 che fa da ponte verso la prossima architettura. Aggiunge DeepSeek Sparse Attention (DSA) sopra V3.1-Terminus per migliorare l'efficienza nell'addestramento e inferenza su contesti lunghi, con ottimizzazioni per l'uso di strumenti, comprensione di documenti lunghi e ragionamento multi-step. Ideale per esplorare una maggiore efficienza di ragionamento con budget di contesto elevati.",
"Pro/deepseek-ai/DeepSeek-V3.description": "DeepSeek-V3 è un modello MoE da 671B parametri che utilizza MLA e DeepSeekMoE con bilanciamento del carico senza perdite per un'inferenza e addestramento efficienti. Preaddestrato su 14,8T token di alta qualità e ulteriormente ottimizzato con SFT e RL, supera altri modelli open-source e si avvicina ai modelli chiusi leader.",
"Pro/moonshotai/Kimi-K2-Instruct-0905.description": "Kimi K2-Instruct-0905 è la versione più recente e potente di Kimi K2. È un modello MoE di fascia alta con 1T di parametri totali e 32B attivi. Le caratteristiche principali includono un'intelligenza di codifica agentica più forte con miglioramenti significativi nei benchmark e nei compiti reali da agente, oltre a una migliore estetica e usabilità del codice frontend.",
"Pro/moonshotai/Kimi-K2-Thinking.description": "Kimi K2 Thinking Turbo è la variante Turbo ottimizzata per velocità di ragionamento e throughput, mantenendo il ragionamento multi-step e l'uso di strumenti di K2 Thinking. È un modello MoE con ~1T parametri totali, contesto nativo da 256K e chiamata stabile di strumenti su larga scala per scenari di produzione con requisiti più severi di latenza e concorrenza.",
"Pro/zai-org/glm-4.7.description": "GLM-4.7 è il nuovo modello di punta di Zhipu AI, con 355 miliardi di parametri totali e 32 miliardi attivi. Offre miglioramenti completi nel dialogo generale, nel ragionamento e nelle capacità degli agenti. GLM-4.7 potenzia il pensiero intercalato (Interleaved Thinking) e introduce il pensiero preservato (Preserved Thinking) e il pensiero a livello di turno (Turn-level Thinking).",
"QwQ-32B-Preview.description": "Qwen QwQ è un modello di ricerca sperimentale focalizzato sul miglioramento del ragionamento.",
"Qwen/QVQ-72B-Preview.description": "QVQ-72B-Preview è un modello di ricerca del team Qwen focalizzato sul ragionamento visivo, con punti di forza nella comprensione di scene complesse e nella risoluzione di problemi visivi di matematica.",
"Qwen/QwQ-32B-Preview.description": "Qwen QwQ è un modello di ricerca sperimentale focalizzato sul miglioramento del ragionamento dell'IA.",
"Qwen/QwQ-32B.description": "QwQ è un modello di ragionamento della famiglia Qwen. Rispetto ai modelli standard ottimizzati per seguire istruzioni, integra capacità di pensiero e ragionamento che migliorano significativamente le prestazioni nei compiti complessi. QwQ-32B è un modello di medie dimensioni competitivo con i migliori modelli di ragionamento come DeepSeek-R1 e o1-mini. Utilizza RoPE, SwiGLU, RMSNorm e bias QKV nell'attenzione, con 64 layer e 40 teste di attenzione Q (8 KV in GQA).",
"Qwen/Qwen-Image-Edit-2509.description": "Qwen-Image-Edit-2509 è l'ultima versione di editing dell'immagine sviluppata dal team Qwen. Basato sul modello Qwen-Image da 20B, estende le potenti capacità di rendering del testo all'editing delle immagini per modifiche testuali precise. Utilizza un'architettura a doppio controllo, inviando gli input a Qwen2.5-VL per il controllo semantico e a un encoder VAE per il controllo dell'aspetto, consentendo modifiche sia semantiche che visive. Supporta modifiche locali (aggiunta/rimozione/modifica) e modifiche semantiche di alto livello come la creazione di IP e il trasferimento di stile, preservando il significato originale. Ottiene risultati SOTA in numerosi benchmark.",
"Qwen/Qwen-Image.description": "Qwen-Image è un modello di base per la generazione di immagini con 20 miliardi di parametri, sviluppato dal team Qwen. Offre miglioramenti significativi nel rendering di testo complesso e nell'editing preciso delle immagini, in particolare per testi in cinese e inglese ad alta fedeltà. Supporta layout multilinea e paragrafi mantenendo la coerenza tipografica. Oltre al rendering testuale, supporta una vasta gamma di stili, dal fotorealistico all'anime, e funzionalità avanzate come trasferimento di stile, aggiunta/rimozione di oggetti, miglioramento dei dettagli, modifica del testo e controllo della posa, con l'obiettivo di essere una base completa per la creazione visiva.",
"Qwen/Qwen2-72B-Instruct.description": "Qwen 2 Instruct (72B) offre un'esecuzione precisa delle istruzioni per carichi di lavoro aziendali.",
"Qwen/Qwen2-7B-Instruct.description": "Qwen2-7B-Instruct è un modello da 7B ottimizzato per seguire istruzioni nella serie Qwen2, basato su Transformer, SwiGLU, bias QKV e attenzione a query raggruppate. Gestisce input di grandi dimensioni e si comporta molto bene in benchmark di comprensione, generazione, multilingua, programmazione, matematica e ragionamento, superando la maggior parte dei modelli open source e Qwen1.5-7B-Chat in diverse valutazioni.",
"Qwen/Qwen2-VL-72B-Instruct.description": "Qwen2-VL è l'ultima versione del modello Qwen-VL, che raggiunge risultati SOTA in benchmark visivi come MathVista, DocVQA, RealWorldQA e MTVQA. È in grado di comprendere video di oltre 20 minuti per domande su video, dialoghi e creazione di contenuti. Supporta anche ragionamento complesso e decisioni, integrandosi con dispositivi/robot per azioni guidate dalla visione. Oltre all'inglese e al cinese, può leggere testi in molte lingue, tra cui la maggior parte delle lingue europee, giapponese, coreano, arabo e vietnamita.",
"Qwen/Qwen2.5-14B-Instruct.description": "Qwen2.5-14B-Instruct fa parte della nuova serie LLM di Alibaba Cloud. Il modello da 14B offre miglioramenti significativi nella programmazione e nella matematica, supporta oltre 29 lingue e migliora l'esecuzione delle istruzioni, la comprensione dei dati strutturati e la generazione di output strutturati (in particolare JSON).",
"Qwen/Qwen2.5-32B-Instruct.description": "Qwen2.5-32B-Instruct fa parte della nuova serie LLM di Alibaba Cloud. Il modello da 32B offre miglioramenti significativi nella programmazione e nella matematica, supporta oltre 29 lingue e migliora l'esecuzione delle istruzioni, la comprensione dei dati strutturati e la generazione di output strutturati (in particolare JSON).",
"Qwen/Qwen2.5-72B-Instruct-128K.description": "Qwen2.5-72B-Instruct fa parte della nuova serie LLM di Alibaba Cloud. Il modello da 72B migliora la programmazione e la matematica, supporta fino a 128K di input e oltre 8K di output, offre supporto per oltre 29 lingue e migliora l'esecuzione delle istruzioni e la generazione di output strutturati (in particolare JSON).",
"Qwen/Qwen2.5-72B-Instruct-Turbo.description": "Qwen2.5 è una nuova famiglia di LLM ottimizzata per compiti basati su istruzioni.",
"Qwen/Qwen2.5-72B-Instruct.description": "Qwen2.5-72B-Instruct fa parte della nuova serie LLM di Alibaba Cloud. Il modello da 72B offre miglioramenti significativi nella programmazione e nella matematica, supporta oltre 29 lingue e migliora l'esecuzione delle istruzioni, la comprensione dei dati strutturati e la generazione di output strutturati (in particolare JSON).",
"Qwen/Qwen2.5-7B-Instruct-Turbo.description": "Qwen2.5 è una nuova famiglia di LLM ottimizzata per compiti basati su istruzioni.",
"Qwen/Qwen2.5-7B-Instruct.description": "Qwen2.5-7B-Instruct fa parte della nuova serie LLM di Alibaba Cloud. Il modello da 7B offre miglioramenti significativi nella programmazione e nella matematica, supporta oltre 29 lingue e migliora l'esecuzione delle istruzioni, la comprensione dei dati strutturati e la generazione di output strutturati (in particolare JSON).",
"Qwen/Qwen2.5-Coder-32B-Instruct.description": "Qwen2.5 Coder 32B Instruct è l'ultimo LLM di Alibaba Cloud focalizzato sul codice. Basato su Qwen2.5 e addestrato su 5,5T token, migliora significativamente la generazione di codice, il ragionamento e la correzione, mantenendo le capacità matematiche e generali, fornendo una solida base per agenti di programmazione.",
"Qwen/Qwen2.5-Coder-7B-Instruct.description": "Qwen2.5-Coder-7B-Instruct è l'ultimo LLM di Alibaba Cloud focalizzato sul codice. Basato su Qwen2.5 e addestrato su 5,5T token, migliora significativamente la generazione di codice, il ragionamento e la correzione, mantenendo le capacità matematiche e generali, fornendo una base solida per agenti di programmazione.",
"Qwen/Qwen2.5-VL-32B-Instruct.description": "Qwen2.5-VL-32B-Instruct è un modello multimodale del team Qwen. Riconosce oggetti comuni e analizza testo, grafici, icone, elementi visivi e layout. Come agente visivo, può ragionare e controllare dinamicamente strumenti, inclusi computer e telefoni. Localizza con precisione oggetti e genera output strutturati per fatture e tabelle. Rispetto a Qwen2-VL, RL migliora ulteriormente la matematica e la risoluzione di problemi, con risposte più preferite dagli utenti.",
"Qwen/Qwen2.5-VL-72B-Instruct.description": "Qwen2.5-VL è il modello visione-linguaggio della serie Qwen2.5 con importanti aggiornamenti: comprensione visiva più forte per oggetti, testo, grafici e layout; ragionamento come agente visivo con uso dinamico di strumenti; comprensione di video oltre 1 ora e cattura di eventi chiave; localizzazione precisa di oggetti tramite riquadri o punti; e output strutturati per dati scansionati come fatture e tabelle.",
"Qwen/Qwen3-14B.description": "Qwen3 è un modello Tongyi Qwen di nuova generazione con importanti miglioramenti nel ragionamento, nelle capacità generali, nelle funzionalità agentiche e nelle prestazioni multilingue, e supporta la commutazione tra modalità di pensiero.",
"Qwen/Qwen3-235B-A22B-Instruct-2507.description": "Qwen3-235B-A22B-Instruct-2507 è un modello di punta della serie Qwen3 MoE con 235 miliardi di parametri totali e 22 miliardi attivi. È una versione aggiornata non pensante, focalizzata sul miglioramento del seguito delle istruzioni, del ragionamento logico, della comprensione del testo, della matematica, della scienza, della programmazione e dell'uso degli strumenti. Amplia inoltre la conoscenza multilingue di nicchia e si allinea meglio alle preferenze degli utenti nei compiti soggettivi e aperti.",
"Qwen/Qwen3-235B-A22B-Thinking-2507.description": "Qwen3-235B-A22B-Thinking-2507 è un modello Qwen3 progettato per il ragionamento complesso e avanzato. Utilizza un'architettura MoE con 235 miliardi di parametri totali e circa 22 miliardi attivi per token, ottimizzando l'efficienza. In quanto modello dedicato al pensiero, mostra miglioramenti significativi in logica, matematica, scienza, programmazione e benchmark accademici, raggiungendo prestazioni di alto livello nel pensiero aperto. Migliora anche il seguito delle istruzioni, l'uso degli strumenti e la generazione di testo, supportando nativamente un contesto di 256K per ragionamenti profondi e documenti lunghi.",
"Qwen/Qwen3-235B-A22B.description": "Qwen3 è un modello Tongyi Qwen di nuova generazione con importanti progressi nel ragionamento, nelle capacità generali, nelle funzionalità agentiche e nelle prestazioni multilingue, e supporta la commutazione tra modalità di pensiero.",
"Qwen/Qwen3-30B-A3B-Instruct-2507.description": "Qwen3-30B-A3B-Instruct-2507 è la versione aggiornata non pensante di Qwen3-30B-A3B. È un modello MoE con 30,5 miliardi di parametri totali e 3,3 miliardi attivi. Migliora significativamente il seguito delle istruzioni, il ragionamento logico, la comprensione del testo, la matematica, la scienza, la programmazione e l'uso degli strumenti, amplia la conoscenza multilingue di nicchia e si allinea meglio alle preferenze degli utenti nei compiti soggettivi aperti. Supporta un contesto di 256K. Questo modello è esclusivamente non pensante e non genera tag `<think></think>`.",
"Qwen/Qwen3-30B-A3B-Thinking-2507.description": "Qwen3-30B-A3B-Thinking-2507 è l'ultimo modello pensante della serie Qwen3. È un modello MoE con 30,5 miliardi di parametri totali e 3,3 miliardi attivi, progettato per compiti complessi. Mostra miglioramenti significativi in logica, matematica, scienza, programmazione e benchmark accademici, e migliora il seguito delle istruzioni, l'uso degli strumenti, la generazione di testo e l'allineamento alle preferenze. Supporta nativamente un contesto di 256K ed è estendibile fino a 1 milione di token. Questa versione è progettata per la modalità pensante, con ragionamento dettagliato passo dopo passo e forti capacità agentiche.",
"Qwen/Qwen3-30B-A3B.description": "Qwen3 è un modello Tongyi Qwen di nuova generazione con importanti progressi nel ragionamento, nelle capacità generali, nelle funzionalità agentiche e nelle prestazioni multilingue, e supporta la commutazione tra modalità di pensiero.",
"Qwen/Qwen3-32B.description": "Qwen3 è un modello Tongyi Qwen di nuova generazione con importanti progressi nel ragionamento, nelle capacità generali, nelle funzionalità agentiche e nelle prestazioni multilingue, e supporta la commutazione tra modalità di pensiero.",
"Qwen/Qwen3-8B.description": "Qwen3 è un modello Tongyi Qwen di nuova generazione con importanti progressi nel ragionamento, nelle capacità generali, nelle funzionalità agentiche e nelle prestazioni multilingue, e supporta la commutazione tra modalità di pensiero.",
"Qwen/Qwen3-Coder-30B-A3B-Instruct.description": "Qwen3-Coder-30B-A3B-Instruct è un modello Qwen3 per la programmazione sviluppato dal team Qwen. È ottimizzato per alte prestazioni ed efficienza, potenziando le capacità di codifica. Mostra vantaggi significativi nella programmazione agentica, nelle operazioni automatizzate del browser e nell'uso degli strumenti tra i modelli open source. Supporta nativamente un contesto di 256K ed è estendibile fino a 1 milione di token per una comprensione a livello di codice base. Alimenta la programmazione agentica su piattaforme come Qwen Code e CLINE con un formato dedicato per le chiamate di funzione.",
"Qwen/Qwen3-Coder-480B-A35B-Instruct.description": "Qwen3-Coder-480B-A35B-Instruct è il modello di programmazione più avanzato di Alibaba. È un modello MoE con 480 miliardi di parametri totali e 35 miliardi attivi, che bilancia efficienza e prestazioni. Supporta nativamente un contesto di 256K ed è estendibile fino a 1 milione di token tramite YaRN, permettendo la gestione di grandi basi di codice. Progettato per flussi di lavoro di programmazione agentica, può interagire con strumenti e ambienti per risolvere compiti di programmazione complessi. Raggiunge risultati di punta tra i modelli open source nei benchmark di programmazione e agenti, comparabili a modelli leader come Claude Sonnet 4.",
"Qwen/Qwen3-Next-80B-A3B-Instruct.description": "Qwen3-Next-80B-A3B-Instruct è un modello base di nuova generazione che utilizza l'architettura Qwen3-Next per un'efficienza estrema in addestramento e inferenza. Combina attenzione ibrida (Gated DeltaNet + Gated Attention), MoE altamente sparso e ottimizzazioni per la stabilità dell'addestramento. Con 80 miliardi di parametri totali ma solo ~3 miliardi attivi in inferenza, riduce il calcolo e offre oltre 10 volte il throughput rispetto a Qwen3-32B su contesti >32K. Questa versione ottimizzata per le istruzioni è pensata per compiti generali (senza modalità pensante). Ha prestazioni comparabili a Qwen3-235B in alcuni benchmark e mostra forti vantaggi nei compiti con contesto ultra-lungo.",
"Qwen/Qwen3-Next-80B-A3B-Thinking.description": "Qwen3-Next-80B-A3B-Thinking è un modello base di nuova generazione per il ragionamento complesso. Utilizza l'architettura Qwen3-Next con attenzione ibrida (Gated DeltaNet + Gated Attention) e MoE altamente sparso per un'efficienza estrema in addestramento e inferenza. Con 80 miliardi di parametri totali ma solo ~3 miliardi attivi in inferenza, riduce il calcolo e offre oltre 10 volte il throughput rispetto a Qwen3-32B su contesti >32K. Questa versione pensante è progettata per compiti multi-step come dimostrazioni, sintesi di codice, analisi logica e pianificazione, generando catene di pensiero strutturate. Supera Qwen3-32B-Thinking e batte Gemini-2.5-Flash-Thinking in diversi benchmark.",
"Qwen/Qwen3-Omni-30B-A3B-Captioner.description": "Qwen3-Omni-30B-A3B-Captioner è un modello VLM della serie Qwen3 progettato per generare didascalie di immagini di alta qualità, dettagliate e accurate. Utilizza un'architettura MoE da 30 miliardi di parametri per comprendere a fondo le immagini e produrre descrizioni fluide, eccellendo nella cattura dei dettagli, nella comprensione della scena, nel riconoscimento degli oggetti e nel ragionamento relazionale.",
"Qwen/Qwen3-Omni-30B-A3B-Instruct.description": "Qwen3-Omni-30B-A3B-Instruct è un modello MoE della serie Qwen3 con 30 miliardi di parametri totali e 3 miliardi attivi, che offre prestazioni elevate a un costo di inferenza ridotto. Addestrato su dati multilingue di alta qualità provenienti da più fonti, supporta input multimodali completi (testo, immagini, audio, video) e comprensione e generazione cross-modale.",
"Qwen/Qwen3-Omni-30B-A3B-Thinking.description": "Qwen3-Omni-30B-A3B-Thinking è il componente \"pensante\" principale di Qwen3-Omni. Elabora input multimodali (testo, audio, immagini, video) e svolge ragionamenti complessi a catena, unificando gli input in una rappresentazione condivisa per una comprensione cross-modale profonda. È un modello MoE con 30 miliardi di parametri totali e 3 miliardi attivi, che bilancia ragionamento avanzato ed efficienza computazionale.",
"Qwen/Qwen3-VL-235B-A22B-Instruct.description": "Qwen3-VL-235B-A22B-Instruct è un grande modello Qwen3-VL ottimizzato per le istruzioni, basato su architettura MoE, che offre eccellente comprensione e generazione multimodale. Supporta nativamente un contesto di 256K ed è adatto a servizi multimodali in produzione ad alta concorrenza.",
"Qwen/Qwen3-VL-235B-A22B-Thinking.description": "Qwen3-VL-235B-A22B-Thinking è la versione pensante di punta di Qwen3-VL, ottimizzata per il ragionamento multimodale complesso, il ragionamento su contesti lunghi e l'interazione con agenti in scenari aziendali.",
"Qwen/Qwen3-VL-30B-A3B-Instruct.description": "Qwen3-VL-30B-A3B-Instruct è il modello Qwen3-VL ottimizzato per le istruzioni, con forte comprensione e generazione linguistico-visiva. Supporta nativamente un contesto di 256K per chat multimodali e generazione condizionata da immagini.",
"Qwen/Qwen3-VL-30B-A3B-Thinking.description": "Qwen3-VL-30B-A3B-Thinking è la versione potenziata per il ragionamento di Qwen3-VL, ottimizzata per il ragionamento multimodale, la conversione da immagine a codice e la comprensione visiva complessa. Supporta un contesto di 256K con una maggiore capacità di catena di pensiero.",
"Qwen/Qwen3-VL-32B-Instruct.description": "Qwen3-VL-32B-Instruct è un modello linguistico-visivo del team Qwen con risultati SOTA su diversi benchmark VL. Supporta immagini ad alta risoluzione (megapixel) e offre forte comprensione visiva, OCR multilingue, ancoraggio visivo dettagliato e dialogo visivo. Gestisce compiti multimodali complessi e supporta chiamate di strumenti e completamento con prefisso.",
"Qwen/Qwen3-VL-32B-Thinking.description": "Qwen3-VL-32B-Thinking è ottimizzato per il ragionamento visivo complesso. Include una modalità pensante integrata che genera passaggi intermedi di ragionamento prima delle risposte, migliorando logica multi-step, pianificazione e ragionamento complesso. Supporta immagini megapixel, forte comprensione visiva, OCR multilingue, ancoraggio dettagliato, dialogo visivo, chiamate di strumenti e completamento con prefisso.",
"Qwen/Qwen3-VL-8B-Instruct.description": "Qwen3-VL-8B-Instruct è un modello linguistico-visivo Qwen3 basato su Qwen3-8B-Instruct e addestrato su grandi quantità di dati immagine-testo. Eccelle nella comprensione visiva generale, nel dialogo centrato sulla visione e nel riconoscimento multilingue del testo nelle immagini, adatto a QA visivo, didascalie, seguito di istruzioni multimodali e uso di strumenti.",
"Qwen/Qwen3-VL-8B-Thinking.description": "Qwen3-VL-8B-Thinking è la versione visiva pensante di Qwen3, ottimizzata per il ragionamento complesso multi-step. Genera una catena di pensiero prima delle risposte per migliorarne l'accuratezza, ideale per QA visivo profondo e analisi dettagliata delle immagini.",
"Qwen2-72B-Instruct.description": "Qwen2 è l'ultima versione della serie Qwen, con supporto per una finestra di contesto di 128k. Rispetto ai migliori modelli open attuali, Qwen2-72B supera significativamente i principali modelli in comprensione del linguaggio naturale, conoscenza, programmazione, matematica e capacità multilingue.",
"Qwen2-7B-Instruct.description": "Qwen2 è l'ultima versione della serie Qwen, che supera i migliori modelli open della stessa dimensione e persino modelli più grandi. Qwen2 7B mostra vantaggi significativi in diversi benchmark, in particolare nella programmazione e nella comprensione del cinese.",
"Qwen2-VL-72B.description": "Qwen2-VL-72B è un potente modello visione-linguaggio che supporta l'elaborazione multimodale immagine-testo, riconoscendo accuratamente i contenuti visivi e generando descrizioni o risposte pertinenti.",
"Qwen2.5-14B-Instruct.description": "Qwen2.5-14B-Instruct è un LLM da 14 miliardi di parametri con prestazioni elevate, ottimizzato per scenari in cinese e multilingue, con supporto per domande e risposte intelligenti e generazione di contenuti.",
"Qwen2.5-32B-Instruct.description": "Qwen2.5-32B-Instruct è un LLM da 32 miliardi di parametri con prestazioni bilanciate, ottimizzato per scenari in cinese e multilingue, con supporto per domande e risposte intelligenti e generazione di contenuti.",
"Qwen2.5-72B-Instruct.description": "LLM per cinese e inglese, ottimizzato per linguaggio, programmazione, matematica e ragionamento.",
"Qwen2.5-7B-Instruct.description": "Qwen2.5-7B-Instruct è un LLM da 7 miliardi di parametri che supporta chiamate a funzioni e integrazione fluida con sistemi esterni, migliorando notevolmente flessibilità ed estensibilità. È ottimizzato per scenari in cinese e multilingue, con supporto per domande e risposte intelligenti e generazione di contenuti.",
"Qwen2.5-Coder-14B-Instruct.description": "Qwen2.5-Coder-14B-Instruct è un modello di istruzioni per la programmazione su larga scala, con eccellenti capacità di comprensione e generazione di codice. Gestisce in modo efficiente una vasta gamma di compiti di programmazione, ideale per codifica intelligente, generazione automatica di script e domande e risposte sulla programmazione.",
"Qwen2.5-Coder-32B-Instruct.description": "LLM avanzato per generazione di codice, ragionamento e correzione di bug nei principali linguaggi di programmazione.",
"Qwen3-235B-A22B-Instruct-2507-FP8.description": "Qwen3 235B A22B Instruct 2507 è ottimizzato per ragionamento avanzato e seguire istruzioni, utilizzando MoE per mantenere l'efficienza del ragionamento su larga scala.",
"Qwen3-235B.description": "Qwen3-235B-A22B è un modello MoE che introduce una modalità di ragionamento ibrida, consentendo agli utenti di passare senza interruzioni tra pensiero e non-pensiero. Supporta comprensione e ragionamento in 119 lingue e dialetti e ha forti capacità di utilizzo di strumenti, competendo con modelli di punta come DeepSeek R1, OpenAI o1, o3-mini, Grok 3 e Google Gemini 2.5 Pro nei benchmark su abilità generali, codice e matematica, capacità multilingue e ragionamento basato sulla conoscenza.",
"Qwen3-32B.description": "Qwen3-32B è un modello denso che introduce una modalità di ragionamento ibrida, consentendo agli utenti di passare tra pensiero e non-pensiero. Grazie a miglioramenti architetturali, più dati e un addestramento migliore, offre prestazioni comparabili a Qwen2.5-72B.",
"SenseChat-128K.description": "Base V4 con contesto da 128K, eccellente nella comprensione e generazione di testi lunghi.",
"SenseChat-32K.description": "Base V4 con contesto da 32K, flessibile per molti scenari.",
"SenseChat-5-1202.description": "Ultima versione basata su V5.5, con miglioramenti significativi nelle basi di cinese/inglese, chat, conoscenze STEM, umanistiche, scrittura, matematica/logica e controllo della lunghezza.",
"SenseChat-5-Cantonese.description": "Progettato per le abitudini di dialogo di Hong Kong, slang e conoscenze locali; supera GPT-4 nella comprensione del cantonese e rivaleggia con GPT-4 Turbo in conoscenza, ragionamento, matematica e programmazione.",
"SenseChat-5-beta.description": "Alcune prestazioni superano SenseChat-5-1202.",
"SenseChat-5.description": "Ultima versione V5.5 con contesto da 128K; grandi miglioramenti nel ragionamento matematico, chat in inglese, esecuzione di istruzioni e comprensione di testi lunghi, comparabile a GPT-4o.",
"SenseChat-Character-Pro.description": "Modello avanzato per chat con personaggi, con contesto da 32K, capacità migliorate e supporto per cinese/inglese.",
"SenseChat-Character.description": "Modello standard per chat con personaggi, con contesto da 8K e alta velocità di risposta.",
"SenseChat-Turbo-1202.description": "Ultimo modello leggero che raggiunge oltre il 90% delle capacità del modello completo con costi di inferenza significativamente inferiori.",
"SenseChat-Turbo.description": "Adatto per domande e risposte rapide e scenari di fine-tuning del modello.",
"SenseChat-Vision.description": "Ultima versione V5.5 con input multi-immagine e ampi miglioramenti nelle capacità di riconoscimento di attributi, relazioni spaziali, rilevamento di azioni/eventi, comprensione di scene, riconoscimento delle emozioni, ragionamento basato sul senso comune e comprensione/generazione di testo.",
"SenseChat.description": "Base V4 con contesto da 4K e forti capacità generali.",
"SenseNova-V6-5-Pro.description": "Con aggiornamenti completi ai dati multimodali, linguistici e di ragionamento, oltre all'ottimizzazione della strategia di addestramento, il nuovo modello migliora significativamente il ragionamento multimodale e il seguito delle istruzioni generalizzate, supporta una finestra di contesto fino a 128k e si distingue nei compiti di riconoscimento OCR e IP culturali/turistici.",
"SenseNova-V6-5-Turbo.description": "Con aggiornamenti completi ai dati multimodali, linguistici e di ragionamento, oltre all'ottimizzazione della strategia di addestramento, il nuovo modello migliora significativamente il ragionamento multimodale e il seguito delle istruzioni generalizzate, supporta una finestra di contesto fino a 128k e si distingue nei compiti di riconoscimento OCR e IP culturali/turistici.",
"SenseNova-V6-Pro.description": "Unifica nativamente immagine, testo e video, superando i limiti tradizionali dei modelli multimodali; si posiziona ai vertici su OpenCompass e SuperCLUE.",
"SenseNova-V6-Reasoner.description": "Combina ragionamento profondo visivo e linguistico, supportando pensiero lento e catene complete di ragionamento.",
"SenseNova-V6-Turbo.description": "Unifica nativamente immagine, testo e video, superando i limiti tradizionali dei modelli multimodali. Guida le capacità linguistiche e multimodali di base e si classifica tra i migliori in molte valutazioni.",
"Skylark2-lite-8k.description": "Modello Skylark di seconda generazione. Skylark2-lite offre risposte rapide per scenari in tempo reale e sensibili ai costi, con esigenze di accuratezza inferiori, e una finestra di contesto da 8K.",
"Skylark2-pro-32k.description": "Modello Skylark di seconda generazione. Skylark2-pro offre maggiore accuratezza per generazione di testi complessi come copywriting professionale, scrittura di romanzi e traduzioni di alta qualità, con una finestra di contesto da 32K.",
"Skylark2-pro-4k.description": "Modello Skylark di seconda generazione. Skylark2-pro offre maggiore accuratezza per generazione di testi complessi come copywriting professionale, scrittura di romanzi e traduzioni di alta qualità, con una finestra di contesto da 4K.",
"Skylark2-pro-character-4k.description": "Modello Skylark di seconda generazione. Skylark2-pro-character eccelle nel gioco di ruolo e nella chat, adattando i prompt a stili di personaggi distinti e dialoghi naturali per chatbot, assistenti virtuali e assistenza clienti, con risposte rapide.",
"Skylark2-pro-turbo-8k.description": "Modello Skylark di seconda generazione. Skylark2-pro-turbo-8k offre inferenza più veloce a costi inferiori con una finestra di contesto da 8K.",
"THUDM/GLM-4-32B-0414.description": "GLM-4-32B-0414 è un modello GLM open-source di nuova generazione con 32 miliardi di parametri, comparabile in prestazioni a OpenAI GPT e alla serie DeepSeek V3/R1.",
"THUDM/GLM-4-9B-0414.description": "GLM-4-9B-0414 è un modello GLM da 9 miliardi di parametri che eredita le tecniche di GLM-4-32B offrendo un'implementazione più leggera. Eccelle nella generazione di codice, progettazione web, generazione SVG e scrittura basata su ricerca.",
"THUDM/GLM-4.1V-9B-Thinking.description": "GLM-4.1V-9B-Thinking è un VLM open-source sviluppato da Zhipu AI e Tsinghua KEG Lab, progettato per la cognizione multimodale complessa. Basato su GLM-4-9B-0414, aggiunge ragionamento a catena e RL per migliorare significativamente il ragionamento cross-modale e la stabilità.",
"THUDM/GLM-Z1-32B-0414.description": "GLM-Z1-32B-0414 è un modello di ragionamento profondo costruito a partire da GLM-4-32B-0414 con dati cold-start e RL esteso, ulteriormente addestrato su matematica, codice e logica. Migliora significativamente la capacità matematica e la risoluzione di compiti complessi rispetto al modello base.",
"THUDM/GLM-Z1-9B-0414.description": "GLM-Z1-9B-0414 è un modello GLM compatto da 9 miliardi di parametri che mantiene i punti di forza open-source offrendo capacità impressionanti. Eccelle nel ragionamento matematico e nei compiti generali, guidando la sua classe di dimensione tra i modelli open.",
"THUDM/GLM-Z1-Rumination-32B-0414.description": "GLM-Z1-Rumination-32B-0414 è un modello di ragionamento profondo con capacità di riflessione (valutato rispetto a OpenAI Deep Research). A differenza dei modelli di pensiero profondo tipici, impiega più tempo per risolvere problemi aperti e complessi.",
"THUDM/glm-4-9b-chat.description": "GLM-4-9B-Chat è il modello GLM-4 open-source di Zhipu AI. Eccelle in semantica, matematica, ragionamento, codice e conoscenza. Oltre alla chat multi-turno, supporta navigazione web, esecuzione di codice, chiamate a strumenti personalizzati e ragionamento su testi lunghi. Supporta 26 lingue (inclusi cinese, inglese, giapponese, coreano, tedesco). Ottiene buoni risultati su AlignBench-v2, MT-Bench, MMLU e C-Eval, e supporta fino a 128K di contesto per uso accademico e aziendale.",
"Tongyi-Zhiwen/QwenLong-L1-32B.description": "QwenLong-L1-32B è il primo modello di ragionamento a lungo contesto (LRM) addestrato con RL, ottimizzato per il ragionamento su testi lunghi. Il suo RL con espansione progressiva del contesto consente un trasferimento stabile da contesti brevi a lunghi. Supera OpenAI-o3-mini e Qwen3-235B-A22B in sette benchmark di QA su documenti a lungo contesto, rivaleggiando con Claude-3.7-Sonnet-Thinking. È particolarmente forte in matematica, logica e ragionamento multi-hop.",
"Yi-34B-Chat.description": "Yi-1.5-34B mantiene le forti capacità linguistiche generali della serie, migliorando significativamente logica matematica e programmazione grazie a un addestramento incrementale su 500 miliardi di token di alta qualità.",
"abab5.5-chat.description": "Progettato per scenari di produttività, gestisce compiti complessi e genera testo in modo efficiente per uso professionale.",
"abab5.5s-chat.description": "Progettato per chat con personaggi in cinese, offrendo dialoghi di alta qualità per varie applicazioni.",
"abab6.5g-chat.description": "Progettato per chat con personaggi multilingue, supporta generazione di dialoghi di alta qualità in inglese e altre lingue.",
"abab6.5s-chat.description": "Adatto a un'ampia gamma di compiti NLP, inclusa la generazione di testo e sistemi di dialogo.",
"abab6.5t-chat.description": "Ottimizzato per chat con personaggi in cinese, fornendo dialoghi fluidi che rispettano le abitudini espressive cinesi.",
"accounts/fireworks/models/deepseek-r1.description": "DeepSeek-R1 è un modello linguistico all'avanguardia ottimizzato con apprendimento per rinforzo e dati cold-start, che offre prestazioni eccellenti in ragionamento, matematica e programmazione.",
"accounts/fireworks/models/deepseek-v3.description": "Un potente modello linguistico Mixture-of-Experts (MoE) di DeepSeek con 671 miliardi di parametri totali e 37 miliardi di parametri attivi per token.",
"accounts/fireworks/models/llama-v3-70b-instruct.description": "Meta ha sviluppato e rilasciato la serie di modelli linguistici Meta Llama 3, che include modelli pre-addestrati e ottimizzati per l'uso conversazionale da 8B e 70B. I modelli Llama 3 ottimizzati per le istruzioni sono progettati per l'interazione conversazionale e superano molti modelli open chat esistenti nei benchmark di settore.",
"accounts/fireworks/models/llama-v3-8b-instruct-hf.description": "I modelli Llama 3 ottimizzati per le istruzioni sono progettati per l'interazione conversazionale e superano molti modelli open chat esistenti nei benchmark di settore. Llama 3 8B Instruct (versione HF) è la versione FP16 originale di Llama 3 8B Instruct, con risultati attesi in linea con l'implementazione ufficiale di Hugging Face.",
"accounts/fireworks/models/llama-v3-8b-instruct.description": "Meta ha sviluppato e rilasciato la serie di modelli linguistici Meta Llama 3, una collezione di modelli pre-addestrati e ottimizzati per la generazione di testo da 8B e 70B. I modelli Llama 3 ottimizzati per le istruzioni sono progettati per l'uso conversazionale e superano molti modelli open chat esistenti nei benchmark di settore.",
"accounts/fireworks/models/llama-v3p1-405b-instruct.description": "Meta Llama 3.1 è una famiglia di modelli linguistici multilingue con modelli di generazione pre-addestrati e ottimizzati per le istruzioni nei formati 8B, 70B e 405B. I modelli ottimizzati per le istruzioni sono progettati per il dialogo multilingue e superano molti modelli open e closed chat nei benchmark di settore. Il modello 405B è il più avanzato della famiglia Llama 3.1, utilizzando inferenza FP8 che replica fedelmente l'implementazione di riferimento.",
"accounts/fireworks/models/llama-v3p1-70b-instruct.description": "Meta Llama 3.1 è una famiglia di modelli linguistici multilingue con modelli di generazione pre-addestrati e ottimizzati per le istruzioni nei formati 8B, 70B e 405B. I modelli ottimizzati per le istruzioni sono progettati per il dialogo multilingue e superano molti modelli open e closed chat nei benchmark di settore.",
"accounts/fireworks/models/llama-v3p1-8b-instruct.description": "Meta Llama 3.1 è una famiglia di modelli linguistici multilingue con modelli di generazione pre-addestrati e ottimizzati per le istruzioni nei formati 8B, 70B e 405B. I modelli ottimizzati per le istruzioni sono progettati per il dialogo multilingue e superano molti modelli open e closed chat nei benchmark di settore.",
"accounts/fireworks/models/llama-v3p2-11b-vision-instruct.description": "Un modello di ragionamento visivo ottimizzato per le istruzioni di Meta con 11 miliardi di parametri, progettato per il riconoscimento visivo, il ragionamento su immagini, la generazione di didascalie e domande e risposte basate su immagini. Comprende dati visivi come grafici e tabelle e collega visione e linguaggio generando descrizioni testuali dei dettagli visivi.",
"accounts/fireworks/models/llama-v3p2-3b-instruct.description": "Llama 3.2 3B Instruct è un modello multilingue leggero di Meta, progettato per un'esecuzione efficiente con vantaggi significativi in termini di latenza e costi rispetto ai modelli più grandi. Gli usi tipici includono la riscrittura di query/promt e l'assistenza alla scrittura.",
"accounts/fireworks/models/llama-v3p2-90b-vision-instruct.description": "Un modello di ragionamento visivo ottimizzato per le istruzioni di Meta con 90 miliardi di parametri, progettato per il riconoscimento visivo, il ragionamento su immagini, la generazione di didascalie e domande e risposte basate su immagini. Comprende dati visivi come grafici e tabelle e collega visione e linguaggio generando descrizioni testuali dei dettagli visivi. Nota: questo modello è attualmente fornito in via sperimentale come modello serverless. Per l'uso in produzione, Fireworks potrebbe ritirare il deployment con breve preavviso.",
"accounts/fireworks/models/llama-v3p3-70b-instruct.description": "Llama 3.3 70B Instruct è l'aggiornamento di dicembre del modello Llama 3.1 70B. Migliora l'uso degli strumenti, il supporto multilingue, la matematica e la programmazione rispetto alla versione di luglio 2024. Raggiunge prestazioni leader nel settore in ragionamento, matematica e comprensione delle istruzioni, offrendo prestazioni comparabili al modello 3.1 405B con vantaggi significativi in termini di velocità e costi.",
"accounts/fireworks/models/mistral-small-24b-instruct-2501.description": "Un modello da 24 miliardi di parametri con capacità all'avanguardia comparabili a modelli più grandi.",
"accounts/fireworks/models/mixtral-8x22b-instruct.description": "Mixtral MoE 8x22B Instruct v0.1 è la versione ottimizzata per le istruzioni di Mixtral MoE 8x22B v0.1, con API di completamento chat abilitata.",
"accounts/fireworks/models/mixtral-8x7b-instruct.description": "Mixtral MoE 8x7B Instruct è la versione ottimizzata per le istruzioni di Mixtral MoE 8x7B, con API di completamento chat abilitata.",
"accounts/fireworks/models/mythomax-l2-13b.description": "Una variante migliorata di MythoMix, probabilmente la sua forma più raffinata, che unisce MythoLogic-L2 e Huginn con una tecnica di fusione tensoriale altamente sperimentale. La sua natura unica lo rende eccellente per la narrazione e il gioco di ruolo.",
"accounts/fireworks/models/phi-3-vision-128k-instruct.description": "Phi-3-Vision-128K-Instruct è un modello multimodale leggero e all'avanguardia costruito con dati sintetici e dataset pubblici selezionati, focalizzato su dati testuali e visivi di alta qualità e ad alta intensità di ragionamento. Fa parte della famiglia Phi-3, con una versione multimodale che supporta una lunghezza di contesto di 128K token. Il modello è stato migliorato con fine-tuning supervisionato e ottimizzazione diretta delle preferenze, per garantire un'accurata comprensione delle istruzioni e solide misure di sicurezza.",
"accounts/fireworks/models/qwen-qwq-32b-preview.description": "Il modello Qwen QwQ si concentra sull'avanzamento del ragionamento dell'IA, dimostrando che i modelli open possono competere con quelli closed di frontiera. QwQ-32B-Preview è una versione sperimentale che eguaglia o1 e supera GPT-4o e Claude 3.5 Sonnet nel ragionamento e nell'analisi su GPQA, AIME, MATH-500 e LiveCodeBench. Nota: questo modello è attualmente fornito in via sperimentale come modello serverless. Per l'uso in produzione, Fireworks potrebbe ritirare il deployment con breve preavviso.",
"accounts/fireworks/models/qwen2-vl-72b-instruct.description": "Il modello Qwen-VL da 72B è l'ultima iterazione di Alibaba, frutto di quasi un anno di innovazione.",
"accounts/fireworks/models/qwen2p5-72b-instruct.description": "Qwen2.5 è una serie di modelli linguistici solo decoder sviluppata dal team Qwen e da Alibaba Cloud, disponibile nei formati 0.5B, 1.5B, 3B, 7B, 14B, 32B e 72B, con varianti base e ottimizzate per le istruzioni.",
"accounts/fireworks/models/qwen2p5-coder-32b-instruct.description": "Qwen2.5-Coder è l'ultimo modello linguistico Qwen progettato per la programmazione (precedentemente CodeQwen). Nota: questo modello è attualmente fornito in via sperimentale come modello serverless. Per l'uso in produzione, Fireworks potrebbe ritirare il deployment con breve preavviso.",
"accounts/yi-01-ai/models/yi-large.description": "Yi-Large è un modello linguistico di alto livello che si posiziona appena sotto GPT-4, Gemini 1.5 Pro e Claude 3 Opus nella classifica LMSYS. Eccelle nella capacità multilingue, in particolare in spagnolo, cinese, giapponese, tedesco e francese. Yi-Large è anche adatto agli sviluppatori, utilizzando lo stesso schema API di OpenAI per una facile integrazione.",
"ai21-jamba-1.5-large.description": "Un modello multilingue da 398 miliardi di parametri (94B attivi) con una finestra di contesto di 256K, supporto per chiamate di funzione, output strutturato e generazione ancorata.",
"ai21-jamba-1.5-mini.description": "Un modello multilingue da 52 miliardi di parametri (12B attivi) con una finestra di contesto di 256K, supporto per chiamate di funzione, output strutturato e generazione ancorata.",
"ai21-labs/AI21-Jamba-1.5-Large.description": "Un modello multilingue da 398 miliardi di parametri (94B attivi) con una finestra di contesto di 256K, supporto per chiamate di funzione, output strutturato e generazione ancorata.",
"ai21-labs/AI21-Jamba-1.5-Mini.description": "Un modello multilingue da 52 miliardi di parametri (12B attivi) con una finestra di contesto di 256K, supporto per chiamate di funzione, output strutturato e generazione ancorata.",
"alibaba/qwen-3-14b.description": "Qwen3 è l'ultima generazione della serie Qwen, che offre una gamma completa di modelli densi e MoE. Basato su un addestramento esteso, introduce innovazioni nel ragionamento, nella comprensione delle istruzioni, nelle capacità agentiche e nel supporto multilingue.",
"alibaba/qwen-3-235b.description": "Qwen3 è l'ultima generazione della serie Qwen, che offre una gamma completa di modelli densi e MoE. Basato su un addestramento esteso, introduce innovazioni nel ragionamento, nella comprensione delle istruzioni, nelle capacità agentiche e nel supporto multilingue.",
"alibaba/qwen-3-30b.description": "Qwen3 è l'ultima generazione della serie Qwen, che offre una gamma completa di modelli densi e MoE. Basato su un addestramento esteso, introduce innovazioni nel ragionamento, nella comprensione delle istruzioni, nelle capacità agentiche e nel supporto multilingue.",
"alibaba/qwen-3-32b.description": "Qwen3 è l'ultima generazione della serie Qwen, che offre una gamma completa di modelli densi e MoE. Basato su un addestramento esteso, introduce innovazioni nel ragionamento, nella comprensione delle istruzioni, nelle capacità agentiche e nel supporto multilingue.",
"alibaba/qwen3-coder.description": "Qwen3-Coder-480B-A35B-Instruct è il modello Qwen più avanzato per la programmazione, con ottime prestazioni in attività agentiche di codifica, uso del browser e altri compiti fondamentali, raggiungendo risultati comparabili a Claude Sonnet.",
"amazon/nova-lite.description": "Un modello multimodale a bassissimo costo con elaborazione estremamente rapida di input immagine, video e testo.",
"amazon/nova-micro.description": "Un modello solo testuale che offre una latenza ultra-bassa a un costo molto contenuto.",
"amazon/nova-pro.description": "Un modello multimodale altamente performante con il miglior equilibrio tra accuratezza, velocità e costo per un'ampia gamma di compiti.",
"amazon/titan-embed-text-v2.description": "Amazon Titan Text Embeddings V2 è un modello di embedding multilingue leggero ed efficiente che supporta dimensioni di 1024, 512 e 256.",
"anthropic.claude-3-5-sonnet-20240620-v1:0.description": "Claude 3.5 Sonnet alza lo standard del settore, superando i concorrenti e Claude 3 Opus in valutazioni ampie, mantenendo velocità e costi di fascia media.",
"anthropic.claude-3-5-sonnet-20241022-v2:0.description": "Claude 3.5 Sonnet alza lo standard del settore, superando i concorrenti e Claude 3 Opus in valutazioni ampie, mantenendo velocità e costi di fascia media.",
"anthropic.claude-3-haiku-20240307-v1:0.description": "Claude 3 Haiku è il modello più veloce e compatto di Anthropic, progettato per risposte quasi istantanee a domande semplici. Offre esperienze AI fluide e simili a quelle umane e supporta input immagine con una finestra di contesto di 200K.",
"anthropic.claude-3-opus-20240229-v1:0.description": "Claude 3 Opus è il modello AI più potente di Anthropic, con prestazioni all'avanguardia in compiti altamente complessi. Gestisce prompt aperti e scenari inediti con eccezionale fluidità e comprensione simile a quella umana, e supporta input immagine con una finestra di contesto di 200K.",
"anthropic.claude-3-sonnet-20240229-v1:0.description": "Claude 3 Sonnet bilancia intelligenza e velocità per carichi di lavoro aziendali, offrendo un ottimo valore a costi contenuti. È progettato come un modello affidabile per implementazioni AI su larga scala e supporta input immagine con una finestra di contesto di 200K.",
"anthropic.claude-instant-v1.description": "Un modello veloce, economico ma capace per chat quotidiane, analisi testuale, riassunti e domande su documenti.",
"anthropic.claude-v2.description": "Un modello altamente capace per compiti che vanno dal dialogo complesso alla generazione creativa fino al rispetto dettagliato delle istruzioni.",
"anthropic.claude-v2:1.description": "Una versione aggiornata di Claude 2 con il doppio della finestra di contesto e miglioramenti in affidabilità, riduzione delle allucinazioni e accuratezza basata su prove per documenti lunghi e RAG.",
"anthropic/claude-3-haiku.description": "Claude 3 Haiku è il modello più veloce di Anthropic, progettato per carichi di lavoro aziendali con prompt lunghi. Può analizzare rapidamente documenti estesi come report trimestrali, contratti o casi legali a metà del costo dei concorrenti.",
"anthropic/claude-3-opus.description": "Claude 3 Opus è il modello più intelligente di Anthropic, con prestazioni leader di mercato in compiti altamente complessi, gestendo prompt aperti e scenari inediti con eccezionale fluidità e comprensione simile a quella umana.",
"anthropic/claude-3.5-haiku.description": "Claude 3.5 Haiku offre velocità migliorata, accuratezza nel codice e uso degli strumenti, adatto a scenari con requisiti elevati di velocità e interazione con strumenti.",
"anthropic/claude-3.5-sonnet.description": "Claude 3.5 Sonnet è il modello veloce ed efficiente della famiglia Sonnet, con migliori prestazioni in codifica e ragionamento; alcune versioni sono gradualmente sostituite da Sonnet 3.7 e successivi.",
"anthropic/claude-3.7-sonnet.description": "Claude 3.7 Sonnet è un modello Sonnet aggiornato con ragionamento e codifica potenziati, adatto a compiti complessi di livello aziendale.",
"anthropic/claude-haiku-4.5.description": "Claude Haiku 4.5 è il modello veloce ad alte prestazioni di Anthropic, con latenza molto bassa e alta accuratezza.",
"anthropic/claude-opus-4.1.description": "Opus 4.1 è il modello di fascia alta di Anthropic, ottimizzato per programmazione, ragionamento complesso e compiti di lunga durata.",
"anthropic/claude-opus-4.5.description": "Claude Opus 4.5 è il modello di punta di Anthropic, che combina intelligenza di alto livello con prestazioni scalabili per compiti complessi e ragionamento di alta qualità.",
"anthropic/claude-opus-4.description": "Opus 4 è il modello di punta di Anthropic, progettato per compiti complessi e applicazioni aziendali.",
"anthropic/claude-sonnet-4.5.description": "Claude Sonnet 4.5 è l'ultimo modello di ragionamento ibrido di Anthropic, ottimizzato per ragionamento complesso e codifica.",
"anthropic/claude-sonnet-4.description": "Claude Sonnet 4 è il modello di ragionamento ibrido di Anthropic con capacità miste di pensiero e non-pensiero.",
"ascend-tribe/pangu-pro-moe.description": "Pangu-Pro-MoE 72B-A16B è un LLM sparso con 72 miliardi di parametri totali e 16 miliardi attivi, basato su un'architettura MoE raggruppata (MoGE). Raggruppa gli esperti durante la selezione e vincola i token ad attivare un numero uguale di esperti per gruppo, bilanciando il carico e migliorando l'efficienza di distribuzione su Ascend.",
"aya.description": "Aya 23 è il modello multilingue di Cohere che supporta 23 lingue per casi d'uso diversificati.",
"aya:35b.description": "Aya 23 è il modello multilingue di Cohere che supporta 23 lingue per casi d'uso diversificati.",
"azure-DeepSeek-R1-0528.description": "Distribuito da Microsoft; DeepSeek R1 è stato aggiornato a DeepSeek-R1-0528. L'aggiornamento aumenta la potenza di calcolo e le ottimizzazioni post-addestramento, migliorando significativamente la profondità di ragionamento e l'inferenza. Ottiene ottimi risultati in matematica, programmazione e logica generale, avvicinandosi a modelli leader come O3 e Gemini 2.5 Pro.",
"baichuan-m2-32b.description": "Baichuan M2 32B è un modello MoE di Baichuan Intelligence con forte capacità di ragionamento.",
"baichuan/baichuan2-13b-chat.description": "Baichuan-13B è un LLM open-source e commercialmente utilizzabile con 13 miliardi di parametri, che ottiene risultati di riferimento eccellenti per la sua dimensione su benchmark autorevoli in cinese e inglese.",
"baidu/ERNIE-4.5-300B-A47B.description": "ERNIE-4.5-300B-A47B è un LLM MoE di Baidu con 300 miliardi di parametri totali e 47 miliardi attivi per token, che bilancia prestazioni elevate ed efficienza computazionale. Come modello centrale di ERNIE 4.5, eccelle in comprensione, generazione, ragionamento e programmazione. Utilizza un metodo di pre-addestramento multimodale eterogeneo MoE con addestramento congiunto testo-visione per potenziare le capacità generali, in particolare nel seguire istruzioni e nella conoscenza del mondo.",
"baidu/ernie-5.0-thinking-preview.description": "ERNIE 5.0 Thinking Preview è il modello ERNIE multimodale nativo di nuova generazione di Baidu, forte nella comprensione multimodale, nel seguire istruzioni, nella creazione, nelle domande e risposte fattuali e nell'uso di strumenti.",
"black-forest-labs/flux-1.1-pro.description": "FLUX 1.1 Pro è una versione più veloce e migliorata di FLUX Pro con eccellente qualità delle immagini e aderenza ai prompt.",
"black-forest-labs/flux-dev.description": "FLUX Dev è la versione di sviluppo di FLUX per uso non commerciale.",
"black-forest-labs/flux-pro.description": "FLUX Pro è il modello FLUX professionale per output di immagini di alta qualità.",
"black-forest-labs/flux-schnell.description": "FLUX Schnell è un modello di generazione immagini veloce ottimizzato per la rapidità.",
"c4ai-aya-expanse-32b.description": "Aya Expanse è un modello multilingue ad alte prestazioni da 32B che utilizza l'istruction tuning, l'arbitraggio dei dati, l'addestramento basato sulle preferenze e la fusione di modelli per competere con i modelli monolingue. Supporta 23 lingue.",
"c4ai-aya-expanse-8b.description": "Aya Expanse è un modello multilingue ad alte prestazioni da 8B che utilizza l'istruction tuning, l'arbitraggio dei dati, l'addestramento basato sulle preferenze e la fusione di modelli per competere con i modelli monolingue. Supporta 23 lingue.",
"c4ai-aya-vision-32b.description": "Aya Vision è un modello multimodale all'avanguardia che offre prestazioni eccellenti nei principali benchmark di linguaggio, testo e visione. Supporta 23 lingue. Questa versione da 32B è focalizzata su prestazioni multilingue di livello superiore.",
"c4ai-aya-vision-8b.description": "Aya Vision è un modello multimodale all'avanguardia che offre prestazioni eccellenti nei principali benchmark di linguaggio, testo e visione. Questa versione da 8B è ottimizzata per bassa latenza e prestazioni elevate.",
"charglm-3.description": "CharGLM-3 è progettato per il gioco di ruolo e la compagnia emotiva, supportando una memoria multi-turno ultra-lunga e dialoghi personalizzati.",
"charglm-4.description": "CharGLM-4 è progettato per il gioco di ruolo e la compagnia emotiva, supportando una memoria multi-turno ultra-lunga e dialoghi personalizzati.",
"chatgpt-4o-latest.description": "ChatGPT-4o è un modello dinamico aggiornato in tempo reale, che combina comprensione e generazione avanzate per casi d'uso su larga scala come assistenza clienti, istruzione e supporto tecnico.",
"claude-2.0.description": "Claude 2 introduce miglioramenti chiave per le imprese, tra cui un contesto leader da 200.000 token, riduzione delle allucinazioni, prompt di sistema e una nuova funzione di test: chiamata agli strumenti.",
"claude-2.1.description": "Claude 2 introduce miglioramenti chiave per le imprese, tra cui un contesto leader da 200.000 token, riduzione delle allucinazioni, prompt di sistema e una nuova funzione di test: chiamata agli strumenti.",
"claude-3-5-haiku-20241022.description": "Claude 3.5 Haiku è il modello di nuova generazione più veloce di Anthropic. Rispetto a Claude 3 Haiku, migliora in tutte le competenze e supera il precedente modello di punta Claude 3 Opus in molti benchmark di intelligenza.",
"claude-3-5-haiku-latest.description": "Claude 3.5 Haiku fornisce risposte rapide per attività leggere.",
"claude-3-7-sonnet-20250219.description": "Claude 3.7 Sonnet è il modello più intelligente di Anthropic e il primo modello di ragionamento ibrido sul mercato. È in grado di fornire risposte quasi istantanee o ragionamenti dettagliati passo dopo passo visibili all'utente. Sonnet eccelle in programmazione, data science, visione e compiti per agenti.",
"claude-3-7-sonnet-latest.description": "Claude 3.7 Sonnet è il modello più recente e avanzato di Anthropic per compiti altamente complessi, eccellendo in prestazioni, intelligenza, fluidità e comprensione.",
"claude-3-haiku-20240307.description": "Claude 3 Haiku è il modello più veloce e compatto di Anthropic, progettato per risposte quasi istantanee con prestazioni rapide e accurate.",
"claude-3-opus-20240229.description": "Claude 3 Opus è il modello più potente di Anthropic per compiti altamente complessi, eccellendo in prestazioni, intelligenza, fluidità e comprensione.",
"claude-3-sonnet-20240229.description": "Claude 3 Sonnet bilancia intelligenza e velocità per carichi di lavoro aziendali, offrendo alta utilità a costi inferiori e distribuzione affidabile su larga scala.",
"claude-haiku-4-5-20251001.description": "Claude Haiku 4.5 è il modello Haiku più veloce e intelligente di Anthropic, con velocità fulminea e capacità di ragionamento esteso.",
"claude-opus-4-1-20250805-thinking.description": "Claude Opus 4.1 Thinking è una variante avanzata in grado di mostrare il proprio processo di ragionamento.",
"claude-opus-4-1-20250805.description": "Claude Opus 4.1 è il modello più recente e potente di Anthropic per compiti altamente complessi, eccellendo in prestazioni, intelligenza, fluidità e comprensione.",
"claude-opus-4-20250514.description": "Claude Opus 4 è il modello più potente di Anthropic per compiti altamente complessi, eccellente in prestazioni, intelligenza, fluidità e comprensione.",
"claude-opus-4-5-20251101.description": "Claude Opus 4.5 è il modello di punta di Anthropic, che combina intelligenza eccezionale e prestazioni scalabili, ideale per compiti complessi che richiedono risposte e ragionamenti di altissima qualità.",
"claude-sonnet-4-20250514-thinking.description": "Claude Sonnet 4 Thinking può produrre risposte quasi istantanee o riflessioni estese passo dopo passo con processo visibile.",
"claude-sonnet-4-20250514.description": "Claude Sonnet 4 può fornire risposte quasi istantanee o ragionamenti dettagliati passo dopo passo con processo visibile.",
"claude-sonnet-4-5-20250929.description": "Claude Sonnet 4.5 è il modello più intelligente di Anthropic fino ad oggi.",
"codegeex-4.description": "CodeGeeX-4 è un potente assistente di codifica AI che supporta Q&A multilingue e completamento del codice per aumentare la produttività degli sviluppatori.",
"codegeex4-all-9b.description": "CodeGeeX4-ALL-9B è un modello multilingue di generazione di codice che supporta completamento e generazione di codice, interprete di codice, ricerca web, chiamata di funzioni e Q&A a livello di repository, coprendo un'ampia gamma di scenari di sviluppo software. È un modello di codice di alto livello con meno di 10B parametri.",
"codegemma.description": "CodeGemma è un modello leggero per compiti di programmazione vari, che consente iterazioni rapide e facile integrazione.",
"codegemma:2b.description": "CodeGemma è un modello leggero per compiti di programmazione vari, che consente iterazioni rapide e facile integrazione.",
"codellama.description": "Code Llama è un LLM focalizzato sulla generazione e discussione di codice, con ampio supporto linguistico per i flussi di lavoro degli sviluppatori.",
"codellama/CodeLlama-34b-Instruct-hf.description": "Code Llama è un LLM focalizzato sulla generazione e discussione di codice, con ampio supporto linguistico per i flussi di lavoro degli sviluppatori.",
"codellama:13b.description": "Code Llama è un LLM focalizzato sulla generazione e discussione di codice, con ampio supporto linguistico per i flussi di lavoro degli sviluppatori.",
"codellama:34b.description": "Code Llama è un LLM focalizzato sulla generazione e discussione di codice, con ampio supporto linguistico per i flussi di lavoro degli sviluppatori.",
"codellama:70b.description": "Code Llama è un LLM focalizzato sulla generazione e discussione di codice, con ampio supporto linguistico per i flussi di lavoro degli sviluppatori.",
"codeqwen.description": "CodeQwen1.5 è un modello linguistico di grandi dimensioni addestrato su un ampio set di dati di codice, progettato per compiti di programmazione complessi.",
"codestral-latest.description": "Codestral è il nostro modello di codifica più avanzato; la versione v2 (gennaio 2025) è pensata per compiti a bassa latenza e alta frequenza come FIM, correzione del codice e generazione di test.",
"codestral.description": "Codestral è il primo modello di codice di Mistral AI, che offre un forte supporto alla generazione di codice.",
"codex-mini-latest.description": "codex-mini-latest è un modello o4-mini ottimizzato per Codex CLI. Per l'uso diretto via API, si consiglia di iniziare con gpt-4.1.",
"cogito-2.1:671b.description": "Cogito v2.1 671B è un LLM open-source statunitense gratuito per uso commerciale, con prestazioni paragonabili ai modelli di punta, maggiore efficienza nel ragionamento sui token, contesto lungo da 128k e capacità complessive elevate.",
"cogview-4.description": "CogView-4 è il primo modello open-source di testo-immagine di Zhipu in grado di generare caratteri cinesi. Migliora la comprensione semantica, la qualità delle immagini e la resa del testo in cinese/inglese, supporta prompt bilingue di lunghezza arbitraria e può generare immagini a qualsiasi risoluzione entro intervalli specificati.",
"cohere-command-r-plus.description": "Command R+ è un modello avanzato ottimizzato per RAG, progettato per carichi di lavoro aziendali.",
"cohere-command-r.description": "Command R è un modello generativo scalabile progettato per RAG e l'uso di strumenti, abilitando AI di livello produttivo.",
"cohere/Cohere-command-r-plus.description": "Command R+ è un modello avanzato ottimizzato per RAG, progettato per carichi di lavoro aziendali.",
"cohere/Cohere-command-r.description": "Command R è un modello generativo scalabile progettato per RAG e l'uso di strumenti, abilitando AI di livello produttivo.",
"cohere/command-a.description": "Command A è il modello più potente di Cohere, eccellente nell'uso di strumenti, agenti, RAG e scenari multilingue. Ha una finestra di contesto da 256K, funziona con solo due GPU e offre una produttività superiore del 150% rispetto a Command R+ 08-2024.",
"cohere/command-r-plus.description": "Command R+ è l'ultimo LLM di Cohere ottimizzato per chat e contesto lungo, con prestazioni eccezionali per passare dai prototipi alla produzione.",
"cohere/command-r.description": "Command R è ottimizzato per chat e compiti a contesto lungo, posizionato come modello \"scalabile\" che bilancia alte prestazioni e precisione per passare dai prototipi alla produzione.",
"cohere/embed-v4.0.description": "Un modello che classifica o converte testo, immagini o contenuti misti in embedding.",
"comfyui/flux-dev.description": "FLUX.1 Dev è un modello testo-immagine di alta qualità (1050 passaggi), ideale per output creativi e artistici di livello premium.",
"comfyui/flux-kontext-dev.description": "FLUX.1 Kontext-dev è un modello di editing immagini che supporta modifiche guidate da testo, inclusi ritocchi locali e trasferimento di stile.",
"comfyui/flux-krea-dev.description": "FLUX.1 Krea-dev è un modello testo-immagine con filtri di sicurezza integrati, sviluppato in collaborazione con Krea.",
"comfyui/flux-schnell.description": "FLUX.1 Schnell è un modello testo-immagine ultra-veloce che genera immagini di alta qualità in 1-4 passaggi, ideale per uso in tempo reale e prototipazione rapida.",
"comfyui/stable-diffusion-15.description": "Stable Diffusion 1.5 è un classico modello testo-immagine 512x512, ideale per prototipazione rapida ed esperimenti creativi.",
"comfyui/stable-diffusion-35-inclclip.description": "Stable Diffusion 3.5 con encoder CLIP/T5 integrati non richiede file encoder esterni, adatto a modelli come sd3.5_medium_incl_clips con uso ridotto di risorse.",
"comfyui/stable-diffusion-35.description": "Stable Diffusion 3.5 è un modello testo-immagine di nuova generazione con varianti Large e Medium. Richiede file encoder CLIP esterni e offre eccellente qualità d'immagine e aderenza ai prompt.",
"comfyui/stable-diffusion-custom-refiner.description": "Modello personalizzato SDXL immagine-a-immagine. Usa custom_sd_lobe.safetensors come nome file del modello; se hai un VAE, usa custom_sd_vae_lobe.safetensors. Inserisci i file modello nelle cartelle richieste da Comfy.",
"comfyui/stable-diffusion-custom.description": "Modello personalizzato SD testo-a-immagine. Usa custom_sd_lobe.safetensors come nome file del modello; se hai un VAE, usa custom_sd_vae_lobe.safetensors. Inserisci i file modello nelle cartelle richieste da Comfy.",
"comfyui/stable-diffusion-refiner.description": "Modello SDXL immagine-a-immagine che esegue trasformazioni di alta qualità da immagini in input, supportando trasferimento di stile, restauro e variazioni creative.",
"comfyui/stable-diffusion-xl.description": "SDXL è un modello testo-immagine che supporta generazione ad alta risoluzione 1024x1024 con migliore qualità e dettaglio visivo.",
"command-a-03-2025.description": "Command A è il nostro modello più avanzato, eccellente nell'uso di strumenti, agenti, RAG e scenari multilingue. Ha una finestra di contesto di 256K, funziona con solo due GPU e offre una produttività superiore del 150% rispetto a Command R+ 08-2024.",
"command-light-nightly.description": "Per ridurre il tempo tra le versioni principali, offriamo build notturne di Command. Per la serie command-light si chiama command-light-nightly. È la versione più recente ed esperimentale (potenzialmente instabile), aggiornata regolarmente senza preavviso, quindi non è consigliata per ambienti di produzione.",
"command-light.description": "Una variante Command più piccola e veloce, quasi altrettanto capace ma più rapida.",
"command-nightly.description": "Per ridurre il tempo tra le versioni principali, offriamo build notturne di Command. Per la serie Command si chiama command-nightly. È la versione più recente ed esperimentale (potenzialmente instabile), aggiornata regolarmente senza preavviso, quindi non è consigliata per ambienti di produzione.",
"command-r-03-2024.description": "Command R è un modello di chat che segue istruzioni, con qualità superiore, maggiore affidabilità e una finestra di contesto più lunga rispetto ai modelli precedenti. Supporta flussi di lavoro complessi come generazione di codice, RAG, uso di strumenti e agenti.",
"command-r-08-2024.description": "command-r-08-2024 è una versione aggiornata del modello Command R rilasciata ad agosto 2024.",
"command-r-plus-04-2024.description": "command-r-plus è un alias di command-r-plus-04-2024, quindi usare command-r-plus nell'API punta a quel modello.",
"command-r-plus-08-2024.description": "Command R+ è un modello di chat che segue istruzioni, con qualità superiore, maggiore affidabilità e una finestra di contesto più lunga rispetto ai modelli precedenti. È ideale per flussi di lavoro RAG complessi e uso multi-step di strumenti.",
"command-r-plus.description": "Command R+ è un LLM ad alte prestazioni progettato per scenari aziendali reali e applicazioni complesse.",
"command-r.description": "Command R è un LLM ottimizzato per chat e compiti a lungo contesto, ideale per interazioni dinamiche e gestione della conoscenza.",
"command-r7b-12-2024.description": "command-r7b-12-2024 è un aggiornamento piccolo ed efficiente rilasciato a dicembre 2024. Eccelle in RAG, uso di strumenti e compiti per agenti che richiedono ragionamento complesso multi-step.",
"command.description": "Un modello di chat che segue istruzioni, offrendo maggiore qualità e affidabilità nei compiti linguistici, con una finestra di contesto più lunga rispetto ai nostri modelli generativi base.",
"computer-use-preview.description": "computer-use-preview è un modello specializzato per lo strumento \"uso del computer\", addestrato per comprendere ed eseguire compiti legati al computer.",
"dall-e-2.description": "Modello DALL·E di seconda generazione con generazione di immagini più realistica e accurata e risoluzione 4× rispetto alla prima generazione.",
"dall-e-3.description": "L'ultimo modello DALL·E, rilasciato a novembre 2023, supporta generazione di immagini più realistica e accurata con maggiore dettaglio.",
"databricks/dbrx-instruct.description": "DBRX Instruct offre una gestione delle istruzioni altamente affidabile in diversi settori.",
"deepseek-ai/DeepSeek-OCR.description": "DeepSeek-OCR è un modello visione-linguaggio sviluppato da DeepSeek AI, specializzato in OCR e \"compressione ottica contestuale\". Esplora la compressione del contesto dalle immagini, elabora documenti in modo efficiente e li converte in testo strutturato (ad esempio, Markdown). Riconosce accuratamente il testo nelle immagini, risultando ideale per la digitalizzazione di documenti, l'estrazione di testo e l'elaborazione strutturata.",
"deepseek-ai/DeepSeek-R1-0528-Qwen3-8B.description": "DeepSeek-R1-0528-Qwen3-8B distilla il ragionamento a catena da DeepSeek-R1-0528 nel modello base Qwen3 8B. Raggiunge lo stato dell'arte tra i modelli open-source, superando Qwen3 8B del 10% su AIME 2024 e uguagliando le prestazioni di Qwen3-235B-thinking. Eccelle nei benchmark di ragionamento matematico, programmazione e logica generale. Condivide l'architettura di Qwen3-8B ma utilizza il tokenizer di DeepSeek-R1-0528.",
"deepseek-ai/DeepSeek-R1-0528.description": "DeepSeek R1 sfrutta maggiore potenza computazionale e ottimizzazioni algoritmiche post-addestramento per approfondire il ragionamento. Ottiene risultati eccellenti nei benchmark di matematica, programmazione e logica generale, avvicinandosi a modelli leader come o3 e Gemini 2.5 Pro.",
"deepseek-ai/DeepSeek-R1-Distill-Llama-70B.description": "I modelli distillati DeepSeek-R1 utilizzano apprendimento per rinforzo (RL) e dati cold-start per migliorare il ragionamento e stabilire nuovi benchmark multi-task per modelli open-source.",
"deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B.description": "I modelli distillati DeepSeek-R1 utilizzano apprendimento per rinforzo (RL) e dati cold-start per migliorare il ragionamento e stabilire nuovi benchmark multi-task per modelli open-source.",
"deepseek-ai/DeepSeek-R1-Distill-Qwen-14B.description": "I modelli distillati DeepSeek-R1 utilizzano apprendimento per rinforzo (RL) e dati cold-start per migliorare il ragionamento e stabilire nuovi benchmark multi-task per modelli open-source.",
"deepseek-ai/DeepSeek-R1-Distill-Qwen-32B.description": "DeepSeek-R1-Distill-Qwen-32B è distillato da Qwen2.5-32B e ottimizzato su 800.000 campioni curati da DeepSeek-R1. Eccelle in matematica, programmazione e ragionamento, ottenendo risultati di rilievo su AIME 2024, MATH-500 (94,3% di accuratezza) e GPQA Diamond.",
"deepseek-ai/DeepSeek-R1-Distill-Qwen-7B.description": "DeepSeek-R1-Distill-Qwen-7B è distillato da Qwen2.5-Math-7B e ottimizzato su 800.000 campioni curati da DeepSeek-R1. Ottiene prestazioni elevate: 92,8% su MATH-500, 55,5% su AIME 2024 e un punteggio CodeForces di 1189 per un modello da 7B.",
"deepseek-ai/DeepSeek-R1.description": "DeepSeek-R1 migliora il ragionamento grazie a dati cold-start e apprendimento per rinforzo, stabilendo nuovi benchmark multi-task per modelli open-source e superando OpenAI-o1-mini.",
"deepseek-ai/DeepSeek-V2.5.description": "DeepSeek-V2.5 aggiorna DeepSeek-V2-Chat e DeepSeek-Coder-V2-Instruct, combinando capacità generali e di programmazione. Migliora la scrittura e il rispetto delle istruzioni per un migliore allineamento alle preferenze, con progressi significativi su AlpacaEval 2.0, ArenaHard, AlignBench e MT-Bench.",
"deepseek-ai/DeepSeek-V3.1-Terminus.description": "DeepSeek-V3.1-Terminus è una versione aggiornata del modello V3.1, concepito come agente ibrido LLM. Risolve problemi segnalati dagli utenti e migliora stabilità, coerenza linguistica e riduce caratteri anomali o misti cinese/inglese. Integra modalità di pensiero e non-pensiero con template di chat per passaggi flessibili. Migliora anche le prestazioni di Code Agent e Search Agent per un uso più affidabile degli strumenti e compiti multi-step.",
"deepseek-ai/DeepSeek-V3.1.description": "DeepSeek V3.1 utilizza un'architettura di ragionamento ibrida e supporta sia modalità di pensiero che non-pensiero.",
"deepseek-ai/DeepSeek-V3.2-Exp.description": "DeepSeek-V3.2-Exp è una versione sperimentale che fa da ponte verso la prossima architettura. Aggiunge DeepSeek Sparse Attention (DSA) sopra V3.1-Terminus per migliorare l'efficienza nell'addestramento e inferenza su contesti lunghi, con ottimizzazioni per l'uso di strumenti, comprensione di documenti lunghi e ragionamento multi-step. Ideale per esplorare una maggiore efficienza di ragionamento con budget di contesto estesi.",
"deepseek-ai/DeepSeek-V3.description": "DeepSeek-V3 è un modello MoE da 671 miliardi di parametri che utilizza MLA e DeepSeekMoE con bilanciamento del carico senza perdite per un addestramento e inferenza efficienti. Preaddestrato su 14,8 trilioni di token di alta qualità con SFT e RL, supera altri modelli open-source e si avvicina ai modelli chiusi leader.",
"deepseek-ai/deepseek-llm-67b-chat.description": "DeepSeek LLM Chat (67B) è un modello innovativo che offre una profonda comprensione linguistica e interazione.",
"deepseek-ai/deepseek-r1.description": "Un modello LLM all'avanguardia, efficiente e potente nel ragionamento, matematica e programmazione.",
"deepseek-ai/deepseek-v3.1-terminus.description": "DeepSeek V3.1 è un modello di nuova generazione per il ragionamento, con capacità avanzate di ragionamento complesso e catena di pensiero per compiti di analisi approfondita.",
"deepseek-ai/deepseek-v3.1.description": "DeepSeek V3.1 è un modello di nuova generazione per il ragionamento, con capacità avanzate di ragionamento complesso e catena di pensiero per compiti di analisi approfondita.",
"deepseek-ai/deepseek-vl2.description": "DeepSeek-VL2 è un modello visione-linguaggio MoE basato su DeepSeekMoE-27B con attivazione sparsa, che raggiunge prestazioni elevate con solo 4,5B di parametri attivi. Eccelle in QA visivo, OCR, comprensione di documenti/tabelle/grafici e grounding visivo.",
"deepseek-chat.description": "Un nuovo modello open-source che combina capacità generali e di programmazione. Mantiene il dialogo generale del modello di chat e la forte capacità di codifica del modello coder, con un migliore allineamento alle preferenze. DeepSeek-V2.5 migliora anche la scrittura e il rispetto delle istruzioni.",
"deepseek-coder-33B-instruct.description": "DeepSeek Coder 33B è un modello linguistico per il codice addestrato su 2 trilioni di token (87% codice, 13% testo in cinese/inglese). Introduce una finestra di contesto da 16K e compiti di completamento nel mezzo, offrendo completamento di codice a livello di progetto e riempimento di frammenti.",
"deepseek-coder-v2.description": "DeepSeek Coder V2 è un modello MoE open-source per il codice che ottiene ottimi risultati nei compiti di programmazione, comparabile a GPT-4 Turbo.",
"deepseek-coder-v2:236b.description": "DeepSeek Coder V2 è un modello MoE open-source per il codice che ottiene ottimi risultati nei compiti di programmazione, comparabile a GPT-4 Turbo.",
"deepseek-ocr.description": "DeepSeek-OCR è un modello visione-linguaggio sviluppato da DeepSeek AI, focalizzato su OCR e \"compressione ottica contestuale\". Esplora la compressione delle informazioni contestuali dalle immagini, elabora documenti in modo efficiente e li converte in formati di testo strutturato come Markdown. Riconosce accuratamente il testo nelle immagini, rendendolo ideale per la digitalizzazione di documenti, l'estrazione di testo e l'elaborazione strutturata.",
"deepseek-r1-0528.description": "Modello completo da 685B rilasciato il 28/05/2025. DeepSeek-R1 utilizza RL su larga scala nel post-addestramento, migliorando notevolmente il ragionamento con dati etichettati minimi, ottenendo ottimi risultati in matematica, programmazione e ragionamento in linguaggio naturale.",
"deepseek-r1-250528.description": "DeepSeek R1 250528 è il modello completo di ragionamento DeepSeek-R1 per compiti complessi di matematica e logica.",
"deepseek-r1-70b-fast-online.description": "DeepSeek R1 70B edizione veloce con ricerca web in tempo reale, offre risposte più rapide mantenendo alte prestazioni.",
"deepseek-r1-70b-online.description": "DeepSeek R1 70B edizione standard con ricerca web in tempo reale, adatto per chat aggiornate e compiti testuali.",
"deepseek-r1-distill-llama-70b.description": "DeepSeek R1 Distill Llama 70B combina il ragionamento R1 con l'ecosistema Llama.",
"deepseek-r1-distill-llama-8b.description": "DeepSeek-R1-Distill-Llama-8B è distillato da Llama-3.1-8B utilizzando output di DeepSeek R1.",
"deepseek-r1-distill-llama.description": "deepseek-r1-distill-llama è distillato da DeepSeek-R1 su Llama.",
"deepseek-r1-distill-qianfan-70b.description": "DeepSeek R1 Distill Qianfan 70B è una distillazione R1 basata su Qianfan-70B con elevato valore.",
"deepseek-r1-distill-qianfan-8b.description": "DeepSeek R1 Distill Qianfan 8B è una distillazione R1 basata su Qianfan-8B per applicazioni di piccole e medie dimensioni.",
"deepseek-r1-distill-qianfan-llama-70b.description": "DeepSeek R1 Distill Qianfan Llama 70B è una distillazione R1 basata su Llama-70B.",
"deepseek-r1-distill-qwen-1.5b.description": "DeepSeek R1 Distill Qwen 1.5B è un modello distillato ultra-leggero per ambienti con risorse molto limitate.",
"deepseek-r1-distill-qwen-14b.description": "DeepSeek R1 Distill Qwen 14B è un modello distillato di medie dimensioni per distribuzioni in scenari multipli.",
"deepseek-r1-distill-qwen-32b.description": "DeepSeek R1 Distill Qwen 32B è una distillazione R1 basata su Qwen-32B, che bilancia prestazioni e costi.",
"deepseek-r1-distill-qwen-7b.description": "DeepSeek R1 Distill Qwen 7B è un modello distillato leggero per ambienti edge e aziendali privati.",
"deepseek-r1-distill-qwen.description": "deepseek-r1-distill-qwen è distillato da DeepSeek-R1 su Qwen.",
"deepseek-r1-fast-online.description": "Versione completa veloce di DeepSeek R1 con ricerca web in tempo reale, che combina capacità su scala 671B e risposte rapide.",
"deepseek-r1-online.description": "Versione completa di DeepSeek R1 con 671B parametri e ricerca web in tempo reale, che offre comprensione e generazione potenziate.",
"deepseek-r1.description": "DeepSeek-R1 utilizza dati cold-start prima dell'RL e ottiene prestazioni comparabili a OpenAI-o1 in matematica, programmazione e ragionamento.",
"meta.llama3-8b-instruct-v1:0.description": "Meta Llama 3 è un LLM open-source pensato per sviluppatori, ricercatori e aziende, progettato per supportare la creazione, la sperimentazione e la scalabilità responsabile di idee basate su IA generativa. Parte integrante dellecosistema globale per linnovazione comunitaria, è ideale per ambienti con risorse limitate, dispositivi edge e tempi di addestramento ridotti.",
"meta/Llama-3.2-11B-Vision-Instruct.description": "Solido ragionamento visivo su immagini ad alta risoluzione, ideale per applicazioni di comprensione visiva.",
"meta/Llama-3.2-90B-Vision-Instruct.description": "Ragionamento visivo avanzato per applicazioni agenti di comprensione visiva.",
"meta/Llama-3.3-70B-Instruct.description": "Llama 3.3 è il modello Llama open-source multilingue più avanzato, con prestazioni paragonabili a modelli da 405B a costi molto contenuti. Basato su architettura Transformer, è migliorato con SFT e RLHF per garantire utilità e sicurezza. La versione ottimizzata per istruzioni eccelle nelle chat multilingue e supera molti modelli, sia open che closed, nei benchmark di settore. Data di cutoff: dicembre 2023.",
"meta/Meta-Llama-3-70B-Instruct.description": "Un potente modello da 70 miliardi di parametri eccellente nel ragionamento, nella programmazione e nei compiti linguistici generali.",
"meta/Meta-Llama-3-8B-Instruct.description": "Un modello versatile da 8 miliardi di parametri ottimizzato per chat e generazione di testo.",
"meta/Meta-Llama-3.1-405B-Instruct.description": "Modello Llama 3.1 ottimizzato per istruzioni, progettato per chat multilingue, con prestazioni elevate nei benchmark industriali tra modelli open e closed.",
"meta/Meta-Llama-3.1-70B-Instruct.description": "Modello Llama 3.1 ottimizzato per istruzioni, progettato per chat multilingue, con prestazioni elevate nei benchmark industriali tra modelli open e closed.",
"meta/Meta-Llama-3.1-8B-Instruct.description": "Modello Llama 3.1 ottimizzato per istruzioni, progettato per chat multilingue, con prestazioni elevate nei benchmark industriali tra modelli open e closed.",
"meta/llama-3-70b.description": "Modello open-source da 70 miliardi di parametri, ottimizzato da Meta per seguire istruzioni, distribuito da Groq su hardware LPU per inferenza rapida ed efficiente.",
"meta/llama-3-8b.description": "Modello open-source da 8 miliardi di parametri, ottimizzato da Meta per seguire istruzioni, distribuito da Groq su hardware LPU per inferenza rapida ed efficiente.",
"meta/llama-3.1-405b-instruct.description": "Modello LLM avanzato che supporta generazione di dati sintetici, distillazione della conoscenza e ragionamento per chatbot, programmazione e compiti specifici di dominio.",
"meta/llama-3.1-70b-instruct.description": "Progettato per dialoghi complessi con eccellente comprensione del contesto, ragionamento e generazione di testo.",
"meta/llama-3.1-70b.description": "Versione aggiornata di Meta Llama 3 70B Instruct con contesto esteso a 128K, supporto multilingue e ragionamento migliorato.",
"meta/llama-3.1-8b-instruct.description": "Modello allavanguardia con solida comprensione linguistica, capacità di ragionamento e generazione di testo.",
"meta/llama-3.1-8b.description": "Llama 3.1 8B supporta una finestra di contesto di 128K, ideale per chat in tempo reale e analisi dei dati, offrendo un notevole risparmio rispetto ai modelli più grandi. Distribuito da Groq su hardware LPU per inferenza rapida ed efficiente.",
"meta/llama-3.2-11b-vision-instruct.description": "Modello linguistico-visivo di frontiera eccellente nel ragionamento di alta qualità a partire da immagini.",
"meta/llama-3.2-11b.description": "Modello ottimizzato per istruzioni e ragionamento su immagini (input testo+immagine, output testo), ideale per riconoscimento visivo, ragionamento su immagini, didascalie e domande generali su immagini.",
"meta/llama-3.2-1b-instruct.description": "Modello linguistico compatto e allavanguardia con forte comprensione, ragionamento e generazione di testo.",
"meta/llama-3.2-1b.description": "Modello solo testo per utilizzi su dispositivo come recupero locale multilingue, sintesi e riscrittura.",
"meta/llama-3.2-3b-instruct.description": "Modello linguistico compatto e allavanguardia con forte comprensione, ragionamento e generazione di testo.",
"meta/llama-3.2-3b.description": "Modello solo testo ottimizzato per utilizzi su dispositivo come recupero locale multilingue, sintesi e riscrittura.",
"meta/llama-3.2-90b-vision-instruct.description": "Modello linguistico-visivo di frontiera eccellente nel ragionamento di alta qualità a partire da immagini.",
"meta/llama-3.2-90b.description": "Modello ottimizzato per istruzioni e ragionamento su immagini (input testo+immagine, output testo), ideale per riconoscimento visivo, ragionamento su immagini, didascalie e domande generali su immagini.",
"meta/llama-3.3-70b-instruct.description": "LLM avanzato con solide capacità di ragionamento, matematica, buon senso e chiamata di funzioni.",
"meta/llama-3.3-70b.description": "Un perfetto equilibrio tra prestazioni ed efficienza. Progettato per IA conversazionale ad alte prestazioni in creazione di contenuti, applicazioni aziendali e ricerca, con forte comprensione linguistica per sintesi, classificazione, analisi del sentiment e generazione di codice.",
"meta/llama-4-maverick.description": "La famiglia Llama 4 è una serie di modelli AI nativamente multimodali che supportano esperienze testuali e multimodali, utilizzando MoE per una comprensione avanzata di testo e immagini. Llama 4 Maverick è un modello da 17B con 128 esperti, distribuito da DeepInfra.",
"meta/llama-4-scout.description": "La famiglia Llama 4 è una serie di modelli AI nativamente multimodali che supportano esperienze testuali e multimodali, utilizzando MoE per una comprensione avanzata di testo e immagini. Llama 4 Scout è un modello da 17B con 16 esperti, distribuito da DeepInfra.",
"microsoft/Phi-3-mini-4k-instruct.description": "Il membro più piccolo della famiglia Phi-3, ottimizzato per qualità e bassa latenza.",
"microsoft/Phi-3-small-128k-instruct.description": "Lo stesso modello Phi-3-small con una finestra contestuale più ampia per RAG o prompt few-shot.",
"microsoft/Phi-3-small-8k-instruct.description": "Un modello da 7 miliardi di parametri con qualità superiore rispetto a Phi-3-mini, focalizzato su dati di alta qualità e ad alta intensità di ragionamento.",
"microsoft/Phi-3.5-mini-instruct.description": "Una versione aggiornata del modello Phi-3-mini.",
"microsoft/Phi-3.5-vision-instruct.description": "Una versione aggiornata del modello Phi-3-vision.",
"microsoft/WizardLM-2-8x22B.description": "WizardLM 2 è un modello linguistico di Microsoft AI eccellente nei dialoghi complessi, nei compiti multilingue, nel ragionamento e negli assistenti.",
"microsoft/wizardlm-2-8x22b.description": "WizardLM-2 8x22B è il modello Wizard più avanzato di Microsoft AI, con prestazioni altamente competitive.",
"minicpm-v.description": "MiniCPM-V è il modello multimodale di nuova generazione di OpenBMB, con eccellenti capacità OCR e comprensione multimodale per un'ampia gamma di casi d'uso.",
"minimax/minimax-m2.description": "MiniMax-M2 è un modello ad alto valore che eccelle nella codifica e nei compiti per agenti in molti scenari ingegneristici.",
"minimaxai/minimax-m2.description": "MiniMax-M2 è un modello MoE compatto, veloce ed economico (230B totali, 10B attivi) progettato per prestazioni di alto livello nella codifica e nei compiti per agenti, mantenendo una forte intelligenza generale. Eccelle in modifiche multi-file, cicli di esecuzione-correzione del codice, validazione dei test e catene di strumenti complesse.",
"ministral-3b-latest.description": "Ministral 3B è il modello edge di punta di Mistral.",
"ministral-8b-latest.description": "Ministral 8B è un modello edge altamente conveniente di Mistral.",
"mistral-ai/Mistral-Large-2411.description": "Il modello di punta di Mistral per compiti complessi che richiedono ragionamento su larga scala o specializzazione (generazione di testo sintetico, generazione di codice, RAG o agenti).",
"mistral-ai/Mistral-Nemo.description": "Mistral Nemo è un LLM all'avanguardia con ragionamento di alto livello, conoscenza del mondo e capacità di codifica per la sua dimensione.",
"mistral-ai/mistral-small-2503.description": "Mistral Small è adatto a qualsiasi compito linguistico che richieda alta efficienza e bassa latenza.",
"mistral-large-instruct.description": "Mistral-Large-Instruct-2407 è un LLM denso avanzato con 123 miliardi di parametri e ragionamento, conoscenza e codifica all'avanguardia.",
"mistral-large-latest.description": "Mistral Large è il modello di punta, forte nei compiti multilingue, nel ragionamento complesso e nella generazione di codice—ideale per applicazioni di fascia alta.",
"mistral-large.description": "Mixtral Large è il modello di punta di Mistral, che combina generazione di codice, matematica e ragionamento con una finestra contestuale di 128K.",
"mistral-medium-latest.description": "Mistral Medium 3 offre prestazioni all'avanguardia a un costo 8× inferiore e semplifica l'implementazione aziendale.",
"mistral-nemo-instruct.description": "Mistral-Nemo-Instruct-2407 è la versione ottimizzata per istruzioni di Mistral-Nemo-Base-2407.",
"mistral-nemo.description": "Mistral Nemo è un modello da 12B ad alta efficienza di Mistral AI e NVIDIA.",
"mistral-small-latest.description": "Mistral Small è un'opzione conveniente, veloce e affidabile per traduzione, sintesi e analisi del sentiment.",
"mistral-small.description": "Mistral Small è adatto a qualsiasi compito linguistico che richieda alta efficienza e bassa latenza.",
"mistral.description": "Mistral è il modello da 7B di Mistral AI, adatto a compiti linguistici vari.",
"mistral/codestral-embed.description": "Un modello di embedding per codici, utile per indicizzare basi di codice e repository a supporto di assistenti alla programmazione.",
"mistral/codestral.description": "Mistral Codestral 25.01 è un modello di codifica all'avanguardia ottimizzato per bassa latenza e uso ad alta frequenza. Supporta oltre 80 linguaggi e si distingue in FIM, correzione del codice e generazione di test.",
"mistral/devstral-small.description": "Devstral è un LLM agentico per compiti di ingegneria del software, rendendolo una scelta solida per agenti software.",
"mistral/magistral-medium.description": "Pensiero complesso supportato da una comprensione profonda con ragionamento trasparente che puoi seguire e verificare. Mantiene un ragionamento ad alta fedeltà tra le lingue, anche a metà compito.",
"mistral/magistral-small.description": "Pensiero complesso supportato da una comprensione profonda con ragionamento trasparente che puoi seguire e verificare. Mantiene un ragionamento ad alta fedeltà tra le lingue, anche a metà compito.",
"mistral/ministral-3b.description": "Un modello compatto ed efficiente per compiti on-device come assistenti e analisi locali, con prestazioni a bassa latenza.",
"mistral/ministral-8b.description": "Un modello più potente con inferenza veloce ed efficiente in memoria, ideale per flussi di lavoro complessi e applicazioni edge esigenti.",
"mistral/mistral-embed.description": "Un modello generale di embedding testuale per ricerca semantica, similarità, clustering e flussi di lavoro RAG.",
"mistral/mistral-large.description": "Mistral Large è ideale per compiti complessi che richiedono forte ragionamento o specializzazione—generazione di testo sintetico, generazione di codice, RAG o agenti.",
"mistral/mistral-small.description": "Mistral Small è ideale per compiti semplici e batchabili come classificazione, supporto clienti o generazione di testo, offrendo ottime prestazioni a un prezzo accessibile.",
"mistral/mixtral-8x22b-instruct.description": "Modello Instruct 8x22B. 8x22B è un modello MoE open source servito da Mistral.",
"mistral/pixtral-12b.description": "Un modello da 12B con comprensione delle immagini e testo.",
"mistral/pixtral-large.description": "Pixtral Large è il secondo modello della nostra famiglia multimodale con comprensione delle immagini di livello avanzato. Gestisce documenti, grafici e immagini naturali mantenendo la comprensione testuale leader di Mistral Large 2.",
"mistralai/Mistral-7B-Instruct-v0.1.description": "Mistral (7B) Instruct è noto per le forti prestazioni in molti compiti linguistici.",
"mistralai/Mistral-7B-Instruct-v0.2.description": "Mistral (7B) Instruct v0.2 migliora la gestione delle istruzioni e l'accuratezza dei risultati.",
"mistralai/Mistral-7B-Instruct-v0.3.description": "Mistral (7B) Instruct v0.3 offre calcolo efficiente e forte comprensione linguistica per molti casi d'uso.",
"mistralai/Mistral-7B-v0.1.description": "Mistral 7B è compatto ma ad alte prestazioni, forte nell'elaborazione batch e in compiti semplici come classificazione e generazione di testo, con solido ragionamento.",
"mistralai/Mixtral-8x22B-Instruct-v0.1.description": "Mixtral-8x22B Instruct (141B) è un LLM molto grande per carichi di lavoro pesanti.",
"mistralai/Mixtral-8x7B-Instruct-v0.1.description": "Mixtral-8x7B Instruct (46.7B) offre alta capacità per l'elaborazione di dati su larga scala.",
"mistralai/Mixtral-8x7B-v0.1.description": "Mixtral 8x7B è un modello MoE sparso che aumenta la velocità di inferenza, adatto a compiti multilingue e generazione di codice.",
"mistralai/mistral-nemo.description": "Mistral Nemo è un modello da 7.3B con supporto multilingue e forti prestazioni nella codifica.",
"o4-mini-deep-research.description": "o4-mini-deep-research è un modello di ricerca approfondita più veloce ed economico per ricerche complesse a più passaggi. Può cercare sul web e accedere ai tuoi dati tramite connettori MCP.",
"o4-mini.description": "o4-mini è l'ultimo modello compatto della serie o, ottimizzato per un ragionamento rapido ed efficace, con alta efficienza nei compiti di programmazione e visione.",
"open-codestral-mamba.description": "Codestral Mamba è un modello linguistico Mamba 2 focalizzato sulla generazione di codice, adatto a compiti avanzati di programmazione e ragionamento.",
"open-mistral-7b.description": "Mistral 7B è compatto ma ad alte prestazioni, ideale per l'elaborazione in batch e compiti semplici come classificazione e generazione di testo, con solide capacità di ragionamento.",
"open-mistral-nemo.description": "Mistral Nemo è un modello da 12B sviluppato in collaborazione con Nvidia, che offre elevate prestazioni in ragionamento e programmazione, con integrazione semplificata.",
"open-mixtral-8x22b.description": "Mixtral 8x22B è un modello MoE di grandi dimensioni per compiti complessi, con forte capacità di ragionamento e throughput elevato.",
"open-mixtral-8x7b.description": "Mixtral 8x7B è un modello MoE sparso che accelera l'inferenza, adatto a compiti multilingue e di generazione di codice.",
"openai/gpt-3.5-turbo-instruct.description": "Capacità simili ai modelli dell'era GPT-3, compatibile con endpoint legacy di completamento piuttosto che chat.",
"openai/gpt-3.5-turbo.description": "Il modello GPT-3.5 più capace ed economico di OpenAI, ottimizzato per la chat ma ancora valido per completamenti classici.",
"openai/gpt-4-turbo.description": "gpt-4-turbo di OpenAI possiede una vasta conoscenza generale e competenze specialistiche, segue istruzioni complesse in linguaggio naturale e risolve problemi difficili con precisione. Il cutoff di conoscenza è aprile 2023 con una finestra di contesto di 128k.",
"openai/gpt-4.1-mini.description": "GPT-4.1 Mini offre una latenza ridotta e un miglior rapporto qualità-prezzo per carichi di lavoro a contesto medio.",
"openai/gpt-4.1-nano.description": "GPT-4.1 Nano è un'opzione a bassissimo costo e latenza per chat brevi ad alta frequenza o classificazione.",
"openai/gpt-4.1.description": "La serie GPT-4.1 offre finestre di contesto più ampie e capacità ingegneristiche e di ragionamento più avanzate.",
"openai/gpt-4o-mini.description": "GPT-4o-mini è una variante compatta e veloce di GPT-4o per utilizzi multimodali a bassa latenza.",
"openai/gpt-4o.description": "La famiglia GPT-4o è il modello Omni di OpenAI con input testuale + immagine e output testuale.",
"openai/gpt-5-chat.description": "GPT-5 Chat è una variante di GPT-5 ottimizzata per conversazioni con latenza ridotta per una migliore interattività.",
"openai/gpt-5-codex.description": "GPT-5-Codex è una variante di GPT-5 ulteriormente ottimizzata per la programmazione e flussi di lavoro su larga scala.",
"openai/gpt-5-mini.description": "GPT-5 Mini è una variante compatta di GPT-5 per scenari a bassa latenza e basso costo.",
"openai/gpt-5-nano.description": "GPT-5 Nano è la variante ultra-compatta per scenari con vincoli stringenti di costo e latenza.",
"openai/gpt-5-pro.description": "GPT-5 Pro è il modello di punta di OpenAI, con capacità avanzate di ragionamento, generazione di codice e funzionalità di livello enterprise, con routing in fase di test e politiche di sicurezza più rigorose.",
"openai/gpt-5.1-chat.description": "GPT-5.1 Chat è il membro leggero della famiglia GPT-5.1, ottimizzato per conversazioni a bassa latenza mantenendo forti capacità di ragionamento ed esecuzione di istruzioni.",
"openai/gpt-5.1-codex-mini.description": "GPT-5.1-Codex-Mini è una versione più piccola e veloce di GPT-5.1-Codex, ideale per scenari di programmazione sensibili a latenza e costi.",
"openai/gpt-5.1-codex.description": "GPT-5.1-Codex è una variante di GPT-5.1 ottimizzata per l'ingegneria del software e i flussi di lavoro di programmazione, adatta a grandi refactoring, debug complessi e compiti autonomi prolungati.",
"openai/gpt-5.1.description": "GPT-5.1 è il nuovo modello di punta della serie GPT-5, con miglioramenti significativi rispetto a GPT-5 nel ragionamento generale, nel seguire istruzioni e nella naturalezza conversazionale, adatto a compiti ampi.",
"openai/gpt-5.description": "GPT-5 è il modello ad alte prestazioni di OpenAI per un'ampia gamma di compiti di produzione e ricerca.",
"openai/gpt-oss-120b.description": "Un LLM generalista altamente capace con ragionamento forte e controllabile.",
"openai/gpt-oss-20b.description": "Un modello linguistico compatto a pesi aperti ottimizzato per bassa latenza e ambienti con risorse limitate, inclusi deployment locali e edge.",
"openai/o1-mini.description": "o1-mini è un modello di ragionamento veloce ed economico progettato per programmazione, matematica e scienze. Ha un contesto di 128K e un cutoff di conoscenza a ottobre 2023.",
"openai/o1-preview.description": "o1 è il nuovo modello di ragionamento di OpenAI per compiti complessi che richiedono ampia conoscenza. Ha un contesto di 128K e un cutoff di conoscenza a ottobre 2023.",
"openai/o1.description": "OpenAI o1 è un modello di ragionamento di punta progettato per problemi complessi che richiedono pensiero profondo, offrendo ragionamento avanzato e maggiore accuratezza nei compiti a più passaggi.",
"openai/o3-mini-high.description": "o3-mini (ragionamento avanzato) offre maggiore intelligenza mantenendo gli stessi obiettivi di costo e latenza di o1-mini.",
"openai/o3-mini.description": "o3-mini è l'ultimo modello compatto di ragionamento di OpenAI, che offre maggiore intelligenza agli stessi livelli di costo e latenza di o1-mini.",
"openai/o3.description": "OpenAI o3 è il modello di ragionamento più potente, stabilendo nuovi standard nello stato dell'arte per programmazione, matematica, scienze e percezione visiva. Eccelle in query complesse e articolate, in particolare nell'analisi di immagini, grafici e diagrammi.",
"openai/o4-mini-high.description": "o4-mini livello di ragionamento avanzato, ottimizzato per ragionamento veloce ed efficiente con elevate prestazioni in programmazione e visione.",
"openai/o4-mini.description": "OpenAI o4-mini è un modello compatto ed efficiente di ragionamento per scenari a bassa latenza.",
"openai/text-embedding-3-large.description": "Il modello di embedding più avanzato di OpenAI per compiti in inglese e in altre lingue.",
"openai/text-embedding-3-small.description": "Variante migliorata e ad alte prestazioni del modello ada di embedding di OpenAI.",
"openai/text-embedding-ada-002.description": "Modello legacy di embedding testuale di OpenAI.",
"openrouter/auto.description": "In base alla lunghezza del contesto, all'argomento e alla complessità, la tua richiesta viene instradata a Llama 3 70B Instruct, Claude 3.5 Sonnet (auto-moderato) o GPT-4o.",
"qwen/qwen2.5-coder-32b-instruct.description": "Un avanzato LLM per la generazione, il ragionamento e la correzione del codice nei principali linguaggi di programmazione.",
"qwen/qwen2.5-coder-7b-instruct.description": "Un solido modello di codice di medie dimensioni con contesto da 32K, eccellente nella programmazione multilingue.",
"qwen/qwen3-14b.description": "Qwen3-14B è la variante da 14B per il ragionamento generale e scenari di chat.",
"qwen/qwen3-14b:free.description": "Qwen3-14B è un LLM causale denso con 14,8 miliardi di parametri, progettato per ragionamento complesso e chat efficiente. Passa da una modalità di pensiero per matematica, programmazione e logica a una modalità non-pensante per la chat generale. Ottimizzato per seguire istruzioni, usare strumenti agentici e scrittura creativa in oltre 100 lingue e dialetti. Supporta nativamente un contesto di 32K e scala fino a 131K con YaRN.",
"qwen/qwen3-235b-a22b-2507.description": "Qwen3-235B-A22B-Instruct-2507 è la variante Instruct della serie Qwen3, che bilancia l'uso multilingue delle istruzioni con scenari a lungo contesto.",
"qwen/qwen3-235b-a22b-thinking-2507.description": "Qwen3-235B-A22B-Thinking-2507 è la variante Thinking di Qwen3, potenziata per compiti complessi di matematica e ragionamento.",
"qwen/qwen3-235b-a22b.description": "Qwen3-235B-A22B è un modello MoE da 235 miliardi di parametri con 22 miliardi attivi per passaggio. Passa da una modalità di pensiero per ragionamento complesso, matematica e codice a una modalità non-pensante per chat efficiente. Offre ragionamento avanzato, supporto multilingue (oltre 100 lingue/dialetti), capacità avanzate di seguire istruzioni e uso di strumenti agentici. Supporta nativamente 32K di contesto e scala fino a 131K con YaRN.",
"qwen/qwen3-235b-a22b:free.description": "Qwen3-235B-A22B è un modello MoE da 235 miliardi di parametri con 22 miliardi attivi per passaggio. Passa da una modalità di pensiero per ragionamento complesso, matematica e codice a una modalità non-pensante per chat efficiente. Offre ragionamento avanzato, supporto multilingue (oltre 100 lingue/dialetti), capacità avanzate di seguire istruzioni e uso di strumenti agentici. Supporta nativamente 32K di contesto e scala fino a 131K con YaRN.",
"qwen/qwen3-30b-a3b.description": "Qwen3 è l'ultima generazione di LLM Qwen con architetture dense e MoE, eccellente nel ragionamento, supporto multilingue e compiti avanzati per agenti. La sua capacità unica di passare da una modalità di pensiero per ragionamento complesso a una modalità non-pensante per chat efficiente garantisce prestazioni versatili e di alta qualità.\n\nQwen3 supera significativamente i modelli precedenti come QwQ e Qwen2.5, offrendo eccellenza in matematica, programmazione, ragionamento di buon senso, scrittura creativa e chat interattiva. La variante Qwen3-30B-A3B ha 30,5 miliardi di parametri (3,3B attivi), 48 layer, 128 esperti (8 attivi per compito) e supporta fino a 131K di contesto con YaRN, stabilendo un nuovo standard per i modelli open source.",
"qwen/qwen3-30b-a3b:free.description": "Qwen3 è l'ultima generazione di LLM Qwen con architetture dense e MoE, eccellente nel ragionamento, supporto multilingue e compiti avanzati per agenti. La sua capacità unica di passare da una modalità di pensiero per ragionamento complesso a una modalità non-pensante per chat efficiente garantisce prestazioni versatili e di alta qualità.\n\nQwen3 supera significativamente i modelli precedenti come QwQ e Qwen2.5, offrendo eccellenza in matematica, programmazione, ragionamento di buon senso, scrittura creativa e chat interattiva. La variante Qwen3-30B-A3B ha 30,5 miliardi di parametri (3,3B attivi), 48 layer, 128 esperti (8 attivi per compito) e supporta fino a 131K di contesto con YaRN, stabilendo un nuovo standard per i modelli open source.",
"qwen/qwen3-32b.description": "Qwen3-32B è un LLM causale denso con 32,8 miliardi di parametri, ottimizzato per ragionamento complesso e chat efficiente. Passa da una modalità di pensiero per matematica, programmazione e logica a una modalità non-pensante per chat generale più veloce. Eccelle nel seguire istruzioni, uso di strumenti agentici e scrittura creativa in oltre 100 lingue e dialetti. Supporta nativamente 32K di contesto e scala fino a 131K con YaRN.",
"qwen/qwen3-32b:free.description": "Qwen3-32B è un LLM causale denso con 32,8 miliardi di parametri, ottimizzato per ragionamento complesso e chat efficiente. Passa da una modalità di pensiero per matematica, programmazione e logica a una modalità non-pensante per chat generale più veloce. Eccelle nel seguire istruzioni, uso di strumenti agentici e scrittura creativa in oltre 100 lingue e dialetti. Supporta nativamente 32K di contesto e scala fino a 131K con YaRN.",
"qwen/qwen3-8b:free.description": "Qwen3-8B è un LLM causale denso con 8,2 miliardi di parametri, progettato per compiti con forte componente di ragionamento e chat efficiente. Passa da una modalità di pensiero per matematica, programmazione e logica a una modalità non-pensante per chat generale. Ottimizzato per seguire istruzioni, integrazione con agenti e scrittura creativa in oltre 100 lingue e dialetti. Supporta nativamente 32K di contesto e scala fino a 131K con YaRN.",
"qwen/qwen3-coder-plus.description": "Qwen3-Coder-Plus è un modello agente per la programmazione della serie Qwen, ottimizzato per l'uso di strumenti complessi e sessioni prolungate.",
"qwen/qwen3-coder.description": "Qwen3-Coder è la famiglia di modelli Qwen3 per la generazione di codice, eccellente nella comprensione e generazione di codice su documenti lunghi.",
"qwen/qwen3-max-preview.description": "Qwen3 Max (anteprima) è la variante Max per ragionamento avanzato e integrazione con strumenti.",
"qwen/qwen3-max.description": "Qwen3 Max è il modello di ragionamento di fascia alta della serie Qwen3, progettato per ragionamento multilingue e integrazione con strumenti.",
"qwen3-coder:480b.description": "Modello ad alte prestazioni di Alibaba per attività di agenti e programmazione, con supporto a contesti lunghi.",
"qwen3-max-preview.description": "Il modello Qwen con le migliori prestazioni per compiti complessi e multi-step. La versione preview supporta il ragionamento.",
"qwen3-max.description": "I modelli Qwen3 Max offrono miglioramenti significativi rispetto alla serie 2.5 in capacità generali, comprensione di cinese/inglese, esecuzione di istruzioni complesse, compiti soggettivi aperti, abilità multilingue e uso di strumenti, con meno allucinazioni. L'ultima versione qwen3-max migliora la programmazione agentica e l'uso degli strumenti rispetto a qwen3-max-preview. Questa release raggiunge lo stato dellarte e risponde a esigenze agentiche più complesse.",
"qwen3-next-80b-a3b-instruct.description": "Modello open-source di nuova generazione Qwen3 senza capacità di ragionamento. Rispetto alla versione precedente (Qwen3-235B-A22B-Instruct-2507), offre una migliore comprensione del cinese, un ragionamento logico più forte e una generazione di testo migliorata.",
"qwen3-next-80b-a3b-thinking.description": "Qwen3 Next 80B A3B Thinking è la versione di punta per il ragionamento, progettata per compiti complessi.",
"qwen3-omni-flash.description": "Qwen-Omni accetta input combinati da testo, immagini, audio e video, e genera output in forma testuale o vocale. Offre stili vocali naturali multipli, supporta lingue e dialetti diversi, ed è adatto a casi duso come scrittura, riconoscimento visivo e assistenti vocali.",
"qwen3-vl-235b-a22b-instruct.description": "Qwen3 VL 235B A22B Instruct è un modello multimodale di punta per comprensione e creazione avanzate.",
"qwen3-vl-235b-a22b-thinking.description": "Qwen3 VL 235B A22B Thinking è la versione di punta per il ragionamento multimodale complesso e la pianificazione.",
"qwen3-vl-30b-a3b-instruct.description": "Qwen3 VL 30B A3B Instruct è un grande modello multimodale che bilancia accuratezza e capacità di ragionamento.",
"qwen3-vl-30b-a3b-thinking.description": "Qwen3 VL 30B A3B Thinking è una versione avanzata per il ragionamento profondo in compiti multimodali complessi.",
"qwen3-vl-32b-instruct.description": "Qwen3 VL 32B Instruct è un modello multimodale ottimizzato per istruzioni, ideale per QA immagine-testo di alta qualità e creazione.",
"qwen3-vl-32b-thinking.description": "Qwen3 VL 32B Thinking è una versione multimodale per il ragionamento profondo, adatta ad analisi complesse e catene logiche lunghe.",
"qwen3-vl-8b-instruct.description": "Qwen3 VL 8B Instruct è un modello multimodale leggero per QA visivo quotidiano e integrazione in app.",
"qwen3-vl-8b-thinking.description": "Qwen3 VL 8B Thinking è un modello multimodale con catena di pensiero per ragionamento visivo dettagliato.",
"qwen3-vl-flash.description": "Qwen3 VL Flash: versione leggera e ad alta velocità per richieste sensibili alla latenza o ad alto volume.",
"qwen3-vl-plus.description": "Qwen VL è un modello di generazione testuale con comprensione visiva. Può eseguire OCR, riassumere e ragionare, ad esempio estraendo attributi da foto di prodotti o risolvendo problemi da immagini.",
"qwen3.description": "Qwen3 è il modello linguistico di nuova generazione di Alibaba, con prestazioni elevate in una vasta gamma di casi duso.",
"qwq-32b-preview.description": "QwQ è un modello sperimentale di ricerca della famiglia Qwen, focalizzato sul miglioramento del ragionamento.",
"qwq-32b.description": "QwQ è un modello di ragionamento della famiglia Qwen. Rispetto ai modelli standard ottimizzati per istruzioni, offre capacità di pensiero e ragionamento che migliorano significativamente le prestazioni nei compiti complessi. QwQ-32B è un modello di medie dimensioni che compete con i migliori modelli di ragionamento come DeepSeek-R1 e o1-mini.",
"qwq-plus.description": "Il modello di ragionamento QwQ, addestrato su Qwen2.5, utilizza lapprendimento per rinforzo per migliorare notevolmente il ragionamento. Ottiene punteggi di punta in matematica/codice (AIME 24/25, LiveCodeBench) e benchmark generali (IFEval, LiveBench), raggiungendo il livello di DeepSeek-R1.",
"qwq.description": "QwQ è un modello di ragionamento della famiglia Qwen. Rispetto ai modelli standard ottimizzati per istruzioni, offre capacità di pensiero e ragionamento che migliorano significativamente le prestazioni nei compiti difficili. QwQ-32B è un modello di medie dimensioni che compete con i migliori modelli di ragionamento come DeepSeek-R1 e o1-mini.",
"qwq_32b.description": "Modello di ragionamento di medie dimensioni della famiglia Qwen. Rispetto ai modelli standard ottimizzati per istruzioni, le capacità di pensiero e ragionamento di QwQ migliorano significativamente le prestazioni nei compiti difficili.",
"r1-1776.description": "R1-1776 è una variante post-addestrata di DeepSeek R1 progettata per fornire informazioni fattuali non censurate e imparziali.",
"solar-mini-ja.description": "Solar Mini (Ja) estende Solar Mini con un focus sul giapponese, mantenendo prestazioni efficienti e solide in inglese e coreano.",
"solar-mini.description": "Solar Mini è un LLM compatto che supera GPT-3.5, con forte capacità multilingue in inglese e coreano, offrendo una soluzione efficiente e leggera.",
"solar-pro.description": "Solar Pro è un LLM ad alta intelligenza di Upstage, focalizzato sullesecuzione di istruzioni su una singola GPU, con punteggi IFEval superiori a 80. Attualmente supporta linglese; il rilascio completo è previsto per novembre 2024 con supporto linguistico ampliato e contesto più lungo.",
"sonar-deep-research.description": "Deep Research esegue ricerche approfondite a livello esperto e le sintetizza in report accessibili e utili.",
"sonar-pro.description": "Prodotto di ricerca avanzata con ancoraggio alla ricerca per query complesse e follow-up.",
"sonar-reasoning-pro.description": "Prodotto di ricerca avanzata con ancoraggio alla ricerca per query complesse e follow-up.",
"sonar-reasoning.description": "Prodotto di ricerca avanzata con ancoraggio alla ricerca per query complesse e follow-up.",
"sonar.description": "Prodotto leggero con ancoraggio alla ricerca, più veloce ed economico rispetto a Sonar Pro.",
"spark-x.description": "Aggiornamenti X1.5: (1) aggiunge modalità di pensiero dinamico controllata dal campo `thinking`; (2) lunghezza del contesto aumentata a 64K input e 64K output; (3) supporta FunctionCall.",
"stable-diffusion-3-medium.description": "L'ultimo modello text-to-image di Stability AI. Questa versione migliora significativamente la qualità delle immagini, la comprensione del testo e la diversità stilistica, interpretando con maggiore precisione prompt complessi in linguaggio naturale e generando immagini più accurate e varie.",
"stable-diffusion-3.5-large-turbo.description": "stable-diffusion-3.5-large-turbo applica la distillazione per diffusione avversaria (ADD) a stable-diffusion-3.5-large per una maggiore velocità.",
"stable-diffusion-3.5-large.description": "stable-diffusion-3.5-large è un modello text-to-image MMDiT da 800M parametri con qualità eccellente e allineamento ai prompt, supporta immagini da 1 megapixel ed è efficiente su hardware consumer.",
"stable-diffusion-v1.5.description": "stable-diffusion-v1.5 è inizializzato dal checkpoint v1.2 e ottimizzato per 595k step su \"laion-aesthetics v2 5+\" a risoluzione 512x512, riducendo il conditioning testuale del 10% per migliorare il campionamento classifier-free.",
"stable-diffusion-xl-base-1.0.description": "Modello open-source text-to-image di Stability AI con generazione creativa di immagini leader nel settore. Ha una forte comprensione delle istruzioni e supporta definizioni inverse dei prompt per generazioni precise.",
"stable-diffusion-xl.description": "stable-diffusion-xl introduce miglioramenti significativi rispetto alla v1.5 e raggiunge i migliori risultati open-source text-to-image. Include un backbone UNet 3 volte più grande, un modulo di raffinamento per immagini migliori e tecniche di addestramento più efficienti.",
"step-1-128k.description": "Equilibrio tra prestazioni e costi per scenari generali.",
"step-1-256k.description": "Gestione di contesti extra-lunghi, ideale per lanalisi di documenti estesi.",
"step-1-32k.description": "Supporta conversazioni di media lunghezza per unampia gamma di scenari.",
"step-1-8k.description": "Modello piccolo adatto a compiti leggeri.",
"step-1-flash.description": "Modello ad alta velocità adatto a chat in tempo reale.",
"step-1.5v-mini.description": "Forti capacità di comprensione video.",
"step-1o-turbo-vision.description": "Eccellente comprensione delle immagini, supera 1o in matematica e programmazione. Più piccolo di 1o con output più veloce.",
"step-1o-vision-32k.description": "Forte comprensione visiva con prestazioni superiori rispetto alla serie Step-1V.",
"step-1v-32k.description": "Supporta input visivi per interazioni multimodali più ricche.",
"step-1v-8k.description": "Modello visivo compatto per compiti base immagine-testo.",
"step-1x-edit.description": "Questo modello si concentra sullediting di immagini, modificando e migliorando immagini in base a input testuali e visivi forniti dallutente. Supporta più formati di input e genera modifiche coerenti con lintento dellutente.",
"step-1x-medium.description": "Questo modello offre una forte generazione di immagini da prompt testuali. Con supporto nativo al cinese, comprende meglio le descrizioni in cinese, ne cattura la semantica e le trasforma in caratteristiche visive per una generazione più accurata. Produce immagini ad alta risoluzione e qualità, con supporto a un certo grado di trasferimento di stile.",
"step-2-16k-exp.description": "Build sperimentale Step-2 con le ultime funzionalità e aggiornamenti continui. Non consigliato per ambienti di produzione.",
"step-2-16k.description": "Supporta interazioni a contesto esteso per dialoghi complessi.",
"step-2-mini.description": "Basato sulla nuova architettura MFA attention proprietaria, offre risultati simili a Step-1 a costi molto inferiori, con throughput più elevato e latenza ridotta. Gestisce compiti generali con forti capacità di programmazione.",
"step-2x-large.description": "Modello di nuova generazione StepFun focalizzato sulla generazione di immagini, produce immagini di alta qualità da prompt testuali. Offre texture più realistiche e una resa testuale cinese/inglese più forte.",
"step-3.description": "Questo modello ha una forte percezione visiva e capacità di ragionamento complesso, gestendo con precisione la comprensione della conoscenza cross-domain, lanalisi matematica-visiva e una vasta gamma di compiti visivi quotidiani.",
"step-r1-v-mini.description": "Modello di ragionamento con forte comprensione delle immagini, in grado di elaborare immagini e testo e generare testo dopo un ragionamento profondo. Eccelle nel ragionamento visivo e offre prestazioni di alto livello in matematica, programmazione e ragionamento testuale, con una finestra di contesto da 100K.",
"v0-1.5-lg.description": "v0-1.5-lg è adatto a compiti avanzati di pensiero e ragionamento.",
"v0-1.5-md.description": "v0-1.5-md è adatto a compiti quotidiani e alla generazione di interfacce utente.",
"vercel/v0-1.0-md.description": "Accedi ai modelli dietro v0 per generare, correggere e ottimizzare applicazioni web moderne con ragionamento specifico per framework e conoscenze aggiornate.",
"vercel/v0-1.5-md.description": "Accedi ai modelli dietro v0 per generare, correggere e ottimizzare applicazioni web moderne con ragionamento specifico per framework e conoscenze aggiornate.",
"volcengine/doubao-seed-code.description": "Doubao-Seed-Code è il modello LLM di Volcano Engine di ByteDance ottimizzato per la programmazione agentica, con prestazioni elevate nei benchmark di programmazione e agenti e supporto per contesti fino a 256K.",
"wan2.2-t2i-flash.description": "Wanxiang 2.2 Speed è il modello più recente con miglioramenti in creatività, stabilità e realismo, offrendo generazione rapida e alto valore.",
"wan2.2-t2i-plus.description": "Wanxiang 2.2 Pro è il modello più recente con miglioramenti in creatività, stabilità e realismo, producendo dettagli più ricchi.",
"wanx-v1.description": "Modello base da testo a immagine. Corrisponde a Tongyi Wanxiang 1.0 General.",
"wanx2.0-t2i-turbo.description": "Eccelle nei ritratti con texture, con velocità moderata e costi ridotti. Corrisponde a Tongyi Wanxiang 2.0 Speed.",
"wanx2.1-t2i-plus.description": "Versione completamente aggiornata con immagini più dettagliate e velocità leggermente inferiore. Corrisponde a Tongyi Wanxiang 2.1 Pro.",
"wanx2.1-t2i-turbo.description": "Versione completamente aggiornata con generazione rapida, qualità complessiva elevata e alto valore. Corrisponde a Tongyi Wanxiang 2.1 Speed.",
"whisper-1.description": "Modello generale di riconoscimento vocale che supporta ASR multilingue, traduzione vocale e identificazione della lingua.",
"wizardlm2.description": "WizardLM 2 è un modello linguistico di Microsoft AI che eccelle in dialoghi complessi, compiti multilingue, ragionamento e assistenza.",
"wizardlm2:8x22b.description": "WizardLM 2 è un modello linguistico di Microsoft AI che eccelle in dialoghi complessi, compiti multilingue, ragionamento e assistenza.",
"x-ai/grok-4-fast-non-reasoning.description": "Grok 4 Fast (Non-Reasoning) è il modello multimodale ad alta capacità e basso costo di xAI (supporta una finestra di contesto da 2M), ideale per scenari sensibili alla latenza e ai costi che non richiedono ragionamento interno. È affiancato dalla versione con ragionamento, attivabile tramite il parametro API reasoning. Prompt e completamenti possono essere utilizzati da xAI o OpenRouter per migliorare i modelli futuri.",
"x-ai/grok-4-fast.description": "Grok 4 Fast è il modello ad alta capacità e basso costo di xAI (supporta una finestra di contesto da 2M), ideale per casi d'uso con alta concorrenza e contesti lunghi.",
"x-ai/grok-4.1-fast-non-reasoning.description": "Grok 4 Fast (Non-Reasoning) è il modello multimodale ad alta capacità e basso costo di xAI (supporta una finestra di contesto da 2M), ideale per scenari sensibili alla latenza e ai costi che non richiedono ragionamento interno. È affiancato dalla versione con ragionamento, attivabile tramite il parametro API reasoning. Prompt e completamenti possono essere utilizzati da xAI o OpenRouter per migliorare i modelli futuri.",
"x-ai/grok-4.1-fast.description": "Grok 4 Fast è il modello ad alta capacità e basso costo di xAI (supporta una finestra di contesto da 2M), ideale per casi d'uso con alta concorrenza e contesti lunghi.",
"x-ai/grok-4.description": "Grok 4 è il modello di punta di xAI con forti capacità di ragionamento e multimodalità.",
"x-ai/grok-code-fast-1.description": "Grok Code Fast 1 è il modello veloce di xAI per la programmazione, con output leggibile e adatto all'ingegneria.",
"xai/grok-2-vision.description": "Grok 2 Vision eccelle nei compiti visivi, offrendo prestazioni all'avanguardia nel ragionamento matematico visivo (MathVista) e nella QA su documenti (DocVQA). Gestisce documenti, grafici, tabelle, screenshot e foto.",
"xai/grok-2.description": "Grok 2 è un modello all'avanguardia con prestazioni eccellenti in ragionamento, chat, programmazione e classificato sopra Claude 3.5 Sonnet e GPT-4 Turbo su LMSYS.",
"xai/grok-3-fast.description": "Il modello di punta di xAI eccelle in casi d'uso aziendali come estrazione dati, programmazione e sintesi, con profonda conoscenza nei settori finanza, sanità, diritto e scienza. La variante veloce utilizza un'infrastruttura più rapida per risposte molto più veloci a un costo per token più elevato.",
"xai/grok-3-mini-fast.description": "Modello leggero di xAI che riflette prima di rispondere, ideale per compiti semplici o basati sulla logica senza conoscenze specialistiche. Sono disponibili tracce di ragionamento grezze. La variante veloce utilizza un'infrastruttura più rapida per risposte molto più veloci a un costo per token più elevato.",
"xai/grok-3-mini.description": "Modello leggero di xAI che riflette prima di rispondere, ideale per compiti semplici o basati sulla logica senza conoscenze specialistiche. Sono disponibili tracce di ragionamento grezze.",
"xai/grok-3.description": "Il modello di punta di xAI eccelle in casi d'uso aziendali come estrazione dati, programmazione e sintesi, con profonda conoscenza nei settori finanza, sanità, diritto e scienza.",
"xai/grok-4.description": "Il nuovo modello di punta di xAI con prestazioni impareggiabili in linguaggio naturale, matematica e ragionamento: un tuttofare ideale.",
"yi-large-fc.description": "Basato su yi-large con funzionalità avanzate di tool-calling, adatto a scenari con agenti e flussi di lavoro.",
"yi-large-preview.description": "Versione preliminare; si consiglia l'uso di yi-large (più recente).",
"yi-large-rag.description": "Servizio avanzato basato su yi-large, che combina recupero e generazione per risposte precise con ricerca web in tempo reale.",
"yi-large-turbo.description": "Valore e prestazioni eccezionali, ottimizzato per un forte equilibrio tra qualità, velocità e costo.",
"yi-large.description": "Un nuovo modello da 100 miliardi di parametri con forti capacità di Q&A e generazione di testo.",
"yi-lightning-lite.description": "Versione leggera; si consiglia yi-lightning.",
"yi-lightning.description": "Modello ad alte prestazioni di ultima generazione con inferenza rapida e output di alta qualità.",
"yi-medium-200k.description": "Modello con contesto lungo da 200K per una comprensione e generazione approfondita di testi lunghi.",
"yi-medium.description": "Modello di medie dimensioni ottimizzato per seguire istruzioni, con capacità e valore bilanciati.",
"yi-spark.description": "Modello compatto e veloce con capacità potenziate in matematica e programmazione.",
"yi-vision-v2.description": "Modello visivo per compiti complessi con forte comprensione e analisi multi-immagine.",
"yi-vision.description": "Modello visivo per compiti complessi con forte comprensione e analisi delle immagini.",
"z-ai/glm-4.5-air.description": "GLM 4.5 Air è una variante leggera di GLM 4.5 per scenari sensibili ai costi, mantenendo forti capacità di ragionamento.",
"z-ai/glm-4.5.description": "GLM 4.5 è il modello di punta di Z.AI con ragionamento ibrido ottimizzato per compiti ingegneristici e contesti lunghi.",
"z-ai/glm-4.6.description": "GLM 4.6 è il modello di punta di Z.AI con contesto esteso e capacità di programmazione.",
"zai-glm-4.6.description": "Eccelle in compiti di programmazione e ragionamento, supporta lo streaming e le chiamate a strumenti, ed è adatto alla programmazione agentica e al ragionamento complesso.",
"zai-org/GLM-4.5-Air.description": "GLM-4.5-Air è un modello base per applicazioni agentiche con architettura Mixture-of-Experts. Ottimizzato per l'uso di strumenti, navigazione web, ingegneria software e programmazione frontend, si integra con agenti di codice come Claude Code e Roo Code. Utilizza ragionamento ibrido per gestire sia scenari complessi che quotidiani.",
"zai-org/GLM-4.5.description": "GLM-4.5 è un modello base progettato per applicazioni agentiche con architettura Mixture-of-Experts. Ottimizzato per l'uso di strumenti, navigazione web, ingegneria software e programmazione frontend, si integra con agenti di codice come Claude Code e Roo Code. Utilizza ragionamento ibrido per gestire sia scenari complessi che quotidiani.",
"zai-org/GLM-4.5V.description": "GLM-4.5V è il più recente VLM di Zhipu AI, basato sul modello testuale di punta GLM-4.5-Air (106B totali, 12B attivi) con architettura MoE per prestazioni elevate a costi ridotti. Segue il percorso GLM-4.1V-Thinking e aggiunge 3D-RoPE per migliorare il ragionamento spaziale 3D. Ottimizzato tramite pretraining, SFT e RL, gestisce immagini, video e documenti lunghi, classificandosi tra i migliori modelli open source su 41 benchmark multimodali pubblici. Una modalità Thinking consente di bilanciare velocità e profondità.",
"zai-org/GLM-4.6.description": "Rispetto a GLM-4.5, GLM-4.6 estende il contesto da 128K a 200K per compiti agentici più complessi. Ottiene punteggi più alti nei benchmark di codice e mostra prestazioni superiori in applicazioni reali come Claude Code, Cline, Roo Code e Kilo Code, inclusa una migliore generazione di pagine frontend. Il ragionamento è migliorato e l'uso di strumenti è supportato durante il ragionamento, rafforzando le capacità complessive. Si integra meglio nei framework agentici, migliora gli agenti di ricerca/strumenti e offre uno stile di scrittura più naturale e preferito dagli utenti.",
"zai/glm-4.5-air.description": "GLM-4.5 e GLM-4.5-Air sono i nostri modelli di punta più recenti per applicazioni agentiche, entrambi con architettura MoE. GLM-4.5 ha 355B totali e 32B attivi per passaggio; GLM-4.5-Air è più snello con 106B totali e 12B attivi.",
"zai/glm-4.5.description": "La serie GLM-4.5 è progettata per agenti. Il modello di punta GLM-4.5 combina ragionamento, programmazione e capacità agentiche con 355B parametri totali (32B attivi) e offre modalità operative doppie come sistema di ragionamento ibrido.",
"zai/glm-4.5v.description": "GLM-4.5V si basa su GLM-4.5-Air, ereditando le tecniche collaudate di GLM-4.1V-Thinking e scalando con una potente architettura MoE da 106B parametri.",
"zenmux/auto.description": "Il sistema di instradamento automatico ZenMux seleziona il modello con il miglior rapporto qualità/prezzo tra quelli supportati in base alla tua richiesta."
}