feat: add video tab to provider ModelList settings page (#12534)

This commit is contained in:
YuTengjing
2026-02-28 22:29:51 +08:00
committed by GitHub
parent ed4eb874b2
commit ac0be5ed5c
72 changed files with 1043 additions and 596 deletions
+7 -3
View File
@@ -224,15 +224,18 @@
"providerModels.item.modelConfig.extendParams.options.gpt5_2ProReasoningEffort.hint": "لسلسلة GPT-5.2 Pro؛ يتحكم في شدة الاستدلال.",
"providerModels.item.modelConfig.extendParams.options.gpt5_2ReasoningEffort.hint": "لسلسلة GPT-5.2؛ يتحكم في شدة الاستدلال.",
"providerModels.item.modelConfig.extendParams.options.imageAspectRatio.hint": "لنماذج توليد الصور من Gemini؛ يتحكم في نسبة العرض إلى الارتفاع للصور المُولدة.",
"providerModels.item.modelConfig.extendParams.options.imageAspectRatio2.hint": "لـ Nano Banana 2؛ يتحكم في نسبة العرض إلى الارتفاع للصور المُنشأة (يدعم النسب العريضة جدًا 1:4، 4:1، 1:8، 8:1).",
"providerModels.item.modelConfig.extendParams.options.imageResolution.hint": "لنماذج توليد الصور من Gemini 3؛ يتحكم في دقة الصور المُولدة.",
"providerModels.item.modelConfig.extendParams.options.imageResolution2.hint": "لـ نماذج الصور Gemini 3.1 Flash؛ يتحكم في دقة الصور المُنشأة (يدعم 512 بكسل).",
"providerModels.item.modelConfig.extendParams.options.reasoningBudgetToken.hint": "لنماذج Claude وQwen3 وما شابهها؛ يتحكم في ميزانية الرموز المخصصة للاستدلال.",
"providerModels.item.modelConfig.extendParams.options.reasoningEffort.hint": "لنماذج OpenAI وغيرها من النماذج القادرة على الاستدلال؛ يتحكم في جهد الاستدلال.",
"providerModels.item.modelConfig.extendParams.options.textVerbosity.hint": "لسلسلة GPT-5+؛ يتحكم في تفصيل النص الناتج.",
"providerModels.item.modelConfig.extendParams.options.thinking.hint": "لبعض نماذج Doubao؛ يسمح للنموذج بتحديد ما إذا كان يجب التفكير بعمق.",
"providerModels.item.modelConfig.extendParams.options.thinkingBudget.hint": "لسلسلة Gemini؛ يتحكم في ميزانية التفكير.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel.hint": "لنماذج المعاينة السريعة من Gemini 3 Flash؛ يتحكم في عمق التفكير.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel2.hint": "لنماذج المعاينة الاحترافية من Gemini 3 Pro؛ يتحكم في عمق التفكير.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel3.hint": "لنماذج Gemini 3.1 Pro Preview؛ يتحكم في عمق التفكير بمستويات منخفضة/متوسطة/عالية.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel.hint": ـ نماذج المعاينة Gemini 3 Flash؛ يتحكم في عمق التفكير.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel2.hint": ـ نماذج المعاينة Gemini 3 Pro؛ يتحكم في عمق التفكير.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel3.hint": ـ نماذج المعاينة Gemini 3.1 Pro؛ يتحكم في عمق التفكير بمستويات منخفضة/متوسطة/عالية.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel4.hint": "لـ نماذج الصور Gemini 3.1 Flash؛ تبديل التفكير تشغيل/إيقاف.",
"providerModels.item.modelConfig.extendParams.options.urlContext.hint": "لسلسلة Gemini؛ يدعم توفير سياق من خلال عنوان URL.",
"providerModels.item.modelConfig.extendParams.placeholder": "اختر المعلمات الموسعة لتفعيلها",
"providerModels.item.modelConfig.extendParams.previewFallback": "المعاينة غير متوفرة",
@@ -311,6 +314,7 @@
"providerModels.tabs.image": "صورة",
"providerModels.tabs.stt": "تحويل الكلام إلى نص",
"providerModels.tabs.tts": "تحويل النص إلى كلام",
"providerModels.tabs.video": "فيديو",
"sortModal.success": "تم تحديث الترتيب بنجاح",
"sortModal.title": "ترتيب مخصص",
"sortModal.update": "تحديث",
+35 -31
View File
@@ -55,7 +55,8 @@
"FLUX.1-dev.description": "FLUX.1-dev هو نموذج لغة متعدد الوسائط مفتوح المصدر من Black Forest Labs، محسن لمهام النص والصورة، ويجمع بين فهم وتوليد النصوص/الصور. مبني على نماذج LLM متقدمة (مثل Mistral-7B)، ويستخدم مشفر رؤية مصمم بعناية وضبط تعليمات متعدد المراحل لتمكين التنسيق متعدد الوسائط والاستدلال المعقد.",
"Gryphe/MythoMax-L2-13b.description": "MythoMax-L2 (13B) هو نموذج مبتكر لمجالات متنوعة ومهام معقدة.",
"HelloMeme.description": "HelloMeme هي أداة ذكاء اصطناعي لإنشاء الميمات، الصور المتحركة (GIFs)، أو مقاطع الفيديو القصيرة من الصور أو الحركات التي تقدمها. لا تتطلب مهارات رسم أو برمجة—فقط صورة مرجعية—لإنتاج محتوى ممتع وجذاب ومتناسق من حيث الأسلوب.",
"HiDream-I1-Full.description": "HiDream-E1-Full هو نموذج تحرير صور متعدد الوسائط مفتوح المصدر من HiDream.ai، مبني على بنية Diffusion Transformer متقدمة وفهم لغوي قوي (مدمج مع LLaMA 3.1-8B-Instruct). يدعم توليد الصور باستخدام اللغة الطبيعية، نقل الأسلوب، التعديلات المحلية، وإعادة التلوين، مع فهم وتنفيذ ممتازين للنصوص والصور.",
"HiDream-E1-Full.description": "HiDream-E1-Full هو نموذج مفتوح المصدر لتحرير الصور متعدد الوسائط من HiDream.ai، يعتمد على بنية Diffusion Transformer المتقدمة وفهم قوي للغة (مدمج LLaMA 3.1-8B-Instruct). يدعم إنشاء الصور باستخدام اللغة الطبيعية، ونقل الأنماط، والتحرير المحلي، وإعادة الطلاء، مع فهم وتنفيذ ممتازين للنصوص والصور.",
"HiDream-I1-Full.description": "HiDream-I1 هو نموذج جديد مفتوح المصدر لإنشاء الصور تم إصداره من قبل HiDream. مع 17 مليار معلمة (Flux يحتوي على 12 مليار)، يمكنه تقديم جودة صور رائدة في الصناعة في ثوانٍ.",
"HunyuanDiT-v1.2-Diffusers-Distilled.description": "hunyuandit-v1.2-distilled هو نموذج تحويل نص إلى صورة خفيف الوزن، محسن عبر التقطير لتوليد صور عالية الجودة بسرعة، ومناسب بشكل خاص للبيئات منخفضة الموارد والتوليد في الوقت الحقيقي.",
"InstantCharacter.description": "InstantCharacter هو نموذج توليد شخصيات مخصص بدون ضبط من Tencent AI لعام 2025، يهدف إلى توليد شخصيات عالية الدقة ومتسقة عبر السيناريوهات. يمكنه نمذجة شخصية من صورة مرجعية واحدة ونقلها بمرونة عبر الأساليب، الحركات، والخلفيات.",
"InternVL2-8B.description": "InternVL2-8B هو نموذج رؤية-لغة قوي يدعم معالجة الصور والنصوص متعددة الوسائط، يتعرف بدقة على محتوى الصور ويولد أوصافًا أو إجابات ذات صلة.",
@@ -80,7 +81,7 @@
"MiniMax-M2.1.description": "MiniMax-M2.1 هو نموذج مفتوح المصدر رائد من MiniMax، يركز على حل المهام الواقعية المعقدة. يتميز بقدرات برمجة متعددة اللغات والقدرة على أداء المهام المعقدة كوكلاء ذكي.",
"MiniMax-M2.5-Lightning.description": "M2.5 Lightning: نفس الأداء، أسرع وأكثر رشاقة (تقريباً 100 tps).",
"MiniMax-M2.5-highspeed.description": "نفس أداء M2.5 مع استنتاج أسرع بشكل ملحوظ.",
"MiniMax-M2.5.description": "أداء من الدرجة الأولى وفعالية تكلفة قصوى، يتعامل بسهولة مع المهام المعقدة (تقريباً 60 tps).",
"MiniMax-M2.5.description": "MiniMax-M2.5 هو نموذج مفتوح المصدر رائد من MiniMax، يركز على حل المهام المعقدة في العالم الحقيقي. يتميز بقدرات برمجة متعددة اللغات والقدرة على حل المهام المعقدة كوكيل.",
"MiniMax-M2.description": "مصمم خصيصًا للبرمجة الفعالة وتدفقات عمل الوكلاء.",
"MiniMax-Text-01.description": "MiniMax-01 يقدم انتباهًا خطيًا واسع النطاق يتجاوز Transformers التقليدية، مع 456 مليار معامل و45.9 مليار مفعّلة في كل تمرير. يحقق أداءً من الدرجة الأولى ويدعم حتى 4 ملايين رمز سياقي (32× GPT-4o، 20× Claude-3.5-Sonnet).",
"MiniMaxAI/MiniMax-M1-80k.description": "MiniMax-M1 هو نموذج استدلال واسع النطاق بوزن مفتوح يستخدم انتباهًا هجينًا، يحتوي على 456 مليار معامل إجماليًا و~45.9 مليار مفعّلة لكل رمز. يدعم سياقًا يصل إلى 1M ويستخدم Flash Attention لتقليل FLOPs بنسبة 75% عند توليد 100K رمز مقارنة بـ DeepSeek R1. بهيكل MoE وتدريب RL هجين، يحقق أداءً رائدًا في الاستدلال طويل المدخلات ومهام هندسة البرمجيات الواقعية.",
@@ -98,6 +99,7 @@
"Phi-3.5-mini-instruct.description": "إصدار محدث من نموذج Phi-3-mini.",
"Phi-3.5-vision-instrust.description": "إصدار محدث من نموذج Phi-3-vision.",
"Pro/MiniMaxAI/MiniMax-M2.1.description": "MiniMax-M2.1 هو نموذج لغوي مفتوح المصدر ومتقدم، مُحسَّن لقدرات الوكلاء، ويتفوق في البرمجة، واستخدام الأدوات، واتباع التعليمات، والتخطيط طويل الأمد. يدعم النموذج تطوير البرمجيات متعددة اللغات وتنفيذ سير العمل المعقد متعدد الخطوات، وحقق نتيجة 74.0 على SWE-bench Verified، متفوقًا على Claude Sonnet 4.5 في السيناريوهات متعددة اللغات.",
"Pro/MiniMaxAI/MiniMax-M2.5.description": "MiniMax-M2.5 هو أحدث نموذج لغة كبير تم تطويره بواسطة MiniMax، تم تدريبه من خلال التعلم المعزز واسع النطاق عبر مئات الآلاف من البيئات المعقدة في العالم الحقيقي. يتميز بهيكل MoE مع 229 مليار معلمة، ويحقق أداءً رائدًا في الصناعة في مهام مثل البرمجة، واستدعاء أدوات الوكيل، والبحث، والسيناريوهات المكتبية.",
"Pro/Qwen/Qwen2-7B-Instruct.description": "Qwen2-7B-Instruct هو نموذج لغوي كبير (LLM) موجه للتعليمات ضمن سلسلة Qwen2. يستخدم بنية Transformer مع SwiGLU، وانحياز QKV في الانتباه، وانتباه الاستعلامات المجمعة، ويعالج مدخلات كبيرة. يتميز بأداء قوي في فهم اللغة، التوليد، المهام متعددة اللغات، البرمجة، الرياضيات، والاستدلال، متفوقًا على معظم النماذج المفتوحة ومنافسًا للنماذج التجارية. يتفوق على Qwen1.5-7B-Chat في العديد من المعايير.",
"Pro/Qwen/Qwen2.5-7B-Instruct.description": "Qwen2.5-7B-Instruct هو جزء من أحدث سلسلة نماذج لغوية كبيرة من Alibaba Cloud. يقدم هذا النموذج ذو 7 مليارات معلمة تحسينات ملحوظة في البرمجة والرياضيات، ويدعم أكثر من 29 لغة، ويعزز اتباع التعليمات، وفهم البيانات المنظمة، وإنتاج المخرجات المنظمة (خصوصًا JSON).",
"Pro/Qwen/Qwen2.5-Coder-7B-Instruct.description": "Qwen2.5-Coder-7B-Instruct هو أحدث نموذج لغوي كبير من Alibaba Cloud يركز على البرمجة. مبني على Qwen2.5 ومدرب على 5.5 تريليون رمز، يعزز بشكل كبير توليد الشيفرة، الاستدلال، والإصلاح، مع الحفاظ على القوة في الرياضيات والقدرات العامة، مما يوفر أساسًا قويًا لوكلاء البرمجة.",
@@ -107,13 +109,13 @@
"Pro/deepseek-ai/DeepSeek-R1-Distill-Qwen-7B.description": "تم تقطير DeepSeek-R1-Distill-Qwen-7B من Qwen2.5-Math-7B وتم تحسينه باستخدام 800 ألف عينة مختارة من DeepSeek-R1. يتميز بأداء قوي، حيث يحقق 92.8٪ في MATH-500، و55.5٪ في AIME 2024، وتصنيف 1189 في CodeForces لنموذج بحجم 7 مليارات معلمة.",
"Pro/deepseek-ai/DeepSeek-R1.description": "DeepSeek-R1 هو نموذج استدلال مدفوع بالتعلم المعزز يقلل التكرار ويحسن قابلية القراءة. يستخدم بيانات بداية باردة قبل التعلم المعزز لتعزيز الاستدلال، ويضاهي OpenAI-o1 في مهام الرياضيات، البرمجة، والاستدلال، ويحقق نتائج أفضل من خلال تدريب دقيق.",
"Pro/deepseek-ai/DeepSeek-V3.1-Terminus.description": "DeepSeek-V3.1-Terminus هو إصدار محدث من نموذج V3.1، مصمم كنموذج وكيل هجين. يعالج المشكلات التي أبلغ عنها المستخدمون، ويحسن الاستقرار، وتناسق اللغة، ويقلل من الخلط بين الصينية/الإنجليزية والرموز غير الطبيعية. يدمج أوضاع التفكير وغير التفكير مع قوالب محادثة للتبديل المرن. كما يعزز أداء وكلاء الشيفرة والبحث لاستخدام أدوات أكثر موثوقية ومهام متعددة الخطوات.",
"Pro/deepseek-ai/DeepSeek-V3.2-Exp.description": "DeepSeek-V3.2-Exp هو إصدار تجريبي من V3.2 يربط بالمعمارية التالية. يضيف انتباهًا متفرقًا (DSA) إلى V3.1-Terminus لتحسين كفاءة التدريب والاستدلال في السياقات الطويلة، مع تحسينات لاستخدام الأدوات، وفهم المستندات الطويلة، والاستدلال متعدد الخطوات. مثالي لاستكشاف كفاءة استدلال أعلى ضمن ميزانيات سياق كبيرة.",
"Pro/deepseek-ai/DeepSeek-V3.2.description": "DeepSeek-V3.2 هو نموذج يجمع بين الكفاءة الحسابية العالية وأداء التفكير والوكيل الممتاز. يعتمد نهجه على ثلاثة اختراقات تكنولوجية رئيسية: DeepSeek Sparse Attention (DSA)، وهي آلية انتباه فعالة تقلل بشكل كبير من التعقيد الحسابي مع الحفاظ على أداء النموذج، ومُحسنة خصيصًا للسيناريوهات ذات السياق الطويل؛ إطار عمل للتعلم المعزز القابل للتوسع يمكن من خلاله أن ينافس أداء النموذج GPT-5، مع نسخته عالية الحوسبة التي تضاهي Gemini-3.0-Pro في قدرات التفكير؛ وخط أنابيب واسع النطاق لتوليف مهام الوكيل يهدف إلى دمج قدرات التفكير في سيناريوهات استخدام الأدوات، مما يحسن اتباع التعليمات والتعميم في البيئات التفاعلية المعقدة. حقق النموذج أداءً متميزًا في الأولمبياد الدولي للرياضيات (IMO) وأولمبياد المعلوماتية الدولي (IOI) لعام 2025.",
"Pro/deepseek-ai/DeepSeek-V3.description": "DeepSeek-V3 هو نموذج MoE يحتوي على 671 مليار معلمة، يستخدم MLA وDeepSeekMoE مع توازن تحميل خالٍ من الفقدان لتحقيق كفاءة في الاستدلال والتدريب. تم تدريبه مسبقًا على 14.8 تريليون رمز عالي الجودة وتم تحسينه باستخدام SFT وRL، متفوقًا على النماذج المفتوحة الأخرى ويقترب من النماذج المغلقة الرائدة.",
"Pro/moonshotai/Kimi-K2-Instruct-0905.description": "Kimi K2-Instruct-0905 هو أحدث وأقوى إصدار من Kimi K2. إنه نموذج MoE من الدرجة الأولى يحتوي على إجمالي 1 تريليون و32 مليار معلمة نشطة. من أبرز ميزاته الذكاء البرمجي القوي مع تحسينات كبيرة في المعايير ومهام الوكلاء الواقعية، بالإضافة إلى تحسينات في جمالية واجهة الشيفرة وسهولة الاستخدام.",
"Pro/moonshotai/Kimi-K2-Thinking.description": "Kimi K2 Thinking Turbo هو إصدار Turbo محسّن لسرعة الاستدلال والإنتاجية مع الحفاظ على قدرات التفكير متعدد الخطوات واستخدام الأدوات في K2 Thinking. إنه نموذج MoE يحتوي على حوالي 1 تريليون معلمة إجمالية، ويدعم سياقًا أصليًا بطول 256 ألف رمز، واستدعاء أدوات واسع النطاق ومستقر لسيناريوهات الإنتاج التي تتطلب زمن استجابة وتزامنًا صارمين.",
"Pro/moonshotai/Kimi-K2.5.description": "Kimi K2.5 هو نموذج وكيل متعدد الوسائط مفتوح المصدر، مبني على Kimi-K2-Base، ومدرب على حوالي 1.5 تريليون رمز من النصوص والرؤية. يستخدم بنية MoE بعدد إجمالي 1 تريليون مع 32 مليار معلمات نشطة، ويدعم نافذة سياق تصل إلى 256 ألف، مما يدمج الفهم البصري واللغوي بسلاسة.",
"Pro/zai-org/glm-4.7.description": "GLM-4.7 هو النموذج الرائد من الجيل الجديد لشركة Zhipu، يحتوي على 355 مليار معلمة إجمالية و32 مليار معلمة نشطة، وقد تم تطويره بالكامل في مجالات الحوار العام، والاستدلال، وقدرات الوكلاء. يعزز GLM-4.7 التفكير المتداخل ويقدم مفاهيم التفكير المحفوظ والتفكير على مستوى الدور.",
"Pro/zai-org/glm-5.description": "GLM-5 هو نموذج لغة كبير جديد من Z.ai، يركز على هندسة الأنظمة المعقدة ومهام الوكيل طويلة الأمد. توسعت معلمات النموذج إلى 744B معلمة (40B نشطة)، وتم دمج DeepSeek Sparse Attention.",
"Pro/zai-org/glm-5.description": "GLM-5 هو نموذج اللغة الكبير من الجيل التالي من Zhipu، يركز على هندسة الأنظمة المعقدة ومهام الوكيل طويلة المدة. تم توسيع معلمات النموذج إلى 744 مليار (40 مليار نشطة) وتدمج DeepSeek Sparse Attention.",
"QwQ-32B-Preview.description": "Qwen QwQ هو نموذج بحث تجريبي يركز على تحسين الاستدلال.",
"Qwen/QVQ-72B-Preview.description": "QVQ-72B-Preview هو نموذج بحث من Qwen يركز على الاستدلال البصري، يتميز بفهم المشاهد المعقدة وحل مسائل الرياضيات البصرية.",
"Qwen/QwQ-32B-Preview.description": "Qwen QwQ هو نموذج بحث تجريبي يركز على تحسين استدلال الذكاء الاصطناعي.",
@@ -137,7 +139,7 @@
"Qwen/Qwen3-14B.description": "Qwen3 هو الجيل التالي من نموذج Tongyi Qwen، يحقق تقدمًا كبيرًا في الاستدلال، القدرات العامة، قدرات الوكلاء، والأداء متعدد اللغات، ويدعم التبديل بين أوضاع التفكير.",
"Qwen/Qwen3-235B-A22B-Instruct-2507.description": "Qwen3-235B-A22B-Instruct-2507 هو النموذج الرائد من نوع MoE في سلسلة Qwen3، يحتوي على 235 مليار معلمة إجمالية و22 مليار نشطة. هو إصدار غير مفكر محدث يركز على تحسين اتباع التعليمات، الاستدلال المنطقي، فهم النصوص، الرياضيات، العلوم، البرمجة، واستخدام الأدوات. كما يوسع المعرفة متعددة اللغات ويعزز التوافق مع تفضيلات المستخدم في المهام المفتوحة الذاتية.",
"Qwen/Qwen3-235B-A22B-Thinking-2507.description": "Qwen3-235B-A22B-Thinking-2507 هو نموذج Qwen3 مخصص للاستدلال المعقد. يستخدم بنية MoE مع 235 مليار معلمة إجمالية وحوالي 22 مليار نشطة لكل رمز لتعزيز الكفاءة. كنموذج تفكير مخصص، يظهر تقدمًا كبيرًا في المنطق، الرياضيات، العلوم، البرمجة، والمعايير الأكاديمية، محققًا أداءً رائدًا في التفكير المفتوح. كما يحسن اتباع التعليمات، استخدام الأدوات، وتوليد النصوص، ويدعم سياقًا يصل إلى 256K للاستدلال العميق والوثائق الطويلة.",
"Qwen/Qwen3-235B-A22B.description": "Qwen3 هو الجيل التالي من نموذج Tongyi Qwen، يحقق تقدمًا كبيرًا في الاستدلال، القدرات العامة، قدرات الوكلاء، والأداء متعدد اللغات، ويدعم التبديل بين أوضاع التفكير.",
"Qwen/Qwen3-235B-A22B.description": "Qwen3 235B A22B هو نموذج Qwen3 واسع النطاق يقدم قدرات ذكاء اصطناعي من الدرجة الأولى.",
"Qwen/Qwen3-30B-A3B-Instruct-2507.description": "Qwen3-30B-A3B-Instruct-2507 هو الإصدار غير المفكر المحدث من Qwen3-30B-A3B. هو نموذج MoE يحتوي على 30.5 مليار معلمة إجمالية و3.3 مليار نشطة. يعزز بشكل كبير اتباع التعليمات، الاستدلال المنطقي، فهم النصوص، الرياضيات، العلوم، البرمجة، واستخدام الأدوات، ويوسع المعرفة متعددة اللغات، ويتماشى بشكل أفضل مع تفضيلات المستخدم في المهام المفتوحة الذاتية. يدعم سياقًا يصل إلى 256K. هذا النموذج غير مفكر فقط ولن ينتج علامات `<think></think>`.",
"Qwen/Qwen3-30B-A3B-Thinking-2507.description": "Qwen3-30B-A3B-Thinking-2507 هو أحدث نموذج تفكير في سلسلة Qwen3. هو نموذج MoE يحتوي على 30.5 مليار معلمة إجمالية و3.3 مليار نشطة، يركز على المهام المعقدة. يظهر تقدمًا كبيرًا في المنطق، الرياضيات، العلوم، البرمجة، والمعايير الأكاديمية، ويحسن اتباع التعليمات، استخدام الأدوات، توليد النصوص، والتوافق مع التفضيلات. يدعم سياقًا يصل إلى 256K ويمكن توسيعه إلى مليون رمز. هذا الإصدار مصمم لوضع التفكير مع استدلال تفصيلي خطوة بخطوة وقدرات وكيل قوية.",
"Qwen/Qwen3-30B-A3B.description": "Qwen3 هو الجيل التالي من نموذج Tongyi Qwen، يحقق تقدمًا كبيرًا في الاستدلال، القدرات العامة، قدرات الوكلاء، والأداء متعدد اللغات، ويدعم التبديل بين أوضاع التفكير.",
@@ -315,7 +317,6 @@
"codeqwen.description": "CodeQwen1.5 هو نموذج لغوي كبير مدرب على بيانات شيفرة واسعة النطاق، مصمم للمهام البرمجية المعقدة.",
"codestral-latest.description": "Codestral هو أحدث نموذج برمجة لدينا؛ الإصدار v2 (يناير 2025) يستهدف المهام منخفضة التأخير وعالية التكرار مثل FIM، تصحيح الشيفرة، وتوليد الاختبارات.",
"codestral.description": "Codestral هو أول نموذج شيفرة من Mistral AI، يقدم دعمًا قويًا لتوليد الشيفرة.",
"codex-mini-latest.description": "codex-mini-latest هو نموذج o4-mini محسّن لواجهة سطر أوامر Codex. للاستخدام المباشر عبر API، نوصي بالبدء بـ gpt-4.1.",
"cogito-2.1:671b.description": "Cogito v2.1 671B هو نموذج مفتوح المصدر من الولايات المتحدة للاستخدام التجاري، يتمتع بأداء ينافس النماذج الرائدة، وكفاءة أعلى في الاستدلال على الرموز، وسياق طويل يصل إلى 128 ألف رمز، وقدرات قوية بشكل عام.",
"cogview-3-flash.description": "CogView-3-Flash هو نموذج مجاني لتوليد الصور أطلقته Zhipu. يقوم بتوليد صور تتماشى مع تعليمات المستخدم مع تحقيق درجات جودة جمالية أعلى. يُستخدم CogView-3-Flash بشكل أساسي في مجالات مثل الإبداع الفني، مرجع التصميم، تطوير الألعاب، والواقع الافتراضي، مما يساعد المستخدمين على تحويل أوصاف النصوص إلى صور بسرعة.",
"cogview-4.description": "CogView-4 هو أول نموذج مفتوح المصدر لتحويل النص إلى صورة من Zhipu يدعم توليد الحروف الصينية. يعزز الفهم الدلالي، جودة الصور، وعرض النصوص الصينية/الإنجليزية، ويدعم مطالبات ثنائية اللغة بأي طول، ويمكنه توليد صور بأي دقة ضمن النطاقات المحددة.",
@@ -342,7 +343,7 @@
"command-light-nightly.description": "لتقليل الفجوة بين الإصدارات الرئيسية، نقدم إصدارات Command الليلية. لسلسلة command-light، يُطلق عليها command-light-nightly. إنها النسخة الأحدث والأكثر تجريبية (وقد تكون غير مستقرة)، ويتم تحديثها بانتظام دون إشعار، لذا لا يُنصح باستخدامها في الإنتاج.",
"command-light.description": "نسخة أصغر وأسرع من Command تتمتع بقدرات شبه مماثلة ولكن بسرعة أعلى.",
"command-nightly.description": "لتقليل الفجوة بين الإصدارات الرئيسية، نقدم إصدارات Command الليلية. لسلسلة Command، يُطلق عليها command-nightly. إنها النسخة الأحدث والأكثر تجريبية (وقد تكون غير مستقرة)، ويتم تحديثها بانتظام دون إشعار، لذا لا يُنصح باستخدامها في الإنتاج.",
"command-r-03-2024.description": "Command R هو نموذج دردشة يتبع التعليمات بجودة أعلى، موثوقية أكبر، وسياق أطول من النماذج السابقة. يدعم سير العمل المعقد مثل توليد الشيفرة، استرجاع المعرفة، استخدام الأدوات، والوكلاء.",
"command-r-03-2024.description": "command-r هو نموذج محادثة يتبع التعليمات ويؤدي مهام اللغة بجودة أعلى، وموثوقية محسنة، وسياق أطول مقارنة بالنماذج السابقة. يدعم سير العمل المعقد مثل إنشاء الأكواد، RAG، استخدام الأدوات، والوكلاء.",
"command-r-08-2024.description": "command-r-08-2024 هو إصدار محدث من نموذج Command R تم إطلاقه في أغسطس 2024.",
"command-r-plus-04-2024.description": "command-r-plus هو اسم مستعار لـ command-r-plus-04-2024، لذا فإن استخدام command-r-plus في API يشير إلى هذا النموذج.",
"command-r-plus-08-2024.description": "Command R+ هو نموذج دردشة يتبع التعليمات بجودة أعلى، موثوقية أكبر، وسياق أطول من النماذج السابقة. مثالي لسير العمل المعقد في استرجاع المعرفة واستخدام الأدوات متعددة الخطوات.",
@@ -366,7 +367,8 @@
"deepseek-ai/DeepSeek-V2.5.description": "يعمل DeepSeek-V2.5 على ترقية DeepSeek-V2-Chat وDeepSeek-Coder-V2-Instruct، ويمزج بين القدرات العامة والبرمجية. يحسن الكتابة واتباع التعليمات لمواءمة التفضيلات بشكل أفضل، ويظهر تحسنًا ملحوظًا في AlpacaEval 2.0 وArenaHard وAlignBench وMT-Bench.",
"deepseek-ai/DeepSeek-V3.1-Terminus.description": "DeepSeek-V3.1-Terminus هو إصدار محدث من V3.1 كنموذج وكيل هجين. يعالج المشكلات التي أبلغ عنها المستخدمون ويحسن الاستقرار واتساق اللغة ويقلل من الخلط بين الصينية/الإنجليزية والرموز غير الطبيعية. يدمج أوضاع التفكير وغير التفكير مع قوالب المحادثة للتبديل المرن. كما يعزز أداء وكلاء الكود والبحث لاستخدام الأدوات بشكل أكثر موثوقية وتنفيذ المهام متعددة الخطوات.",
"deepseek-ai/DeepSeek-V3.1.description": "يستخدم DeepSeek V3.1 بنية تفكير هجينة ويدعم أوضاع التفكير وغير التفكير.",
"deepseek-ai/DeepSeek-V3.2-Exp.description": "DeepSeek-V3.2-Exp هو إصدار تجريبي من V3.2 يربط بالهيكلية القادمة. يضيف انتباهًا متفرقًا (DSA) إلى V3.1-Terminus لتحسين كفاءة التدريب والاستدلال في السياقات الطويلة، مع تحسينات لاستخدام الأدوات، وفهم المستندات الطويلة، والتفكير متعدد الخطوات. مثالي لاستكشاف كفاءة تفكير أعلى بميزانيات سياق كبيرة.",
"deepseek-ai/DeepSeek-V3.2-Exp.description": "DeepSeek V3.2 Exp يستخدم بنية تفكير هجينة ويدعم أوضاع التفكير وغير التفكير.",
"deepseek-ai/DeepSeek-V3.2.description": "DeepSeek-V3.2 هو نموذج يجمع بين الكفاءة الحسابية العالية وأداء التفكير والوكيل الممتاز. يعتمد نهجه على ثلاثة اختراقات تكنولوجية رئيسية: DeepSeek Sparse Attention (DSA)، وهي آلية انتباه فعالة تقلل بشكل كبير من التعقيد الحسابي مع الحفاظ على أداء النموذج، ومُحسنة خصيصًا للسيناريوهات ذات السياق الطويل؛ إطار عمل للتعلم المعزز القابل للتوسع يمكن من خلاله أن ينافس أداء النموذج GPT-5، مع نسخته عالية الحوسبة التي تضاهي Gemini-3.0-Pro في قدرات التفكير؛ وخط أنابيب واسع النطاق لتوليف مهام الوكيل يهدف إلى دمج قدرات التفكير في سيناريوهات استخدام الأدوات، مما يحسن اتباع التعليمات والتعميم في البيئات التفاعلية المعقدة. حقق النموذج أداءً متميزًا في الأولمبياد الدولي للرياضيات (IMO) وأولمبياد المعلوماتية الدولي (IOI) لعام 2025.",
"deepseek-ai/DeepSeek-V3.description": "DeepSeek-V3 هو نموذج MoE يحتوي على 671 مليار معلمة، يستخدم MLA وDeepSeekMoE مع توازن تحميل خالٍ من الفقدان لتدريب واستدلال فعال. تم تدريبه مسبقًا على 14.8 تريليون رمز عالي الجودة مع SFT وRL، ويتفوق على النماذج المفتوحة الأخرى ويقترب من النماذج المغلقة الرائدة.",
"deepseek-ai/deepseek-llm-67b-chat.description": "DeepSeek LLM Chat (67B) هو نموذج مبتكر يوفر فهمًا عميقًا للغة وتفاعلًا ذكيًا.",
"deepseek-ai/deepseek-v3.1-terminus.description": "DeepSeek V3.1 هو نموذج تفكير من الجيل التالي يتمتع بقدرات أقوى في التفكير المعقد وسلسلة التفكير لمهام التحليل العميق.",
@@ -433,6 +435,7 @@
"deepseek_r1_distill_llama_70b.description": "تم تقطير DeepSeek-R1-Distill-Llama-70B من Llama-3.3-70B-Instruct. كجزء من سلسلة DeepSeek-R1، تم ضبطه بدقة باستخدام عينات تم إنشاؤها بواسطة DeepSeek-R1، ويؤدي بقوة في مجالات الرياضيات والبرمجة والاستدلال.",
"deepseek_r1_distill_qwen_14b.description": "تم تقطير DeepSeek-R1-Distill-Qwen-14B من Qwen2.5-14B وتم ضبطه بدقة باستخدام 800 ألف عينة منسقة تم إنشاؤها بواسطة DeepSeek-R1، مما يوفر أداءً قويًا في الاستدلال.",
"deepseek_r1_distill_qwen_32b.description": "تم تقطير DeepSeek-R1-Distill-Qwen-32B من Qwen2.5-32B وتم ضبطه بدقة باستخدام 800 ألف عينة منسقة تم إنشاؤها بواسطة DeepSeek-R1، ويتفوق في مجالات الرياضيات والبرمجة والاستدلال.",
"devstral-2512.description": "Devstral 2 هو نموذج نصوص على مستوى المؤسسات يتميز باستخدام الأدوات لاستكشاف قواعد الأكواد، وتحرير ملفات متعددة، وتشغيل وكلاء هندسة البرمجيات.",
"devstral-2:123b.description": "يتفوق Devstral 2 123B في استخدام الأدوات لاستكشاف قواعد الشيفرة، وتحرير ملفات متعددة، ودعم وكلاء هندسة البرمجيات.",
"doubao-1.5-lite-32k.description": "Doubao-1.5-lite هو نموذج خفيف الوزن جديد يتميز بسرعة استجابة فائقة، ويقدم جودة عالية وأداء منخفض الكمون من الدرجة الأولى.",
"doubao-1.5-pro-256k.description": "Doubao-1.5-pro-256k هو ترقية شاملة لـ Doubao-1.5-Pro، حيث يحسن الأداء العام بنسبة 10٪. يدعم نافذة سياق بحجم 256k وما يصل إلى 12k من الرموز الناتجة، مما يوفر أداءً أعلى، وسياقًا أوسع، وقيمة قوية لحالات الاستخدام المتنوعة.",
@@ -546,10 +549,10 @@
"gemini-2.5-pro-preview-06-05.description": "Gemini 2.5 Pro Preview هو أكثر نماذج Google تقدمًا في الاستدلال، قادر على تحليل الشيفرات والرياضيات ومشاكل العلوم، وتحليل مجموعات البيانات الكبيرة وقواعد الشيفرة والمستندات ضمن سياق طويل.",
"gemini-2.5-pro.description": "Gemini 2.5 Pro هو النموذج الرائد من Google في مجال الاستدلال، يدعم السياق الطويل للمهام المعقدة.",
"gemini-3-flash-preview.description": "Gemini 3 Flash هو أذكى نموذج تم تصميمه للسرعة، يجمع بين الذكاء المتقدم وأساس بحث ممتاز.",
"gemini-3-pro-image-preview.description": "Gemini 3 Pro Image (Nano Banana Pro) هو نموذج توليد الصور من Google ويدعم المحادثة متعددة الوسائط.",
"gemini-3-pro-image-preview.description": "Gemini 3 Pro Image (Nano Banana Pro) هو نموذج إنشاء الصور من Google الذي يدعم أيضًا الحوار متعدد الوسائط.",
"gemini-3-pro-image-preview:image.description": "Gemini 3 Pro Image (Nano Banana Pro) هو نموذج توليد الصور من Google ويدعم أيضًا المحادثة متعددة الوسائط.",
"gemini-3-pro-preview.description": "Gemini 3 Pro هو أقوى نموذج من Google للوكيل الذكي والبرمجة الإبداعية، يقدم تفاعلاً أعمق وصورًا أغنى مع استدلال متقدم.",
"gemini-3.1-flash-image-preview.description": "Gemini 3.1 Flash Image (Nano Banana 2) يقدم جودة صور احترافية بسرعة فائقة مع دعم الدردشة متعددة الوسائط.",
"gemini-3.1-flash-image-preview.description": "Gemini 3.1 Flash Image (Nano Banana 2) هو أسرع نموذج إنشاء صور أصلي من Google مع دعم التفكير، وإنشاء الصور الحواري، والتحرير.",
"gemini-3.1-flash-image-preview:image.description": "Gemini 3.1 Flash Image (Nano Banana 2) يقدم جودة صور احترافية بسرعة فائقة مع دعم الدردشة متعددة الوسائط.",
"gemini-3.1-pro-preview.description": "Gemini 3.1 Pro Preview يحسن من Gemini 3 Pro مع قدرات استدلال محسّنة ويضيف دعم مستوى التفكير المتوسط.",
"gemini-flash-latest.description": "أحدث إصدار من Gemini Flash",
@@ -605,19 +608,15 @@
"google/gemini-2.0-flash-lite-001.description": "Gemini 2.0 Flash Lite هو إصدار خفيف من Gemini مع تعطيل التفكير افتراضيًا لتحسين زمن الاستجابة والتكلفة، ويمكن تفعيله عبر المعلمات.",
"google/gemini-2.0-flash-lite.description": "Gemini 2.0 Flash Lite يقدم ميزات الجيل التالي بما في ذلك السرعة الفائقة، استخدام الأدوات المدمجة، التوليد متعدد الوسائط، ونافذة سياق تصل إلى مليون رمز.",
"google/gemini-2.0-flash.description": "Gemini 2.0 Flash هو نموذج استدلال عالي الأداء من Google للمهام متعددة الوسائط الممتدة.",
"google/gemini-2.5-flash-image-free.description": "النسخة المجانية من Gemini 2.5 Flash Image مع حصة محدودة للتوليد متعدد الوسائط.",
"google/gemini-2.5-flash-image-preview.description": "نموذج Gemini 2.5 Flash التجريبي مع دعم توليد الصور.",
"google/gemini-2.5-flash-image.description": "Gemini 2.5 Flash Image (Nano Banana) هو نموذج توليد الصور من Google مع دعم المحادثة متعددة الوسائط.",
"google/gemini-2.5-flash-lite.description": "Gemini 2.5 Flash Lite هو إصدار خفيف من Gemini 2.5 محسّن لزمن الاستجابة والتكلفة، مناسب لسيناريوهات الإنتاجية العالية.",
"google/gemini-2.5-flash-preview.description": "Gemini 2.5 Flash هو النموذج الرائد الأكثر تقدمًا من Google، مصمم لمهام الاستدلال المتقدم، البرمجة، الرياضيات، والعلوم. يتضمن ميزة \"التفكير\" المدمجة لتقديم استجابات أكثر دقة ومعالجة سياق أدق.\n\nملاحظة: يحتوي هذا النموذج على نسختين — مع التفكير وبدونه. تختلف أسعار الإخراج بشكل كبير حسب ما إذا كان التفكير مفعلاً. إذا اخترت النسخة القياسية (بدون اللاحقة \":thinking\")، سيتجنب النموذج توليد رموز التفكير.\n\nلاستخدام التفكير واستلام رموز التفكير، يجب اختيار النسخة \":thinking\"، والتي تتطلب تكلفة أعلى.\n\nيمكن أيضًا ضبط Gemini 2.5 Flash عبر معلمة \"الحد الأقصى لرموز الاستدلال\" كما هو موضح في الوثائق (https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning).",
"google/gemini-2.5-flash-preview:thinking.description": "Gemini 2.5 Flash هو النموذج الرائد الأكثر تقدمًا من Google، مصمم لمهام الاستدلال المتقدم، البرمجة، الرياضيات، والعلوم. يتضمن ميزة \"التفكير\" المدمجة لتقديم استجابات أكثر دقة ومعالجة سياق أدق.\n\nملاحظة: يحتوي هذا النموذج على نسختين — مع التفكير وبدونه. تختلف أسعار الإخراج بشكل كبير حسب ما إذا كان التفكير مفعلاً. إذا اخترت النسخة القياسية (بدون اللاحقة \":thinking\"), سيتجنب النموذج توليد رموز التفكير.\n\nلاستخدام التفكير واستلام رموز التفكير، يجب اختيار النسخة \":thinking\"، والتي تتطلب تكلفة أعلى.\n\nيمكن أيضًا ضبط Gemini 2.5 Flash عبر معلمة \"الحد الأقصى لرموز الاستدلال\" كما هو موضح في الوثائق (https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning).",
"google/gemini-2.5-flash.description": "Gemini 2.5 Flash (Lite/Pro/Flash) هو عائلة نماذج من Google تغطي من زمن الاستجابة المنخفض إلى الاستدلال عالي الأداء.",
"google/gemini-2.5-pro-free.description": "النسخة المجانية من Gemini 2.5 Pro تقدم حصة محدودة من التوليد متعدد الوسائط طويل السياق، مناسبة للتجارب وسير العمل الخفيف.",
"google/gemini-2.5-flash.description": "Gemini 2.5 Flash هو عائلة Google التي تمتد من زمن استجابة منخفض إلى أداء عالٍ في التفكير.",
"google/gemini-2.5-pro-preview.description": "Gemini 2.5 Pro Preview هو النموذج الأكثر تقدمًا من Google للاستدلال في المشكلات المعقدة في البرمجة، الرياضيات، والعلوم، وتحليل مجموعات البيانات الكبيرة، قواعد الشيفرة، والمستندات ذات السياق الطويل.",
"google/gemini-2.5-pro.description": "Gemini 2.5 Pro هو النموذج الرائد من Google للاستدلال مع دعم السياق الطويل للمهام المعقدة.",
"google/gemini-3-pro-image-preview-free.description": "النسخة المجانية من Gemini 3 Pro Image مع حصة محدودة للتوليد متعدد الوسائط.",
"google/gemini-3-pro-image-preview.description": "Gemini 3 Pro Image (Nano Banana Pro) هو نموذج توليد الصور من Google مع دعم المحادثة متعددة الوسائط.",
"google/gemini-3-pro-preview-free.description": "Gemini 3 Pro Preview Free يقدم نفس الفهم متعدد الوسائط والاستدلال مثل النسخة القياسية، ولكن مع حدود في الحصة ومعدل الاستخدام، مما يجعله مناسبًا للتجارب والاستخدام منخفض التكرار.",
"google/gemini-3-pro-preview.description": "Gemini 3 Pro هو نموذج الاستدلال متعدد الوسائط من الجيل التالي في عائلة Gemini، يفهم النصوص، الصوت، الصور، والفيديو، ويتعامل مع المهام المعقدة وقواعد الشيفرة الكبيرة.",
"google/gemini-embedding-001.description": "نموذج تضمين متقدم يتميز بأداء قوي في مهام اللغة الإنجليزية، ومتعددة اللغات، والبرمجة.",
"google/gemini-flash-1.5.description": "يوفر Gemini 1.5 Flash معالجة متعددة الوسائط محسّنة لمجموعة من المهام المعقدة.",
@@ -717,15 +716,24 @@
"hunyuan-a13b.description": "أول نموذج تفكير هجين من Hunyuan، مطور من hunyuan-standard-256K (بإجمالي 80 مليار، 13 مليار نشطة). يعتمد بشكل افتراضي على التفكير البطيء ويدعم التبديل بين التفكير السريع والبطيء عبر المعلمات أو بإضافة /no_think. تم تحسين القدرات العامة مقارنة بالجيل السابق، خاصة في الرياضيات والعلوم وفهم النصوص الطويلة والمهام المعتمدة على الوكلاء.",
"hunyuan-code.description": "أحدث نموذج برمجي من Hunyuan مدرب على 200 مليار بيانات أكواد عالية الجودة بالإضافة إلى ستة أشهر من بيانات SFT، مع سياق 8K. يحتل مرتبة قريبة من القمة في معايير البرمجة الآلية وفي تقييمات الخبراء البشريين عبر خمس لغات.",
"hunyuan-functioncall.description": "أحدث نموذج MoE FunctionCall من Hunyuan مدرب على بيانات استدعاء الأدوات عالية الجودة، مع نافذة سياق 32K ومعايير رائدة عبر الأبعاد.",
"hunyuan-large-longcontext.description": "يتفوق في مهام المستندات الطويلة مثل التلخيص والأسئلة والأجوبة مع التعامل أيضًا مع التوليد العام. قوي في تحليل النصوص الطويلة وتوليد المحتوى المعقد والمفصل.",
"hunyuan-large.description": "Hunyuan-large يحتوي على ~389 مليار معلمة إجمالية و ~52 مليار نشطة، وهو أكبر وأقوى نموذج MoE مفتوح في بنية Transformer.",
"hunyuan-lite.description": "تمت ترقيته إلى بنية MoE مع إطار سياق 256 ألف، ويتفوق على العديد من النماذج المفتوحة في مجالات معالجة اللغة الطبيعية، الشيفرة، الرياضيات، والمعايير الصناعية.",
"hunyuan-pro.description": "نموذج طويل السياق MoE-32K بعدد تريليون معلمة، يتصدر المعايير، قوي في التعليمات المعقدة والتفكير، الرياضيات المتقدمة، استدعاء الوظائف، ومُحسّن للترجمة متعددة اللغات، والمالية، والقانون، والمجالات الطبية.",
"hunyuan-role.description": "أحدث نموذج لعب الأدوار من Hunyuan، تم تحسينه رسميًا ببيانات لعب الأدوار، مما يقدم أداءً أساسيًا أقوى في سيناريوهات لعب الأدوار.",
"hunyuan-standard-256K.description": "يستخدم توجيهًا محسّنًا لتخفيف توازن التحميل وانهيار الخبراء. يصل النص الطويل \"الإبرة في كومة القش\" إلى 99.9%. MOE-256K يدفع أكثر في الطول والجودة، مما يوسع بشكل كبير طول الإدخال.",
"hunyuan-standard.description": "يستخدم توجيهًا محسّنًا لتخفيف توازن التحميل وانهيار الخبراء. يصل النص الطويل \"الإبرة في كومة القش\" إلى 99.9%. MOE-32K يقدم قيمة أفضل مع تحقيق توازن بين الجودة والسعر لإدخالات النص الطويل.",
"hunyuan-standard-256K.description": "يستخدم توجيهًا محسنًا لتخفيف توازن الحمل وانهيار الخبراء. يحقق 99.9% في البحث عن الإبرة في كومة القش في السياقات الطويلة. MOE-256K يوسع طول السياق والجودة.",
"hunyuan-standard.description": "يستخدم توجيهًا محسنًا لتخفيف توازن الحمل وانهيار الخبراء. يحقق 99.9% في البحث عن الإبرة في كومة القش في السياقات الطويلة. MOE-32K يقدم قيمة قوية مع التعامل مع المدخلات الطويلة.",
"hunyuan-t1-20250321.description": "يبني قدرات متوازنة في الفنون والعلوم مع التقاط قوي للمعلومات النصية الطويلة. يدعم الإجابات المنطقية لمشاكل الرياضيات، المنطق، العلوم، وبرمجة الأكواد عبر مستويات الصعوبة.",
"hunyuan-t1-20250403.description": "يحسن إنشاء الأكواد على مستوى المشاريع وجودة الكتابة، ويعزز فهم الموضوعات متعددة الأدوار واتباع تعليمات ToB، ويحسن فهم الكلمات، ويقلل من مشكلات الإخراج المختلط بين المبسط/التقليدي والصيني/الإنجليزي.",
"hunyuan-t1-20250529.description": "يحسن الكتابة الإبداعية والتأليف، ويعزز البرمجة الأمامية، والرياضيات، والتفكير المنطقي، ويعزز اتباع التعليمات.",
"hunyuan-t1-20250711.description": "يحسن بشكل كبير الرياضيات الصعبة، والمنطق، والبرمجة، ويعزز استقرار الإخراج، ويعزز القدرة على النصوص الطويلة.",
"hunyuan-t1-latest.description": "يحسن بشكل ملحوظ نموذج التفكير البطيء في الرياضيات الصعبة، والتفكير المعقد، والبرمجة المعقدة، واتباع التعليمات، وجودة الكتابة الإبداعية.",
"hunyuan-t1-vision-20250916.description": "أحدث نموذج t1-vision للتفكير العميق مع تحسينات كبيرة في VQA، التثبيت البصري، التعرف البصري على الحروف، الرسوم البيانية، حل المشكلات المصورة، والإبداع المعتمد على الصور، بالإضافة إلى دعم أقوى للإنجليزية واللغات منخفضة الموارد.",
"hunyuan-turbo-20241223.description": "يعزز هذا الإصدار توسيع التعليمات لتحسين التعميم، ويحسن بشكل كبير التفكير في الرياضيات/الأكواد/المنطق، ويعزز فهم الكلمات، ويحسن جودة الكتابة.",
"hunyuan-turbo-latest.description": "تحسينات عامة في تجربة فهم اللغة الطبيعية، والكتابة، والدردشة، والأسئلة والأجوبة، والترجمة، والمجالات؛ استجابات أكثر إنسانية، توضيح أفضل للنوايا الغامضة، تحسين تحليل الكلمات، جودة إبداعية أعلى وتفاعلية، ومحادثات متعددة الأدوار أقوى.",
"hunyuan-turbo.description": "نموذج الجيل التالي من Hunyuan LLM بمعمارية MoE جديدة، يوفر تفكيراً أسرع ونتائج أقوى من hunyuan-pro.",
"hunyuan-turbos-latest.description": "أحدث نموذج رائد من Hunyuan TurboS مع تفكير أقوى وتجربة شاملة أفضل.",
"hunyuan-turbos-longtext-128k-20250325.description": "يتفوق في مهام المستندات الطويلة مثل التلخيص والأسئلة والأجوبة مع التعامل أيضًا مع التوليد العام. قوي في تحليل النصوص الطويلة وتوليد المحتوى المعقد والمفصل.",
"hunyuan-vision-1.5-instruct.description": "نموذج سريع التفكير لتحويل الصور إلى نص مبني على قاعدة النص TurboS، يظهر تحسينات ملحوظة مقارنة بالإصدار السابق في التعرف الأساسي على الصور واستدلال تحليل الصور.",
"hunyuan-vision.description": "أحدث نموذج متعدد الوسائط من Hunyuan يدعم إدخالات الصور + النصوص لتوليد النصوص.",
"image-01-live.description": "نموذج توليد صور بتفاصيل دقيقة، يدعم التحويل من نص إلى صورة وأنماط قابلة للتحكم.",
@@ -770,8 +778,7 @@
"kimi-k2:1t.description": "Kimi K2 هو نموذج LLM كبير من نوع MoE من Moonshot AI بإجمالي 1 تريليون معلمة و32 مليار نشطة لكل تمرير أمامي. مُحسّن لقدرات الوكالة بما في ذلك استخدام الأدوات المتقدمة، الاستدلال، وتوليد الشيفرة.",
"kimi-latest.description": "Kimi Latest يستخدم أحدث نموذج من Kimi وقد يتضمن ميزات تجريبية. يدعم فهم الصور ويختار تلقائيًا نماذج الفوترة 8k/32k/128k بناءً على طول السياق.",
"kuaishou/kat-coder-pro-v1.description": "KAT-Coder-Pro-V1 (مجاني لفترة محدودة) يركز على فهم الشيفرة والأتمتة لوكلاء البرمجة الفعالة.",
"learnlm-1.5-pro-experimental.description": "LearnLM هو نموذج تجريبي خاص بالمهام مدرب على مبادئ علم التعلم لاتباع تعليمات النظام في سيناريوهات التعليم/التعلم، ويعمل كمدرس خبير.",
"learnlm-2.0-flash-experimental.description": "LearnLM هو نموذج تجريبي خاص بالمهام مدرب على مبادئ علم التعلم لاتباع تعليمات النظام في سيناريوهات التعليم/التعلم، ويعمل كمدرس خبير.",
"labs-devstral-small-2512.description": "Devstral Small 2 يتفوق في استخدام الأدوات لاستكشاف قواعد الأكواد، وتحرير ملفات متعددة، وتشغيل وكلاء هندسة البرمجيات.",
"lite.description": "Spark Lite هو نموذج LLM خفيف الوزن بزمن استجابة منخفض للغاية ومعالجة فعالة. مجاني بالكامل ويدعم البحث الفوري عبر الإنترنت. يقدم استجابات سريعة ويعمل جيدًا على الأجهزة منخفضة القدرة ولتخصيص النماذج، مما يوفر كفاءة تكلفة عالية وتجربة ذكية، خاصة في سيناريوهات الأسئلة المعرفية، توليد المحتوى، والبحث.",
"llama-3.1-70b-versatile.description": "Llama 3.1 70B يقدم استدلالًا أقوى للذكاء الاصطناعي لتطبيقات معقدة، ويدعم الحوسبة الثقيلة بكفاءة ودقة عالية.",
"llama-3.1-8b-instant.description": "Llama 3.1 8B هو نموذج عالي الكفاءة لتوليد النصوص بسرعة، مثالي للتطبيقات واسعة النطاق وذات التكلفة المنخفضة.",
@@ -782,7 +789,6 @@
"llama-3.2-90b-vision-preview.description": "تم تصميم Llama 3.2 للمهام التي تجمع بين الرؤية والنص، ويتفوق في توصيف الصور والأسئلة البصرية لربط توليد اللغة بالاستدلال البصري.",
"llama-3.2-vision-instruct.description": "نموذج Llama 3.2-Vision المحسن للتعليمات مُحسّن للتعرف البصري، الاستدلال على الصور، توصيف الصور، والأسئلة العامة حول الصور.",
"llama-3.3-70b-versatile.description": "Meta Llama 3.3 هو نموذج LLM متعدد اللغات يحتوي على 70 مليار معلمة (نص داخل/خارج)، ويقدم نسخًا مدربة مسبقًا ومحسنة للتعليمات. النسخة المحسنة للتعليمات مخصصة للدردشة متعددة اللغات وتتجاوز العديد من النماذج المفتوحة والمغلقة في اختبارات الصناعة الشائعة.",
"llama-3.3-70b.description": "Llama 3.3 70B: نموذج متوسط إلى كبير من Llama يوازن بين الاستدلال والإنتاجية.",
"llama-3.3-instruct.description": "نموذج Llama 3.3 المحسن للتعليمات مُحسّن للدردشة ويتفوق على العديد من النماذج المفتوحة في اختبارات الصناعة الشائعة.",
"llama3-70b-8192.description": "Meta Llama 3 70B يقدم معالجة استثنائية للتعقيد للمشاريع المتطلبة.",
"llama3-8b-8192.description": "Meta Llama 3 8B يقدم أداء استدلال قوي لسيناريوهات متنوعة.",
@@ -832,7 +838,6 @@
"meta-llama/llama-3.1-8b-instruct:free.description": "LLaMA 3.1 يدعم لغات متعددة ويُعد من النماذج الرائدة في التوليد.",
"meta-llama/llama-3.2-11b-vision-instruct.description": "تم تصميم LLaMA 3.2 لمهام تجمع بين الرؤية والنص. يتفوق في توصيف الصور والأسئلة البصرية، ويجسر بين توليد اللغة والاستدلال البصري.",
"meta-llama/llama-3.2-3b-instruct.description": "meta-llama/llama-3.2-3b-instruct",
"meta-llama/llama-3.2-90b-vision-instruct.description": "تم تصميم LLaMA 3.2 لمهام تجمع بين الرؤية والنص. يتفوق في توصيف الصور والأسئلة البصرية، ويجسر بين توليد اللغة والاستدلال البصري.",
"meta-llama/llama-3.3-70b-instruct.description": "Llama 3.3 هو النموذج مفتوح المصدر الأكثر تقدماً من Llama متعدد اللغات، يقدم أداءً قريباً من 405B بتكلفة منخفضة جداً. يعتمد على Transformer وتم تحسينه باستخدام SFT وRLHF لتحقيق الفائدة والسلامة. النسخة المُعدّة للتعليمات مُحسّنة للدردشة متعددة اللغات وتتفوّق على العديد من النماذج المفتوحة والمغلقة في معايير الصناعة. تاريخ قطع المعرفة: ديسمبر 2023.",
"meta-llama/llama-3.3-70b-instruct:free.description": "Llama 3.3 هو النموذج مفتوح المصدر الأكثر تقدماً من Llama متعدد اللغات، يقدم أداءً قريباً من 405B بتكلفة منخفضة جداً. يعتمد على Transformer وتم تحسينه باستخدام SFT وRLHF لتحقيق الفائدة والسلامة. النسخة المُعدّة للتعليمات مُحسّنة للدردشة متعددة اللغات وتتفوّق على العديد من النماذج المفتوحة والمغلقة في معايير الصناعة. تاريخ قطع المعرفة: ديسمبر 2023.",
"meta.llama3-1-405b-instruct-v1:0.description": "Meta Llama 3.1 405B Instruct هو أكبر وأقوى نموذج Llama 3.1 Instruct، نموذج متقدم للغاية للحوار والاستدلال وتوليد البيانات الاصطناعية، ويشكل قاعدة قوية للتدريب المخصص أو التخصيص حسب المجال. نماذج Llama 3.1 متعددة اللغات هي مجموعة من النماذج المدربة مسبقًا والمضبوطة بالتعليمات بأحجام 8B و70B و405B (نص داخل/نص خارج). تم تحسين النماذج المضبوطة للحوار متعدد اللغات وتتجاوز العديد من نماذج الدردشة المفتوحة في المعايير الصناعية. تم تصميم Llama 3.1 للاستخدام التجاري والبحثي عبر اللغات. النماذج المضبوطة مناسبة للدردشة على نمط المساعد، بينما النماذج المدربة مسبقًا تناسب مهام توليد اللغة الطبيعية الأوسع. يمكن أيضًا استخدام مخرجات Llama 3.1 لتحسين نماذج أخرى، بما في ذلك توليد البيانات الاصطناعية وتحسينها. Llama 3.1 هو نموذج Transformer توليدي ذاتي مع بنية محسّنة. تستخدم الإصدارات المضبوطة التخصيص الخاضع للإشراف (SFT) والتعلم المعزز من تغذية راجعة بشرية (RLHF) لتتماشى مع تفضيلات البشر من حيث الفائدة والسلامة.",
@@ -894,7 +899,7 @@
"mistral-large-instruct.description": "Mistral-Large-Instruct-2407 هو نموذج لغوي كثيف متقدم يحتوي على 123 مليار معامل، يتميز بأحدث تقنيات الاستدلال والمعرفة والبرمجة.",
"mistral-large-latest.description": "Mistral Large هو النموذج الرئيسي، قوي في المهام متعددة اللغات، والاستدلال المعقد، وتوليد الكود—مثالي للتطبيقات المتقدمة.",
"mistral-large.description": "Mixtral Large هو النموذج الرئيسي من Mistral، يجمع بين توليد الكود، والرياضيات، والاستدلال مع نافذة سياق 128K.",
"mistral-medium-latest.description": "Mistral Medium 3 يقدم أداءً متقدمًا بتكلفة أقل 8 مرات، ويسهّل النشر المؤسسي.",
"mistral-medium-latest.description": "Mistral Medium 3.1 يقدم أداءً رائدًا بتكلفة أقل بـ 8 مرات ويُبسط نشر المؤسسات.",
"mistral-nemo-instruct.description": "Mistral-Nemo-Instruct-2407 هو الإصدار الموجه بالتعليمات من Mistral-Nemo-Base-2407.",
"mistral-nemo.description": "Mistral Nemo هو نموذج فعال يحتوي على 12 مليار معامل من Mistral AI وNVIDIA.",
"mistral-small-latest.description": "Mistral Small هو خيار سريع وموثوق وفعال من حيث التكلفة للترجمة، والتلخيص، وتحليل المشاعر.",
@@ -933,7 +938,7 @@
"moonshot-v1-auto.description": "Moonshot V1 Auto يختار النموذج المناسب بناءً على استخدام الرموز في السياق الحالي.",
"moonshotai/Kimi-Dev-72B.description": "Kimi-Dev-72B هو نموذج مفتوح المصدر للبرمجة تم تحسينه باستخدام التعلم المعزز على نطاق واسع لإنتاج تصحيحات قوية وجاهزة للإنتاج. يحقق نسبة 60.4٪ على SWE-bench Verified، مسجلاً رقمًا قياسيًا جديدًا للنماذج المفتوحة في مهام هندسة البرمجيات الآلية مثل إصلاح الأخطاء ومراجعة الشيفرة.",
"moonshotai/Kimi-K2-Instruct-0905.description": "Kimi K2-Instruct-0905 هو أحدث وأقوى إصدار من Kimi K2. إنه نموذج MoE من الدرجة الأولى يحتوي على تريليون معلمة إجمالية و32 مليار معلمة نشطة. من أبرز ميزاته الذكاء البرمجي القوي، وتحسينات كبيرة في اختبارات الأداء والمهام الواقعية، بالإضافة إلى تحسينات في جمالية واجهات الاستخدام وسهولة البرمجة الأمامية.",
"moonshotai/Kimi-K2-Thinking.description": "Kimi K2 Thinking هو أحدث وأقوى نموذج تفكير مفتوح المصدر. يعزز بشكل كبير عمق التفكير متعدد الخطوات ويحافظ على استخدام الأدوات بثبات عبر 200300 استدعاء متتالي، محققًا أرقامًا قياسية جديدة في Humanity's Last Exam (HLE)، وBrowseComp، وغيرها من المعايير. يتفوق في البرمجة، والرياضيات، والمنطق، وسيناريوهات الوكلاء. مبني على بنية MoE بحوالي تريليون معلمة إجمالية، ويدعم نافذة سياق بحجم 256K واستدعاء الأدوات.",
"moonshotai/Kimi-K2-Thinking.description": "Kimi K2 Thinking هو أحدث وأقوى نموذج تفكير مفتوح المصدر. يوسع بشكل كبير عمق التفكير متعدد الخطوات ويحافظ على استخدام الأدوات المستقر عبر 200-300 استدعاء متتالي، محققًا أرقامًا قياسية جديدة في Humanity's Last Exam (HLE)، BrowseComp، ومعايير أخرى. يتفوق في البرمجة، الرياضيات، المنطق، وسيناريوهات الوكيل. يعتمد على بنية MoE مع ~1 تريليون معلمة إجمالية، ويدعم نافذة سياق 256K واستدعاء الأدوات.",
"moonshotai/kimi-k2-0711.description": "Kimi K2 0711 هو إصدار موجه من سلسلة Kimi، مناسب للبرمجة عالية الجودة واستخدام الأدوات.",
"moonshotai/kimi-k2-0905.description": "Kimi K2 0905 هو تحديث يعزز أداء السياق والتفكير مع تحسينات في البرمجة.",
"moonshotai/kimi-k2-instruct-0905.description": "نموذج kimi-k2-0905-preview يدعم نافذة سياق بحجم 256K، مع برمجة وكيلة أقوى، وشيفرة أمامية أكثر صقلًا وعملية، وفهم أفضل للسياق.",
@@ -948,8 +953,8 @@
"nvidia/Llama-3.1-Nemotron-70B-Instruct-HF.description": "Llama 3.1 Nemotron 70B هو نموذج LLM مخصص من NVIDIA لتحسين الفائدة. يحقق أداءً قويًا في Arena Hard وAlpacaEval 2 LC وGPT-4-Turbo MT-Bench، ويحتل المرتبة الأولى في جميع معايير المحاذاة التلقائية الثلاثة حتى 1 أكتوبر 2024. تم تدريبه من Llama-3.1-70B-Instruct باستخدام RLHF (REINFORCE)، وLlama-3.1-Nemotron-70B-Reward، ومطالبات HelpSteer2-Preference.",
"nvidia/llama-3.1-nemotron-51b-instruct.description": "نموذج لغوي مميز يقدم دقة وكفاءة استثنائية.",
"nvidia/llama-3.1-nemotron-70b-instruct.description": "Llama-3.1-Nemotron-70B-Instruct هو نموذج مخصص من NVIDIA مصمم لتحسين فائدة استجابات LLM.",
"o1-mini.description": "أصغر وأسرع من o1-preview، بتكلفة أقل بنسبة 80٪، قوي في توليد الشيفرة والمهام ذات السياق القصير.",
"o1-preview.description": "يركز على التفكير المتقدم وحل المشكلات المعقدة، بما في ذلك الرياضيات والعلوم. مثالي للتطبيقات التي تتطلب فهمًا عميقًا للسياق وسير عمل مستقل.",
"o1-mini.description": "o1-mini هو نموذج تفكير سريع وفعال من حيث التكلفة مصمم للبرمجة، الرياضيات، والعلوم. يحتوي على سياق 128K وحد أقصى للمعرفة في أكتوبر 2023.",
"o1-preview.description": "o1 هو نموذج التفكير الجديد من OpenAI للمهام المعقدة التي تتطلب معرفة واسعة. يحتوي على سياق 128K وحد أقصى للمعرفة في أكتوبر 2023.",
"o1-pro.description": "تم تدريب سلسلة o1 باستخدام التعلم المعزز للتفكير قبل الإجابة والتعامل مع التفكير المعقد. يستخدم o1-pro موارد حسابية أكبر للتفكير الأعمق وتقديم إجابات عالية الجودة باستمرار.",
"o1.description": "o1 هو نموذج التفكير الجديد من OpenAI بمدخلات نصية وصورية ومخرجات نصية، مناسب للمهام المعقدة التي تتطلب معرفة واسعة. يحتوي على نافذة سياق بحجم 200K وتاريخ معرفة حتى أكتوبر 2023.",
"o3-2025-04-16.description": "o3 هو نموذج التفكير الجديد من OpenAI بمدخلات نصية وصورية ومخرجات نصية للمهام المعقدة التي تتطلب معرفة واسعة.",
@@ -1022,7 +1027,6 @@
"qianfan-check-vl.description": "Qianfan Check VL هو نموذج مراجعة محتوى متعدد الوسائط لمهام التوافق والتعرف على الصور والنصوص.",
"qianfan-composition.description": "Qianfan Composition هو نموذج إنشاء متعدد الوسائط لفهم وتوليد الصور والنصوص المختلطة.",
"qianfan-engcard-vl.description": "Qianfan EngCard VL هو نموذج تعرف متعدد الوسائط يركز على السيناريوهات الإنجليزية.",
"qianfan-lightning-128b-a19b.description": "Qianfan Lightning 128B A19B هو نموذج صيني عام عالي الأداء للأسئلة المعقدة والتفكير واسع النطاق.",
"qianfan-llama-vl-8b.description": "Qianfan Llama VL 8B هو نموذج متعدد الوسائط مبني على Llama لفهم عام للصور والنصوص.",
"qianfan-multipicocr.description": "Qianfan MultiPicOCR هو نموذج OCR متعدد الصور لاكتشاف النصوص والتعرف عليها عبر الصور.",
"qianfan-qi-vl.description": "Qianfan QI VL هو نموذج سؤال وجواب متعدد الوسائط للاسترجاع الدقيق والإجابة في سيناريوهات الصور والنصوص المعقدة.",
@@ -1032,7 +1036,6 @@
"qvq-72b-preview.description": "QVQ-72B-Preview هو نموذج بحث تجريبي من Qwen يركز على تحسين الاستدلال البصري.",
"qvq-max.description": "نموذج الاستدلال البصري Qwen QVQ يدعم إدخال الصور وإخراج سلسلة التفكير، ويتميز بأداء قوي في الرياضيات، البرمجة، التحليل البصري، الإبداع، والمهام العامة.",
"qvq-plus.description": "نموذج استدلال بصري يدعم إدخال الصور وإخراج سلسلة التفكير. سلسلة qvq-plus تتبع qvq-max وتوفر استدلالًا أسرع مع توازن أفضل بين الجودة والتكلفة.",
"qwen-3-32b.description": "Qwen 3 32B: قوي في المهام متعددة اللغات والبرمجة، مناسب للاستخدام الإنتاجي متوسط النطاق.",
"qwen-coder-plus.description": "نموذج Qwen للبرمجة.",
"qwen-coder-turbo-latest.description": "نموذج Qwen للبرمجة.",
"qwen-coder-turbo.description": "نموذج Qwen للبرمجة.",
@@ -1128,7 +1131,6 @@
"qwen3-coder-next.description": "الجيل التالي من Qwen coder محسن لتوليد الأكواد المعقدة متعددة الملفات، وتصحيح الأخطاء، وسير العمل عالي الإنتاجية للوكلاء. مصمم لتكامل الأدوات القوي وتحسين أداء الاستدلال.",
"qwen3-coder-plus.description": "نموذج Qwen للبرمجة. سلسلة Qwen3-Coder الأحدث مبنية على Qwen3 وتوفر قدرات قوية كوكلاء برمجة، واستخدام الأدوات، والتفاعل مع البيئة للبرمجة الذاتية، مع أداء ممتاز في البرمجة وقدرات عامة قوية.",
"qwen3-coder:480b.description": "نموذج عالي الأداء من Alibaba لمعالجة المهام المتعلقة بالوكلاء والبرمجة مع دعم لسياقات طويلة.",
"qwen3-max-2026-01-23.description": "نماذج Qwen3 Max تحقق تقدمًا كبيرًا مقارنة بسلسلة 2.5 في القدرات العامة، وفهم الصينية/الإنجليزية، واتباع التعليمات المعقدة، والمهام المفتوحة الذاتية، والقدرة متعددة اللغات، واستخدام الأدوات، مع تقليل الهلوسة. الإصدار الأحدث qwen3-max يحسن البرمجة الوكيلة واستخدام الأدوات مقارنة بـ qwen3-max-preview. هذا الإصدار يحقق أداءً رائدًا في المجال ويستهدف احتياجات الوكلاء المعقدة.",
"qwen3-max-preview.description": "أفضل نموذج Qwen للأداء في المهام المعقدة متعددة الخطوات. المعاينة تدعم التفكير.",
"qwen3-max.description": "نماذج Qwen3 Max تقدم تحسينات كبيرة مقارنة بسلسلة 2.5 في القدرات العامة، وفهم اللغة الصينية/الإنجليزية، واتباع التعليمات المعقدة، والمهام المفتوحة الذاتية، والقدرات متعددة اللغات، واستخدام الأدوات، مع تقليل الهلوسة. الإصدار الأحدث qwen3-max يعزز البرمجة الوكيلة واستخدام الأدوات مقارنة بـ qwen3-max-preview. هذا الإصدار يحقق أداءً رائداً في المجال ويستهدف احتياجات الوكلاء المعقدة.",
"qwen3-next-80b-a3b-instruct.description": "نموذج Qwen3 من الجيل التالي مفتوح المصدر غير مخصص للتفكير. مقارنة بالإصدار السابق (Qwen3-235B-A22B-Instruct-2507)، يتميز بفهم أفضل للغة الصينية، واستدلال منطقي أقوى، وتحسين في توليد النصوص.",
@@ -1145,7 +1147,8 @@
"qwen3-vl-flash.description": "Qwen3 VL Flash: إصدار خفيف وسريع للاستدلال مخصص للطلبات الحساسة للزمن أو ذات الحجم الكبير.",
"qwen3-vl-plus.description": "Qwen VL هو نموذج توليد نصوص مع فهم بصري. يمكنه تنفيذ OCR، والتلخيص، والاستدلال، مثل استخراج السمات من صور المنتجات أو حل المشكلات من الصور.",
"qwen3.5-397b-a17b.description": "يدعم إدخالات النصوص والصور والفيديو. بالنسبة للمهام النصية فقط، أداؤه مشابه لـ Qwen3 Max، مع تقديم كفاءة أعلى وتكلفة أقل. في القدرات متعددة الوسائط، يقدم تحسينات كبيرة مقارنة بسلسلة Qwen3 VL.",
"qwen3.5-plus.description": "Qwen3.5 Plus يدعم إدخالات النصوص والصور والفيديو. بالنسبة للمهام النصية فقط، أداؤه مشابه لـ Qwen3 Max، مع تقديم كفاءة أعلى وتكلفة أقل. في القدرات متعددة الوسائط، يظهر تحسينات كبيرة مقارنة بسلسلة Qwen3 VL.",
"qwen3.5-plus.description": "Qwen3.5 Plus يدعم إدخال النصوص، الصور، والفيديو. أداؤه في المهام النصية البحتة يعادل Qwen3 Max، مع أداء أفضل وتكلفة أقل. قدراته متعددة الوسائط محسنة بشكل كبير مقارنة بسلسلة Qwen3 VL.",
"qwen3.5:397b.description": "Qwen3.5 هو نموذج أساسي موحد للرؤية واللغة مع بنية هجينة (Mixture-of-Experts + انتباه خطي)، يقدم قدرات قوية في التفكير متعدد الوسائط، البرمجة، والسياقات الطويلة مع نافذة سياق 256K.",
"qwen3.description": "Qwen3 هو نموذج اللغة الكبير من الجيل التالي من Alibaba، يتميز بأداء قوي في مجموعة متنوعة من الاستخدامات.",
"qwq-32b-preview.description": "QwQ هو نموذج بحث تجريبي من Qwen يركز على تحسين الاستدلال.",
"qwq-32b.description": "QwQ هو نموذج استدلال من عائلة Qwen. مقارنة بالنماذج المضبوطة على التعليمات، يقدم تفكيراً واستدلالاً يعزز الأداء بشكل كبير، خاصة في المشكلات المعقدة. QwQ-32B هو نموذج متوسط الحجم ينافس أفضل نماذج الاستدلال مثل DeepSeek-R1 و o1-mini.",
@@ -1187,7 +1190,7 @@
"step-2-16k.description": "يدعم التفاعلات ذات السياق الكبير للمحادثات المعقدة.",
"step-2-mini.description": "مبني على بنية MFA الجديدة، يقدم نتائج مماثلة لـ Step-1 بتكلفة أقل، مع إنتاجية أعلى وزمن استجابة أسرع. يتعامل مع المهام العامة بقدرة قوية على البرمجة.",
"step-2x-large.description": "نموذج صور من الجيل الجديد من StepFun يركز على توليد الصور، وينتج صورًا عالية الجودة من التعليمات النصية. يتميز بواقعية أكبر في الملمس وقدرة أقوى على عرض النصوص الصينية/الإنجليزية.",
"step-3.5-flash.description": "نموذج الاستدلال اللغوي الرائد من Stepfun. يقدم هذا النموذج قدرات استدلال من الدرجة الأولى مع تنفيذ سريع وموثوق. يمكنه تفكيك وتخطيط المهام المعقدة، استدعاء الأدوات بسرعة وموثوقية لتنفيذها، والتفوق في الاستدلال المنطقي، الرياضيات، هندسة البرمجيات، البحث العميق، وغيرها من المهام المتقدمة. طول السياق هو 256K.",
"step-3.5-flash.description": "نموذج التفكير اللغوي الرائد من Stepfun. يتميز بقدرات تفكير من الدرجة الأولى وقدرات تنفيذ سريعة وموثوقة. قادر على تحليل وتخطيط المهام المعقدة، واستدعاء الأدوات بسرعة وموثوقية لأداء المهام، والتعامل مع مختلف المهام المعقدة مثل التفكير المنطقي، الرياضيات، هندسة البرمجيات، والبحث المتعمق.",
"step-3.description": "يتمتع هذا النموذج بإدراك بصري قوي واستدلال معقد، ويتعامل بدقة مع فهم المعرفة عبر المجالات، وتحليل الرياضيات والرؤية، ومجموعة واسعة من مهام التحليل البصري اليومية.",
"step-r1-v-mini.description": "نموذج استدلال يتمتع بفهم قوي للصور، يمكنه معالجة الصور والنصوص، ثم توليد نص بعد استدلال عميق. يتفوق في الاستدلال البصري ويقدم أداءً رائدًا في الرياضيات والبرمجة والاستدلال النصي، مع نافذة سياق تصل إلى 100 ألف.",
"stepfun-ai/step3.description": "Step3 هو نموذج استدلال متعدد الوسائط متقدم من StepFun، مبني على بنية MoE بسعة إجمالية 321B و38B نشطة. تصميمه الشامل يقلل من تكلفة فك التشفير مع تقديم استدلال رؤية-لغة من الدرجة الأولى. بفضل تصميم MFA وAFD، يظل فعالًا على المسرعات القوية والضعيفة. تم تدريبه مسبقًا على أكثر من 20 تريليون رمز نصي و4 تريليون رمز صورة-نص بعدة لغات. يحقق أداءً رائدًا في النماذج المفتوحة في اختبارات الرياضيات والبرمجة ومتعددة الوسائط.",
@@ -1276,10 +1279,11 @@
"z-ai/glm4.7.description": "GLM-4.7 هو أحدث نموذج رئيسي من Zhipu، محسّن لسيناريوهات البرمجة الوكيلية مع تحسين قدرات البرمجة.",
"z-ai/glm5.description": "GLM-5 هو النموذج الأساسي الجديد من Zhipu AI للهندسة الوكيلة، يحقق أداءً مفتوح المصدر SOTA في البرمجة وقدرات الوكلاء. يتطابق مع أداء Claude Opus 4.5.",
"z-image-turbo.description": "Z-Image هو نموذج خفيف الوزن لتحويل النصوص إلى صور يمكنه بسرعة إنتاج الصور، يدعم تقديم النصوص باللغتين الصينية والإنجليزية، ويتكيف بمرونة مع دقة متعددة ونسب عرض إلى ارتفاع.",
"zai-glm-4.7.description": "هذا النموذج يقدم أداءً قويًا في البرمجة مع قدرات تفكير متقدمة، واستخدام أدوات متفوق، وأداء معزز في تطبيقات البرمجة الوكيلة الواقعية.",
"zai-org/GLM-4.5-Air.description": "GLM-4.5-Air هو نموذج أساسي لتطبيقات الوكلاء يستخدم بنية Mixture-of-Experts. مُحسّن لاستخدام الأدوات، وتصفح الويب، والهندسة البرمجية، وبرمجة الواجهات، ويتكامل مع وكلاء البرمجة مثل Claude Code وRoo Code. يستخدم استدلالًا هجينًا للتعامل مع السيناريوهات المعقدة واليومية.",
"zai-org/GLM-4.5.description": "GLM-4.5 هو نموذج أساسي لتطبيقات الوكلاء يستخدم بنية Mixture-of-Experts. مُحسّن بعمق لاستخدام الأدوات، وتصفح الويب، والهندسة البرمجية، وبرمجة الواجهات، ويتكامل مع وكلاء البرمجة مثل Claude Code وRoo Code. يستخدم استدلالًا هجينًا للتعامل مع السيناريوهات المعقدة واليومية.",
"zai-org/GLM-4.5V.description": "GLM-4.5V هو أحدث نموذج رؤية من Zhipu AI، مبني على نموذج النص الرائد GLM-4.5-Air (إجمالي 106 مليار، 12 مليار نشط) باستخدام بنية MoE لأداء قوي بتكلفة أقل. يتبع مسار GLM-4.1V-Thinking ويضيف 3D-RoPE لتحسين الاستدلال المكاني ثلاثي الأبعاد. مُحسّن من خلال التدريب المسبق، والتعلم الخاضع للإشراف، والتعلم المعزز، ويتعامل مع الصور، والفيديو، والمستندات الطويلة، ويتصدر النماذج المفتوحة في 41 معيارًا متعدد الوسائط. يتيح وضع التفكير للمستخدمين التوازن بين السرعة والعمق.",
"zai-org/GLM-4.6.description": "مقارنة بـ GLM-4.5، يوسّع GLM-4.6 السياق من 128 ألف إلى 200 ألف لمهام الوكلاء المعقدة. يحقق نتائج أعلى في اختبارات البرمجة ويُظهر أداءً أقوى في التطبيقات الواقعية مثل Claude Code وCline وRoo Code وKilo Code، بما في ذلك توليد صفحات الواجهة الأمامية بشكل أفضل. تم تحسين الاستدلال ودعم استخدام الأدوات أثناء التفكير، مما يعزز القدرات العامة. يتكامل بشكل أفضل مع أطر الوكلاء، ويحسّن وكلاء الأدوات/البحث، ويتميز بأسلوب كتابة مفضل بشريًا وطبيعية في تقمص الأدوار.",
"zai-org/GLM-4.6V.description": "GLM-4.6V يحقق دقة رائدة في فهم الرؤية على نفس نطاق المعلمات SOTA، ولأول مرة يدمج قدرة استدعاء الوظائف (Function Call) أصلاً في نموذج الرؤية، مما يربط بين 'الإدراك البصري' و'الإجراءات القابلة للتنفيذ'، مما يوفر قاعدة تقنية موحدة للوكلاء متعدد الوسائط في سيناريوهات الأعمال الواقعية.",
"zai/glm-4.5-air.description": "GLM-4.5 وGLM-4.5-Air هما أحدث النماذج الرائدة لدينا لتطبيقات الوكلاء، وكلاهما يستخدم بنية MoE. يحتوي GLM-4.5 على 355 مليار إجمالي و32 مليار نشط لكل تمرير؛ بينما GLM-4.5-Air أنحف بإجمالي 106 مليار و12 مليار نشط.",
"zai/glm-4.5.description": "سلسلة GLM-4.5 مصممة للوكلاء. النموذج الرائد GLM-4.5 يجمع بين الاستدلال، والبرمجة، ومهارات الوكلاء مع 355 مليار معلمة إجمالية (32 مليار نشطة) ويقدّم أوضاع تشغيل مزدوجة كنظام استدلال هجين.",
"zai/glm-4.5v.description": "GLM-4.5V مبني على GLM-4.5-Air، ويَرِث تقنيات GLM-4.1V-Thinking المثبتة، ويتوسع ببنية MoE قوية بسعة 106 مليار.",
+14
View File
@@ -24,6 +24,20 @@
"builtins.lobe-agent-builder.inspector.noResults": "لا توجد نتائج",
"builtins.lobe-agent-builder.inspector.togglePlugin": "تبديل",
"builtins.lobe-agent-builder.title": "خبير بناء الوكلاء",
"builtins.lobe-agent-management.apiName.callAgent": "وكيل الاتصال",
"builtins.lobe-agent-management.apiName.createAgent": "إنشاء وكيل",
"builtins.lobe-agent-management.apiName.deleteAgent": "حذف الوكيل",
"builtins.lobe-agent-management.apiName.searchAgent": "البحث عن وكلاء",
"builtins.lobe-agent-management.apiName.updateAgent": "تحديث الوكيل",
"builtins.lobe-agent-management.inspector.callAgent.sync": "الاتصال:",
"builtins.lobe-agent-management.inspector.callAgent.task": "تعيين مهمة إلى:",
"builtins.lobe-agent-management.inspector.createAgent.title": "إنشاء وكيل:",
"builtins.lobe-agent-management.inspector.searchAgent.all": "البحث عن وكلاء:",
"builtins.lobe-agent-management.inspector.searchAgent.market": "البحث في السوق:",
"builtins.lobe-agent-management.inspector.searchAgent.results": "{{count}} نتائج",
"builtins.lobe-agent-management.inspector.searchAgent.user": "البحث عن وكلائي:",
"builtins.lobe-agent-management.inspector.updateAgent.title": "تحديث الوكيل:",
"builtins.lobe-agent-management.title": "مدير الوكلاء",
"builtins.lobe-cloud-sandbox.apiName.editLocalFile": "تعديل الملف",
"builtins.lobe-cloud-sandbox.apiName.executeCode": "تنفيذ الكود",
"builtins.lobe-cloud-sandbox.apiName.exportFile": "تصدير الملف",
+3
View File
@@ -724,6 +724,9 @@
"tools.builtins.lobe-artifacts.description": "إنشاء ومعاينة مكونات واجهة المستخدم التفاعلية، وتصوير البيانات، والمخططات، والرسومات بصيغة SVG، وتطبيقات الويب بشكل مباشر. أنشئ محتوى بصريًا غنيًا يمكن للمستخدمين التفاعل معه مباشرة.",
"tools.builtins.lobe-artifacts.readme": "أنشئ معاينات حية وتفاعلية لمكونات واجهة المستخدم، وتصوير البيانات، والمخططات، والرسومات بصيغة SVG، وتطبيقات الويب. أنشئ محتوى بصريًا غنيًا يمكن للمستخدمين التفاعل معه مباشرة.",
"tools.builtins.lobe-artifacts.title": "القطع الفنية",
"tools.builtins.lobe-calculator.description": "إجراء العمليات الحسابية، حل المعادلات، والعمل مع التعبيرات الرمزية",
"tools.builtins.lobe-calculator.readme": "آلة حاسبة رياضية متقدمة تدعم العمليات الحسابية الأساسية، المعادلات الجبرية، عمليات التفاضل والتكامل، والرياضيات الرمزية. تشمل تحويل القواعد، حل المعادلات، التفاضل، التكامل، وأكثر.",
"tools.builtins.lobe-calculator.title": "آلة حاسبة",
"tools.builtins.lobe-cloud-sandbox.description": "تنفيذ تعليمات برمجية بلغة بايثون، جافاسكريبت، وتايب سكريبت في بيئة سحابية معزولة. شغّل أوامر الصدفة، إدارة الملفات، البحث باستخدام تعبيرات regex، وتصدير النتائج بأمان.",
"tools.builtins.lobe-cloud-sandbox.readme": "نفّذ تعليمات برمجية بلغة Python وJavaScript وTypeScript في بيئة سحابية معزولة. شغّل أوامر الصدفة، وأدر الملفات، وابحث في المحتوى باستخدام regex، وصدّر النتائج بأمان.",
"tools.builtins.lobe-cloud-sandbox.title": "بيئة سحابية تجريبية",
+7 -3
View File
@@ -224,15 +224,18 @@
"providerModels.item.modelConfig.extendParams.options.gpt5_2ProReasoningEffort.hint": "За серията GPT-5.2 Pro; контролира интензивността на разсъждението.",
"providerModels.item.modelConfig.extendParams.options.gpt5_2ReasoningEffort.hint": "За серията GPT-5.2; контролира интензивността на разсъждението.",
"providerModels.item.modelConfig.extendParams.options.imageAspectRatio.hint": "За моделите за генериране на изображения Gemini; контролира съотношението на страните на генерираните изображения.",
"providerModels.item.modelConfig.extendParams.options.imageAspectRatio2.hint": "За Nano Banana 2; контролира съотношението на страните на генерираните изображения (поддържа изключително широки 1:4, 4:1, 1:8, 8:1).",
"providerModels.item.modelConfig.extendParams.options.imageResolution.hint": "За моделите Gemini 3 за генериране на изображения; контролира резолюцията на генерираните изображения.",
"providerModels.item.modelConfig.extendParams.options.imageResolution2.hint": "За модели Gemini 3.1 Flash Image; контролира резолюцията на генерираните изображения (поддържа 512px).",
"providerModels.item.modelConfig.extendParams.options.reasoningBudgetToken.hint": "За Claude, Qwen3 и подобни; контролира бюджета от токени за разсъждение.",
"providerModels.item.modelConfig.extendParams.options.reasoningEffort.hint": "За OpenAI и други модели с логическо мислене; контролира усилието за разсъждение.",
"providerModels.item.modelConfig.extendParams.options.textVerbosity.hint": "За серията GPT-5+; контролира обемността на изходния текст.",
"providerModels.item.modelConfig.extendParams.options.thinking.hint": "За някои модели Doubao; позволява на модела да реши дали да мисли задълбочено.",
"providerModels.item.modelConfig.extendParams.options.thinkingBudget.hint": "За серията Gemini; контролира бюджета за мислене.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel.hint": "За моделите Gemini 3 Flash Preview; контролира дълбочината на мислене.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel2.hint": "За моделите Gemini 3 Pro Preview; контролира дълбочината на мислене.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel3.hint": "За моделите Gemini 3.1 Pro Preview; контролира дълбочината на мислене с ниско/средно/високо ниво.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel.hint": "За модели Gemini 3 Flash Preview; контролира дълбочината на мислене.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel2.hint": "За модели Gemini 3 Pro Preview; контролира дълбочината на мислене.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel3.hint": "За модели Gemini 3.1 Pro Preview; контролира дълбочината на мислене с ниско/средно/високо ниво.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel4.hint": "За модели Gemini 3.1 Flash Image; включване/изключване на мисленето.",
"providerModels.item.modelConfig.extendParams.options.urlContext.hint": "За серията Gemini; поддържа предоставяне на контекст чрез URL.",
"providerModels.item.modelConfig.extendParams.placeholder": "Изберете разширени параметри за активиране",
"providerModels.item.modelConfig.extendParams.previewFallback": "Прегледът не е наличен",
@@ -311,6 +314,7 @@
"providerModels.tabs.image": "Изображение",
"providerModels.tabs.stt": "ASR",
"providerModels.tabs.tts": "TTS",
"providerModels.tabs.video": "Видео",
"sortModal.success": "Сортирането е успешно обновено",
"sortModal.title": "Персонализиран ред",
"sortModal.update": "Обнови",
+35 -31
View File
@@ -55,7 +55,8 @@
"FLUX.1-dev.description": "FLUX.1-dev е мултимодален езиков модел с отворен код (MLLM) от Black Forest Labs, оптимизиран за задачи с изображения и текст, комбиниращ разбиране и генериране на изображения/текст. Изграден върху напреднали LLM модели (като Mistral-7B), използва внимателно проектиран визуален енкодер и многоетапна настройка с инструкции за постигане на мултимодална координация и логическо мислене при сложни задачи.",
"Gryphe/MythoMax-L2-13b.description": "MythoMax-L2 (13B) е иновативен модел за разнообразни области и сложни задачи.",
"HelloMeme.description": "HelloMeme е AI инструмент, който генерира мемета, GIF-ове или кратки видеа от предоставени изображения или движения. Не изисква умения за рисуване или програмиране — само референтно изображение — за създаване на забавно, атрактивно и стилово консистентно съдържание.",
"HiDream-I1-Full.description": "HiDream-E1-Full е мултимодален модел за редактиране на изображения с отворен код от HiDream.ai, базиран на напреднала архитектура Diffusion Transformer и силно езиково разбиране (вграден LLaMA 3.1-8B-Instruct). Поддържа генериране на изображения чрез естествен език, трансфер на стил, локални редакции и прерисуване, с отлично разбиране и изпълнение на връзката между изображение и текст.",
"HiDream-E1-Full.description": "HiDream-E1-Full е модел за отворен код за мултимодално редактиране на изображения от HiDream.ai, базиран на усъвършенствана архитектура Diffusion Transformer и силно езиково разбиране (вграден LLaMA 3.1-8B-Instruct). Той поддържа генериране на изображения, трансфер на стилове, локални редакции и прерисуване, управлявани от естествен език, с отлично разбиране и изпълнение на текст и изображения.",
"HiDream-I1-Full.description": "HiDream-I1 е нов модел за генериране на изображения с отворен код, пуснат от HiDream. С 17 милиарда параметри (Flux има 12 милиарда), той може да предостави водещо в индустрията качество на изображенията за секунди.",
"HunyuanDiT-v1.2-Diffusers-Distilled.description": "hunyuandit-v1.2-distilled е олекотен модел за преобразуване на текст в изображение, оптимизиран чрез дистилация за бързо генериране на висококачествени изображения, особено подходящ за среди с ограничени ресурси и реално време.",
"InstantCharacter.description": "InstantCharacter е модел за персонализирано генериране на персонажи без нужда от настройка, пуснат от Tencent AI през 2025 г., насочен към висок реализъм и консистентност на персонажа в различни сценарии. Може да моделира персонаж от едно референтно изображение и гъвкаво да го прехвърля между стилове, действия и фонове.",
"InternVL2-8B.description": "InternVL2-8B е мощен модел за визия и език, поддържащ мултимодална обработка на изображения и текст, с точно разпознаване на съдържание и генериране на съответни описания или отговори.",
@@ -80,7 +81,7 @@
"MiniMax-M2.1.description": "MiniMax-M2.1 е водеща отворена голяма езикова система от MiniMax, фокусирана върху решаването на сложни реални задачи. Основните ѝ предимства са възможностите за програмиране на множество езици и способността да действа като агент за решаване на сложни задачи.",
"MiniMax-M2.5-Lightning.description": "M2.5 Lightning: Същата производителност, по-бърз и по-агилен (приблизително 100 tps).",
"MiniMax-M2.5-highspeed.description": "Същата производителност като M2.5 с значително по-бързо извеждане.",
"MiniMax-M2.5.description": "Висококласна производителност и максимална икономичност, лесно справяне със сложни задачи (приблизително 60 tps).",
"MiniMax-M2.5.description": "MiniMax-M2.5 е водещ модел с отворен код от MiniMax, фокусиран върху решаването на сложни реални задачи. Основните му предимства са мултиезиковите програмни възможности и способността да решава сложни задачи като агент.",
"MiniMax-M2.description": "Създаден специално за ефективно програмиране и работни потоци с агенти",
"MiniMax-Text-01.description": "MiniMax-01 въвежда мащабно линейно внимание отвъд класическите трансформери, с 456B параметри и 45.9B активирани на преминаване. Постига водеща производителност и поддържа до 4M токена контекст (32× GPT-4o, 20× Claude-3.5-Sonnet).",
"MiniMaxAI/MiniMax-M1-80k.description": "MiniMax-M1 е отворен модел с голям мащаб и хибридно внимание, с общо 456B параметри и ~45.9B активни на токен. Поддържа нативно 1M контекст и използва Flash Attention за 75% по-малко FLOPs при генериране на 100K токена спрямо DeepSeek R1. С MoE архитектура, CISPO и хибридно обучение с внимание и RL, постига водеща производителност при дълги входове и реални задачи по софтуерно инженерство.",
@@ -98,6 +99,7 @@
"Phi-3.5-mini-instruct.description": "Актуализирана версия на модела Phi-3-mini.",
"Phi-3.5-vision-instrust.description": "Актуализирана версия на модела Phi-3-vision.",
"Pro/MiniMaxAI/MiniMax-M2.1.description": "MiniMax-M2.1 е отворен модел с голям езиков капацитет, оптимизиран за агентни способности, с изключителни резултати в програмиране, използване на инструменти, следване на инструкции и дългосрочно планиране. Моделът поддържа многоезична разработка на софтуер и изпълнение на сложни многoетапни работни потоци, постигайки резултат от 74.0 в SWE-bench Verified и надминава Claude Sonnet 4.5 в многоезични сценарии.",
"Pro/MiniMaxAI/MiniMax-M2.5.description": "MiniMax-M2.5 е най-новият голям езиков модел, разработен от MiniMax, обучен чрез мащабно подсилващо обучение в стотици хиляди сложни реални среди. С архитектура MoE и 229 милиарда параметри, той постига водещи в индустрията резултати в задачи като програмиране, извикване на инструменти от агенти, търсене и офис сценарии.",
"Pro/Qwen/Qwen2-7B-Instruct.description": "Qwen2-7B-Instruct е 7B модел с инструкции от серията Qwen2. Използва трансформерна архитектура със SwiGLU, QKV bias и групирано внимание, и обработва големи входове. Постига отлични резултати в езиково разбиране, генериране, многоезични задачи, програмиране, математика и разсъждение, надминавайки повечето отворени модели и конкурирайки се със затворени.",
"Pro/Qwen/Qwen2.5-7B-Instruct.description": "Qwen2.5-7B-Instruct е част от най-новата серия LLM на Alibaba Cloud. Моделът с 7B параметри носи значителни подобрения в програмирането и математиката, поддържа над 29 езика и подобрява следването на инструкции, разбирането на структурирани данни и генерирането на структурирани изходи (особено JSON).",
"Pro/Qwen/Qwen2.5-Coder-7B-Instruct.description": "Qwen2.5-Coder-7B-Instruct е най-новият LLM на Alibaba Cloud, фокусиран върху програмиране. Изграден върху Qwen2.5 и обучен с 5.5T токена, значително подобрява генерирането на код, разсъждението и поправката, като същевременно запазва силни математически и общи способности, осигурявайки стабилна основа за кодови агенти.",
@@ -107,13 +109,13 @@
"Pro/deepseek-ai/DeepSeek-R1-Distill-Qwen-7B.description": "DeepSeek-R1-Distill-Qwen-7B е дестилиран от Qwen2.5-Math-7B и фино настроен с 800K подбрани проби от DeepSeek-R1. Постига отлични резултати: 92.8% на MATH-500, 55.5% на AIME 2024 и рейтинг 1189 в CodeForces за 7B модел.",
"Pro/deepseek-ai/DeepSeek-R1.description": "DeepSeek-R1 е модел за разсъждение, базиран на обучение чрез подсилване (RL), който намалява повторенията и подобрява четимостта. Използва cold-start данни преди RL, за да засили разсъждението, съпоставя се с OpenAI-o1 при задачи по математика, код и логика и подобрява общите резултати чрез внимателно обучение.",
"Pro/deepseek-ai/DeepSeek-V3.1-Terminus.description": "DeepSeek-V3.1-Terminus е обновен модел от серията V3.1, позициониран като хибриден агентен LLM. Отстранява докладвани от потребители проблеми и подобрява стабилността, езиковата последователност и намалява смесването на китайски/английски и аномални символи. Интегрира режими с и без разсъждение с шаблони за чат за гъвкаво превключване. Подобрява и производителността на Code Agent и Search Agent за по-надеждно използване на инструменти и многoетапни задачи.",
"Pro/deepseek-ai/DeepSeek-V3.2-Exp.description": "DeepSeek-V3.2-Exp е експериментална версия от серията V3.2, която служи като мост към следващата архитектура. Добавя DeepSeek Sparse Attention (DSA) върху V3.1-Terminus за по-ефективно обучение и инференция при дълъг контекст, с оптимизации за използване на инструменти, разбиране на дълги документи и многoетапно разсъждение. Идеален за изследване на по-висока ефективност при разсъждение с голям контекстов бюджет.",
"Pro/deepseek-ai/DeepSeek-V3.2.description": "DeepSeek-V3.2 е модел, който съчетава висока изчислителна ефективност с отлично разсъждение и производителност като агент. Подходът му се основава на три ключови технологични пробива: DeepSeek Sparse Attention (DSA), ефективен механизъм за внимание, който значително намалява изчислителната сложност, като същевременно поддържа производителността на модела и е специално оптимизиран за сценарии с дълъг контекст; мащабируема рамка за подсилващо обучение, чрез която производителността на модела може да съперничи на GPT-5, а версията с висока изчислителна мощност съответства на Gemini-3.0-Pro по способности за разсъждение; и мащабна тръбопроводна система за синтез на задачи за агенти, насочена към интегриране на способности за разсъждение в сценарии за използване на инструменти, като по този начин подобрява следването на инструкции и обобщаването в сложни интерактивни среди. Моделът постигна златен медал на Международната математическа олимпиада (IMO) и Международната олимпиада по информатика (IOI) през 2025 г.",
"Pro/deepseek-ai/DeepSeek-V3.description": "DeepSeek-V3 е MoE модел с 671 милиарда параметъра, използващ MLA и DeepSeekMoE с балансирано натоварване без загуби за ефективно обучение и инференция. Предварително обучен върху 14.8T висококачествени токени и допълнително настроен с SFT и RL, той надминава други отворени модели и се доближава до водещите затворени решения.",
"Pro/moonshotai/Kimi-K2-Instruct-0905.description": "Kimi K2-Instruct-0905 е най-новият и най-мощен модел от серията Kimi K2. Това е MoE модел от най-висок клас с 1T общо и 32B активни параметъра. Основните му предимства включват по-силна агентна интелигентност при програмиране с значителни подобрения в бенчмаркове и реални задачи, както и подобрена естетика и използваемост на фронтенд кода.",
"Pro/moonshotai/Kimi-K2-Thinking.description": "Kimi K2 Thinking Turbo е ускорен вариант, оптимизиран за скорост на разсъждение и пропускателна способност, като запазва многoетапното разсъждение и използване на инструменти от K2 Thinking. Това е MoE модел с ~1T общи параметри, роден 256K контекст и стабилно мащабируемо извикване на инструменти за производствени сценарии с по-строги изисквания за латентност и едновременност.",
"Pro/moonshotai/Kimi-K2.5.description": "Kimi K2.5 е отворен мултимодален агентен модел, базиран на Kimi-K2-Base, обучен върху приблизително 1.5 трилиона смесени визуални и текстови токени. Моделът използва MoE архитектура с общо 1T параметри и 32B активни параметри, поддържа контекстен прозорец от 256K и безпроблемно интегрира визуално и езиково разбиране.",
"Pro/zai-org/glm-4.7.description": "GLM-4.7 е най-новият флагмански модел на Zhipu с общо 355 милиарда параметъра и 32 милиарда активни параметъра. Той е напълно обновен в областите на общ диалог, логическо мислене и агентни способности. GLM-4.7 подобрява Междинното мислене и въвежда Запазено мислене и Мислене на ниво обръщение.",
"Pro/zai-org/glm-5.description": "GLM-5 е новото поколение голям езиков модел, представен от Zhipu, фокусиран върху сложни системни инженерни задачи и дългосрочни агентски задачи. Моделът разширява параметрите до 744B (40B активни) и интегрира DeepSeek Sparse Attention.",
"Pro/zai-org/glm-5.description": "GLM-5 е следващото поколение голям езиков модел на Zhipu, фокусиран върху сложното системно инженерство и задачи на агенти с дълга продължителност. Параметрите на модела са разширени до 744 милиарда (40 милиарда активни) и интегрират DeepSeek Sparse Attention.",
"QwQ-32B-Preview.description": "Qwen QwQ е експериментален изследователски модел, фокусиран върху подобряване на разсъждението.",
"Qwen/QVQ-72B-Preview.description": "QVQ-72B-Preview е изследователски модел от Qwen, насочен към визуално разсъждение, със силни страни в разбирането на сложни сцени и визуални математически задачи.",
"Qwen/QwQ-32B-Preview.description": "Qwen QwQ е експериментален изследователски модел, фокусиран върху подобрено AI разсъждение.",
@@ -137,7 +139,7 @@
"Qwen/Qwen3-14B.description": "Qwen3 е следващо поколение модел Tongyi Qwen с основни подобрения в логическото мислене, общите способности, агентните възможности и многоезичната производителност, като поддържа превключване между режими на мислене.",
"Qwen/Qwen3-235B-A22B-Instruct-2507.description": "Qwen3-235B-A22B-Instruct-2507 е водещ MoE модел от серията Qwen3 с общо 235B и 22B активни параметри. Това е актуализирана версия без мислене, фокусирана върху подобряване на следването на инструкции, логическото мислене, разбирането на текст, математика, наука, програмиране и използване на инструменти. Разширява също така многоезичните знания и се съобразява по-добре с предпочитанията на потребителите при субективни отворени задачи.",
"Qwen/Qwen3-235B-A22B-Thinking-2507.description": "Qwen3-235B-A22B-Thinking-2507 е модел от серията Qwen3, фокусиран върху сложни логически задачи. Използва MoE архитектура с общо 235B и ~22B активни параметри на токен за повишена ефективност. Като специализиран мислещ модел, показва значителни подобрения в логика, математика, наука, програмиране и академични оценки, достигайки водещи резултати сред отворените мислещи модели. Подобрява също следването на инструкции, използването на инструменти и генерирането на текст, като нативно поддържа 256K контекст за дълбоко разсъждение и дълги документи.",
"Qwen/Qwen3-235B-A22B.description": "Qwen3 е следващо поколение модел Tongyi Qwen с основни подобрения в логическото мислене, общите способности, агентните възможности и многоезичната производителност, като поддържа превключване между режими на мислене.",
"Qwen/Qwen3-235B-A22B.description": "Qwen3 235B A22B е ултра-мащабен модел на Qwen3, предоставящ най-високо ниво на AI възможности.",
"Qwen/Qwen3-30B-A3B-Instruct-2507.description": "Qwen3-30B-A3B-Instruct-2507 е актуализираната немислеща версия на Qwen3-30B-A3B. Това е MoE модел с общо 30.5B и 3.3B активни параметри. Значително подобрява следването на инструкции, логическото мислене, разбирането на текст, математика, наука, програмиране и използване на инструменти, разширява многоезичните знания и се съобразява по-добре с предпочитанията на потребителите при субективни отворени задачи. Поддържа 256K контекст. Този модел е само немислещ и няма да генерира тагове `<think></think>`.",
"Qwen/Qwen3-30B-A3B-Thinking-2507.description": "Qwen3-30B-A3B-Thinking-2507 е най-новият мислещ модел от серията Qwen3. Това е MoE модел с общо 30.5B и 3.3B активни параметри, фокусиран върху сложни задачи. Показва значителни подобрения в логика, математика, наука, програмиране и академични оценки, и подобрява следването на инструкции, използването на инструменти, генерирането на текст и съобразяването с предпочитания. Нативно поддържа 256K контекст и може да се разшири до 1M токена. Тази версия е проектирана за мислещ режим с детайлно стъпково разсъждение и силни агентни възможности.",
"Qwen/Qwen3-30B-A3B.description": "Qwen3 е следващо поколение модел Tongyi Qwen с основни подобрения в логическото мислене, общите способности, агентните възможности и многоезичната производителност, като поддържа превключване между режими на мислене.",
@@ -315,7 +317,6 @@
"codeqwen.description": "CodeQwen1.5 е голям езиков модел, обучен върху обширни данни от код, създаден за сложни програмни задачи.",
"codestral-latest.description": "Codestral е нашият най-усъвършенстван модел за програмиране; версия 2 (януари 2025) е насочена към задачи с ниска латентност и висока честота като FIM, корекция на код и генериране на тестове.",
"codestral.description": "Codestral е първият модел за програмиране на Mistral AI, осигуряващ силна поддръжка за генериране на код.",
"codex-mini-latest.description": "codex-mini-latest е фино настроен o4-mini модел за Codex CLI. За директна употреба чрез API се препоръчва gpt-4.1.",
"cogito-2.1:671b.description": "Cogito v2.1 671B е отворен модел от САЩ, свободен за търговска употреба, с производителност, съпоставима с водещите модели, по-висока ефективност при разсъждение с токени, 128k контекст и силни общи способности.",
"cogview-3-flash.description": "CogView-3-Flash е безплатен модел за генериране на изображения, създаден от Zhipu. Той генерира изображения, които съответстват на инструкциите на потребителя, като същевременно постига по-високи оценки за естетическо качество. CogView-3-Flash се използва основно в области като художествено творчество, дизайнерски референции, разработка на игри и виртуална реалност, помагайки на потребителите бързо да преобразуват текстови описания в изображения.",
"cogview-4.description": "CogView-4 е първият отворен модел на Zhipu за преобразуване на текст в изображение, който може да генерира китайски знаци. Подобрява семантичното разбиране, качеството на изображенията и рендирането на китайски/английски текст, поддържа двуезични подкани с произволна дължина и може да генерира изображения с всякаква резолюция в зададени граници.",
@@ -342,7 +343,7 @@
"command-light-nightly.description": "За да съкратим времето между основните версии, предлагаме нощни билдове на Command. За серията command-light това е command-light-nightly. Това е най-новата, най-експериментална (и потенциално нестабилна) версия, която се обновява редовно без предизвестие, затова не се препоръчва за продукционна употреба.",
"command-light.description": "По-малък и по-бърз вариант на Command, който е почти толкова способен, но с по-висока скорост.",
"command-nightly.description": "За да съкратим времето между основните версии, предлагаме нощни билдове на Command. За серията Command това е command-nightly. Това е най-новата, най-експериментална (и потенциално нестабилна) версия, която се обновява редовно без предизвестие, затова не се препоръчва за продукционна употреба.",
"command-r-03-2024.description": "Command R е чат модел, следващ инструкции, с по-високо качество, по-голяма надеждност и по-дълъг контекстен прозорец от предишните модели. Поддържа сложни работни потоци като генериране на код, RAG, използване на инструменти и агенти.",
"command-r-03-2024.description": "command-r е модел за следване на инструкции в чат, който изпълнява езикови задачи с по-високо качество, подобрена надеждност и по-дълъг контекст в сравнение с предишните модели. Той поддържа сложни работни потоци като генериране на код, RAG, използване на инструменти и агенти.",
"command-r-08-2024.description": "command-r-08-2024 е обновен модел Command R, пуснат през август 2024 г.",
"command-r-plus-04-2024.description": "command-r-plus е псевдоним на command-r-plus-04-2024, така че използването на command-r-plus в API-то сочи към този модел.",
"command-r-plus-08-2024.description": "Command R+ е чат модел, следващ инструкции, с по-високо качество, по-голяма надеждност и по-дълъг контекстен прозорец от предишните модели. Най-подходящ е за сложни RAG работни потоци и многоетапно използване на инструменти.",
@@ -366,7 +367,8 @@
"deepseek-ai/DeepSeek-V2.5.description": "DeepSeek-V2.5 надгражда DeepSeek-V2-Chat и DeepSeek-Coder-V2-Instruct, комбинирайки общи и кодови способности. Подобрява писането и следването на инструкции за по-добро съответствие с предпочитанията и показва значителни подобрения в AlpacaEval 2.0, ArenaHard, AlignBench и MT-Bench.",
"deepseek-ai/DeepSeek-V3.1-Terminus.description": "DeepSeek-V3.1-Terminus е обновен модел V3.1, позициониран като хибриден агентен LLM. Отстранява докладвани от потребители проблеми и подобрява стабилността, езиковата последователност и намалява смесените китайски/английски и аномални символи. Интегрира режими на мислене и немислене с шаблони за чат за гъвкаво превключване. Подобрява и производителността на Code Agent и Search Agent за по-надеждно използване на инструменти и многоетапни задачи.",
"deepseek-ai/DeepSeek-V3.1.description": "DeepSeek V3.1 използва хибридна архитектура за разсъждение и поддържа както мислещ, така и немислещ режим.",
"deepseek-ai/DeepSeek-V3.2-Exp.description": "DeepSeek-V3.2-Exp е експериментална версия V3.2, която служи като мост към следващата архитектура. Добавя DeepSeek Sparse Attention (DSA) върху V3.1-Terminus за подобряване на ефективността при обучение и извеждане с дълъг контекст, с оптимизации за използване на инструменти, разбиране на дълги документи и многoетапно разсъждение. Идеален е за изследване на по-висока ефективност при разсъждение с големи контекстуални бюджети.",
"deepseek-ai/DeepSeek-V3.2-Exp.description": "DeepSeek V3.2 Exp използва хибридна архитектура за разсъждение и поддържа както мисловни, така и немисловни режими.",
"deepseek-ai/DeepSeek-V3.2.description": "DeepSeek-V3.2 е модел, който съчетава висока изчислителна ефективност с отлично разсъждение и производителност като агент. Подходът му се основава на три основни технологични пробива: DeepSeek Sparse Attention (DSA), ефективен механизъм за внимание, който значително намалява изчислителната сложност, като същевременно поддържа производителността на модела и е специално оптимизиран за сценарии с дълъг контекст; мащабируема рамка за подсилващо обучение, чрез която производителността на модела може да съперничи на GPT-5, а версията с висока изчислителна мощност може да съперничи на Gemini-3.0-Pro по способности за разсъждение; и мащабна тръбопроводна система за синтез на задачи за агенти, предназначена да интегрира способности за разсъждение в сценарии за използване на инструменти, като по този начин подобрява следването на инструкции и обобщаването в сложни интерактивни среди. Моделът постигна златни медали на Международната математическа олимпиада (IMO) и Международната олимпиада по информатика (IOI) през 2025 г.",
"deepseek-ai/DeepSeek-V3.description": "DeepSeek-V3 е MoE модел с 671 милиарда параметъра, използващ MLA и DeepSeekMoE с балансирано натоварване без загуби за ефективно обучение и извеждане. Предварително обучен върху 14.8 трилиона висококачествени токени със SFT и RL, той превъзхожда други отворени модели и се доближава до водещите затворени модели.",
"deepseek-ai/deepseek-llm-67b-chat.description": "DeepSeek LLM Chat (67B) е иновативен модел, предлагащ дълбоко езиково разбиране и интеракция.",
"deepseek-ai/deepseek-v3.1-terminus.description": "DeepSeek V3.1 е модел за разсъждение от ново поколение с по-силни способности за сложни разсъждения и верига от мисли за задълбочени аналитични задачи.",
@@ -433,6 +435,7 @@
"deepseek_r1_distill_llama_70b.description": "DeepSeek-R1-Distill-Llama-70B е дестилиран от Llama-3.3-70B-Instruct. Като част от серията DeepSeek-R1, е фино настроен с примери, генерирани от DeepSeek-R1, и се представя силно в математика, програмиране и разсъждение.",
"deepseek_r1_distill_qwen_14b.description": "DeepSeek-R1-Distill-Qwen-14B е дестилиран от Qwen2.5-14B и фино настроен с 800K подбрани примера, генерирани от DeepSeek-R1, осигуряващ силно разсъждение.",
"deepseek_r1_distill_qwen_32b.description": "DeepSeek-R1-Distill-Qwen-32B е дестилиран от Qwen2.5-32B и фино настроен с 800K подбрани примера, генерирани от DeepSeek-R1, отличаващ се в математика, програмиране и разсъждение.",
"devstral-2512.description": "Devstral 2 е текстов модел на корпоративно ниво, който превъзхожда в използването на инструменти за изследване на кодови бази, редактиране на множество файлове и захранване на агенти за софтуерно инженерство.",
"devstral-2:123b.description": "Devstral 2 123B се отличава с използването на инструменти за изследване на кодови бази, редактиране на множество файлове и поддръжка на агенти за софтуерно инженерство.",
"doubao-1.5-lite-32k.description": "Doubao-1.5-lite е нов лек модел с изключително бърз отговор, предоставящ първокласно качество и ниска латентност.",
"doubao-1.5-pro-256k.description": "Doubao-1.5-pro-256k е цялостен ъпгрейд на Doubao-1.5-Pro, подобряващ общата производителност с 10%. Поддържа контекстен прозорец от 256k и до 12k изходни токена, осигурявайки по-висока производителност, по-голям прозорец и отлична стойност за по-широки приложения.",
@@ -546,10 +549,10 @@
"gemini-2.5-pro-preview-06-05.description": "Gemini 2.5 Pro Preview е най-усъвършенстваният модел за разсъждение на Google, способен да разсъждава върху код, математика и STEM проблеми и да анализира големи набори от данни, кодови бази и документи с дълъг контекст.",
"gemini-2.5-pro.description": "Gemini 2.5 Pro е най-усъвършенстваният модел за разсъждение на Google, способен да разсъждава върху код, математика и STEM проблеми и да анализира големи набори от данни, кодови бази и документи с дълъг контекст.",
"gemini-3-flash-preview.description": "Gemini 3 Flash е най-интелигентният модел, създаден за скорост, съчетаващ авангардна интелигентност с отлично търсене и обоснованост.",
"gemini-3-pro-image-preview.description": "Gemini 3 Pro ImageNano Banana Proе модел на Google за генериране на изображения, който също така поддържа мултимодален диалог.",
"gemini-3-pro-image-preview.description": "Gemini 3 Pro Image (Nano Banana Pro) е модел за генериране на изображения на Google, който също поддържа мултимодален диалог.",
"gemini-3-pro-image-preview:image.description": "Gemini 3 Pro Image (Nano Banana Pro) е моделът на Google за генериране на изображения и поддържа мултимодален чат.",
"gemini-3-pro-preview.description": "Gemini 3 Pro е най-мощният агентен и „vibe-coding“ модел на Google, който предлага по-богати визуализации и по-дълбоко взаимодействие, базирано на съвременно логическо мислене.",
"gemini-3.1-flash-image-preview.description": "Gemini 3.1 Flash Image (Nano Banana 2) предоставя професионално качество на изображенията с Flash скорост и поддръжка на мултимодални разговори.",
"gemini-3.1-flash-image-preview.description": "Gemini 3.1 Flash Image (Nano Banana 2) е най-бързият модел на Google за генериране на изображения с поддръжка на мислене, разговорно генериране и редактиране на изображения.",
"gemini-3.1-flash-image-preview:image.description": "Gemini 3.1 Flash Image (Nano Banana 2) предоставя професионално качество на изображенията с Flash скорост и поддръжка на мултимодални разговори.",
"gemini-3.1-pro-preview.description": "Gemini 3.1 Pro Preview подобрява Gemini 3 Pro с усъвършенствани способности за разсъждение и добавя поддръжка за средно ниво на мислене.",
"gemini-flash-latest.description": "Най-новата версия на Gemini Flash",
@@ -605,19 +608,15 @@
"google/gemini-2.0-flash-lite-001.description": "Gemini 2.0 Flash Lite е олекотен вариант на Gemini с изключено мислене по подразбиране за подобрена латентност и разходи, но може да бъде активирано чрез параметри.",
"google/gemini-2.0-flash-lite.description": "Gemini 2.0 Flash Lite предлага функции от ново поколение, включително изключителна скорост, вградена употреба на инструменти, мултимодално генериране и контекстен прозорец от 1 милион токена.",
"google/gemini-2.0-flash.description": "Gemini 2.0 Flash е високопроизводителен модел на Google за разширени мултимодални задачи с разсъждение.",
"google/gemini-2.5-flash-image-free.description": "Безплатен слой на Gemini 2.5 Flash Image с ограничен капацитет за мултимодално генериране.",
"google/gemini-2.5-flash-image-preview.description": "Експериментален модел Gemini 2.5 Flash с поддръжка за генериране на изображения.",
"google/gemini-2.5-flash-image.description": "Gemini 2.5 Flash Image (Nano Banana) е модел на Google за генериране на изображения с поддръжка на мултимодален разговор.",
"google/gemini-2.5-flash-lite.description": "Gemini 2.5 Flash Lite е олекотен вариант на Gemini 2.5, оптимизиран за ниска латентност и разходи, подходящ за сценарии с висок трафик.",
"google/gemini-2.5-flash-preview.description": "Gemini 2.5 Flash е най-усъвършенстваният водещ модел на Google, създаден за напреднало разсъждение, програмиране, математика и научни задачи. Включва вградено „мислене“ за по-точни отговори и по-фино обработване на контекста.\n\nЗабележка: Моделът има два варианта — с мислене и без мислене. Ценообразуването на изхода се различава значително в зависимост от това дали мисленето е активирано. Ако изберете стандартния вариант (без суфикса “:thinking”), моделът изрично ще избягва генериране на мисловни токени.\n\nЗа да използвате мислене и да получавате мисловни токени, трябва да изберете варианта “:thinking”, който има по-висока цена за изхода.\n\nGemini 2.5 Flash може също да бъде конфигуриран чрез параметъра “max reasoning tokens”, както е документирано (https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning).",
"google/gemini-2.5-flash-preview:thinking.description": "Gemini 2.5 Flash е най-усъвършенстваният водещ модел на Google, създаден за напреднало разсъждение, програмиране, математика и научни задачи. Включва вградено „мислене“ за по-точни отговори и по-фино обработване на контекста.\n\nЗабележка: Моделът има два варианта — с мислене и без мислене. Ценообразуването на изхода се различава значително в зависимост от това дали мисленето е активирано. Ако изберете стандартния вариант (без суфикса “:thinking”), моделът изрично ще избягва генериране на мисловни токени.\n\nЗа да използвате мислене и да получавате мисловни токени, трябва да изберете варианта “:thinking”, който има по-висока цена за изхода.\n\nGemini 2.5 Flash може също да бъде конфигуриран чрез параметъра “max reasoning tokens”, както е документирано (https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning).",
"google/gemini-2.5-flash.description": "Gemini 2.5 Flash (Lite/Pro/Flash) е фамилия от модели на Google, обхващаща от ниска латентност до високопроизводително разсъждение.",
"google/gemini-2.5-pro-free.description": "Безплатен слой на Gemini 2.5 Pro с ограничен капацитет за мултимодален дълъг контекст, подходящ за тестове и леки работни потоци.",
"google/gemini-2.5-flash.description": "Gemini 2.5 Flash е семейство на Google, обхващащо ниска латентност до високопроизводително разсъждение.",
"google/gemini-2.5-pro-preview.description": "Gemini 2.5 Pro Preview е най-усъвършенстваният мисловен модел на Google за разсъждение върху сложни проблеми в програмирането, математиката и STEM, както и за анализ на големи набори от данни, кодови бази и документи с дълъг контекст.",
"google/gemini-2.5-pro.description": "Gemini 2.5 Pro е водещият модел на Google за разсъждение с поддръжка на дълъг контекст за сложни задачи.",
"google/gemini-3-pro-image-preview-free.description": "Безплатен слой на Gemini 3 Pro Image с ограничен капацитет за мултимодално генериране.",
"google/gemini-3-pro-image-preview.description": "Gemini 3 Pro Image (Nano Banana Pro) е модел на Google за генериране на изображения с поддръжка на мултимодален разговор.",
"google/gemini-3-pro-preview-free.description": "Gemini 3 Pro Preview Free предлага същото мултимодално разбиране и разсъждение като стандартната версия, но с квотни и честотни ограничения, което го прави подходящ за тестове и нискочестотна употреба.",
"google/gemini-3-pro-preview.description": "Gemini 3 Pro е модел от ново поколение за мултимодално разсъждение от фамилията Gemini, който разбира текст, аудио, изображения и видео и се справя със сложни задачи и големи кодови бази.",
"google/gemini-embedding-001.description": "Модел за вграждане от най-ново поколение с висока производителност при задачи на английски, многоезични и кодови задачи.",
"google/gemini-flash-1.5.description": "Gemini 1.5 Flash осигурява оптимизирана мултимодална обработка за широк спектър от сложни задачи.",
@@ -717,15 +716,24 @@
"hunyuan-a13b.description": "Първият хибриден логически модел на Hunyuan, надграден от hunyuan-standard-256K (общо 80B, 13B активни). По подразбиране използва бавно мислене и поддържа превключване между бързо/бавно чрез параметри или префикс /no_think. Общите възможности са подобрени спрямо предишното поколение, особено в математика, наука, разбиране на дълги текстове и агентски задачи.",
"hunyuan-code.description": "Най-новият кодов модел на Hunyuan, обучен върху 200B висококачествени кодови данни плюс шест месеца SFT данни, с 8K контекст. Той се нарежда близо до върха в автоматизирани кодови бенчмаркове и в експертни човешки оценки в пет езика.",
"hunyuan-functioncall.description": "Най-новият MoE FunctionCall модел на Hunyuan, обучен върху висококачествени данни за използване на инструменти, с прозорец за контекст от 32K и водещи бенчмаркове в различни измерения.",
"hunyuan-large-longcontext.description": "Превъзхожда в задачи с дълги документи като обобщение и QA, като същевременно се справя с общо генериране. Силен в анализ и генериране на дълги текстове за сложни, детайлни съдържания.",
"hunyuan-large.description": "Hunyuan-large има ~389 милиарда общи параметри и ~52 милиарда активирани, най-големият и най-силен отворен MoE модел в архитектура Transformer.",
"hunyuan-lite.description": "Надграден до MoE архитектура с прозорец на контекста от 256K, водещ много отворени модели в NLP, програмиране, математика и индустриални бенчмаркове.",
"hunyuan-pro.description": "MoE модел с трилион параметри и 32K контекст, водещ в бенчмаркове, силен при сложни инструкции и логика, напреднала математика, извикване на функции и оптимизиран за многоезичен превод, финанси, право и медицина.",
"hunyuan-role.description": "Най-новият модел за ролеви игри на Hunyuan, официално фино настроен с данни за ролеви игри, предоставящ по-силна основна производителност в сценарии за ролеви игри.",
"hunyuan-standard-256K.description": "Използва подобрено маршрутизиране за смекчаване на балансирането на натоварването и колапса на експертите. Дългият текст \"игла в купа сено\" достига 99.9%. MOE-256K разширява дължината и качеството, значително увеличавайки дължината на входа.",
"hunyuan-standard.description": "Използва подобрено маршрутизиране за смекчаване на балансирането на натоварването и колапса на експертите. Дългият текст \"игла в купа сено\" достига 99.9%. MOE-32K предлага по-добра стойност, като балансира качество и цена за дълги текстови входове.",
"hunyuan-standard-256K.description": "Използва подобрено маршрутизиране за смекчаване на балансирането на натоварването и колапса на експертите. Постига 99.9% успех в задачи с дълъг контекст. MOE-256K допълнително разширява дължината и качеството на контекста.",
"hunyuan-standard.description": "Използва подобрено маршрутизиране за смекчаване на балансирането на натоварването и колапса на експертите. Постига 99.9% успех в задачи с дълъг контекст. MOE-32K предлага силна стойност, като се справя с дълги входове.",
"hunyuan-t1-20250321.description": "Изгражда балансирани способности в изкуствата и STEM с мощно улавяне на информация от дълги текстове. Поддържа разсъждения за отговори на задачи по математика, логика, наука и кодиране на различни нива на трудност.",
"hunyuan-t1-20250403.description": "Подобрява генерирането на код на проектно ниво и качеството на писане, укрепва разбирането на многократни теми и следването на инструкции ToB, подобрява разбирането на думи и намалява проблемите със смесени опростени/традиционни и китайски/английски изходи.",
"hunyuan-t1-20250529.description": "Подобрява творческото писане и композиция, укрепва фронтенд кодирането, математическите и логическите разсъждения и подобрява следването на инструкции.",
"hunyuan-t1-20250711.description": "Значително подобрява трудните задачи по математика, логика и кодиране, увеличава стабилността на изхода и подобрява способностите за дълги текстове.",
"hunyuan-t1-latest.description": "Значително подобрява модела с бавно мислене при трудна математика, сложна логика, трудни задачи по програмиране, следване на инструкции и качество на креативното писане.",
"hunyuan-t1-vision-20250916.description": "Най-новият модел t1-vision с дълбоко логическо мислене и големи подобрения във VQA, визуално привързване, OCR, диаграми, решаване на заснети задачи и създаване на съдържание от изображения, както и по-силна поддръжка на английски и езици с ограничени ресурси.",
"hunyuan-turbo-20241223.description": "Тази версия подобрява мащабирането на инструкции за по-добра обобщаемост, значително подобрява математическите/кодови/логически разсъждения, подобрява разбирането на думи и качеството на писане.",
"hunyuan-turbo-latest.description": "Общи подобрения в опита с NLP разбирането, писането, чата, QA, превода и домейните; по-човекоподобни отговори, по-добро изясняване на неясни намерения, подобрено парсване на думи, по-високо творческо качество и интерактивност и по-силни многократни разговори.",
"hunyuan-turbo.description": "Преглед на следващото поколение LLM на Hunyuan с нова MoE архитектура, осигуряваща по-бързо разсъждение и по-силни резултати от hunyuan-pro.",
"hunyuan-turbos-latest.description": "Най-новият флагмански модел Hunyuan TurboS с по-силно разсъждение и по-добро цялостно изживяване.",
"hunyuan-turbos-longtext-128k-20250325.description": "Превъзхожда в задачи с дълги документи като обобщение и QA, като същевременно се справя с общо генериране. Силен в анализ и генериране на дълги текстове за сложни, детайлни съдържания.",
"hunyuan-vision-1.5-instruct.description": "Бърз мисловен модел за изображения-към-текст, базиран на текстовата основа TurboS, показващ значителни подобрения спрямо предишната версия в основно разпознаване на изображения и анализ на разсъждения.",
"hunyuan-vision.description": "Най-новият мултимодален модел на Hunyuan, поддържащ входове за изображения + текст за генериране на текст.",
"image-01-live.description": "Модел за генериране на изображения с фини детайли, поддържащ преобразуване от текст към изображение и контролируеми стилови настройки.",
@@ -770,8 +778,7 @@
"kimi-k2:1t.description": "Kimi K2 е голям MoE LLM от Moonshot AI с 1T общи параметри и 32B активни на всяко преминаване. Оптимизиран е за агентни способности, включително напреднало използване на инструменти, разсъждение и синтез на код.",
"kimi-latest.description": "Kimi Latest използва най-новия модел на Kimi и може да включва експериментални функции. Поддържа разбиране на изображения и автоматично избира модели за таксуване 8k/32k/128k според дължината на контекста.",
"kuaishou/kat-coder-pro-v1.description": "KAT-Coder-Pro-V1 (ограничено безплатен) се фокусира върху разбиране на код и автоматизация за ефективни кодиращи агенти.",
"learnlm-1.5-pro-experimental.description": "LearnLM е експериментален, задачно-ориентиран модел, обучен според принципите на науката за учене, за да следва системни инструкции в образователни сценарии, действайки като експертен преподавател.",
"learnlm-2.0-flash-experimental.description": "LearnLM е експериментален, задачно-ориентиран модел, обучен според принципите на науката за учене, за да следва системни инструкции в образователни сценарии, действайки като експертен преподавател.",
"labs-devstral-small-2512.description": "Devstral Small 2 превъзхожда в използването на инструменти за изследване на кодови бази, редактиране на множество файлове и захранване на агенти за софтуерно инженерство.",
"lite.description": "Spark Lite е лек LLM с ултраниска латентност и ефективна обработка. Напълно безплатен е и поддържа търсене в реално време в уеб. Бързите му отговори се представят добре на устройства с ниска изчислителна мощност и при фина настройка на модели, осигурявайки висока ефективност на разходите и интелигентно изживяване, особено за въпроси и отговори, генериране на съдържание и търсене.",
"llama-3.1-70b-versatile.description": "Llama 3.1 70B предоставя по-силно AI разсъждение за сложни приложения, поддържайки тежки изчисления с висока ефективност и точност.",
"llama-3.1-8b-instant.description": "Llama 3.1 8B е високоефективен модел с бързо генериране на текст, идеален за мащабни, икономични приложения.",
@@ -782,7 +789,6 @@
"llama-3.2-90b-vision-preview.description": "Llama 3.2 е проектиран за задачи, съчетаващи визия и текст, отличаващ се в надписи на изображения и визуални въпроси и отговори, свързващ езиковото генериране и визуалното разсъждение.",
"llama-3.2-vision-instruct.description": "Llama 3.2-Vision, настроен за инструкции, е оптимизиран за визуално разпознаване, визуално разсъждение, надписи и общи въпроси и отговори върху изображения.",
"llama-3.3-70b-versatile.description": "Meta Llama 3.3 е многоезичен LLM с 70B параметри (текст вход/изход), предлагащ предварително обучени и настроени за инструкции варианти. Текстовият модел, настроен за инструкции, е оптимизиран за многоезичен диалог и надминава много отворени и затворени чат модели в общи индустриални бенчмаркове.",
"llama-3.3-70b.description": "Llama 3.3 70B: среден до голям модел от серията Llama, балансиращ между разсъждение и производителност.",
"llama-3.3-instruct.description": "Llama 3.3, настроен за инструкции, е оптимизиран за чат и надминава много отворени чат модели в общи индустриални бенчмаркове.",
"llama3-70b-8192.description": "Meta Llama 3 70B предлага изключителна способност за справяне със сложност за взискателни проекти.",
"llama3-8b-8192.description": "Meta Llama 3 8B осигурява силно разсъждение за разнообразни сценарии.",
@@ -832,7 +838,6 @@
"meta-llama/llama-3.1-8b-instruct:free.description": "LLaMA 3.1 предлага многоезична поддръжка и е сред водещите генеративни модели.",
"meta-llama/llama-3.2-11b-vision-instruct.description": "LLaMA 3.2 е създаден за задачи, съчетаващи визия и текст. Отличава се в описване на изображения и визуални въпроси, свързвайки езиковото генериране с визуалното разсъждение.",
"meta-llama/llama-3.2-3b-instruct.description": "meta-llama/llama-3.2-3b-instruct",
"meta-llama/llama-3.2-90b-vision-instruct.description": "LLaMA 3.2 е създаден за задачи, съчетаващи визия и текст. Отличава се в описване на изображения и визуални въпроси, свързвайки езиковото генериране с визуалното разсъждение.",
"meta-llama/llama-3.3-70b-instruct.description": "Llama 3.3 е най-усъвършенстваният многоезичен отворен модел от серията Llama, предлагащ производителност, близка до 405B, на много ниска цена. Базиран е на Transformer архитектура и подобрен чрез SFT и RLHF за полезност и безопасност. Версията, обучена с инструкции, е оптимизирана за многоезичен чат и превъзхожда много отворени и затворени модели в индустриалните бенчмаркове. Край на знанията: декември 2023.",
"meta-llama/llama-3.3-70b-instruct:free.description": "Llama 3.3 е най-усъвършенстваният многоезичен отворен модел от серията Llama, предлагащ производителност, близка до 405B, на много ниска цена. Базиран е на Transformer архитектура и подобрен чрез SFT и RLHF за полезност и безопасност. Версията, обучена с инструкции, е оптимизирана за многоезичен чат и превъзхожда много отворени и затворени модели в индустриалните бенчмаркове. Край на знанията: декември 2023.",
"meta.llama3-1-405b-instruct-v1:0.description": "Meta Llama 3.1 405B Instruct е най-големият и най-мощен модел от серията Llama 3.1 Instruct – изключително напреднал модел за диалогово разсъждение и генериране на синтетични данни, отлична основа за дообучение в специфични домейни. Многоезичните LLM модели Llama 3.1 са предварително обучени и настроени с инструкции в размери 8B, 70B и 405B (текстов вход/изход). Моделите, обучени с инструкции, са оптимизирани за многоезичен диалог и превъзхождат много отворени чат модели в индустриалните бенчмаркове. Llama 3.1 е предназначен за търговска и изследователска употреба на различни езици. Моделите, обучени с инструкции, са подходящи за чат в стил асистент, докато предварително обучените модели са подходящи за по-широки задачи по генериране на естествен език. Изходите от Llama 3.1 могат да се използват и за подобряване на други модели, включително чрез генериране и прецизиране на синтетични данни. Llama 3.1 е автогенеративен Transformer модел с оптимизирана архитектура. Настроените версии използват SFT и RLHF за съответствие с човешките предпочитания за полезност и безопасност.",
@@ -894,7 +899,7 @@
"mistral-large-instruct.description": "Mistral-Large-Instruct-2407 е усъвършенстван плътен LLM със 123 милиарда параметъра и водещи възможности за разсъждение, знания и програмиране.",
"mistral-large-latest.description": "Mistral Large е флагманският модел, силен в многоезични задачи, сложно разсъждение и генериране на код — идеален за висококачествени приложения.",
"mistral-large.description": "Mixtral Large е флагманският модел на Mistral, комбиниращ генериране на код, математика и разсъждение с 128K контекстен прозорец.",
"mistral-medium-latest.description": "Mistral Medium 3 предлага водеща производителност при 8× по-ниска цена и улеснява внедряването в предприятия.",
"mistral-medium-latest.description": "Mistral Medium 3.1 предоставя водеща производителност на 8× по-ниска цена и опростява корпоративното внедряване.",
"mistral-nemo-instruct.description": "Mistral-Nemo-Instruct-2407 е версия, настроена за инструкции, на Mistral-Nemo-Base-2407.",
"mistral-nemo.description": "Mistral Nemo е високоефективен 12B модел от Mistral AI и NVIDIA.",
"mistral-small-latest.description": "Mistral Small е икономичен, бърз и надежден избор за превод, обобщение и анализ на настроения.",
@@ -933,7 +938,7 @@
"moonshot-v1-auto.description": "Moonshot V1 Auto избира подходящия модел въз основа на текущата употреба на токени в контекста.",
"moonshotai/Kimi-Dev-72B.description": "Kimi-Dev-72B е отворен кодов езиков модел, оптимизиран с мащабно подсилващо обучение за създаване на стабилни, готови за продукция корекции. Постига 60.4% в SWE-bench Verified, поставяйки нов рекорд сред отворените модели за автоматизирани задачи като отстраняване на грешки и преглед на код.",
"moonshotai/Kimi-K2-Instruct-0905.description": "Kimi K2-Instruct-0905 е най-новият и най-мощен модел от серията Kimi K2. Това е MoE модел от най-висок клас с 1T общо и 32B активни параметъра. Основни характеристики включват по-силна агентна интелигентност при програмиране, значителни подобрения в бенчмаркове и реални задачи, както и подобрена естетика и използваемост на фронтенд кода.",
"moonshotai/Kimi-K2-Thinking.description": "Kimi K2 Thinking е най-новият и най-мощен отворен модел за мислене. Значително разширява дълбочината на многoстъпковото разсъждение и поддържа стабилна употреба на инструменти в 200–300 последователни извиквания, поставяйки нови рекорди в Humanity's Last Exam (HLE), BrowseComp и други бенчмаркове. Отличава се в програмиране, математика, логика и агентни сценарии. Изграден върху MoE архитектура с ~1T параметри, поддържа 256K контекстен прозорец и извикване на инструменти.",
"moonshotai/Kimi-K2-Thinking.description": "Kimi K2 Thinking е най-новият и най-мощен модел за мислене с отворен код. Той значително разширява дълбочината на многократното разсъждение и поддържа стабилно използване на инструменти в 200–300 последователни извиквания, поставяйки нови рекорди на Humanity's Last Exam (HLE), BrowseComp и други бенчмаркове. Превъзхожда в кодиране, математика, логика и сценарии с агенти. Изграден на архитектура MoE с ~1 трилион общи параметри, поддържа 256K контекстен прозорец и извикване на инструменти.",
"moonshotai/kimi-k2-0711.description": "Kimi K2 0711 е instruct вариант от серията Kimi, подходящ за висококачествен код и използване на инструменти.",
"moonshotai/kimi-k2-0905.description": "Kimi K2 0905 е актуализация, която разширява контекста и логическата производителност с оптимизации за програмиране.",
"moonshotai/kimi-k2-instruct-0905.description": "Моделът kimi-k2-0905-preview поддържа 256K контекстен прозорец, с по-силно агентно програмиране, по-изпипан и практичен фронтенд код и по-добро разбиране на контекста.",
@@ -948,8 +953,8 @@
"nvidia/Llama-3.1-Nemotron-70B-Instruct-HF.description": "Llama 3.1 Nemotron 70B е персонализиран LLM от NVIDIA, създаден за подобряване на полезността. Представя се отлично в Arena Hard, AlpacaEval 2 LC и GPT-4-Turbo MT-Bench, заемайки първо място и в трите автоматични бенчмарка към 1 октомври 2024 г. Обучен е от Llama-3.1-70B-Instruct с помощта на RLHF (REINFORCE), Llama-3.1-Nemotron-70B-Reward и HelpSteer2-Preference подсказки.",
"nvidia/llama-3.1-nemotron-51b-instruct.description": "Отличителен езиков модел, предлагащ изключителна точност и ефективност.",
"nvidia/llama-3.1-nemotron-70b-instruct.description": "Llama-3.1-Nemotron-70B-Instruct е персонализиран модел на NVIDIA, създаден за подобряване на полезността на отговорите от LLM.",
"o1-mini.description": "По-малък и по-бърз от o1-preview, с 80% по-ниска цена, силен при генериране на код и задачи с кратък контекст.",
"o1-preview.description": "Фокусиран върху напреднало разсъждение и решаване на сложни проблеми, включително математика и наука. Идеален за приложения, изискващи дълбоко разбиране на контекста и автономни работни потоци.",
"o1-mini.description": "o1-mini е бърз, икономичен модел за разсъждение, проектиран за кодиране, математика и наука. Има 128K контекст и знание до октомври 2023 г.",
"o1-preview.description": "o1 е новият модел на OpenAI за разсъждение за сложни задачи, изискващи широки знания. Има 128K контекст и знание до октомври 2023 г.",
"o1-pro.description": "Серията o1 е обучена с подсилващо обучение, за да мисли преди да отговори и да се справя със сложни разсъждения. o1-pro използва повече изчислителна мощ за по-дълбоко мислене и последователно по-качествени отговори.",
"o1.description": "o1 е новият модел за разсъждение на OpenAI с вход текст+изображение и изход текст, подходящ за сложни задачи, изискващи широка обща култура. Има контекстен прозорец от 200K и граница на знанията от октомври 2023 г.",
"o3-2025-04-16.description": "o3 е новият модел за разсъждение на OpenAI с вход текст+изображение и изход текст за сложни задачи, изискващи широка обща култура.",
@@ -1022,7 +1027,6 @@
"qianfan-check-vl.description": "Qianfan Check VL е мултимодален модел за преглед на съдържание, съвместимост между изображение и текст и задачи по разпознаване.",
"qianfan-composition.description": "Qianfan Composition е мултимодален модел за създаване, разбиране и генериране на смесено изображение и текст.",
"qianfan-engcard-vl.description": "Qianfan EngCard VL е мултимодален модел за разпознаване, фокусиран върху английски езикови сценарии.",
"qianfan-lightning-128b-a19b.description": "Qianfan Lightning 128B A19B е високопроизводителен китайски общ модел за сложни въпроси и мащабно разсъждение.",
"qianfan-llama-vl-8b.description": "Qianfan Llama VL 8B е мултимодален модел, базиран на Llama, за общо разбиране на изображения и текст.",
"qianfan-multipicocr.description": "Qianfan MultiPicOCR е OCR модел за множество изображения, откриващ и разпознаващ текст в различни изображения.",
"qianfan-qi-vl.description": "Qianfan QI VL е мултимодален модел за въпроси и отговори с точна извличане и отговори в сложни сценарии с изображения и текст.",
@@ -1032,7 +1036,6 @@
"qvq-72b-preview.description": "QVQ-72B-Preview е експериментален изследователски модел от Qwen, фокусиран върху подобрено визуално разсъждение.",
"qvq-max.description": "Моделът за визуално разсъждение Qwen QVQ поддържа вход от изображения и изход с chain-of-thought, с по-силна производителност в математика, програмиране, визуален анализ, творчество и общи задачи.",
"qvq-plus.description": "Модел за визуално разсъждение с вход от изображения и изход с chain-of-thought. Серията qvq-plus следва qvq-max и предлага по-бързо разсъждение с по-добър баланс между качество и цена.",
"qwen-3-32b.description": "Qwen 3 32B: силен в многоезични и програмистки задачи, подходящ за средномащабна продукция.",
"qwen-coder-plus.description": "Модел за програмиране от серията Qwen.",
"qwen-coder-turbo-latest.description": "Модел за програмиране от серията Qwen.",
"qwen-coder-turbo.description": "Модел за програмиране от серията Qwen.",
@@ -1128,7 +1131,6 @@
"qwen3-coder-next.description": "Следващо поколение Qwen кодер, оптимизиран за сложна многокодова генерация, дебъгване и високопроизводителни работни потоци на агенти. Създаден за силна интеграция на инструменти и подобрена производителност на разсъждения.",
"qwen3-coder-plus.description": "Модел за програмиране Qwen. Най-новата серия Qwen3-Coder е базирана на Qwen3 и предлага силни способности за програмиране чрез агенти, използване на инструменти и взаимодействие със среди за автономно програмиране, с отлично представяне при код и стабилни общи възможности.",
"qwen3-coder:480b.description": "Високопроизводителен модел на Alibaba с дълъг контекст за задачи с агенти и програмиране.",
"qwen3-max-2026-01-23.description": "Моделите Qwen3 Max предлагат значителни подобрения спрямо серията 2.5 в общите способности, разбиране на китайски/английски, следване на сложни инструкции, субективни отворени задачи, многоезичност и използване на инструменти, с по-малко халюцинации. Най-новият qwen3-max подобрява агентското програмиране и използването на инструменти спрямо qwen3-max-preview. Това издание достига върхови резултати в областта и е насочено към по-сложни нужди на агентите.",
"qwen3-max-preview.description": "Най-добре представящият се модел Qwen за сложни, многоетапни задачи. Прегледната версия поддържа разсъждение.",
"qwen3-max.description": "Моделите Qwen3 Max предлагат значителни подобрения спрямо серията 2.5 в общите способности, разбиране на китайски/английски, следване на сложни инструкции, субективни отворени задачи, многоезичност и използване на инструменти, с по-малко халюцинации. Най-новият qwen3-max подобрява програмирането чрез агенти и използването на инструменти спрямо qwen3-max-preview. Тази версия достига водещи резултати в индустрията и е насочена към по-сложни нужди на агентите.",
"qwen3-next-80b-a3b-instruct.description": "Следващо поколение отворен модел Qwen3 без мисловни способности. В сравнение с предишната версия (Qwen3-235B-A22B-Instruct-2507), предлага по-добро разбиране на китайски, по-силна логическа аргументация и подобрено генериране на текст.",
@@ -1145,7 +1147,8 @@
"qwen3-vl-flash.description": "Qwen3 VL Flash: лек, високоскоростен модел за аргументация, подходящ за заявки с ниска латентност или голям обем.",
"qwen3-vl-plus.description": "Qwen VL е модел за генериране на текст с разбиране на визуално съдържание. Може да извършва OCR, както и обобщаване и логическа обработка, например извличане на атрибути от продуктови снимки или решаване на задачи от изображения.",
"qwen3.5-397b-a17b.description": "Поддържа текст, изображения и видео входове. За задачи само с текст, производителността му е сравнима с Qwen3 Max, предлагайки по-висока ефективност и по-ниска цена. В мултимодалните способности той предоставя значителни подобрения спрямо серията Qwen3 VL.",
"qwen3.5-plus.description": "Qwen3.5 Plus поддържа текст, изображения и видео входове. За задачи само с текст, производителността му е сравнима с Qwen3 Max, докато предлага по-добра ефективност и по-ниска цена. В мултимодалните способности той показва значителни подобрения спрямо серията Qwen3 VL.",
"qwen3.5-plus.description": "Qwen3.5 Plus поддържа текст, изображения и видео вход. Производителността му при чисто текстови задачи е сравнима с Qwen3 Max, с по-добра производителност и по-ниска цена. Мултимодалните му възможности са значително подобрени в сравнение със серията Qwen3 VL.",
"qwen3.5:397b.description": "Qwen3.5 е обединен модел за визия и език с хибридна архитектура (Mixture-of-Experts + линейно внимание), предлагащ силни мултимодални разсъждения, кодиране и способности за дълъг контекст с 256K контекстен прозорец.",
"qwen3.description": "Qwen3 е следващото поколение голям езиков модел на Alibaba с висока ефективност в разнообразни приложения.",
"qwq-32b-preview.description": "QwQ е експериментален изследователски модел от Qwen, фокусиран върху подобрена аргументация.",
"qwq-32b.description": "QwQ е модел за аргументация от семейството на Qwen. В сравнение със стандартните модели, обучени с инструкции, предлага мисловни и логически способности, които значително подобряват ефективността при сложни задачи. QwQ-32B е среден по размер модел, съперничещ на водещи модели като DeepSeek-R1 и o1-mini.",
@@ -1187,7 +1190,7 @@
"step-2-16k.description": "Поддържа взаимодействия с голям контекст за сложни диалози.",
"step-2-mini.description": "Изграден върху следващото поколение вътрешна архитектура MFA attention, предоставяйки резултати, подобни на Step-1, при значително по-ниска цена, с по-висока пропускателна способност и по-бърза латентност. Обработва общи задачи със силни способности за програмиране.",
"step-2x-large.description": "Модел от ново поколение StepFun за генериране на изображения, създаващ висококачествени изображения от текстови подканва. Осигурява по-реалистична текстура и по-добро визуализиране на китайски/английски текст.",
"step-3.5-flash.description": "Флагманският модел за езиково разсъждение от Stepfun. Този модел предоставя топ способности за разсъждение заедно с бързо и надеждно изпълнение. Може да разлага и планира сложни задачи, бързо и надеждно да извиква инструменти за тяхното изпълнение и да превъзхожда в логическо разсъждение, математика, софтуерно инженерство, дълбоки изследвания и други сложни задачи. Дължината на контекста е 256K.",
"step-3.5-flash.description": "Флагманският модел за езиково разсъждение на Stepfun. Този модел има първокласни способности за разсъждение и бързи и надеждни изпълнителни възможности. Може да разлага и планира сложни задачи, бързо и надеждно да извиква инструменти за изпълнение на задачи и да бъде компетентен в различни сложни задачи като логическо разсъждение, математика, софтуерно инженерство и задълбочени изследвания.",
"step-3.description": "Този модел притежава силно визуално възприятие и сложна логика, точно обработва междудомейново знание, анализ между математика и визия и широк спектър от ежедневни визуални задачи.",
"step-r1-v-mini.description": "Модел за логическо разсъждение със силно визуално разбиране, който може да обработва изображения и текст, след което да генерира текст след дълбоко разсъждение. Отличава се във визуално разсъждение и предоставя водещи резултати в математика, програмиране и текстово разсъждение, с контекстен прозорец от 100K.",
"stepfun-ai/step3.description": "Step3 е авангарден мултимодален модел за разсъждение от StepFun, изграден върху MoE архитектура с общо 321B и 38B активни параметъра. Дизайнът от край до край минимизира разходите за декодиране, като същевременно осигурява водещо разсъждение между визия и език. С MFA и AFD дизайн, остава ефективен както на флагмански, така и на нискобюджетни ускорители. Предобучен с над 20T текстови токени и 4T токени от изображения и текст на множество езици. Постига водеща производителност сред отворените модели в математика, код и мултимодални бенчмаркове.",
@@ -1276,10 +1279,11 @@
"z-ai/glm4.7.description": "GLM-4.7 е най-новият флагмански модел на Zhipu, подобрен за сценарии на агентно кодиране с усъвършенствани кодови способности.",
"z-ai/glm5.description": "GLM-5 е новият флагмански основен модел на Zhipu AI за инженеринг на агенти, постигайки отворен източник SOTA производителност в кодиране и способности на агенти. Сравнява се с Claude Opus 4.5 по производителност.",
"z-image-turbo.description": "Z-Image е лек модел за генериране на изображения от текст, който може бързо да произвежда изображения, поддържа както китайско, така и английско рендиране на текст и гъвкаво се адаптира към множество резолюции и съотношения.",
"zai-glm-4.7.description": "Този модел предоставя силна производителност в кодирането с напреднали способности за разсъждение, превъзходно използване на инструменти и подобрена реална производителност в агентни приложения за кодиране.",
"zai-org/GLM-4.5-Air.description": "GLM-4.5-Air е базов модел за агентни приложения с архитектура Mixture-of-Experts. Оптимизиран е за използване на инструменти, уеб браузване, софтуерно инженерство и фронтенд програмиране, и се интегрира с кодови агенти като Claude Code и Roo Code. Използва хибридно разсъждение за справяне както със сложни, така и с ежедневни задачи.",
"zai-org/GLM-4.5.description": "GLM-4.5 е базов модел, създаден за агентни приложения с архитектура Mixture-of-Experts. Дълбоко оптимизиран за използване на инструменти, уеб браузване, софтуерно инженерство и фронтенд програмиране, и се интегрира с кодови агенти като Claude Code и Roo Code. Използва хибридно разсъждение за справяне както със сложни, така и с ежедневни задачи.",
"zai-org/GLM-4.5V.description": "GLM-4.5V е най-новият визуален езиков модел (VLM) на Zhipu AI, изграден върху флагманския текстов модел GLM-4.5-Air (106B общо, 12B активни) с MoE архитектура за висока производителност при по-ниска цена. Следва пътя на GLM-4.1V-Thinking и добавя 3D-RoPE за подобрено пространствено разсъждение в 3D. Оптимизиран чрез предварително обучение, SFT и RL, обработва изображения, видео и дълги документи и е сред водещите отворени модели в 41 публични мултимодални бенчмарка. Режимът Thinking позволява на потребителите да балансират между скорост и дълбочина.",
"zai-org/GLM-4.6.description": "В сравнение с GLM-4.5, GLM-4.6 разширява контекста от 128K до 200K за по-сложни агентни задачи. Постига по-високи резултати в кодови бенчмаркове и показва по-добра реална производителност в приложения като Claude Code, Cline, Roo Code и Kilo Code, включително по-добро генериране на фронтенд страници. Разсъждението е подобрено и се поддържа използване на инструменти по време на разсъждение, което засилва цялостните възможности. По-добре се интегрира в агентни рамки, подобрява инструментите/търсещите агенти и има по-предпочитан от хора стил на писане и естественост в ролевите сценарии.",
"zai-org/GLM-4.6V.description": "GLM-4.6V постига SOTA точност в разбирането на визията за същия мащаб на параметрите и за първи път интегрира способността за извикване на функции (инструменти) в архитектурата на визуалния модел, свързвайки „визуално възприятие“ с „изпълними действия (Action)“, предоставяйки унифицирана технологична основа за мултимодални агенти в реални бизнес сценарии.",
"zai/glm-4.5-air.description": "GLM-4.5 и GLM-4.5-Air са най-новите ни флагмани за агентни приложения, и двата използват MoE. GLM-4.5 има 355B общо и 32B активни параметри на стъпка; GLM-4.5-Air е по-лек с 106B общо и 12B активни.",
"zai/glm-4.5.description": "Серията GLM-4.5 е проектирана за агенти. Флагманският GLM-4.5 комбинира разсъждение, програмиране и агентни умения с 355B общи параметри (32B активни) и предлага два режима на работа като хибридна система за разсъждение.",
"zai/glm-4.5v.description": "GLM-4.5V надгражда GLM-4.5-Air, наследявайки доказани техники от GLM-4.1V-Thinking и мащабира с мощна MoE архитектура с 106 милиарда параметъра.",
+14
View File
@@ -24,6 +24,20 @@
"builtins.lobe-agent-builder.inspector.noResults": "Няма резултати",
"builtins.lobe-agent-builder.inspector.togglePlugin": "Превключи",
"builtins.lobe-agent-builder.title": "Експерт по изграждане на агенти",
"builtins.lobe-agent-management.apiName.callAgent": "Обаждане на агент",
"builtins.lobe-agent-management.apiName.createAgent": "Създаване на агент",
"builtins.lobe-agent-management.apiName.deleteAgent": "Изтриване на агент",
"builtins.lobe-agent-management.apiName.searchAgent": "Търсене на агенти",
"builtins.lobe-agent-management.apiName.updateAgent": "Актуализиране на агент",
"builtins.lobe-agent-management.inspector.callAgent.sync": "Обаждане:",
"builtins.lobe-agent-management.inspector.callAgent.task": "Възлагане на задача на:",
"builtins.lobe-agent-management.inspector.createAgent.title": "Създаване на агент:",
"builtins.lobe-agent-management.inspector.searchAgent.all": "Търсене на агенти:",
"builtins.lobe-agent-management.inspector.searchAgent.market": "Търсене на пазар:",
"builtins.lobe-agent-management.inspector.searchAgent.results": "{{count}} резултати",
"builtins.lobe-agent-management.inspector.searchAgent.user": "Търсене на моите агенти:",
"builtins.lobe-agent-management.inspector.updateAgent.title": "Актуализиране на агент:",
"builtins.lobe-agent-management.title": "Мениджър на агенти",
"builtins.lobe-cloud-sandbox.apiName.editLocalFile": "Редактиране на файл",
"builtins.lobe-cloud-sandbox.apiName.executeCode": "Изпълнение на код",
"builtins.lobe-cloud-sandbox.apiName.exportFile": "Експортиране на файл",
+3
View File
@@ -724,6 +724,9 @@
"tools.builtins.lobe-artifacts.description": "Генерирайте и визуализирайте интерактивни UI компоненти, визуализации на данни, диаграми, SVG графики и уеб приложения в реално време. Създавайте богато визуално съдържание, с което потребителите могат директно да взаимодействат.",
"tools.builtins.lobe-artifacts.readme": "Генерирайте и визуализирайте интерактивни UI компоненти, визуализации на данни, диаграми, SVG графики и уеб приложения в реално време. Създавайте богато визуално съдържание, с което потребителите могат директно да взаимодействат.",
"tools.builtins.lobe-artifacts.title": "Артефакти",
"tools.builtins.lobe-calculator.description": "Извършвайте математически изчисления, решавайте уравнения и работете със символни изрази",
"tools.builtins.lobe-calculator.readme": "Разширен математически калкулатор, поддържащ основна аритметика, алгебрични уравнения, операции с калкулус и символна математика. Включва преобразуване на бази, решаване на уравнения, диференциране, интегриране и други.",
"tools.builtins.lobe-calculator.title": "Калкулатор",
"tools.builtins.lobe-cloud-sandbox.description": "Изпълнявайте код на Python, JavaScript и TypeScript в изолирана облачна среда. Стартирайте shell команди, управлявайте файлове, търсете съдържание с regex и експортирайте резултати сигурно.",
"tools.builtins.lobe-cloud-sandbox.readme": "Изпълнявайте код на Python, JavaScript и TypeScript в изолирана облачна среда. Стартирайте shell команди, управлявайте файлове, търсете съдържание с regex и експортирайте резултати сигурно.",
"tools.builtins.lobe-cloud-sandbox.title": "Облачна пясъчник среда",
+5 -1
View File
@@ -224,7 +224,9 @@
"providerModels.item.modelConfig.extendParams.options.gpt5_2ProReasoningEffort.hint": "Für die GPT-5.2 Pro-Serie; steuert die Intensität des logischen Denkens.",
"providerModels.item.modelConfig.extendParams.options.gpt5_2ReasoningEffort.hint": "Für die GPT-5.2-Serie; steuert die Intensität des logischen Denkens.",
"providerModels.item.modelConfig.extendParams.options.imageAspectRatio.hint": "Für Gemini-Bildgenerierungsmodelle; steuert das Seitenverhältnis der generierten Bilder.",
"providerModels.item.modelConfig.extendParams.options.imageAspectRatio2.hint": "Für Nano Banana 2; steuert das Seitenverhältnis der generierten Bilder (unterstützt extra-breit 1:4, 4:1, 1:8, 8:1).",
"providerModels.item.modelConfig.extendParams.options.imageResolution.hint": "Für Gemini 3 Bildgenerierungsmodelle; steuert die Auflösung der generierten Bilder.",
"providerModels.item.modelConfig.extendParams.options.imageResolution2.hint": "Für Gemini 3.1 Flash Image-Modelle; steuert die Auflösung der generierten Bilder (unterstützt 512px).",
"providerModels.item.modelConfig.extendParams.options.reasoningBudgetToken.hint": "Für Claude, Qwen3 und ähnliche Modelle; steuert das Token-Budget für logisches Denken.",
"providerModels.item.modelConfig.extendParams.options.reasoningEffort.hint": "Für OpenAI und andere Modelle mit Denkfähigkeit; steuert den Denkaufwand.",
"providerModels.item.modelConfig.extendParams.options.textVerbosity.hint": "Für die GPT-5+-Serie; steuert die Ausführlichkeit der Ausgabe.",
@@ -232,7 +234,8 @@
"providerModels.item.modelConfig.extendParams.options.thinkingBudget.hint": "Für die Gemini-Serie; steuert das Denkbudget.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel.hint": "Für Gemini 3 Flash Preview-Modelle; steuert die Denktiefe.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel2.hint": "Für Gemini 3 Pro Preview-Modelle; steuert die Denktiefe.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel3.hint": "Für Gemini 3.1 Pro Vorschau-Modelle; steuert die Denktiefe mit niedrigen/mittleren/hohen Stufen.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel3.hint": "Für Gemini 3.1 Pro Preview-Modelle; steuert die Denktiefe mit niedrigen/mittleren/hohen Stufen.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel4.hint": "Für Gemini 3.1 Flash Image-Modelle; schaltet das Denken ein/aus.",
"providerModels.item.modelConfig.extendParams.options.urlContext.hint": "Für die Gemini-Serie; unterstützt die Bereitstellung von URL-Kontext.",
"providerModels.item.modelConfig.extendParams.placeholder": "Wählen Sie zu aktivierende erweiterte Parameter",
"providerModels.item.modelConfig.extendParams.previewFallback": "Vorschau nicht verfügbar",
@@ -311,6 +314,7 @@
"providerModels.tabs.image": "Bild",
"providerModels.tabs.stt": "ASR",
"providerModels.tabs.tts": "TTS",
"providerModels.tabs.video": "Video",
"sortModal.success": "Sortierung erfolgreich aktualisiert",
"sortModal.title": "Benutzerdefinierte Reihenfolge",
"sortModal.update": "Aktualisieren",
+35 -31
View File
@@ -55,7 +55,8 @@
"FLUX.1-dev.description": "FLUX.1-dev ist ein Open-Source-multimodales Sprachmodell (MLLM) von Black Forest Labs, optimiert für Bild-Text-Aufgaben. Es kombiniert Bild-/Textverständnis und -generierung. Basierend auf fortschrittlichen LLMs (z.B. Mistral-7B) nutzt es einen sorgfältig entwickelten Vision-Encoder und mehrstufiges Instruction-Tuning für multimodale Koordination und komplexes logisches Denken.",
"Gryphe/MythoMax-L2-13b.description": "MythoMax-L2 (13B) ist ein innovatives Modell für vielfältige Anwendungsbereiche und komplexe Aufgaben.",
"HelloMeme.description": "HelloMeme ist ein KI-Tool zur Erstellung von Memes, GIFs oder Kurzvideos aus bereitgestellten Bildern oder Bewegungen. Es erfordert keine Zeichen- oder Programmierkenntnisse ein Referenzbild genügt, um unterhaltsame, ansprechende und stilistisch konsistente Inhalte zu erzeugen.",
"HiDream-I1-Full.description": "HiDream-E1-Full ist ein Open-Source-Modell zur multimodalen Bildbearbeitung von HiDream.ai, basierend auf einer fortschrittlichen Diffusion Transformer-Architektur und starkem Sprachverständnis (integriertes LLaMA 3.1-8B-Instruct). Es unterstützt bildgesteuerte Generierung, Stilübertragungen, lokale Bearbeitungen und Neumalerei mit exzellentem Bild-Text-Verständnis und präziser Ausführung.",
"HiDream-E1-Full.description": "HiDream-E1-Full ist ein Open-Source-Multimodell-Bildbearbeitungsmodell von HiDream.ai, basierend auf einer fortschrittlichen Diffusion Transformer-Architektur und starker Sprachverständnisfähigkeit (integriertes LLaMA 3.1-8B-Instruct). Es unterstützt natürliche Sprachsteuerung für Bildgenerierung, Stiltransfer, lokale Bearbeitungen und Übermalungen mit hervorragendem Bild-Text-Verständnis und Ausführung.",
"HiDream-I1-Full.description": "HiDream-I1 ist ein neues Open-Source-Basis-Bildgenerierungsmodell von HiDream. Mit 17 Milliarden Parametern (Flux hat 12 Milliarden) liefert es branchenführende Bildqualität in Sekundenschnelle.",
"HunyuanDiT-v1.2-Diffusers-Distilled.description": "hunyuandit-v1.2-distilled ist ein leichtgewichtiges Text-zu-Bild-Modell, das durch Distillation optimiert wurde, um schnell hochwertige Bilder zu erzeugen. Besonders geeignet für ressourcenschwache Umgebungen und Echtzeitanwendungen.",
"InstantCharacter.description": "InstantCharacter ist ein personalisiertes Charaktergenerierungsmodell ohne Feintuning, veröffentlicht von Tencent AI im Jahr 2025. Es ermöglicht hochrealistische, szenenübergreifend konsistente Charaktere. Ein einzelnes Referenzbild genügt, um den Charakter flexibel in verschiedene Stile, Aktionen und Hintergründe zu übertragen.",
"InternVL2-8B.description": "InternVL2-8B ist ein leistungsstarkes Vision-Language-Modell für multimodale Bild-Text-Verarbeitung. Es erkennt Bildinhalte präzise und generiert passende Beschreibungen oder Antworten.",
@@ -80,7 +81,7 @@
"MiniMax-M2.1.description": "MiniMax-M2.1 ist das Flaggschiff unter den Open-Source-Großmodellen von MiniMax und konzentriert sich auf die Lösung komplexer Aufgaben aus der realen Welt. Seine zentralen Stärken liegen in der mehrsprachigen Programmierfähigkeit und der Fähigkeit, als Agent komplexe Aufgaben zu bewältigen.",
"MiniMax-M2.5-Lightning.description": "M2.5 Lightning: Gleiche Leistung, schneller und agiler (ca. 100 tps).",
"MiniMax-M2.5-highspeed.description": "Gleiche Leistung wie M2.5 mit deutlich schnellerer Inferenz.",
"MiniMax-M2.5.description": "Erstklassige Leistung und ultimative Kosteneffizienz, bewältigt mühelos komplexe Aufgaben (ca. 60 tps).",
"MiniMax-M2.5.description": "MiniMax-M2.5 ist ein Flaggschiff-Open-Source-Großmodell von MiniMax, das sich auf die Lösung komplexer realer Aufgaben konzentriert. Seine Kernstärken sind mehrsprachige Programmierfähigkeiten und die Fähigkeit, komplexe Aufgaben als Agent zu lösen.",
"MiniMax-M2.description": "Speziell für effizientes Programmieren und Agenten-Workflows entwickelt",
"MiniMax-Text-01.description": "MiniMax-01 führt großskalige lineare Aufmerksamkeit über klassische Transformer hinaus ein. Mit 456B Parametern und 45,9B aktiv pro Durchlauf erreicht es Spitzenleistung und unterstützt bis zu 4M Token Kontext (32× GPT-4o, 20× Claude-3.5-Sonnet).",
"MiniMaxAI/MiniMax-M1-80k.description": "MiniMax-M1 ist ein Open-Weights-Modell für großskalige hybride Aufmerksamkeits- und Schlussfolgerungsaufgaben mit insgesamt 456 Milliarden Parametern und etwa 45,9 Milliarden aktiven Parametern pro Token. Es unterstützt nativ einen Kontext von 1 Million Tokens und nutzt Flash Attention, um die FLOPs bei der Generierung von 100.000 Tokens im Vergleich zu DeepSeek R1 um 75 % zu reduzieren. Durch die MoE-Architektur, CISPO und hybrides RL-Training erzielt es führende Leistungen bei Aufgaben mit langen Eingaben und realer Softwareentwicklung.",
@@ -98,6 +99,7 @@
"Phi-3.5-mini-instruct.description": "Eine aktualisierte Version des Phi-3-mini-Modells.",
"Phi-3.5-vision-instrust.description": "Eine aktualisierte Version des Phi-3-vision-Modells.",
"Pro/MiniMaxAI/MiniMax-M2.1.description": "MiniMax-M2.1 ist ein Open-Source-Sprachmodell der nächsten Generation, das für agentenbasierte Fähigkeiten optimiert wurde. Es überzeugt in den Bereichen Programmierung, Werkzeugnutzung, Befolgen von Anweisungen und langfristige Planung. Das Modell unterstützt mehrsprachige Softwareentwicklung und die Ausführung komplexer, mehrstufiger Arbeitsabläufe. Es erreichte 74,0 Punkte im SWE-bench Verified und übertrifft Claude Sonnet 4.5 in mehrsprachigen Szenarien.",
"Pro/MiniMaxAI/MiniMax-M2.5.description": "MiniMax-M2.5 ist das neueste große Sprachmodell von MiniMax, das durch groß angelegtes Reinforcement Learning in Hunderttausenden komplexer realer Umgebungen trainiert wurde. Mit einer MoE-Architektur und 229 Milliarden Parametern erreicht es branchenführende Leistungen in Aufgaben wie Programmierung, Agenten-Tool-Aufrufen, Suche und Büroszenarien.",
"Pro/Qwen/Qwen2-7B-Instruct.description": "Qwen2-7B-Instruct ist ein 7B-Instruktionsmodell der Qwen2-Serie. Es verwendet eine Transformer-Architektur mit SwiGLU, Attention-QKV-Bias und Grouped-Query-Attention und verarbeitet große Eingaben. Es zeigt starke Leistungen in Sprachverständnis, Textgenerierung, Mehrsprachigkeit, Programmierung, Mathematik und logischem Denken, übertrifft die meisten Open-Source-Modelle und konkurriert mit proprietären Modellen. Es übertrifft Qwen1.5-7B-Chat in mehreren Benchmarks.",
"Pro/Qwen/Qwen2.5-7B-Instruct.description": "Qwen2.5-7B-Instruct ist Teil der neuesten LLM-Serie von Alibaba Cloud. Das 7B-Modell bietet deutliche Verbesserungen in den Bereichen Programmierung und Mathematik, unterstützt über 29 Sprachen und verbessert das Befolgen von Anweisungen, das Verständnis strukturierter Daten und strukturierte Ausgaben (insbesondere JSON).",
"Pro/Qwen/Qwen2.5-Coder-7B-Instruct.description": "Qwen2.5-Coder-7B-Instruct ist das neueste codefokussierte LLM von Alibaba Cloud. Basierend auf Qwen2.5 und trainiert mit 5,5 Billionen Tokens verbessert es die Codegenerierung, das logische Denken und die Fehlerbehebung erheblich, während es mathematische und allgemeine Stärken beibehält eine solide Grundlage für Coding-Agenten.",
@@ -107,13 +109,13 @@
"Pro/deepseek-ai/DeepSeek-R1-Distill-Qwen-7B.description": "DeepSeek-R1-Distill-Qwen-7B ist eine Destillation von Qwen2.5-Math-7B und wurde mit 800.000 kuratierten DeepSeek-R1-Beispielen feinabgestimmt. Es erzielt starke Leistungen mit 92,8 % auf MATH-500, 55,5 % auf AIME 2024 und einem CodeForces-Rating von 1189 für ein 7B-Modell.",
"Pro/deepseek-ai/DeepSeek-R1.description": "DeepSeek-R1 ist ein durch RL optimiertes Schlussfolgerungsmodell, das Wiederholungen reduziert und die Lesbarkeit verbessert. Es verwendet Cold-Start-Daten vor dem RL, um das logische Denken weiter zu verbessern, erreicht vergleichbare Leistungen wie OpenAI-o1 bei Mathematik-, Code- und Denkaufgaben und verbessert die Gesamtergebnisse durch sorgfältiges Training.",
"Pro/deepseek-ai/DeepSeek-V3.1-Terminus.description": "DeepSeek-V3.1-Terminus ist eine aktualisierte Version des V3.1-Modells, das als hybrides Agenten-LLM positioniert ist. Es behebt von Nutzern gemeldete Probleme, verbessert die Stabilität und Sprachkonsistenz und reduziert gemischte chinesisch/englische Ausgaben und fehlerhafte Zeichen. Es integriert Denk- und Nicht-Denk-Modi mit Chat-Vorlagen für flexibles Umschalten. Außerdem verbessert es die Leistung von Code- und Suchagenten für zuverlässigere Werkzeugnutzung und mehrstufige Aufgaben.",
"Pro/deepseek-ai/DeepSeek-V3.2-Exp.description": "DeepSeek-V3.2-Exp ist eine experimentelle V3.2-Version, die den Übergang zur nächsten Architektur bildet. Sie ergänzt DeepSeek Sparse Attention (DSA) auf Basis von V3.1-Terminus, um das Training und die Inferenz bei langen Kontexten effizienter zu gestalten, mit Optimierungen für Werkzeugnutzung, Verständnis langer Dokumente und mehrstufiges Denken. Ideal zur Erforschung höherer Effizienz bei großem Kontextbudget.",
"Pro/deepseek-ai/DeepSeek-V3.2.description": "DeepSeek-V3.2 ist ein Modell, das hohe Rechenleistungseffizienz mit exzellenter Argumentation und Agentenleistung kombiniert. Sein Ansatz basiert auf drei technologischen Durchbrüchen: DeepSeek Sparse Attention (DSA), einem effizienten Aufmerksamkeitsmechanismus, der die Rechenkomplexität erheblich reduziert und gleichzeitig die Modellleistung beibehält, speziell optimiert für Langkontext-Szenarien; einem skalierbaren Reinforcement-Learning-Framework, durch das die Modellleistung mit GPT-5 konkurrieren kann, wobei die Hochleistungsvariante mit Gemini-3.0-Pro in Argumentationsfähigkeiten vergleichbar ist; und einer groß angelegten Agenten-Aufgabensynthese-Pipeline, die darauf abzielt, Argumentationsfähigkeiten in Werkzeugszenarien zu integrieren, um die Befolgung von Anweisungen und die Generalisierung in komplexen interaktiven Umgebungen zu verbessern. Das Modell erreichte Goldmedaillenleistungen bei der Internationalen Mathematik-Olympiade (IMO) und der Internationalen Informatik-Olympiade (IOI) 2025.",
"Pro/deepseek-ai/DeepSeek-V3.description": "DeepSeek-V3 ist ein MoE-Modell mit 671 Milliarden Parametern, das MLA und DeepSeekMoE mit verlustfreier Lastverteilung für effizientes Training und Inferenz nutzt. Es wurde mit 14,8 Billionen hochwertigen Tokens vortrainiert und mit SFT und RL weiter abgestimmt. Es übertrifft andere Open-Source-Modelle und nähert sich führenden Closed-Source-Modellen an.",
"Pro/moonshotai/Kimi-K2-Instruct-0905.description": "Kimi K2-Instruct-0905 ist das neueste und leistungsstärkste Modell der Kimi K2-Reihe. Es handelt sich um ein MoE-Spitzenmodell mit insgesamt 1 Billion und 32 Milliarden aktiven Parametern. Zu den Hauptmerkmalen zählen eine verbesserte agentenbasierte Programmierintelligenz mit deutlichen Leistungssteigerungen bei Benchmarks und realen Agentenaufgaben sowie eine optimierte Ästhetik und Benutzerfreundlichkeit im Frontend-Coding.",
"Pro/moonshotai/Kimi-K2-Thinking.description": "Kimi K2 Thinking Turbo ist die Turbo-Variante, die für hohe Geschwindigkeit und Durchsatz beim logischen Denken optimiert wurde, während die Fähigkeit zu mehrstufigem Denken und Werkzeugnutzung von K2 Thinking erhalten bleibt. Es handelt sich um ein MoE-Modell mit etwa 1 Billion Parametern, nativem 256K-Kontext und stabiler großskaliger Tool-Nutzung für Produktionsszenarien mit strengen Anforderungen an Latenz und Parallelität.",
"Pro/moonshotai/Kimi-K2.5.description": "Kimi K2.5 ist ein Open-Source-natives multimodales Agentenmodell, basierend auf Kimi-K2-Base, trainiert mit etwa 1,5 Billionen gemischten Bild- und Text-Tokens. Das Modell verwendet eine MoE-Architektur mit insgesamt 1 Billion Parametern und 32 Milliarden aktiven Parametern, unterstützt ein Kontextfenster von 256K und integriert nahtlos visuelle und sprachliche Verständnisfähigkeiten.",
"Pro/zai-org/glm-4.7.description": "GLM-4.7 ist Zhipus neue Flaggschiff-Generation mit insgesamt 355 Milliarden Parametern und 32 Milliarden aktiven Parametern. Das Modell wurde umfassend in den Bereichen allgemeiner Dialog, logisches Denken und Agentenfähigkeiten verbessert. GLM-4.7 stärkt das Interleaved Thinking und führt Preserved Thinking sowie Turn-level Thinking ein.",
"Pro/zai-org/glm-5.description": "GLM-5 ist das neue Generationen-Sprachmodell von Zhipu, das sich auf komplexe Systemtechnik und langfristige Agentenaufgaben konzentriert. Die Modellparameter wurden auf 744B Parameter (40B aktiv) erweitert und integrieren DeepSeek Sparse Attention.",
"Pro/zai-org/glm-5.description": "GLM-5 ist Zhipus nächste Generation eines großen Sprachmodells, das sich auf komplexe Systementwicklung und lang andauernde Agentenaufgaben konzentriert. Die Modellparameter wurden auf 744 Milliarden (40 Milliarden aktiv) erweitert und integrieren DeepSeek Sparse Attention.",
"QwQ-32B-Preview.description": "Qwen QwQ ist ein experimentelles Forschungsmodell mit Fokus auf die Verbesserung logischer Schlussfolgerungen.",
"Qwen/QVQ-72B-Preview.description": "QVQ-72B-Preview ist ein Forschungsmodell von Qwen mit Schwerpunkt auf visuellem Denken. Es überzeugt durch seine Fähigkeit zur Analyse komplexer Szenen und zur Lösung visueller Mathematikaufgaben.",
"Qwen/QwQ-32B-Preview.description": "Qwen QwQ ist ein experimentelles Forschungsmodell zur Verbesserung der KI-Logik und des Denkvermögens.",
@@ -137,7 +139,7 @@
"Qwen/Qwen3-14B.description": "Qwen3 ist ein Next-Gen-Modell der Tongyi Qwen-Reihe mit erheblichen Fortschritten in den Bereichen logisches Denken, allgemeine Fähigkeiten, Agentenfunktionen und mehrsprachige Leistung. Es unterstützt den Wechsel zwischen verschiedenen Denkmodi.",
"Qwen/Qwen3-235B-A22B-Instruct-2507.description": "Qwen3-235B-A22B-Instruct-2507 ist das Flaggschiff-MoE-Modell der Qwen3-Reihe mit insgesamt 235 Milliarden und 22 Milliarden aktiven Parametern. Es handelt sich um eine aktualisierte Nicht-Denk-Version, die auf die Verbesserung der Befolgung von Anweisungen, logisches Denken, Textverständnis, Mathematik, Naturwissenschaften, Programmierung und Werkzeugnutzung fokussiert ist. Zudem erweitert es das mehrsprachige Wissen zu Nischenthemen und passt sich besser an Nutzerpräferenzen bei offenen, subjektiven Aufgaben an.",
"Qwen/Qwen3-235B-A22B-Thinking-2507.description": "Qwen3-235B-A22B-Thinking-2507 ist ein Qwen3-Modell, das auf komplexes logisches Denken spezialisiert ist. Es nutzt eine MoE-Architektur mit insgesamt 235 Milliarden Parametern und etwa 22 Milliarden aktiven Parametern pro Token zur Effizienzsteigerung. Als dediziertes Denkmodell erzielt es erhebliche Fortschritte in Logik, Mathematik, Naturwissenschaften, Programmierung und akademischen Benchmarks und erreicht Spitzenleistungen im offenen Denken. Es verbessert zudem die Befolgung von Anweisungen, Werkzeugnutzung und Textgenerierung und unterstützt nativ einen Kontext von 256.000 Tokens für tiefes Denken und lange Dokumente.",
"Qwen/Qwen3-235B-A22B.description": "Qwen3 ist ein Next-Gen-Modell der Tongyi Qwen-Reihe mit erheblichen Fortschritten in den Bereichen logisches Denken, allgemeine Fähigkeiten, Agentenfunktionen und mehrsprachige Leistung. Es unterstützt den Wechsel zwischen verschiedenen Denkmodi.",
"Qwen/Qwen3-235B-A22B.description": "Qwen3 235B A22B ist das ultra-skalierte Modell von Qwen3, das erstklassige KI-Fähigkeiten liefert.",
"Qwen/Qwen3-30B-A3B-Instruct-2507.description": "Qwen3-30B-A3B-Instruct-2507 ist die aktualisierte Nicht-Denk-Version von Qwen3-30B-A3B. Es handelt sich um ein MoE-Modell mit insgesamt 30,5 Milliarden und 3,3 Milliarden aktiven Parametern. Es verbessert deutlich die Befolgung von Anweisungen, logisches Denken, Textverständnis, Mathematik, Naturwissenschaften, Programmierung und Werkzeugnutzung, erweitert das mehrsprachige Wissen zu Nischenthemen und passt sich besser an Nutzerpräferenzen bei offenen Aufgaben an. Es unterstützt einen Kontext von 256.000 Tokens. Dieses Modell ist ausschließlich für Nicht-Denk-Aufgaben konzipiert und gibt keine `<think></think>`-Tags aus.",
"Qwen/Qwen3-30B-A3B-Thinking-2507.description": "Qwen3-30B-A3B-Thinking-2507 ist das neueste Denkmodell der Qwen3-Serie. Es handelt sich um ein MoE-Modell mit insgesamt 30,5 Milliarden und 3,3 Milliarden aktiven Parametern, das auf komplexe Aufgaben fokussiert ist. Es zeigt deutliche Fortschritte in Logik, Mathematik, Naturwissenschaften, Programmierung und akademischen Benchmarks und verbessert die Befolgung von Anweisungen, Werkzeugnutzung, Textgenerierung und Präferenzabgleich. Es unterstützt nativ einen Kontext von 256.000 Tokens und kann auf bis zu 1 Million Tokens erweitert werden. Diese Version ist für den Denkmodus mit detaillierter schrittweiser Argumentation und starken Agentenfähigkeiten konzipiert.",
"Qwen/Qwen3-30B-A3B.description": "Qwen3 ist ein Next-Gen-Modell der Tongyi Qwen-Reihe mit erheblichen Fortschritten in den Bereichen logisches Denken, allgemeine Fähigkeiten, Agentenfunktionen und mehrsprachige Leistung. Es unterstützt den Wechsel zwischen verschiedenen Denkmodi.",
@@ -315,7 +317,6 @@
"codeqwen.description": "CodeQwen1.5 ist ein großes Sprachmodell, das auf umfangreichen Code-Daten trainiert wurde und für komplexe Programmieraufgaben entwickelt wurde.",
"codestral-latest.description": "Codestral ist unser fortschrittlichstes Codierungsmodell; Version 2 (Jan. 2025) ist auf Aufgaben mit niedriger Latenz und hoher Frequenz wie FIM, Codekorrektur und Testgenerierung ausgelegt.",
"codestral.description": "Codestral ist das erste Codierungsmodell von Mistral AI und bietet leistungsstarke Unterstützung bei der Codegenerierung.",
"codex-mini-latest.description": "codex-mini-latest ist ein feinabgestimmtes o4-mini-Modell für die Codex-CLI. Für die direkte API-Nutzung empfehlen wir den Einstieg mit gpt-4.1.",
"cogito-2.1:671b.description": "Cogito v2.1 671B ist ein quelloffenes US-LLM zur freien kommerziellen Nutzung mit einer Leistung, die mit Spitzenmodellen konkurriert. Es bietet eine höhere Effizienz beim Token-Reasoning, einen 128k-Kontext und starke Gesamtfähigkeiten.",
"cogview-3-flash.description": "CogView-3-Flash ist ein kostenloses Bildgenerierungsmodell, das von Zhipu entwickelt wurde. Es erzeugt Bilder, die den Benutzeranweisungen entsprechen und gleichzeitig höhere ästhetische Qualitätsbewertungen erzielen. CogView-3-Flash wird hauptsächlich in Bereichen wie künstlerischer Gestaltung, Designreferenzen, Spieleentwicklung und virtueller Realität eingesetzt und hilft Benutzern, Textbeschreibungen schnell in Bilder umzuwandeln.",
"cogview-4.description": "CogView-4 ist Zhipus erstes quelloffenes Text-zu-Bild-Modell, das chinesische Schriftzeichen generieren kann. Es verbessert das semantische Verständnis, die Bildqualität und die Textdarstellung in Chinesisch/Englisch, unterstützt beliebig lange zweisprachige Eingaben und kann Bilder in jeder Auflösung innerhalb definierter Bereiche erzeugen.",
@@ -342,7 +343,7 @@
"command-light-nightly.description": "Um die Zeit zwischen Hauptveröffentlichungen zu verkürzen, bieten wir nächtliche Command-Builds an. Für die command-light-Serie heißt dies command-light-nightly. Es handelt sich um die neueste, experimentellste (und potenziell instabile) Version, die regelmäßig ohne Ankündigung aktualisiert wird daher nicht für den Produktionseinsatz empfohlen.",
"command-light.description": "Eine kleinere, schnellere Command-Variante, die nahezu gleich leistungsfähig, aber schneller ist.",
"command-nightly.description": "Um die Zeit zwischen Hauptveröffentlichungen zu verkürzen, bieten wir nächtliche Command-Builds an. Für die Command-Serie heißt dies command-nightly. Es handelt sich um die neueste, experimentellste (und potenziell instabile) Version, die regelmäßig ohne Ankündigung aktualisiert wird daher nicht für den Produktionseinsatz empfohlen.",
"command-r-03-2024.description": "Command R ist ein Chatmodell zur Befolgung von Anweisungen mit höherer Qualität, größerer Zuverlässigkeit und einem längeren Kontextfenster als frühere Modelle. Es unterstützt komplexe Workflows wie Codegenerierung, RAG, Tool-Nutzung und Agenten.",
"command-r-03-2024.description": "command-r ist ein anweisungsfolgendes Chat-Modell, das Sprachaufgaben mit höherer Qualität, verbesserter Zuverlässigkeit und längeren Kontexten als frühere Modelle ausführt. Es unterstützt komplexe Workflows wie Codegenerierung, RAG, Werkzeugnutzung und Agenten.",
"command-r-08-2024.description": "command-r-08-2024 ist ein aktualisiertes Command R-Modell, das im August 2024 veröffentlicht wurde.",
"command-r-plus-04-2024.description": "command-r-plus ist ein Alias für command-r-plus-04-2024. Die Verwendung von command-r-plus in der API verweist auf dieses Modell.",
"command-r-plus-08-2024.description": "Command R+ ist ein Chatmodell zur Befolgung von Anweisungen mit höherer Qualität, größerer Zuverlässigkeit und einem längeren Kontextfenster als frühere Modelle. Es eignet sich besonders für komplexe RAG-Workflows und mehrstufige Tool-Nutzung.",
@@ -366,7 +367,8 @@
"deepseek-ai/DeepSeek-V2.5.description": "DeepSeek-V2.5 ist ein Upgrade von DeepSeek-V2-Chat und DeepSeek-Coder-V2-Instruct und kombiniert allgemeine und Programmierfähigkeiten. Es verbessert das Schreiben und das Befolgen von Anweisungen für eine bessere Präferenzanpassung und zeigt deutliche Fortschritte bei AlpacaEval 2.0, ArenaHard, AlignBench und MT-Bench.",
"deepseek-ai/DeepSeek-V3.1-Terminus.description": "DeepSeek-V3.1-Terminus ist ein aktualisiertes V3.1-Modell, das als hybrides Agenten-LLM positioniert ist. Es behebt gemeldete Probleme, verbessert die Stabilität und Sprachkonsistenz und reduziert gemischte chinesisch/englische Ausgaben sowie fehlerhafte Zeichen. Es integriert Denk- und Nicht-Denk-Modi mit Chat-Vorlagen für flexibles Umschalten. Zudem verbessert es die Leistung von Code- und Suchagenten für zuverlässigere Toolnutzung und mehrstufige Aufgaben.",
"deepseek-ai/DeepSeek-V3.1.description": "DeepSeek V3.1 verwendet eine hybride Denkarchitektur und unterstützt sowohl Denk- als auch Nicht-Denk-Modi.",
"deepseek-ai/DeepSeek-V3.2-Exp.description": "DeepSeek-V3.2-Exp ist eine experimentelle V3.2-Version, die zur nächsten Architektur überleitet. Sie ergänzt DeepSeek Sparse Attention (DSA) auf Basis von V3.1-Terminus zur Verbesserung von Training und Inferenz bei langen Kontexten. Optimiert für Toolnutzung, Dokumentenverständnis und mehrstufiges Denken ideal zur Erforschung effizienteren Denkens bei großem Kontextbudget.",
"deepseek-ai/DeepSeek-V3.2-Exp.description": "DeepSeek V3.2 Exp verwendet eine hybride Argumentationsarchitektur und unterstützt sowohl Denk- als auch Nicht-Denk-Modi.",
"deepseek-ai/DeepSeek-V3.2.description": "DeepSeek-V3.2 ist ein Modell, das hohe Rechenleistungseffizienz mit exzellenter Argumentation und Agentenleistung kombiniert. Sein Ansatz basiert auf drei wesentlichen technologischen Durchbrüchen: DeepSeek Sparse Attention (DSA), einem effizienten Aufmerksamkeitsmechanismus, der die Rechenkomplexität erheblich reduziert und gleichzeitig die Modellleistung beibehält, speziell optimiert für Langkontext-Szenarien; einem skalierbaren Reinforcement-Learning-Framework, durch das die Modellleistung mit GPT-5 konkurrieren kann, wobei die Hochleistungsvariante mit Gemini-3.0-Pro in Argumentationsfähigkeiten vergleichbar ist; und einer groß angelegten Agenten-Aufgabensynthese-Pipeline, die darauf abzielt, Argumentationsfähigkeiten in Werkzeugszenarien zu integrieren, um die Befolgung von Anweisungen und die Generalisierung in komplexen interaktiven Umgebungen zu verbessern. Das Modell erreichte Goldmedaillenleistungen bei der Internationalen Mathematik-Olympiade (IMO) und der Internationalen Informatik-Olympiade (IOI) 2025.",
"deepseek-ai/DeepSeek-V3.description": "DeepSeek-V3 ist ein MoE-Modell mit 671 Milliarden Parametern, das MLA und DeepSeekMoE mit verlustfreier Lastverteilung für effizientes Training und Inferenz nutzt. Vortrainiert auf 14,8B hochwertigen Tokens mit SFT und RL übertrifft es andere offene Modelle und nähert sich führenden geschlossenen Modellen an.",
"deepseek-ai/deepseek-llm-67b-chat.description": "DeepSeek LLM Chat (67B) ist ein innovatives Modell mit tiefem Sprachverständnis und Interaktionsfähigkeit.",
"deepseek-ai/deepseek-v3.1-terminus.description": "DeepSeek V3.1 ist ein Next-Gen-Denkmodell mit stärkerem komplexem Denken und Chain-of-Thought für tiefgreifende Analyseaufgaben.",
@@ -433,6 +435,7 @@
"deepseek_r1_distill_llama_70b.description": "DeepSeek-R1-Distill-Llama-70B ist ein destilliertes Modell basierend auf Llama-3.3-70B-Instruct. Als Teil der DeepSeek-R1-Serie ist es mit DeepSeek-R1-generierten Beispielen feinabgestimmt und zeigt starke Leistung in Mathematik, Programmierung und Schlussfolgerung.",
"deepseek_r1_distill_qwen_14b.description": "DeepSeek-R1-Distill-Qwen-14B ist ein destilliertes Modell basierend auf Qwen2.5-14B und wurde mit 800.000 kuratierten Beispielen von DeepSeek-R1 feinabgestimmt. Es liefert starke Schlussfolgerungsleistung.",
"deepseek_r1_distill_qwen_32b.description": "DeepSeek-R1-Distill-Qwen-32B ist ein destilliertes Modell basierend auf Qwen2.5-32B und wurde mit 800.000 kuratierten Beispielen von DeepSeek-R1 feinabgestimmt. Es überzeugt in Mathematik, Programmierung und Schlussfolgerung.",
"devstral-2512.description": "Devstral 2 ist ein unternehmensgerechtes Textmodell, das sich durch die Nutzung von Werkzeugen zur Erkundung von Codebasen, Bearbeitung mehrerer Dateien und Unterstützung von Softwareentwicklungsagenten auszeichnet.",
"devstral-2:123b.description": "Devstral 2 123B ist hervorragend im Einsatz von Tools zur Erkundung von Codebasen, Bearbeitung mehrerer Dateien und Unterstützung von Softwareentwicklungsagenten.",
"doubao-1.5-lite-32k.description": "Doubao-1.5-lite ist ein neues, leichtgewichtiges Modell mit ultraschneller Reaktionszeit, das erstklassige Qualität und geringe Latenz bietet.",
"doubao-1.5-pro-256k.description": "Doubao-1.5-pro-256k ist ein umfassendes Upgrade von Doubao-1.5-Pro mit einer Leistungssteigerung von 10 %. Es unterstützt ein Kontextfenster von 256k und bis zu 12k Ausgabetokens und bietet höhere Leistung, ein größeres Kontextfenster und ein starkes Preis-Leistungs-Verhältnis für vielfältige Anwendungsfälle.",
@@ -546,10 +549,10 @@
"gemini-2.5-pro-preview-06-05.description": "Gemini 2.5 Pro Preview ist Googles fortschrittlichstes Reasoning-Modell, das über Code, Mathematik und MINT-Probleme nachdenken und große Datensätze, Codebasen und Dokumente mit langem Kontext analysieren kann.",
"gemini-2.5-pro.description": "Gemini 2.5 Pro ist Googles fortschrittlichstes Reasoning-Modell, das über Code, Mathematik und MINT-Probleme nachdenken und große Datensätze, Codebasen und Dokumente mit langem Kontext analysieren kann.",
"gemini-3-flash-preview.description": "Gemini 3 Flash ist das intelligenteste Modell, das auf Geschwindigkeit ausgelegt ist es vereint modernste Intelligenz mit exzellenter Suchverankerung.",
"gemini-3-pro-image-preview.description": "Gemini 3 Pro Image (Nano Banana Pro) ist Googles Bildgenerierungsmodell mit Unterstützung für multimodale Dialoge.",
"gemini-3-pro-image-preview.description": "Gemini 3 Pro Image (Nano Banana Pro) ist Googles Bildgenerierungsmodell, das auch multimodale Dialoge unterstützt.",
"gemini-3-pro-image-preview:image.description": "Gemini 3 Pro Image (Nano Banana Pro) ist Googles Modell zur Bildgenerierung und unterstützt auch multimodale Konversationen.",
"gemini-3-pro-preview.description": "Gemini 3 Pro ist Googles leistungsstärkstes Agenten- und Vibe-Coding-Modell. Es bietet reichhaltigere visuelle Inhalte und tiefere Interaktionen auf Basis modernster logischer Fähigkeiten.",
"gemini-3.1-flash-image-preview.description": "Gemini 3.1 Flash Image (Nano Banana 2) liefert Bildqualität auf Pro-Niveau mit Flash-Geschwindigkeit und unterstützt multimodale Chats.",
"gemini-3.1-flash-image-preview.description": "Gemini 3.1 Flash Image (Nano Banana 2) ist Googles schnellstes natives Bildgenerierungsmodell mit Denkunterstützung, konversationaler Bildgenerierung und -bearbeitung.",
"gemini-3.1-flash-image-preview:image.description": "Gemini 3.1 Flash Image (Nano Banana 2) liefert Bildqualität auf Pro-Niveau mit Flash-Geschwindigkeit und unterstützt multimodale Chats.",
"gemini-3.1-pro-preview.description": "Gemini 3.1 Pro Preview verbessert Gemini 3 Pro mit erweiterten Fähigkeiten für logisches Denken und unterstützt mittleres Denklevel.",
"gemini-flash-latest.description": "Neueste Version von Gemini Flash",
@@ -605,19 +608,15 @@
"google/gemini-2.0-flash-lite-001.description": "Gemini 2.0 Flash Lite ist eine leichtgewichtige Gemini-Variante mit standardmäßig deaktiviertem Denkmodus zur Verbesserung von Latenz und Kosten kann jedoch über Parameter aktiviert werden.",
"google/gemini-2.0-flash-lite.description": "Gemini 2.0 Flash Lite bietet Next-Gen-Funktionen wie außergewöhnliche Geschwindigkeit, integrierte Werkzeugnutzung, multimodale Generierung und ein Kontextfenster von 1 Million Tokens.",
"google/gemini-2.0-flash.description": "Gemini 2.0 Flash ist Googles leistungsstarkes Reasoning-Modell für erweiterte multimodale Aufgaben.",
"google/gemini-2.5-flash-image-free.description": "Gemini 2.5 Flash Image in der kostenlosen Stufe mit begrenztem Kontingent für multimodale Generierung.",
"google/gemini-2.5-flash-image-preview.description": "Gemini 2.5 Flash ist ein experimentelles Modell mit Bildgenerierungsunterstützung.",
"google/gemini-2.5-flash-image.description": "Gemini 2.5 Flash Image (Nano Banana) ist Googles Bildgenerierungsmodell mit Unterstützung für multimodale Konversation.",
"google/gemini-2.5-flash-lite.description": "Gemini 2.5 Flash Lite ist die leichtgewichtige Variante von Gemini 2.5, optimiert für geringe Latenz und Kosten ideal für Szenarien mit hohem Durchsatz.",
"google/gemini-2.5-flash-preview.description": "Gemini 2.5 Flash ist Googles fortschrittlichstes Flaggschiffmodell für Reasoning, Programmierung, Mathematik und Wissenschaft. Es enthält einen integrierten Denkmodus für genauere Antworten und feinere Kontextverarbeitung.\n\nHinweis: Dieses Modell hat zwei Varianten mit und ohne Denkmodus. Die Ausgabekosten unterscheiden sich je nach aktivierter Denkfunktion. Wenn Sie die Standardvariante (ohne „:thinking“-Suffix) wählen, vermeidet das Modell explizit die Generierung von Denk-Tokens.\n\nUm Denkprozesse zu nutzen und Denk-Tokens zu erhalten, müssen Sie die „:thinking“-Variante auswählen, die höhere Ausgabekosten verursacht.\n\nGemini 2.5 Flash kann auch über den Parameter „max reasoning tokens“ konfiguriert werden (siehe Dokumentation: https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning).",
"google/gemini-2.5-flash-preview:thinking.description": "Gemini 2.5 Flash ist Googles fortschrittlichstes Flaggschiffmodell für Reasoning, Programmierung, Mathematik und Wissenschaft. Es enthält einen integrierten Denkmodus für genauere Antworten und feinere Kontextverarbeitung.\n\nHinweis: Dieses Modell hat zwei Varianten mit und ohne Denkmodus. Die Ausgabekosten unterscheiden sich je nach aktivierter Denkfunktion. Wenn Sie die Standardvariante (ohne „:thinking“-Suffix) wählen, vermeidet das Modell explizit die Generierung von Denk-Tokens.\n\nUm Denkprozesse zu nutzen und Denk-Tokens zu erhalten, müssen Sie die „:thinking“-Variante auswählen, die höhere Ausgabekosten verursacht.\n\nGemini 2.5 Flash kann auch über den Parameter „max reasoning tokens“ konfiguriert werden (siehe Dokumentation: https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning).",
"google/gemini-2.5-flash.description": "Gemini 2.5 Flash (Lite/Pro/Flash) ist Googles Modellfamilie mit Bandbreite von niedriger Latenz bis hin zu leistungsstarkem Reasoning.",
"google/gemini-2.5-pro-free.description": "Die kostenlose Stufe von Gemini 2.5 Pro bietet multimodale Langkontextverarbeitung mit begrenztem Kontingent ideal für Tests und leichte Arbeitsabläufe.",
"google/gemini-2.5-flash.description": "Gemini 2.5 Flash ist Googles Modellreihe, die von niedriger Latenz bis hin zu hochleistungsfähigem Argumentieren reicht.",
"google/gemini-2.5-pro-preview.description": "Gemini 2.5 Pro Preview ist Googles fortschrittlichstes Denkmodell für komplexe Aufgaben in Code, Mathematik und MINT-Fächern sowie zur Analyse großer Datensätze, Codebasen und Dokumente mit langem Kontext.",
"google/gemini-2.5-pro.description": "Gemini 2.5 Pro ist Googles Flaggschiffmodell für logisches Denken mit Langkontextunterstützung für komplexe Aufgaben.",
"google/gemini-3-pro-image-preview-free.description": "Kostenlose Stufe von Gemini 3 Pro Image mit begrenztem Kontingent für multimodale Generierung.",
"google/gemini-3-pro-image-preview.description": "Gemini 3 Pro Image (Nano Banana Pro) ist Googles Bildgenerierungsmodell mit Unterstützung für multimodale Konversation.",
"google/gemini-3-pro-preview-free.description": "Gemini 3 Pro Preview Free bietet dieselben multimodalen Verständnis- und Denkfähigkeiten wie die Standardversion, jedoch mit Kontingent- und Ratenbeschränkungen ideal für Tests und seltene Nutzung.",
"google/gemini-3-pro-preview.description": "Gemini 3 Pro ist das nächste Generationenmodell für multimodales Denken innerhalb der Gemini-Familie. Es versteht Text, Audio, Bilder und Videos und bewältigt komplexe Aufgaben sowie große Codebasen.",
"google/gemini-embedding-001.description": "Ein hochmodernes Embedding-Modell mit starker Leistung in Englisch, Mehrsprachigkeit und Code-Aufgaben.",
"google/gemini-flash-1.5.description": "Gemini 1.5 Flash bietet optimierte multimodale Verarbeitung für eine Vielzahl komplexer Aufgaben.",
@@ -717,15 +716,24 @@
"hunyuan-a13b.description": "Das erste hybride Denkmodell von Hunyuan, aufgerüstet von hunyuan-standard-256K (80B gesamt, 13B aktiv). Standardmäßig im langsamen Denkmodus, unterstützt Umschaltung zwischen schnell/langsam über Parameter oder Präfix /no_think. Insgesamt verbesserte Fähigkeiten gegenüber der vorherigen Generation, insbesondere in Mathematik, Wissenschaft, Langtextverständnis und Agentenaufgaben.",
"hunyuan-code.description": "Das neueste Code-Modell von Hunyuan, trainiert mit 200 Milliarden hochwertigen Code-Daten plus sechs Monaten SFT-Daten, mit 8K Kontext. Es rangiert nahe der Spitze in automatisierten Code-Benchmarks und in Expertenbewertungen über fünf Sprachen hinweg.",
"hunyuan-functioncall.description": "Das neueste MoE FunctionCall-Modell von Hunyuan, trainiert mit hochwertigen Werkzeugaufruf-Daten, mit einem 32K Kontextfenster und führenden Benchmarks über verschiedene Dimensionen.",
"hunyuan-large-longcontext.description": "Hervorragend bei Langdokumentaufgaben wie Zusammenfassungen und QA, während es auch allgemeine Generierungsaufgaben bewältigt. Stark in der Analyse und Generierung von langen, komplexen und detaillierten Inhalten.",
"hunyuan-large.description": "Hunyuan-large hat ~389 Milliarden Gesamtparameter und ~52 Milliarden aktivierte, das größte und stärkste offene MoE-Modell in einer Transformer-Architektur.",
"hunyuan-lite.description": "Aufgerüstet auf eine MoE-Architektur mit 256K Kontextfenster, führend gegenüber vielen offenen Modellen in NLP, Code, Mathematik und Branchenbenchmarks.",
"hunyuan-pro.description": "MoE-Modell mit Billionenparametern und 32K Kontext, führend in Benchmarks, stark bei komplexen Anweisungen und logischem Denken, fortgeschrittener Mathematik, Funktionsaufrufen und optimiert für mehrsprachige Übersetzung, Finanzen, Recht und Medizin.",
"hunyuan-role.description": "Das neueste Rollenspiel-Modell von Hunyuan, offiziell mit Rollenspiel-Daten feinabgestimmt, bietet stärkere Basisleistung in Rollenspiel-Szenarien.",
"hunyuan-standard-256K.description": "Verwendet verbessertes Routing, um Lastenausgleich und Expertenzusammenbruch zu mildern. Langtext-\"Nadel im Heuhaufen\" erreicht 99,9%. MOE-256K erweitert die Eingabelänge und Qualität erheblich.",
"hunyuan-standard.description": "Verwendet verbessertes Routing, um Lastenausgleich und Expertenzusammenbruch zu mildern. Langtext-\"Nadel im Heuhaufen\" erreicht 99,9%. MOE-32K bietet ein besseres Preis-Leistungs-Verhältnis bei gleichzeitiger Balance von Qualität und Preis für Langtexteingaben.",
"hunyuan-standard-256K.description": "Verwendet verbessertes Routing, um Lastenausgleich und Expertenzusammenbruch zu mindern. Erreicht 99,9 % Nadel-im-Heuhaufen bei Langkontext. MOE-256K erweitert die Kontextlänge und -qualität weiter.",
"hunyuan-standard.description": "Verwendet verbessertes Routing, um Lastenausgleich und Expertenzusammenbruch zu mindern. Erreicht 99,9 % Nadel-im-Heuhaufen bei Langkontext. MOE-32K bietet starken Wert bei der Verarbeitung langer Eingaben.",
"hunyuan-t1-20250321.description": "Baut ausgewogene Kunst- und MINT-Fähigkeiten auf mit starker Informationsaufnahme bei langen Texten. Unterstützt Argumentationsantworten für Mathematik-, Logik-, Wissenschafts- und Programmierprobleme auf verschiedenen Schwierigkeitsstufen.",
"hunyuan-t1-20250403.description": "Verbessert die Codegenerierung auf Projektebene und die Schreibqualität, stärkt das Verständnis von mehrstufigen Themen und die Befolgung von ToB-Anweisungen, verbessert das Wortverständnis und reduziert Probleme mit gemischten vereinfachten/traditionellen und chinesischen/englischen Ausgaben.",
"hunyuan-t1-20250529.description": "Verbessert kreatives Schreiben und Komposition, stärkt Frontend-Codierung, Mathematik- und Logikargumentation und verbessert die Befolgung von Anweisungen.",
"hunyuan-t1-20250711.description": "Verbessert stark schwierige Mathematik-, Logik- und Programmieraufgaben, steigert die Stabilität der Ausgaben und verbessert die Fähigkeit zu langen Texten.",
"hunyuan-t1-latest.description": "Verbessert das langsame Denkmodell deutlich bei schwieriger Mathematik, komplexem logischen Denken, anspruchsvoller Programmierung, Befolgung von Anweisungen und kreativer Schreibqualität.",
"hunyuan-t1-vision-20250916.description": "Neuestes t1-vision Modell mit großen Fortschritten in VQA, visueller Verankerung, OCR, Diagrammen, Lösung fotografierter Aufgaben und bildbasierter Kreation sowie stärkerem Englisch und Unterstützung für ressourcenschwache Sprachen.",
"hunyuan-turbo-20241223.description": "Diese Version verbessert die Skalierung von Anweisungen für bessere Generalisierung, verbessert die Argumentation in Mathematik/Code/Logik erheblich, stärkt das Wortverständnis und verbessert die Schreibqualität.",
"hunyuan-turbo-latest.description": "Allgemeine Verbesserungen der NLP-Verständnis-, Schreib-, Chat-, QA-, Übersetzungs- und Domänenfähigkeiten; menschlichere Antworten, bessere Klärung bei unklarer Absicht, verbessertes Wortparsing, höhere kreative Qualität und Interaktivität sowie stärkere mehrstufige Gespräche.",
"hunyuan-turbo.description": "Vorschau auf Hunyuans LLM der nächsten Generation mit neuer MoE-Architektur, liefert schnelleres Denken und bessere Ergebnisse als hunyuan-pro.",
"hunyuan-turbos-latest.description": "Das neueste Hunyuan TurboS-Flaggschiffmodell mit stärkerem logischen Denken und insgesamt besserer Nutzererfahrung.",
"hunyuan-turbos-longtext-128k-20250325.description": "Hervorragend bei Langdokumentaufgaben wie Zusammenfassungen und QA, während es auch allgemeine Generierungsaufgaben bewältigt. Stark in der Analyse und Generierung von langen, komplexen und detaillierten Inhalten.",
"hunyuan-vision-1.5-instruct.description": "Ein schnelles Denkmodell für Bild-zu-Text, basierend auf der TurboS-Textbasis, mit bemerkenswerten Verbesserungen gegenüber der vorherigen Version in grundlegender Bilderkennung und Bildanalyse.",
"hunyuan-vision.description": "Das neueste multimodale Modell von Hunyuan unterstützt Bild- und Texteingaben zur Textgenerierung.",
"image-01-live.description": "Ein Bildgenerierungsmodell mit feinen Details, das Text-zu-Bild-Generierung und steuerbare Stilvorgaben unterstützt.",
@@ -770,8 +778,7 @@
"kimi-k2:1t.description": "Kimi K2 ist ein großes MoE-LLM von Moonshot AI mit insgesamt 1T Parametern und 32B aktiven pro Durchlauf. Es ist für Agentenfunktionen wie fortgeschrittene Werkzeugnutzung, logisches Denken und Codegenerierung optimiert.",
"kimi-latest.description": "Kimi Latest verwendet das neueste Kimi-Modell und kann experimentelle Funktionen enthalten. Es unterstützt Bildverständnis und wählt automatisch 8k/32k/128k-Abrechnungsmodelle basierend auf der Kontextlänge.",
"kuaishou/kat-coder-pro-v1.description": "KAT-Coder-Pro-V1 (zeitlich begrenzt kostenlos) konzentriert sich auf Codeverständnis und Automatisierung für effiziente Programmieragenten.",
"learnlm-1.5-pro-experimental.description": "LearnLM ist ein experimentelles, aufgabenorientiertes Modell, das auf Prinzipien der Lernwissenschaft basiert. Es folgt Systemanweisungen in Lehr-/Lernszenarien und agiert als Expertentutor.",
"learnlm-2.0-flash-experimental.description": "LearnLM ist ein experimentelles, aufgabenorientiertes Modell, das auf Prinzipien der Lernwissenschaft basiert. Es folgt Systemanweisungen in Lehr-/Lernszenarien und agiert als Expertentutor.",
"labs-devstral-small-2512.description": "Devstral Small 2 zeichnet sich durch die Nutzung von Werkzeugen zur Erkundung von Codebasen, Bearbeitung mehrerer Dateien und Unterstützung von Softwareentwicklungsagenten aus.",
"lite.description": "Spark Lite ist ein leichtgewichtiges LLM mit extrem niedriger Latenz und effizienter Verarbeitung. Es ist vollständig kostenlos und unterstützt Echtzeit-Websuche. Dank schneller Reaktionszeiten eignet es sich gut für Geräte mit geringer Rechenleistung und Modellanpassung ideal für Wissensfragen, Inhaltserstellung und Suchszenarien.",
"llama-3.1-70b-versatile.description": "Llama 3.1 70B bietet verbessertes logisches Denken für komplexe Anwendungen und unterstützt rechenintensive Aufgaben mit hoher Effizienz und Genauigkeit.",
"llama-3.1-8b-instant.description": "Llama 3.1 8B ist ein hocheffizientes Modell mit schneller Textgenerierung ideal für großflächige, kosteneffiziente Anwendungen.",
@@ -782,7 +789,6 @@
"llama-3.2-90b-vision-preview.description": "Llama 3.2 ist für Aufgaben konzipiert, die Vision und Text kombinieren. Es glänzt bei Bildbeschreibungen und visuellen Fragen und verbindet Sprachgenerierung mit visuellem Denken.",
"llama-3.2-vision-instruct.description": "Das auf Anweisungen abgestimmte Modell Llama 3.2-Vision ist für visuelle Erkennung, Bildverständnis, Bildbeschreibungen und allgemeine Bildfragen optimiert.",
"llama-3.3-70b-versatile.description": "Meta Llama 3.3 ist ein mehrsprachiges LLM mit 70B Parametern (Text in/Text out) und bietet vortrainierte sowie anweisungsoptimierte Varianten. Die textbasierte, anweisungsoptimierte Version ist für mehrsprachige Dialoge optimiert und übertrifft viele offene und geschlossene Chatmodelle in gängigen Benchmarks.",
"llama-3.3-70b.description": "Llama 3.3 70B: ein mittelgroßes bis großes Llama-Modell mit ausgewogenem Verhältnis zwischen logischem Denken und Durchsatz.",
"llama-3.3-instruct.description": "Das auf Anweisungen abgestimmte Modell Llama 3.3 ist für Chat optimiert und übertrifft viele offene Chatmodelle in gängigen Branchenbenchmarks.",
"llama3-70b-8192.description": "Meta Llama 3 70B bietet außergewöhnliche Komplexitätsbewältigung für anspruchsvolle Projekte.",
"llama3-8b-8192.description": "Meta Llama 3 8B liefert starke Leistungen im logischen Denken für vielfältige Szenarien.",
@@ -832,7 +838,6 @@
"meta-llama/llama-3.1-8b-instruct:free.description": "LLaMA 3.1 bietet mehrsprachige Unterstützung und gehört zu den führenden generativen Modellen.",
"meta-llama/llama-3.2-11b-vision-instruct.description": "LLaMA 3.2 wurde für Aufgaben entwickelt, die Vision und Text kombinieren. Es glänzt bei der Bildbeschreibung und visuellen Fragebeantwortung und schlägt eine Brücke zwischen Sprachgenerierung und visuellem Denken.",
"meta-llama/llama-3.2-3b-instruct.description": "meta-llama/llama-3.2-3b-instruct",
"meta-llama/llama-3.2-90b-vision-instruct.description": "LLaMA 3.2 wurde für Aufgaben entwickelt, die Vision und Text kombinieren. Es glänzt bei der Bildbeschreibung und visuellen Fragebeantwortung und schlägt eine Brücke zwischen Sprachgenerierung und visuellem Denken.",
"meta-llama/llama-3.3-70b-instruct.description": "Llama 3.3 ist das fortschrittlichste mehrsprachige Open-Source-Modell der Llama-Reihe und bietet nahezu 405B-Leistung zu sehr niedrigen Kosten. Es basiert auf der Transformer-Architektur und wurde mit SFT und RLHF für Nützlichkeit und Sicherheit optimiert. Die instruktionstunierte Version ist für mehrsprachige Chats optimiert und übertrifft viele offene und geschlossene Chatmodelle in Branchenbenchmarks. Wissensstand: Dezember 2023.",
"meta-llama/llama-3.3-70b-instruct:free.description": "Llama 3.3 ist das fortschrittlichste mehrsprachige Open-Source-Modell der Llama-Reihe und bietet nahezu 405B-Leistung zu sehr niedrigen Kosten. Es basiert auf der Transformer-Architektur und wurde mit SFT und RLHF für Nützlichkeit und Sicherheit optimiert. Die instruktionstunierte Version ist für mehrsprachige Chats optimiert und übertrifft viele offene und geschlossene Chatmodelle in Branchenbenchmarks. Wissensstand: Dezember 2023.",
"meta.llama3-1-405b-instruct-v1:0.description": "Meta Llama 3.1 405B Instruct ist das größte und leistungsstärkste Llama 3.1 Instruct-Modell ein hochentwickeltes Modell für Dialogverständnis und Generierung synthetischer Daten sowie eine starke Grundlage für domänenspezifisches Pretraining oder Fine-Tuning. Die mehrsprachigen Llama 3.1 LLMs sind vortrainierte und instruktionstunierte Generierungsmodelle in den Größen 8B, 70B und 405B (Text in/Text out). Die instruktionstunierten Textmodelle sind für mehrsprachige Dialoge optimiert und übertreffen viele verfügbare offene Chatmodelle in gängigen Benchmarks. Llama 3.1 ist für kommerzielle und wissenschaftliche Nutzung über Sprachgrenzen hinweg konzipiert. Instruktionstunierte Modelle eignen sich für assistentenähnliche Chats, während vortrainierte Modelle breitere Aufgaben der Sprachgenerierung abdecken. Die Ausgaben von Llama 3.1 können auch zur Verbesserung anderer Modelle verwendet werden, z.B. zur Generierung und Verfeinerung synthetischer Daten. Llama 3.1 ist ein autoregressives Transformer-Modell mit optimierter Architektur. Die tunierten Versionen nutzen überwachtes Fine-Tuning (SFT) und Reinforcement Learning aus menschlichem Feedback (RLHF), um sich an menschliche Präferenzen hinsichtlich Nützlichkeit und Sicherheit anzupassen.",
@@ -894,7 +899,7 @@
"mistral-large-instruct.description": "Mistral-Large-Instruct-2407 ist ein fortschrittliches dichtes LLM mit 123 Milliarden Parametern und modernstem logischen Denken, Wissen und Programmierfähigkeiten.",
"mistral-large-latest.description": "Mistral Large ist das Flaggschiffmodell, stark in mehrsprachigen Aufgaben, komplexem logischen Denken und Codegenerierung ideal für anspruchsvolle Anwendungen.",
"mistral-large.description": "Mixtral Large ist das Flaggschiffmodell von Mistral, das Codegenerierung, Mathematik und logisches Denken mit einem Kontextfenster von 128K kombiniert.",
"mistral-medium-latest.description": "Mistral Medium 3 bietet modernste Leistung bei achtfach geringeren Kosten und vereinfacht die Unternehmensbereitstellung.",
"mistral-medium-latest.description": "Mistral Medium 3.1 liefert erstklassige Leistung bei 8× geringeren Kosten und vereinfacht die Unternehmensbereitstellung.",
"mistral-nemo-instruct.description": "Mistral-Nemo-Instruct-2407 ist die instruktionstaugliche Version von Mistral-Nemo-Base-2407.",
"mistral-nemo.description": "Mistral Nemo ist ein hocheffizientes 12B-Modell von Mistral AI und NVIDIA.",
"mistral-small-latest.description": "Mistral Small ist eine kosteneffiziente, schnelle und zuverlässige Option für Übersetzung, Zusammenfassung und Sentimentanalyse.",
@@ -933,7 +938,7 @@
"moonshot-v1-auto.description": "Moonshot V1 Auto wählt automatisch das passende Modell basierend auf der aktuellen Token-Nutzung im Kontext aus.",
"moonshotai/Kimi-Dev-72B.description": "Kimi-Dev-72B ist ein quelloffenes Code-LLM, das mit großflächigem RL optimiert wurde, um robuste, produktionsreife Patches zu erzeugen. Es erreicht 60,4 % auf SWE-bench Verified und setzt damit einen neuen Rekord für Open-Modelle bei automatisierten Softwareentwicklungsaufgaben wie Bugfixing und Code-Review.",
"moonshotai/Kimi-K2-Instruct-0905.description": "Kimi K2-Instruct-0905 ist das neueste und leistungsstärkste Modell der Kimi K2-Reihe. Es handelt sich um ein MoE-Spitzenmodell mit insgesamt 1T und 32B aktiven Parametern. Zu den Hauptmerkmalen gehören eine stärkere agentenbasierte Codierungsintelligenz mit deutlichen Verbesserungen bei Benchmarks und realen Agentenaufgaben sowie eine verbesserte Ästhetik und Benutzerfreundlichkeit im Frontend-Code.",
"moonshotai/Kimi-K2-Thinking.description": "Kimi K2 Thinking ist das neueste und leistungsstärkste quelloffene Modell für Denkprozesse. Es erweitert die Tiefe des mehrstufigen Denkens erheblich und ermöglicht eine stabile Werkzeugnutzung über 200300 aufeinanderfolgende Aufrufe hinweg. Es setzt neue Maßstäbe bei Humanity's Last Exam (HLE), BrowseComp und anderen Benchmarks. Es glänzt in den Bereichen Programmierung, Mathematik, Logik und Agentenszenarien. Basierend auf einer MoE-Architektur mit ~1T Gesamtparametern unterstützt es ein Kontextfenster von 256K und Tool-Aufrufe.",
"moonshotai/Kimi-K2-Thinking.description": "Kimi K2 Thinking ist das neueste und leistungsstärkste Open-Source-Denkmodell. Es erweitert die Tiefe des mehrstufigen Denkens erheblich und gewährleistet stabile Werkzeugnutzung über 200300 aufeinanderfolgende Aufrufe, wobei neue Rekorde bei Humanity's Last Exam (HLE), BrowseComp und anderen Benchmarks aufgestellt werden. Es zeichnet sich in den Bereichen Programmierung, Mathematik, Logik und Agentenszenarien aus. Basierend auf einer MoE-Architektur mit ~1 Billion Gesamtparametern unterstützt es ein 256K-Kontextfenster und Werkzeugaufrufe.",
"moonshotai/kimi-k2-0711.description": "Kimi K2 0711 ist die Instruct-Variante der Kimi-Serie, geeignet für hochwertigen Code und Werkzeugnutzung.",
"moonshotai/kimi-k2-0905.description": "Kimi K2 0905 ist ein Update mit erweitertem Kontext und verbesserter Denkfähigkeit sowie Optimierungen für die Programmierung.",
"moonshotai/kimi-k2-instruct-0905.description": "Das Modell kimi-k2-0905-preview unterstützt ein Kontextfenster von 256K, bietet stärkere agentenbasierte Codierung, ausgereifteren und praxisnahen Frontend-Code sowie ein besseres Kontextverständnis.",
@@ -948,8 +953,8 @@
"nvidia/Llama-3.1-Nemotron-70B-Instruct-HF.description": "Llama 3.1 Nemotron 70B ist ein von NVIDIA angepasstes LLM zur Verbesserung der Nützlichkeit. Es erzielt Spitzenwerte bei Arena Hard, AlpacaEval 2 LC und GPT-4-Turbo MT-Bench und belegt am 1. Oktober 2024 Platz 1 in allen drei Auto-Alignment-Benchmarks. Es wurde aus Llama-3.1-70B-Instruct mithilfe von RLHF (REINFORCE), Llama-3.1-Nemotron-70B-Reward und HelpSteer2-Preference-Prompts trainiert.",
"nvidia/llama-3.1-nemotron-51b-instruct.description": "Ein einzigartiges Sprachmodell mit außergewöhnlicher Genauigkeit und Effizienz.",
"nvidia/llama-3.1-nemotron-70b-instruct.description": "Llama-3.1-Nemotron-70B-Instruct ist ein von NVIDIA entwickeltes Modell zur Verbesserung der Nützlichkeit von LLM-Antworten.",
"o1-mini.description": "Kleiner und schneller als o1-preview, 80% geringere Kosten, stark bei Codegenerierung und Aufgaben mit kurzem Kontext.",
"o1-preview.description": "Fokussiert auf fortgeschrittenes Denken und komplexe Problemlösung, einschließlich Mathematik und Naturwissenschaften. Ideal für Anwendungen mit tiefem Kontextverständnis und autonomen Workflows.",
"o1-mini.description": "o1-mini ist ein schnelles, kosteneffizientes Argumentationsmodell, das für Programmierung, Mathematik und Wissenschaft entwickelt wurde. Es hat einen 128K-Kontext und einen Wissensstand von Oktober 2023.",
"o1-preview.description": "o1 ist OpenAIs neues Argumentationsmodell für komplexe Aufgaben, die breites Wissen erfordern. Es hat einen 128K-Kontext und einen Wissensstand von Oktober 2023.",
"o1-pro.description": "Die o1-Serie wurde mit Reinforcement Learning trainiert, um vor der Antwort zu denken und komplexe Denkprozesse zu bewältigen. o1-pro nutzt mehr Rechenleistung für tiefere Überlegungen und liefert konsistent hochwertigere Antworten.",
"o1.description": "o1 ist OpenAIs neues Modell für Denkprozesse mit Text- und Bildeingabe sowie Textausgabe geeignet für komplexe Aufgaben mit breitem Wissen. Es verfügt über ein Kontextfenster von 200K und einen Wissensstand von Oktober 2023.",
"o3-2025-04-16.description": "o3 ist OpenAIs neues Modell für logisches Denken mit Text+Bild-Eingabe und Textausgabe für komplexe Aufgaben, die breites Wissen erfordern.",
@@ -1022,7 +1027,6 @@
"qianfan-check-vl.description": "Qianfan Check VL ist ein multimodales Modell zur Inhaltsprüfung für Bild-Text-Konformität und Erkennungsaufgaben.",
"qianfan-composition.description": "Qianfan Composition ist ein multimodales Kreativmodell für gemischtes Bild-Text-Verständnis und -Generierung.",
"qianfan-engcard-vl.description": "Qianfan EngCard VL ist ein multimodales Erkennungsmodell mit Fokus auf englischsprachige Szenarien.",
"qianfan-lightning-128b-a19b.description": "Qianfan Lightning 128B A19B ist ein leistungsstarkes chinesisches Allzweckmodell für komplexe QA und groß angelegte Schlussfolgerungen.",
"qianfan-llama-vl-8b.description": "Qianfan Llama VL 8B ist ein auf Llama basierendes multimodales Modell für allgemeines Bild-Text-Verständnis.",
"qianfan-multipicocr.description": "Qianfan MultiPicOCR ist ein OCR-Modell für mehrere Bilder zur Texterkennung und -extraktion über verschiedene Bilder hinweg.",
"qianfan-qi-vl.description": "Qianfan QI VL ist ein multimodales QA-Modell für präzise Informationsabfrage und QA in komplexen Bild-Text-Szenarien.",
@@ -1032,7 +1036,6 @@
"qvq-72b-preview.description": "QVQ-72B-Preview ist ein experimentelles Forschungsmodell von Qwen mit Fokus auf verbesserte visuelle Schlussfolgerung.",
"qvq-max.description": "Qwen QVQ ist ein Modell für visuelle Schlussfolgerung mit Bildinput und Chain-of-Thought-Ausgabe, mit starker Leistung in Mathematik, Programmierung, visueller Analyse, Kreativität und allgemeinen Aufgaben.",
"qvq-plus.description": "Modell für visuelle Schlussfolgerung mit Bildinput und Chain-of-Thought-Ausgabe. Die qvq-plus-Serie folgt auf qvq-max und bietet schnellere Schlussfolgerung bei besserem Verhältnis von Qualität zu Kosten.",
"qwen-3-32b.description": "Qwen 3 32B: stark in mehrsprachigen und Programmieraufgaben, geeignet für mittlere Produktionsszenarien.",
"qwen-coder-plus.description": "Qwen-Code-Modell.",
"qwen-coder-turbo-latest.description": "Qwen-Code-Modell.",
"qwen-coder-turbo.description": "Qwen-Code-Modell.",
@@ -1128,7 +1131,6 @@
"qwen3-coder-next.description": "Next-Gen Qwen-Coder optimiert für komplexe Multi-Datei-Codegenerierung, Debugging und hochdurchsatzfähige Agenten-Workflows. Entwickelt für starke Werkzeugintegration und verbesserte Leistung im logischen Denken.",
"qwen3-coder-plus.description": "Qwen-Code-Modell. Die neueste Qwen3-Coder-Serie basiert auf Qwen3 und bietet starke Fähigkeiten für Coding-Agenten, Werkzeugnutzung und Interaktion mit Umgebungen für autonomes Programmieren, mit exzellenter Codeleistung und solider Allgemeinkompetenz.",
"qwen3-coder:480b.description": "Alibabas leistungsstarkes Langkontextmodell für Agenten- und Programmieraufgaben.",
"qwen3-max-2026-01-23.description": "Qwen3 Max-Modelle bieten große Fortschritte gegenüber der 2.5-Serie in allgemeinen Fähigkeiten, chinesisch/englischem Verständnis, komplexer Befehlsverarbeitung, offenen subjektiven Aufgaben, Mehrsprachigkeit und Werkzeugnutzung mit weniger Halluzinationen. Die neueste Version verbessert agentenbasiertes Programmieren und Werkzeugnutzung gegenüber qwen3-max-preview. Diese Veröffentlichung erreicht SOTA in ihrem Bereich und zielt auf komplexere Agentenanforderungen ab.",
"qwen3-max-preview.description": "Leistungsstärkstes Qwen-Modell für komplexe, mehrstufige Aufgaben. Die Vorschau unterstützt Denkprozesse.",
"qwen3-max.description": "Qwen3 Max-Modelle bieten große Fortschritte gegenüber der 2.5-Serie in allgemeiner Fähigkeit, chinesisch/englischem Verständnis, komplexer Anweisungsbefolgung, offenen subjektiven Aufgaben, Mehrsprachigkeit und Werkzeugnutzung bei weniger Halluzinationen. Das neueste qwen3-max verbessert agentisches Programmieren und Werkzeugnutzung gegenüber qwen3-max-preview. Diese Version erreicht SOTA-Niveau und zielt auf komplexere Agentenanforderungen.",
"qwen3-next-80b-a3b-instruct.description": "Nächste Generation des Qwen3 Open-Source-Modells ohne Denkfunktion. Im Vergleich zur vorherigen Version (Qwen3-235B-A22B-Instruct-2507) bietet es besseres chinesisches Verständnis, stärkere logische Schlussfolgerung und verbesserte Textgenerierung.",
@@ -1145,7 +1147,8 @@
"qwen3-vl-flash.description": "Qwen3 VL Flash: leichtgewichtige, hochschnelle Denkversion für latenzempfindliche oder hochvolumige Anfragen.",
"qwen3-vl-plus.description": "Qwen VL ist ein Textgenerierungsmodell mit Bildverständnis. Es kann OCR durchführen sowie zusammenfassen und schlussfolgern, z.B. Attribute aus Produktfotos extrahieren oder Probleme aus Bildern lösen.",
"qwen3.5-397b-a17b.description": "Unterstützt Text-, Bild- und Videoeingaben. Für reine Textaufgaben ist die Leistung vergleichbar mit Qwen3 Max, bietet jedoch höhere Effizienz und niedrigere Kosten. In multimodalen Fähigkeiten bietet es signifikante Verbesserungen gegenüber der Qwen3 VL-Serie.",
"qwen3.5-plus.description": "Qwen3.5 Plus unterstützt Text-, Bild- und Videoeingaben. Für reine Textaufgaben ist die Leistung vergleichbar mit Qwen3 Max, während es bessere Effizienz und niedrigere Kosten bietet. In Bezug auf multimodale Fähigkeiten zeigt es signifikante Verbesserungen gegenüber der Qwen3 VL-Serie.",
"qwen3.5-plus.description": "Qwen3.5 Plus unterstützt Text-, Bild- und Videoeingaben. Seine Leistung bei reinen Textaufgaben ist vergleichbar mit Qwen3 Max, mit besserer Leistung und geringeren Kosten. Seine multimodalen Fähigkeiten sind im Vergleich zur Qwen3 VL-Serie erheblich verbessert.",
"qwen3.5:397b.description": "Qwen3.5 ist ein einheitliches Vision-Language-Grundlagenmodell mit einer hybriden Architektur (Mixture-of-Experts + lineare Aufmerksamkeit), das starke multimodale Argumentations-, Programmier- und Langkontextfähigkeiten mit einem 256K-Kontextfenster bietet.",
"qwen3.description": "Qwen3 ist Alibabas nächste Generation eines großen Sprachmodells mit starker Leistung in vielfältigen Anwendungsfällen.",
"qwq-32b-preview.description": "QwQ ist ein experimentelles Forschungsmodell von Qwen mit Fokus auf verbesserte Schlussfolgerungen.",
"qwq-32b.description": "QwQ ist ein Schlussfolgerungsmodell aus der Qwen-Familie. Im Vergleich zu standardmäßig instruktionstunierten Modellen bietet es überlegene Denk- und Schlussfolgerungsfähigkeiten, die die Leistung bei nachgelagerten Aufgaben deutlich steigern insbesondere bei komplexen Problemen. QwQ-32B ist ein mittelgroßes Modell, das mit führenden Schlussfolgerungsmodellen wie DeepSeek-R1 und o1-mini konkurriert.",
@@ -1187,7 +1190,7 @@
"step-2-16k.description": "Unterstützt Interaktionen mit großem Kontext für komplexe Dialoge.",
"step-2-mini.description": "Basierend auf der nächsten Generation der internen MFA-Attention-Architektur liefert es Ergebnisse auf Step-1-Niveau bei deutlich geringeren Kosten, höherem Durchsatz und geringerer Latenz. Bewältigt allgemeine Aufgaben mit starker Programmierleistung.",
"step-2x-large.description": "Ein neues StepFun-Bildmodell der nächsten Generation mit Fokus auf Bildgenerierung. Es erzeugt hochwertige Bilder aus Texteingaben mit realistischeren Texturen und besserer Darstellung chinesischer/englischer Texte.",
"step-3.5-flash.description": "Das Flaggschiff-Sprachmodell für logisches Denken von Stepfun. Dieses Modell bietet erstklassige Fähigkeiten im logischen Denken sowie schnelle und zuverlässige Ausführung. Es kann komplexe Aufgaben zerlegen und planen, Werkzeuge schnell und zuverlässig aufrufen, und in logischem Denken, Mathematik, Softwareentwicklung, tiefgehender Forschung und anderen anspruchsvollen Aufgaben herausragend sein. Die Kontextlänge beträgt 256K.",
"step-3.5-flash.description": "Stepfuns Flaggschiff-Sprachargumentationsmodell. Dieses Modell verfügt über erstklassige Argumentationsfähigkeiten und schnelle sowie zuverlässige Ausführungskapazitäten. Es kann komplexe Aufgaben wie logisches Denken, Mathematik, Softwareentwicklung und tiefgehende Forschung zerlegen und planen, Werkzeuge schnell und zuverlässig aufrufen, um Aufgaben auszuführen, und ist in verschiedenen komplexen Aufgaben kompetent.",
"step-3.description": "Dieses Modell verfügt über starke visuelle Wahrnehmung und komplexe Schlussfolgerungsfähigkeiten. Es verarbeitet domänenübergreifendes Wissen, analysiert Mathematik und visuelle Inhalte gemeinsam und bewältigt eine Vielzahl alltäglicher visueller Analyseaufgaben.",
"step-r1-v-mini.description": "Ein Schlussfolgerungsmodell mit starkem Bildverständnis, das Bilder und Texte verarbeiten und anschließend durch tiefes Denken Text generieren kann. Es glänzt im visuellen Denken und liefert Spitzenleistungen in Mathematik, Programmierung und Textverständnis mit einem Kontextfenster von 100K.",
"stepfun-ai/step3.description": "Step3 ist ein hochmodernes multimodales Schlussfolgerungsmodell von StepFun, basierend auf einer MoE-Architektur mit insgesamt 321B und 38B aktiven Parametern. Sein End-to-End-Design minimiert die Dekodierungskosten und liefert erstklassige Vision-Language-Schlussfolgerungen. Dank MFA- und AFD-Design bleibt es sowohl auf High-End- als auch auf Low-End-Beschleunigern effizient. Das Pretraining umfasst über 20T Text-Tokens und 4T Bild-Text-Tokens in vielen Sprachen. Es erreicht führende Leistungen bei offenen Modellen in Mathematik, Code und multimodalen Benchmarks.",
@@ -1276,10 +1279,11 @@
"z-ai/glm4.7.description": "GLM-4.7 ist das neueste Flaggschiff-Modell von Zhipu, optimiert für Agentic-Coding-Szenarien mit verbesserten Codierungsfähigkeiten.",
"z-ai/glm5.description": "GLM-5 ist das neue Flaggschiff-Grundlagenmodell von Zhipu AI für Agenten-Engineering, das Open-Source-SOTA-Leistung in Codierung und Agentenfähigkeiten erreicht. Es entspricht der Leistung von Claude Opus 4.5.",
"z-image-turbo.description": "Z-Image ist ein leichtgewichtiges Text-zu-Bild-Generierungsmodell, das schnell Bilder erzeugen kann, sowohl chinesische als auch englische Textrendering unterstützt und sich flexibel an verschiedene Auflösungen und Seitenverhältnisse anpasst.",
"zai-glm-4.7.description": "Dieses Modell liefert starke Programmierleistungen mit fortschrittlichen Argumentationsfähigkeiten, überlegener Werkzeugnutzung und verbesserter realer Leistung in agentenbasierten Programmieranwendungen.",
"zai-org/GLM-4.5-Air.description": "GLM-4.5-Air ist ein Basismodell für Agentenanwendungen mit Mixture-of-Experts-Architektur. Es ist optimiert für Toolnutzung, Web-Browsing, Softwareentwicklung und Frontend-Codierung und integriert sich mit Code-Agenten wie Claude Code und Roo Code. Es nutzt hybrides Reasoning für komplexe und alltägliche Szenarien.",
"zai-org/GLM-4.5.description": "GLM-4.5 ist ein Basismodell für Agentenanwendungen mit Mixture-of-Experts-Architektur. Es ist tiefgreifend optimiert für Toolnutzung, Web-Browsing, Softwareentwicklung und Frontend-Codierung und integriert sich mit Code-Agenten wie Claude Code und Roo Code. Es nutzt hybrides Reasoning für komplexe und alltägliche Szenarien.",
"zai-org/GLM-4.5V.description": "GLM-4.5V ist Zhipu AIs neuestes VLM, basierend auf dem GLM-4.5-Air-Textmodell (106B gesamt, 12B aktiv) mit MoE-Architektur für starke Leistung bei geringeren Kosten. Es folgt dem GLM-4.1V-Thinking-Ansatz und fügt 3D-RoPE zur Verbesserung des 3D-Räumlichkeitsdenkens hinzu. Optimiert durch Pretraining, SFT und RL, verarbeitet es Bilder, Videos und lange Dokumente und belegt Spitzenplätze unter offenen Modellen in 41 öffentlichen multimodalen Benchmarks. Ein Thinking-Modus-Schalter ermöglicht die Balance zwischen Geschwindigkeit und Tiefe.",
"zai-org/GLM-4.6.description": "Im Vergleich zu GLM-4.5 erweitert GLM-4.6 den Kontext von 128K auf 200K für komplexere Agentenaufgaben. Es erzielt höhere Werte in Code-Benchmarks und zeigt stärkere reale Leistung in Apps wie Claude Code, Cline, Roo Code und Kilo Code einschließlich besserer Frontend-Seitengenerierung. Reasoning wurde verbessert und Toolnutzung während des Denkens unterstützt, was die Gesamtleistung stärkt. Es integriert sich besser in Agentenframeworks, verbessert Tool-/Suchagenten und bietet einen menschenfreundlicheren Schreibstil und natürlichere Rollenspiele.",
"zai-org/GLM-4.6V.description": "GLM-4.6V erreicht bei der visuellen Verständnisgenauigkeit SOTA auf gleichem Parameterskalenniveau und integriert erstmals die Funktion Call (Werkzeugaufruf) nativ in das visuelle Modell, wodurch die Kette von „visueller Wahrnehmung“ zu „ausführbarer Aktion“ geschlossen wird. Dies bietet eine einheitliche technologische Grundlage für multimodale Agenten in realen Geschäftsszenarien.",
"zai/glm-4.5-air.description": "GLM-4.5 und GLM-4.5-Air sind unsere neuesten Flaggschiffe für Agentenanwendungen, beide mit MoE. GLM-4.5 hat 355B gesamt und 32B aktiv pro Forward-Pass; GLM-4.5-Air ist schlanker mit 106B gesamt und 12B aktiv.",
"zai/glm-4.5.description": "Die GLM-4.5-Serie ist für Agenten konzipiert. Das Flaggschiff GLM-4.5 kombiniert Reasoning-, Coding- und Agentenfähigkeiten mit 355B Gesamtparametern (32B aktiv) und bietet zwei Betriebsmodi als hybrides Reasoning-System.",
"zai/glm-4.5v.description": "GLM-4.5V baut auf GLM-4.5-Air auf, übernimmt bewährte GLM-4.1V-Thinking-Techniken und skaliert mit einer starken 106B-Parameter-MoE-Architektur.",
+14
View File
@@ -24,6 +24,20 @@
"builtins.lobe-agent-builder.inspector.noResults": "Keine Ergebnisse",
"builtins.lobe-agent-builder.inspector.togglePlugin": "Umschalten",
"builtins.lobe-agent-builder.title": "Agentenbau-Experte",
"builtins.lobe-agent-management.apiName.callAgent": "Agent anrufen",
"builtins.lobe-agent-management.apiName.createAgent": "Agent erstellen",
"builtins.lobe-agent-management.apiName.deleteAgent": "Agent löschen",
"builtins.lobe-agent-management.apiName.searchAgent": "Agenten suchen",
"builtins.lobe-agent-management.apiName.updateAgent": "Agent aktualisieren",
"builtins.lobe-agent-management.inspector.callAgent.sync": "Anrufen:",
"builtins.lobe-agent-management.inspector.callAgent.task": "Aufgabe zuweisen an:",
"builtins.lobe-agent-management.inspector.createAgent.title": "Agent wird erstellt:",
"builtins.lobe-agent-management.inspector.searchAgent.all": "Agenten suchen:",
"builtins.lobe-agent-management.inspector.searchAgent.market": "Markt durchsuchen:",
"builtins.lobe-agent-management.inspector.searchAgent.results": "{{count}} Ergebnisse",
"builtins.lobe-agent-management.inspector.searchAgent.user": "Meine Agenten suchen:",
"builtins.lobe-agent-management.inspector.updateAgent.title": "Agent wird aktualisiert:",
"builtins.lobe-agent-management.title": "Agenten-Manager",
"builtins.lobe-cloud-sandbox.apiName.editLocalFile": "Datei bearbeiten",
"builtins.lobe-cloud-sandbox.apiName.executeCode": "Code ausführen",
"builtins.lobe-cloud-sandbox.apiName.exportFile": "Datei exportieren",
+3
View File
@@ -724,6 +724,9 @@
"tools.builtins.lobe-artifacts.description": "Interaktive UI-Komponenten, Datenvisualisierungen, Diagramme, SVG-Grafiken und Webanwendungen generieren und in Echtzeit anzeigen. Erstellen Sie reichhaltige visuelle Inhalte, mit denen Nutzer direkt interagieren können.",
"tools.builtins.lobe-artifacts.readme": "Erstellen und live-vorschauen interaktive UI-Komponenten, Datenvisualisierungen, Diagramme, SVG-Grafiken und Webanwendungen. Erzeugen Sie reichhaltige visuelle Inhalte, mit denen Nutzer direkt interagieren können.",
"tools.builtins.lobe-artifacts.title": "Artefakte",
"tools.builtins.lobe-calculator.description": "Mathematische Berechnungen durchführen, Gleichungen lösen und mit symbolischen Ausdrücken arbeiten",
"tools.builtins.lobe-calculator.readme": "Erweiterter mathematischer Rechner, der grundlegende Arithmetik, algebraische Gleichungen, Kalkulationsoperationen und symbolische Mathematik unterstützt. Beinhaltet Basisumrechnung, Gleichungslösung, Differentiation, Integration und mehr.",
"tools.builtins.lobe-calculator.title": "Rechner",
"tools.builtins.lobe-cloud-sandbox.description": "Python-, JavaScript- und TypeScript-Code in einer isolierten Cloud-Umgebung ausführen. Shell-Befehle ausführen, Dateien verwalten, Inhalte mit Regex durchsuchen und Ergebnisse sicher exportieren.",
"tools.builtins.lobe-cloud-sandbox.readme": "Führen Sie Python-, JavaScript- und TypeScript-Code in einer isolierten Cloud-Umgebung aus. Führen Sie Shell-Befehle aus, verwalten Sie Dateien, durchsuchen Sie Inhalte mit regulären Ausdrücken und exportieren Sie Ergebnisse sicher.",
"tools.builtins.lobe-cloud-sandbox.title": "Cloud-Sandbox",
+6 -5
View File
@@ -226,16 +226,16 @@
"providerModels.item.modelConfig.extendParams.options.imageAspectRatio.hint": "For Gemini image generation models; controls aspect ratio of generated images.",
"providerModels.item.modelConfig.extendParams.options.imageAspectRatio2.hint": "For Nano Banana 2; controls aspect ratio of generated images (supports extra-wide 1:4, 4:1, 1:8, 8:1).",
"providerModels.item.modelConfig.extendParams.options.imageResolution.hint": "For Gemini 3 image generation models; controls resolution of generated images.",
"providerModels.item.modelConfig.extendParams.options.imageResolution2.hint": "For Gemini 3.1 Flash Image model; controls resolution of generated images (supports 512px).",
"providerModels.item.modelConfig.extendParams.options.imageResolution2.hint": "For Gemini 3.1 Flash Image models; controls resolution of generated images (supports 512px).",
"providerModels.item.modelConfig.extendParams.options.reasoningBudgetToken.hint": "For Claude, Qwen3 and similar; controls token budget for reasoning.",
"providerModels.item.modelConfig.extendParams.options.reasoningEffort.hint": "For OpenAI and other reasoning-capable models; controls reasoning effort.",
"providerModels.item.modelConfig.extendParams.options.textVerbosity.hint": "For GPT-5+ series; controls output verbosity.",
"providerModels.item.modelConfig.extendParams.options.thinking.hint": "For some Doubao models; allow model to decide whether to think deeply.",
"providerModels.item.modelConfig.extendParams.options.thinkingBudget.hint": "For Gemini series; controls thinking budget.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel.hint": "For Gemini 3 Flash Preview model; controls thinking depth.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel2.hint": "For Gemini 3 Pro Preview model; controls thinking depth.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel3.hint": "For Gemini 3.1 Pro Preview model; controls thinking depth with low/medium/high levels.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel4.hint": "For Gemini 3.1 Flash Image model; toggle thinking on/off.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel.hint": "For Gemini 3 Flash Preview models; controls thinking depth.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel2.hint": "For Gemini 3 Pro Preview models; controls thinking depth.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel3.hint": "For Gemini 3.1 Pro Preview models; controls thinking depth with low/medium/high levels.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel4.hint": "For Gemini 3.1 Flash Image models; toggle thinking on/off.",
"providerModels.item.modelConfig.extendParams.options.urlContext.hint": "For Gemini series; supports providing URL context.",
"providerModels.item.modelConfig.extendParams.placeholder": "Select extended parameters to enable",
"providerModels.item.modelConfig.extendParams.previewFallback": "Preview unavailable",
@@ -314,6 +314,7 @@
"providerModels.tabs.image": "Image",
"providerModels.tabs.stt": "ASR",
"providerModels.tabs.tts": "TTS",
"providerModels.tabs.video": "Video",
"sortModal.success": "Sort update successful",
"sortModal.title": "Custom Order",
"sortModal.update": "Update",
+35 -31
View File
@@ -55,7 +55,8 @@
"FLUX.1-dev.description": "FLUX.1-dev is an open-source multimodal language model (MLLM) from Black Forest Labs, optimized for image-text tasks and combining image/text understanding and generation. Built on advanced LLMs (such as Mistral-7B), it uses a carefully designed vision encoder and multi-stage instruction tuning to enable multimodal coordination and complex task reasoning.",
"Gryphe/MythoMax-L2-13b.description": "MythoMax-L2 (13B) is an innovative model for diverse domains and complex tasks.",
"HelloMeme.description": "HelloMeme is an AI tool that generates memes, GIFs, or short videos from the images or motions you provide. It requires no drawing or coding skills—just a reference image—to produce fun, attractive, and stylistically consistent content.",
"HiDream-I1-Full.description": "HiDream-E1-Full is an open-source multimodal image editing model from HiDream.ai, based on an advanced Diffusion Transformer architecture and strong language understanding (built-in LLaMA 3.1-8B-Instruct). It supports natural-language-driven image generation, style transfer, local edits, and repainting, with excellent image-text understanding and execution.",
"HiDream-E1-Full.description": "HiDream-E1-Full is an open-source multimodal image editing model from HiDream.ai, based on an advanced Diffusion Transformer architecture and strong language understanding (built-in LLaMA 3.1-8B-Instruct). It supports natural-language-driven image generation, style transfer, local edits, and repainting, with excellent image-text understanding and execution.",
"HiDream-I1-Full.description": "HiDream-I1 is a new open-source base image generation model released by HiDream. With 17B parameters (Flux has 12B), it can deliver industry-leading image quality in seconds.",
"HunyuanDiT-v1.2-Diffusers-Distilled.description": "hunyuandit-v1.2-distilled is a lightweight text-to-image model optimized via distillation to generate high-quality images quickly, especially suited for low-resource environments and real-time generation.",
"InstantCharacter.description": "InstantCharacter is a tuning-free personalized character generation model released by Tencent AI in 2025, aiming for high-fidelity, cross-scenario consistent character generation. It can model a character from a single reference image and flexibly transfer it across styles, actions, and backgrounds.",
"InternVL2-8B.description": "InternVL2-8B is a powerful vision-language model supporting multimodal image-text processing, accurately recognizing image content and generating relevant descriptions or answers.",
@@ -80,7 +81,7 @@
"MiniMax-M2.1.description": "MiniMax-M2.1 is a flagship open-source large model from MiniMax, focusing on solving complex real-world tasks. Its core strengths are multi-language programming capabilities and the ability to solve complex tasks as an Agent.",
"MiniMax-M2.5-Lightning.description": "M2.5 Lightning: Same performance, faster and more agile (approx. 100 tps).",
"MiniMax-M2.5-highspeed.description": "Same performance as M2.5 with significantly faster inference.",
"MiniMax-M2.5.description": "Top-tier performance and ultimate cost-effectiveness, easily handling complex tasks (approx. 60 tps).",
"MiniMax-M2.5.description": "MiniMax-M2.5 is a flagship open-source large model from MiniMax, focusing on solving complex real-world tasks. Its core strengths are multi-language programming capabilities and the ability to solve complex tasks as an Agent.",
"MiniMax-M2.description": "Built specifically for efficient coding and Agent workflows",
"MiniMax-Text-01.description": "MiniMax-01 introduces large-scale linear attention beyond classic Transformers, with 456B parameters and 45.9B activated per pass. It achieves top-tier performance and supports up to 4M tokens of context (32× GPT-4o, 20× Claude-3.5-Sonnet).",
"MiniMaxAI/MiniMax-M1-80k.description": "MiniMax-M1 is an open-weights large-scale hybrid-attention reasoning model with 456B total parameters and ~45.9B active per token. It natively supports 1M context and uses Flash Attention to cut FLOPs by 75% on 100K-token generation vs DeepSeek R1. With an MoE architecture plus CISPO and hybrid-attention RL training, it achieves leading performance on long-input reasoning and real software engineering tasks.",
@@ -98,6 +99,7 @@
"Phi-3.5-mini-instruct.description": "An updated version of the Phi-3-mini model.",
"Phi-3.5-vision-instrust.description": "An updated version of the Phi-3-vision model.",
"Pro/MiniMaxAI/MiniMax-M2.1.description": "MiniMax-M2.1 is an open-source large language model optimized for agent capabilities, excelling in programming, tool usage, instruction following, and long-term planning. The model supports multilingual software development and complex multi-step workflow execution, achieving a score of 74.0 on SWE-bench Verified and surpassing Claude Sonnet 4.5 in multilingual scenarios.",
"Pro/MiniMaxAI/MiniMax-M2.5.description": "MiniMax-M2.5 is the latest large language model developed by MiniMax, trained through large-scale reinforcement learning across hundreds of thousands of complex, real-world environments. Featuring an MoE architecture with 229 billion parameters, it achieves industry-leading performance in tasks such as programming, agent tool-calling, search, and office scenarios.",
"Pro/Qwen/Qwen2-7B-Instruct.description": "Qwen2-7B-Instruct is a 7B instruction-tuned LLM in the Qwen2 series. It uses Transformer architecture with SwiGLU, attention QKV bias, and grouped-query attention, and handles large inputs. It performs strongly across language understanding, generation, multilingual tasks, coding, math, and reasoning, outperforming most open models and competing with proprietary ones. It surpasses Qwen1.5-7B-Chat on multiple benchmarks.",
"Pro/Qwen/Qwen2.5-7B-Instruct.description": "Qwen2.5-7B-Instruct is part of Alibaba Clouds latest LLM series. The 7B model brings notable gains in coding and math, supports 29+ languages, and improves instruction following, structured data understanding, and structured output (especially JSON).",
"Pro/Qwen/Qwen2.5-Coder-7B-Instruct.description": "Qwen2.5-Coder-7B-Instruct is the latest Alibaba Cloud code-focused LLM. Built on Qwen2.5 and trained on 5.5T tokens, it significantly improves code generation, reasoning, and repair while retaining math and general strengths, providing a solid base for coding agents.",
@@ -107,13 +109,13 @@
"Pro/deepseek-ai/DeepSeek-R1-Distill-Qwen-7B.description": "DeepSeek-R1-Distill-Qwen-7B is distilled from Qwen2.5-Math-7B and fine-tuned on 800K curated DeepSeek-R1 samples. It performs strongly, with 92.8% on MATH-500, 55.5% on AIME 2024, and a 1189 CodeForces rating for a 7B model.",
"Pro/deepseek-ai/DeepSeek-R1.description": "DeepSeek-R1 is an RL-driven reasoning model that reduces repetition and improves readability. It uses cold-start data before RL to further boost reasoning, matches OpenAI-o1 on math, code, and reasoning tasks, and improves overall results through careful training.",
"Pro/deepseek-ai/DeepSeek-V3.1-Terminus.description": "DeepSeek-V3.1-Terminus is an updated V3.1 model positioned as a hybrid agent LLM. It fixes user-reported issues and improves stability, language consistency, and reduces mixed Chinese/English and abnormal characters. It integrates Thinking and Non-thinking modes with chat templates for flexible switching. It also improves Code Agent and Search Agent performance for more reliable tool use and multi-step tasks.",
"Pro/deepseek-ai/DeepSeek-V3.2-Exp.description": "DeepSeek-V3.2-Exp is an experimental V3.2 release bridging to the next architecture. It adds DeepSeek Sparse Attention (DSA) on top of V3.1-Terminus to improve long-context training and inference efficiency, with optimizations for tool use, long-document understanding, and multi-step reasoning. It is ideal for exploring higher reasoning efficiency with large context budgets.",
"Pro/deepseek-ai/DeepSeek-V3.2.description": "DeepSeek-V3.2 is a model that combines high computational efficiency with excellent reasoning and Agent performance. Its approach is built on three key technological breakthroughs: DeepSeek Sparse Attention (DSA), an efficient attention mechanism that significantly reduces computational complexity while maintaining model performance, and is specifically optimized for long-context scenarios; a scalable reinforcement learning framework through which model performance can rival GPT-5, with its high-compute version matching Gemini-3.0-Pro in reasoning capabilities; and a large-scale Agent task synthesis pipeline aimed at integrating reasoning capabilities into tool use scenarios, thereby improving instruction following and generalization in complex interactive environments. The model achieved gold medal performance in the 2025 International Mathematical Olympiad (IMO) and International Olympiad in Informatics (IOI).",
"Pro/deepseek-ai/DeepSeek-V3.description": "DeepSeek-V3 is a 671B-parameter MoE model using MLA and DeepSeekMoE with loss-free load balancing for efficient inference and training. Pretrained on 14.8T high-quality tokens and further tuned with SFT and RL, it outperforms other open models and approaches leading closed models.",
"Pro/moonshotai/Kimi-K2-Instruct-0905.description": "Kimi K2-Instruct-0905 is the newest and most powerful Kimi K2. It is a top-tier MoE model with 1T total and 32B active parameters. Key features include stronger agentic coding intelligence with significant gains on benchmarks and real-world agent tasks, plus improved frontend coding aesthetics and usability.",
"Pro/moonshotai/Kimi-K2-Thinking.description": "Kimi K2 Thinking Turbo is the Turbo variant optimized for reasoning speed and throughput while retaining K2 Thinkings multi-step reasoning and tool use. It is an MoE model with ~1T total parameters, native 256K context, and stable large-scale tool calling for production scenarios with stricter latency and concurrency needs.",
"Pro/moonshotai/Kimi-K2.5.description": "Kimi K2.5 is an open-source native multimodal agent model, built on Kimi-K2-Base, trained on approximately 1.5 trillion mixed vision and text tokens. The model adopts an MoE architecture with 1T total parameters and 32B active parameters, supporting a 256K context window, seamlessly integrating vision and language understanding capabilities.",
"Pro/zai-org/glm-4.7.description": "GLM-4.7 is Zhipu's new generation flagship model with 355B total parameters and 32B active parameters, fully upgraded in general dialogue, reasoning, and agent capabilities. GLM-4.7 enhances Interleaved Thinking and introduces Preserved Thinking and Turn-level Thinking.",
"Pro/zai-org/glm-5.description": "GLM-5 是智谱推出的新一代大语言模型,专注于复杂系统工程和长周期 Agent 任务。模型参数扩展至 744B 参数(40B 激活),并集成了 DeepSeek Sparse Attention",
"Pro/zai-org/glm-5.description": "GLM-5 is Zhipu's next-generation large language model, focusing on complex system engineering and long-duration Agent tasks. The model parameters have been expanded to 744B (40B active) and integrate DeepSeek Sparse Attention.",
"QwQ-32B-Preview.description": "Qwen QwQ is an experimental research model focused on improving reasoning.",
"Qwen/QVQ-72B-Preview.description": "QVQ-72B-Preview is a research model from Qwen focused on visual reasoning, with strengths in complex scene understanding and visual math problems.",
"Qwen/QwQ-32B-Preview.description": "Qwen QwQ is an experimental research model focused on improved AI reasoning.",
@@ -137,7 +139,7 @@
"Qwen/Qwen3-14B.description": "Qwen3 is a next-gen Tongyi Qwen model with major gains in reasoning, general ability, agent capability, and multilingual performance, and supports switching thinking modes.",
"Qwen/Qwen3-235B-A22B-Instruct-2507.description": "Qwen3-235B-A22B-Instruct-2507 is a flagship Qwen3 MoE model with 235B total and 22B active parameters. It is an updated non-thinking version focused on improving instruction following, logical reasoning, text understanding, math, science, coding, and tool use. It also expands multilingual long-tail knowledge and better aligns with user preferences for subjective open-ended tasks.",
"Qwen/Qwen3-235B-A22B-Thinking-2507.description": "Qwen3-235B-A22B-Thinking-2507 is a Qwen3 model focused on hard complex reasoning. It uses an MoE architecture with 235B total and ~22B active per token to boost efficiency. As a dedicated thinking model, it shows major gains in logic, math, science, coding, and academic benchmarks, reaching top-tier open thinking performance. It also improves instruction following, tool use, and text generation, and natively supports 256K context for deep reasoning and long documents.",
"Qwen/Qwen3-235B-A22B.description": "Qwen3 is a next-gen Tongyi Qwen model with major gains in reasoning, general ability, agent capability, and multilingual performance, and supports switching thinking modes.",
"Qwen/Qwen3-235B-A22B.description": "Qwen3 235B A22B is the Qwen3 ultra-scale model delivering top-tier AI capability.",
"Qwen/Qwen3-30B-A3B-Instruct-2507.description": "Qwen3-30B-A3B-Instruct-2507 is the updated non-thinking version of Qwen3-30B-A3B. It is an MoE model with 30.5B total and 3.3B active parameters. It significantly improves instruction following, logical reasoning, text understanding, math, science, coding, and tool use, expands multilingual long-tail knowledge, and better aligns with user preferences on subjective open tasks. It supports 256K context. This model is non-thinking only and will not output `<think></think>` tags.",
"Qwen/Qwen3-30B-A3B-Thinking-2507.description": "Qwen3-30B-A3B-Thinking-2507 is the latest thinking model in the Qwen3 series. It is an MoE model with 30.5B total and 3.3B active parameters, focused on complex tasks. It shows significant gains in logic, math, science, coding, and academic benchmarks, and improves instruction following, tool use, text generation, and preference alignment. It natively supports 256K context and can extend to 1M tokens. This version is designed for thinking mode with detailed step-by-step reasoning and strong agent capabilities.",
"Qwen/Qwen3-30B-A3B.description": "Qwen3 is a next-gen Tongyi Qwen model with major gains in reasoning, general ability, agent capability, and multilingual performance, and supports switching thinking modes.",
@@ -315,7 +317,6 @@
"codeqwen.description": "CodeQwen1.5 is a large language model trained on extensive code data, built for complex programming tasks.",
"codestral-latest.description": "Codestral is our most advanced coding model; v2 (Jan 2025) targets low-latency, high-frequency tasks like FIM, code correction, and test generation.",
"codestral.description": "Codestral is Mistral AIs first code model, delivering strong code generation support.",
"codex-mini-latest.description": "codex-mini-latest is a fine-tuned o4-mini model for the Codex CLI. For direct API use, we recommend starting with gpt-4.1.",
"cogito-2.1:671b.description": "Cogito v2.1 671B is a US open-source LLM free for commercial use, with performance rivaling top models, higher token reasoning efficiency, a 128k long context, and strong overall capability.",
"cogview-3-flash.description": "CogView-3-Flash is a free image generation model launched by Zhipu. It generates images that align with user instructions while achieving higher aesthetic quality scores. CogView-3-Flash is primarily used in fields such as artistic creation, design reference, game development, and virtual reality, helping users rapidly convert text descriptions into images.",
"cogview-4.description": "CogView-4 is Zhipus first open-source text-to-image model that can generate Chinese characters. It improves semantic understanding, image quality, and Chinese/English text rendering, supports arbitrary-length bilingual prompts, and can generate images at any resolution within specified ranges.",
@@ -342,7 +343,7 @@
"command-light-nightly.description": "To shorten the gap between major releases, we offer nightly Command builds. For the command-light series this is called command-light-nightly. It is the newest, most experimental (and potentially unstable) version, updated regularly without notice, so it is not recommended for production.",
"command-light.description": "A smaller, faster Command variant that is nearly as capable but faster.",
"command-nightly.description": "To shorten the gap between major releases, we offer nightly Command builds. For the Command series this is called command-nightly. It is the newest, most experimental (and potentially unstable) version, updated regularly without notice, so it is not recommended for production.",
"command-r-03-2024.description": "Command R is an instruction-following chat model with higher quality, greater reliability, and a longer context window than earlier models. It supports complex workflows such as code generation, RAG, tool use, and agents.",
"command-r-03-2024.description": "command-r is an instruction-following chat model that performs language tasks with higher quality, improved reliability, and longer context than previous models. It supports complex workflows such as code generation, RAG, tool use, and agents.",
"command-r-08-2024.description": "command-r-08-2024 is an updated Command R model released in August 2024.",
"command-r-plus-04-2024.description": "command-r-plus is an alias of command-r-plus-04-2024, so using command-r-plus in the API points to that model.",
"command-r-plus-08-2024.description": "Command R+ is an instruction-following chat model with higher quality, greater reliability, and a longer context window than previous models. It is best for complex RAG workflows and multi-step tool use.",
@@ -366,7 +367,8 @@
"deepseek-ai/DeepSeek-V2.5.description": "DeepSeek-V2.5 upgrades DeepSeek-V2-Chat and DeepSeek-Coder-V2-Instruct, combining general and coding abilities. It improves writing and instruction following for better preference alignment, and shows significant gains on AlpacaEval 2.0, ArenaHard, AlignBench, and MT-Bench.",
"deepseek-ai/DeepSeek-V3.1-Terminus.description": "DeepSeek-V3.1-Terminus is an updated V3.1 model positioned as a hybrid agent LLM. It fixes user-reported issues and improves stability, language consistency, and reduces mixed Chinese/English and abnormal characters. It integrates Thinking and Non-thinking modes with chat templates for flexible switching. It also improves Code Agent and Search Agent performance for more reliable tool use and multi-step tasks.",
"deepseek-ai/DeepSeek-V3.1.description": "DeepSeek V3.1 uses a hybrid reasoning architecture and supports both thinking and non-thinking modes.",
"deepseek-ai/DeepSeek-V3.2-Exp.description": "DeepSeek-V3.2-Exp is an experimental V3.2 release bridging to the next architecture. It adds DeepSeek Sparse Attention (DSA) on top of V3.1-Terminus to improve long-context training and inference efficiency, with optimizations for tool use, long-document understanding, and multi-step reasoning. It is ideal for exploring higher reasoning efficiency with large context budgets.",
"deepseek-ai/DeepSeek-V3.2-Exp.description": "DeepSeek V3.2 Exp uses a hybrid reasoning architecture and supports both thinking and non-thinking modes.",
"deepseek-ai/DeepSeek-V3.2.description": "DeepSeek-V3.2 is a model that combines high computational efficiency with excellent reasoning and Agent performance. Its approach is based on three major technological breakthroughs: DeepSeek Sparse Attention (DSA), an efficient attention mechanism that significantly reduces computational complexity while maintaining model performance, and is specifically optimized for long-context scenarios; a scalable reinforcement learning framework, through which the model's performance can rival GPT-5, and its high-compute version can rival Gemini-3.0-Pro in reasoning capabilities; and a large-scale Agent task synthesis pipeline, designed to integrate reasoning capabilities into tool-using scenarios, thereby improving instruction-following and generalization abilities in complex interactive environments. The model achieved gold medal results in the 2025 International Mathematical Olympiad (IMO) and International Informatics Olympiad (IOI).",
"deepseek-ai/DeepSeek-V3.description": "DeepSeek-V3 is a 671B-parameter MoE model using MLA and DeepSeekMoE with loss-free load balancing for efficient training and inference. Pretrained on 14.8T high-quality tokens with SFT and RL, it outperforms other open models and approaches leading closed models.",
"deepseek-ai/deepseek-llm-67b-chat.description": "DeepSeek LLM Chat (67B) is an innovative model offering deep language understanding and interaction.",
"deepseek-ai/deepseek-v3.1-terminus.description": "DeepSeek V3.1 is a next-gen reasoning model with stronger complex reasoning and chain-of-thought for deep analysis tasks.",
@@ -433,6 +435,7 @@
"deepseek_r1_distill_llama_70b.description": "DeepSeek-R1-Distill-Llama-70B is distilled from Llama-3.3-70B-Instruct. As part of the DeepSeek-R1 series, it is fine-tuned on DeepSeek-R1-generated samples and performs strongly in math, coding, and reasoning.",
"deepseek_r1_distill_qwen_14b.description": "DeepSeek-R1-Distill-Qwen-14B is distilled from Qwen2.5-14B and fine-tuned on 800K curated samples generated by DeepSeek-R1, delivering strong reasoning.",
"deepseek_r1_distill_qwen_32b.description": "DeepSeek-R1-Distill-Qwen-32B is distilled from Qwen2.5-32B and fine-tuned on 800K curated samples generated by DeepSeek-R1, excelling in math, coding, and reasoning.",
"devstral-2512.description": "Devstral 2 is an enterprise-level text model that excels at using tools to explore codebases, edit multiple files, and power software engineering agents.",
"devstral-2:123b.description": "Devstral 2 123B excels at using tools to explore codebases, edit multiple files, and support software engineering agents.",
"doubao-1.5-lite-32k.description": "Doubao-1.5-lite is a new lightweight model with ultra-fast response, delivering top-tier quality and latency.",
"doubao-1.5-pro-256k.description": "Doubao-1.5-pro-256k is a comprehensive upgrade to Doubao-1.5-Pro, improving overall performance by 10%. It supports a 256k context window and up to 12k output tokens, delivering higher performance, a larger window, and strong value for broader use cases.",
@@ -546,10 +549,10 @@
"gemini-2.5-pro-preview-06-05.description": "Gemini 2.5 Pro Preview is Googles most advanced reasoning model, able to reason over code, math, and STEM problems and analyze large datasets, codebases, and documents with long context.",
"gemini-2.5-pro.description": "Gemini 2.5 Pro is Googles most advanced reasoning model, able to reason over code, math, and STEM problems and analyze large datasets, codebases, and documents with long context.",
"gemini-3-flash-preview.description": "Gemini 3 Flash is the smartest model built for speed, combining cutting-edge intelligence with excellent search grounding.",
"gemini-3-pro-image-preview.description": "Gemini 3 Pro ImageNano Banana Pro)是 Google 的图像生成模型,同时支持多模态对话。",
"gemini-3-pro-image-preview.description": "Gemini 3 Pro Image (Nano Banana Pro) is Google's image generation model that also supports multimodal dialogue.",
"gemini-3-pro-image-preview:image.description": "Gemini 3 Pro Image (Nano Banana Pro) is Google's image generation model and also supports multimodal chat.",
"gemini-3-pro-preview.description": "Gemini 3 Pro is Googles most powerful agent and vibe-coding model, delivering richer visuals and deeper interaction on top of state-of-the-art reasoning.",
"gemini-3.1-flash-image-preview.description": "Gemini 3.1 Flash Image (Nano Banana 2) delivers Pro-level image quality at Flash speed with multimodal chat support.",
"gemini-3.1-flash-image-preview.description": "Gemini 3.1 Flash Image (Nano Banana 2) is Google's fastest native image generation model with thinking support, conversational image generation and editing.",
"gemini-3.1-flash-image-preview:image.description": "Gemini 3.1 Flash Image (Nano Banana 2) delivers Pro-level image quality at Flash speed with multimodal chat support.",
"gemini-3.1-pro-preview.description": "Gemini 3.1 Pro Preview improves on Gemini 3 Pro with enhanced reasoning capabilities and adds medium thinking level support.",
"gemini-flash-latest.description": "Latest release of Gemini Flash",
@@ -605,19 +608,15 @@
"google/gemini-2.0-flash-lite-001.description": "Gemini 2.0 Flash Lite is a lightweight Gemini variant with thinking disabled by default to improve latency and cost, but it can be enabled via parameters.",
"google/gemini-2.0-flash-lite.description": "Gemini 2.0 Flash Lite delivers next-gen features including exceptional speed, built-in tool use, multimodal generation, and a 1M-token context window.",
"google/gemini-2.0-flash.description": "Gemini 2.0 Flash is Googles high-performance reasoning model for extended multimodal tasks.",
"google/gemini-2.5-flash-image-free.description": "Gemini 2.5 Flash Image free tier with limited-quota multimodal generation.",
"google/gemini-2.5-flash-image-preview.description": "Gemini 2.5 Flash experimental model with image generation support.",
"google/gemini-2.5-flash-image.description": "Gemini 2.5 Flash Image (Nano Banana) is Googles image generation model with multimodal conversation support.",
"google/gemini-2.5-flash-lite.description": "Gemini 2.5 Flash Lite is the lightweight Gemini 2.5 variant optimized for latency and cost, suitable for high-throughput scenarios.",
"google/gemini-2.5-flash-preview.description": "Gemini 2.5 Flash is Googles most advanced flagship model, built for advanced reasoning, coding, math, and science tasks. It includes built-in “thinking” to deliver higher-accuracy responses with finer context processing.\n\nNote: This model has two variants—thinking and non-thinking. Output pricing differs significantly depending on whether thinking is enabled. If you choose the standard variant (without the “:thinking” suffix), the model will explicitly avoid generating thinking tokens.\n\nTo use thinking and receive thinking tokens, you must select the “:thinking” variant, which incurs higher thinking output pricing.\n\nGemini 2.5 Flash can also be configured via the “max reasoning tokens” parameter as documented (https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning).",
"google/gemini-2.5-flash-preview:thinking.description": "Gemini 2.5 Flash is Googles most advanced flagship model, built for advanced reasoning, coding, math, and science tasks. It includes built-in “thinking” to deliver higher-accuracy responses with finer context processing.\n\nNote: This model has two variants—thinking and non-thinking. Output pricing differs significantly depending on whether thinking is enabled. If you choose the standard variant (without the “:thinking” suffix), the model will explicitly avoid generating thinking tokens.\n\nTo use thinking and receive thinking tokens, you must select the “:thinking” variant, which incurs higher thinking output pricing.\n\nGemini 2.5 Flash can also be configured via the “max reasoning tokens” parameter as documented (https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning).",
"google/gemini-2.5-flash.description": "Gemini 2.5 Flash (Lite/Pro/Flash) is Googles family spanning low latency to high-performance reasoning.",
"google/gemini-2.5-pro-free.description": "Gemini 2.5 Pro free tier offers limited-quota multimodal long-context, suitable for trials and light workflows.",
"google/gemini-2.5-flash.description": "Gemini 2.5 Flash is Googles family spanning low latency to high-performance reasoning.",
"google/gemini-2.5-pro-preview.description": "Gemini 2.5 Pro Preview is Googles most advanced thinking model for reasoning over complex problems in code, math, and STEM, and for analyzing large datasets, codebases, and documents with long context.",
"google/gemini-2.5-pro.description": "Gemini 2.5 Pro is Googles flagship reasoning model with long context support for complex tasks.",
"google/gemini-3-pro-image-preview-free.description": "Gemini 3 Pro Image free tier with limited-quota multimodal generation.",
"google/gemini-3-pro-image-preview.description": "Gemini 3 Pro Image (Nano Banana Pro) is Googles image generation model with multimodal conversation support.",
"google/gemini-3-pro-preview-free.description": "Gemini 3 Pro Preview Free offers the same multimodal understanding and reasoning as the standard version, but with quota and rate limits, making it better for trials and low-frequency use.",
"google/gemini-3-pro-preview.description": "Gemini 3 Pro is the next-generation multimodal reasoning model in the Gemini family, understanding text, audio, images, and video, and handling complex tasks and large codebases.",
"google/gemini-embedding-001.description": "A state-of-the-art embedding model with strong performance in English, multilingual, and code tasks.",
"google/gemini-flash-1.5.description": "Gemini 1.5 Flash provides optimized multimodal processing for a range of complex tasks.",
@@ -717,15 +716,24 @@
"hunyuan-a13b.description": "The first hybrid reasoning model from Hunyuan, upgraded from hunyuan-standard-256K (80B total, 13B active). It defaults to slow thinking and supports fast/slow switching via params or prefixing /no_think. Overall capability is improved over the previous generation, especially in math, science, long-text understanding, and agent tasks.",
"hunyuan-code.description": "Hunyuans latest code model trained on 200B high-quality code data plus six months of SFT data, with 8K context. It ranks near the top in automated code benchmarks and in expert human evaluations across five languages.",
"hunyuan-functioncall.description": "Hunyuans latest MoE FunctionCall model trained on high-quality tool-call data, with a 32K context window and leading benchmarks across dimensions.",
"hunyuan-large-longcontext.description": "Excels at long-document tasks like summarization and QA while also handling general generation. Strong at long-text analysis and generation for complex, detailed content.",
"hunyuan-large.description": "Hunyuan-large has ~389B total parameters and ~52B activated, the largest and strongest open MoE model in a Transformer architecture.",
"hunyuan-lite.description": "Upgraded to an MoE architecture with a 256k context window, leading many open models across NLP, code, math, and industry benchmarks.",
"hunyuan-pro.description": "Trillion-parameter MOE-32K long-context model leading benchmarks, strong at complex instructions and reasoning, advanced math, function calling, and optimized for multilingual translation, finance, law, and medical domains.",
"hunyuan-role.description": "Hunyuans latest roleplay model, officially fine-tuned with roleplay data, delivering stronger base performance in roleplay scenarios.",
"hunyuan-standard-256K.description": "Uses improved routing to mitigate load balancing and expert collapse. Long-text \"needle in a haystack\" reaches 99.9%. MOE-256K pushes further in length and quality, greatly expanding input length.",
"hunyuan-standard.description": "Uses improved routing to mitigate load balancing and expert collapse. Long-text \"needle in a haystack\" reaches 99.9%. MOE-32K offers better value while balancing quality and price for long-text inputs.",
"hunyuan-standard-256K.description": "Uses improved routing to mitigate load balancing and expert collapse. Achieves 99.9% needle-in-a-haystack on long context. MOE-256K further expands context length and quality.",
"hunyuan-standard.description": "Uses improved routing to mitigate load balancing and expert collapse. Achieves 99.9% needle-in-a-haystack on long context. MOE-32K offers strong value while handling long inputs.",
"hunyuan-t1-20250321.description": "Builds balanced arts and STEM capabilities with strong long-text information capture. Supports reasoning answers for math, logic, science, and code problems across difficulty levels.",
"hunyuan-t1-20250403.description": "Improves project-level code generation and writing quality, strengthens multi-turn topic understanding and ToB instruction following, improves word-level understanding, and reduces mixed simplified/traditional and Chinese/English output issues.",
"hunyuan-t1-20250529.description": "Improves creative writing and composition, strengthens frontend coding, math, and logic reasoning, and enhances instruction following.",
"hunyuan-t1-20250711.description": "Greatly improves hard math, logic, and coding, boosts output stability, and enhances long-text capability.",
"hunyuan-t1-latest.description": "Significantly improves the slow-thinking model on hard math, complex reasoning, difficult coding, instruction following, and creative writing quality.",
"hunyuan-t1-vision-20250916.description": "Latest t1-vision deep reasoning model with major improvements in VQA, visual grounding, OCR, charts, solving photographed problems, and image-based creation, plus stronger English and low-resource languages.",
"hunyuan-turbo-20241223.description": "This version boosts instruction scaling for better generalization, significantly improves math/code/logic reasoning, enhances word-level understanding, and improves writing quality.",
"hunyuan-turbo-latest.description": "General experience improvements across NLP understanding, writing, chat, QA, translation, and domains; more human-like responses, better clarification on ambiguous intent, improved word parsing, higher creative quality and interactivity, and stronger multi-turn conversations.",
"hunyuan-turbo.description": "Preview of Hunyuans next-gen LLM with a new MoE architecture, delivering faster reasoning and stronger results than hunyuan-pro.",
"hunyuan-turbos-latest.description": "The latest Hunyuan TurboS flagship model with stronger reasoning and a better overall experience.",
"hunyuan-turbos-longtext-128k-20250325.description": "Excels at long-document tasks like summarization and QA while also handling general generation. Strong at long-text analysis and generation for complex, detailed content.",
"hunyuan-vision-1.5-instruct.description": "A fast-thinking image-to-text model built on the TurboS text base, showing notable improvements over the previous version in fundamental image recognition and image analysis reasoning.",
"hunyuan-vision.description": "Hunyuan latest multimodal model supporting image + text inputs to generate text.",
"image-01-live.description": "An image generation model with fine detail, supporting text-to-image and controllable style presets.",
@@ -770,8 +778,7 @@
"kimi-k2:1t.description": "Kimi K2 is a large MoE LLM from Moonshot AI with 1T total parameters and 32B active per forward pass. It is optimized for agent capabilities including advanced tool use, reasoning, and code synthesis.",
"kimi-latest.description": "Kimi Latest uses the newest Kimi model and may include experimental features. It supports image understanding and automatically selects 8k/32k/128k billing models based on context length.",
"kuaishou/kat-coder-pro-v1.description": "KAT-Coder-Pro-V1 (limited-time free) focuses on code understanding and automation for efficient coding agents.",
"learnlm-1.5-pro-experimental.description": "LearnLM is an experimental, task-specific model trained on learning science principles to follow system instructions in teaching/learning scenarios, acting as an expert tutor.",
"learnlm-2.0-flash-experimental.description": "LearnLM is an experimental, task-specific model trained on learning science principles to follow system instructions in teaching/learning scenarios, acting as an expert tutor.",
"labs-devstral-small-2512.description": "Devstral Small 2 excels at using tools to explore code bases, edit multiple files, and power software engineering agents.",
"lite.description": "Spark Lite is a lightweight LLM with ultra-low latency and efficient processing. It is fully free and supports real-time web search. Its fast responses perform well on low-compute devices and for model fine-tuning, delivering strong cost efficiency and an intelligent experience, especially for knowledge Q&A, content generation, and search scenarios.",
"llama-3.1-70b-versatile.description": "Llama 3.1 70B delivers stronger AI reasoning for complex applications, supporting heavy compute with high efficiency and accuracy.",
"llama-3.1-8b-instant.description": "Llama 3.1 8B is a high-efficiency model with fast text generation, ideal for large-scale, cost-effective applications.",
@@ -782,7 +789,6 @@
"llama-3.2-90b-vision-preview.description": "Llama 3.2 is designed for tasks combining vision and text, excelling at image captioning and visual QA to bridge language generation and visual reasoning.",
"llama-3.2-vision-instruct.description": "Llama 3.2-Vision instruction-tuned model is optimized for visual recognition, image reasoning, captioning, and general image Q&A.",
"llama-3.3-70b-versatile.description": "Meta Llama 3.3 is a multilingual LLM with 70B parameters (text in/text out), offering pre-trained and instruction-tuned variants. The instruction-tuned text-only model is optimized for multilingual dialogue use cases and outperforms many available open and closed chat models on common industry benchmarks.",
"llama-3.3-70b.description": "Llama 3.3 70B: a mid-to-large Llama model balancing reasoning and throughput.",
"llama-3.3-instruct.description": "Llama 3.3 instruction-tuned model is optimized for chat and beats many open chat models on common industry benchmarks.",
"llama3-70b-8192.description": "Meta Llama 3 70B offers exceptional complexity handling for demanding projects.",
"llama3-8b-8192.description": "Meta Llama 3 8B delivers strong reasoning performance for diverse scenarios.",
@@ -832,7 +838,6 @@
"meta-llama/llama-3.1-8b-instruct:free.description": "LLaMA 3.1 offers multilingual support and is one of the leading generative models.",
"meta-llama/llama-3.2-11b-vision-instruct.description": "LLaMA 3.2 is designed for tasks combining vision and text. It excels at image captioning and visual QA, bridging language generation and visual reasoning.",
"meta-llama/llama-3.2-3b-instruct.description": "meta-llama/llama-3.2-3b-instruct",
"meta-llama/llama-3.2-90b-vision-instruct.description": "LLaMA 3.2 is designed for tasks combining vision and text. It excels at image captioning and visual QA, bridging language generation and visual reasoning.",
"meta-llama/llama-3.3-70b-instruct.description": "Llama 3.3 is the most advanced multilingual open-source Llama model, delivering near-405B performance at very low cost. It is Transformer-based and improved with SFT and RLHF for usefulness and safety. The instruction-tuned version is optimized for multilingual chat and beats many open and closed chat models on industry benchmarks. Knowledge cutoff: Dec 2023.",
"meta-llama/llama-3.3-70b-instruct:free.description": "Llama 3.3 is the most advanced multilingual open-source Llama model, delivering near-405B performance at very low cost. It is Transformer-based and improved with SFT and RLHF for usefulness and safety. The instruction-tuned version is optimized for multilingual chat and beats many open and closed chat models on industry benchmarks. Knowledge cutoff: Dec 2023.",
"meta.llama3-1-405b-instruct-v1:0.description": "Meta Llama 3.1 405B Instruct is the largest and most powerful Llama 3.1 Instruct model, a highly advanced model for dialogue reasoning and synthetic data generation, and a strong base for domain-specific continued pretraining or fine-tuning. The Llama 3.1 multilingual LLMs are a set of pre-trained and instruction-tuned generation models in 8B, 70B, and 405B sizes (text in/text out). The instruction-tuned text models are optimized for multilingual dialogue and outperform many available open chat models on common industry benchmarks. Llama 3.1 is designed for commercial and research use across languages. Instruction-tuned models are suited for assistant-style chat, while pretrained models fit broader natural language generation tasks. Llama 3.1 outputs can also be used to improve other models, including synthetic data generation and refinement. Llama 3.1 is an autoregressive Transformer model with an optimized architecture. The tuned versions use supervised fine-tuning (SFT) and reinforcement learning from human feedback (RLHF) to align with human preferences for helpfulness and safety.",
@@ -894,7 +899,7 @@
"mistral-large-instruct.description": "Mistral-Large-Instruct-2407 is an advanced dense LLM with 123B parameters and state-of-the-art reasoning, knowledge, and coding.",
"mistral-large-latest.description": "Mistral Large is the flagship model, strong in multilingual tasks, complex reasoning, and code generation—ideal for high-end applications.",
"mistral-large.description": "Mixtral Large is Mistrals flagship model, combining code generation, math, and reasoning with a 128K context window.",
"mistral-medium-latest.description": "Mistral Medium 3 delivers state-of-the-art performance at 8× lower cost and simplifies enterprise deployment.",
"mistral-medium-latest.description": "Mistral Medium 3.1 delivers state-of-the-art performance at 8× lower cost and simplifies enterprise deployment.",
"mistral-nemo-instruct.description": "Mistral-Nemo-Instruct-2407 is the instruction-tuned version of Mistral-Nemo-Base-2407.",
"mistral-nemo.description": "Mistral Nemo is a high-efficiency 12B model from Mistral AI and NVIDIA.",
"mistral-small-latest.description": "Mistral Small is a cost-effective, fast, and reliable option for translation, summarization, and sentiment analysis.",
@@ -933,7 +938,7 @@
"moonshot-v1-auto.description": "Moonshot V1 Auto selects the appropriate model based on current context token usage.",
"moonshotai/Kimi-Dev-72B.description": "Kimi-Dev-72B is an open-source code LLM optimized with large-scale RL to produce robust, production-ready patches. It scores 60.4% on SWE-bench Verified, setting a new open-model record for automated software engineering tasks like bug fixing and code review.",
"moonshotai/Kimi-K2-Instruct-0905.description": "Kimi K2-Instruct-0905 is the newest and most powerful Kimi K2. It is a top-tier MoE model with 1T total and 32B active parameters. Key features include stronger agentic coding intelligence with significant gains on benchmarks and real-world agent tasks, plus improved frontend coding aesthetics and usability.",
"moonshotai/Kimi-K2-Thinking.description": "Kimi K2 Thinking is the latest and most powerful open-source thinking model. It greatly extends multi-step reasoning depth and sustains stable tool use across 200300 consecutive calls, setting new records on Humanity's Last Exam (HLE), BrowseComp, and other benchmarks. It excels in coding, math, logic, and agent scenarios. Built on an MoE architecture with ~1T total parameters, it supports a 256K context window and tool calling.",
"moonshotai/Kimi-K2-Thinking.description": "Kimi K2 Thinking is the latest and most powerful open-source thinking model. It greatly extends multi-step reasoning depth and sustains stable tool use across 200300 consecutive calls, setting new records on Humanity's Last Exam (HLE), BrowseComp, and other benchmarks. 'It excels in coding, math, logic, and agent scenarios. Built on an MoE architecture with ~1T total parameters, it supports a 256K context window and tool calling.",
"moonshotai/kimi-k2-0711.description": "Kimi K2 0711 is the instruct variant in the Kimi series, suited for high-quality code and tool use.",
"moonshotai/kimi-k2-0905.description": "Kimi K2 0905 is an update that expands context and reasoning performance with coding optimizations.",
"moonshotai/kimi-k2-instruct-0905.description": "The kimi-k2-0905-preview model supports a 256k context window, with stronger agentic coding, more polished and practical frontend code, and better context understanding.",
@@ -948,8 +953,8 @@
"nvidia/Llama-3.1-Nemotron-70B-Instruct-HF.description": "Llama 3.1 Nemotron 70B is an NVIDIA-customized LLM to improve helpfulness. It performs strongly on Arena Hard, AlpacaEval 2 LC, and GPT-4-Turbo MT-Bench, ranking #1 on all three auto-alignment benchmarks as of Oct 1, 2024. It is trained from Llama-3.1-70B-Instruct using RLHF (REINFORCE), Llama-3.1-Nemotron-70B-Reward, and HelpSteer2-Preference prompts.",
"nvidia/llama-3.1-nemotron-51b-instruct.description": "A distinctive language model delivering exceptional accuracy and efficiency.",
"nvidia/llama-3.1-nemotron-70b-instruct.description": "Llama-3.1-Nemotron-70B-Instruct is a custom NVIDIA model designed to improve the helpfulness of LLM responses.",
"o1-mini.description": "Smaller and faster than o1-preview, 80% lower cost, strong at code generation and short-context tasks.",
"o1-preview.description": "Focused on advanced reasoning and complex problem solving, including math and science. Ideal for applications needing deep context understanding and autonomous workflows.",
"o1-mini.description": "o1-mini is a fast, cost-effective reasoning model designed for coding, math, and science. It has 128K context and an October 2023 knowledge cutoff.",
"o1-preview.description": "o1 is OpenAIs new reasoning model for complex tasks requiring broad knowledge. It has 128K context and an October 2023 knowledge cutoff.",
"o1-pro.description": "The o1 series is trained with reinforcement learning to think before answering and handle complex reasoning. o1-pro uses more compute for deeper thinking and consistently higher-quality answers.",
"o1.description": "o1 is OpenAIs new reasoning model with text+image input and text output, suited for complex tasks requiring broad knowledge. It has a 200K context window and an October 2023 knowledge cutoff.",
"o3-2025-04-16.description": "o3 is OpenAIs new reasoning model with text+image input and text output for complex tasks requiring broad knowledge.",
@@ -1022,7 +1027,6 @@
"qianfan-check-vl.description": "Qianfan Check VL is a multimodal content review model for image-text compliance and recognition tasks.",
"qianfan-composition.description": "Qianfan Composition is a multimodal creation model for mixed image-text understanding and generation.",
"qianfan-engcard-vl.description": "Qianfan EngCard VL is a multimodal recognition model focused on English scenarios.",
"qianfan-lightning-128b-a19b.description": "Qianfan Lightning 128B A19B is a high-performance Chinese general model for complex QA and large-scale reasoning.",
"qianfan-llama-vl-8b.description": "Qianfan Llama VL 8B is a Llama-based multimodal model for general image-text understanding.",
"qianfan-multipicocr.description": "Qianfan MultiPicOCR is a multi-image OCR model for text detection and recognition across images.",
"qianfan-qi-vl.description": "Qianfan QI VL is a multimodal QA model for accurate retrieval and QA in complex image-text scenarios.",
@@ -1032,7 +1036,6 @@
"qvq-72b-preview.description": "QVQ-72B-Preview is an experimental research model from Qwen focused on improving visual reasoning.",
"qvq-max.description": "Qwen QVQ visual reasoning model supports vision input and chain-of-thought output, with stronger performance in math, coding, visual analysis, creative, and general tasks.",
"qvq-plus.description": "Visual reasoning model with vision input and chain-of-thought output. The qvq-plus series follows qvq-max and offers faster reasoning with a better quality-cost balance.",
"qwen-3-32b.description": "Qwen 3 32B: strong at multilingual and coding tasks, suitable for mid-scale production use.",
"qwen-coder-plus.description": "Qwen code model.",
"qwen-coder-turbo-latest.description": "Qwen code model.",
"qwen-coder-turbo.description": "Qwen code model.",
@@ -1128,7 +1131,6 @@
"qwen3-coder-next.description": "Nextgen Qwen coder optimized for complex multi-file code generation, debugging, and highthroughput agent workflows. Designed for strong tool integration and improved reasoning performance.",
"qwen3-coder-plus.description": "Qwen code model. The latest Qwen3-Coder series is based on Qwen3 and delivers strong coding-agent abilities, tool use, and environment interaction for autonomous programming, with excellent code performance and solid general capability.",
"qwen3-coder:480b.description": "Alibaba's high-performance long-context model for agent and coding tasks.",
"qwen3-max-2026-01-23.description": "Qwen3 Max models deliver large gains over the 2.5 series in general ability, Chinese/English understanding, complex instruction following, subjective open tasks, multilingual ability, and tool use, with fewer hallucinations. The latest qwen3-max improves agentic programming and tool use over qwen3-max-preview. This release reaches field SOTA and targets more complex agent needs.",
"qwen3-max-preview.description": "Best-performing Qwen model for complex, multi-step tasks. The preview supports thinking.",
"qwen3-max.description": "Qwen3 Max models deliver large gains over the 2.5 series in general ability, Chinese/English understanding, complex instruction following, subjective open tasks, multilingual ability, and tool use, with fewer hallucinations. The latest qwen3-max improves agentic programming and tool use over qwen3-max-preview. This release reaches field SOTA and targets more complex agent needs.",
"qwen3-next-80b-a3b-instruct.description": "Next-gen Qwen3 non-thinking open-source model. Compared to the prior version (Qwen3-235B-A22B-Instruct-2507), it has better Chinese understanding, stronger logical reasoning, and improved text generation.",
@@ -1145,7 +1147,8 @@
"qwen3-vl-flash.description": "Qwen3 VL Flash: lightweight, high-speed reasoning version for latency-sensitive or high-volume requests.",
"qwen3-vl-plus.description": "Qwen VL is a text generation model with vision understanding. It can do OCR and also summarize and reason, such as extracting attributes from product photos or solving problems from images.",
"qwen3.5-397b-a17b.description": "Supports text, image, and video inputs. For text-only tasks, its performance is comparable to Qwen3 Max, offering higher efficiency and lower cost. In multimodal capabilities, it delivers significant improvements over the Qwen3 VL series.",
"qwen3.5-plus.description": "Qwen3.5 Plus supports text, image, and video inputs. For text-only tasks, its performance is comparable to Qwen3 Max, while delivering better efficiency and lower cost. In terms of multimodal capabilities, it shows significant improvements over the Qwen3 VL series.",
"qwen3.5-plus.description": "Qwen3.5 Plus supports text, image, and video input. Its performance on pure text tasks is comparable to Qwen3 Max, with better performance and lower cost. Its multimodal capabilities are significantly improved compared to the Qwen3 VL series.",
"qwen3.5:397b.description": "Qwen3.5 is a unified visionlanguage foundation model with a hybrid architecture (Mixture-of-Experts + linear attention), offering strong multimodal reasoning, coding, and long-context capabilities with a 256K context window.",
"qwen3.description": "Qwen3 is Alibabas next-generation large language model with strong performance across diverse use cases.",
"qwq-32b-preview.description": "QwQ is an experimental research model from Qwen focused on improved reasoning.",
"qwq-32b.description": "QwQ is a reasoning model in the Qwen family. Compared with standard instruction-tuned models, it brings thinking and reasoning that significantly boost downstream performance, especially on complex problems. QwQ-32B is a mid-sized reasoning model that rivals top reasoning models like DeepSeek-R1 and o1-mini.",
@@ -1187,7 +1190,7 @@
"step-2-16k.description": "Supports large-context interactions for complex dialogues.",
"step-2-mini.description": "Built on the next-generation in-house MFA attention architecture, delivering Step-1-like results at much lower cost while achieving higher throughput and faster latency. Handles general tasks with strong coding ability.",
"step-2x-large.description": "A new-generation StepFun image model focused on image generation, producing high-quality images from text prompts. It delivers more realistic texture and stronger Chinese/English text rendering.",
"step-3.5-flash.description": "The flagship language reasoning model from Stepfun. This model delivers top-tier reasoning capabilities along with fast and reliable execution. It can decompose and plan complex tasks, quickly and reliably invoke tools to carry them out, and excel in logical reasoning, mathematics, software engineering, deep research, and other sophisticated tasks. The context length is 256K.",
"step-3.5-flash.description": "Stepfuns flagship language reasoning model.This model has top-notch reasoning capabilities and fast and reliable execution capabilities.Able to decompose and plan complex tasks, call tools quickly and reliably to perform tasks, and be competent in various complex tasks such as logical reasoning, mathematics, software engineering, and in-depth research.",
"step-3.description": "This model has strong visual perception and complex reasoning, accurately handling cross-domain knowledge understanding, math-vision cross analysis, and a wide range of everyday visual analysis tasks.",
"step-r1-v-mini.description": "A reasoning model with strong image understanding that can process images and text, then generate text after deep reasoning. It excels at visual reasoning and delivers top-tier math, coding, and text reasoning, with a 100K context window.",
"stepfun-ai/step3.description": "Step3 is a cutting-edge multimodal reasoning model from StepFun, built on an MoE architecture with 321B total and 38B active parameters. Its end-to-end design minimizes decoding cost while delivering top-tier vision-language reasoning. With MFA and AFD design, it stays efficient on both flagship and low-end accelerators. Pretraining uses 20T+ text tokens and 4T image-text tokens across many languages. It reaches leading open-model performance on math, code, and multimodal benchmarks.",
@@ -1276,10 +1279,11 @@
"z-ai/glm4.7.description": "GLM-4.7 is Zhipu latest flagship model, enhanced for Agentic Coding scenarios with improved coding capabilities.",
"z-ai/glm5.description": "GLM-5 is Zhipu AI's new flagship foundation model for agent engineering, achieving open-source SOTA performance in coding and agent capabilities. It matches Claude Opus 4.5 in performance.",
"z-image-turbo.description": "Z-Image is a lightweight text-to-image generation model that can rapidly produce images, supports both Chinese and English text rendering, and flexibly adapts to multiple resolutions and aspect ratios.",
"zai-glm-4.7.description": "This model delivers strong coding performance with advanced reasoning capabilities, superior tool use, and enhanced real-world performance in agentic coding applications.",
"zai-org/GLM-4.5-Air.description": "GLM-4.5-Air is a base model for agent applications using a Mixture-of-Experts architecture. It is optimized for tool use, web browsing, software engineering, and frontend coding, and integrates with code agents like Claude Code and Roo Code. It uses hybrid reasoning to handle both complex reasoning and everyday scenarios.",
"zai-org/GLM-4.5.description": "GLM-4.5 is a base model built for agent applications using a Mixture-of-Experts architecture. It is deeply optimized for tool use, web browsing, software engineering, and frontend coding, and integrates with code agents like Claude Code and Roo Code. It uses hybrid reasoning to handle both complex reasoning and everyday scenarios.",
"zai-org/GLM-4.5V.description": "GLM-4.5V is Zhipu AIs latest VLM, built on the GLM-4.5-Air flagship text model (106B total, 12B active) with an MoE architecture for strong performance at lower cost. It follows the GLM-4.1V-Thinking path and adds 3D-RoPE to improve 3D spatial reasoning. Optimized through pretraining, SFT, and RL, it handles images, video, and long documents and ranks top among open models on 41 public multimodal benchmarks. A Thinking mode toggle lets users balance speed and depth.",
"zai-org/GLM-4.6.description": "Compared to GLM-4.5, GLM-4.6 expands context from 128K to 200K for more complex agent tasks. It scores higher on code benchmarks and shows stronger real-world performance in apps like Claude Code, Cline, Roo Code, and Kilo Code, including better frontend page generation. Reasoning is improved and tool use is supported during reasoning, strengthening overall capability. It integrates better into agent frameworks, improves tool/search agents, and has more human-preferred writing style and roleplay naturalness.",
"zai-org/GLM-4.6V.description": "GLM-4.6V 在视觉理解精度上达到同参数规模 SOTA,并首次在模型架构中将 Function Call(工具调用)能力原生融入视觉模型,打通从「视觉感知」到「可执行行动(Action)」的链路,为真实业务场景中的多模态 Agent 提供统一的技术底座。",
"zai/glm-4.5-air.description": "GLM-4.5 and GLM-4.5-Air are our latest flagships for agent applications, both using MoE. GLM-4.5 has 355B total and 32B active per forward pass; GLM-4.5-Air is slimmer with 106B total and 12B active.",
"zai/glm-4.5.description": "The GLM-4.5 series is designed for agents. The flagship GLM-4.5 combines reasoning, coding, and agent skills with 355B total params (32B active) and offers dual operation modes as a hybrid reasoning system.",
"zai/glm-4.5v.description": "GLM-4.5V builds on GLM-4.5-Air, inheriting proven GLM-4.1V-Thinking techniques and scaling with a strong 106B-parameter MoE architecture.",
+14
View File
@@ -24,6 +24,20 @@
"builtins.lobe-agent-builder.inspector.noResults": "No results",
"builtins.lobe-agent-builder.inspector.togglePlugin": "Toggle",
"builtins.lobe-agent-builder.title": "Agent Builder Expert",
"builtins.lobe-agent-management.apiName.callAgent": "Call agent",
"builtins.lobe-agent-management.apiName.createAgent": "Create agent",
"builtins.lobe-agent-management.apiName.deleteAgent": "Delete agent",
"builtins.lobe-agent-management.apiName.searchAgent": "Search agents",
"builtins.lobe-agent-management.apiName.updateAgent": "Update agent",
"builtins.lobe-agent-management.inspector.callAgent.sync": "Calling:",
"builtins.lobe-agent-management.inspector.callAgent.task": "Assigning task to:",
"builtins.lobe-agent-management.inspector.createAgent.title": "Creating agent:",
"builtins.lobe-agent-management.inspector.searchAgent.all": "Search agents:",
"builtins.lobe-agent-management.inspector.searchAgent.market": "Search market:",
"builtins.lobe-agent-management.inspector.searchAgent.results": "{{count}} results",
"builtins.lobe-agent-management.inspector.searchAgent.user": "Search my agents:",
"builtins.lobe-agent-management.inspector.updateAgent.title": "Updating agent:",
"builtins.lobe-agent-management.title": "Agent Manager",
"builtins.lobe-cloud-sandbox.apiName.editLocalFile": "Edit file",
"builtins.lobe-cloud-sandbox.apiName.executeCode": "Execute code",
"builtins.lobe-cloud-sandbox.apiName.exportFile": "Export file",
+7 -3
View File
@@ -224,15 +224,18 @@
"providerModels.item.modelConfig.extendParams.options.gpt5_2ProReasoningEffort.hint": "Para la serie GPT-5.2 Pro; controla la intensidad del razonamiento.",
"providerModels.item.modelConfig.extendParams.options.gpt5_2ReasoningEffort.hint": "Para la serie GPT-5.2; controla la intensidad del razonamiento.",
"providerModels.item.modelConfig.extendParams.options.imageAspectRatio.hint": "Para modelos de generación de imágenes Gemini; controla la relación de aspecto de las imágenes generadas.",
"providerModels.item.modelConfig.extendParams.options.imageAspectRatio2.hint": "Para Nano Banana 2; controla la relación de aspecto de las imágenes generadas (admite ultra ancha 1:4, 4:1, 1:8, 8:1).",
"providerModels.item.modelConfig.extendParams.options.imageResolution.hint": "Para modelos de generación de imágenes Gemini 3; controla la resolución de las imágenes generadas.",
"providerModels.item.modelConfig.extendParams.options.imageResolution2.hint": "Para modelos de imágenes Gemini 3.1 Flash; controla la resolución de las imágenes generadas (admite 512px).",
"providerModels.item.modelConfig.extendParams.options.reasoningBudgetToken.hint": "Para Claude, Qwen3 y similares; controla el presupuesto de tokens para el razonamiento.",
"providerModels.item.modelConfig.extendParams.options.reasoningEffort.hint": "Para OpenAI y otros modelos con capacidad de razonamiento; controla el esfuerzo de razonamiento.",
"providerModels.item.modelConfig.extendParams.options.textVerbosity.hint": "Para la serie GPT-5+; controla la verbosidad del resultado.",
"providerModels.item.modelConfig.extendParams.options.thinking.hint": "Para algunos modelos Doubao; permite que el modelo decida si debe pensar en profundidad.",
"providerModels.item.modelConfig.extendParams.options.thinkingBudget.hint": "Para la serie Gemini; controla el presupuesto de pensamiento.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel.hint": "Para modelos Gemini 3 Flash Preview; controla la profundidad del pensamiento.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel2.hint": "Para modelos Gemini 3 Pro Preview; controla la profundidad del pensamiento.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel3.hint": "Para los modelos Gemini 3.1 Pro Preview; controla la profundidad de pensamiento con niveles bajo/medio/alto.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel.hint": "Para modelos Gemini 3 Flash Preview; controla la profundidad de pensamiento.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel2.hint": "Para modelos Gemini 3 Pro Preview; controla la profundidad de pensamiento.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel3.hint": "Para modelos Gemini 3.1 Pro Preview; controla la profundidad de pensamiento con niveles bajo/medio/alto.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel4.hint": "Para modelos Gemini 3.1 Flash Image; activa o desactiva el pensamiento.",
"providerModels.item.modelConfig.extendParams.options.urlContext.hint": "Para la serie Gemini; permite proporcionar contexto mediante URL.",
"providerModels.item.modelConfig.extendParams.placeholder": "Selecciona los parámetros extendidos a habilitar",
"providerModels.item.modelConfig.extendParams.previewFallback": "Vista previa no disponible",
@@ -311,6 +314,7 @@
"providerModels.tabs.image": "Imagen",
"providerModels.tabs.stt": "ASR",
"providerModels.tabs.tts": "TTS",
"providerModels.tabs.video": "Vídeo",
"sortModal.success": "Orden actualizado con éxito",
"sortModal.title": "Orden personalizado",
"sortModal.update": "Actualizar",
+35 -31
View File
@@ -55,7 +55,8 @@
"FLUX.1-dev.description": "FLUX.1-dev es un modelo de lenguaje multimodal de código abierto (MLLM) de Black Forest Labs, optimizado para tareas de imagen y texto. Combina comprensión y generación de imagen/texto. Basado en LLMs avanzados (como Mistral-7B), utiliza un codificador visual cuidadosamente diseñado y ajuste por etapas para lograr coordinación multimodal y razonamiento complejo.",
"Gryphe/MythoMax-L2-13b.description": "MythoMax-L2 (13B) es un modelo innovador para dominios diversos y tareas complejas.",
"HelloMeme.description": "HelloMeme es una herramienta de IA que genera memes, GIFs o videos cortos a partir de imágenes o movimientos proporcionados. No requiere habilidades de dibujo ni programación: solo una imagen de referencia para crear contenido divertido, atractivo y estilísticamente coherente.",
"HiDream-I1-Full.description": "HiDream-E1-Full es un modelo de edición de imágenes multimodal de código abierto de HiDream.ai, basado en una arquitectura avanzada Diffusion Transformer y una sólida comprensión del lenguaje (con LLaMA 3.1-8B-Instruct incorporado). Admite generación de imágenes guiada por lenguaje natural, transferencia de estilo, ediciones locales y repintado, con excelente comprensión y ejecución imagen-texto.",
"HiDream-E1-Full.description": "HiDream-E1-Full es un modelo de edición de imágenes multimodal de código abierto de HiDream.ai, basado en una avanzada arquitectura Diffusion Transformer y una sólida comprensión del lenguaje (LLaMA 3.1-8B-Instruct incorporado). Admite generación de imágenes impulsada por lenguaje natural, transferencia de estilo, ediciones locales y repintado, con excelente comprensión y ejecución de texto e imagen.",
"HiDream-I1-Full.description": "HiDream-I1 es un nuevo modelo de generación de imágenes base de código abierto lanzado por HiDream. Con 17 mil millones de parámetros (Flux tiene 12 mil millones), puede ofrecer calidad de imagen líder en la industria en segundos.",
"HunyuanDiT-v1.2-Diffusers-Distilled.description": "hunyuandit-v1.2-distilled es un modelo ligero de texto a imagen optimizado mediante destilación para generar imágenes de alta calidad rápidamente, especialmente adecuado para entornos con pocos recursos y generación en tiempo real.",
"InstantCharacter.description": "InstantCharacter es un modelo de generación de personajes personalizados sin necesidad de ajuste, lanzado por Tencent AI en 2025. Permite generar personajes con alta fidelidad y consistencia entre escenarios. Puede modelar un personaje a partir de una sola imagen de referencia y transferirlo con flexibilidad entre estilos, acciones y fondos.",
"InternVL2-8B.description": "InternVL2-8B es un potente modelo visión-lenguaje que admite procesamiento multimodal imagen-texto, reconociendo con precisión el contenido visual y generando descripciones o respuestas relevantes.",
@@ -80,7 +81,7 @@
"MiniMax-M2.1.description": "MiniMax-M2.1 es un modelo insignia de código abierto de MiniMax, enfocado en resolver tareas complejas del mundo real. Sus principales fortalezas son sus capacidades de programación multilingüe y su habilidad para resolver tareas complejas como un Agente.",
"MiniMax-M2.5-Lightning.description": "M2.5 Lightning: Misma rendimiento, más rápido y ágil (aproximadamente 100 tps).",
"MiniMax-M2.5-highspeed.description": "Misma rendimiento que M2.5 con una inferencia significativamente más rápida.",
"MiniMax-M2.5.description": "Rendimiento de primera categoría y máxima rentabilidad, manejando fácilmente tareas complejas (aproximadamente 60 tps).",
"MiniMax-M2.5.description": "MiniMax-M2.5 es un modelo insignia de código abierto de gran tamaño de MiniMax, enfocado en resolver tareas complejas del mundo real. Sus principales fortalezas son las capacidades de programación multilingüe y la habilidad para resolver tareas complejas como un Agente.",
"MiniMax-M2.description": "Diseñado específicamente para una codificación eficiente y flujos de trabajo con agentes",
"MiniMax-Text-01.description": "MiniMax-01 introduce atención lineal a gran escala más allá de los Transformers clásicos, con 456B de parámetros y 45.9B activados por paso. Logra rendimiento de primer nivel y admite hasta 4M tokens de contexto (32× GPT-4o, 20× Claude-3.5-Sonnet).",
"MiniMaxAI/MiniMax-M1-80k.description": "MiniMax-M1 es un modelo de razonamiento híbrido de gran escala con pesos abiertos, 456B de parámetros totales y ~45.9B activos por token. Admite nativamente 1M de contexto y utiliza Flash Attention para reducir FLOPs en un 75% en generación de 100K tokens frente a DeepSeek R1. Con arquitectura MoE más CISPO y entrenamiento híbrido con atención y RL, logra rendimiento líder en razonamiento con entradas largas y tareas reales de ingeniería de software.",
@@ -98,6 +99,7 @@
"Phi-3.5-mini-instruct.description": "Una versión actualizada del modelo Phi-3-mini.",
"Phi-3.5-vision-instrust.description": "Una versión actualizada del modelo Phi-3-vision.",
"Pro/MiniMaxAI/MiniMax-M2.1.description": "MiniMax-M2.1 es un modelo de lenguaje de código abierto optimizado para capacidades de agente, sobresaliendo en programación, uso de herramientas, seguimiento de instrucciones y planificación a largo plazo. El modelo admite desarrollo de software multilingüe y ejecución de flujos de trabajo complejos en múltiples pasos, logrando una puntuación de 74.0 en SWE-bench Verified y superando a Claude Sonnet 4.5 en escenarios multilingües.",
"Pro/MiniMaxAI/MiniMax-M2.5.description": "MiniMax-M2.5 es el último modelo de lenguaje grande desarrollado por MiniMax, entrenado mediante aprendizaje por refuerzo a gran escala en cientos de miles de entornos complejos del mundo real. Con una arquitectura MoE y 229 mil millones de parámetros, logra un rendimiento líder en la industria en tareas como programación, uso de herramientas por agentes, búsqueda y escenarios de oficina.",
"Pro/Qwen/Qwen2-7B-Instruct.description": "Qwen2-7B-Instruct es un modelo LLM de 7 mil millones de parámetros ajustado para instrucciones de la serie Qwen2. Utiliza arquitectura Transformer con SwiGLU, sesgo QKV en atención y atención de consulta agrupada, y maneja entradas extensas. Tiene un rendimiento destacado en comprensión del lenguaje, generación, tareas multilingües, programación, matemáticas y razonamiento, superando a la mayoría de los modelos abiertos y compitiendo con modelos propietarios. Supera a Qwen1.5-7B-Chat en múltiples pruebas.",
"Pro/Qwen/Qwen2.5-7B-Instruct.description": "Qwen2.5-7B-Instruct forma parte de la última serie de LLM de Alibaba Cloud. El modelo de 7 mil millones ofrece mejoras notables en programación y matemáticas, admite más de 29 idiomas y mejora el seguimiento de instrucciones, la comprensión de datos estructurados y la generación de salidas estructuradas (especialmente JSON).",
"Pro/Qwen/Qwen2.5-Coder-7B-Instruct.description": "Qwen2.5-Coder-7B-Instruct es el último modelo LLM de Alibaba Cloud enfocado en programación. Basado en Qwen2.5 y entrenado con 5,5 billones de tokens, mejora significativamente la generación, razonamiento y corrección de código, manteniendo fortalezas en matemáticas y tareas generales, proporcionando una base sólida para agentes de programación.",
@@ -107,13 +109,13 @@
"Pro/deepseek-ai/DeepSeek-R1-Distill-Qwen-7B.description": "DeepSeek-R1-Distill-Qwen-7B es una destilación de Qwen2.5-Math-7B ajustada con 800 mil muestras seleccionadas de DeepSeek-R1. Tiene un rendimiento destacado, con 92,8% en MATH-500, 55,5% en AIME 2024 y una puntuación de 1189 en CodeForces para un modelo de 7 mil millones.",
"Pro/deepseek-ai/DeepSeek-R1.description": "DeepSeek-R1 es un modelo de razonamiento impulsado por aprendizaje por refuerzo que reduce la repetición y mejora la legibilidad. Utiliza datos de arranque en frío antes del RL para potenciar aún más el razonamiento, iguala a OpenAI-o1 en tareas de matemáticas, programación y razonamiento, y mejora los resultados generales mediante un entrenamiento cuidadoso.",
"Pro/deepseek-ai/DeepSeek-V3.1-Terminus.description": "DeepSeek-V3.1-Terminus es una versión actualizada del modelo V3.1, posicionado como un LLM híbrido para agentes. Corrige problemas reportados por usuarios y mejora la estabilidad, coherencia lingüística y reduce caracteres anómalos o mezclas de chino/inglés. Integra modos de razonamiento y no razonamiento con plantillas de chat para cambiar de forma flexible. También mejora el rendimiento de los agentes de código y búsqueda para un uso más fiable de herramientas y tareas de múltiples pasos.",
"Pro/deepseek-ai/DeepSeek-V3.2-Exp.description": "DeepSeek-V3.2-Exp es una versión experimental de V3.2 que sirve de puente hacia la próxima arquitectura. Añade DeepSeek Sparse Attention (DSA) sobre V3.1-Terminus para mejorar el entrenamiento e inferencia en contextos largos, con optimizaciones para uso de herramientas, comprensión de documentos extensos y razonamiento de múltiples pasos. Ideal para explorar mayor eficiencia de razonamiento con presupuestos de contexto amplios.",
"Pro/deepseek-ai/DeepSeek-V3.2.description": "DeepSeek-V3.2 es un modelo que combina alta eficiencia computacional con excelente razonamiento y rendimiento como Agente. Su enfoque se basa en tres avances tecnológicos clave: DeepSeek Sparse Attention (DSA), un mecanismo de atención eficiente que reduce significativamente la complejidad computacional mientras mantiene el rendimiento del modelo, optimizado específicamente para escenarios de contexto largo; un marco de aprendizaje por refuerzo escalable que permite que el rendimiento del modelo rivalice con GPT-5, con su versión de alta computación igualando a Gemini-3.0-Pro en capacidades de razonamiento; y una tubería de síntesis de tareas de Agente a gran escala diseñada para integrar capacidades de razonamiento en escenarios de uso de herramientas, mejorando así el seguimiento de instrucciones y la generalización en entornos interactivos complejos. El modelo obtuvo medallas de oro en la Olimpiada Internacional de Matemáticas (IMO) y la Olimpiada Internacional de Informática (IOI) de 2025.",
"Pro/deepseek-ai/DeepSeek-V3.description": "DeepSeek-V3 es un modelo MoE de 671 mil millones de parámetros que utiliza MLA y DeepSeekMoE con balanceo de carga sin pérdida para inferencia y entrenamiento eficientes. Preentrenado con 14,8 billones de tokens de alta calidad y ajustado con SFT y RL, supera a otros modelos abiertos y se acerca al rendimiento de modelos cerrados líderes.",
"Pro/moonshotai/Kimi-K2-Instruct-0905.description": "Kimi K2-Instruct-0905 es la versión más reciente y potente de Kimi K2. Es un modelo MoE de primer nivel con 1 billón de parámetros totales y 32 mil millones activos. Sus características clave incluyen mayor inteligencia en programación con agentes, mejoras significativas en pruebas de referencia y tareas reales de agentes, además de una estética y usabilidad mejoradas en programación frontend.",
"Pro/moonshotai/Kimi-K2-Thinking.description": "Kimi K2 Thinking Turbo es la variante Turbo optimizada para velocidad de razonamiento y rendimiento, manteniendo el razonamiento de múltiples pasos y uso de herramientas de K2 Thinking. Es un modelo MoE con aproximadamente 1 billón de parámetros totales, contexto nativo de 256K y llamadas a herramientas estables a gran escala para escenarios de producción con necesidades estrictas de latencia y concurrencia.",
"Pro/moonshotai/Kimi-K2.5.description": "Kimi K2.5 es un modelo agente multimodal nativo de código abierto, basado en Kimi-K2-Base, entrenado con aproximadamente 1.5 billones de tokens mixtos de visión y texto. El modelo adopta una arquitectura MoE con 1T de parámetros totales y 32B de parámetros activos, soportando una ventana de contexto de 256K, integrando de forma fluida capacidades de comprensión visual y lingüística.",
"Pro/zai-org/glm-4.7.description": "GLM-4.7 es el modelo insignia de nueva generación de Zhipu, con un total de 355 mil millones de parámetros y 32 mil millones activos. Ha sido completamente mejorado en capacidades de diálogo general, razonamiento y agentes. GLM-4.7 potencia el Pensamiento Intercalado e introduce el Pensamiento Preservado y el Pensamiento a Nivel de Turno.",
"Pro/zai-org/glm-5.description": "GLM-5 es el nuevo modelo de lenguaje avanzado lanzado por Zhipu, enfocado en ingeniería de sistemas complejos y tareas de agentes de largo plazo. Los parámetros del modelo se expanden a 744B (40B activos) e integran DeepSeek Sparse Attention.",
"Pro/zai-org/glm-5.description": "GLM-5 es el modelo de lenguaje grande de próxima generación de Zhipu, enfocado en ingeniería de sistemas complejos y tareas de Agente de larga duración. Los parámetros del modelo se han ampliado a 744 mil millones (40 mil millones activos) e integran DeepSeek Sparse Attention.",
"QwQ-32B-Preview.description": "Qwen QwQ es un modelo de investigación experimental centrado en mejorar el razonamiento.",
"Qwen/QVQ-72B-Preview.description": "QVQ-72B-Preview es un modelo de investigación de Qwen enfocado en razonamiento visual, con fortalezas en comprensión de escenas complejas y problemas visuales de matemáticas.",
"Qwen/QwQ-32B-Preview.description": "Qwen QwQ es un modelo de investigación experimental centrado en mejorar el razonamiento de IA.",
@@ -137,7 +139,7 @@
"Qwen/Qwen3-14B.description": "Qwen3 es un modelo Tongyi Qwen de nueva generación con grandes avances en razonamiento, capacidad general, habilidades de agente y rendimiento multilingüe, y permite cambiar entre modos de pensamiento.",
"Qwen/Qwen3-235B-A22B-Instruct-2507.description": "Qwen3-235B-A22B-Instruct-2507 es un modelo insignia MoE de Qwen3 con 235B parámetros totales y 22B activos. Es una versión sin modo de pensamiento centrada en mejorar el seguimiento de instrucciones, el razonamiento lógico, la comprensión de texto, matemáticas, ciencia, programación y uso de herramientas. También amplía el conocimiento multilingüe de nicho y se alinea mejor con las preferencias del usuario en tareas abiertas y subjetivas.",
"Qwen/Qwen3-235B-A22B-Thinking-2507.description": "Qwen3-235B-A22B-Thinking-2507 es un modelo Qwen3 centrado en razonamiento complejo. Utiliza una arquitectura MoE con 235B parámetros totales y ~22B activos por token para mejorar la eficiencia. Como modelo dedicado al pensamiento, muestra grandes avances en lógica, matemáticas, ciencia, programación y pruebas académicas, alcanzando un rendimiento de primer nivel en razonamiento abierto. También mejora el seguimiento de instrucciones, el uso de herramientas y la generación de texto, y admite de forma nativa un contexto de 256K para razonamiento profundo y documentos extensos.",
"Qwen/Qwen3-235B-A22B.description": "Qwen3 es un modelo Tongyi Qwen de nueva generación con grandes avances en razonamiento, capacidad general, habilidades de agente y rendimiento multilingüe, y permite cambiar entre modos de pensamiento.",
"Qwen/Qwen3-235B-A22B.description": "Qwen3 235B A22B es el modelo ultraescalado de Qwen3 que ofrece capacidades de IA de primer nivel.",
"Qwen/Qwen3-30B-A3B-Instruct-2507.description": "Qwen3-30B-A3B-Instruct-2507 es la versión sin modo de pensamiento actualizada de Qwen3-30B-A3B. Es un modelo MoE con 30.5B parámetros totales y 3.3B activos. Mejora significativamente el seguimiento de instrucciones, el razonamiento lógico, la comprensión de texto, matemáticas, ciencia, programación y uso de herramientas, amplía el conocimiento multilingüe de nicho y se alinea mejor con las preferencias del usuario en tareas abiertas y subjetivas. Admite contexto de 256K. Este modelo es solo sin pensamiento y no generará etiquetas `<think></think>`.",
"Qwen/Qwen3-30B-A3B-Thinking-2507.description": "Qwen3-30B-A3B-Thinking-2507 es el modelo de pensamiento más reciente de la serie Qwen3. Es un modelo MoE con 30.5B parámetros totales y 3.3B activos, centrado en tareas complejas. Muestra avances significativos en lógica, matemáticas, ciencia, programación y pruebas académicas, y mejora el seguimiento de instrucciones, el uso de herramientas, la generación de texto y la alineación con preferencias. Admite de forma nativa contexto de 256K y puede extenderse hasta 1M tokens. Esta versión está diseñada para el modo de pensamiento con razonamiento detallado paso a paso y sólidas capacidades de agente.",
"Qwen/Qwen3-30B-A3B.description": "Qwen3 es un modelo Tongyi Qwen de nueva generación con grandes avances en razonamiento, capacidad general, habilidades de agente y rendimiento multilingüe, y permite cambiar entre modos de pensamiento.",
@@ -315,7 +317,6 @@
"codeqwen.description": "CodeQwen1.5 es un modelo de lenguaje grande entrenado con datos extensos de código, diseñado para tareas de programación complejas.",
"codestral-latest.description": "Codestral es nuestro modelo de codificación más avanzado; la versión v2 (enero 2025) está orientada a tareas de baja latencia y alta frecuencia como FIM, corrección de código y generación de pruebas.",
"codestral.description": "Codestral es el primer modelo de código de Mistral AI, ofreciendo un sólido soporte para generación de código.",
"codex-mini-latest.description": "codex-mini-latest es un modelo o4-mini ajustado para la CLI de Codex. Para uso directo con API, se recomienda comenzar con gpt-4.1.",
"cogito-2.1:671b.description": "Cogito v2.1 671B es un modelo de lenguaje abierto de EE. UU. de uso comercial gratuito, con un rendimiento comparable a los mejores modelos, mayor eficiencia en razonamiento por tokens, contexto largo de 128k y gran capacidad general.",
"cogview-3-flash.description": "CogView-3-Flash es un modelo gratuito de generación de imágenes lanzado por Zhipu. Genera imágenes que se alinean con las instrucciones del usuario mientras logra puntuaciones más altas en calidad estética. CogView-3-Flash se utiliza principalmente en campos como la creación artística, referencia de diseño, desarrollo de videojuegos y realidad virtual, ayudando a los usuarios a convertir rápidamente descripciones de texto en imágenes.",
"cogview-4.description": "CogView-4 es el primer modelo de texto a imagen de código abierto de Zhipu que puede generar caracteres chinos. Mejora la comprensión semántica, la calidad de imagen y la representación de texto en chino/inglés, admite entradas bilingües de longitud arbitraria y puede generar imágenes en cualquier resolución dentro de los rangos especificados.",
@@ -342,7 +343,7 @@
"command-light-nightly.description": "Para acortar el tiempo entre versiones principales, ofrecemos compilaciones nocturnas de Command. Para la serie command-light, se llama command-light-nightly. Es la versión más nueva y experimental (y potencialmente inestable), actualizada regularmente sin previo aviso, por lo que no se recomienda para producción.",
"command-light.description": "Una variante más pequeña y rápida de Command que es casi igual de capaz pero más veloz.",
"command-nightly.description": "Para acortar el tiempo entre versiones principales, ofrecemos compilaciones nocturnas de Command. Para la serie Command, se llama command-nightly. Es la versión más nueva y experimental (y potencialmente inestable), actualizada regularmente sin previo aviso, por lo que no se recomienda para producción.",
"command-r-03-2024.description": "Command R es un modelo de chat que sigue instrucciones con mayor calidad, fiabilidad y una ventana de contexto más larga que modelos anteriores. Admite flujos de trabajo complejos como generación de código, RAG, uso de herramientas y agentes.",
"command-r-03-2024.description": "command-r es un modelo de chat que sigue instrucciones y realiza tareas de lenguaje con mayor calidad, confiabilidad mejorada y contexto más largo que los modelos anteriores. Admite flujos de trabajo complejos como generación de código, RAG, uso de herramientas y agentes.",
"command-r-08-2024.description": "command-r-08-2024 es una versión actualizada del modelo Command R lanzada en agosto de 2024.",
"command-r-plus-04-2024.description": "command-r-plus es un alias de command-r-plus-04-2024, por lo que usar command-r-plus en la API apunta a ese modelo.",
"command-r-plus-08-2024.description": "Command R+ es un modelo de chat que sigue instrucciones con mayor calidad, fiabilidad y una ventana de contexto más larga que modelos anteriores. Es ideal para flujos de trabajo RAG complejos y uso de herramientas en múltiples pasos.",
@@ -366,7 +367,8 @@
"deepseek-ai/DeepSeek-V2.5.description": "DeepSeek-V2.5 mejora DeepSeek-V2-Chat y DeepSeek-Coder-V2-Instruct, combinando capacidades generales y de programación. Mejora la redacción y el seguimiento de instrucciones para una mejor alineación con las preferencias, mostrando avances significativos en AlpacaEval 2.0, ArenaHard, AlignBench y MT-Bench.",
"deepseek-ai/DeepSeek-V3.1-Terminus.description": "DeepSeek-V3.1-Terminus es una versión actualizada del modelo V3.1, concebido como un agente híbrido. Corrige problemas reportados por usuarios y mejora la estabilidad, coherencia lingüística y reduce caracteres anómalos o mezclas de chino/inglés. Integra modos de pensamiento y no pensamiento con plantillas de chat para cambiar de forma flexible. También mejora el rendimiento de los agentes de código y búsqueda para un uso más confiable de herramientas y tareas de múltiples pasos.",
"deepseek-ai/DeepSeek-V3.1.description": "DeepSeek V3.1 utiliza una arquitectura de razonamiento híbrido y admite modos de pensamiento y no pensamiento.",
"deepseek-ai/DeepSeek-V3.2-Exp.description": "DeepSeek-V3.2-Exp es una versión experimental de V3.2 que sirve de puente hacia la próxima arquitectura. Añade DeepSeek Sparse Attention (DSA) sobre V3.1-Terminus para mejorar el entrenamiento y la inferencia en contextos largos, con optimizaciones para el uso de herramientas, comprensión de documentos extensos y razonamiento de múltiples pasos. Ideal para explorar mayor eficiencia de razonamiento con presupuestos de contexto amplios.",
"deepseek-ai/DeepSeek-V3.2-Exp.description": "DeepSeek V3.2 Exp utiliza una arquitectura de razonamiento híbrida y admite modos de pensamiento y no pensamiento.",
"deepseek-ai/DeepSeek-V3.2.description": "DeepSeek-V3.2 es un modelo que combina alta eficiencia computacional con excelente razonamiento y rendimiento como Agente. Su enfoque se basa en tres avances tecnológicos principales: DeepSeek Sparse Attention (DSA), un mecanismo de atención eficiente que reduce significativamente la complejidad computacional mientras mantiene el rendimiento del modelo, optimizado específicamente para escenarios de contexto largo; un marco de aprendizaje por refuerzo escalable que permite que el rendimiento del modelo rivalice con GPT-5, y su versión de alta computación puede igualar a Gemini-3.0-Pro en capacidades de razonamiento; y una tubería de síntesis de tareas de Agente a gran escala, diseñada para integrar capacidades de razonamiento en escenarios de uso de herramientas, mejorando así el seguimiento de instrucciones y las habilidades de generalización en entornos interactivos complejos. El modelo obtuvo resultados de medalla de oro en la Olimpiada Internacional de Matemáticas (IMO) y la Olimpiada Internacional de Informática (IOI) de 2025.",
"deepseek-ai/DeepSeek-V3.description": "DeepSeek-V3 es un modelo MoE con 671 mil millones de parámetros que utiliza MLA y DeepSeekMoE con balanceo de carga sin pérdida para un entrenamiento e inferencia eficientes. Preentrenado con 14.8T de tokens de alta calidad, SFT y RL, supera a otros modelos abiertos y se acerca a los modelos cerrados líderes.",
"deepseek-ai/deepseek-llm-67b-chat.description": "DeepSeek LLM Chat (67B) es un modelo innovador que ofrece una comprensión profunda del lenguaje y una interacción avanzada.",
"deepseek-ai/deepseek-v3.1-terminus.description": "DeepSeek V3.1 es un modelo de razonamiento de nueva generación con capacidades mejoradas para razonamiento complejo y cadenas de pensamiento, ideal para tareas de análisis profundo.",
@@ -433,6 +435,7 @@
"deepseek_r1_distill_llama_70b.description": "DeepSeek-R1-Distill-Llama-70B es una versión destilada de Llama-3.3-70B-Instruct. Como parte de la serie DeepSeek-R1, está ajustado finamente con muestras generadas por DeepSeek-R1 y ofrece un rendimiento sólido en matemáticas, programación y razonamiento.",
"deepseek_r1_distill_qwen_14b.description": "DeepSeek-R1-Distill-Qwen-14B es una versión destilada de Qwen2.5-14B y ajustada finamente con 800K muestras seleccionadas generadas por DeepSeek-R1, ofreciendo un razonamiento sólido.",
"deepseek_r1_distill_qwen_32b.description": "DeepSeek-R1-Distill-Qwen-32B es una versión destilada de Qwen2.5-32B y ajustada finamente con 800K muestras seleccionadas generadas por DeepSeek-R1, destacando en matemáticas, programación y razonamiento.",
"devstral-2512.description": "Devstral 2 es un modelo de texto a nivel empresarial que sobresale en el uso de herramientas para explorar bases de código, editar múltiples archivos y potenciar agentes de ingeniería de software.",
"devstral-2:123b.description": "Devstral 2 123B destaca en el uso de herramientas para explorar bases de código, editar múltiples archivos y asistir a agentes de ingeniería de software.",
"doubao-1.5-lite-32k.description": "Doubao-1.5-lite es un nuevo modelo ligero con respuesta ultrarrápida, que ofrece calidad y latencia de primer nivel.",
"doubao-1.5-pro-256k.description": "Doubao-1.5-pro-256k es una mejora integral de Doubao-1.5-Pro, con un rendimiento general un 10% superior. Admite una ventana de contexto de 256k y hasta 12k tokens de salida, ofreciendo mayor rendimiento, una ventana más amplia y un gran valor para casos de uso más amplios.",
@@ -546,10 +549,10 @@
"gemini-2.5-pro-preview-06-05.description": "Gemini 2.5 Pro Preview es el modelo de razonamiento más avanzado de Google, capaz de razonar sobre código, matemáticas y problemas STEM, y analizar grandes conjuntos de datos, bases de código y documentos con contexto largo.",
"gemini-2.5-pro.description": "Gemini 2.5 Pro es el modelo de razonamiento más avanzado de Google, capaz de razonar sobre código, matemáticas y problemas STEM, y analizar grandes conjuntos de datos, bases de código y documentos con contexto largo.",
"gemini-3-flash-preview.description": "Gemini 3 Flash es el modelo más inteligente diseñado para la velocidad, combinando inteligencia de vanguardia con una excelente fundamentación en búsquedas.",
"gemini-3-pro-image-preview.description": "Gemini 3 Pro Image (Nano Banana Pro) es el modelo de generación de imágenes de Google, compatible también con chat multimodal.",
"gemini-3-pro-image-preview.description": "Gemini 3 Pro Image (Nano Banana Pro) es el modelo de generación de imágenes de Google que también admite diálogo multimodal.",
"gemini-3-pro-image-preview:image.description": "Gemini 3 Pro Image (Nano Banana Pro) es el modelo de generación de imágenes de Google y también admite chat multimodal.",
"gemini-3-pro-preview.description": "Gemini 3 Pro es el agente más potente de Google y modelo de codificación emocional, que ofrece visuales más ricos e interacción más profunda sobre un razonamiento de última generación.",
"gemini-3.1-flash-image-preview.description": "Gemini 3.1 Flash Image (Nano Banana 2) ofrece calidad de imagen a nivel profesional a velocidad Flash con soporte para chat multimodal.",
"gemini-3.1-flash-image-preview.description": "Gemini 3.1 Flash Image (Nano Banana 2) es el modelo nativo de generación de imágenes más rápido de Google con soporte de pensamiento, generación conversacional de imágenes y edición.",
"gemini-3.1-flash-image-preview:image.description": "Gemini 3.1 Flash Image (Nano Banana 2) ofrece calidad de imagen a nivel profesional a velocidad Flash con soporte para chat multimodal.",
"gemini-3.1-pro-preview.description": "Gemini 3.1 Pro Preview mejora las capacidades de razonamiento de Gemini 3 Pro y añade soporte para un nivel de pensamiento medio.",
"gemini-flash-latest.description": "Última versión de Gemini Flash",
@@ -605,19 +608,15 @@
"google/gemini-2.0-flash-lite-001.description": "Gemini 2.0 Flash Lite es una variante ligera de Gemini con el razonamiento desactivado por defecto para mejorar la latencia y el costo, aunque puede activarse mediante parámetros.",
"google/gemini-2.0-flash-lite.description": "Gemini 2.0 Flash Lite ofrece funciones de nueva generación como velocidad excepcional, uso integrado de herramientas, generación multimodal y una ventana de contexto de 1 millón de tokens.",
"google/gemini-2.0-flash.description": "Gemini 2.0 Flash es el modelo de razonamiento de alto rendimiento de Google para tareas multimodales extendidas.",
"google/gemini-2.5-flash-image-free.description": "Nivel gratuito de Gemini 2.5 Flash Image con generación multimodal de cuota limitada.",
"google/gemini-2.5-flash-image-preview.description": "Modelo experimental Gemini 2.5 Flash con soporte para generación de imágenes.",
"google/gemini-2.5-flash-image.description": "Gemini 2.5 Flash Image (Nano Banana) es el modelo de generación de imágenes de Google con soporte para conversación multimodal.",
"google/gemini-2.5-flash-lite.description": "Gemini 2.5 Flash Lite es la variante ligera de Gemini 2.5 optimizada para latencia y costo, ideal para escenarios de alto rendimiento.",
"google/gemini-2.5-flash-preview.description": "Gemini 2.5 Flash es el modelo insignia más avanzado de Google, diseñado para tareas de razonamiento, programación, matemáticas y ciencia. Incluye razonamiento integrado para ofrecer respuestas más precisas con un procesamiento de contexto más fino.\n\nNota: Este modelo tiene dos variantes: con y sin razonamiento. El precio de salida varía significativamente según si el razonamiento está activado. Si eliges la variante estándar (sin el sufijo “:thinking”), el modelo evitará explícitamente generar tokens de razonamiento.\n\nPara usar el razonamiento y recibir tokens de razonamiento, debes seleccionar la variante “:thinking”, que conlleva un precio de salida más alto.\n\nGemini 2.5 Flash también puede configurarse mediante el parámetro “max reasoning tokens” como se documenta (https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning).",
"google/gemini-2.5-flash-preview:thinking.description": "Gemini 2.5 Flash es el modelo insignia más avanzado de Google, diseñado para tareas de razonamiento, programación, matemáticas y ciencia. Incluye razonamiento integrado para ofrecer respuestas más precisas con un procesamiento de contexto más fino.\n\nNota: Este modelo tiene dos variantes: con y sin razonamiento. El precio de salida varía significativamente según si el razonamiento está activado. Si eliges la variante estándar (sin el sufijo “:thinking”), el modelo evitará explícitamente generar tokens de razonamiento.\n\nPara usar el razonamiento y recibir tokens de razonamiento, debes seleccionar la variante “:thinking”, que conlleva un precio de salida más alto.\n\nGemini 2.5 Flash también puede configurarse mediante el parámetro “max reasoning tokens” como se documenta (https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning).",
"google/gemini-2.5-flash.description": "Gemini 2.5 Flash (Lite/Pro/Flash) es la familia de modelos de Google que abarca desde baja latencia hasta razonamiento de alto rendimiento.",
"google/gemini-2.5-pro-free.description": "El nivel gratuito de Gemini 2.5 Pro ofrece generación multimodal de contexto largo con cuota limitada, ideal para pruebas y flujos de trabajo ligeros.",
"google/gemini-2.5-flash.description": "Gemini 2.5 Flash es la familia de Google que abarca desde baja latencia hasta razonamiento de alto rendimiento.",
"google/gemini-2.5-pro-preview.description": "Gemini 2.5 Pro Preview es el modelo de razonamiento más avanzado de Google para resolver problemas complejos en código, matemáticas y STEM, y para analizar grandes conjuntos de datos, bases de código y documentos con contexto largo.",
"google/gemini-2.5-pro.description": "Gemini 2.5 Pro es el modelo insignia de razonamiento de Google con soporte de contexto largo para tareas complejas.",
"google/gemini-3-pro-image-preview-free.description": "Nivel gratuito de Gemini 3 Pro Image con generación multimodal de cuota limitada.",
"google/gemini-3-pro-image-preview.description": "Gemini 3 Pro Image (Nano Banana Pro) es el modelo de generación de imágenes de Google con soporte para conversación multimodal.",
"google/gemini-3-pro-preview-free.description": "Gemini 3 Pro Preview Free ofrece la misma comprensión y razonamiento multimodal que la versión estándar, pero con límites de cuota y frecuencia, ideal para pruebas y uso ocasional.",
"google/gemini-3-pro-preview.description": "Gemini 3 Pro es el modelo de razonamiento multimodal de nueva generación de la familia Gemini, capaz de comprender texto, audio, imágenes y video, y manejar tareas complejas y grandes bases de código.",
"google/gemini-embedding-001.description": "Modelo de embedding de última generación con alto rendimiento en tareas en inglés, multilingües y de código.",
"google/gemini-flash-1.5.description": "Gemini 1.5 Flash ofrece procesamiento multimodal optimizado para una variedad de tareas complejas.",
@@ -717,15 +716,24 @@
"hunyuan-a13b.description": "El primer modelo de razonamiento híbrido de Hunyuan, mejorado a partir del hunyuan-standard-256K (80B en total, 13B activos). Por defecto utiliza pensamiento lento y permite cambiar entre pensamiento rápido/lento mediante parámetros o el prefijo /no_think. Su capacidad general ha mejorado respecto a la generación anterior, especialmente en matemáticas, ciencia, comprensión de textos largos y tareas de agentes.",
"hunyuan-code.description": "El último modelo de código de Hunyuan entrenado con 200 mil millones de datos de código de alta calidad más seis meses de datos SFT, con un contexto de 8K. Se ubica cerca de la cima en los benchmarks automatizados de código y en evaluaciones humanas expertas en cinco idiomas.",
"hunyuan-functioncall.description": "El último modelo MoE FunctionCall de Hunyuan entrenado con datos de llamadas de herramientas de alta calidad, con una ventana de contexto de 32K y benchmarks líderes en múltiples dimensiones.",
"hunyuan-large-longcontext.description": "Sobresale en tareas de documentos largos como resumen y preguntas y respuestas, mientras maneja generación general. Fuerte en análisis y generación de texto largo para contenido complejo y detallado.",
"hunyuan-large.description": "Hunyuan-large tiene ~389 mil millones de parámetros totales y ~52 mil millones activados, el modelo MoE abierto más grande y fuerte en una arquitectura Transformer.",
"hunyuan-lite.description": "Actualizado a una arquitectura MoE con ventana de contexto de 256K, liderando muchos modelos abiertos en benchmarks de NLP, código, matemáticas e industria.",
"hunyuan-pro.description": "Modelo MoE de un billón de parámetros con contexto largo de 32K, líder en benchmarks, fuerte en instrucciones complejas y razonamiento, matemáticas avanzadas, llamadas a funciones y optimizado para traducción multilingüe, finanzas, derecho y medicina.",
"hunyuan-role.description": "El último modelo de rol de Hunyuan, ajustado oficialmente con datos de rol, ofreciendo un rendimiento base más sólido en escenarios de rol.",
"hunyuan-standard-256K.description": "Utiliza enrutamiento mejorado para mitigar el balanceo de carga y el colapso de expertos. El texto largo \"aguja en un pajar\" alcanza el 99.9%. MOE-256K avanza aún más en longitud y calidad, ampliando enormemente la longitud de entrada.",
"hunyuan-standard.description": "Utiliza enrutamiento mejorado para mitigar el balanceo de carga y el colapso de expertos. El texto largo \"aguja en un pajar\" alcanza el 99.9%. MOE-32K ofrece mejor valor mientras equilibra calidad y precio para entradas de texto largo.",
"hunyuan-standard-256K.description": "Utiliza enrutamiento mejorado para mitigar el balance de carga y el colapso de expertos. Logra un 99.9% de aguja en un pajar en contexto largo. MOE-256K amplía aún más la longitud y calidad del contexto.",
"hunyuan-standard.description": "Utiliza enrutamiento mejorado para mitigar el balance de carga y el colapso de expertos. Logra un 99.9% de aguja en un pajar en contexto largo. MOE-32K ofrece un gran valor mientras maneja entradas largas.",
"hunyuan-t1-20250321.description": "Construye capacidades equilibradas en artes y STEM con una fuerte captura de información de texto largo. Admite respuestas de razonamiento para problemas de matemáticas, lógica, ciencia y código en niveles de dificultad variados.",
"hunyuan-t1-20250403.description": "Mejora la generación de código a nivel de proyecto y la calidad de escritura, fortalece la comprensión de temas en múltiples turnos y el seguimiento de instrucciones ToB, mejora la comprensión a nivel de palabra y reduce problemas de salida mixta simplificada/tradicional y chino/inglés.",
"hunyuan-t1-20250529.description": "Mejora la escritura creativa y la composición, fortalece la codificación frontend, el razonamiento matemático y lógico, y mejora el seguimiento de instrucciones.",
"hunyuan-t1-20250711.description": "Mejora significativamente matemáticas difíciles, lógica y codificación, aumenta la estabilidad de salida y mejora la capacidad de texto largo.",
"hunyuan-t1-latest.description": "Mejora significativamente el modelo de pensamiento lento en matemáticas complejas, razonamiento avanzado, codificación difícil, seguimiento de instrucciones y calidad de escritura creativa.",
"hunyuan-t1-vision-20250916.description": "Último modelo de razonamiento profundo t1-vision con grandes mejoras en VQA, anclaje visual, OCR, gráficos, resolución de problemas fotografiados y creación basada en imágenes, además de mayor rendimiento en inglés y lenguas de bajos recursos.",
"hunyuan-turbo-20241223.description": "Esta versión mejora la escalabilidad de instrucciones para una mejor generalización, mejora significativamente el razonamiento matemático/código/lógico, mejora la comprensión a nivel de palabra y la calidad de escritura.",
"hunyuan-turbo-latest.description": "Mejoras generales en la experiencia de comprensión de NLP, escritura, chat, preguntas y respuestas, traducción y dominios; respuestas más humanas, mejor aclaración de intenciones ambiguas, mejor análisis de palabras, mayor calidad creativa e interactividad, y conversaciones de múltiples turnos más sólidas.",
"hunyuan-turbo.description": "Vista previa del LLM de próxima generación de Hunyuan con nueva arquitectura MoE, que ofrece razonamiento más rápido y mejores resultados que hunyuan-pro.",
"hunyuan-turbos-latest.description": "El último modelo insignia Hunyuan TurboS con razonamiento más sólido y mejor experiencia general.",
"hunyuan-turbos-longtext-128k-20250325.description": "Sobresale en tareas de documentos largos como resumen y preguntas y respuestas, mientras maneja generación general. Fuerte en análisis y generación de texto largo para contenido complejo y detallado.",
"hunyuan-vision-1.5-instruct.description": "Un modelo rápido de imagen a texto basado en la base de texto TurboS, mostrando mejoras notables sobre la versión anterior en reconocimiento de imágenes fundamental y razonamiento de análisis de imágenes.",
"hunyuan-vision.description": "El último modelo multimodal de Hunyuan que admite entradas de imagen + texto para generar texto.",
"image-01-live.description": "Un modelo de generación de imágenes con gran nivel de detalle, compatible con texto a imagen y estilos predefinidos controlables.",
@@ -770,8 +778,7 @@
"kimi-k2:1t.description": "Kimi K2 es un gran modelo MoE LLM de Moonshot AI con 1T de parámetros totales y 32B activos por pasada. Está optimizado para capacidades de agentes, incluyendo uso avanzado de herramientas, razonamiento y síntesis de código.",
"kimi-latest.description": "Kimi Latest utiliza el modelo Kimi más reciente y puede incluir funciones experimentales. Admite comprensión de imágenes y selecciona automáticamente modelos de facturación 8k/32k/128k según la longitud del contexto.",
"kuaishou/kat-coder-pro-v1.description": "KAT-Coder-Pro-V1 (gratis por tiempo limitado) se enfoca en la comprensión de código y automatización para agentes de programación eficientes.",
"learnlm-1.5-pro-experimental.description": "LearnLM es un modelo experimental específico para tareas, entrenado con principios de ciencia del aprendizaje para seguir instrucciones del sistema en escenarios de enseñanza/aprendizaje, actuando como un tutor experto.",
"learnlm-2.0-flash-experimental.description": "LearnLM es un modelo experimental específico para tareas, entrenado con principios de ciencia del aprendizaje para seguir instrucciones del sistema en escenarios de enseñanza/aprendizaje, actuando como un tutor experto.",
"labs-devstral-small-2512.description": "Devstral Small 2 sobresale en el uso de herramientas para explorar bases de código, editar múltiples archivos y potenciar agentes de ingeniería de software.",
"lite.description": "Spark Lite es un LLM ligero con latencia ultra baja y procesamiento eficiente. Es completamente gratuito y admite búsqueda web en tiempo real. Sus respuestas rápidas funcionan bien en dispositivos con pocos recursos y para ajuste fino de modelos, ofreciendo una experiencia inteligente y rentable, especialmente para preguntas y respuestas de conocimiento, generación de contenido y escenarios de búsqueda.",
"llama-3.1-70b-versatile.description": "Llama 3.1 70B ofrece un razonamiento de IA más sólido para aplicaciones complejas, compatible con procesamiento intensivo con alta eficiencia y precisión.",
"llama-3.1-8b-instant.description": "Llama 3.1 8B es un modelo de alta eficiencia con generación de texto rápida, ideal para aplicaciones a gran escala y rentables.",
@@ -782,7 +789,6 @@
"llama-3.2-90b-vision-preview.description": "Llama 3.2 está diseñado para tareas que combinan visión y texto, destacando en subtitulado de imágenes y preguntas visuales para unir generación de lenguaje y razonamiento visual.",
"llama-3.2-vision-instruct.description": "El modelo Llama 3.2-Vision ajustado por instrucciones está optimizado para reconocimiento visual, razonamiento de imágenes, subtitulado y preguntas generales sobre imágenes.",
"llama-3.3-70b-versatile.description": "Meta Llama 3.3 es un LLM multilingüe con 70B de parámetros (entrada/salida de texto), disponible en variantes preentrenadas y ajustadas por instrucciones. La versión ajustada por instrucciones está optimizada para diálogos multilingües y supera a muchos modelos de chat abiertos y cerrados en benchmarks de la industria.",
"llama-3.3-70b.description": "Llama 3.3 70B: un modelo Llama de tamaño medio a grande que equilibra razonamiento y rendimiento.",
"llama-3.3-instruct.description": "El modelo Llama 3.3 ajustado por instrucciones está optimizado para chat y supera a muchos modelos de chat abiertos en benchmarks de la industria.",
"llama3-70b-8192.description": "Meta Llama 3 70B ofrece una gestión excepcional de la complejidad para proyectos exigentes.",
"llama3-8b-8192.description": "Meta Llama 3 8B ofrece un rendimiento sólido en razonamiento para escenarios diversos.",
@@ -832,7 +838,6 @@
"meta-llama/llama-3.1-8b-instruct:free.description": "LLaMA 3.1 ofrece soporte multilingüe y es uno de los modelos generativos líderes.",
"meta-llama/llama-3.2-11b-vision-instruct.description": "LLaMA 3.2 está diseñado para tareas que combinan visión y texto. Destaca en subtitulación de imágenes y preguntas visuales, uniendo la generación de lenguaje con el razonamiento visual.",
"meta-llama/llama-3.2-3b-instruct.description": "meta-llama/llama-3.2-3b-instruct",
"meta-llama/llama-3.2-90b-vision-instruct.description": "LLaMA 3.2 está diseñado para tareas que combinan visión y texto. Destaca en subtitulación de imágenes y preguntas visuales, uniendo la generación de lenguaje con el razonamiento visual.",
"meta-llama/llama-3.3-70b-instruct.description": "Llama 3.3 es el modelo Llama multilingüe de código abierto más avanzado, con un rendimiento cercano al de modelos de 405B a un costo muy bajo. Está basado en Transformer y mejorado con SFT y RLHF para mayor utilidad y seguridad. La versión ajustada por instrucciones está optimizada para chat multilingüe y supera a muchos modelos abiertos y cerrados en pruebas de referencia de la industria. Fecha de corte de conocimiento: diciembre de 2023.",
"meta-llama/llama-3.3-70b-instruct:free.description": "Llama 3.3 es el modelo Llama multilingüe de código abierto más avanzado, con un rendimiento cercano al de modelos de 405B a un costo muy bajo. Está basado en Transformer y mejorado con SFT y RLHF para mayor utilidad y seguridad. La versión ajustada por instrucciones está optimizada para chat multilingüe y supera a muchos modelos abiertos y cerrados en pruebas de referencia de la industria. Fecha de corte de conocimiento: diciembre de 2023.",
"meta.llama3-1-405b-instruct-v1:0.description": "Meta Llama 3.1 405B Instruct es el modelo Llama 3.1 Instruct más grande y potente, altamente avanzado para razonamiento en diálogos y generación de datos sintéticos, y una base sólida para preentrenamiento o ajuste fino en dominios específicos. Los LLMs multilingües Llama 3.1 son modelos de generación preentrenados y ajustados por instrucciones en tamaños de 8B, 70B y 405B (texto de entrada/salida). Los modelos ajustados están optimizados para diálogos multilingües y superan a muchos modelos de chat abiertos en pruebas de referencia comunes. Llama 3.1 está diseñado para uso comercial y de investigación en múltiples idiomas. Los modelos ajustados son ideales para chat estilo asistente, mientras que los preentrenados se adaptan a tareas más amplias de generación de lenguaje natural. Las salidas de Llama 3.1 también pueden utilizarse para mejorar otros modelos, incluida la generación y refinamiento de datos sintéticos. Llama 3.1 es un modelo Transformer autorregresivo con una arquitectura optimizada. Las versiones ajustadas utilizan ajuste fino supervisado (SFT) y aprendizaje por refuerzo con retroalimentación humana (RLHF) para alinearse con las preferencias humanas en cuanto a utilidad y seguridad.",
@@ -894,7 +899,7 @@
"mistral-large-instruct.description": "Mistral-Large-Instruct-2407 es un LLM denso avanzado con 123 mil millones de parámetros y razonamiento, conocimiento y codificación de última generación.",
"mistral-large-latest.description": "Mistral Large es el modelo insignia, fuerte en tareas multilingües, razonamiento complejo y generación de código, ideal para aplicaciones de alto nivel.",
"mistral-large.description": "Mixtral Large es el modelo insignia de Mistral, que combina generación de código, matemáticas y razonamiento con una ventana de contexto de 128K.",
"mistral-medium-latest.description": "Mistral Medium 3 ofrece un rendimiento de última generación a un costo 8× menor y simplifica el despliegue empresarial.",
"mistral-medium-latest.description": "Mistral Medium 3.1 ofrece rendimiento de última generación a un costo 8× menor y simplifica la implementación empresarial.",
"mistral-nemo-instruct.description": "Mistral-Nemo-Instruct-2407 es la versión ajustada por instrucciones de Mistral-Nemo-Base-2407.",
"mistral-nemo.description": "Mistral Nemo es un modelo de 12 mil millones de parámetros de alta eficiencia de Mistral AI y NVIDIA.",
"mistral-small-latest.description": "Mistral Small es una opción rentable, rápida y confiable para traducción, resumen y análisis de sentimientos.",
@@ -933,7 +938,7 @@
"moonshot-v1-auto.description": "Moonshot V1 Auto selecciona el modelo adecuado según el uso actual de tokens de contexto.",
"moonshotai/Kimi-Dev-72B.description": "Kimi-Dev-72B es un modelo de código de código abierto optimizado con aprendizaje por refuerzo a gran escala para generar parches robustos y listos para producción. Obtiene un 60.4% en SWE-bench Verified, estableciendo un nuevo récord entre modelos abiertos para tareas de ingeniería de software automatizada como corrección de errores y revisión de código.",
"moonshotai/Kimi-K2-Instruct-0905.description": "Kimi K2-Instruct-0905 es la versión más nueva y potente de Kimi K2. Es un modelo MoE de primer nivel con 1T total y 32B de parámetros activos. Sus características clave incluyen mayor inteligencia en programación de agentes con mejoras significativas en benchmarks y tareas reales, además de mejor estética y usabilidad en código frontend.",
"moonshotai/Kimi-K2-Thinking.description": "Kimi K2 Thinking es el modelo de razonamiento de código abierto más potente hasta la fecha. Amplía considerablemente la profundidad del razonamiento multietapa y mantiene un uso estable de herramientas en 200300 llamadas consecutivas, estableciendo nuevos récords en Humanity's Last Exam (HLE), BrowseComp y otros benchmarks. Destaca en programación, matemáticas, lógica y escenarios de agentes. Basado en una arquitectura MoE con ~1T de parámetros totales, admite una ventana de contexto de 256K y llamadas a herramientas.",
"moonshotai/Kimi-K2-Thinking.description": "Kimi K2 Thinking es el modelo de pensamiento más reciente y poderoso de código abierto. Amplía enormemente la profundidad de razonamiento de múltiples pasos y mantiene un uso estable de herramientas en 200300 llamadas consecutivas, estableciendo nuevos récords en Humanity's Last Exam (HLE), BrowseComp y otros puntos de referencia. Sobresale en codificación, matemáticas, lógica y escenarios de agentes. Construido sobre una arquitectura MoE con ~1 billón de parámetros totales, admite una ventana de contexto de 256K y llamadas de herramientas.",
"moonshotai/kimi-k2-0711.description": "Kimi K2 0711 es la variante instructiva de la serie Kimi, adecuada para el uso de herramientas y generación de código de alta calidad.",
"moonshotai/kimi-k2-0905.description": "Kimi K2 0905 es una actualización que amplía el contexto y mejora el rendimiento en razonamiento con optimizaciones para programación.",
"moonshotai/kimi-k2-instruct-0905.description": "El modelo kimi-k2-0905-preview admite una ventana de contexto de 256k, con programación más autónoma, código frontend más pulido y práctico, y mejor comprensión del contexto.",
@@ -948,8 +953,8 @@
"nvidia/Llama-3.1-Nemotron-70B-Instruct-HF.description": "Llama 3.1 Nemotron 70B es un modelo LLM personalizado por NVIDIA para mejorar la utilidad. Tiene un rendimiento destacado en Arena Hard, AlpacaEval 2 LC y GPT-4-Turbo MT-Bench, ocupando el puesto #1 en los tres benchmarks de autoalineación al 1 de octubre de 2024. Está entrenado a partir de Llama-3.1-70B-Instruct usando RLHF (REINFORCE), Llama-3.1-Nemotron-70B-Reward y prompts de HelpSteer2-Preference.",
"nvidia/llama-3.1-nemotron-51b-instruct.description": "Un modelo de lenguaje distintivo que ofrece precisión y eficiencia excepcionales.",
"nvidia/llama-3.1-nemotron-70b-instruct.description": "Llama-3.1-Nemotron-70B-Instruct es un modelo personalizado de NVIDIA diseñado para mejorar la utilidad de las respuestas de los LLM.",
"o1-mini.description": "Más pequeño y rápido que o1-preview, con un costo 80% menor, fuerte en generación de código y tareas de contexto corto.",
"o1-preview.description": "Enfocado en razonamiento avanzado y resolución de problemas complejos, incluyendo matemáticas y ciencia. Ideal para aplicaciones que requieren comprensión profunda del contexto y flujos de trabajo autónomos.",
"o1-mini.description": "o1-mini es un modelo de razonamiento rápido y rentable diseñado para codificación, matemáticas y ciencia. Tiene un contexto de 128K y un límite de conocimiento de octubre de 2023.",
"o1-preview.description": "o1 es el nuevo modelo de razonamiento de OpenAI para tareas complejas que requieren un conocimiento amplio. Tiene un contexto de 128K y un límite de conocimiento de octubre de 2023.",
"o1-pro.description": "La serie o1 está entrenada con aprendizaje por refuerzo para pensar antes de responder y manejar razonamiento complejo. o1-pro utiliza más recursos computacionales para un pensamiento más profundo y respuestas de mayor calidad de forma constante.",
"o1.description": "o1 es el nuevo modelo de razonamiento de OpenAI con entrada de texto+imagen y salida de texto, adecuado para tareas complejas que requieren conocimiento amplio. Tiene una ventana de contexto de 200K y un límite de conocimiento de octubre de 2023.",
"o3-2025-04-16.description": "o3 es el nuevo modelo de razonamiento de OpenAI con entrada de texto+imagen y salida de texto para tareas complejas que requieren conocimiento amplio.",
@@ -1022,7 +1027,6 @@
"qianfan-check-vl.description": "Qianfan Check VL es un modelo de revisión de contenido multimodal para tareas de cumplimiento y reconocimiento de imagen-texto.",
"qianfan-composition.description": "Qianfan Composition es un modelo de creación multimodal para comprensión y generación combinada de imagen y texto.",
"qianfan-engcard-vl.description": "Qianfan EngCard VL es un modelo de reconocimiento multimodal enfocado en escenarios en inglés.",
"qianfan-lightning-128b-a19b.description": "Qianfan Lightning 128B A19B es un modelo general chino de alto rendimiento para preguntas complejas y razonamiento a gran escala.",
"qianfan-llama-vl-8b.description": "Qianfan Llama VL 8B es un modelo multimodal basado en Llama para comprensión general de imagen y texto.",
"qianfan-multipicocr.description": "Qianfan MultiPicOCR es un modelo OCR para múltiples imágenes que detecta y reconoce texto en varias imágenes.",
"qianfan-qi-vl.description": "Qianfan QI VL es un modelo de preguntas y respuestas multimodal para recuperación precisa y QA en escenarios complejos de imagen y texto.",
@@ -1032,7 +1036,6 @@
"qvq-72b-preview.description": "QVQ-72B-Preview es un modelo de investigación experimental de Qwen enfocado en mejorar el razonamiento visual.",
"qvq-max.description": "El modelo de razonamiento visual Qwen QVQ admite entrada visual y salida con cadena de pensamiento, con mejor rendimiento en matemáticas, programación, análisis visual, creatividad y tareas generales.",
"qvq-plus.description": "Modelo de razonamiento visual con entrada visual y salida con cadena de pensamiento. La serie qvq-plus sigue a qvq-max y ofrece razonamiento más rápido con mejor equilibrio entre calidad y costo.",
"qwen-3-32b.description": "Qwen 3 32B: fuerte en tareas multilingües y de programación, adecuado para uso en producción de escala media.",
"qwen-coder-plus.description": "Modelo de código Qwen.",
"qwen-coder-turbo-latest.description": "Modelo de código Qwen.",
"qwen-coder-turbo.description": "Modelo de código Qwen.",
@@ -1128,7 +1131,6 @@
"qwen3-coder-next.description": "El próximo generador de código Qwen optimizado para generación de código complejo de múltiples archivos, depuración y flujos de trabajo de agentes de alto rendimiento. Diseñado para una fuerte integración de herramientas y un rendimiento de razonamiento mejorado.",
"qwen3-coder-plus.description": "Modelo de código Qwen. La última serie Qwen3-Coder se basa en Qwen3 y ofrece sólidas capacidades de agente de codificación, uso de herramientas e interacción con entornos para programación autónoma, con excelente rendimiento en código y capacidad general sólida.",
"qwen3-coder:480b.description": "Modelo de alto rendimiento de Alibaba para tareas de agente y programación con contexto largo.",
"qwen3-max-2026-01-23.description": "Los modelos Qwen3 Max ofrecen grandes mejoras sobre la serie 2.5 en capacidad general, comprensión del chino/inglés, seguimiento de instrucciones complejas, tareas abiertas subjetivas, capacidad multilingüe y uso de herramientas, con menos alucinaciones. La última versión qwen3-max mejora la programación agente y el uso de herramientas respecto a qwen3-max-preview. Esta versión alcanza el SOTA en su campo y está orientada a necesidades de agentes más complejas.",
"qwen3-max-preview.description": "Modelo Qwen con mejor rendimiento para tareas complejas y de múltiples pasos. La vista previa admite razonamiento.",
"qwen3-max.description": "Los modelos Qwen3 Max ofrecen grandes mejoras sobre la serie 2.5 en capacidad general, comprensión en chino/inglés, seguimiento de instrucciones complejas, tareas abiertas subjetivas, capacidad multilingüe y uso de herramientas, con menos alucinaciones. La última versión qwen3-max mejora la programación agente y el uso de herramientas respecto a qwen3-max-preview. Este lanzamiento alcanza el estado del arte en el campo y está dirigido a necesidades de agentes más complejas.",
"qwen3-next-80b-a3b-instruct.description": "Modelo de próxima generación Qwen3 de código abierto sin razonamiento. En comparación con la versión anterior (Qwen3-235B-A22B-Instruct-2507), mejora la comprensión del chino, el razonamiento lógico y la generación de texto.",
@@ -1145,7 +1147,8 @@
"qwen3-vl-flash.description": "Qwen3 VL Flash: versión ligera y de razonamiento rápido para solicitudes sensibles a la latencia o de alto volumen.",
"qwen3-vl-plus.description": "Qwen VL es un modelo de generación de texto con comprensión visual. Puede realizar OCR, resumir y razonar, como extraer atributos de fotos de productos o resolver problemas a partir de imágenes.",
"qwen3.5-397b-a17b.description": "Admite entradas de texto, imagen y video. Para tareas solo de texto, su rendimiento es comparable al de Qwen3 Max, ofreciendo mayor eficiencia y menor costo. En capacidades multimodales, ofrece mejoras significativas sobre la serie Qwen3 VL.",
"qwen3.5-plus.description": "Qwen3.5 Plus admite entradas de texto, imagen y video. Para tareas solo de texto, su rendimiento es comparable al de Qwen3 Max, mientras ofrece mejor eficiencia y menor costo. En términos de capacidades multimodales, muestra mejoras significativas sobre la serie Qwen3 VL.",
"qwen3.5-plus.description": "Qwen3.5 Plus admite entrada de texto, imagen y video. Su rendimiento en tareas de texto puro es comparable al de Qwen3 Max, con mejor rendimiento y menor costo. Sus capacidades multimodales están significativamente mejoradas en comparación con la serie Qwen3 VL.",
"qwen3.5:397b.description": "Qwen3.5 es un modelo fundacional unificado de visión-lenguaje con una arquitectura híbrida (Mixture-of-Experts + atención lineal), que ofrece un razonamiento multimodal sólido, codificación y capacidades de contexto largo con una ventana de contexto de 256K.",
"qwen3.description": "Qwen3 es el modelo de lenguaje de próxima generación de Alibaba con alto rendimiento en diversos casos de uso.",
"qwq-32b-preview.description": "QwQ es un modelo experimental de investigación de Qwen centrado en mejorar el razonamiento.",
"qwq-32b.description": "QwQ es un modelo de razonamiento de la familia Qwen. En comparación con los modelos estándar ajustados por instrucciones, ofrece capacidades de pensamiento y razonamiento que mejoran significativamente el rendimiento en tareas complejas. QwQ-32B es un modelo de razonamiento de tamaño medio que rivaliza con los mejores modelos como DeepSeek-R1 y o1-mini.",
@@ -1187,7 +1190,7 @@
"step-2-16k.description": "Admite interacciones de gran contexto para diálogos complejos.",
"step-2-mini.description": "Basado en la arquitectura de atención MFA de próxima generación, ofrece resultados similares a Step-1 con menor costo, mayor rendimiento y menor latencia. Maneja tareas generales con gran capacidad de programación.",
"step-2x-large.description": "Modelo de imagen de nueva generación StepFun centrado en la generación de imágenes, produce imágenes de alta calidad a partir de texto. Ofrece texturas más realistas y mejor representación de texto en chino e inglés.",
"step-3.5-flash.description": "El modelo insignia de razonamiento de lenguaje de Stepfun. Este modelo ofrece capacidades de razonamiento de primer nivel junto con una ejecución rápida y confiable. Puede descomponer y planificar tareas complejas, invocar herramientas de manera rápida y confiable para llevarlas a cabo, y sobresalir en razonamiento lógico, matemáticas, ingeniería de software, investigación profunda y otras tareas sofisticadas. La longitud del contexto es de 256K.",
"step-3.5-flash.description": "El modelo insignia de razonamiento lingüístico de Stepfun. Este modelo tiene capacidades de razonamiento de primer nivel y capacidades de ejecución rápidas y confiables. Es capaz de descomponer y planificar tareas complejas, llamar herramientas de manera rápida y confiable para realizar tareas, y ser competente en diversas tareas complejas como razonamiento lógico, matemáticas, ingeniería de software e investigación profunda.",
"step-3.description": "Este modelo posee una fuerte percepción visual y razonamiento complejo, manejando con precisión el entendimiento de conocimientos multidominio, análisis matemático-visual y una amplia gama de tareas de análisis visual cotidiano.",
"step-r1-v-mini.description": "Modelo de razonamiento con sólida comprensión de imágenes que puede procesar imágenes y texto, y luego generar texto tras un razonamiento profundo. Destaca en razonamiento visual y ofrece rendimiento de primer nivel en matemáticas, programación y razonamiento textual, con una ventana de contexto de 100K.",
"stepfun-ai/step3.description": "Step3 es un modelo de razonamiento multimodal de vanguardia de StepFun, basado en una arquitectura MoE con 321B parámetros totales y 38B activos. Su diseño de extremo a extremo minimiza el costo de decodificación mientras ofrece razonamiento visión-lenguaje de primer nivel. Con diseño MFA y AFD, es eficiente tanto en aceleradores de gama alta como baja. Su preentrenamiento incluye más de 20T de tokens de texto y 4T de tokens imagen-texto en múltiples idiomas. Alcanza un rendimiento líder entre modelos abiertos en matemáticas, código y benchmarks multimodales.",
@@ -1276,10 +1279,11 @@
"z-ai/glm4.7.description": "GLM-4.7 es el último modelo insignia de Zhipu, mejorado para escenarios de codificación agentica con capacidades de codificación mejoradas.",
"z-ai/glm5.description": "GLM-5 es el nuevo modelo base insignia de Zhipu AI para ingeniería de agentes, logrando un rendimiento SOTA de código abierto en capacidades de codificación y agentes. Iguala el rendimiento de Claude Opus 4.5.",
"z-image-turbo.description": "Z-Image es un modelo ligero de generación de texto a imagen que puede producir imágenes rápidamente, admite renderizado de texto en chino e inglés y se adapta de manera flexible a múltiples resoluciones y proporciones de aspecto.",
"zai-glm-4.7.description": "Este modelo ofrece un rendimiento sólido en codificación con capacidades avanzadas de razonamiento, uso superior de herramientas y rendimiento mejorado en aplicaciones de codificación agentiva en el mundo real.",
"zai-org/GLM-4.5-Air.description": "GLM-4.5-Air es un modelo base para aplicaciones de agentes que utiliza una arquitectura de Mezcla de Expertos (MoE). Está optimizado para el uso de herramientas, navegación web, ingeniería de software y programación frontend, e integra agentes de código como Claude Code y Roo Code. Emplea razonamiento híbrido para abordar tanto escenarios complejos como situaciones cotidianas.",
"zai-org/GLM-4.5.description": "GLM-4.5 es un modelo base diseñado para aplicaciones de agentes con una arquitectura de Mezcla de Expertos (MoE). Está profundamente optimizado para el uso de herramientas, navegación web, ingeniería de software y programación frontend, e integra agentes de código como Claude Code y Roo Code. Utiliza razonamiento híbrido para manejar tanto razonamientos complejos como escenarios cotidianos.",
"zai-org/GLM-4.5V.description": "GLM-4.5V es el último modelo VLM de Zhipu AI, basado en el modelo de texto insignia GLM-4.5-Air (106B en total, 12B activos) con una arquitectura MoE que ofrece alto rendimiento a menor costo. Sigue la línea de pensamiento de GLM-4.1V-Thinking y añade 3D-RoPE para mejorar el razonamiento espacial en 3D. Optimizado mediante preentrenamiento, SFT y RL, maneja imágenes, videos y documentos extensos, y se posiciona entre los mejores modelos abiertos en 41 benchmarks multimodales públicos. Un modo de pensamiento configurable permite equilibrar velocidad y profundidad.",
"zai-org/GLM-4.6.description": "En comparación con GLM-4.5, GLM-4.6 amplía el contexto de 128K a 200K para abordar tareas de agentes más complejas. Obtiene mejores puntuaciones en benchmarks de código y muestra un rendimiento superior en aplicaciones reales como Claude Code, Cline, Roo Code y Kilo Code, incluyendo una mejor generación de páginas frontend. El razonamiento ha sido mejorado y se admite el uso de herramientas durante el proceso, fortaleciendo su capacidad general. Se integra mejor en marcos de trabajo de agentes, mejora los agentes de búsqueda y herramientas, y ofrece un estilo de escritura más natural y preferido por los usuarios, así como una mayor naturalidad en la simulación de roles.",
"zai-org/GLM-4.6V.description": "GLM-4.6V alcanza precisión SOTA en comprensión visual en el mismo tamaño de parámetros y, por primera vez, integra de manera nativa la capacidad de Function Call (llamadas de herramientas) en el modelo visual, conectando la cadena desde 'percepción visual' hasta 'acción ejecutable', proporcionando una base técnica unificada para agentes multimodales en escenarios empresariales reales.",
"zai/glm-4.5-air.description": "GLM-4.5 y GLM-4.5-Air son nuestros modelos insignia más recientes para aplicaciones de agentes, ambos con arquitectura MoE. GLM-4.5 cuenta con 355B en total y 32B activos por pasada; GLM-4.5-Air es más liviano, con 106B en total y 12B activos.",
"zai/glm-4.5.description": "La serie GLM-4.5 está diseñada para agentes. El modelo insignia GLM-4.5 combina razonamiento, programación y habilidades de agente con 355B de parámetros totales (32B activos) y ofrece modos de operación dual como sistema de razonamiento híbrido.",
"zai/glm-4.5v.description": "GLM-4.5V se basa en GLM-4.5-Air, heredando técnicas comprobadas de GLM-4.1V-Thinking y escalando con una sólida arquitectura MoE de 106B parámetros.",
+14
View File
@@ -24,6 +24,20 @@
"builtins.lobe-agent-builder.inspector.noResults": "Sin resultados",
"builtins.lobe-agent-builder.inspector.togglePlugin": "Alternar",
"builtins.lobe-agent-builder.title": "Experto en Creación de Agentes",
"builtins.lobe-agent-management.apiName.callAgent": "Agente de llamada",
"builtins.lobe-agent-management.apiName.createAgent": "Crear agente",
"builtins.lobe-agent-management.apiName.deleteAgent": "Eliminar agente",
"builtins.lobe-agent-management.apiName.searchAgent": "Buscar agentes",
"builtins.lobe-agent-management.apiName.updateAgent": "Actualizar agente",
"builtins.lobe-agent-management.inspector.callAgent.sync": "Llamando:",
"builtins.lobe-agent-management.inspector.callAgent.task": "Asignando tarea a:",
"builtins.lobe-agent-management.inspector.createAgent.title": "Creando agente:",
"builtins.lobe-agent-management.inspector.searchAgent.all": "Buscar agentes:",
"builtins.lobe-agent-management.inspector.searchAgent.market": "Buscar mercado:",
"builtins.lobe-agent-management.inspector.searchAgent.results": "{{count}} resultados",
"builtins.lobe-agent-management.inspector.searchAgent.user": "Buscar mis agentes:",
"builtins.lobe-agent-management.inspector.updateAgent.title": "Actualizando agente:",
"builtins.lobe-agent-management.title": "Gestor de agentes",
"builtins.lobe-cloud-sandbox.apiName.editLocalFile": "Editar archivo",
"builtins.lobe-cloud-sandbox.apiName.executeCode": "Ejecutar código",
"builtins.lobe-cloud-sandbox.apiName.exportFile": "Exportar archivo",
+3
View File
@@ -724,6 +724,9 @@
"tools.builtins.lobe-artifacts.description": "Genera y previsualiza en vivo componentes de interfaz interactivos, visualizaciones de datos, gráficos, imágenes SVG y aplicaciones web. Crea contenido visual enriquecido con el que los usuarios pueden interactuar directamente.",
"tools.builtins.lobe-artifacts.readme": "Genera y previsualiza en vivo componentes de interfaz interactivos, visualizaciones de datos, gráficos, SVG y aplicaciones web. Crea contenido visual enriquecido con el que los usuarios pueden interactuar directamente.",
"tools.builtins.lobe-artifacts.title": "Artefactos",
"tools.builtins.lobe-calculator.description": "Realiza cálculos matemáticos, resuelve ecuaciones y trabaja con expresiones simbólicas",
"tools.builtins.lobe-calculator.readme": "Calculadora matemática avanzada que admite aritmética básica, ecuaciones algebraicas, operaciones de cálculo y matemáticas simbólicas. Incluye conversión de bases, resolución de ecuaciones, diferenciación, integración y más.",
"tools.builtins.lobe-calculator.title": "Calculadora",
"tools.builtins.lobe-cloud-sandbox.description": "Ejecuta código en Python, JavaScript y TypeScript en un entorno aislado en la nube. Ejecuta comandos de terminal, gestiona archivos, busca contenido con expresiones regulares y exporta resultados de forma segura.",
"tools.builtins.lobe-cloud-sandbox.readme": "Ejecuta código en Python, JavaScript y TypeScript en un entorno aislado en la nube. Ejecuta comandos de terminal, gestiona archivos, busca contenido con expresiones regulares y exporta resultados de forma segura.",
"tools.builtins.lobe-cloud-sandbox.title": "Sandbox en la Nube",
+7 -3
View File
@@ -224,15 +224,18 @@
"providerModels.item.modelConfig.extendParams.options.gpt5_2ProReasoningEffort.hint": "برای سری GPT-5.2 Pro؛ شدت استدلال را کنترل می‌کند.",
"providerModels.item.modelConfig.extendParams.options.gpt5_2ReasoningEffort.hint": "برای سری GPT-5.2؛ شدت استدلال را کنترل می‌کند.",
"providerModels.item.modelConfig.extendParams.options.imageAspectRatio.hint": "برای مدل‌های تولید تصویر Gemini؛ نسبت تصویر خروجی را کنترل می‌کند.",
"providerModels.item.modelConfig.extendParams.options.imageAspectRatio2.hint": "برای نانو بانانا ۲؛ نسبت ابعاد تصاویر تولید شده را کنترل می‌کند (پشتیبانی از فوق‌العاده عریض ۱:۴، ۴:۱، ۱:۸، ۸:۱).",
"providerModels.item.modelConfig.extendParams.options.imageResolution.hint": "برای مدل‌های تولید تصویر Gemini 3؛ وضوح تصویر تولیدی را کنترل می‌کند.",
"providerModels.item.modelConfig.extendParams.options.imageResolution2.hint": "برای مدل‌های تصویر فلش جمینی ۳.۱؛ وضوح تصاویر تولید شده را کنترل می‌کند (پشتیبانی از ۵۱۲ پیکسل).",
"providerModels.item.modelConfig.extendParams.options.reasoningBudgetToken.hint": "برای Claude، Qwen3 و مدل‌های مشابه؛ بودجه توکن برای استدلال را کنترل می‌کند.",
"providerModels.item.modelConfig.extendParams.options.reasoningEffort.hint": "برای مدل‌های OpenAI و سایر مدل‌های دارای توانایی استدلال؛ میزان تلاش استدلالی را کنترل می‌کند.",
"providerModels.item.modelConfig.extendParams.options.textVerbosity.hint": "برای سری GPT-5+؛ میزان تفصیل خروجی را کنترل می‌کند.",
"providerModels.item.modelConfig.extendParams.options.thinking.hint": "برای برخی مدل‌های Doubao؛ به مدل اجازه می‌دهد تصمیم بگیرد که آیا عمیق فکر کند یا نه.",
"providerModels.item.modelConfig.extendParams.options.thinkingBudget.hint": "برای سری Gemini؛ بودجه تفکر را کنترل می‌کند.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel.hint": "برای مدل‌های پیش‌نمایش Gemini 3 Flash؛ عمق تفکر را کنترل می‌کند.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel2.hint": "برای مدل‌های پیش‌نمایش Gemini 3 Pro؛ عمق تفکر را کنترل می‌کند.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel3.hint": "برای مدل‌های پیش‌نمایش Gemini 3.1 Pro؛ عمق تفکر را با سطوح کم/متوسط/زیاد کنترل می‌کند.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel.hint": "برای مدل‌های پیش‌نمایش فلش جمینی ۳؛ عمق تفکر را کنترل می‌کند.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel2.hint": "برای مدل‌های پیش‌نمایش حرفه‌ای جمینی ۳؛ عمق تفکر را کنترل می‌کند.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel3.hint": "برای مدل‌های پیش‌نمایش حرفه‌ای جمینی ۳.۱؛ عمق تفکر را با سطوح کم/متوسط/زیاد کنترل می‌کند.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel4.hint": "برای مدل‌های تصویر فلش جمینی ۳.۱؛ تفکر را روشن/خاموش می‌کند.",
"providerModels.item.modelConfig.extendParams.options.urlContext.hint": "برای سری Gemini؛ امکان ارائه زمینه از طریق URL را فراهم می‌کند.",
"providerModels.item.modelConfig.extendParams.placeholder": "پارامترهای پیشرفته‌ای را برای فعال‌سازی انتخاب کنید",
"providerModels.item.modelConfig.extendParams.previewFallback": "پیش‌نمایش در دسترس نیست",
@@ -311,6 +314,7 @@
"providerModels.tabs.image": "تصویر",
"providerModels.tabs.stt": "تبدیل گفتار به متن",
"providerModels.tabs.tts": "تبدیل متن به گفتار",
"providerModels.tabs.video": "ویدیو",
"sortModal.success": "مرتب‌سازی با موفقیت به‌روزرسانی شد",
"sortModal.title": "ترتیب سفارشی",
"sortModal.update": "به‌روزرسانی",
+35 -31
View File
@@ -55,7 +55,8 @@
"FLUX.1-dev.description": "FLUX.1-dev یک مدل زبان چندوجهی متن-تصویر متن‌باز از آزمایشگاه Black Forest است که برای وظایف درک و تولید تصویر/متن بهینه‌سازی شده است. این مدل بر پایه LLMهای پیشرفته (مانند Mistral-7B) ساخته شده و از رمزگذار بینایی طراحی‌شده و تنظیمات چندمرحله‌ای دستورالعمل بهره می‌برد تا هماهنگی چندوجهی و استدلال پیچیده را ممکن سازد.",
"Gryphe/MythoMax-L2-13b.description": "MythoMax-L2 (13B) مدلی نوآورانه برای حوزه‌های متنوع و وظایف پیچیده است.",
"HelloMeme.description": "HelloMeme یک ابزار هوش مصنوعی برای تولید میم، گیف یا ویدیوهای کوتاه از تصاویر یا حرکاتی است که ارائه می‌دهید. بدون نیاز به مهارت طراحی یا کدنویسی، تنها با یک تصویر مرجع، محتوایی سرگرم‌کننده، جذاب و از نظر سبک هماهنگ تولید می‌کند.",
"HiDream-I1-Full.description": "HiDream-E1-Full یک مدل متن‌باز ویرایش تصویر چندوجهی از HiDream.ai است که بر پایه معماری پیشرفته Diffusion Transformer و درک زبانی قوی (با LLaMA 3.1-8B-Instruct داخلی) ساخته شده است. این مدل از تولید تصویر با زبان طبیعی، انتقال سبک، ویرایش‌های محلی و بازسازی پشتیبانی می‌کند و در درک و اجرای متن-تصویر عملکرد عالی دارد.",
"HiDream-E1-Full.description": "HiDream-E1-Full یک مدل ویرایش تصویر چندوجهی متن‌باز از HiDream.ai است که بر اساس معماری پیشرفته Diffusion Transformer و درک قوی زبان (LLaMA 3.1-8B-Instruct داخلی) ساخته شده است. این مدل از تولید تصویر با زبان طبیعی، انتقال سبک، ویرایش‌های محلی و بازسازی با درک و اجرای عالی متن-تصویر پشتیبانی می‌کند.",
"HiDream-I1-Full.description": "HiDream-I1 یک مدل جدید تولید تصویر پایه متن‌باز است که توسط HiDream منتشر شده است. با 17 میلیارد پارامتر (Flux دارای 12 میلیارد است)، می‌تواند کیفیت تصویر پیشرو در صنعت را در چند ثانیه ارائه دهد.",
"HunyuanDiT-v1.2-Diffusers-Distilled.description": "hunyuandit-v1.2-distilled یک مدل سبک تبدیل متن به تصویر است که با استفاده از تقطیر بهینه‌سازی شده تا تصاویر باکیفیت را به‌سرعت تولید کند، به‌ویژه مناسب برای محیط‌های کم‌منبع و تولید بلادرنگ.",
"InstantCharacter.description": "InstantCharacter مدلی برای تولید شخصیت شخصی‌سازی‌شده بدون نیاز به تنظیم است که توسط Tencent AI در سال ۲۰۲۵ عرضه شده است. این مدل با هدف تولید شخصیت‌هایی با دقت بالا و سازگاری در سناریوهای مختلف طراحی شده و می‌تواند تنها با یک تصویر مرجع، شخصیت را مدل‌سازی کرده و آن را در سبک‌ها، حرکات و پس‌زمینه‌های مختلف منتقل کند.",
"InternVL2-8B.description": "InternVL2-8B یک مدل قدرتمند بینایی-زبان است که از پردازش چندوجهی تصویر-متن پشتیبانی می‌کند و محتوای تصویر را با دقت شناسایی کرده و توضیحات یا پاسخ‌های مرتبط تولید می‌کند.",
@@ -80,7 +81,7 @@
"MiniMax-M2.1.description": "MiniMax-M2.1 یک مدل بزرگ متن‌باز پیشرفته از MiniMax است که بر حل وظایف پیچیده دنیای واقعی تمرکز دارد. نقاط قوت اصلی آن شامل توانایی برنامه‌نویسی چندزبانه و قابلیت عمل به‌عنوان یک عامل هوشمند برای حل مسائل پیچیده است.",
"MiniMax-M2.5-Lightning.description": "M2.5 Lightning: همان عملکرد، سریع‌تر و چابک‌تر (تقریباً 100 tps).",
"MiniMax-M2.5-highspeed.description": "همان عملکرد M2.5 با استنتاج به‌طور قابل‌توجهی سریع‌تر.",
"MiniMax-M2.5.description": "عملکرد برتر و صرفه‌جویی نهایی در هزینه، به‌راحتی از عهده وظایف پیچیده برمی‌آید (تقریباً 60 tps).",
"MiniMax-M2.5.description": "MiniMax-M2.5 یک مدل بزرگ متن‌باز پرچمدار از MiniMax است که بر حل وظایف پیچیده دنیای واقعی تمرکز دارد. نقاط قوت اصلی آن توانایی برنامه‌نویسی چندزبانه و قابلیت حل وظایف پیچیده به عنوان یک عامل (Agent) است.",
"MiniMax-M2.description": "طراحی‌شده به‌طور خاص برای کدنویسی کارآمد و جریان‌های کاری عامل‌محور.",
"MiniMax-Text-01.description": "MiniMax-01 توجه خطی در مقیاس بزرگ را فراتر از ترنسفورمرهای کلاسیک معرفی می‌کند، با ۴۵۶ میلیارد پارامتر و ۴۵.۹ میلیارد پارامتر فعال در هر عبور. این مدل عملکردی در سطح برتر ارائه می‌دهد و تا ۴ میلیون توکن زمینه را پشتیبانی می‌کند (۳۲ برابر GPT-4o، ۲۰ برابر Claude-3.5-Sonnet).",
"MiniMaxAI/MiniMax-M1-80k.description": "MiniMax-M1 یک مدل استدلالی با وزن‌های باز و معماری توجه ترکیبی در مقیاس بزرگ است با ۴۵۶ میلیارد پارامتر کل و حدود ۴۵.۹ میلیارد پارامتر فعال در هر توکن. این مدل به‌صورت بومی از زمینه ۱ میلیون توکن پشتیبانی می‌کند و با استفاده از Flash Attention، مصرف FLOPs را در تولید ۱۰۰ هزار توکن تا ۷۵٪ نسبت به DeepSeek R1 کاهش می‌دهد. با معماری MoE به‌همراه CISPO و آموزش تقویتی با توجه ترکیبی، عملکردی پیشرو در استدلال ورودی‌های طولانی و وظایف واقعی مهندسی نرم‌افزار ارائه می‌دهد.",
@@ -98,6 +99,7 @@
"Phi-3.5-mini-instruct.description": "نسخه به‌روزشده مدل Phi-3-mini.",
"Phi-3.5-vision-instrust.description": "نسخه به‌روزشده مدل Phi-3-vision.",
"Pro/MiniMaxAI/MiniMax-M2.1.description": "MiniMax-M2.1 یک مدل زبان بزرگ متن‌باز است که برای قابلیت‌های عامل بهینه‌سازی شده و در برنامه‌نویسی، استفاده از ابزارها، پیروی از دستورالعمل‌ها و برنامه‌ریزی بلندمدت عملکرد برجسته‌ای دارد. این مدل از توسعه نرم‌افزار چندزبانه و اجرای جریان‌های کاری پیچیده چندمرحله‌ای پشتیبانی می‌کند و با کسب امتیاز ۷۴.۰ در SWE-bench Verified، در سناریوهای چندزبانه از Claude Sonnet 4.5 پیشی گرفته است.",
"Pro/MiniMaxAI/MiniMax-M2.5.description": "MiniMax-M2.5 جدیدترین مدل زبان بزرگ توسعه‌یافته توسط MiniMax است که از طریق یادگیری تقویتی در مقیاس بزرگ در صدها هزار محیط پیچیده دنیای واقعی آموزش دیده است. با معماری MoE و 229 میلیارد پارامتر، عملکرد پیشرو در صنعت را در وظایفی مانند برنامه‌نویسی، استفاده از ابزارهای عامل، جستجو و سناریوهای اداری ارائه می‌دهد.",
"Pro/Qwen/Qwen2-7B-Instruct.description": "Qwen2-7B-Instruct یک مدل LLM با ۷ میلیارد پارامتر در سری Qwen2 است که با معماری ترنسفورمر، SwiGLU، بایاس QKV توجه و توجه گروهی طراحی شده و ورودی‌های بزرگ را مدیریت می‌کند. این مدل در درک زبان، تولید، وظایف چندزبانه، کدنویسی، ریاضی و استدلال عملکرد قوی دارد و از بسیاری از مدل‌های باز پیشی می‌گیرد و با مدل‌های اختصاصی رقابت می‌کند. در چندین معیار از Qwen1.5-7B-Chat بهتر عمل می‌کند.",
"Pro/Qwen/Qwen2.5-7B-Instruct.description": "Qwen2.5-7B-Instruct بخشی از جدیدترین سری LLM علی‌بابا کلود است. این مدل ۷ میلیاردی پیشرفت‌های قابل توجهی در کدنویسی و ریاضی دارد، از بیش از ۲۹ زبان پشتیبانی می‌کند و در پیروی از دستورالعمل‌ها، درک داده‌های ساختاریافته و تولید خروجی ساختاریافته (به‌ویژه JSON) بهبود یافته است.",
"Pro/Qwen/Qwen2.5-Coder-7B-Instruct.description": "Qwen2.5-Coder-7B-Instruct جدیدترین مدل LLM متمرکز بر کد از علی‌بابا کلود است. بر پایه Qwen2.5 ساخته شده و با ۵.۵ تریلیون توکن آموزش دیده، تولید کد، استدلال و اصلاح را به‌طور قابل توجهی بهبود می‌بخشد و در عین حال توانایی‌های ریاضی و عمومی را حفظ می‌کند، و پایه‌ای قوی برای عامل‌های کدنویسی فراهم می‌کند.",
@@ -107,13 +109,13 @@
"Pro/deepseek-ai/DeepSeek-R1-Distill-Qwen-7B.description": "DeepSeek-R1-Distill-Qwen-7B از Qwen2.5-Math-7B استخراج شده و بر روی ۸۰۰ هزار نمونه منتخب DeepSeek-R1 تنظیم دقیق شده است. این مدل عملکرد قوی دارد: ۹۲.۸٪ در MATH-500، ۵۵.۵٪ در AIME 2024 و امتیاز ۱۱۸۹ در CodeForces برای یک مدل ۷ میلیاردی.",
"Pro/deepseek-ai/DeepSeek-R1.description": "DeepSeek-R1 یک مدل استدلالی مبتنی بر یادگیری تقویتی است که تکرار را کاهش داده و خوانایی را بهبود می‌بخشد. با استفاده از داده‌های شروع سرد پیش از RL، استدلال را بیشتر تقویت می‌کند، در وظایف ریاضی، کدنویسی و استدلال با OpenAI-o1 برابری می‌کند و با آموزش دقیق، نتایج کلی را بهبود می‌بخشد.",
"Pro/deepseek-ai/DeepSeek-V3.1-Terminus.description": "DeepSeek-V3.1-Terminus نسخه به‌روزشده مدل V3.1 است که به‌عنوان یک LLM عامل ترکیبی طراحی شده است. مشکلات گزارش‌شده کاربران را رفع کرده، پایداری و سازگاری زبانی را بهبود داده و نویسه‌های غیرعادی و ترکیب چینی/انگلیسی را کاهش داده است. حالت‌های تفکری و غیرتفکری را با قالب‌های چت یکپارچه می‌کند تا امکان جابجایی انعطاف‌پذیر فراهم شود. همچنین عملکرد عامل کد و عامل جستجو را برای استفاده مطمئن‌تر از ابزارها و وظایف چندمرحله‌ای بهبود می‌بخشد.",
"Pro/deepseek-ai/DeepSeek-V3.2-Exp.description": "DeepSeek-V3.2-Exp یک نسخه آزمایشی از V3.2 است که پلی به سوی معماری بعدی ایجاد می‌کند. با افزودن DeepSeek Sparse Attention (DSA) بر پایه V3.1-Terminus، کارایی آموزش و استنتاج در زمینه‌های طولانی را بهبود می‌بخشد و برای استفاده از ابزارها، درک اسناد طولانی و استدلال چندمرحله‌ای بهینه شده است. برای بررسی کارایی بالاتر استدلال با بودجه زمینه بزرگ ایده‌آل است.",
"Pro/deepseek-ai/DeepSeek-V3.2.description": "DeepSeek-V3.2 مدلی است که کارایی محاسباتی بالا را با استدلال و عملکرد عامل عالی ترکیب می‌کند. رویکرد آن بر سه پیشرفت کلیدی فناوری استوار است: DeepSeek Sparse Attention (DSA)، یک مکانیزم توجه کارآمد که پیچیدگی محاسباتی را به طور قابل توجهی کاهش می‌دهد در حالی که عملکرد مدل را حفظ می‌کند و به طور خاص برای سناریوهای با زمینه طولانی بهینه شده است؛ یک چارچوب یادگیری تقویتی مقیاس‌پذیر که از طریق آن عملکرد مدل می‌تواند با GPT-5 رقابت کند و نسخه با محاسبات بالا آن می‌تواند با Gemini-3.0-Pro در قابلیت‌های استدلال رقابت کند؛ و یک خط لوله سنتز وظایف عامل در مقیاس بزرگ که با هدف ادغام قابلیت‌های استدلال در سناریوهای استفاده از ابزار طراحی شده است و در نتیجه پیروی از دستورالعمل‌ها و تعمیم در محیط‌های تعاملی پیچیده را بهبود می‌بخشد. این مدل عملکرد مدال طلا را در المپیاد بین‌المللی ریاضی (IMO) و المپیاد بین‌المللی انفورماتیک (IOI) سال 2025 به دست آورد.",
"Pro/deepseek-ai/DeepSeek-V3.description": "DeepSeek-V3 یک مدل MoE با ۶۷۱ میلیارد پارامتر است که از MLA و DeepSeekMoE با تعادل بار بدون اتلاف برای استنتاج و آموزش کارآمد استفاده می‌کند. با پیش‌آموزش بر روی ۱۴.۸ تریلیون توکن با کیفیت بالا و تنظیم بیشتر با SFT و RL، از سایر مدل‌های باز پیشی می‌گیرد و به مدل‌های بسته پیشرو نزدیک می‌شود.",
"Pro/moonshotai/Kimi-K2-Instruct-0905.description": "Kimi K2-Instruct-0905 جدیدترین و قدرتمندترین نسخه Kimi K2 است. این مدل MoE سطح بالا با ۱ تریلیون پارامتر کل و ۳۲ میلیارد پارامتر فعال است. ویژگی‌های کلیدی شامل هوش کدنویسی عامل‌محور قوی‌تر با پیشرفت‌های قابل توجه در معیارها و وظایف واقعی عامل‌ها، به‌علاوه زیبایی‌شناسی و قابلیت استفاده بهتر در کدنویسی رابط کاربری است.",
"Pro/moonshotai/Kimi-K2-Thinking.description": "Kimi K2 Thinking Turbo نسخه توربو بهینه‌شده برای سرعت استدلال و توان عملیاتی است، در حالی که استدلال چندمرحله‌ای و استفاده از ابزار K2 Thinking را حفظ می‌کند. این مدل MoE با حدود ۱ تریلیون پارامتر کل، زمینه بومی ۲۵۶ هزار توکن و فراخوانی ابزار در مقیاس بزرگ پایدار برای سناریوهای تولیدی با نیازهای سخت‌گیرانه‌تر در تأخیر و هم‌زمانی است.",
"Pro/moonshotai/Kimi-K2.5.description": "Kimi K2.5 یک مدل عامل چندوجهی بومی متن‌باز است که بر پایه Kimi-K2-Base ساخته شده و با حدود ۱.۵ تریلیون توکن ترکیبی بینایی و متنی آموزش دیده است. این مدل از معماری MoE با ۱ تریلیون پارامتر کل و ۳۲ میلیارد پارامتر فعال بهره می‌برد و از پنجره متنی ۲۵۶ هزار توکن پشتیبانی می‌کند و درک زبان و تصویر را به‌صورت یکپارچه ارائه می‌دهد.",
"Pro/zai-org/glm-4.7.description": "GLM-4.7 مدل پرچم‌دار نسل جدید Zhipu با ۳۵۵ میلیارد پارامتر کل و ۳۲ میلیارد پارامتر فعال است که به‌طور کامل در زمینه‌های گفت‌وگوی عمومی، استدلال و توانایی‌های عامل به‌روزرسانی شده است. GLM-4.7 تفکر درهم‌تنیده را بهبود می‌بخشد و مفاهیم تفکر حفظ‌شده و تفکر در سطح نوبت را معرفی می‌کند.",
"Pro/zai-org/glm-5.description": "GLM-5 مدل زبان بزرگ نسل جدیدی است که توسط Zhipu ارائه شده و بر مهندسی سیستم‌های پیچیده و وظایف Agent با دوره‌های طولانی تمرکز دارد. پارامترهای مدل به 744 میلیارد پارامتر (40 میلیارد فعال) گسترش یافته و DeepSeek Sparse Attention را ادغام کرده است.",
"Pro/zai-org/glm-5.description": "GLM-5 مدل زبان بزرگ نسل بعدی Zhipu است که بر مهندسی سیستم‌های پیچیده و وظایف عامل با مدت زمان طولانی تمرکز دارد. پارامترهای مدل به 744 میلیارد (40 میلیارد فعال) گسترش یافته و DeepSeek Sparse Attention را ادغام می‌کند.",
"QwQ-32B-Preview.description": "Qwen QwQ یک مدل تحقیقاتی آزمایشی است که بر بهبود توانایی استدلال تمرکز دارد.",
"Qwen/QVQ-72B-Preview.description": "QVQ-72B-Preview یک مدل تحقیقاتی از Qwen است که بر استدلال بصری تمرکز دارد و در درک صحنه‌های پیچیده و حل مسائل ریاضی بصری توانمند است.",
"Qwen/QwQ-32B-Preview.description": "Qwen QwQ یک مدل تحقیقاتی آزمایشی است که بر بهبود استدلال هوش مصنوعی تمرکز دارد.",
@@ -137,7 +139,7 @@
"Qwen/Qwen3-14B.description": "Qwen3 یک مدل نسل جدید از خانواده Tongyi Qwen است که پیشرفت‌های چشمگیری در استدلال، توانایی عمومی، قابلیت‌های عامل‌محور و عملکرد چندزبانه دارد و از تغییر حالت‌های تفکر پشتیبانی می‌کند.",
"Qwen/Qwen3-235B-A22B-Instruct-2507.description": "Qwen3-235B-A22B-Instruct-2507 یک مدل پرچم‌دار MoE از سری Qwen3 با ۲۳۵ میلیارد پارامتر کل و ۲۲ میلیارد پارامتر فعال است. این نسخه غیرتفکری به‌روزرسانی شده، بر بهبود پیروی از دستورالعمل‌ها، استدلال منطقی، درک متن، ریاضیات، علوم، برنامه‌نویسی و استفاده از ابزار تمرکز دارد. همچنین دانش چندزبانه در حوزه‌های کم‌کاربرد را گسترش داده و با ترجیحات کاربران در وظایف ذهنی و باز بهتر هم‌راستا می‌شود.",
"Qwen/Qwen3-235B-A22B-Thinking-2507.description": "Qwen3-235B-A22B-Thinking-2507 یک مدل Qwen3 متمرکز بر استدلال پیچیده و دشوار است. این مدل از معماری MoE با ۲۳۵ میلیارد پارامتر کل و حدود ۲۲ میلیارد پارامتر فعال در هر توکن استفاده می‌کند تا بهره‌وری را افزایش دهد. به‌عنوان یک مدل تفکری اختصاصی، پیشرفت‌های چشمگیری در منطق، ریاضیات، علوم، برنامه‌نویسی و معیارهای دانشگاهی نشان می‌دهد و به عملکردی در سطح برتر در تفکر باز می‌رسد. همچنین پیروی از دستورالعمل‌ها، استفاده از ابزار و تولید متن را بهبود می‌بخشد و به‌صورت بومی از زمینه ۲۵۶ هزار توکن برای استدلال عمیق و اسناد طولانی پشتیبانی می‌کند.",
"Qwen/Qwen3-235B-A22B.description": "Qwen3 یک مدل نسل جدید از خانواده Tongyi Qwen است که پیشرفت‌های چشمگیری در استدلال، توانایی عمومی، قابلیت‌های عامل‌محور و عملکرد چندزبانه دارد و از تغییر حالت‌های تفکر پشتیبانی می‌کند.",
"Qwen/Qwen3-235B-A22B.description": "Qwen3 235B A22B یک مدل فوق‌العاده مقیاس Qwen3 است که قابلیت‌های برتر هوش مصنوعی را ارائه می‌دهد.",
"Qwen/Qwen3-30B-A3B-Instruct-2507.description": "Qwen3-30B-A3B-Instruct-2507 نسخه غیرتفکری به‌روزرسانی‌شده Qwen3-30B-A3B است. این مدل MoE دارای ۳۰.۵ میلیارد پارامتر کل و ۳.۳ میلیارد پارامتر فعال است. این مدل به‌طور قابل‌توجهی پیروی از دستورالعمل‌ها، استدلال منطقی، درک متن، ریاضیات، علوم، برنامه‌نویسی و استفاده از ابزار را بهبود می‌بخشد، دانش چندزبانه در حوزه‌های کم‌کاربرد را گسترش می‌دهد و با ترجیحات کاربران در وظایف ذهنی باز بهتر هم‌راستا می‌شود. از زمینه ۲۵۶ هزار توکن پشتیبانی می‌کند. این مدل فقط در حالت غیرتفکری عمل می‌کند و تگ‌های `<think></think>` تولید نمی‌کند.",
"Qwen/Qwen3-30B-A3B-Thinking-2507.description": "Qwen3-30B-A3B-Thinking-2507 جدیدترین مدل تفکری در سری Qwen3 است. این مدل MoE با ۳۰.۵ میلیارد پارامتر کل و ۳.۳ میلیارد پارامتر فعال، بر وظایف پیچیده تمرکز دارد. پیشرفت‌های قابل‌توجهی در منطق، ریاضیات، علوم، برنامه‌نویسی و معیارهای دانشگاهی نشان می‌دهد و پیروی از دستورالعمل‌ها، استفاده از ابزار، تولید متن و هم‌راستایی با ترجیحات را بهبود می‌بخشد. به‌صورت بومی از زمینه ۲۵۶ هزار توکن پشتیبانی می‌کند و قابلیت گسترش تا ۱ میلیون توکن را دارد. این نسخه برای حالت تفکری طراحی شده و استدلال گام‌به‌گام دقیق و قابلیت‌های قوی عامل‌محور ارائه می‌دهد.",
"Qwen/Qwen3-30B-A3B.description": "Qwen3 یک مدل نسل جدید از خانواده Tongyi Qwen است که پیشرفت‌های چشمگیری در استدلال، توانایی عمومی، قابلیت‌های عامل‌محور و عملکرد چندزبانه دارد و از تغییر حالت‌های تفکر پشتیبانی می‌کند.",
@@ -315,7 +317,6 @@
"codeqwen.description": "CodeQwen1.5 یک مدل زبانی بزرگ است که بر پایه داده‌های گسترده کد آموزش دیده و برای وظایف پیچیده برنامه‌نویسی طراحی شده است.",
"codestral-latest.description": "Codestral پیشرفته‌ترین مدل کدنویسی ماست؛ نسخه v2 (ژانویه ۲۰۲۵) برای وظایف با تأخیر کم و فرکانس بالا مانند FIM، اصلاح کد و تولید تست بهینه شده است.",
"codestral.description": "Codestral اولین مدل کدنویسی از Mistral AI است که پشتیبانی قوی برای تولید کد ارائه می‌دهد.",
"codex-mini-latest.description": "codex-mini-latest نسخه تنظیم‌شده مدل o4-mini برای رابط خط فرمان Codex است. برای استفاده مستقیم از API، توصیه می‌شود با gpt-4.1 شروع کنید.",
"cogito-2.1:671b.description": "Cogito v2.1 671B یک مدل زبان بازمتن آمریکایی است که برای استفاده تجاری رایگان است. این مدل عملکردی در حد مدل‌های برتر دارد، بازدهی بالای استدلال با توکن، زمینه طولانی ۱۲۸هزار توکنی و توانایی کلی قوی ارائه می‌دهد.",
"cogview-3-flash.description": "CogView-3-Flash یک مدل تولید تصویر رایگان است که توسط Zhipu ارائه شده است. این مدل تصاویر را مطابق با دستورالعمل‌های کاربران تولید می‌کند و در عین حال امتیازات کیفیت زیبایی‌شناسی بالاتری را به دست می‌آورد. CogView-3-Flash عمدتاً در زمینه‌هایی مانند خلق هنری، مرجع طراحی، توسعه بازی و واقعیت مجازی استفاده می‌شود و به کاربران کمک می‌کند تا توضیحات متنی را به سرعت به تصاویر تبدیل کنند.",
"cogview-4.description": "CogView-4 نخستین مدل متن به تصویر بازمتن Zhipu است که توانایی تولید نویسه‌های چینی را دارد. این مدل درک معنایی، کیفیت تصویر و رندر متن چینی/انگلیسی را بهبود می‌بخشد، از دستورات دو زبانه با طول دلخواه پشتیبانی می‌کند و می‌تواند تصاویر را در هر وضوحی در محدوده مشخص تولید کند.",
@@ -342,7 +343,7 @@
"command-light-nightly.description": "برای کاهش فاصله بین نسخه‌های اصلی، نسخه‌های شبانه Command را ارائه می‌دهیم. برای سری command-light، این نسخه command-light-nightly نام دارد. این نسخه جدیدترین و آزمایشی‌ترین (و احتمالاً ناپایدارترین) نسخه است که به‌طور منظم و بدون اطلاع به‌روزرسانی می‌شود، بنابراین برای استفاده در تولید توصیه نمی‌شود.",
"command-light.description": "نسخه‌ای کوچک‌تر و سریع‌تر از Command که تقریباً به همان اندازه توانمند است اما سریع‌تر عمل می‌کند.",
"command-nightly.description": "برای کاهش فاصله بین نسخه‌های اصلی، نسخه‌های شبانه Command را ارائه می‌دهیم. برای سری Command، این نسخه command-nightly نام دارد. این نسخه جدیدترین و آزمایشی‌ترین (و احتمالاً ناپایدارترین) نسخه است که به‌طور منظم و بدون اطلاع به‌روزرسانی می‌شود، بنابراین برای استفاده در تولید توصیه نمی‌شود.",
"command-r-03-2024.description": "Command R یک مدل چت پیرو دستورالعمل است که کیفیت بالاتر، قابلیت اطمینان بیشتر و پنجره زمینه طولانی‌تری نسبت به مدل‌های قبلی دارد. این مدل از جریان‌های کاری پیچیده مانند تولید کد، RAG، استفاده از ابزار و عامل‌ها پشتیبانی می‌کند.",
"command-r-03-2024.description": "command-r یک مدل چت پیروی از دستورالعمل است که وظایف زبانی را با کیفیت بالاتر، قابلیت اطمینان بهبود یافته و زمینه طولانی‌تر نسبت به مدل‌های قبلی انجام می‌دهد. این مدل از جریان‌های کاری پیچیده مانند تولید کد، RAG، استفاده از ابزار و عوامل پشتیبانی می‌کند.",
"command-r-08-2024.description": "command-r-08-2024 نسخه به‌روزرسانی‌شده مدل Command R است که در آگوست ۲۰۲۴ منتشر شده است.",
"command-r-plus-04-2024.description": "command-r-plus نام مستعار command-r-plus-04-2024 است، بنابراین استفاده از command-r-plus در API به آن مدل اشاره دارد.",
"command-r-plus-08-2024.description": "Command R+ یک مدل چت پیرو دستورالعمل است که کیفیت بالاتر، قابلیت اطمینان بیشتر و پنجره زمینه طولانی‌تری نسبت به مدل‌های قبلی دارد. این مدل برای جریان‌های کاری پیچیده RAG و استفاده چندمرحله‌ای از ابزارها بهترین گزینه است.",
@@ -366,7 +367,8 @@
"deepseek-ai/DeepSeek-V2.5.description": "DeepSeek-V2.5 نسخه ارتقاءیافته DeepSeek-V2-Chat و DeepSeek-Coder-V2-Instruct است که توانایی‌های عمومی و برنامه‌نویسی را ترکیب می‌کند. این مدل در نوشتن و پیروی از دستورالعمل‌ها بهبود یافته و در معیارهایی مانند AlpacaEval 2.0، ArenaHard، AlignBench و MT-Bench پیشرفت چشمگیری نشان داده است.",
"deepseek-ai/DeepSeek-V3.1-Terminus.description": "DeepSeek-V3.1-Terminus نسخه به‌روزشده مدل V3.1 است که به‌عنوان یک عامل ترکیبی LLM طراحی شده است. این مدل مشکلات گزارش‌شده کاربران را رفع کرده، ثبات و سازگاری زبانی را بهبود بخشیده و نویسه‌های غیرعادی و ترکیب چینی/انگلیسی را کاهش داده است. این مدل حالت‌های تفکر و غیرتفکر را با قالب‌های چت ترکیب کرده و امکان جابجایی انعطاف‌پذیر را فراهم می‌کند. همچنین عملکرد عامل کدنویسی و جستجو را برای استفاده مطمئن‌تر از ابزارها و انجام وظایف چندمرحله‌ای بهبود داده است.",
"deepseek-ai/DeepSeek-V3.1.description": "DeepSeek V3.1 از معماری استدلال ترکیبی استفاده می‌کند و از هر دو حالت تفکر و غیرتفکر پشتیبانی می‌کند.",
"deepseek-ai/DeepSeek-V3.2-Exp.description": "DeepSeek-V3.2-Exp نسخه آزمایشی V3.2 است که به معماری بعدی پل می‌زند. این مدل با افزودن DeepSeek Sparse Attention (DSA) بر پایه V3.1-Terminus، کارایی آموزش و استنتاج در زمینه‌های طولانی را بهبود می‌بخشد و برای استفاده از ابزارها، درک اسناد طولانی و استدلال چندمرحله‌ای بهینه شده است. این مدل برای بررسی بهره‌وری بالاتر در استدلال با بودجه متنی بزرگ ایده‌آل است.",
"deepseek-ai/DeepSeek-V3.2-Exp.description": "DeepSeek V3.2 Exp از یک معماری استدلال ترکیبی استفاده می‌کند و از هر دو حالت تفکر و غیرتفکر پشتیبانی می‌کند.",
"deepseek-ai/DeepSeek-V3.2.description": "DeepSeek-V3.2 مدلی است که کارایی محاسباتی بالا را با استدلال و عملکرد عامل عالی ترکیب می‌کند. رویکرد آن بر سه پیشرفت کلیدی فناوری استوار است: DeepSeek Sparse Attention (DSA)، یک مکانیزم توجه کارآمد که پیچیدگی محاسباتی را به طور قابل توجهی کاهش می‌دهد در حالی که عملکرد مدل را حفظ می‌کند و به طور خاص برای سناریوهای با زمینه طولانی بهینه شده است؛ یک چارچوب یادگیری تقویتی مقیاس‌پذیر که از طریق آن عملکرد مدل می‌تواند با GPT-5 رقابت کند و نسخه با محاسبات بالا آن می‌تواند با Gemini-3.0-Pro در قابلیت‌های استدلال رقابت کند؛ و یک خط لوله سنتز وظایف عامل در مقیاس بزرگ که با هدف ادغام قابلیت‌های استدلال در سناریوهای استفاده از ابزار طراحی شده است و در نتیجه پیروی از دستورالعمل‌ها و تعمیم در محیط‌های تعاملی پیچیده را بهبود می‌بخشد. این مدل عملکرد مدال طلا را در المپیاد بین‌المللی ریاضی (IMO) و المپیاد بین‌المللی انفورماتیک (IOI) سال 2025 به دست آورد.",
"deepseek-ai/DeepSeek-V3.description": "DeepSeek-V3 یک مدل MoE با ۶۷۱ میلیارد پارامتر است که از MLA و DeepSeekMoE با تعادل بار بدون اتلاف برای آموزش و استنتاج کارآمد استفاده می‌کند. این مدل با استفاده از ۱۴.۸ تریلیون توکن با کیفیت بالا و آموزش با SFT و RL، از سایر مدل‌های متن‌باز پیشی گرفته و به مدل‌های بسته پیشرو نزدیک شده است.",
"deepseek-ai/deepseek-llm-67b-chat.description": "DeepSeek LLM Chat (67B) یک مدل نوآورانه با درک عمیق زبان و تعامل است.",
"deepseek-ai/deepseek-v3.1-terminus.description": "DeepSeek V3.1 یک مدل استدلال نسل بعدی با توانایی استدلال پیچیده و زنجیره تفکر برای وظایف تحلیلی عمیق است.",
@@ -433,6 +435,7 @@
"deepseek_r1_distill_llama_70b.description": "DeepSeek-R1-Distill-Llama-70B از Llama-3.3-70B-Instruct تقطیر شده است. به‌عنوان بخشی از سری DeepSeek-R1، با استفاده از نمونه‌های تولیدشده توسط DeepSeek-R1 تنظیم دقیق شده و در ریاضی، کدنویسی و استدلال عملکرد قوی دارد.",
"deepseek_r1_distill_qwen_14b.description": "DeepSeek-R1-Distill-Qwen-14B از Qwen2.5-14B تقطیر شده و با استفاده از ۸۰۰ هزار نمونه منتخب تولیدشده توسط DeepSeek-R1 تنظیم دقیق شده است و عملکرد استدلالی قوی ارائه می‌دهد.",
"deepseek_r1_distill_qwen_32b.description": "DeepSeek-R1-Distill-Qwen-32B از Qwen2.5-32B تقطیر شده و با استفاده از ۸۰۰ هزار نمونه منتخب تولیدشده توسط DeepSeek-R1 تنظیم دقیق شده است و در ریاضی، کدنویسی و استدلال عملکرد برجسته‌ای دارد.",
"devstral-2512.description": "Devstral 2 یک مدل متنی در سطح سازمانی است که در استفاده از ابزارها برای کاوش در پایگاه‌های کد، ویرایش چندین فایل و تقویت عوامل مهندسی نرم‌افزار برتری دارد.",
"devstral-2:123b.description": "Devstral 2 123B در استفاده از ابزارها برای بررسی پایگاه‌های کد، ویرایش چندین فایل و پشتیبانی از عامل‌های مهندسی نرم‌افزار عملکرد برجسته‌ای دارد.",
"doubao-1.5-lite-32k.description": "Doubao-1.5-lite یک مدل سبک و جدید با پاسخ‌دهی فوق‌العاده سریع است که کیفیت و تأخیر سطح بالا را ارائه می‌دهد.",
"doubao-1.5-pro-256k.description": "Doubao-1.5-pro-256k ارتقایی جامع از Doubao-1.5-Pro است که عملکرد کلی را ۱۰٪ بهبود می‌بخشد. این مدل از پنجره متنی ۲۵۶هزار توکن و خروجی تا ۱۲هزار توکن پشتیبانی می‌کند و عملکرد بالاتر، پنجره بزرگ‌تر و ارزش قوی‌تری برای کاربردهای گسترده‌تر ارائه می‌دهد.",
@@ -546,10 +549,10 @@
"gemini-2.5-pro-preview-06-05.description": "Gemini 2.5 Pro Preview پیشرفته‌ترین مدل استدلالی گوگل است که توانایی استدلال در کد، ریاضی و مسائل STEM را دارد و می‌تواند مجموعه‌داده‌های بزرگ، پایگاه‌های کد و اسناد را با زمینه طولانی تحلیل کند.",
"gemini-2.5-pro.description": "Gemini 2.5 Pro پرچم‌دار مدل‌های استدلالی گوگل است که از زمینه‌های طولانی برای انجام وظایف پیچیده پشتیبانی می‌کند.",
"gemini-3-flash-preview.description": "Gemini 3 Flash هوشمندترین مدل طراحی‌شده برای سرعت است که هوش پیشرفته را با قابلیت جست‌وجوی دقیق ترکیب می‌کند.",
"gemini-3-pro-image-preview.description": "Gemini 3 Pro Image (Nano Banana Pro) مدل تولید تصویر گوگل است که از گفت‌وگوی چندوجهی نیز پشتیبانی می‌کند.",
"gemini-3-pro-image-preview.description": "Gemini 3 Pro Image (Nano Banana Pro) مدل تولید تصویر گوگل است که از گفتگوی چندوجهی نیز پشتیبانی می‌کند.",
"gemini-3-pro-image-preview:image.description": "Gemini 3 Pro Image (Nano Banana Pro) مدل تولید تصویر گوگل است که از گفت‌وگوی چندوجهی نیز پشتیبانی می‌کند.",
"gemini-3-pro-preview.description": "Gemini 3 Pro قدرتمندترین مدل عامل و کدنویسی احساسی گوگل است که تعاملات بصری غنی‌تر و تعامل عمیق‌تری را بر پایه استدلال پیشرفته ارائه می‌دهد.",
"gemini-3.1-flash-image-preview.description": "Gemini 3.1 Flash Image (Nano Banana 2) کیفیت تصویر حرفه‌ای را با سرعت Flash ارائه می‌دهد و از چت چندوجهی پشتیبانی می‌کند.",
"gemini-3.1-flash-image-preview.description": "Gemini 3.1 Flash Image (Nano Banana 2) سریع‌ترین مدل تولید تصویر بومی گوگل با پشتیبانی از تفکر، تولید و ویرایش تصویر مکالمه‌ای است.",
"gemini-3.1-flash-image-preview:image.description": "Gemini 3.1 Flash Image (Nano Banana 2) کیفیت تصویر حرفه‌ای را با سرعت Flash ارائه می‌دهد و از چت چندوجهی پشتیبانی می‌کند.",
"gemini-3.1-pro-preview.description": "پیش‌نمایش Gemini 3.1 Pro قابلیت‌های استدلال بهبود یافته را به Gemini 3 Pro اضافه می‌کند و از سطح تفکر متوسط پشتیبانی می‌کند.",
"gemini-flash-latest.description": "آخرین نسخه منتشرشده از Gemini Flash",
@@ -605,19 +608,15 @@
"google/gemini-2.0-flash-lite-001.description": "Gemini 2.0 Flash Lite نسخه سبک Gemini است که به‌طور پیش‌فرض تفکر را غیرفعال کرده تا تأخیر و هزینه را کاهش دهد، اما می‌توان آن را از طریق پارامترها فعال کرد.",
"google/gemini-2.0-flash-lite.description": "Gemini 2.0 Flash Lite ویژگی‌های نسل بعدی را ارائه می‌دهد، از جمله سرعت بالا، استفاده داخلی از ابزارها، تولید چندوجهی و پنجره زمینه‌ای ۱ میلیون توکن.",
"google/gemini-2.0-flash.description": "Gemini 2.0 Flash مدل استدلال با عملکرد بالای گوگل برای وظایف چندوجهی گسترده است.",
"google/gemini-2.5-flash-image-free.description": "نسخه رایگان Gemini 2.5 Flash Image با سهمیه محدود برای تولید چندوجهی.",
"google/gemini-2.5-flash-image-preview.description": "مدل آزمایشی Gemini 2.5 Flash با پشتیبانی از تولید تصویر.",
"google/gemini-2.5-flash-image.description": "Gemini 2.5 Flash Image (Nano Banana) مدل تولید تصویر گوگل با پشتیبانی از گفت‌وگوی چندوجهی است.",
"google/gemini-2.5-flash-lite.description": "Gemini 2.5 Flash Lite نسخه سبک Gemini 2.5 است که برای تأخیر کم و هزینه پایین بهینه شده و برای سناریوهای با حجم بالا مناسب است.",
"google/gemini-2.5-flash-preview.description": "Gemini 2.5 Flash پیشرفته‌ترین مدل پرچم‌دار گوگل است که برای استدلال پیشرفته، برنامه‌نویسی، ریاضی و علوم طراحی شده است. این مدل دارای قابلیت تفکر داخلی است تا پاسخ‌هایی با دقت بالاتر و پردازش زمینه‌ای دقیق‌تر ارائه دهد.",
"google/gemini-2.5-flash-preview:thinking.description": "Gemini 2.5 Flash پیشرفته‌ترین مدل پرچم‌دار گوگل است که برای وظایف استدلالی، برنامه‌نویسی، ریاضی و علمی طراحی شده است. این مدل دارای قابلیت «تفکر» داخلی است که پاسخ‌هایی با دقت بالاتر و پردازش زمینه‌ای دقیق‌تر ارائه می‌دهد.\n\nتوجه: این مدل دو نسخه دارد — با تفکر و بدون تفکر. قیمت‌گذاری خروجی به‌طور قابل توجهی بسته به فعال بودن تفکر متفاوت است. اگر نسخه استاندارد (بدون پسوند “:thinking”) را انتخاب کنید، مدل به‌طور صریح از تولید توکن‌های تفکر خودداری می‌کند.\n\nبرای استفاده از تفکر و دریافت توکن‌های تفکر، باید نسخه “:thinking” را انتخاب کنید که هزینه بیشتری دارد.\n\nGemini 2.5 Flash همچنین می‌تواند از طریق پارامتر “max reasoning tokens” پیکربندی شود (https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning).",
"google/gemini-2.5-flash.description": "Gemini 2.5 Flash (Lite/Pro/Flash) خانواده‌ای از مدل‌های گوگل است که از تأخیر کم تا استدلال با عملکرد بالا را پوشش می‌دهد.",
"google/gemini-2.5-pro-free.description": "نسخه رایگان Gemini 2.5 Pro با سهمیه محدود، پشتیبانی از ورودی چندحالته و زمینه طولانی، مناسب برای آزمایش و جریان‌های کاری سبک.",
"google/gemini-2.5-flash.description": "Gemini 2.5 Flash خانواده‌ای از گوگل است که از تأخیر کم تا استدلال با عملکرد بالا را پوشش می‌دهد.",
"google/gemini-2.5-pro-preview.description": "Gemini 2.5 Pro Preview پیشرفته‌ترین مدل تفکر گوگل برای استدلال در مسائل پیچیده کد، ریاضی و علوم است و برای تحلیل مجموعه داده‌های بزرگ، پایگاه‌های کد و اسناد با زمینه طولانی مناسب است.",
"google/gemini-2.5-pro.description": "Gemini 2.5 Pro مدل پرچم‌دار استدلالی گوگل با پشتیبانی از زمینه طولانی برای وظایف پیچیده است.",
"google/gemini-3-pro-image-preview-free.description": "نسخه رایگان Gemini 3 Pro Image با سهمیه محدود برای تولید چندحالته.",
"google/gemini-3-pro-image-preview.description": "Gemini 3 Pro Image (Nano Banana Pro) مدل تولید تصویر گوگل با پشتیبانی از مکالمه چندحالته است.",
"google/gemini-3-pro-preview-free.description": "نسخه رایگان Gemini 3 Pro Preview همان درک و استدلال چندحالته نسخه استاندارد را ارائه می‌دهد، اما با محدودیت سهمیه و نرخ، مناسب برای آزمایش و استفاده کم‌تکرار است.",
"google/gemini-3-pro-preview.description": "Gemini 3 Pro نسل بعدی مدل استدلال چندحالته در خانواده Gemini است که متن، صدا، تصویر و ویدیو را درک می‌کند و وظایف پیچیده و پایگاه‌های کد بزرگ را مدیریت می‌کند.",
"google/gemini-embedding-001.description": "مدل جاسازی پیشرفته با عملکرد قوی در وظایف انگلیسی، چندزبانه و کدنویسی.",
"google/gemini-flash-1.5.description": "Gemini 1.5 Flash پردازش چندحالته بهینه‌شده برای طیف وسیعی از وظایف پیچیده را ارائه می‌دهد.",
@@ -717,15 +716,24 @@
"hunyuan-a13b.description": "اولین مدل استدلال ترکیبی از Hunyuan، ارتقاءیافته از hunyuan-standard-256K (در مجموع ۸۰ میلیارد، ۱۳ میلیارد فعال). به‌طور پیش‌فرض با تفکر آهسته کار می‌کند و از طریق پارامترها یا پیشوند /no_think قابلیت تغییر بین تفکر سریع و آهسته را دارد. توانایی کلی آن نسبت به نسل قبلی به‌ویژه در ریاضی، علوم، درک متون بلند و وظایف عامل بهبود یافته است.",
"hunyuan-code.description": "جدیدترین مدل کدنویسی Hunyuan که بر اساس داده‌های کد با کیفیت بالا به‌میزان 200 میلیارد و شش ماه داده SFT آموزش داده شده است، با زمینه 8K. این مدل در معیارهای کدنویسی خودکار و ارزیابی‌های انسانی متخصص در پنج زبان رتبه بالایی دارد.",
"hunyuan-functioncall.description": "جدیدترین مدل MoE FunctionCall Hunyuan که بر اساس داده‌های فراخوانی ابزار با کیفیت بالا آموزش داده شده است، با پنجره زمینه 32K و معیارهای پیشرو در ابعاد مختلف.",
"hunyuan-large-longcontext.description": "در وظایف اسناد طولانی مانند خلاصه‌سازی و پرسش و پاسخ برتری دارد و همچنین تولید عمومی را مدیریت می‌کند. در تحلیل و تولید متن طولانی برای محتوای پیچیده و دقیق قوی است.",
"hunyuan-large.description": "Hunyuan-large دارای ~389 میلیارد پارامتر کل و ~52 میلیارد فعال است، بزرگ‌ترین و قوی‌ترین مدل MoE متن‌باز در معماری Transformer.",
"hunyuan-lite.description": "ارتقاءیافته به معماری MoE با پنجره زمینه ۲۵۶ هزار، پیشتاز در میان بسیاری از مدل‌های باز در حوزه‌های NLP، کد، ریاضی و معیارهای صنعتی.",
"hunyuan-pro.description": "مدل MoE با تریلیون پارامتر و پنجره زمینه ۳۲ هزار که در ارزیابی‌ها پیشتاز است، در دستورالعمل‌های پیچیده و استدلال، ریاضی پیشرفته، تماس تابع و ترجمه چندزبانه، مالی، حقوقی و پزشکی عملکرد قوی دارد.",
"hunyuan-role.description": "جدیدترین مدل نقش‌آفرینی Hunyuan که به‌طور رسمی با داده‌های نقش‌آفرینی تنظیم شده است و عملکرد پایه قوی‌تری در سناریوهای نقش‌آفرینی ارائه می‌دهد.",
"hunyuan-standard-256K.description": "از مسیریابی بهبود یافته برای کاهش تعادل بار و فروپاشی متخصص استفاده می‌کند. متن طولانی \"سوزن در انبار کاه\" به 99.9% می‌رسد. MOE-256K طول و کیفیت ورودی را به‌طور قابل‌توجهی گسترش می‌دهد.",
"hunyuan-standard.description": "از مسیریابی بهبود یافته برای کاهش تعادل بار و فروپاشی متخصص استفاده می‌کند. متن طولانی \"سوزن در انبار کاه\" به 99.9% می‌رسد. MOE-32K ارزش بهتری ارائه می‌دهد و کیفیت و قیمت را برای ورودی‌های متن طولانی متعادل می‌کند.",
"hunyuan-standard-256K.description": "از مسیریابی بهبود یافته برای کاهش تعادل بار و فروپاشی متخصص استفاده می‌کند. به 99.9% موفقیت در وظایف با زمینه طولانی دست می‌یابد. MOE-256K طول و کیفیت زمینه را بیشتر گسترش می‌دهد.",
"hunyuan-standard.description": "از مسیریابی بهبود یافته برای کاهش تعادل بار و فروپاشی متخصص استفاده می‌کند. به 99.9% موفقیت در وظایف با زمینه طولانی دست می‌یابد. MOE-32K ارزش قوی را در حالی که ورودی‌های طولانی را مدیریت می‌کند ارائه می‌دهد.",
"hunyuan-t1-20250321.description": "قابلیت‌های متعادل در هنر و STEM را با ضبط اطلاعات قوی متن طولانی ایجاد می‌کند. از پاسخ‌های استدلالی برای مسائل ریاضی، منطق، علم و کدنویسی در سطوح دشواری مختلف پشتیبانی می‌کند.",
"hunyuan-t1-20250403.description": "کیفیت تولید کد در سطح پروژه و نوشتن را بهبود می‌بخشد، درک موضوع چندمرحله‌ای و پیروی از دستورالعمل ToB را تقویت می‌کند، درک کلمه‌ای را بهبود می‌بخشد و مشکلات خروجی‌های ترکیبی ساده/سنتی و چینی/انگلیسی را کاهش می‌دهد.",
"hunyuan-t1-20250529.description": "نوشتن خلاقانه و ترکیب‌بندی را بهبود می‌بخشد، کدنویسی فرانت‌اند، ریاضیات و استدلال منطقی را تقویت می‌کند و پیروی از دستورالعمل‌ها را افزایش می‌دهد.",
"hunyuan-t1-20250711.description": "ریاضیات سخت، منطق و کدنویسی را به طور قابل توجهی بهبود می‌بخشد، پایداری خروجی را افزایش می‌دهد و قابلیت متن طولانی را تقویت می‌کند.",
"hunyuan-t1-latest.description": "مدل تفکر آهسته را در ریاضی سخت، استدلال پیچیده، کدنویسی دشوار، پیروی از دستورالعمل‌ها و کیفیت نوشتار خلاقانه به‌طور قابل توجهی بهبود می‌بخشد.",
"hunyuan-t1-vision-20250916.description": "جدیدترین مدل استدلال عمیق t1-vision با بهبودهای عمده در VQA، اتصال بصری، OCR، نمودارها، حل مسائل تصویری و تولید مبتنی بر تصویر، به‌علاوه پشتیبانی قوی‌تر از زبان انگلیسی و زبان‌های کم‌منبع.",
"hunyuan-turbo-20241223.description": "این نسخه مقیاس‌بندی دستورالعمل‌ها را برای تعمیم بهتر تقویت می‌کند، استدلال ریاضی/کد/منطق را به طور قابل توجهی بهبود می‌بخشد، درک کلمه‌ای را تقویت می‌کند و کیفیت نوشتن را بهبود می‌بخشد.",
"hunyuan-turbo-latest.description": "بهبودهای کلی در تجربه درک NLP، نوشتن، چت، پرسش و پاسخ، ترجمه و دامنه‌ها؛ پاسخ‌های انسانی‌تر، وضوح بهتر در نیت‌های مبهم، تجزیه کلمات بهتر، کیفیت خلاقانه بالاتر و تعامل بیشتر، و مکالمات چندمرحله‌ای قوی‌تر.",
"hunyuan-turbo.description": "پیش‌نمایشی از مدل LLM نسل بعدی Hunyuan با معماری جدید MoE، ارائه‌دهنده استدلال سریع‌تر و نتایج قوی‌تر نسبت به hunyuan-pro.",
"hunyuan-turbos-latest.description": "جدیدترین مدل پرچم‌دار Hunyuan TurboS با استدلال قوی‌تر و تجربه‌ای کلی بهتر.",
"hunyuan-turbos-longtext-128k-20250325.description": "در وظایف اسناد طولانی مانند خلاصه‌سازی و پرسش و پاسخ برتری دارد و همچنین تولید عمومی را مدیریت می‌کند. در تحلیل و تولید متن طولانی برای محتوای پیچیده و دقیق قوی است.",
"hunyuan-vision-1.5-instruct.description": "یک مدل تصویر به متن سریع تفکر که بر اساس پایه متن TurboS ساخته شده است و بهبودهای قابل‌توجهی نسبت به نسخه قبلی در تشخیص تصویر بنیادی و استدلال تحلیل تصویر نشان می‌دهد.",
"hunyuan-vision.description": "جدیدترین مدل چندوجهی Hunyuan که از ورودی‌های تصویر + متن برای تولید متن پشتیبانی می‌کند.",
"image-01-live.description": "مدل تولید تصویر با جزئیات دقیق، پشتیبانی از تبدیل متن به تصویر و تنظیمات سبک قابل کنترل.",
@@ -770,8 +778,7 @@
"kimi-k2:1t.description": "Kimi K2 یک مدل زبانی بزرگ MoE از Moonshot AI با ۱ تریلیون پارامتر کل و ۳۲ میلیارد فعال در هر عبور است. این مدل برای قابلیت‌های عامل از جمله استفاده پیشرفته از ابزار، استدلال و ترکیب کد بهینه‌سازی شده است.",
"kimi-latest.description": "Kimi Latest از جدیدترین مدل Kimi استفاده می‌کند و ممکن است شامل ویژگی‌های آزمایشی باشد. این مدل از درک تصویر پشتیبانی می‌کند و به‌طور خودکار مدل‌های ۸k/32k/128k را بر اساس طول زمینه انتخاب می‌کند.",
"kuaishou/kat-coder-pro-v1.description": "KAT-Coder-Pro-V1 (رایگان برای مدت محدود) بر درک کد و خودکارسازی برای عامل‌های برنامه‌نویسی کارآمد تمرکز دارد.",
"learnlm-1.5-pro-experimental.description": "LearnLM یک مدل آزمایشی و وظیفه‌محور است که بر اساس اصول علوم یادگیری آموزش دیده تا در سناریوهای آموزش/یادگیری به‌عنوان یک معلم خبره عمل کند و از دستورالعمل‌های سیستمی پیروی کند.",
"learnlm-2.0-flash-experimental.description": "LearnLM یک مدل آزمایشی و وظیفه‌محور است که بر اساس اصول علوم یادگیری آموزش دیده تا در سناریوهای آموزش/یادگیری به‌عنوان یک معلم خبره عمل کند و از دستورالعمل‌های سیستمی پیروی کند.",
"labs-devstral-small-2512.description": "Devstral Small 2 در استفاده از ابزارها برای کاوش در پایگاه‌های کد، ویرایش چندین فایل و تقویت عوامل مهندسی نرم‌افزار برتری دارد.",
"lite.description": "Spark Lite یک مدل زبانی سبک با تأخیر بسیار پایین و پردازش کارآمد است. این مدل کاملاً رایگان است و از جستجوی وب در زمان واقعی پشتیبانی می‌کند. پاسخ‌های سریع آن در دستگاه‌های با توان محاسباتی پایین و برای تنظیم دقیق مدل عملکرد خوبی دارد و تجربه‌ای هوشمندانه و مقرون‌به‌صرفه، به‌ویژه برای پرسش‌وپاسخ دانشی، تولید محتوا و سناریوهای جستجو ارائه می‌دهد.",
"llama-3.1-70b-versatile.description": "Llama 3.1 70B استدلال هوش مصنوعی قوی‌تری را برای کاربردهای پیچیده ارائه می‌دهد و از محاسبات سنگین با کارایی و دقت بالا پشتیبانی می‌کند.",
"llama-3.1-8b-instant.description": "Llama 3.1 8B یک مدل کارآمد با تولید سریع متن است که برای کاربردهای گسترده و مقرون‌به‌صرفه ایده‌آل است.",
@@ -782,7 +789,6 @@
"llama-3.2-90b-vision-preview.description": "Llama 3.2 برای وظایف ترکیبی بین تصویر و متن طراحی شده و در تولید کپشن تصویر و پرسش‌وپاسخ بصری برتری دارد و شکاف بین تولید زبان و استدلال بصری را پر می‌کند.",
"llama-3.2-vision-instruct.description": "مدل تنظیم‌شده Llama 3.2-Vision برای تشخیص بصری، استدلال تصویری، تولید کپشن و پرسش‌وپاسخ عمومی تصویری بهینه‌سازی شده است.",
"llama-3.3-70b-versatile.description": "Meta Llama 3.3 یک مدل زبانی چندزبانه با ۷۰ میلیارد پارامتر (ورودی/خروجی متنی) است که نسخه‌های پیش‌آموزش‌دیده و تنظیم‌شده برای دستورالعمل دارد. نسخه تنظیم‌شده فقط متنی برای چت چندزبانه بهینه شده و در بسیاری از معیارهای صنعتی از مدل‌های چت متن‌باز و بسته پیشی می‌گیرد.",
"llama-3.3-70b.description": "Llama 3.3 70B: یک مدل Llama متوسط تا بزرگ که تعادلی بین استدلال و بازدهی برقرار می‌کند.",
"llama-3.3-instruct.description": "مدل تنظیم‌شده Llama 3.3 برای چت بهینه شده و در بسیاری از معیارهای صنعتی از مدل‌های چت متن‌باز پیشی می‌گیرد.",
"llama3-70b-8192.description": "Meta Llama 3 70B توانایی بی‌نظیری در مدیریت پیچیدگی برای پروژه‌های پرچالش ارائه می‌دهد.",
"llama3-8b-8192.description": "Meta Llama 3 8B عملکرد استدلالی قوی را در سناریوهای متنوع ارائه می‌دهد.",
@@ -832,7 +838,6 @@
"meta-llama/llama-3.1-8b-instruct:free.description": "LLaMA 3.1 از چندزبانگی پشتیبانی می‌کند و یکی از مدل‌های پیشرو تولیدی است.",
"meta-llama/llama-3.2-11b-vision-instruct.description": "LLaMA 3.2 برای وظایف ترکیبی بینایی و متن طراحی شده است. در توصیف تصویر و پرسش و پاسخ بصری عملکرد بالایی دارد و بین تولید زبان و استدلال بصری پل می‌زند.",
"meta-llama/llama-3.2-3b-instruct.description": "meta-llama/llama-3.2-3b-instruct",
"meta-llama/llama-3.2-90b-vision-instruct.description": "LLaMA 3.2 برای وظایف ترکیبی بینایی و متن طراحی شده است. در توصیف تصویر و پرسش و پاسخ بصری عملکرد بالایی دارد و بین تولید زبان و استدلال بصری پل می‌زند.",
"meta-llama/llama-3.3-70b-instruct.description": "Llama 3.3 پیشرفته‌ترین مدل چندزبانه متن‌باز Llama است که عملکردی نزدیک به 405B را با هزینه بسیار پایین ارائه می‌دهد. این مدل مبتنی بر Transformer بوده و با SFT و RLHF برای مفید بودن و ایمنی بهبود یافته است. نسخه تنظیم‌شده با دستورالعمل برای گفتگوهای چندزبانه بهینه شده و در ارزیابی‌های صنعتی از بسیاری از مدل‌های باز و بسته پیشی می‌گیرد. تاریخ قطع دانش: دسامبر ۲۰۲۳.",
"meta-llama/llama-3.3-70b-instruct:free.description": "Llama 3.3 پیشرفته‌ترین مدل چندزبانه متن‌باز Llama است که عملکردی نزدیک به 405B را با هزینه بسیار پایین ارائه می‌دهد. این مدل مبتنی بر Transformer بوده و با SFT و RLHF برای مفید بودن و ایمنی بهبود یافته است. نسخه تنظیم‌شده با دستورالعمل برای گفتگوهای چندزبانه بهینه شده و در ارزیابی‌های صنعتی از بسیاری از مدل‌های باز و بسته پیشی می‌گیرد. تاریخ قطع دانش: دسامبر ۲۰۲۳.",
"meta.llama3-1-405b-instruct-v1:0.description": "Meta Llama 3.1 405B Instruct بزرگ‌ترین و قدرتمندترین مدل Llama 3.1 Instruct است؛ مدلی بسیار پیشرفته برای استدلال در گفت‌وگو و تولید داده‌های مصنوعی، و پایه‌ای قوی برای آموزش تکمیلی یا تنظیم دقیق در حوزه‌های خاص. مدل‌های چندزبانه Llama 3.1 مجموعه‌ای از مدل‌های تولیدی آموزش‌دیده و تنظیم‌شده با دستورالعمل در اندازه‌های 8B، 70B و 405B هستند (ورودی/خروجی متنی). این مدل‌ها برای گفت‌وگوهای چندزبانه بهینه شده‌اند و در بسیاری از معیارهای صنعتی از مدل‌های چت متن‌باز موجود بهتر عمل می‌کنند. Llama 3.1 برای استفاده تجاری و پژوهشی در زبان‌های مختلف طراحی شده است. مدل‌های تنظیم‌شده با دستورالعمل برای چت به سبک دستیار مناسب‌اند، در حالی که مدل‌های آموزش‌دیده برای وظایف گسترده‌تر تولید زبان طبیعی مناسب‌اند. خروجی‌های Llama 3.1 همچنین می‌توانند برای بهبود مدل‌های دیگر، از جمله تولید و پالایش داده‌های مصنوعی، استفاده شوند. Llama 3.1 یک مدل ترنسفورمر خودرگرسیو با معماری بهینه‌شده است. نسخه‌های تنظیم‌شده از آموزش نظارت‌شده (SFT) و یادگیری تقویتی از بازخورد انسانی (RLHF) برای هم‌راستایی با ترجیحات انسانی در مفید بودن و ایمنی استفاده می‌کنند.",
@@ -894,7 +899,7 @@
"mistral-large-instruct.description": "Mistral-Large-Instruct-2407 یک مدل LLM متراکم پیشرفته با ۱۲۳ میلیارد پارامتر و استدلال، دانش و برنامه‌نویسی پیشرفته است.",
"mistral-large-latest.description": "Mistral Large مدل پرچم‌دار است که در وظایف چندزبانه، استدلال پیچیده و تولید کد قوی است — ایده‌آل برای برنامه‌های سطح بالا.",
"mistral-large.description": "Mixtral Large مدل پرچم‌دار Mistral است که تولید کد، ریاضی و استدلال را با پنجره متنی ۱۲۸ هزار ترکیب می‌کند.",
"mistral-medium-latest.description": "Mistral Medium 3 عملکردی در سطح پیشرفته با هزینه‌ای ۸ برابر کمتر ارائه می‌دهد و استقرار سازمانی را ساده می‌کند.",
"mistral-medium-latest.description": "Mistral Medium 3.1 عملکرد پیشرفته‌ای را با هزینه 8 برابر کمتر ارائه می‌دهد و استقرار سازمانی را ساده می‌کند.",
"mistral-nemo-instruct.description": "Mistral-Nemo-Instruct-2407 نسخه تنظیم‌شده بر اساس دستورالعمل از Mistral-Nemo-Base-2407 است.",
"mistral-nemo.description": "Mistral Nemo یک مدل ۱۲ میلیاردی با کارایی بالا از Mistral AI و NVIDIA است.",
"mistral-small-latest.description": "Mistral Small گزینه‌ای مقرون‌به‌صرفه، سریع و قابل‌اعتماد برای ترجمه، خلاصه‌سازی و تحلیل احساسات است.",
@@ -933,7 +938,7 @@
"moonshot-v1-auto.description": "Moonshot V1 Auto به‌طور خودکار مدل مناسب را بر اساس میزان استفاده از توکن‌های زمینه انتخاب می‌کند.",
"moonshotai/Kimi-Dev-72B.description": "Kimi-Dev-72B یک مدل کد متن‌باز است که با یادگیری تقویتی در مقیاس بزرگ بهینه‌سازی شده و وصله‌های قابل‌اعتماد و آماده تولید ارائه می‌دهد. این مدل با امتیاز ۶۰.۴٪ در SWE-bench Verified، رکورد جدیدی را در میان مدل‌های متن‌باز برای وظایف مهندسی نرم‌افزار خودکار مانند رفع باگ و بازبینی کد ثبت کرده است.",
"moonshotai/Kimi-K2-Instruct-0905.description": "Kimi K2-Instruct-0905 جدیدترین و قدرتمندترین نسخه Kimi K2 است. این مدل MoE سطح بالا با ۱ تریلیون پارامتر کل و ۳۲ میلیارد پارامتر فعال است. ویژگی‌های کلیدی آن شامل هوش برنامه‌نویسی عامل‌محور قوی‌تر، بهبود چشمگیر در آزمون‌ها و وظایف واقعی عامل‌ها، و کدنویسی ظاهری و کاربردی بهتر در رابط کاربری است.",
"moonshotai/Kimi-K2-Thinking.description": "Kimi K2 Thinking جدیدترین و قدرتمندترین مدل متن‌باز برای تفکر است. این مدل عمق استدلال چندمرحله‌ای را بهطور چشمگیری افزایش داده و استفاده پایدار از ابزارها را در ۲۰۰ تا ۳۰۰ فراخوانی متوالی حفظ می‌کند. این مدل در آزمون‌هایی مانند Humanity's Last Exam (HLE)، BrowseComp و سایر معیارها رکورد جدیدی ثبت کرده و در برنامه‌نویسی، ریاضی، منطق و سناریوهای عامل عملکرد درخشانی دارد. این مدل بر پایه معماری MoE با حدود ۱ تریلیون پارامتر ساخته شده و از پنجره زمینه ۲۵۶K و فراخوانی ابزار پشتیبانی می‌کند.",
"moonshotai/Kimi-K2-Thinking.description": "Kimi K2 Thinking جدیدترین و قدرتمندترین مدل تفکر متن‌باز است. عمق استدلال چندمرحله‌ای را به طور قابل توجهی گسترش می‌دهد و استفاده پایدار از ابزار را در 200–300 تماس متوالی حفظ می‌کند و رکوردهای جدیدی در Humanity's Last Exam (HLE)، BrowseComp و سایر معیارها ثبت می‌کند. در کدنویسی، ریاضیات، منطق و سناریوهای عامل برتری دارد. بر اساس معماری MoE با ~1 تریلیون پارامتر کل ساخته شده است، از یک پنجره زمینه 256K و تماس با ابزار پشتیبانی می‌کند.",
"moonshotai/kimi-k2-0711.description": "Kimi K2 0711 نسخه instruct از سری Kimi است که برای تولید کد با کیفیت بالا و استفاده از ابزارها مناسب است.",
"moonshotai/kimi-k2-0905.description": "Kimi K2 0905 نسخه‌ای به‌روزشده است که عملکرد زمینه و استدلال را با بهینه‌سازی‌های برنامه‌نویسی گسترش می‌دهد.",
"moonshotai/kimi-k2-instruct-0905.description": "مدل kimi-k2-0905-preview از پنجره زمینه ۲۵۶K پشتیبانی می‌کند و دارای برنامه‌نویسی عامل‌محور قوی‌تر، کد رابط کاربری زیباتر و کاربردی‌تر و درک بهتر زمینه است.",
@@ -948,8 +953,8 @@
"nvidia/Llama-3.1-Nemotron-70B-Instruct-HF.description": "Llama 3.1 Nemotron 70B یک مدل سفارشی‌شده توسط NVIDIA برای بهبود مفید بودن پاسخ‌های LLM است. این مدل در Arena Hard، AlpacaEval 2 LC و GPT-4-Turbo MT-Bench عملکرد قوی دارد و تا ۱ اکتبر ۲۰۲۴ در هر سه معیار هم‌ترازی خودکار رتبه اول را کسب کرده است. این مدل از Llama-3.1-70B-Instruct با استفاده از RLHF (REINFORCE)، Llama-3.1-Nemotron-70B-Reward و درخواست‌های HelpSteer2-Preference آموزش دیده است.",
"nvidia/llama-3.1-nemotron-51b-instruct.description": "مدلی متمایز با دقت و کارایی استثنایی در پردازش زبان طبیعی.",
"nvidia/llama-3.1-nemotron-70b-instruct.description": "Llama-3.1-Nemotron-70B-Instruct یک مدل سفارشی‌شده توسط NVIDIA است که برای بهبود مفید بودن پاسخ‌های LLM طراحی شده است.",
"o1-mini.description": "کوچک‌تر و سریع‌تر از o1-preview، با ۸۰٪ هزینه کمتر، قوی در تولید کد و وظایف با زمینه کوتاه.",
"o1-preview.description": "متمرکز بر استدلال پیشرفته و حل مسائل پیچیده، از جمله ریاضی و علوم. ایده‌آل برای برنامه‌هایی که نیاز به درک عمیق زمینه و جریان‌های کاری خودکار دارند.",
"o1-mini.description": "o1-mini یک مدل استدلال سریع و مقرون‌به‌صرفه است که برای کدنویسی، ریاضیات و علوم طراحی شده است. دارای زمینه 128K و برش دانش تا اکتبر 2023 است.",
"o1-preview.description": "o1 مدل استدلال جدید OpenAI برای وظایف پیچیده‌ای است که نیاز به دانش گسترده دارند. دارای زمینه 128K و برش دانش تا اکتبر 2023 است.",
"o1-pro.description": "سری o1 با یادگیری تقویتی آموزش دیده تا پیش از پاسخ‌دهی فکر کند و استدلال پیچیده را مدیریت کند. o1-pro از منابع محاسباتی بیشتری برای تفکر عمیق‌تر استفاده می‌کند و پاسخ‌هایی با کیفیت بالاتر به‌طور مداوم ارائه می‌دهد.",
"o1.description": "o1 مدل جدید استدلال OpenAI با ورودی متن+تصویر و خروجی متنی است که برای وظایف پیچیده با نیاز به دانش گسترده مناسب است. این مدل دارای پنجره زمینه ۲۰۰K و تاریخ قطع دانش اکتبر ۲۰۲۳ است.",
"o3-2025-04-16.description": "o3 مدل جدید استدلال OpenAI با ورودی متن+تصویر و خروجی متنی برای وظایف پیچیده با نیاز به دانش گسترده است.",
@@ -1022,7 +1027,6 @@
"qianfan-check-vl.description": "Qianfan Check VL یک مدل بازبینی محتوای چندوجهی برای تطابق تصویر-متن و وظایف شناسایی است.",
"qianfan-composition.description": "Qianfan Composition یک مدل تولید چندوجهی برای درک و تولید ترکیبی تصویر و متن است.",
"qianfan-engcard-vl.description": "Qianfan EngCard VL یک مدل شناسایی چندوجهی متمرکز بر سناریوهای انگلیسی است.",
"qianfan-lightning-128b-a19b.description": "Qianfan Lightning 128B A19B یک مدل عمومی چینی با عملکرد بالا برای پرسش‌وپاسخ پیچیده و استدلال در مقیاس بزرگ است.",
"qianfan-llama-vl-8b.description": "Qianfan Llama VL 8B یک مدل چندوجهی مبتنی بر Llama برای درک عمومی تصویر و متن است.",
"qianfan-multipicocr.description": "Qianfan MultiPicOCR یک مدل OCR چندتصویری برای شناسایی و استخراج متن از تصاویر مختلف است.",
"qianfan-qi-vl.description": "Qianfan QI VL یک مدل پرسش‌وپاسخ چندوجهی برای بازیابی دقیق و پاسخ‌دهی در سناریوهای پیچیده تصویر-متن است.",
@@ -1032,7 +1036,6 @@
"qvq-72b-preview.description": "QVQ-72B-Preview یک مدل تحقیقاتی آزمایشی از Qwen است که بر بهبود استدلال بصری تمرکز دارد.",
"qvq-max.description": "مدل استدلال بصری Qwen QVQ از ورودی تصویری و خروجی زنجیره‌ای پشتیبانی می‌کند و عملکرد قوی‌تری در ریاضی، کدنویسی، تحلیل بصری، خلاقیت و وظایف عمومی دارد.",
"qvq-plus.description": "مدل استدلال بصری با ورودی تصویری و خروجی زنجیره‌ای. سری qvq-plus پس از qvq-max عرضه شده و استدلال سریع‌تر با تعادل بهتر کیفیت-هزینه ارائه می‌دهد.",
"qwen-3-32b.description": "Qwen 3 32B: قدرتمند در وظایف چندزبانه و کدنویسی، مناسب برای استفاده در مقیاس متوسط تولیدی.",
"qwen-coder-plus.description": "مدل کدنویسی Qwen.",
"qwen-coder-turbo-latest.description": "مدل کدنویسی Qwen.",
"qwen-coder-turbo.description": "مدل کدنویسی Qwen.",
@@ -1128,7 +1131,6 @@
"qwen3-coder-next.description": "کدنویس نسل بعدی Qwen که برای تولید کد چندفایلی پیچیده، اشکال‌زدایی و جریان‌های کاری عامل با توان بالا بهینه شده است. طراحی شده برای ادغام ابزار قوی و عملکرد استدلال بهبود یافته.",
"qwen3-coder-plus.description": "مدل کدنویسی Qwen. سری جدید Qwen3-Coder بر پایه Qwen3 ساخته شده و توانایی‌های قوی در عامل‌های کدنویس، استفاده از ابزارها و تعامل با محیط برای برنامه‌نویسی خودکار دارد، با عملکرد عالی در کد و توانایی عمومی قوی.",
"qwen3-coder:480b.description": "مدل با عملکرد بالا از علی‌بابا برای وظایف عامل و کدنویسی با پشتیبانی از زمینه طولانی.",
"qwen3-max-2026-01-23.description": "مدل‌های Qwen3 Max نسبت به سری ۲.۵ پیشرفت‌های بزرگی در توانایی عمومی، درک چینی/انگلیسی، پیروی از دستورالعمل‌های پیچیده، وظایف ذهنی باز، توانایی چندزبانه و استفاده از ابزار دارند و خطاهای توهمی کمتری دارند. نسخه جدید qwen3-max در برنامه‌نویسی عامل‌محور و استفاده از ابزار نسبت به نسخه پیش‌نمایش بهبود یافته و به سطح SOTA در حوزه خود رسیده و برای نیازهای پیچیده‌تر عامل‌ها طراحی شده است.",
"qwen3-max-preview.description": "بهترین مدل Qwen برای وظایف پیچیده و چندمرحله‌ای. نسخه پیش‌نمایش از تفکر پشتیبانی می‌کند.",
"qwen3-max.description": "مدل‌های Qwen3 Max نسبت به سری 2.5 پیشرفت‌های چشمگیری در توانایی عمومی، درک زبان چینی/انگلیسی، پیروی از دستورالعمل‌های پیچیده، وظایف باز ذهنی، توانایی چندزبانه و استفاده از ابزار دارند، با کاهش خطاهای توهمی. نسخه جدید qwen3-max توانایی برنامه‌نویسی عامل‌محور و استفاده از ابزار را نسبت به qwen3-max-preview بهبود داده است. این نسخه به سطح پیشرفته در حوزه خود رسیده و برای نیازهای پیچیده‌تر عامل‌ها طراحی شده است.",
"qwen3-next-80b-a3b-instruct.description": "مدل متن‌باز نسل بعدی Qwen3 بدون قابلیت تفکر. نسبت به نسخه قبلی (Qwen3-235B-A22B-Instruct-2507)، درک زبان چینی بهتر، استدلال منطقی قوی‌تر و تولید متن بهبود یافته‌ای دارد.",
@@ -1145,7 +1147,8 @@
"qwen3-vl-flash.description": "Qwen3 VL Flash: نسخه سبک و پرسرعت برای استدلال در درخواست‌های حساس به تأخیر یا با حجم بالا.",
"qwen3-vl-plus.description": "Qwen VL یک مدل تولید متن با درک بصری است. می‌تواند OCR انجام دهد و همچنین خلاصه‌سازی و استدلال کند، مانند استخراج ویژگی‌ها از عکس‌های محصول یا حل مسائل از روی تصاویر.",
"qwen3.5-397b-a17b.description": "از ورودی‌های متن، تصویر و ویدئو پشتیبانی می‌کند. برای وظایف فقط متنی، عملکرد آن قابل مقایسه با Qwen3 Max است، که کارایی بالاتر و هزینه کمتری ارائه می‌دهد. در قابلیت‌های چندوجهی، بهبودهای قابل‌توجهی نسبت به سری Qwen3 VL ارائه می‌دهد.",
"qwen3.5-plus.description": "Qwen3.5 Plus از ورودی‌های متن، تصویر و ویدئو پشتیبانی می‌کند. برای وظایف فقط متنی، عملکرد آن قابل مقایسه با Qwen3 Max است، در حالی که کارایی بهتر و هزینه کمتری ارائه می‌دهد. از نظر قابلیت‌های چندوجهی، بهبودهای قابلتوجهی نسبت به سری Qwen3 VL نشان می‌دهد.",
"qwen3.5-plus.description": "Qwen3.5 Plus از ورودی متن، تصویر و ویدئو پشتیبانی می‌کند. عملکرد آن در وظایف متنی خالص قابل مقایسه با Qwen3 Max است، با عملکرد بهتر و هزینه کمتر. قابلیت‌های چندوجهی آن به طور قابل توجهی نسبت به سری Qwen3 VL بهبود یافته است.",
"qwen3.5:397b.description": "Qwen3.5 یک مدل پایه بینایی-زبان یکپارچه با معماری ترکیبی (Mixture-of-Experts + توجه خطی) است که استدلال چندوجهی قوی، کدنویسی و قابلیت‌های زمینه طولانی با یک پنجره زمینه 256K ارائه می‌دهد.",
"qwen3.description": "Qwen3 نسل بعدی مدل زبان بزرگ علی‌بابا است که عملکرد قدرتمندی در کاربردهای متنوع دارد.",
"qwq-32b-preview.description": "QwQ یک مدل تحقیقاتی آزمایشی از Qwen است که بر بهبود استدلال تمرکز دارد.",
"qwq-32b.description": "QwQ یک مدل استدلال در خانواده Qwen است. در مقایسه با مدل‌های تنظیم‌شده با دستورالعمل استاندارد، توانایی تفکر و استدلال آن عملکرد پایین‌دستی را به‌ویژه در مسائل پیچیده به‌طور قابل توجهی بهبود می‌بخشد. QwQ-32B یک مدل استدلال میان‌رده است که با مدل‌های برتر مانند DeepSeek-R1 و o1-mini رقابت می‌کند.",
@@ -1187,7 +1190,7 @@
"step-2-16k.description": "پشتیبانی از تعاملات با زمینه بزرگ برای گفت‌وگوهای پیچیده.",
"step-2-mini.description": "ساخته‌شده بر پایه معماری توجه MFA نسل بعدی داخلی، با نتایجی مشابه Step-1 اما با هزینه کمتر، توان عملیاتی بالاتر و تأخیر کمتر. وظایف عمومی را با توانایی قوی در کدنویسی انجام می‌دهد.",
"step-2x-large.description": "مدل تصویری نسل جدید StepFun با تمرکز بر تولید تصویر، تولید تصاویر با کیفیت بالا از دستورات متنی. بافت واقعی‌تر و رندر بهتر متون چینی/انگلیسی ارائه می‌دهد.",
"step-3.5-flash.description": "مدل استدلال زبان پرچمدار از Stepfun. این مدل قابلیت‌های استدلال سطح بالا را همراه با اجرای سریع و قابلاعتماد ارائه می‌دهد. می‌تواند وظایف پیچیده را تجزیه و برنامه‌ریزی کند، ابزارها را بهسرعت و قابل‌اعتماد فراخوانی کند و در استدلال منطقی، ریاضیات، مهندسی نرم‌افزار، تحقیقات عمیق و سایر وظایف پیچیده برتری داشته باشد. طول زمینه 256K است.",
"step-3.5-flash.description": "مدل استدلال زبانی پرچمدار Stepfun. این مدل دارای قابلیت‌های استدلال برتر و قابلیت‌های اجرای سریع و قابل اعتماد است. قادر به تجزیه و برنامه‌ریزی وظایف پیچیده، فراخوانی ابزارها به سرعت و با اطمینان برای انجام وظایف و شایستگی در وظایف پیچیده مختلف مانند استدلال منطقی، ریاضیات، مهندسی نرم‌افزار و تحقیقات عمیق است.",
"step-3.description": "این مدل دارای درک بصری قوی و استدلال پیچیده است و درک دانش میان‌رشته‌ای، تحلیل ریاضی-تصویری و طیف گسترده‌ای از وظایف تحلیل بصری روزمره را با دقت انجام می‌دهد.",
"step-r1-v-mini.description": "مدل استدلال با درک قوی تصویر که می‌تواند تصاویر و متون را پردازش کرده و پس از استدلال عمیق، متن تولید کند. در استدلال بصری، ریاضی، کدنویسی و استدلال متنی عملکردی در سطح بالا دارد و از پنجره زمینه ۱۰۰ هزار توکن پشتیبانی می‌کند.",
"stepfun-ai/step3.description": "Step3 یک مدل استدلال چندوجهی پیشرفته از StepFun است که بر پایه معماری MoE با ۳۲۱ میلیارد پارامتر کل و ۳۸ میلیارد فعال ساخته شده است. طراحی انتها به انتها هزینه رمزگشایی را کاهش داده و استدلال زبان-تصویر سطح بالا را ارائه می‌دهد. با طراحی MFA و AFD، در شتاب‌دهنده‌های پرچم‌دار و سطح پایین کارآمد باقی می‌ماند. پیش‌آموزش با بیش از ۲۰ تریلیون توکن متنی و ۴ تریلیون توکن تصویر-متن در زبان‌های مختلف انجام شده و در معیارهای ریاضی، کدنویسی و چندوجهی عملکردی پیشرو دارد.",
@@ -1276,10 +1279,11 @@
"z-ai/glm4.7.description": "GLM-4.7 جدیدترین مدل پرچم‌دار Zhipu است که برای سناریوهای کدنویسی عامل با قابلیت‌های کدنویسی بهبود یافته طراحی شده است.",
"z-ai/glm5.description": "GLM-5 مدل پایه جدید پرچم‌دار Zhipu AI برای مهندسی عامل است که عملکرد SOTA متن‌باز در قابلیت‌های کدنویسی و عامل را به دست می‌آورد. این مدل با عملکرد Claude Opus 4.5 مطابقت دارد.",
"z-image-turbo.description": "Z-Image یک مدل سبک تولید تصویر از متن است که می‌تواند به‌سرعت تصاویر تولید کند، از رندر متن چینی و انگلیسی پشتیبانی می‌کند و به‌طور انعطاف‌پذیر با وضوح‌ها و نسبت‌های ابعاد مختلف سازگار می‌شود.",
"zai-glm-4.7.description": "این مدل عملکرد کدنویسی قوی با قابلیت‌های استدلال پیشرفته، استفاده برتر از ابزار و عملکرد واقعی بهبود یافته در برنامه‌های کدنویسی عامل ارائه می‌دهد.",
"zai-org/GLM-4.5-Air.description": "GLM-4.5-Air یک مدل پایه برای برنامه‌های عامل با معماری Mixture-of-Experts است. این مدل برای استفاده از ابزار، مرور وب، مهندسی نرم‌افزار و کدنویسی فرانت‌اند بهینه شده و با عامل‌های کد مانند Claude Code و Roo Code ادغام می‌شود. از استدلال ترکیبی برای مدیریت وظایف پیچیده و روزمره استفاده می‌کند.",
"zai-org/GLM-4.5.description": "GLM-4.5 یک مدل پایه برای برنامه‌های عامل با معماری Mixture-of-Experts است. این مدل برای استفاده از ابزار، مرور وب، مهندسی نرم‌افزار و کدنویسی فرانت‌اند به‌طور عمیق بهینه شده و با عامل‌های کد مانند Claude Code و Roo Code ادغام می‌شود. از استدلال ترکیبی برای مدیریت وظایف پیچیده و روزمره استفاده می‌کند.",
"zai-org/GLM-4.5V.description": "GLM-4.5V جدیدترین مدل VLM از Zhipu AI است که بر پایه مدل متنی پرچم‌دار GLM-4.5-Air (با ۱۰۶ میلیارد پارامتر کل و ۱۲ میلیارد فعال) ساخته شده و از معماری MoE برای عملکرد قوی با هزینه کمتر بهره می‌برد. این مدل مسیر GLM-4.1V-Thinking را دنبال کرده و با افزودن 3D-RoPE استدلال فضایی سه‌بعدی را بهبود می‌بخشد. با پیش‌آموزش، SFT و RL بهینه‌سازی شده و تصاویر، ویدیو و اسناد بلند را پردازش می‌کند و در ۴۱ معیار چندوجهی عمومی در میان مدل‌های متن‌باز رتبه برتر دارد. حالت تفکر قابل تنظیم به کاربران امکان می‌دهد بین سرعت و عمق تعادل برقرار کنند.",
"zai-org/GLM-4.6.description": "در مقایسه با GLM-4.5، مدل GLM-4.6 زمینه را از ۱۲۸ هزار به ۲۰۰ هزار توکن گسترش می‌دهد تا وظایف عامل پیچیده‌تری را مدیریت کند. در معیارهای کد امتیاز بالاتری کسب کرده و عملکرد واقعی بهتری در برنامه‌هایی مانند Claude Code، Cline، Roo Code و Kilo Code دارد، از جمله تولید بهتر صفحات فرانت‌اند. استدلال بهبود یافته و استفاده از ابزار در حین استدلال پشتیبانی می‌شود که توانایی کلی را تقویت می‌کند. این مدل بهتر در چارچوب‌های عامل ادغام می‌شود، عامل‌های ابزار/جستجو را بهبود می‌بخشد و سبک نوشتاری و نقش‌آفرینی طبیعی‌تری دارد.",
"zai-org/GLM-4.6V.description": "GLM-4.6V در دقت درک بصری به SOTA در مقیاس پارامتر مشابه دست یافته و برای اولین بار قابلیت Function Call (فراخوانی ابزار) را به طور بومی در معماری مدل بصری ادغام کرده است، و زنجیره‌ای از «ادراک بصری» به «اقدام اجرایی (Action)» را باز کرده است، و یک پایه فنی یکپارچه برای عوامل چندوجهی در سناریوهای تجاری واقعی فراهم می‌کند.",
"zai/glm-4.5-air.description": "GLM-4.5 و GLM-4.5-Air جدیدترین مدل‌های پرچم‌دار ما برای برنامه‌های عامل هستند که هر دو از معماری MoE استفاده می‌کنند. GLM-4.5 دارای ۳۵۵ میلیارد پارامتر کل و ۳۲ میلیارد فعال در هر عبور است؛ GLM-4.5-Air نسخه سبک‌تر با ۱۰۶ میلیارد کل و ۱۲ میلیارد فعال است.",
"zai/glm-4.5.description": "سری GLM-4.5 برای عامل‌ها طراحی شده است. مدل پرچم‌دار GLM-4.5 استدلال، کدنویسی و مهارت‌های عامل را با ۳۵۵ میلیارد پارامتر کل (۳۲ میلیارد فعال) ترکیب می‌کند و دو حالت عملیاتی به‌عنوان یک سیستم استدلال ترکیبی ارائه می‌دهد.",
"zai/glm-4.5v.description": "GLM-4.5V بر پایه GLM-4.5-Air ساخته شده، تکنیک‌های اثبات‌شده GLM-4.1V-Thinking را به ارث برده و با معماری MoE قدرتمند ۱۰۶ میلیارد پارامتری مقیاس یافته است.",
+14
View File
@@ -24,6 +24,20 @@
"builtins.lobe-agent-builder.inspector.noResults": "نتیجه‌ای یافت نشد",
"builtins.lobe-agent-builder.inspector.togglePlugin": "تغییر وضعیت",
"builtins.lobe-agent-builder.title": "متخصص ساخت عامل",
"builtins.lobe-agent-management.apiName.callAgent": "نماینده تماس",
"builtins.lobe-agent-management.apiName.createAgent": "ایجاد نماینده",
"builtins.lobe-agent-management.apiName.deleteAgent": "حذف نماینده",
"builtins.lobe-agent-management.apiName.searchAgent": "جستجوی نمایندگان",
"builtins.lobe-agent-management.apiName.updateAgent": "به‌روزرسانی نماینده",
"builtins.lobe-agent-management.inspector.callAgent.sync": "در حال تماس:",
"builtins.lobe-agent-management.inspector.callAgent.task": "اختصاص وظیفه به:",
"builtins.lobe-agent-management.inspector.createAgent.title": "ایجاد نماینده:",
"builtins.lobe-agent-management.inspector.searchAgent.all": "جستجوی نمایندگان:",
"builtins.lobe-agent-management.inspector.searchAgent.market": "جستجوی بازار:",
"builtins.lobe-agent-management.inspector.searchAgent.results": "{{count}} نتیجه",
"builtins.lobe-agent-management.inspector.searchAgent.user": "جستجوی نمایندگان من:",
"builtins.lobe-agent-management.inspector.updateAgent.title": "به‌روزرسانی نماینده:",
"builtins.lobe-agent-management.title": "مدیریت نمایندگان",
"builtins.lobe-cloud-sandbox.apiName.editLocalFile": "ویرایش فایل",
"builtins.lobe-cloud-sandbox.apiName.executeCode": "اجرای کد",
"builtins.lobe-cloud-sandbox.apiName.exportFile": "صادرات فایل",
+3
View File
@@ -724,6 +724,9 @@
"tools.builtins.lobe-artifacts.description": "تولید و پیش‌نمایش زنده اجزای تعاملی رابط کاربری، نمودارها، گرافیک‌های SVG و برنامه‌های وب. ایجاد محتوای بصری غنی که کاربران بتوانند مستقیماً با آن تعامل داشته باشند.",
"tools.builtins.lobe-artifacts.readme": "اجزای رابط کاربری تعاملی، نمودارها، گرافیک‌های SVG و برنامه‌های وب را تولید کرده و به‌صورت زنده پیش‌نمایش دهید. محتوای بصری غنی ایجاد کنید که کاربران بتوانند مستقیماً با آن تعامل داشته باشند.",
"tools.builtins.lobe-artifacts.title": "آرتیفکت‌ها",
"tools.builtins.lobe-calculator.description": "انجام محاسبات ریاضی، حل معادلات و کار با عبارات نمادین",
"tools.builtins.lobe-calculator.readme": "ماشین‌حساب پیشرفته ریاضی که از عملیات حسابی پایه، معادلات جبری، عملیات حساب دیفرانسیل و انتگرال و ریاضیات نمادین پشتیبانی می‌کند. شامل تبدیل مبنا، حل معادلات، مشتق‌گیری، انتگرال‌گیری و موارد دیگر.",
"tools.builtins.lobe-calculator.title": "ماشین‌حساب",
"tools.builtins.lobe-cloud-sandbox.description": "اجرای کدهای Python، JavaScript و TypeScript در محیط ابری ایزوله. اجرای دستورات شِل، مدیریت فایل‌ها، جستجوی محتوا با regex و خروجی‌گیری امن از نتایج.",
"tools.builtins.lobe-cloud-sandbox.readme": "کدهای Python، JavaScript و TypeScript را در محیطی ایزوله در فضای ابری اجرا کنید. دستورات شِل را اجرا کرده، فایل‌ها را مدیریت کنید، با استفاده از regex محتوا را جستجو کرده و نتایج را به‌صورت ایمن صادر نمایید.",
"tools.builtins.lobe-cloud-sandbox.title": "محیط آزمایشی ابری",
+4
View File
@@ -224,7 +224,9 @@
"providerModels.item.modelConfig.extendParams.options.gpt5_2ProReasoningEffort.hint": "Pour la série GPT-5.2 Pro ; contrôle lintensité du raisonnement.",
"providerModels.item.modelConfig.extendParams.options.gpt5_2ReasoningEffort.hint": "Pour la série GPT-5.2 ; contrôle lintensité du raisonnement.",
"providerModels.item.modelConfig.extendParams.options.imageAspectRatio.hint": "Pour les modèles de génération dimages Gemini ; contrôle le format dimage généré.",
"providerModels.item.modelConfig.extendParams.options.imageAspectRatio2.hint": "Pour Nano Banana 2 ; contrôle le rapport d'aspect des images générées (prend en charge ultra-large 1:4, 4:1, 1:8, 8:1).",
"providerModels.item.modelConfig.extendParams.options.imageResolution.hint": "Pour les modèles de génération dimages Gemini 3 ; contrôle la résolution des images générées.",
"providerModels.item.modelConfig.extendParams.options.imageResolution2.hint": "Pour les modèles d'images Gemini 3.1 Flash ; contrôle la résolution des images générées (prend en charge 512px).",
"providerModels.item.modelConfig.extendParams.options.reasoningBudgetToken.hint": "Pour Claude, Qwen3 et similaires ; contrôle le budget de jetons pour le raisonnement.",
"providerModels.item.modelConfig.extendParams.options.reasoningEffort.hint": "Pour OpenAI et autres modèles capables de raisonnement ; contrôle leffort de raisonnement.",
"providerModels.item.modelConfig.extendParams.options.textVerbosity.hint": "Pour la série GPT-5+ ; contrôle la verbosité de la sortie.",
@@ -233,6 +235,7 @@
"providerModels.item.modelConfig.extendParams.options.thinkingLevel.hint": "Pour les modèles Gemini 3 Flash Preview ; contrôle la profondeur de réflexion.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel2.hint": "Pour les modèles Gemini 3 Pro Preview ; contrôle la profondeur de réflexion.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel3.hint": "Pour les modèles Gemini 3.1 Pro Preview ; contrôle la profondeur de réflexion avec des niveaux bas/moyen/élevé.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel4.hint": "Pour les modèles Gemini 3.1 Flash Image ; active ou désactive la réflexion.",
"providerModels.item.modelConfig.extendParams.options.urlContext.hint": "Pour la série Gemini ; permet de fournir un contexte via une URL.",
"providerModels.item.modelConfig.extendParams.placeholder": "Sélectionnez les paramètres étendus à activer",
"providerModels.item.modelConfig.extendParams.previewFallback": "Aperçu non disponible",
@@ -311,6 +314,7 @@
"providerModels.tabs.image": "Image",
"providerModels.tabs.stt": "ASR",
"providerModels.tabs.tts": "TTS",
"providerModels.tabs.video": "Vidéo",
"sortModal.success": "Tri mis à jour avec succès",
"sortModal.title": "Ordre personnalisé",
"sortModal.update": "Mettre à jour",
+35 -31
View File
@@ -55,7 +55,8 @@
"FLUX.1-dev.description": "FLUX.1-dev est un modèle de langage multimodal open source (MLLM) de Black Forest Labs, optimisé pour les tâches image-texte, combinant compréhension et génération dimages et de textes. Construit sur des LLM avancés (comme Mistral-7B), il utilise un encodeur visuel soigneusement conçu et un ajustement par instructions en plusieurs étapes pour permettre la coordination multimodale et le raisonnement sur des tâches complexes.",
"Gryphe/MythoMax-L2-13b.description": "MythoMax-L2 (13B) est un modèle innovant pour des domaines variés et des tâches complexes.",
"HelloMeme.description": "HelloMeme est un outil dIA qui génère des mèmes, GIFs ou courtes vidéos à partir des images ou mouvements que vous fournissez. Aucune compétence en dessin ou en codage nest requise : une simple image de référence suffit pour créer un contenu amusant, attrayant et stylistiquement cohérent.",
"HiDream-I1-Full.description": "HiDream-E1-Full est un modèle open source dédition dimages multimodal de HiDream.ai, basé sur une architecture Diffusion Transformer avancée et une solide compréhension du langage (intégrant LLaMA 3.1-8B-Instruct). Il prend en charge la génération dimages guidée par le langage naturel, le transfert de style, les modifications locales et la repeinture, avec une excellente compréhension et exécution image-texte.",
"HiDream-E1-Full.description": "HiDream-E1-Full est un modèle open-source d'édition d'images multimodales développé par HiDream.ai, basé sur une architecture avancée de Diffusion Transformer et une compréhension linguistique robuste (intégrant LLaMA 3.1-8B-Instruct). Il prend en charge la génération d'images guidée par le langage naturel, le transfert de style, les modifications locales et la retouche, avec une excellente compréhension et exécution image-texte.",
"HiDream-I1-Full.description": "HiDream-I1 est un nouveau modèle open-source de génération d'images de base publié par HiDream. Avec 17 milliards de paramètres (Flux en compte 12 milliards), il peut offrir une qualité d'image de pointe en quelques secondes.",
"HunyuanDiT-v1.2-Diffusers-Distilled.description": "hunyuandit-v1.2-distilled est un modèle léger de génération dimages à partir de texte, optimisé par distillation pour produire rapidement des images de haute qualité, particulièrement adapté aux environnements à faibles ressources et à la génération en temps réel.",
"InstantCharacter.description": "InstantCharacter est un modèle de génération de personnages personnalisés sans ajustement, publié par Tencent AI en 2025, visant une génération fidèle et cohérente de personnages à travers différents scénarios. Il peut modéliser un personnage à partir dune seule image de référence et le transférer de manière flexible entre styles, actions et arrière-plans.",
"InternVL2-8B.description": "InternVL2-8B est un puissant modèle vision-langage prenant en charge le traitement multimodal image-texte, capable de reconnaître précisément le contenu des images et de générer des descriptions ou réponses pertinentes.",
@@ -80,7 +81,7 @@
"MiniMax-M2.1.description": "MiniMax-M2.1 est un modèle phare open source de MiniMax, conçu pour résoudre des tâches complexes du monde réel. Ses principaux atouts résident dans ses capacités de programmation multilingue et sa faculté à résoudre des problèmes complexes en tant qu'agent.",
"MiniMax-M2.5-Lightning.description": "M2.5 Lightning : Même performance, plus rapide et plus agile (environ 100 tps).",
"MiniMax-M2.5-highspeed.description": "Même performance que M2.5 avec une inférence nettement plus rapide.",
"MiniMax-M2.5.description": "Performance de premier ordre et rentabilité ultime, capable de gérer facilement des tâches complexes (environ 60 tps).",
"MiniMax-M2.5.description": "MiniMax-M2.5 est un modèle phare open-source de grande taille développé par MiniMax, axé sur la résolution de tâches complexes du monde réel. Ses principaux atouts sont ses capacités de programmation multilingue et sa capacité à résoudre des tâches complexes en tant qu'Agent.",
"MiniMax-M2.description": "Conçu spécifiquement pour un codage efficace et des flux de travail d'agents",
"MiniMax-Text-01.description": "MiniMax-01 introduit une attention linéaire à grande échelle au-delà des Transformers classiques, avec 456 milliards de paramètres et 45,9 milliards activés par passage. Il atteint des performances de premier plan et prend en charge jusqu’à 4 millions de jetons de contexte (32× GPT-4o, 20× Claude-3.5-Sonnet).",
"MiniMaxAI/MiniMax-M1-80k.description": "MiniMax-M1 est un modèle de raisonnement à attention hybride à grande échelle avec poids ouverts, totalisant 456 milliards de paramètres et environ 45,9 milliards actifs par jeton. Il prend en charge nativement un contexte de 1 million de jetons et utilise Flash Attention pour réduire les FLOPs de 75 % sur une génération de 100 000 jetons par rapport à DeepSeek R1. Grâce à une architecture MoE, CISPO et un entraînement RL à attention hybride, il atteint des performances de pointe sur les tâches de raisonnement à long contexte et dingénierie logicielle réelle.",
@@ -98,6 +99,7 @@
"Phi-3.5-mini-instruct.description": "Une version mise à jour du modèle Phi-3-mini.",
"Phi-3.5-vision-instrust.description": "Une version mise à jour du modèle Phi-3-vision.",
"Pro/MiniMaxAI/MiniMax-M2.1.description": "MiniMax-M2.1 est un modèle de langage open source de grande taille, optimisé pour les capacités dagent. Il excelle en programmation, utilisation doutils, suivi dinstructions et planification à long terme. Le modèle prend en charge le développement logiciel multilingue et lexécution de flux de travail complexes en plusieurs étapes, atteignant un score de 74,0 sur SWE-bench Verified et surpassant Claude Sonnet 4.5 dans des scénarios multilingues.",
"Pro/MiniMaxAI/MiniMax-M2.5.description": "MiniMax-M2.5 est le dernier modèle de langage de grande taille développé par MiniMax, entraîné par apprentissage par renforcement à grande échelle sur des centaines de milliers d'environnements complexes du monde réel. Doté d'une architecture MoE avec 229 milliards de paramètres, il atteint des performances de pointe dans des tâches telles que la programmation, l'utilisation d'outils par des agents, la recherche et les scénarios bureautiques.",
"Pro/Qwen/Qwen2-7B-Instruct.description": "Qwen2-7B-Instruct est un LLM de 7 milliards de paramètres ajusté pour les instructions, de la série Qwen2. Il utilise une architecture Transformer avec SwiGLU, un biais QKV pour lattention et une attention à requêtes groupées, capable de gérer de grandes entrées. Il excelle en compréhension linguistique, génération, tâches multilingues, codage, mathématiques et raisonnement, surpassant la plupart des modèles open source et rivalisant avec les modèles propriétaires. Il dépasse Qwen1.5-7B-Chat sur plusieurs benchmarks.",
"Pro/Qwen/Qwen2.5-7B-Instruct.description": "Qwen2.5-7B-Instruct fait partie de la dernière série de LLM dAlibaba Cloud. Ce modèle de 7 milliards apporte des améliorations notables en codage et mathématiques, prend en charge plus de 29 langues et améliore le suivi des instructions, la compréhension des données structurées et la génération de sorties structurées (notamment en JSON).",
"Pro/Qwen/Qwen2.5-Coder-7B-Instruct.description": "Qwen2.5-Coder-7B-Instruct est le dernier LLM dAlibaba Cloud axé sur le code. Basé sur Qwen2.5 et entraîné sur 5,5T de jetons, il améliore considérablement la génération de code, le raisonnement et la correction, tout en conservant ses forces en mathématiques et en intelligence générale, constituant une base solide pour les agents de codage.",
@@ -107,13 +109,13 @@
"Pro/deepseek-ai/DeepSeek-R1-Distill-Qwen-7B.description": "DeepSeek-R1-Distill-Qwen-7B est distillé à partir de Qwen2.5-Math-7B et affiné sur 800 000 échantillons DeepSeek-R1 sélectionnés. Il offre dexcellentes performances, avec 92,8 % sur MATH-500, 55,5 % sur AIME 2024 et une note CodeForces de 1189 pour un modèle de 7B.",
"Pro/deepseek-ai/DeepSeek-R1.description": "DeepSeek-R1 est un modèle de raisonnement basé sur lapprentissage par renforcement qui réduit la répétition et améliore la lisibilité. Il utilise des données de démarrage à froid avant lentraînement RL pour renforcer encore le raisonnement, rivalise avec OpenAI-o1 sur les tâches de mathématiques, de code et de raisonnement, et améliore les résultats globaux grâce à un entraînement soigné.",
"Pro/deepseek-ai/DeepSeek-V3.1-Terminus.description": "DeepSeek-V3.1-Terminus est une version mise à jour du modèle V3.1, positionnée comme un LLM hybride pour agents. Il corrige les problèmes signalés par les utilisateurs, améliore la stabilité, la cohérence linguistique et réduit les caractères anormaux ou mélangés chinois/anglais. Il intègre les modes Pensant et Non pensant avec des modèles de chat pour un basculement flexible. Il améliore également les performances des agents de code et de recherche pour une utilisation plus fiable des outils et des tâches multi-étapes.",
"Pro/deepseek-ai/DeepSeek-V3.2-Exp.description": "DeepSeek-V3.2-Exp est une version expérimentale de V3.2 servant de pont vers la prochaine architecture. Il ajoute DeepSeek Sparse Attention (DSA) au-dessus de V3.1-Terminus pour améliorer lefficacité de lentraînement et de linférence sur de longs contextes, avec des optimisations pour lutilisation doutils, la compréhension de documents longs et le raisonnement multi-étapes. Il est idéal pour explorer une efficacité de raisonnement accrue avec de grands budgets de contexte.",
"Pro/deepseek-ai/DeepSeek-V3.2.description": "DeepSeek-V3.2 est un modèle qui combine une grande efficacité de calcul avec d'excellentes performances en raisonnement et en tâches d'Agent. Son approche repose sur trois percées technologiques clés : DeepSeek Sparse Attention (DSA), un mécanisme d'attention efficace qui réduit considérablement la complexité de calcul tout en maintenant les performances du modèle, optimisé spécifiquement pour les scénarios à long contexte ; un cadre d'apprentissage par renforcement évolutif permettant au modèle de rivaliser avec GPT-5, sa version haute performance égalant Gemini-3.0-Pro en capacités de raisonnement ; et un pipeline de synthèse de tâches d'Agent à grande échelle visant à intégrer les capacités de raisonnement dans les scénarios d'utilisation d'outils, améliorant ainsi le suivi des instructions et la généralisation dans des environnements interactifs complexes. Le modèle a obtenu des performances médaillées d'or aux Olympiades Internationales de Mathématiques (IMO) et d'Informatique (IOI) de 2025.",
"Pro/deepseek-ai/DeepSeek-V3.description": "DeepSeek-V3 est un modèle MoE de 671 milliards de paramètres utilisant MLA et DeepSeekMoE avec un équilibrage de charge sans perte pour une inférence et un entraînement efficaces. Préentraîné sur 14,8T de jetons de haute qualité et affiné avec SFT et RL, il surpasse les autres modèles open source et se rapproche des modèles fermés de pointe.",
"Pro/moonshotai/Kimi-K2-Instruct-0905.description": "Kimi K2-Instruct-0905 est le tout dernier et le plus puissant modèle Kimi K2. Il s'agit d'un modèle MoE de premier plan avec 1T de paramètres totaux et 32B de paramètres actifs. Ses principales caractéristiques incluent une intelligence de codage agentique renforcée avec des gains significatifs sur les benchmarks et les tâches d'agents réels, ainsi qu'une esthétique et une convivialité améliorées pour le codage en interface utilisateur.",
"Pro/moonshotai/Kimi-K2-Thinking.description": "Kimi K2 Thinking Turbo est la variante Turbo optimisée pour la vitesse de raisonnement et le débit, tout en conservant le raisonnement multi-étapes et l'utilisation d'outils de K2 Thinking. Il s'agit d'un modèle MoE avec environ 1T de paramètres totaux, un contexte natif de 256K, et un appel d'outils à grande échelle stable pour des scénarios de production nécessitant une faible latence et une forte concurrence.",
"Pro/moonshotai/Kimi-K2.5.description": "Kimi K2.5 est un agent multimodal natif open source, basé sur Kimi-K2-Base, entraîné sur environ 1,5 billion de jetons mêlant vision et texte. Le modèle adopte une architecture MoE avec 1T de paramètres totaux et 32B de paramètres actifs, prenant en charge une fenêtre de contexte de 256K, intégrant harmonieusement les capacités de compréhension visuelle et linguistique.",
"Pro/zai-org/glm-4.7.description": "GLM-4.7 est le modèle phare de nouvelle génération de Zhipu, doté de 355 milliards de paramètres totaux et de 32 milliards de paramètres actifs. Il a été entièrement amélioré pour les dialogues généraux, le raisonnement et les capacités dagent. GLM-4.7 renforce la pensée intercalée et introduit la pensée préservée ainsi que la pensée au niveau des tours.",
"Pro/zai-org/glm-5.description": "GLM-5 est le nouveau modèle de langage avancé lancé par Zhipu, axé sur l'ingénierie de systèmes complexes et les tâches d'Agent à long terme. Les paramètres du modèle s'étendent à 744B (40B actis) et intègrent DeepSeek Sparse Attention.",
"Pro/zai-org/glm-5.description": "GLM-5 est le modèle de langage de nouvelle génération de Zhipu, axé sur l'ingénierie de systèmes complexes et les tâches d'Agent de longue durée. Les paramètres du modèle ont été étendus à 744 milliards (40 milliards actifs) et intègrent DeepSeek Sparse Attention.",
"QwQ-32B-Preview.description": "Qwen QwQ est un modèle de recherche expérimental axé sur l'amélioration du raisonnement.",
"Qwen/QVQ-72B-Preview.description": "QVQ-72B-Preview est un modèle de recherche de Qwen axé sur le raisonnement visuel, avec des points forts en compréhension de scènes complexes et en résolution de problèmes visuels mathématiques.",
"Qwen/QwQ-32B-Preview.description": "Qwen QwQ est un modèle de recherche expérimental axé sur l'amélioration du raisonnement de l'IA.",
@@ -137,7 +139,7 @@
"Qwen/Qwen3-14B.description": "Qwen3 est un modèle Tongyi Qwen de nouvelle génération, offrant des avancées majeures en raisonnement, capacités générales, fonctionnement en tant qu'agent et performance multilingue. Il prend en charge le changement de mode de pensée.",
"Qwen/Qwen3-235B-A22B-Instruct-2507.description": "Qwen3-235B-A22B-Instruct-2507 est un modèle MoE phare de la série Qwen3, avec 235 milliards de paramètres au total et 22 milliards actifs. Il s'agit d'une version non-pensante mise à jour, axée sur l'amélioration du suivi des instructions, du raisonnement logique, de la compréhension de texte, des mathématiques, des sciences, du codage et de l'utilisation d'outils. Il étend également les connaissances multilingues de longue traîne et s'aligne mieux sur les préférences des utilisateurs pour les tâches subjectives ouvertes.",
"Qwen/Qwen3-235B-A22B-Thinking-2507.description": "Qwen3-235B-A22B-Thinking-2507 est un modèle Qwen3 dédié au raisonnement complexe. Il utilise une architecture MoE avec 235 milliards de paramètres au total et environ 22 milliards actifs par jeton pour une efficacité accrue. En tant que modèle de réflexion, il affiche des progrès significatifs en logique, mathématiques, sciences, codage et performances académiques, atteignant un niveau de réflexion ouvert de premier plan. Il améliore également le suivi des instructions, l'utilisation d'outils et la génération de texte, et prend en charge nativement un contexte de 256K pour le raisonnement approfondi et les documents longs.",
"Qwen/Qwen3-235B-A22B.description": "Qwen3 est un modèle Tongyi Qwen de nouvelle génération, offrant des avancées majeures en raisonnement, capacités générales, fonctionnement en tant qu'agent et performance multilingue. Il prend en charge le changement de mode de pensée.",
"Qwen/Qwen3-235B-A22B.description": "Qwen3 235B A22B est le modèle ultra-échelle de Qwen3 offrant des capacités d'IA de premier ordre.",
"Qwen/Qwen3-30B-A3B-Instruct-2507.description": "Qwen3-30B-A3B-Instruct-2507 est la version non-pensante mise à jour de Qwen3-30B-A3B. Il s'agit d'un modèle MoE avec 30,5 milliards de paramètres au total et 3,3 milliards actifs. Il améliore considérablement le suivi des instructions, le raisonnement logique, la compréhension de texte, les mathématiques, les sciences, le codage et l'utilisation d'outils, étend les connaissances multilingues de longue traîne et s'aligne mieux sur les préférences des utilisateurs pour les tâches ouvertes subjectives. Il prend en charge un contexte de 256K. Ce modèle est uniquement non-pensant et ne génère pas de balises `<think></think>`.",
"Qwen/Qwen3-30B-A3B-Thinking-2507.description": "Qwen3-30B-A3B-Thinking-2507 est le dernier modèle de réflexion de la série Qwen3. Il s'agit d'un modèle MoE avec 30,5 milliards de paramètres au total et 3,3 milliards actifs, conçu pour les tâches complexes. Il affiche des gains significatifs en logique, mathématiques, sciences, codage et performances académiques, et améliore le suivi des instructions, l'utilisation d'outils, la génération de texte et l'alignement sur les préférences. Il prend en charge nativement un contexte de 256K et peut s'étendre jusqu'à 1 million de jetons. Cette version est conçue pour le mode de réflexion avec un raisonnement détaillé étape par étape et de solides capacités d'agent.",
"Qwen/Qwen3-30B-A3B.description": "Qwen3 est un modèle Tongyi Qwen de nouvelle génération, offrant des avancées majeures en raisonnement, capacités générales, fonctionnement en tant qu'agent et performance multilingue. Il prend en charge le changement de mode de pensée.",
@@ -315,7 +317,6 @@
"codeqwen.description": "CodeQwen1.5 est un grand modèle de langage entraîné sur de vastes données de code, conçu pour des tâches de programmation complexes.",
"codestral-latest.description": "Codestral est notre modèle de codage le plus avancé ; la version v2 (janvier 2025) cible les tâches à faible latence et haute fréquence comme FIM, la correction de code et la génération de tests.",
"codestral.description": "Codestral est le premier modèle de code de Mistral AI, offrant un excellent support pour la génération de code.",
"codex-mini-latest.description": "codex-mini-latest est un modèle o4-mini affiné pour l'interface en ligne de commande Codex. Pour une utilisation directe via l'API, nous recommandons de commencer avec gpt-4.1.",
"cogito-2.1:671b.description": "Cogito v2.1 671B est un modèle de langage open source américain, gratuit pour un usage commercial. Il rivalise avec les meilleurs modèles, offre une meilleure efficacité de raisonnement par jeton, un contexte long de 128k et de solides performances globales.",
"cogview-3-flash.description": "CogView-3-Flash est un modèle de génération d'images gratuit lancé par Zhipu. Il génère des images conformes aux instructions des utilisateurs tout en atteignant des scores de qualité esthétique plus élevés. CogView-3-Flash est principalement utilisé dans des domaines tels que la création artistique, la référence de design, le développement de jeux et la réalité virtuelle, aidant les utilisateurs à convertir rapidement des descriptions textuelles en images.",
"cogview-4.description": "CogView-4 est le premier modèle open source de génération d'images à partir de texte de Zhipu capable de générer des caractères chinois. Il améliore la compréhension sémantique, la qualité d'image et le rendu du texte en chinois/anglais, prend en charge des invites bilingues de longueur arbitraire et peut générer des images à toute résolution dans des plages spécifiées.",
@@ -342,7 +343,7 @@
"command-light-nightly.description": "Pour réduire l'intervalle entre les versions majeures, nous proposons des versions Command nocturnes. Pour la série command-light, cela s'appelle command-light-nightly. C'est la version la plus récente, la plus expérimentale (et potentiellement instable), mise à jour régulièrement sans préavis, donc non recommandée pour la production.",
"command-light.description": "Une variante Command plus petite et plus rapide, presque aussi performante mais plus rapide.",
"command-nightly.description": "Pour réduire l'intervalle entre les versions majeures, nous proposons des versions Command nocturnes. Pour la série Command, cela s'appelle command-nightly. C'est la version la plus récente, la plus expérimentale (et potentiellement instable), mise à jour régulièrement sans préavis, donc non recommandée pour la production.",
"command-r-03-2024.description": "Command R est un modèle de chat suivant les instructions avec une qualité supérieure, une fiabilité accrue et une fenêtre de contexte plus longue que les modèles précédents. Il prend en charge des flux de travail complexes tels que la génération de code, le RAG, l'utilisation d'outils et les agents.",
"command-r-03-2024.description": "command-r est un modèle de chat suivant les instructions qui exécute des tâches linguistiques avec une qualité supérieure, une fiabilité améliorée et un contexte plus long que les modèles précédents. Il prend en charge des flux de travail complexes tels que la génération de code, RAG, l'utilisation d'outils et les agents.",
"command-r-08-2024.description": "command-r-08-2024 est une version mise à jour du modèle Command R publiée en août 2024.",
"command-r-plus-04-2024.description": "command-r-plus est un alias de command-r-plus-04-2024, donc utiliser command-r-plus dans l'API pointe vers ce modèle.",
"command-r-plus-08-2024.description": "Command R+ est un modèle de chat suivant les instructions avec une qualité supérieure, une fiabilité accrue et une fenêtre de contexte plus longue que les modèles précédents. Il est idéal pour les flux de travail RAG complexes et l'utilisation d'outils en plusieurs étapes.",
@@ -366,7 +367,8 @@
"deepseek-ai/DeepSeek-V2.5.description": "DeepSeek-V2.5 améliore DeepSeek-V2-Chat et DeepSeek-Coder-V2-Instruct, combinant capacités générales et de codage. Il améliore la rédaction et le suivi des instructions pour un meilleur alignement des préférences, avec des gains significatifs sur AlpacaEval 2.0, ArenaHard, AlignBench et MT-Bench.",
"deepseek-ai/DeepSeek-V3.1-Terminus.description": "DeepSeek-V3.1-Terminus est une version mise à jour du modèle V3.1, positionnée comme un agent hybride LLM. Il corrige les problèmes signalés par les utilisateurs et améliore la stabilité, la cohérence linguistique, tout en réduisant les caractères anormaux et le mélange chinois/anglais. Il intègre les modes de pensée et non-pensée avec des modèles de chat pour un basculement flexible. Il améliore également les performances des agents de code et de recherche pour une utilisation plus fiable des outils et des tâches multi-étapes.",
"deepseek-ai/DeepSeek-V3.1.description": "DeepSeek V3.1 utilise une architecture de raisonnement hybride et prend en charge les modes pensée et non-pensée.",
"deepseek-ai/DeepSeek-V3.2-Exp.description": "DeepSeek-V3.2-Exp est une version expérimentale de V3.2 servant de pont vers la prochaine architecture. Il ajoute DeepSeek Sparse Attention (DSA) au-dessus de V3.1-Terminus pour améliorer lefficacité de lentraînement et de linférence sur les contextes longs, avec des optimisations pour lutilisation doutils, la compréhension de documents longs et le raisonnement multi-étapes. Idéal pour explorer une efficacité de raisonnement accrue avec de grands budgets de contexte.",
"deepseek-ai/DeepSeek-V3.2-Exp.description": "DeepSeek V3.2 Exp utilise une architecture de raisonnement hybride et prend en charge les modes de réflexion et de non-réflexion.",
"deepseek-ai/DeepSeek-V3.2.description": "DeepSeek-V3.2 est un modèle qui combine une grande efficacité de calcul avec d'excellentes performances en raisonnement et en tâches d'Agent. Son approche repose sur trois percées technologiques majeures : DeepSeek Sparse Attention (DSA), un mécanisme d'attention efficace qui réduit considérablement la complexité de calcul tout en maintenant les performances du modèle, optimisé spécifiquement pour les scénarios à long contexte ; un cadre d'apprentissage par renforcement évolutif permettant au modèle de rivaliser avec GPT-5, sa version haute performance égalant Gemini-3.0-Pro en capacités de raisonnement ; et un pipeline de synthèse de tâches d'Agent à grande échelle conçu pour intégrer les capacités de raisonnement dans les scénarios d'utilisation d'outils, améliorant ainsi le suivi des instructions et les capacités de généralisation dans des environnements interactifs complexes. Le modèle a obtenu des résultats médaillés d'or aux Olympiades Internationales de Mathématiques (IMO) et d'Informatique (IOI) de 2025.",
"deepseek-ai/DeepSeek-V3.description": "DeepSeek-V3 est un modèle MoE de 671 milliards de paramètres utilisant MLA et DeepSeekMoE avec un équilibrage de charge sans perte pour un entraînement et une inférence efficaces. Préentraîné sur 14,8T de tokens de haute qualité avec SFT et RL, il surpasse les autres modèles open source et rivalise avec les modèles fermés de pointe.",
"deepseek-ai/deepseek-llm-67b-chat.description": "DeepSeek LLM Chat (67B) est un modèle innovant offrant une compréhension linguistique approfondie et une interaction fluide.",
"deepseek-ai/deepseek-v3.1-terminus.description": "DeepSeek V3.1 est un modèle de raisonnement nouvelle génération avec un raisonnement complexe renforcé et une chaîne de pensée pour les tâches danalyse approfondie.",
@@ -433,6 +435,7 @@
"deepseek_r1_distill_llama_70b.description": "DeepSeek-R1-Distill-Llama-70B est distillé à partir de Llama-3.3-70B-Instruct. Faisant partie de la série DeepSeek-R1, il est affiné sur des échantillons générés par DeepSeek-R1 et offre d'excellentes performances en mathématiques, programmation et raisonnement.",
"deepseek_r1_distill_qwen_14b.description": "DeepSeek-R1-Distill-Qwen-14B est distillé à partir de Qwen2.5-14B et affiné sur 800 000 échantillons sélectionnés générés par DeepSeek-R1, offrant un raisonnement solide.",
"deepseek_r1_distill_qwen_32b.description": "DeepSeek-R1-Distill-Qwen-32B est distillé à partir de Qwen2.5-32B et affiné sur 800 000 échantillons sélectionnés générés par DeepSeek-R1, excellant en mathématiques, programmation et raisonnement.",
"devstral-2512.description": "Devstral 2 est un modèle textuel de niveau entreprise qui excelle dans l'utilisation d'outils pour explorer des bases de code, éditer plusieurs fichiers et alimenter des agents d'ingénierie logicielle.",
"devstral-2:123b.description": "Devstral 2 123B excelle dans lutilisation doutils pour explorer des bases de code, modifier plusieurs fichiers et assister les agents en ingénierie logicielle.",
"doubao-1.5-lite-32k.description": "Doubao-1.5-lite est un nouveau modèle léger à réponse ultra-rapide, offrant une qualité et une latence de premier ordre.",
"doubao-1.5-pro-256k.description": "Doubao-1.5-pro-256k est une mise à niveau complète de Doubao-1.5-Pro, améliorant les performances globales de 10 %. Il prend en charge une fenêtre de contexte de 256k et jusqu’à 12k jetons de sortie, offrant de meilleures performances, une fenêtre plus large et une forte valeur pour des cas dusage étendus.",
@@ -546,10 +549,10 @@
"gemini-2.5-pro-preview-06-05.description": "Gemini 2.5 Pro Preview est le modèle de raisonnement le plus avancé de Google, capable de raisonner sur du code, des mathématiques et des problèmes STEM, et danalyser de grands ensembles de données, bases de code et documents avec un long contexte.",
"gemini-2.5-pro.description": "Gemini 2.5 Pro est le modèle de raisonnement phare de Google, avec un support de long contexte pour les tâches complexes.",
"gemini-3-flash-preview.description": "Gemini 3 Flash est le modèle le plus intelligent conçu pour la vitesse, alliant intelligence de pointe et ancrage de recherche performant.",
"gemini-3-pro-image-preview.description": "Gemini 3 Pro Image (Nano Banana Pro) est le modèle de génération dimages de Google, prenant également en charge les dialogues multimodaux.",
"gemini-3-pro-image-preview.description": "Gemini 3 Pro Image (Nano Banana Pro) est le modèle de génération d'images de Google qui prend également en charge le dialogue multimodal.",
"gemini-3-pro-image-preview:image.description": "Gemini 3 Pro Image (Nano Banana Pro) est le modèle de génération d'images de Google, prenant également en charge le chat multimodal.",
"gemini-3-pro-preview.description": "Gemini 3 Pro est le modèle agent et de codage le plus puissant de Google, offrant des visuels enrichis et une interaction plus poussée grâce à un raisonnement de pointe.",
"gemini-3.1-flash-image-preview.description": "Gemini 3.1 Flash Image (Nano Banana 2) offre une qualité d'image professionnelle à une vitesse Flash avec prise en charge de la discussion multimodale.",
"gemini-3.1-flash-image-preview.description": "Gemini 3.1 Flash Image (Nano Banana 2) est le modèle de génération d'images natif le plus rapide de Google avec prise en charge de la réflexion, génération et édition d'images conversationnelles.",
"gemini-3.1-flash-image-preview:image.description": "Gemini 3.1 Flash Image (Nano Banana 2) offre une qualité d'image professionnelle à une vitesse Flash avec prise en charge de la discussion multimodale.",
"gemini-3.1-pro-preview.description": "Gemini 3.1 Pro Preview améliore Gemini 3 Pro avec des capacités de raisonnement renforcées et ajoute un support de niveau de réflexion moyen.",
"gemini-flash-latest.description": "Dernière version de Gemini Flash",
@@ -605,19 +608,15 @@
"google/gemini-2.0-flash-lite-001.description": "Gemini 2.0 Flash Lite est une variante allégée de Gemini, avec le raisonnement désactivé par défaut pour réduire la latence et les coûts, mais pouvant être activé via des paramètres.",
"google/gemini-2.0-flash-lite.description": "Gemini 2.0 Flash Lite propose des fonctionnalités de nouvelle génération, notamment une vitesse exceptionnelle, l'utilisation intégrée d'outils, la génération multimodale et une fenêtre de contexte dun million de jetons.",
"google/gemini-2.0-flash.description": "Gemini 2.0 Flash est le modèle de raisonnement haute performance de Google pour les tâches multimodales étendues.",
"google/gemini-2.5-flash-image-free.description": "Gemini 2.5 Flash Image, niveau gratuit avec quota limité pour la génération multimodale.",
"google/gemini-2.5-flash-image-preview.description": "Modèle expérimental Gemini 2.5 Flash avec prise en charge de la génération dimages.",
"google/gemini-2.5-flash-image.description": "Gemini 2.5 Flash Image (Nano Banana) est le modèle de génération dimages de Google avec prise en charge des conversations multimodales.",
"google/gemini-2.5-flash-lite.description": "Gemini 2.5 Flash Lite est la variante allégée de Gemini 2.5, optimisée pour la latence et les coûts, idéale pour les scénarios à haut débit.",
"google/gemini-2.5-flash-preview.description": "Gemini 2.5 Flash est le modèle phare le plus avancé de Google, conçu pour le raisonnement complexe, le codage, les mathématiques et les sciences. Il intègre un mode « réflexion » pour fournir des réponses plus précises avec un traitement contextuel plus fin.\n\nRemarque : ce modèle existe en deux variantes — avec ou sans réflexion. Le tarif de sortie varie considérablement selon que la réflexion est activée. Si vous choisissez la variante standard (sans le suffixe « :thinking »), le modèle évitera explicitement de générer des jetons de réflexion.\n\nPour activer la réflexion et recevoir des jetons de réflexion, vous devez sélectionner la variante « :thinking », qui entraîne un coût de sortie plus élevé.\n\nGemini 2.5 Flash peut également être configuré via le paramètre « max reasoning tokens » comme documenté (https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning).",
"google/gemini-2.5-flash-preview:thinking.description": "Gemini 2.5 Flash est le modèle phare le plus avancé de Google, conçu pour le raisonnement complexe, le codage, les mathématiques et les sciences. Il intègre un mode « réflexion » pour fournir des réponses plus précises avec un traitement contextuel plus fin.\n\nRemarque : ce modèle existe en deux variantes — avec ou sans réflexion. Le tarif de sortie varie considérablement selon que la réflexion est activée. Si vous choisissez la variante standard (sans le suffixe « :thinking »), le modèle évitera explicitement de générer des jetons de réflexion.\n\nPour activer la réflexion et recevoir des jetons de réflexion, vous devez sélectionner la variante « :thinking », qui entraîne un coût de sortie plus élevé.\n\nGemini 2.5 Flash peut également être configuré via le paramètre « max reasoning tokens » comme documenté (https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning).",
"google/gemini-2.5-flash.description": "Gemini 2.5 Flash (Lite/Pro/Flash) est une famille de modèles Google allant de la faible latence au raisonnement haute performance.",
"google/gemini-2.5-pro-free.description": "Gemini 2.5 Pro, niveau gratuit, offre un quota limité pour la génération multimodale avec contexte long, adapté aux essais et aux flux de travail légers.",
"google/gemini-2.5-flash.description": "Gemini 2.5 Flash est une famille de modèles de Google allant de la faible latence à des capacités de raisonnement haute performance.",
"google/gemini-2.5-pro-preview.description": "Gemini 2.5 Pro Preview est le modèle de raisonnement le plus avancé de Google pour résoudre des problèmes complexes en code, mathématiques et STEM, et pour analyser de grands ensembles de données, bases de code et documents avec un long contexte.",
"google/gemini-2.5-pro.description": "Gemini 2.5 Pro est le modèle phare de raisonnement de Google avec prise en charge du contexte long pour les tâches complexes.",
"google/gemini-3-pro-image-preview-free.description": "Gemini 3 Pro Image, niveau gratuit avec quota limité pour la génération multimodale.",
"google/gemini-3-pro-image-preview.description": "Gemini 3 Pro Image (Nano Banana Pro) est le modèle de génération dimages de Google avec prise en charge des conversations multimodales.",
"google/gemini-3-pro-preview-free.description": "Gemini 3 Pro Preview Free offre les mêmes capacités de compréhension et de raisonnement multimodal que la version standard, mais avec des limites de quota et de fréquence, ce qui le rend idéal pour les essais et les usages peu fréquents.",
"google/gemini-3-pro-preview.description": "Gemini 3 Pro est le modèle de raisonnement multimodal de nouvelle génération de la famille Gemini, capable de comprendre le texte, laudio, les images et la vidéo, et de gérer des tâches complexes et de grands ensembles de code.",
"google/gemini-embedding-001.description": "Un modèle dintégration de texte de pointe avec dexcellentes performances en anglais, en multilingue et en tâches de codage.",
"google/gemini-flash-1.5.description": "Gemini 1.5 Flash offre un traitement multimodal optimisé pour une variété de tâches complexes.",
@@ -717,15 +716,24 @@
"hunyuan-a13b.description": "Premier modèle hybride de raisonnement de Hunyuan, amélioré à partir de hunyuan-standard-256K (80B au total, 13B actifs). Il privilégie la réflexion lente par défaut et permet de basculer entre réflexion rapide/lente via des paramètres ou le préfixe /no_think. Ses capacités globales sont supérieures à la génération précédente, notamment en mathématiques, sciences, compréhension de longs textes et tâches d'agents.",
"hunyuan-code.description": "Le dernier modèle de code Hunyuan, entraîné sur 200 milliards de données de code de haute qualité et six mois de données SFT, avec un contexte de 8K. Il se classe parmi les meilleurs dans les benchmarks de code automatisé et dans les évaluations humaines expertes dans cinq langues.",
"hunyuan-functioncall.description": "Le dernier modèle MoE FunctionCall de Hunyuan, entraîné sur des données d'appel d'outils de haute qualité, avec une fenêtre de contexte de 32K et des benchmarks de pointe dans plusieurs dimensions.",
"hunyuan-large-longcontext.description": "Excelle dans les tâches de documents longs comme le résumé et les questions-réponses tout en gérant également la génération générale. Fort en analyse et génération de textes longs pour des contenus complexes et détaillés.",
"hunyuan-large.description": "Hunyuan-large compte ~389 milliards de paramètres totaux et ~52 milliards activés, le plus grand et le plus puissant modèle MoE ouvert dans une architecture Transformer.",
"hunyuan-lite.description": "Mis à niveau vers une architecture MoE avec une fenêtre de contexte de 256K, surpassant de nombreux modèles open source dans les benchmarks NLP, code, mathématiques et industriels.",
"hunyuan-pro.description": "Modèle MoE-32K à un billion de paramètres avec longue fenêtre de contexte, en tête des benchmarks, excellent pour les instructions complexes, le raisonnement, les mathématiques avancées, les appels de fonctions, et optimisé pour la traduction multilingue, la finance, le droit et la médecine.",
"hunyuan-role.description": "Le dernier modèle de jeu de rôle Hunyuan, officiellement affiné avec des données de jeu de rôle, offrant des performances de base plus solides dans les scénarios de jeu de rôle.",
"hunyuan-standard-256K.description": "Utilise un routage amélioré pour atténuer l'équilibrage de charge et l'effondrement des experts. Les longues recherches textuelles \"aiguille dans une botte de foin\" atteignent 99,9 %. MOE-256K pousse encore plus loin en longueur et en qualité, élargissant considérablement la longueur des entrées.",
"hunyuan-standard.description": "Utilise un routage amélioré pour atténuer l'équilibrage de charge et l'effondrement des experts. Les longues recherches textuelles \"aiguille dans une botte de foin\" atteignent 99,9 %. MOE-32K offre une meilleure valeur tout en équilibrant qualité et prix pour les entrées longues.",
"hunyuan-standard-256K.description": "Utilise un routage amélioré pour atténuer les déséquilibres de charge et l'effondrement des experts. Atteint 99,9 % d'aiguille dans une botte de foin sur un long contexte. MOE-256K étend davantage la longueur et la qualité du contexte.",
"hunyuan-standard.description": "Utilise un routage amélioré pour atténuer les déséquilibres de charge et l'effondrement des experts. Atteint 99,9 % d'aiguille dans une botte de foin sur un long contexte. MOE-32K offre une grande valeur tout en gérant des entrées longues.",
"hunyuan-t1-20250321.description": "Développe des capacités équilibrées en arts et STEM avec une forte capture d'informations sur des textes longs. Prend en charge des réponses raisonnées pour des problèmes de mathématiques, logique, sciences et code à différents niveaux de difficulté.",
"hunyuan-t1-20250403.description": "Améliore la génération de code au niveau des projets et la qualité de l'écriture, renforce la compréhension des sujets multi-tours et le suivi des instructions ToB, améliore la compréhension au niveau des mots et réduit les problèmes de sortie mixte simplifiée/traditionnelle et chinois/anglais.",
"hunyuan-t1-20250529.description": "Améliore l'écriture créative et la composition, renforce le codage frontend, le raisonnement mathématique et logique, et améliore le suivi des instructions.",
"hunyuan-t1-20250711.description": "Améliore considérablement les mathématiques difficiles, la logique et le codage, augmente la stabilité des sorties et renforce les capacités de texte long.",
"hunyuan-t1-latest.description": "Améliore significativement le modèle à réflexion lente sur les mathématiques complexes, le raisonnement, le codage difficile, le suivi des instructions et la qualité de l'écriture créative.",
"hunyuan-t1-vision-20250916.description": "Dernier modèle de raisonnement profond t1-vision avec des améliorations majeures en VQA, ancrage visuel, OCR, graphiques, résolution de problèmes photographiés et création basée sur l'image, ainsi qu'une meilleure prise en charge de l'anglais et des langues peu dotées.",
"hunyuan-turbo-20241223.description": "Cette version améliore l'échelle des instructions pour une meilleure généralisation, améliore significativement le raisonnement mathématique/code/logique, renforce la compréhension au niveau des mots et améliore la qualité de l'écriture.",
"hunyuan-turbo-latest.description": "Améliorations générales de l'expérience dans la compréhension NLP, l'écriture, le chat, les questions-réponses, la traduction et les domaines ; réponses plus humaines, meilleure clarification des intentions ambiguës, amélioration de l'analyse des mots, qualité créative et interactivité accrues, et conversations multi-tours renforcées.",
"hunyuan-turbo.description": "Aperçu du prochain LLM de Hunyuan avec une nouvelle architecture MoE, offrant un raisonnement plus rapide et de meilleurs résultats que hunyuan-pro.",
"hunyuan-turbos-latest.description": "Le dernier modèle phare Hunyuan TurboS avec un raisonnement renforcé et une expérience globale améliorée.",
"hunyuan-turbos-longtext-128k-20250325.description": "Excelle dans les tâches de documents longs comme le résumé et les questions-réponses tout en gérant également la génération générale. Fort en analyse et génération de textes longs pour des contenus complexes et détaillés.",
"hunyuan-vision-1.5-instruct.description": "Un modèle image-texte à réflexion rapide basé sur la base textuelle TurboS, montrant des améliorations notables par rapport à la version précédente en reconnaissance d'image fondamentale et en raisonnement d'analyse d'image.",
"hunyuan-vision.description": "Le dernier modèle multimodal Hunyuan prenant en charge les entrées image + texte pour générer du texte.",
"image-01-live.description": "Modèle de génération dimage avec un haut niveau de détail, prenant en charge la génération texte-vers-image et des styles contrôlables prédéfinis.",
@@ -770,8 +778,7 @@
"kimi-k2:1t.description": "Kimi K2 est un grand LLM MoE de Moonshot AI avec 1T de paramètres totaux et 32B actifs par passage. Il est optimisé pour les capacités dagent, y compris lutilisation avancée doutils, le raisonnement et la synthèse de code.",
"kimi-latest.description": "Kimi Latest utilise le modèle Kimi le plus récent et peut inclure des fonctionnalités expérimentales. Il prend en charge la compréhension dimages et sélectionne automatiquement les modèles de facturation 8k/32k/128k en fonction de la longueur du contexte.",
"kuaishou/kat-coder-pro-v1.description": "KAT-Coder-Pro-V1 (gratuit pour une durée limitée) se concentre sur la compréhension du code et lautomatisation pour des agents de codage efficaces.",
"learnlm-1.5-pro-experimental.description": "LearnLM est un modèle expérimental, spécifique à certaines tâches, entraîné selon les principes des sciences de lapprentissage pour suivre les instructions système dans des scénarios denseignement/apprentissage, agissant comme un tuteur expert.",
"learnlm-2.0-flash-experimental.description": "LearnLM est un modèle expérimental, spécifique à certaines tâches, entraîné selon les principes des sciences de lapprentissage pour suivre les instructions système dans des scénarios denseignement/apprentissage, agissant comme un tuteur expert.",
"labs-devstral-small-2512.description": "Devstral Small 2 excelle dans l'utilisation d'outils pour explorer des bases de code, éditer plusieurs fichiers et alimenter des agents d'ingénierie logicielle.",
"lite.description": "Spark Lite est un LLM léger avec une latence ultra-faible et un traitement efficace. Entièrement gratuit, il prend en charge la recherche web en temps réel. Ses réponses rapides sont performantes sur des appareils à faible puissance de calcul et pour laffinage de modèles, offrant un excellent rapport coût-efficacité et une expérience intelligente, notamment pour les questions-réponses, la génération de contenu et les scénarios de recherche.",
"llama-3.1-70b-versatile.description": "Llama 3.1 70B offre un raisonnement IA renforcé pour les applications complexes, avec une efficacité et une précision élevées pour les calculs intensifs.",
"llama-3.1-8b-instant.description": "Llama 3.1 8B est un modèle efficace avec une génération de texte rapide, idéal pour des applications à grande échelle et économiques.",
@@ -782,7 +789,6 @@
"llama-3.2-90b-vision-preview.description": "Llama 3.2 est conçu pour les tâches combinant vision et texte, excellent en légendage d'images et en questions-réponses visuelles, reliant génération de langage et raisonnement visuel.",
"llama-3.2-vision-instruct.description": "Le modèle Llama 3.2-Vision optimisé pour les instructions est conçu pour la reconnaissance visuelle, le raisonnement sur image, le légendage et les questions-réponses générales sur image.",
"llama-3.3-70b-versatile.description": "Meta Llama 3.3 est un LLM multilingue de 70B paramètres (texte en/texte hors), disponible en versions pré-entraînée et optimisée pour les instructions. La version optimisée est conçue pour les dialogues multilingues et surpasse de nombreux modèles open source et propriétaires sur les benchmarks industriels.",
"llama-3.3-70b.description": "Llama 3.3 70B : un modèle Llama de taille moyenne à grande, équilibrant raisonnement et débit.",
"llama-3.3-instruct.description": "Le modèle Llama 3.3 optimisé pour les instructions est conçu pour le chat et surpasse de nombreux modèles open source sur les benchmarks industriels.",
"llama3-70b-8192.description": "Meta Llama 3 70B offre une gestion exceptionnelle de la complexité pour les projets exigeants.",
"llama3-8b-8192.description": "Meta Llama 3 8B offre de solides performances de raisonnement pour des scénarios variés.",
@@ -832,7 +838,6 @@
"meta-llama/llama-3.1-8b-instruct:free.description": "LLaMA 3.1 offre un support multilingue et fait partie des modèles génératifs les plus performants.",
"meta-llama/llama-3.2-11b-vision-instruct.description": "LLaMA 3.2 est conçu pour les tâches combinant vision et texte. Il excelle en légendage dimages et en questions-réponses visuelles, faisant le lien entre génération de langage et raisonnement visuel.",
"meta-llama/llama-3.2-3b-instruct.description": "meta-llama/llama-3.2-3b-instruct",
"meta-llama/llama-3.2-90b-vision-instruct.description": "LLaMA 3.2 est conçu pour les tâches combinant vision et texte. Il excelle en légendage dimages et en questions-réponses visuelles, faisant le lien entre génération de langage et raisonnement visuel.",
"meta-llama/llama-3.3-70b-instruct.description": "Llama 3.3 est le modèle Llama multilingue open source le plus avancé, offrant des performances proches de 405B à très faible coût. Basé sur larchitecture Transformer, il est amélioré par SFT et RLHF pour une meilleure utilité et sécurité. La version optimisée pour les instructions est conçue pour les conversations multilingues et surpasse de nombreux modèles ouverts et fermés selon les benchmarks industriels. Date de coupure des connaissances : décembre 2023.",
"meta-llama/llama-3.3-70b-instruct:free.description": "Llama 3.3 est le modèle Llama multilingue open source le plus avancé, offrant des performances proches de 405B à très faible coût. Basé sur larchitecture Transformer, il est amélioré par SFT et RLHF pour une meilleure utilité et sécurité. La version optimisée pour les instructions est conçue pour les conversations multilingues et surpasse de nombreux modèles ouverts et fermés selon les benchmarks industriels. Date de coupure des connaissances : décembre 2023.",
"meta.llama3-1-405b-instruct-v1:0.description": "Meta Llama 3.1 405B Instruct est le plus grand et le plus puissant modèle Llama 3.1 Instruct, conçu pour le raisonnement conversationnel et la génération de données synthétiques. Il constitue une base solide pour un pré-entraînement ou un ajustement spécifique à un domaine. Les LLMs multilingues Llama 3.1 sont des modèles de génération pré-entraînés et ajustés par instruction, disponibles en tailles 8B, 70B et 405B (texte en entrée/sortie). Les modèles ajustés sont optimisés pour le dialogue multilingue et surpassent de nombreux modèles de chat ouverts sur les benchmarks industriels. Llama 3.1 est destiné à un usage commercial et de recherche dans plusieurs langues. Les modèles ajustés conviennent aux assistants conversationnels, tandis que les modèles pré-entraînés sont adaptés à des tâches plus générales de génération de texte. Les sorties de Llama 3.1 peuvent également être utilisées pour améliorer d'autres modèles, notamment via la génération et le raffinement de données synthétiques. Llama 3.1 est un modèle Transformer autorégressif avec une architecture optimisée. Les versions ajustées utilisent un apprentissage supervisé (SFT) et un apprentissage par renforcement avec retour humain (RLHF) pour saligner sur les préférences humaines en matière dutilité et de sécurité.",
@@ -894,7 +899,7 @@
"mistral-large-instruct.description": "Mistral-Large-Instruct-2407 est un LLM dense avancé avec 123 milliards de paramètres, doté dun raisonnement, de connaissances et de capacités de codage de pointe.",
"mistral-large-latest.description": "Mistral Large est le modèle phare, performant en tâches multilingues, raisonnement complexe et génération de code — idéal pour les applications haut de gamme.",
"mistral-large.description": "Mixtral Large est le modèle phare de Mistral, combinant génération de code, mathématiques et raisonnement avec une fenêtre de contexte de 128K.",
"mistral-medium-latest.description": "Mistral Medium 3 offre des performances de pointe à un coût 8× inférieur et simplifie le déploiement en entreprise.",
"mistral-medium-latest.description": "Mistral Medium 3.1 offre des performances de pointe à un coût 8× inférieur et simplifie le déploiement en entreprise.",
"mistral-nemo-instruct.description": "Mistral-Nemo-Instruct-2407 est la version ajustée par instruction de Mistral-Nemo-Base-2407.",
"mistral-nemo.description": "Mistral Nemo est un modèle efficace de 12B développé par Mistral AI et NVIDIA.",
"mistral-small-latest.description": "Mistral Small est une option économique, rapide et fiable pour la traduction, le résumé et lanalyse de sentiments.",
@@ -933,7 +938,7 @@
"moonshot-v1-auto.description": "Moonshot V1 Auto sélectionne le modèle approprié en fonction de lutilisation actuelle des jetons de contexte.",
"moonshotai/Kimi-Dev-72B.description": "Kimi-Dev-72B est un modèle de code open source optimisé avec un apprentissage par renforcement à grande échelle pour produire des correctifs robustes et prêts pour la production. Il atteint 60,4 % sur SWE-bench Verified, établissant un nouveau record pour les modèles ouverts dans les tâches dingénierie logicielle automatisée comme la correction de bugs et la revue de code.",
"moonshotai/Kimi-K2-Instruct-0905.description": "Kimi K2-Instruct-0905 est la version la plus récente et la plus puissante de Kimi K2. Cest un modèle MoE de premier plan avec 1T de paramètres totaux et 32B actifs. Ses points forts incluent une intelligence de codage agentique renforcée avec des gains significatifs sur les benchmarks et les tâches réelles, ainsi quun code frontend plus esthétique et plus utilisable.",
"moonshotai/Kimi-K2-Thinking.description": "Kimi K2 Thinking est le modèle de réflexion open source le plus avancé. Il étend considérablement la profondeur du raisonnement multi-étapes et maintient une utilisation stable des outils sur 200 à 300 appels consécutifs, établissant de nouveaux records sur Humanity's Last Exam (HLE), BrowseComp et d'autres benchmarks. Il excelle en codage, mathématiques, logique et scénarios dagents. Construit sur une architecture MoE avec ~1T de paramètres totaux, il prend en charge une fenêtre de contexte de 256K et lappel doutils.",
"moonshotai/Kimi-K2-Thinking.description": "Kimi K2 Thinking est le dernier et le plus puissant modèle de réflexion open-source. Il étend considérablement la profondeur de raisonnement multi-étapes et maintient une utilisation stable des outils sur 200300 appels consécutifs, établissant de nouveaux records sur Humanity's Last Exam (HLE), BrowseComp et d'autres benchmarks. Il excelle en codage, mathématiques, logique et scénarios d'Agent. Construit sur une architecture MoE avec ~1T de paramètres totaux, il prend en charge une fenêtre de contexte de 256K et l'appel d'outils.",
"moonshotai/kimi-k2-0711.description": "Kimi K2 0711 est la variante instructive de la série Kimi, adaptée au code de haute qualité et à lutilisation doutils.",
"moonshotai/kimi-k2-0905.description": "Kimi K2 0905 est une mise à jour qui améliore les performances de contexte et de raisonnement avec des optimisations de codage.",
"moonshotai/kimi-k2-instruct-0905.description": "Le modèle kimi-k2-0905-preview prend en charge une fenêtre de contexte de 256K, avec un codage agentique renforcé, un code frontend plus soigné et pratique, et une meilleure compréhension du contexte.",
@@ -948,8 +953,8 @@
"nvidia/Llama-3.1-Nemotron-70B-Instruct-HF.description": "Llama 3.1 Nemotron 70B est un LLM personnalisé par NVIDIA pour améliorer lutilité. Il obtient dexcellents résultats sur Arena Hard, AlpacaEval 2 LC et GPT-4-Turbo MT-Bench, se classant n°1 sur les trois benchmarks dalignement automatique au 1er octobre 2024. Il est entraîné à partir de Llama-3.1-70B-Instruct avec RLHF (REINFORCE), Llama-3.1-Nemotron-70B-Reward et des invites HelpSteer2-Preference.",
"nvidia/llama-3.1-nemotron-51b-instruct.description": "Un modèle de langage distinctif offrant une précision et une efficacité exceptionnelles.",
"nvidia/llama-3.1-nemotron-70b-instruct.description": "Llama-3.1-Nemotron-70B-Instruct est un modèle personnalisé par NVIDIA conçu pour améliorer lutilité des réponses des LLM.",
"o1-mini.description": "Plus petit et plus rapide que o1-preview, avec un coût réduit de 80 %, performant en génération de code et sur les tâches à contexte court.",
"o1-preview.description": "Axé sur le raisonnement avancé et la résolution de problèmes complexes, notamment en mathématiques et en sciences. Idéal pour les applications nécessitant une compréhension approfondie du contexte et des flux de travail autonomes.",
"o1-mini.description": "o1-mini est un modèle de raisonnement rapide et économique conçu pour le codage, les mathématiques et les sciences. Il dispose d'un contexte de 128K et d'une limite de connaissances d'octobre 2023.",
"o1-preview.description": "o1 est le nouveau modèle de raisonnement d'OpenAI pour les tâches complexes nécessitant des connaissances étendues. Il dispose d'un contexte de 128K et d'une limite de connaissances d'octobre 2023.",
"o1-pro.description": "La série o1 est entraînée par apprentissage par renforcement pour réfléchir avant de répondre et gérer un raisonnement complexe. o1-pro utilise plus de ressources pour une réflexion approfondie et des réponses de qualité constante.",
"o1.description": "o1 est le nouveau modèle de raisonnement dOpenAI avec entrée texte + image et sortie texte, adapté aux tâches complexes nécessitant une vaste base de connaissances. Il dispose dune fenêtre de contexte de 200K et dune base de connaissances arrêtée en octobre 2023.",
"o3-2025-04-16.description": "o3 est le nouveau modèle de raisonnement dOpenAI avec entrée texte + image et sortie texte, conçu pour les tâches complexes nécessitant une large base de connaissances.",
@@ -1022,7 +1027,6 @@
"qianfan-check-vl.description": "Qianfan Check VL est un modèle de révision de contenu multimodal pour les tâches de conformité et de reconnaissance image-texte.",
"qianfan-composition.description": "Qianfan Composition est un modèle de création multimodale pour la compréhension et la génération combinées d'image et de texte.",
"qianfan-engcard-vl.description": "Qianfan EngCard VL est un modèle de reconnaissance multimodale axé sur les scénarios en anglais.",
"qianfan-lightning-128b-a19b.description": "Qianfan Lightning 128B A19B est un modèle général chinois haute performance pour les questions-réponses complexes et le raisonnement à grande échelle.",
"qianfan-llama-vl-8b.description": "Qianfan Llama VL 8B est un modèle multimodal basé sur Llama pour la compréhension générale image-texte.",
"qianfan-multipicocr.description": "Qianfan MultiPicOCR est un modèle OCR multi-images pour la détection et la reconnaissance de texte à travers plusieurs images.",
"qianfan-qi-vl.description": "Qianfan QI VL est un modèle de questions-réponses multimodal pour une récupération précise et des réponses dans des scénarios image-texte complexes.",
@@ -1032,7 +1036,6 @@
"qvq-72b-preview.description": "QVQ-72B-Preview est un modèle de recherche expérimental de Qwen axé sur l'amélioration du raisonnement visuel.",
"qvq-max.description": "Le modèle de raisonnement visuel Qwen QVQ prend en charge les entrées visuelles et les sorties en chaîne de pensée, avec de meilleures performances en mathématiques, codage, analyse visuelle, créativité et tâches générales.",
"qvq-plus.description": "Modèle de raisonnement visuel avec entrée visuelle et sortie en chaîne de pensée. La série qvq-plus succède à qvq-max et offre un raisonnement plus rapide avec un meilleur équilibre qualité-coût.",
"qwen-3-32b.description": "Qwen 3 32B : performant en tâches multilingues et de programmation, adapté à une utilisation en production à moyenne échelle.",
"qwen-coder-plus.description": "Modèle de code Qwen.",
"qwen-coder-turbo-latest.description": "Modèle de code Qwen.",
"qwen-coder-turbo.description": "Modèle de code Qwen.",
@@ -1128,7 +1131,6 @@
"qwen3-coder-next.description": "Le prochain modèle Qwen coder optimisé pour la génération de code complexe multi-fichiers, le débogage et les flux de travail d'agent à haut débit. Conçu pour une forte intégration d'outils et des performances de raisonnement améliorées.",
"qwen3-coder-plus.description": "Modèle de code Qwen. La dernière série Qwen3-Coder est basée sur Qwen3 et offre de solides capacités dagent de codage, dutilisation doutils et dinteraction avec lenvironnement pour la programmation autonome, avec dexcellentes performances en code et de bonnes capacités générales.",
"qwen3-coder:480b.description": "Modèle haute performance dAlibaba pour les tâches dagent et de codage avec contexte long.",
"qwen3-max-2026-01-23.description": "Les modèles Qwen3 Max offrent des gains significatifs par rapport à la série 2.5 en capacités générales, compréhension du chinois/anglais, suivi d'instructions complexes, tâches subjectives ouvertes, compétences multilingues et utilisation doutils, avec moins dhallucinations. La dernière version qwen3-max améliore la programmation agentique et lutilisation doutils par rapport à qwen3-max-preview. Cette version atteint l’état de lart et répond aux besoins dagents plus complexes.",
"qwen3-max-preview.description": "Modèle Qwen le plus performant pour les tâches complexes à étapes multiples. La version preview prend en charge le raisonnement.",
"qwen3-max.description": "Les modèles Qwen3 Max offrent des gains importants par rapport à la série 2.5 en capacité générale, compréhension du chinois/anglais, suivi dinstructions complexes, tâches ouvertes subjectives, multilinguisme et utilisation doutils, avec moins dhallucinations. La dernière version améliore la programmation agentique et lutilisation doutils par rapport à qwen3-max-preview. Cette version atteint le SOTA dans son domaine et vise des besoins agents plus complexes.",
"qwen3-next-80b-a3b-instruct.description": "Modèle open source Qwen3 de nouvelle génération sans raisonnement. Par rapport à la version précédente (Qwen3-235B-A22B-Instruct-2507), il offre une meilleure compréhension du chinois, un raisonnement logique renforcé et une génération de texte améliorée.",
@@ -1145,7 +1147,8 @@
"qwen3-vl-flash.description": "Qwen3 VL Flash : version légère et rapide de raisonnement pour les requêtes sensibles à la latence ou à fort volume.",
"qwen3-vl-plus.description": "Qwen VL est un modèle de génération de texte avec compréhension visuelle. Il peut effectuer de lOCR, résumer, raisonner, extraire des attributs de photos de produits ou résoudre des problèmes à partir dimages.",
"qwen3.5-397b-a17b.description": "Prend en charge les entrées texte, image et vidéo. Pour les tâches uniquement textuelles, ses performances sont comparables à celles de Qwen3 Max, offrant une efficacité supérieure et un coût inférieur. En termes de capacités multimodales, il offre des améliorations significatives par rapport à la série Qwen3 VL.",
"qwen3.5-plus.description": "Qwen3.5 Plus prend en charge les entrées texte, image et vidéo. Pour les tâches uniquement textuelles, ses performances sont comparables à celles de Qwen3 Max, tout en offrant une meilleure efficacité et un coût inférieur. En termes de capacités multimodales, il montre des améliorations significatives par rapport à la série Qwen3 VL.",
"qwen3.5-plus.description": "Qwen3.5 Plus prend en charge les entrées texte, image et vidéo. Ses performances sur les tâches purement textuelles sont comparables à celles de Qwen3 Max, avec de meilleures performances et un coût réduit. Ses capacités multimodales sont significativement améliorées par rapport à la série Qwen3 VL.",
"qwen3.5:397b.description": "Qwen3.5 est un modèle fondamental vision-langage unifié avec une architecture hybride (Mixture-of-Experts + attention linéaire), offrant un raisonnement multimodal puissant, du codage et des capacités de long contexte avec une fenêtre de contexte de 256K.",
"qwen3.description": "Qwen3 est le modèle de langage de nouvelle génération d'Alibaba, performant dans de nombreux cas dusage.",
"qwq-32b-preview.description": "QwQ est un modèle de recherche expérimental de Qwen axé sur lamélioration du raisonnement.",
"qwq-32b.description": "QwQ est un modèle de raisonnement de la famille Qwen. Comparé aux modèles classiques ajustés par instruction, il apporte des capacités de réflexion et de raisonnement qui améliorent considérablement les performances en aval, notamment sur les problèmes complexes. QwQ-32B est un modèle de raisonnement de taille moyenne qui rivalise avec les meilleurs modèles comme DeepSeek-R1 et o1-mini.",
@@ -1187,7 +1190,7 @@
"step-2-16k.description": "Prend en charge les interactions à long contexte pour des dialogues complexes.",
"step-2-mini.description": "Basé sur larchitecture dattention MFA de nouvelle génération, offrant des résultats comparables à Step-1 à un coût bien inférieur, avec un débit plus élevé et une latence réduite. Gère les tâches générales avec de solides capacités de codage.",
"step-2x-large.description": "Nouveau modèle dimage StepFun axé sur la génération dimages de haute qualité à partir de requêtes textuelles. Il offre des textures plus réalistes et un meilleur rendu du texte en chinois et en anglais.",
"step-3.5-flash.description": "Le modèle phare de raisonnement linguistique de Stepfun. Ce modèle offre des capacités de raisonnement de premier ordre ainsi qu'une exécution rapide et fiable. Il peut décomposer et planifier des tâches complexes, invoquer rapidement et de manière fiable des outils pour les exécuter, et excelle dans le raisonnement logique, les mathématiques, l'ingénierie logicielle, la recherche approfondie et d'autres tâches sophistiquées. La longueur du contexte est de 256K.",
"step-3.5-flash.description": "Le modèle phare de raisonnement linguistique de Stepfun. Ce modèle possède des capacités de raisonnement de premier ordre et des capacités d'exécution rapides et fiables. Capable de décomposer et de planifier des tâches complexes, d'appeler des outils rapidement et de manière fiable pour exécuter des tâches, et compétent dans diverses tâches complexes telles que le raisonnement logique, les mathématiques, l'ingénierie logicielle et la recherche approfondie.",
"step-3.description": "Ce modèle possède une forte perception visuelle et un raisonnement complexe, gérant avec précision la compréhension interdomaines, lanalyse mathématique-visuelle croisée et une large gamme de tâches danalyse visuelle quotidienne.",
"step-r1-v-mini.description": "Modèle de raisonnement avec une forte compréhension dimage, capable de traiter des images et du texte, puis de générer du texte après un raisonnement approfondi. Il excelle en raisonnement visuel et offre des performances de haut niveau en mathématiques, codage et raisonnement textuel, avec une fenêtre de contexte de 100K.",
"stepfun-ai/step3.description": "Step3 est un modèle de raisonnement multimodal de pointe de StepFun, basé sur une architecture MoE avec 321B paramètres totaux et 38B actifs. Son design de bout en bout réduit les coûts de décodage tout en offrant un raisonnement vision-langage de haut niveau. Grâce aux conceptions MFA et AFD, il reste efficace sur les accélérateurs haut de gamme comme sur les plus modestes. Lentraînement préliminaire utilise plus de 20T de tokens texte et 4T de tokens image-texte dans de nombreuses langues. Il atteint des performances de premier plan sur les benchmarks ouverts en mathématiques, code et multimodalité.",
@@ -1276,10 +1279,11 @@
"z-ai/glm4.7.description": "GLM-4.7 est le dernier modèle phare de Zhipu, amélioré pour les scénarios de codage agentique avec des capacités de codage renforcées.",
"z-ai/glm5.description": "GLM-5 est le nouveau modèle phare de Zhipu AI pour l'ingénierie des agents, atteignant des performances SOTA open-source en codage et capacités d'agent. Il égale Claude Opus 4.5 en performance.",
"z-image-turbo.description": "Z-Image est un modèle léger de génération de texte en image qui peut produire rapidement des images, prend en charge le rendu de texte en chinois et en anglais, et s'adapte de manière flexible à plusieurs résolutions et rapports d'aspect.",
"zai-glm-4.7.description": "Ce modèle offre de solides performances en codage avec des capacités de raisonnement avancées, une utilisation supérieure des outils et des performances réelles améliorées dans les applications de codage agentiques.",
"zai-org/GLM-4.5-Air.description": "GLM-4.5-Air est un modèle de base pour les applications dagents utilisant une architecture Mixture-of-Experts. Il est optimisé pour lutilisation doutils, la navigation web, lingénierie logicielle et le codage frontend, et sintègre avec des agents de code comme Claude Code et Roo Code. Il utilise un raisonnement hybride pour gérer à la fois les scénarios complexes et quotidiens.",
"zai-org/GLM-4.5.description": "GLM-4.5 est un modèle de base conçu pour les applications dagents utilisant une architecture Mixture-of-Experts. Il est profondément optimisé pour lutilisation doutils, la navigation web, lingénierie logicielle et le codage frontend, et sintègre avec des agents de code comme Claude Code et Roo Code. Il utilise un raisonnement hybride pour gérer à la fois les scénarios complexes et quotidiens.",
"zai-org/GLM-4.5V.description": "GLM-4.5V est le dernier VLM de Zhipu AI, basé sur le modèle texte phare GLM-4.5-Air (106B total, 12B actifs) avec une architecture MoE pour de hautes performances à moindre coût. Il suit la voie GLM-4.1V-Thinking et ajoute 3D-RoPE pour améliorer le raisonnement spatial 3D. Optimisé par pré-entraînement, SFT et RL, il gère images, vidéos et documents longs, et se classe parmi les meilleurs modèles open source sur 41 benchmarks multimodaux publics. Un mode Thinking permet d’équilibrer vitesse et profondeur.",
"zai-org/GLM-4.6.description": "Par rapport à GLM-4.5, GLM-4.6 étend le contexte de 128K à 200K pour des tâches dagents plus complexes. Il obtient de meilleurs scores sur les benchmarks de code et montre de meilleures performances réelles dans des applications comme Claude Code, Cline, Roo Code et Kilo Code, y compris une meilleure génération de pages frontend. Le raisonnement est amélioré et lutilisation doutils est prise en charge pendant le raisonnement, renforçant les capacités globales. Il sintègre mieux aux frameworks dagents, améliore les agents de recherche/outils et offre un style d’écriture plus naturel et apprécié des utilisateurs.",
"zai-org/GLM-4.6V.description": "GLM-4.6V atteint une précision de compréhension visuelle SOTA pour une échelle de paramètres similaire et intègre pour la première fois dans l'architecture du modèle la capacité d'appel de fonction (utilisation d'outils) de manière native dans un modèle visuel, reliant la « perception visuelle » à la « action exécutable » pour fournir une base technologique unifiée aux agents multimodaux dans des scénarios commerciaux réels.",
"zai/glm-4.5-air.description": "GLM-4.5 et GLM-4.5-Air sont nos derniers modèles phares pour les applications dagents, tous deux utilisant MoE. GLM-4.5 a 355B au total et 32B actifs par passage ; GLM-4.5-Air est plus léger avec 106B au total et 12B actifs.",
"zai/glm-4.5.description": "La série GLM-4.5 est conçue pour les agents. Le modèle phare GLM-4.5 combine raisonnement, codage et compétences dagent avec 355B de paramètres totaux (32B actifs) et offre deux modes de fonctionnement en tant que système de raisonnement hybride.",
"zai/glm-4.5v.description": "GLM-4.5V est basé sur GLM-4.5-Air, héritant des techniques éprouvées de GLM-4.1V-Thinking et sappuyant sur une architecture MoE puissante de 106B paramètres.",
+14
View File
@@ -24,6 +24,20 @@
"builtins.lobe-agent-builder.inspector.noResults": "Aucun résultat",
"builtins.lobe-agent-builder.inspector.togglePlugin": "Basculer",
"builtins.lobe-agent-builder.title": "Expert en création d'agents",
"builtins.lobe-agent-management.apiName.callAgent": "Appeler un agent",
"builtins.lobe-agent-management.apiName.createAgent": "Créer un agent",
"builtins.lobe-agent-management.apiName.deleteAgent": "Supprimer un agent",
"builtins.lobe-agent-management.apiName.searchAgent": "Rechercher des agents",
"builtins.lobe-agent-management.apiName.updateAgent": "Mettre à jour un agent",
"builtins.lobe-agent-management.inspector.callAgent.sync": "Appel en cours :",
"builtins.lobe-agent-management.inspector.callAgent.task": "Attribuer une tâche à :",
"builtins.lobe-agent-management.inspector.createAgent.title": "Création de l'agent :",
"builtins.lobe-agent-management.inspector.searchAgent.all": "Rechercher des agents :",
"builtins.lobe-agent-management.inspector.searchAgent.market": "Rechercher sur le marché :",
"builtins.lobe-agent-management.inspector.searchAgent.results": "{{count}} résultats",
"builtins.lobe-agent-management.inspector.searchAgent.user": "Rechercher mes agents :",
"builtins.lobe-agent-management.inspector.updateAgent.title": "Mise à jour de l'agent :",
"builtins.lobe-agent-management.title": "Gestionnaire d'agents",
"builtins.lobe-cloud-sandbox.apiName.editLocalFile": "Modifier le fichier",
"builtins.lobe-cloud-sandbox.apiName.executeCode": "Exécuter le code",
"builtins.lobe-cloud-sandbox.apiName.exportFile": "Exporter le fichier",
+3
View File
@@ -724,6 +724,9 @@
"tools.builtins.lobe-artifacts.description": "Générez et prévisualisez en direct des composants d'interface interactifs, des visualisations de données, des graphiques, des illustrations SVG et des applications web. Créez du contenu visuel riche avec lequel les utilisateurs peuvent interagir directement.",
"tools.builtins.lobe-artifacts.readme": "Générez et prévisualisez en direct des composants d'interface utilisateur interactifs, des visualisations de données, des graphiques, des illustrations SVG et des applications web. Créez du contenu visuel riche avec lequel les utilisateurs peuvent interagir directement.",
"tools.builtins.lobe-artifacts.title": "Artefacts",
"tools.builtins.lobe-calculator.description": "Effectuez des calculs mathématiques, résolvez des équations et travaillez avec des expressions symboliques",
"tools.builtins.lobe-calculator.readme": "Calculatrice mathématique avancée prenant en charge l'arithmétique de base, les équations algébriques, les opérations de calcul et les mathématiques symboliques. Inclut la conversion de base, la résolution d'équations, la différentiation, l'intégration et plus encore.",
"tools.builtins.lobe-calculator.title": "Calculatrice",
"tools.builtins.lobe-cloud-sandbox.description": "Exécutez du code Python, JavaScript et TypeScript dans un environnement cloud isolé. Lancez des commandes shell, gérez des fichiers, recherchez du contenu avec des expressions régulières et exportez les résultats en toute sécurité.",
"tools.builtins.lobe-cloud-sandbox.readme": "Exécutez du code Python, JavaScript et TypeScript dans un environnement cloud isolé. Lancez des commandes shell, gérez des fichiers, effectuez des recherches avec des expressions régulières et exportez les résultats en toute sécurité.",
"tools.builtins.lobe-cloud-sandbox.title": "Bac à sable cloud",
+6 -2
View File
@@ -224,15 +224,18 @@
"providerModels.item.modelConfig.extendParams.options.gpt5_2ProReasoningEffort.hint": "Per la serie GPT-5.2 Pro; controlla l'intensità del ragionamento.",
"providerModels.item.modelConfig.extendParams.options.gpt5_2ReasoningEffort.hint": "Per la serie GPT-5.2; controlla l'intensità del ragionamento.",
"providerModels.item.modelConfig.extendParams.options.imageAspectRatio.hint": "Per i modelli di generazione immagini Gemini; controlla il rapporto d'aspetto delle immagini generate.",
"providerModels.item.modelConfig.extendParams.options.imageAspectRatio2.hint": "Per Nano Banana 2; controlla il rapporto d'aspetto delle immagini generate (supporta extra-wide 1:4, 4:1, 1:8, 8:1).",
"providerModels.item.modelConfig.extendParams.options.imageResolution.hint": "Per i modelli di generazione immagini Gemini 3; controlla la risoluzione delle immagini generate.",
"providerModels.item.modelConfig.extendParams.options.imageResolution2.hint": "Per i modelli Gemini 3.1 Flash Image; controlla la risoluzione delle immagini generate (supporta 512px).",
"providerModels.item.modelConfig.extendParams.options.reasoningBudgetToken.hint": "Per Claude, Qwen3 e simili; controlla il budget di token per il ragionamento.",
"providerModels.item.modelConfig.extendParams.options.reasoningEffort.hint": "Per OpenAI e altri modelli con capacità di ragionamento; controlla lo sforzo di ragionamento.",
"providerModels.item.modelConfig.extendParams.options.textVerbosity.hint": "Per la serie GPT-5+; controlla la verbosità dell'output.",
"providerModels.item.modelConfig.extendParams.options.thinking.hint": "Per alcuni modelli Doubao; consente al modello di decidere se pensare in profondità.",
"providerModels.item.modelConfig.extendParams.options.thinkingBudget.hint": "Per la serie Gemini; controlla il budget di pensiero.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel.hint": "Per i modelli Gemini 3 Flash Preview; controlla la profondità del pensiero.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel2.hint": "Per i modelli Gemini 3 Pro Preview; controlla la profondità del pensiero.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel.hint": "Per i modelli Gemini 3 Flash Preview; controlla la profondità di pensiero.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel2.hint": "Per i modelli Gemini 3 Pro Preview; controlla la profondità di pensiero.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel3.hint": "Per i modelli Gemini 3.1 Pro Preview; controlla la profondità di pensiero con livelli basso/medio/alto.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel4.hint": "Per i modelli Gemini 3.1 Flash Image; attiva/disattiva il pensiero.",
"providerModels.item.modelConfig.extendParams.options.urlContext.hint": "Per la serie Gemini; supporta il contesto tramite URL.",
"providerModels.item.modelConfig.extendParams.placeholder": "Seleziona i parametri estesi da abilitare",
"providerModels.item.modelConfig.extendParams.previewFallback": "Anteprima non disponibile",
@@ -311,6 +314,7 @@
"providerModels.tabs.image": "Immagine",
"providerModels.tabs.stt": "ASR",
"providerModels.tabs.tts": "TTS",
"providerModels.tabs.video": "Video",
"sortModal.success": "Ordinamento aggiornato con successo",
"sortModal.title": "Ordine personalizzato",
"sortModal.update": "Aggiorna",
+35 -31
View File
@@ -55,7 +55,8 @@
"FLUX.1-dev.description": "FLUX.1-dev è un modello linguistico multimodale open-source (MLLM) di Black Forest Labs, ottimizzato per compiti immagine-testo e in grado di comprendere e generare contenuti visivi e testuali. Basato su LLM avanzati (come Mistral-7B), utilizza un encoder visivo progettato con cura e un tuning a più stadi per abilitare il coordinamento multimodale e il ragionamento su compiti complessi.",
"Gryphe/MythoMax-L2-13b.description": "MythoMax-L2 (13B) è un modello innovativo per domini diversificati e compiti complessi.",
"HelloMeme.description": "HelloMeme è uno strumento AI che genera meme, GIF o brevi video a partire da immagini o movimenti forniti. Non richiede abilità di disegno o programmazione: basta un'immagine di riferimento per creare contenuti divertenti, accattivanti e stilisticamente coerenti.",
"HiDream-I1-Full.description": "HiDream-E1-Full è un modello open-source per l'editing multimodale di immagini sviluppato da HiDream.ai, basato su un'architettura Diffusion Transformer avanzata e una solida comprensione linguistica (con LLaMA 3.1-8B-Instruct integrato). Supporta generazione di immagini guidata da linguaggio naturale, trasferimento di stile, modifiche locali e ritinteggiatura, con eccellente comprensione ed esecuzione immagine-testo.",
"HiDream-E1-Full.description": "HiDream-E1-Full è un modello open-source per l'editing di immagini multimodale di HiDream.ai, basato su un'architettura avanzata Diffusion Transformer e una forte comprensione del linguaggio (LLaMA 3.1-8B-Instruct integrato). Supporta la generazione di immagini guidata dal linguaggio naturale, il trasferimento di stile, modifiche locali e ritocchi, con un'eccellente comprensione ed esecuzione immagine-testo.",
"HiDream-I1-Full.description": "HiDream-I1 è un nuovo modello open-source per la generazione di immagini rilasciato da HiDream. Con 17 miliardi di parametri (Flux ne ha 12 miliardi), può offrire una qualità d'immagine leader nel settore in pochi secondi.",
"HunyuanDiT-v1.2-Diffusers-Distilled.description": "hunyuandit-v1.2-distilled è un modello leggero text-to-image ottimizzato tramite distillazione per generare immagini di alta qualità in modo rapido, particolarmente adatto ad ambienti con risorse limitate e generazione in tempo reale.",
"InstantCharacter.description": "InstantCharacter è un modello di generazione di personaggi personalizzati senza tuning, rilasciato da Tencent AI nel 2025, progettato per una generazione fedele e coerente di personaggi in diversi scenari. Può modellare un personaggio da una singola immagine di riferimento e trasferirlo con flessibilità tra stili, azioni e sfondi.",
"InternVL2-8B.description": "InternVL2-8B è un potente modello visione-linguaggio che supporta l'elaborazione multimodale immagine-testo, riconoscendo accuratamente i contenuti visivi e generando descrizioni o risposte pertinenti.",
@@ -80,7 +81,7 @@
"MiniMax-M2.1.description": "MiniMax-M2.1 è un modello open-source di punta di MiniMax, progettato per affrontare compiti complessi del mondo reale. I suoi punti di forza principali sono le capacità di programmazione multilingue e la risoluzione di compiti complessi come agente.",
"MiniMax-M2.5-Lightning.description": "M2.5 Lightning: Stessa prestazione, più veloce e agile (circa 100 tps).",
"MiniMax-M2.5-highspeed.description": "Stessa prestazione del M2.5 con inferenza significativamente più veloce.",
"MiniMax-M2.5.description": "Prestazioni di alto livello e massima convenienza economica, gestisce facilmente compiti complessi (circa 60 tps).",
"MiniMax-M2.5.description": "MiniMax-M2.5 è un modello open-source di punta di MiniMax, focalizzato sulla risoluzione di compiti complessi del mondo reale. I suoi punti di forza principali sono le capacità di programmazione multilingue e la capacità di risolvere compiti complessi come un Agente.",
"MiniMax-M2.description": "Progettato specificamente per una programmazione efficiente e flussi di lavoro con agenti",
"MiniMax-Text-01.description": "MiniMax-01 introduce l'attenzione lineare su larga scala oltre i Transformer classici, con 456B parametri e 45,9B attivati per passaggio. Raggiunge prestazioni di alto livello e supporta fino a 4M token di contesto (32× GPT-4o, 20× Claude-3.5-Sonnet).",
"MiniMaxAI/MiniMax-M1-80k.description": "MiniMax-M1 è un modello di ragionamento ibrido su larga scala con pesi open, 456B parametri totali e ~45,9B attivi per token. Supporta nativamente 1M di contesto e utilizza Flash Attention per ridurre i FLOPs del 75% nella generazione di 100K token rispetto a DeepSeek R1. Con architettura MoE, CISPO e addestramento RL ibrido, raggiunge prestazioni leader su ragionamento con input lunghi e compiti reali di ingegneria del software.",
@@ -98,6 +99,7 @@
"Phi-3.5-mini-instruct.description": "Una versione aggiornata del modello Phi-3-mini.",
"Phi-3.5-vision-instrust.description": "Una versione aggiornata del modello Phi-3-vision.",
"Pro/MiniMaxAI/MiniMax-M2.1.description": "MiniMax-M2.1 è un modello linguistico di grandi dimensioni open-source ottimizzato per capacità agentiche, eccellente nella programmazione, nell'uso di strumenti, nel seguire istruzioni e nella pianificazione a lungo termine. Supporta lo sviluppo software multilingue e l'esecuzione di flussi di lavoro complessi a più fasi, ottenendo un punteggio di 74,0 su SWE-bench Verified e superando Claude Sonnet 4.5 in scenari multilingue.",
"Pro/MiniMaxAI/MiniMax-M2.5.description": "MiniMax-M2.5 è l'ultimo modello linguistico di grandi dimensioni sviluppato da MiniMax, addestrato attraverso l'apprendimento per rinforzo su larga scala in centinaia di migliaia di ambienti complessi del mondo reale. Con un'architettura MoE e 229 miliardi di parametri, raggiunge prestazioni leader nel settore in compiti come programmazione, utilizzo di strumenti da parte di agenti, ricerca e scenari d'ufficio.",
"Pro/Qwen/Qwen2-7B-Instruct.description": "Qwen2-7B-Instruct è un LLM da 7B parametri ottimizzato per istruzioni nella serie Qwen2. Utilizza un'architettura Transformer con SwiGLU, bias QKV per l'attenzione e grouped-query attention, ed è in grado di gestire input di grandi dimensioni. Eccelle in comprensione linguistica, generazione, compiti multilingue, programmazione, matematica e ragionamento, superando la maggior parte dei modelli open-source e competendo con quelli proprietari. Supera Qwen1.5-7B-Chat in diversi benchmark.",
"Pro/Qwen/Qwen2.5-7B-Instruct.description": "Qwen2.5-7B-Instruct fa parte della nuova serie LLM di Alibaba Cloud. Il modello da 7B offre miglioramenti significativi in programmazione e matematica, supporta oltre 29 lingue e migliora il rispetto delle istruzioni, la comprensione dei dati strutturati e la generazione di output strutturati (in particolare JSON).",
"Pro/Qwen/Qwen2.5-Coder-7B-Instruct.description": "Qwen2.5-Coder-7B-Instruct è l'ultimo LLM di Alibaba Cloud focalizzato sul codice. Basato su Qwen2.5 e addestrato su 5,5T token, migliora notevolmente la generazione, il ragionamento e la correzione del codice, mantenendo al contempo le capacità matematiche e generali, fornendo una solida base per agenti di programmazione.",
@@ -107,13 +109,13 @@
"Pro/deepseek-ai/DeepSeek-R1-Distill-Qwen-7B.description": "DeepSeek-R1-Distill-Qwen-7B è distillato da Qwen2.5-Math-7B e ottimizzato su 800K campioni curati DeepSeek-R1. Ottiene ottimi risultati: 92,8% su MATH-500, 55,5% su AIME 2024 e un punteggio CodeForces di 1189 per un modello da 7B.",
"Pro/deepseek-ai/DeepSeek-R1.description": "DeepSeek-R1 è un modello di ragionamento guidato da RL che riduce la ripetizione e migliora la leggibilità. Utilizza dati cold-start prima del RL per potenziare ulteriormente il ragionamento, eguaglia OpenAI-o1 in compiti di matematica, codice e ragionamento, migliorando i risultati complessivi grazie a un addestramento accurato.",
"Pro/deepseek-ai/DeepSeek-V3.1-Terminus.description": "DeepSeek-V3.1-Terminus è una versione aggiornata del modello V3.1, posizionato come LLM ibrido per agenti. Risolve problemi segnalati dagli utenti e migliora la stabilità, la coerenza linguistica e riduce caratteri anomali e misti cinese/inglese. Integra modalità di pensiero e non-pensiero con template di chat per passaggi flessibili. Migliora anche le prestazioni di Code Agent e Search Agent per un uso più affidabile degli strumenti e compiti multi-step.",
"Pro/deepseek-ai/DeepSeek-V3.2-Exp.description": "DeepSeek-V3.2-Exp è una versione sperimentale della serie V3.2 che fa da ponte verso la prossima architettura. Aggiunge DeepSeek Sparse Attention (DSA) sopra V3.1-Terminus per migliorare l'efficienza nell'addestramento e inferenza su contesti lunghi, con ottimizzazioni per l'uso di strumenti, comprensione di documenti lunghi e ragionamento multi-step. Ideale per esplorare una maggiore efficienza di ragionamento con budget di contesto elevati.",
"Pro/deepseek-ai/DeepSeek-V3.2.description": "DeepSeek-V3.2 è un modello che combina un'elevata efficienza computazionale con eccellenti capacità di ragionamento e prestazioni come Agente. Il suo approccio si basa su tre principali innovazioni tecnologiche: DeepSeek Sparse Attention (DSA), un meccanismo di attenzione efficiente che riduce significativamente la complessità computazionale mantenendo le prestazioni del modello, ottimizzato specificamente per scenari a lungo contesto; un framework di apprendimento per rinforzo scalabile, attraverso il quale le prestazioni del modello possono competere con GPT-5, e la sua versione ad alta capacità computazionale può competere con Gemini-3.0-Pro nelle capacità di ragionamento; e una pipeline di sintesi di compiti per Agenti su larga scala, progettata per integrare le capacità di ragionamento negli scenari di utilizzo degli strumenti, migliorando così il rispetto delle istruzioni e la generalizzazione in ambienti interattivi complessi. Il modello ha ottenuto medaglie d'oro nelle Olimpiadi Internazionali di Matematica (IMO) e nelle Olimpiadi Internazionali di Informatica (IOI) del 2025.",
"Pro/deepseek-ai/DeepSeek-V3.description": "DeepSeek-V3 è un modello MoE da 671B parametri che utilizza MLA e DeepSeekMoE con bilanciamento del carico senza perdite per un'inferenza e addestramento efficienti. Preaddestrato su 14,8T token di alta qualità e ulteriormente ottimizzato con SFT e RL, supera altri modelli open-source e si avvicina ai modelli chiusi leader.",
"Pro/moonshotai/Kimi-K2-Instruct-0905.description": "Kimi K2-Instruct-0905 è la versione più recente e potente di Kimi K2. È un modello MoE di fascia alta con 1T di parametri totali e 32B attivi. Le caratteristiche principali includono un'intelligenza di codifica agentica più forte con miglioramenti significativi nei benchmark e nei compiti reali da agente, oltre a una migliore estetica e usabilità del codice frontend.",
"Pro/moonshotai/Kimi-K2-Thinking.description": "Kimi K2 Thinking Turbo è la variante Turbo ottimizzata per velocità di ragionamento e throughput, mantenendo il ragionamento multi-step e l'uso di strumenti di K2 Thinking. È un modello MoE con ~1T parametri totali, contesto nativo da 256K e chiamata stabile di strumenti su larga scala per scenari di produzione con requisiti più severi di latenza e concorrenza.",
"Pro/moonshotai/Kimi-K2.5.description": "Kimi K2.5 è un modello agente multimodale nativo open-source, basato su Kimi-K2-Base, addestrato su circa 1,5 trilioni di token misti visivi e testuali. Il modello adotta un'architettura MoE con 1T di parametri totali e 32B attivi, supporta una finestra di contesto di 256K e integra perfettamente le capacità di comprensione visiva e linguistica.",
"Pro/zai-org/glm-4.7.description": "GLM-4.7 è il modello di punta di nuova generazione di Zhipu, con 355 miliardi di parametri totali e 32 miliardi di parametri attivi, completamente aggiornato nelle capacità di dialogo generale, ragionamento e agenti. GLM-4.7 migliora il Pensiero Intercalato e introduce il Pensiero Conservato e il Pensiero a Livello di Turno.",
"Pro/zai-org/glm-5.description": "GLM-5 è il nuovo modello di linguaggio avanzato di Zhipu, focalizzato sull'ingegneria di sistemi complessi e sui compiti di agenti a lungo termine. I parametri del modello sono stati ampliati a 744B (40B attivi) e integrano DeepSeek Sparse Attention.",
"Pro/zai-org/glm-5.description": "GLM-5 è il modello linguistico di prossima generazione di Zhipu, focalizzato sull'ingegneria di sistemi complessi e sui compiti di lunga durata per Agenti. I parametri del modello sono stati ampliati a 744 miliardi (40 miliardi attivi) e integrano DeepSeek Sparse Attention.",
"QwQ-32B-Preview.description": "Qwen QwQ è un modello di ricerca sperimentale focalizzato sul miglioramento del ragionamento.",
"Qwen/QVQ-72B-Preview.description": "QVQ-72B-Preview è un modello di ricerca del team Qwen focalizzato sul ragionamento visivo, con punti di forza nella comprensione di scene complesse e nella risoluzione di problemi visivi di matematica.",
"Qwen/QwQ-32B-Preview.description": "Qwen QwQ è un modello di ricerca sperimentale focalizzato sul miglioramento del ragionamento dell'IA.",
@@ -137,7 +139,7 @@
"Qwen/Qwen3-14B.description": "Qwen3 è un modello Tongyi Qwen di nuova generazione con importanti miglioramenti nel ragionamento, nelle capacità generali, nelle funzionalità agentiche e nelle prestazioni multilingue, e supporta la commutazione tra modalità di pensiero.",
"Qwen/Qwen3-235B-A22B-Instruct-2507.description": "Qwen3-235B-A22B-Instruct-2507 è un modello di punta della serie Qwen3 MoE con 235 miliardi di parametri totali e 22 miliardi attivi. È una versione aggiornata non pensante, focalizzata sul miglioramento del seguito delle istruzioni, del ragionamento logico, della comprensione del testo, della matematica, della scienza, della programmazione e dell'uso degli strumenti. Amplia inoltre la conoscenza multilingue di nicchia e si allinea meglio alle preferenze degli utenti nei compiti soggettivi e aperti.",
"Qwen/Qwen3-235B-A22B-Thinking-2507.description": "Qwen3-235B-A22B-Thinking-2507 è un modello Qwen3 progettato per il ragionamento complesso e avanzato. Utilizza un'architettura MoE con 235 miliardi di parametri totali e circa 22 miliardi attivi per token, ottimizzando l'efficienza. In quanto modello dedicato al pensiero, mostra miglioramenti significativi in logica, matematica, scienza, programmazione e benchmark accademici, raggiungendo prestazioni di alto livello nel pensiero aperto. Migliora anche il seguito delle istruzioni, l'uso degli strumenti e la generazione di testo, supportando nativamente un contesto di 256K per ragionamenti profondi e documenti lunghi.",
"Qwen/Qwen3-235B-A22B.description": "Qwen3 è un modello Tongyi Qwen di nuova generazione con importanti progressi nel ragionamento, nelle capacità generali, nelle funzionalità agentiche e nelle prestazioni multilingue, e supporta la commutazione tra modalità di pensiero.",
"Qwen/Qwen3-235B-A22B.description": "Qwen3 235B A22B è il modello ultra-scala di Qwen3 che offre capacità AI di altissimo livello.",
"Qwen/Qwen3-30B-A3B-Instruct-2507.description": "Qwen3-30B-A3B-Instruct-2507 è la versione aggiornata non pensante di Qwen3-30B-A3B. È un modello MoE con 30,5 miliardi di parametri totali e 3,3 miliardi attivi. Migliora significativamente il seguito delle istruzioni, il ragionamento logico, la comprensione del testo, la matematica, la scienza, la programmazione e l'uso degli strumenti, amplia la conoscenza multilingue di nicchia e si allinea meglio alle preferenze degli utenti nei compiti soggettivi aperti. Supporta un contesto di 256K. Questo modello è esclusivamente non pensante e non genera tag `<think></think>`.",
"Qwen/Qwen3-30B-A3B-Thinking-2507.description": "Qwen3-30B-A3B-Thinking-2507 è l'ultimo modello pensante della serie Qwen3. È un modello MoE con 30,5 miliardi di parametri totali e 3,3 miliardi attivi, progettato per compiti complessi. Mostra miglioramenti significativi in logica, matematica, scienza, programmazione e benchmark accademici, e migliora il seguito delle istruzioni, l'uso degli strumenti, la generazione di testo e l'allineamento alle preferenze. Supporta nativamente un contesto di 256K ed è estendibile fino a 1 milione di token. Questa versione è progettata per la modalità pensante, con ragionamento dettagliato passo dopo passo e forti capacità agentiche.",
"Qwen/Qwen3-30B-A3B.description": "Qwen3 è un modello Tongyi Qwen di nuova generazione con importanti progressi nel ragionamento, nelle capacità generali, nelle funzionalità agentiche e nelle prestazioni multilingue, e supporta la commutazione tra modalità di pensiero.",
@@ -315,7 +317,6 @@
"codeqwen.description": "CodeQwen1.5 è un modello linguistico di grandi dimensioni addestrato su un ampio set di dati di codice, progettato per compiti di programmazione complessi.",
"codestral-latest.description": "Codestral è il nostro modello di codifica più avanzato; la versione v2 (gennaio 2025) è pensata per compiti a bassa latenza e alta frequenza come FIM, correzione del codice e generazione di test.",
"codestral.description": "Codestral è il primo modello di codice di Mistral AI, che offre un forte supporto alla generazione di codice.",
"codex-mini-latest.description": "codex-mini-latest è un modello o4-mini ottimizzato per Codex CLI. Per l'uso diretto via API, si consiglia di iniziare con gpt-4.1.",
"cogito-2.1:671b.description": "Cogito v2.1 671B è un LLM open-source statunitense gratuito per uso commerciale, con prestazioni paragonabili ai modelli di punta, maggiore efficienza nel ragionamento sui token, contesto lungo da 128k e capacità complessive elevate.",
"cogview-3-flash.description": "CogView-3-Flash è un modello gratuito di generazione di immagini lanciato da Zhipu. Genera immagini che si allineano alle istruzioni degli utenti, raggiungendo al contempo punteggi di qualità estetica più elevati. CogView-3-Flash è utilizzato principalmente in campi come la creazione artistica, il riferimento per il design, lo sviluppo di giochi e la realtà virtuale, aiutando gli utenti a convertire rapidamente descrizioni testuali in immagini.",
"cogview-4.description": "CogView-4 è il primo modello open-source di testo-immagine di Zhipu in grado di generare caratteri cinesi. Migliora la comprensione semantica, la qualità delle immagini e la resa del testo in cinese/inglese, supporta prompt bilingue di lunghezza arbitraria e può generare immagini a qualsiasi risoluzione entro intervalli specificati.",
@@ -342,7 +343,7 @@
"command-light-nightly.description": "Per ridurre il tempo tra le versioni principali, offriamo build notturne di Command. Per la serie command-light si chiama command-light-nightly. È la versione più recente ed esperimentale (potenzialmente instabile), aggiornata regolarmente senza preavviso, quindi non è consigliata per ambienti di produzione.",
"command-light.description": "Una variante Command più piccola e veloce, quasi altrettanto capace ma più rapida.",
"command-nightly.description": "Per ridurre il tempo tra le versioni principali, offriamo build notturne di Command. Per la serie Command si chiama command-nightly. È la versione più recente ed esperimentale (potenzialmente instabile), aggiornata regolarmente senza preavviso, quindi non è consigliata per ambienti di produzione.",
"command-r-03-2024.description": "Command R è un modello di chat che segue istruzioni, con qualità superiore, maggiore affidabilità e una finestra di contesto più lunga rispetto ai modelli precedenti. Supporta flussi di lavoro complessi come generazione di codice, RAG, uso di strumenti e agenti.",
"command-r-03-2024.description": "command-r è un modello di chat che segue le istruzioni e svolge compiti linguistici con qualità superiore, maggiore affidabilità e contesto più lungo rispetto ai modelli precedenti. Supporta flussi di lavoro complessi come generazione di codice, RAG, utilizzo di strumenti e agenti.",
"command-r-08-2024.description": "command-r-08-2024 è una versione aggiornata del modello Command R rilasciata ad agosto 2024.",
"command-r-plus-04-2024.description": "command-r-plus è un alias di command-r-plus-04-2024, quindi usare command-r-plus nell'API punta a quel modello.",
"command-r-plus-08-2024.description": "Command R+ è un modello di chat che segue istruzioni, con qualità superiore, maggiore affidabilità e una finestra di contesto più lunga rispetto ai modelli precedenti. È ideale per flussi di lavoro RAG complessi e uso multi-step di strumenti.",
@@ -366,7 +367,8 @@
"deepseek-ai/DeepSeek-V2.5.description": "DeepSeek-V2.5 aggiorna DeepSeek-V2-Chat e DeepSeek-Coder-V2-Instruct, combinando capacità generali e di programmazione. Migliora la scrittura e il rispetto delle istruzioni per un migliore allineamento alle preferenze, con progressi significativi su AlpacaEval 2.0, ArenaHard, AlignBench e MT-Bench.",
"deepseek-ai/DeepSeek-V3.1-Terminus.description": "DeepSeek-V3.1-Terminus è una versione aggiornata del modello V3.1, concepito come agente ibrido LLM. Risolve problemi segnalati dagli utenti e migliora stabilità, coerenza linguistica e riduce caratteri anomali o misti cinese/inglese. Integra modalità di pensiero e non-pensiero con template di chat per passaggi flessibili. Migliora anche le prestazioni di Code Agent e Search Agent per un uso più affidabile degli strumenti e compiti multi-step.",
"deepseek-ai/DeepSeek-V3.1.description": "DeepSeek V3.1 utilizza un'architettura di ragionamento ibrida e supporta sia modalità di pensiero che non-pensiero.",
"deepseek-ai/DeepSeek-V3.2-Exp.description": "DeepSeek-V3.2-Exp è una versione sperimentale della serie V3.2 che fa da ponte verso la prossima architettura. Aggiunge DeepSeek Sparse Attention (DSA) sopra V3.1-Terminus per migliorare l'efficienza nell'addestramento e inferenza su contesti lunghi, con ottimizzazioni per l'uso di strumenti, comprensione di documenti lunghi e ragionamento multi-step. Ideale per esplorare una maggiore efficienza di ragionamento con budget di contesto estesi.",
"deepseek-ai/DeepSeek-V3.2-Exp.description": "DeepSeek V3.2 Exp utilizza un'architettura di ragionamento ibrida e supporta sia modalità di pensiero che non di pensiero.",
"deepseek-ai/DeepSeek-V3.2.description": "DeepSeek-V3.2 è un modello che combina un'elevata efficienza computazionale con eccellenti capacità di ragionamento e prestazioni come Agente. Il suo approccio si basa su tre principali innovazioni tecnologiche: DeepSeek Sparse Attention (DSA), un meccanismo di attenzione efficiente che riduce significativamente la complessità computazionale mantenendo le prestazioni del modello, ottimizzato specificamente per scenari a lungo contesto; un framework di apprendimento per rinforzo scalabile, attraverso il quale le prestazioni del modello possono competere con GPT-5, e la sua versione ad alta capacità computazionale può competere con Gemini-3.0-Pro nelle capacità di ragionamento; e una pipeline di sintesi di compiti per Agenti su larga scala, progettata per integrare le capacità di ragionamento negli scenari di utilizzo degli strumenti, migliorando così il rispetto delle istruzioni e la generalizzazione in ambienti interattivi complessi. Il modello ha ottenuto medaglie d'oro nelle Olimpiadi Internazionali di Matematica (IMO) e nelle Olimpiadi Internazionali di Informatica (IOI) del 2025.",
"deepseek-ai/DeepSeek-V3.description": "DeepSeek-V3 è un modello MoE con 671 miliardi di parametri che utilizza MLA e DeepSeekMoE con bilanciamento del carico senza perdite per un addestramento e inferenza efficienti. Preaddestrato su 14,8 trilioni di token di alta qualità con SFT e RL, supera altri modelli open-source e si avvicina ai modelli chiusi leader.",
"deepseek-ai/deepseek-llm-67b-chat.description": "DeepSeek LLM Chat (67B) è un modello innovativo che offre una profonda comprensione linguistica e interazione.",
"deepseek-ai/deepseek-v3.1-terminus.description": "DeepSeek V3.1 è un modello di nuova generazione per il ragionamento, con capacità avanzate di ragionamento complesso e chain-of-thought per compiti di analisi approfondita.",
@@ -433,6 +435,7 @@
"deepseek_r1_distill_llama_70b.description": "DeepSeek-R1-Distill-Llama-70B è distillato da Llama-3.3-70B-Instruct. Fa parte della serie DeepSeek-R1, è ottimizzato su campioni generati da DeepSeek-R1 e offre prestazioni elevate in matematica, programmazione e ragionamento.",
"deepseek_r1_distill_qwen_14b.description": "DeepSeek-R1-Distill-Qwen-14B è distillato da Qwen2.5-14B e ottimizzato su 800.000 campioni curati generati da DeepSeek-R1, offrendo un ragionamento solido.",
"deepseek_r1_distill_qwen_32b.description": "DeepSeek-R1-Distill-Qwen-32B è distillato da Qwen2.5-32B e ottimizzato su 800.000 campioni curati generati da DeepSeek-R1, eccellendo in matematica, programmazione e ragionamento.",
"devstral-2512.description": "Devstral 2 è un modello testuale a livello aziendale che eccelle nell'utilizzo di strumenti per esplorare basi di codice, modificare più file e alimentare agenti per l'ingegneria del software.",
"devstral-2:123b.description": "Devstral 2 123B eccelle nell'utilizzo di strumenti per esplorare basi di codice, modificare più file e supportare agenti di ingegneria del software.",
"doubao-1.5-lite-32k.description": "Doubao-1.5-lite è un nuovo modello leggero con risposta ultra-rapida, che offre qualità e latenza di livello superiore.",
"doubao-1.5-pro-256k.description": "Doubao-1.5-pro-256k è un aggiornamento completo di Doubao-1.5-Pro, con un miglioramento delle prestazioni complessive del 10%. Supporta una finestra contestuale di 256k e fino a 12k token in output, offrendo prestazioni superiori, una finestra più ampia e un ottimo rapporto qualità-prezzo per casi d'uso più ampi.",
@@ -546,10 +549,10 @@
"gemini-2.5-pro-preview-06-05.description": "Gemini 2.5 Pro Preview è il modello di ragionamento più avanzato di Google, in grado di ragionare su codice, matematica e problemi STEM, e analizzare grandi dataset, basi di codice e documenti con contesto esteso.",
"gemini-2.5-pro.description": "Gemini 2.5 Pro è il modello di ragionamento più avanzato di Google, in grado di ragionare su codice, matematica e problemi STEM, e analizzare grandi dataset, basi di codice e documenti con contesto esteso.",
"gemini-3-flash-preview.description": "Gemini 3 Flash è il modello più intelligente progettato per la velocità, che combina intelligenza all'avanguardia con un eccellente ancoraggio alla ricerca.",
"gemini-3-pro-image-preview.description": "Gemini 3 Pro Image (Nano Banana Pro) è il modello di generazione di immagini di Google, che supporta anche la conversazione multimodale.",
"gemini-3-pro-image-preview.description": "Gemini 3 Pro Image (Nano Banana Pro) è il modello di generazione di immagini di Google che supporta anche il dialogo multimodale.",
"gemini-3-pro-image-preview:image.description": "Gemini 3 Pro Image (Nano Banana Pro) è il modello di generazione di immagini di Google e supporta anche la chat multimodale.",
"gemini-3-pro-preview.description": "Gemini 3 Pro è il modello più potente di Google per agenti e codifica creativa, offrendo visuali più ricche e interazioni più profonde grazie a un ragionamento all'avanguardia.",
"gemini-3.1-flash-image-preview.description": "Gemini 3.1 Flash Image (Nano Banana 2) offre una qualità d'immagine di livello professionale a velocità Flash con supporto per chat multimodale.",
"gemini-3.1-flash-image-preview.description": "Gemini 3.1 Flash Image (Nano Banana 2) è il modello di generazione di immagini nativo più veloce di Google con supporto al pensiero, generazione e modifica di immagini conversazionali.",
"gemini-3.1-flash-image-preview:image.description": "Gemini 3.1 Flash Image (Nano Banana 2) offre una qualità d'immagine di livello professionale a velocità Flash con supporto per chat multimodale.",
"gemini-3.1-pro-preview.description": "Gemini 3.1 Pro Preview migliora Gemini 3 Pro con capacità di ragionamento avanzate e aggiunge supporto per un livello di pensiero medio.",
"gemini-flash-latest.description": "Ultima versione di Gemini Flash",
@@ -605,19 +608,15 @@
"google/gemini-2.0-flash-lite-001.description": "Gemini 2.0 Flash Lite è una variante leggera di Gemini con il ragionamento disattivato per impostazione predefinita per migliorare latenza e costi, ma può essere attivato tramite parametri.",
"google/gemini-2.0-flash-lite.description": "Gemini 2.0 Flash Lite offre funzionalità di nuova generazione tra cui velocità eccezionale, uso integrato di strumenti, generazione multimodale e una finestra di contesto da 1 milione di token.",
"google/gemini-2.0-flash.description": "Gemini 2.0 Flash è il modello di ragionamento ad alte prestazioni di Google per compiti multimodali estesi.",
"google/gemini-2.5-flash-image-free.description": "Gemini 2.5 Flash Image livello gratuito con generazione multimodale a quota limitata.",
"google/gemini-2.5-flash-image-preview.description": "Modello sperimentale Gemini 2.5 Flash con supporto alla generazione di immagini.",
"google/gemini-2.5-flash-image.description": "Gemini 2.5 Flash Image (Nano Banana) è il modello di generazione di immagini di Google con supporto alla conversazione multimodale.",
"google/gemini-2.5-flash-lite.description": "Gemini 2.5 Flash Lite è la variante leggera di Gemini 2.5, ottimizzata per latenza e costi, adatta a scenari ad alto volume.",
"google/gemini-2.5-flash-preview.description": "Gemini 2.5 Flash è il modello di punta più avanzato di Google, progettato per compiti complessi di ragionamento, programmazione, matematica e scienza. Include un sistema di 'pensiero' integrato per fornire risposte più accurate con elaborazione contestuale più fine.\n\nNota: questo modello ha due varianti — con e senza pensiero. Il prezzo dell'output varia significativamente a seconda che il pensiero sia attivato. Se scegli la variante standard (senza il suffisso ':thinking'), il modello eviterà esplicitamente di generare token di pensiero.\n\nPer utilizzare il pensiero e ricevere token di pensiero, devi selezionare la variante ':thinking', che comporta un costo maggiore per l'output.\n\nGemini 2.5 Flash può anche essere configurato tramite il parametro 'max reasoning tokens' come documentato (https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning).",
"google/gemini-2.5-flash-preview:thinking.description": "Gemini 2.5 Flash è il modello di punta più avanzato di Google, progettato per compiti complessi di ragionamento, programmazione, matematica e scienza. Include un sistema di 'pensiero' integrato per fornire risposte più accurate con elaborazione contestuale più fine.\n\nNota: questo modello ha due varianti — con e senza pensiero. Il prezzo dell'output varia significativamente a seconda che il pensiero sia attivato. Se scegli la variante standard (senza il suffisso ':thinking'), il modello eviterà esplicitamente di generare token di pensiero.\n\nPer utilizzare il pensiero e ricevere token di pensiero, devi selezionare la variante ':thinking', che comporta un costo maggiore per l'output.\n\nGemini 2.5 Flash può anche essere configurato tramite il parametro 'max reasoning tokens' come documentato (https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning).",
"google/gemini-2.5-flash.description": "Gemini 2.5 Flash (Lite/Pro/Flash) è la famiglia di modelli di Google che spazia da bassa latenza a ragionamento ad alte prestazioni.",
"google/gemini-2.5-pro-free.description": "Gemini 2.5 Pro livello gratuito offre generazione multimodale con contesto esteso a quota limitata, adatto per prove e flussi di lavoro leggeri.",
"google/gemini-2.5-flash.description": "Gemini 2.5 Flash è la famiglia di modelli di Google che spazia da bassa latenza a ragionamento ad alte prestazioni.",
"google/gemini-2.5-pro-preview.description": "Gemini 2.5 Pro Preview è il modello di pensiero più avanzato di Google per il ragionamento su problemi complessi in codice, matematica e STEM, e per l'analisi di grandi dataset, basi di codice e documenti con contesto esteso.",
"google/gemini-2.5-pro.description": "Gemini 2.5 Pro è il modello di ragionamento di punta di Google con supporto a contesto esteso per compiti complessi.",
"google/gemini-3-pro-image-preview-free.description": "Gemini 3 Pro Image livello gratuito con generazione multimodale a quota limitata.",
"google/gemini-3-pro-image-preview.description": "Gemini 3 Pro Image (Nano Banana Pro) è il modello di generazione di immagini di Google con supporto alla conversazione multimodale.",
"google/gemini-3-pro-preview-free.description": "Gemini 3 Pro Preview Free offre la stessa comprensione e ragionamento multimodale della versione standard, ma con limiti di quota e frequenza, ideale per prove e uso a bassa frequenza.",
"google/gemini-3-pro-preview.description": "Gemini 3 Pro è il modello di ragionamento multimodale di nuova generazione della famiglia Gemini, in grado di comprendere testo, audio, immagini e video, e di gestire compiti complessi e grandi basi di codice.",
"google/gemini-embedding-001.description": "Un modello di embedding all'avanguardia con prestazioni elevate in inglese, multilingua e compiti di programmazione.",
"google/gemini-flash-1.5.description": "Gemini 1.5 Flash offre un'elaborazione multimodale ottimizzata per una vasta gamma di compiti complessi.",
@@ -717,15 +716,24 @@
"hunyuan-a13b.description": "Il primo modello di ragionamento ibrido di Hunyuan, aggiornato da hunyuan-standard-256K (80B totali, 13B attivi). Di default utilizza un pensiero lento e supporta il passaggio veloce/lento tramite parametri o prefisso /no_think. Le capacità complessive sono migliorate rispetto alla generazione precedente, in particolare in matematica, scienza, comprensione di testi lunghi e compiti agentici.",
"hunyuan-code.description": "L'ultimo modello di codice di Hunyuan addestrato su 200 miliardi di dati di codice di alta qualità più sei mesi di dati SFT, con un contesto di 8K. Si posiziona ai vertici nei benchmark di codice automatizzati e nelle valutazioni umane esperte in cinque lingue.",
"hunyuan-functioncall.description": "L'ultimo modello MoE FunctionCall di Hunyuan addestrato su dati di chiamata di strumenti di alta qualità, con una finestra di contesto di 32K e benchmark leader in tutte le dimensioni.",
"hunyuan-large-longcontext.description": "Eccelle nei compiti su documenti lunghi come riassunti e domande/risposte, gestendo anche la generazione generale. Forte nell'analisi e generazione di testi lunghi per contenuti complessi e dettagliati.",
"hunyuan-large.description": "Hunyuan-large ha ~389 miliardi di parametri totali e ~52 miliardi attivati, il più grande e potente modello MoE open-source in un'architettura Transformer.",
"hunyuan-lite.description": "Aggiornato a un'architettura MoE con finestra di contesto da 256K, guida molti modelli open-source nei benchmark NLP, codice, matematica e industriali.",
"hunyuan-pro.description": "Modello MOE-32K a trilioni di parametri con contesto lungo, leader nei benchmark, forte in istruzioni complesse e ragionamento, matematica avanzata, chiamate funzione, e ottimizzato per traduzione multilingue, finanza, diritto e medicina.",
"hunyuan-role.description": "L'ultimo modello di roleplay di Hunyuan, ufficialmente ottimizzato con dati di roleplay, offre prestazioni di base più forti negli scenari di roleplay.",
"hunyuan-standard-256K.description": "Utilizza un routing migliorato per mitigare il bilanciamento del carico e il collasso degli esperti. Nei testi lunghi \"ago nel pagliaio\" raggiunge il 99,9%. MOE-256K spinge ulteriormente in lunghezza e qualità, espandendo notevolmente la lunghezza dell'input.",
"hunyuan-standard.description": "Utilizza un routing migliorato per mitigare il bilanciamento del carico e il collasso degli esperti. Nei testi lunghi \"ago nel pagliaio\" raggiunge il 99,9%. MOE-32K offre un miglior rapporto qualità-prezzo bilanciando qualità e prezzo per input di testi lunghi.",
"hunyuan-standard-256K.description": "Utilizza un routing migliorato per mitigare il bilanciamento del carico e il collasso degli esperti. Raggiunge il 99,9% di successo nel trovare l'ago nel pagliaio su contesti lunghi. MOE-256K espande ulteriormente la lunghezza e la qualità del contesto.",
"hunyuan-standard.description": "Utilizza un routing migliorato per mitigare il bilanciamento del carico e il collasso degli esperti. Raggiunge il 99,9% di successo nel trovare l'ago nel pagliaio su contesti lunghi. MOE-32K offre un grande valore gestendo input lunghi.",
"hunyuan-t1-20250321.description": "Sviluppa capacità bilanciate tra arti e STEM con una forte cattura di informazioni su testi lunghi. Supporta risposte di ragionamento per problemi di matematica, logica, scienza e codice a vari livelli di difficoltà.",
"hunyuan-t1-20250403.description": "Migliora la generazione di codice a livello di progetto e la qualità della scrittura, rafforza la comprensione di argomenti multi-turno e il rispetto delle istruzioni ToB, migliora la comprensione a livello di parola e riduce i problemi di output misto semplificato/tradizionale e cinese/inglese.",
"hunyuan-t1-20250529.description": "Migliora la scrittura creativa e la composizione, rafforza la codifica frontend, il ragionamento matematico e logico, e migliora il rispetto delle istruzioni.",
"hunyuan-t1-20250711.description": "Migliora notevolmente la matematica complessa, la logica e la codifica, aumenta la stabilità dell'output e potenzia la capacità di testi lunghi.",
"hunyuan-t1-latest.description": "Migliora significativamente il modello a pensiero lento su matematica complessa, ragionamento articolato, programmazione difficile, rispetto delle istruzioni e qualità della scrittura creativa.",
"hunyuan-t1-vision-20250916.description": "Ultimo modello t1-vision con importanti miglioramenti in VQA, grounding visivo, OCR, grafici, risoluzione di problemi fotografati e creazione basata su immagini, oltre a una maggiore competenza in inglese e lingue a bassa risorsa.",
"hunyuan-turbo-20241223.description": "Questa versione potenzia la scalabilità delle istruzioni per una migliore generalizzazione, migliora significativamente il ragionamento matematico/codice/logico, rafforza la comprensione a livello di parola e migliora la qualità della scrittura.",
"hunyuan-turbo-latest.description": "Miglioramenti generali nell'esperienza NLP, scrittura, chat, QA, traduzione e domini; risposte più simili a quelle umane, migliore chiarimento su intenti ambigui, miglior parsing delle parole, maggiore qualità creativa e interattività, e conversazioni multi-turno più forti.",
"hunyuan-turbo.description": "Anteprima del prossimo LLM di Hunyuan con nuova architettura MoE, che offre ragionamento più veloce e risultati migliori rispetto a hunyuan-pro.",
"hunyuan-turbos-latest.description": "Il più recente modello di punta Hunyuan TurboS con ragionamento potenziato e unesperienza complessiva migliorata.",
"hunyuan-turbos-longtext-128k-20250325.description": "Eccelle nei compiti su documenti lunghi come riassunti e domande/risposte, gestendo anche la generazione generale. Forte nell'analisi e generazione di testi lunghi per contenuti complessi e dettagliati.",
"hunyuan-vision-1.5-instruct.description": "Un modello immagine-testo a pensiero rapido basato sulla base testuale TurboS, con miglioramenti significativi rispetto alla versione precedente nel riconoscimento fondamentale delle immagini e nel ragionamento analitico delle immagini.",
"hunyuan-vision.description": "L'ultimo modello multimodale di Hunyuan supporta input immagine + testo per generare testo.",
"image-01-live.description": "Modello di generazione immagini con dettagli raffinati, supporta testo-immagine e stili controllabili predefiniti.",
@@ -770,8 +778,7 @@
"kimi-k2:1t.description": "Kimi K2 è un grande LLM MoE di Moonshot AI con 1T di parametri totali e 32B attivi per passaggio. È ottimizzato per capacità agentiche tra cui uso avanzato di strumenti, ragionamento e sintesi di codice.",
"kimi-latest.description": "Kimi Latest utilizza il modello Kimi più recente e può includere funzionalità sperimentali. Supporta la comprensione delle immagini e seleziona automaticamente i modelli di fatturazione 8k/32k/128k in base alla lunghezza del contesto.",
"kuaishou/kat-coder-pro-v1.description": "KAT-Coder-Pro-V1 (gratuito per un periodo limitato) è focalizzato sulla comprensione del codice e sull'automazione per agenti di programmazione efficienti.",
"learnlm-1.5-pro-experimental.description": "LearnLM è un modello sperimentale e specifico per compiti, addestrato secondo i principi della scienza dell'apprendimento per seguire istruzioni di sistema in scenari di insegnamento/apprendimento, agendo come un tutor esperto.",
"learnlm-2.0-flash-experimental.description": "LearnLM è un modello sperimentale e specifico per compiti, addestrato secondo i principi della scienza dell'apprendimento per seguire istruzioni di sistema in scenari di insegnamento/apprendimento, agendo come un tutor esperto.",
"labs-devstral-small-2512.description": "Devstral Small 2 eccelle nell'utilizzo di strumenti per esplorare basi di codice, modificare più file e alimentare agenti per l'ingegneria del software.",
"lite.description": "Spark Lite è un LLM leggero con latenza ultra-bassa ed elaborazione efficiente. È completamente gratuito e supporta la ricerca web in tempo reale. Le sue risposte rapide si comportano bene su dispositivi a bassa potenza e per il fine-tuning dei modelli, offrendo un'esperienza intelligente e conveniente, soprattutto per domande e risposte, generazione di contenuti e scenari di ricerca.",
"llama-3.1-70b-versatile.description": "Llama 3.1 70B offre un ragionamento AI avanzato per applicazioni complesse, supportando carichi computazionali elevati con alta efficienza e precisione.",
"llama-3.1-8b-instant.description": "Llama 3.1 8B è un modello ad alta efficienza con generazione di testo rapida, ideale per applicazioni su larga scala e a basso costo.",
@@ -782,7 +789,6 @@
"llama-3.2-90b-vision-preview.description": "Llama 3.2 è progettato per compiti che combinano visione e testo, eccellendo in didascalie di immagini e domande e risposte visive, unendo generazione linguistica e ragionamento visivo.",
"llama-3.2-vision-instruct.description": "Il modello Llama 3.2-Vision ottimizzato per istruzioni è progettato per riconoscimento visivo, ragionamento su immagini, generazione di didascalie e domande e risposte generali su immagini.",
"llama-3.3-70b-versatile.description": "Meta Llama 3.3 è un LLM multilingue con 70 miliardi di parametri (input/output testuale), disponibile in versioni pre-addestrate e ottimizzate per istruzioni. Il modello testuale ottimizzato per istruzioni è pensato per dialoghi multilingue e supera molti modelli open e closed nei benchmark di settore.",
"llama-3.3-70b.description": "Llama 3.3 70B: un modello Llama di dimensioni medio-grandi che bilancia ragionamento e throughput.",
"llama-3.3-instruct.description": "Il modello Llama 3.3 ottimizzato per istruzioni è progettato per chat e supera molti modelli open source nei benchmark di settore.",
"llama3-70b-8192.description": "Meta Llama 3 70B offre una gestione eccezionale della complessità per progetti impegnativi.",
"llama3-8b-8192.description": "Meta Llama 3 8B garantisce prestazioni di ragionamento solide in scenari diversificati.",
@@ -832,7 +838,6 @@
"meta-llama/llama-3.1-8b-instruct:free.description": "LLaMA 3.1 offre supporto multilingue ed è uno dei principali modelli generativi.",
"meta-llama/llama-3.2-11b-vision-instruct.description": "LLaMA 3.2 è progettato per compiti che combinano visione e testo. Eccelle in didascalie di immagini e domande e risposte visive, unendo generazione linguistica e ragionamento visivo.",
"meta-llama/llama-3.2-3b-instruct.description": "meta-llama/llama-3.2-3b-instruct",
"meta-llama/llama-3.2-90b-vision-instruct.description": "LLaMA 3.2 è progettato per compiti che combinano visione e testo. Eccelle in didascalie di immagini e domande e risposte visive, unendo generazione linguistica e ragionamento visivo.",
"meta-llama/llama-3.3-70b-instruct.description": "Llama 3.3 è il modello Llama open source multilingue più avanzato, con prestazioni vicine a quelle dei modelli da 405B a costi molto contenuti. Basato su Transformer, è migliorato con SFT e RLHF per utilità e sicurezza. La versione ottimizzata per istruzioni è pensata per chat multilingue e supera molti modelli open e closed nei benchmark di settore. Data di cutoff: dicembre 2023.",
"meta-llama/llama-3.3-70b-instruct:free.description": "Llama 3.3 è il modello Llama open source multilingue più avanzato, con prestazioni vicine a quelle dei modelli da 405B a costi molto contenuti. Basato su Transformer, è migliorato con SFT e RLHF per utilità e sicurezza. La versione ottimizzata per istruzioni è pensata per chat multilingue e supera molti modelli open e closed nei benchmark di settore. Data di cutoff: dicembre 2023.",
"meta.llama3-1-405b-instruct-v1:0.description": "Meta Llama 3.1 405B Instruct è il modello Llama 3.1 Instruct più grande e potente, altamente avanzato per il ragionamento dialogico e la generazione di dati sintetici, e una solida base per pretraining o fine-tuning specifici per dominio. I LLM multilingue Llama 3.1 sono una serie di modelli di generazione preaddestrati e ottimizzati per le istruzioni in versioni da 8B, 70B e 405B (input/output testuale). I modelli ottimizzati per le istruzioni sono progettati per dialoghi multilingue e superano molti modelli open chat disponibili nei benchmark industriali. Llama 3.1 è pensato per l'uso commerciale e di ricerca in più lingue. I modelli ottimizzati per le istruzioni sono adatti a chat in stile assistente, mentre i modelli preaddestrati si adattano a compiti più generali di generazione linguistica. Gli output di Llama 3.1 possono anche essere utilizzati per migliorare altri modelli, inclusa la generazione e il perfezionamento di dati sintetici. Llama 3.1 è un modello Transformer autoregressivo con architettura ottimizzata. Le versioni ottimizzate utilizzano fine-tuning supervisionato (SFT) e apprendimento per rinforzo con feedback umano (RLHF) per allinearsi alle preferenze umane in termini di utilità e sicurezza.",
@@ -894,7 +899,7 @@
"mistral-large-instruct.description": "Mistral-Large-Instruct-2407 è un LLM denso avanzato con 123 miliardi di parametri e ragionamento, conoscenza e codifica all'avanguardia.",
"mistral-large-latest.description": "Mistral Large è il modello di punta, forte nei compiti multilingue, nel ragionamento complesso e nella generazione di codice—ideale per applicazioni di fascia alta.",
"mistral-large.description": "Mixtral Large è il modello di punta di Mistral, che combina generazione di codice, matematica e ragionamento con una finestra contestuale di 128K.",
"mistral-medium-latest.description": "Mistral Medium 3 offre prestazioni all'avanguardia a un costo 8× inferiore e semplifica l'implementazione aziendale.",
"mistral-medium-latest.description": "Mistral Medium 3.1 offre prestazioni all'avanguardia a un costo 8 volte inferiore e semplifica l'implementazione aziendale.",
"mistral-nemo-instruct.description": "Mistral-Nemo-Instruct-2407 è la versione ottimizzata per istruzioni di Mistral-Nemo-Base-2407.",
"mistral-nemo.description": "Mistral Nemo è un modello da 12B ad alta efficienza di Mistral AI e NVIDIA.",
"mistral-small-latest.description": "Mistral Small è un'opzione conveniente, veloce e affidabile per traduzione, sintesi e analisi del sentiment.",
@@ -933,7 +938,7 @@
"moonshot-v1-auto.description": "Moonshot V1 Auto seleziona automaticamente il modello più adatto in base all'utilizzo corrente dei token di contesto.",
"moonshotai/Kimi-Dev-72B.description": "Kimi-Dev-72B è un LLM open-source per il codice, ottimizzato con RL su larga scala per generare patch robuste e pronte per la produzione. Ottiene un punteggio del 60,4% su SWE-bench Verified, stabilendo un nuovo record tra i modelli open-source per attività di ingegneria del software automatizzata come la correzione di bug e la revisione del codice.",
"moonshotai/Kimi-K2-Instruct-0905.description": "Kimi K2-Instruct-0905 è la versione più recente e potente della serie Kimi K2. È un modello MoE di fascia alta con 1T di parametri totali e 32B attivi. Tra le caratteristiche principali: maggiore intelligenza agentica nella programmazione, miglioramenti significativi nei benchmark e nei compiti reali per agenti, oltre a un'estetica e usabilità del codice frontend più curate.",
"moonshotai/Kimi-K2-Thinking.description": "Kimi K2 Thinking è il più recente e potente modello open-source per il ragionamento. Estende notevolmente la profondità del ragionamento multi-step e mantiene un uso stabile degli strumenti per 200300 chiamate consecutive, stabilendo nuovi record su Humanity's Last Exam (HLE), BrowseComp e altri benchmark. Eccelle in programmazione, matematica, logica e scenari agentici. Basato su un'architettura MoE con ~1T di parametri totali, supporta una finestra di contesto di 256K e chiamate a strumenti.",
"moonshotai/Kimi-K2-Thinking.description": "Kimi K2 Thinking è il modello di pensiero open-source più recente e potente. Estende notevolmente la profondità del ragionamento multi-step e mantiene un utilizzo stabile degli strumenti per 200300 chiamate consecutive, stabilendo nuovi record su Humanity's Last Exam (HLE), BrowseComp e altri benchmark. Eccelle in scenari di codifica, matematica, logica e agenti. Basato su un'architettura MoE con ~1 trilione di parametri totali, supporta una finestra di contesto di 256K e chiamate di strumenti.",
"moonshotai/kimi-k2-0711.description": "Kimi K2 0711 è la variante instruct della serie Kimi, adatta per codice di alta qualità e uso di strumenti.",
"moonshotai/kimi-k2-0905.description": "Kimi K2 0905 è un aggiornamento che migliora le prestazioni di contesto e ragionamento con ottimizzazioni per la programmazione.",
"moonshotai/kimi-k2-instruct-0905.description": "Il modello kimi-k2-0905-preview supporta una finestra di contesto di 256k, con programmazione agentica più avanzata, codice frontend più rifinito e pratico, e una migliore comprensione del contesto.",
@@ -948,8 +953,8 @@
"nvidia/Llama-3.1-Nemotron-70B-Instruct-HF.description": "Llama 3.1 Nemotron 70B è un LLM personalizzato da NVIDIA per migliorare l'utilità. Ottiene ottimi risultati su Arena Hard, AlpacaEval 2 LC e GPT-4-Turbo MT-Bench, classificandosi al primo posto in tutti e tre i benchmark di auto-allineamento al 1° ottobre 2024. È addestrato da Llama-3.1-70B-Instruct usando RLHF (REINFORCE), Llama-3.1-Nemotron-70B-Reward e prompt HelpSteer2-Preference.",
"nvidia/llama-3.1-nemotron-51b-instruct.description": "Un modello linguistico distintivo che offre precisione ed efficienza eccezionali.",
"nvidia/llama-3.1-nemotron-70b-instruct.description": "Llama-3.1-Nemotron-70B-Instruct è un modello personalizzato da NVIDIA progettato per migliorare l'utilità delle risposte LLM.",
"o1-mini.description": "Più piccolo e veloce di o1-preview, con un costo inferiore dell'80%, eccelle nella generazione di codice e nei compiti a contesto breve.",
"o1-preview.description": "Focalizzato su ragionamento avanzato e risoluzione di problemi complessi, inclusi matematica e scienze. Ideale per applicazioni che richiedono comprensione profonda del contesto e flussi di lavoro autonomi.",
"o1-mini.description": "o1-mini è un modello di ragionamento veloce e conveniente progettato per codifica, matematica e scienza. Ha un contesto di 128K e una data di cutoff delle conoscenze di ottobre 2023.",
"o1-preview.description": "o1 è il nuovo modello di ragionamento di OpenAI per compiti complessi che richiedono una conoscenza ampia. Ha un contesto di 128K e una data di cutoff delle conoscenze di ottobre 2023.",
"o1-pro.description": "La serie o1 è addestrata con apprendimento per rinforzo per pensare prima di rispondere e gestire ragionamenti complessi. o1-pro utilizza più risorse computazionali per un pensiero più profondo e risposte di qualità costantemente superiore.",
"o1.description": "o1 è il nuovo modello di ragionamento di OpenAI con input testo+immagine e output testuale, adatto a compiti complessi che richiedono conoscenze ampie. Ha una finestra di contesto di 200K e un cutoff di conoscenza a ottobre 2023.",
"o3-2025-04-16.description": "o3 è il nuovo modello di ragionamento di OpenAI con input testo+immagine e output testuale per compiti complessi che richiedono conoscenze ampie.",
@@ -1022,7 +1027,6 @@
"qianfan-check-vl.description": "Qianfan Check VL è un modello multimodale per la revisione di contenuti e il riconoscimento immagine-testo.",
"qianfan-composition.description": "Qianfan Composition è un modello multimodale per comprensione e generazione mista immagine-testo.",
"qianfan-engcard-vl.description": "Qianfan EngCard VL è un modello di riconoscimento multimodale focalizzato su scenari in lingua inglese.",
"qianfan-lightning-128b-a19b.description": "Qianfan Lightning 128B A19B è un modello generale cinese ad alte prestazioni per domande complesse e ragionamento su larga scala.",
"qianfan-llama-vl-8b.description": "Qianfan Llama VL 8B è un modello multimodale basato su Llama per la comprensione generale immagine-testo.",
"qianfan-multipicocr.description": "Qianfan MultiPicOCR è un modello OCR multi-immagine per rilevamento e riconoscimento del testo su più immagini.",
"qianfan-qi-vl.description": "Qianfan QI VL è un modello multimodale di domande-risposte per recupero accurato e QA in scenari immagine-testo complessi.",
@@ -1032,7 +1036,6 @@
"qvq-72b-preview.description": "QVQ-72B-Preview è un modello sperimentale del team Qwen focalizzato sul miglioramento del ragionamento visivo.",
"qvq-max.description": "Il modello di ragionamento visivo Qwen QVQ supporta input visivi e output con catena di pensiero, con prestazioni superiori in matematica, programmazione, analisi visiva, creatività e compiti generali.",
"qvq-plus.description": "Modello di ragionamento visivo con input visivo e output con catena di pensiero. La serie qvq-plus segue qvq-max e offre ragionamento più veloce con un miglior equilibrio qualità-costo.",
"qwen-3-32b.description": "Qwen 3 32B: eccellente in compiti multilingue e di programmazione, adatto per produzione su scala media.",
"qwen-coder-plus.description": "Modello di programmazione Qwen.",
"qwen-coder-turbo-latest.description": "Modello di programmazione Qwen.",
"qwen-coder-turbo.description": "Modello di programmazione Qwen.",
@@ -1128,7 +1131,6 @@
"qwen3-coder-next.description": "Il coder Qwen di nuova generazione ottimizzato per la generazione di codice complesso multi-file, il debugging e i flussi di lavoro ad alta produttività per agenti. Progettato per una forte integrazione degli strumenti e prestazioni di ragionamento migliorate.",
"qwen3-coder-plus.description": "Modello di codice Qwen. La serie Qwen3-Coder si basa su Qwen3 e offre forti capacità di agenti di programmazione, utilizzo di strumenti e interazione con lambiente per la programmazione autonoma, con prestazioni eccellenti nel codice e solide capacità generali.",
"qwen3-coder:480b.description": "Modello ad alte prestazioni di Alibaba per attività di agenti e programmazione, con supporto a contesti lunghi.",
"qwen3-max-2026-01-23.description": "I modelli Qwen3 Max offrono miglioramenti significativi rispetto alla serie 2.5 in capacità generali, comprensione di cinese/inglese, esecuzione di istruzioni complesse, compiti soggettivi aperti, capacità multilingue e utilizzo di strumenti, con meno allucinazioni. Lultima versione migliora la programmazione agentica e luso di strumenti rispetto a qwen3-max-preview. Raggiunge lo stato dellarte in vari ambiti e si rivolge a esigenze agentiche più complesse.",
"qwen3-max-preview.description": "Il modello Qwen con le migliori prestazioni per compiti complessi e multi-step. La versione preview supporta il ragionamento.",
"qwen3-max.description": "I modelli Qwen3 Max offrono miglioramenti significativi rispetto alla serie 2.5 in capacità generali, comprensione di cinese/inglese, esecuzione di istruzioni complesse, compiti soggettivi aperti, abilità multilingue e uso di strumenti, con meno allucinazioni. L'ultima versione qwen3-max migliora la programmazione agentica e l'uso degli strumenti rispetto a qwen3-max-preview. Questa release raggiunge lo stato dellarte e risponde a esigenze agentiche più complesse.",
"qwen3-next-80b-a3b-instruct.description": "Modello open-source di nuova generazione Qwen3 senza capacità di ragionamento. Rispetto alla versione precedente (Qwen3-235B-A22B-Instruct-2507), offre una migliore comprensione del cinese, un ragionamento logico più forte e una generazione di testo migliorata.",
@@ -1145,7 +1147,8 @@
"qwen3-vl-flash.description": "Qwen3 VL Flash: versione leggera e ad alta velocità per richieste sensibili alla latenza o ad alto volume.",
"qwen3-vl-plus.description": "Qwen VL è un modello di generazione testuale con comprensione visiva. Può eseguire OCR, riassumere e ragionare, ad esempio estraendo attributi da foto di prodotti o risolvendo problemi da immagini.",
"qwen3.5-397b-a17b.description": "Supporta input di testo, immagini e video. Per compiti solo testuali, le sue prestazioni sono paragonabili a Qwen3 Max, offrendo maggiore efficienza e costi inferiori. Nelle capacità multimodali, offre miglioramenti significativi rispetto alla serie Qwen3 VL.",
"qwen3.5-plus.description": "Qwen3.5 Plus supporta input di testo, immagini e video. Per compiti solo testuali, le sue prestazioni sono paragonabili a Qwen3 Max, offrendo maggiore efficienza e costi inferiori. Nelle capacità multimodali, mostra miglioramenti significativi rispetto alla serie Qwen3 VL.",
"qwen3.5-plus.description": "Qwen3.5 Plus supporta input di testo, immagini e video. Le sue prestazioni nei compiti di solo testo sono paragonabili a Qwen3 Max, con migliori prestazioni e costi inferiori. Le sue capacità multimodali sono significativamente migliorate rispetto alla serie Qwen3 VL.",
"qwen3.5:397b.description": "Qwen3.5 è un modello di base visione-linguaggio unificato con un'architettura ibrida (Mixture-of-Experts + attenzione lineare), che offre un forte ragionamento multimodale, codifica e capacità di lungo contesto con una finestra di contesto di 256K.",
"qwen3.description": "Qwen3 è il modello linguistico di nuova generazione di Alibaba, con prestazioni elevate in una vasta gamma di casi duso.",
"qwq-32b-preview.description": "QwQ è un modello sperimentale di ricerca della famiglia Qwen, focalizzato sul miglioramento del ragionamento.",
"qwq-32b.description": "QwQ è un modello di ragionamento della famiglia Qwen. Rispetto ai modelli standard ottimizzati per istruzioni, offre capacità di pensiero e ragionamento che migliorano significativamente le prestazioni nei compiti complessi. QwQ-32B è un modello di medie dimensioni che compete con i migliori modelli di ragionamento come DeepSeek-R1 e o1-mini.",
@@ -1187,7 +1190,7 @@
"step-2-16k.description": "Supporta interazioni a contesto esteso per dialoghi complessi.",
"step-2-mini.description": "Basato sulla nuova architettura MFA attention proprietaria, offre risultati simili a Step-1 a costi molto inferiori, con throughput più elevato e latenza ridotta. Gestisce compiti generali con forti capacità di programmazione.",
"step-2x-large.description": "Modello di nuova generazione StepFun focalizzato sulla generazione di immagini, produce immagini di alta qualità da prompt testuali. Offre texture più realistiche e una resa testuale cinese/inglese più forte.",
"step-3.5-flash.description": "Il modello di ragionamento linguistico di punta di Stepfun. Questo modello offre capacità di ragionamento di alto livello insieme a un'esecuzione rapida e affidabile. Può scomporre e pianificare compiti complessi, invocare rapidamente e in modo affidabile strumenti per eseguirli ed eccellere nel ragionamento logico, matematica, ingegneria del software, ricerca approfondita e altri compiti sofisticati. La lunghezza del contesto è di 256K.",
"step-3.5-flash.description": "Il modello di punta di Stepfun per il ragionamento linguistico. Questo modello ha capacità di ragionamento di altissimo livello e capacità di esecuzione rapide e affidabili. È in grado di scomporre e pianificare compiti complessi, chiamare strumenti rapidamente e in modo affidabile per eseguire compiti, ed essere competente in vari compiti complessi come ragionamento logico, matematica, ingegneria del software e ricerca approfondita.",
"step-3.description": "Questo modello ha una forte percezione visiva e capacità di ragionamento complesso, gestendo con precisione la comprensione della conoscenza cross-domain, lanalisi matematica-visiva e una vasta gamma di compiti visivi quotidiani.",
"step-r1-v-mini.description": "Modello di ragionamento con forte comprensione delle immagini, in grado di elaborare immagini e testo e generare testo dopo un ragionamento profondo. Eccelle nel ragionamento visivo e offre prestazioni di alto livello in matematica, programmazione e ragionamento testuale, con una finestra di contesto da 100K.",
"stepfun-ai/step3.description": "Step3 è un modello all'avanguardia per il ragionamento multimodale di StepFun, basato su un'architettura MoE con 321 miliardi di parametri totali e 38 miliardi attivi. Il suo design end-to-end riduce i costi di decodifica offrendo al contempo un ragionamento visivo-linguistico di alto livello. Grazie al design MFA e AFD, mantiene l'efficienza sia su acceleratori di fascia alta che su quelli economici. Il pretraining utilizza oltre 20T di token testuali e 4T di token immagine-testo in molte lingue. Raggiunge prestazioni di punta tra i modelli open-source in matematica, codice e benchmark multimodali.",
@@ -1276,10 +1279,11 @@
"z-ai/glm4.7.description": "GLM-4.7 è l'ultimo modello di punta di Zhipu, migliorato per scenari di codifica agentica con capacità di codifica avanzate.",
"z-ai/glm5.description": "GLM-5 è il nuovo modello di base di punta di Zhipu AI per l'ingegneria degli agenti, raggiungendo prestazioni SOTA open-source in capacità di codifica e agenti. È paragonabile a Claude Opus 4.5 in termini di prestazioni.",
"z-image-turbo.description": "Z-Image è un modello leggero di generazione di immagini da testo che può produrre rapidamente immagini, supporta il rendering di testo in cinese e inglese e si adatta in modo flessibile a più risoluzioni e rapporti d'aspetto.",
"zai-glm-4.7.description": "Questo modello offre prestazioni di codifica avanzate con capacità di ragionamento superiori, utilizzo avanzato degli strumenti e prestazioni migliorate nel mondo reale in applicazioni di codifica agentica.",
"zai-org/GLM-4.5-Air.description": "GLM-4.5-Air è un modello base per applicazioni agentiche con architettura Mixture-of-Experts. Ottimizzato per l'uso di strumenti, navigazione web, ingegneria software e programmazione frontend, si integra con agenti di codice come Claude Code e Roo Code. Utilizza ragionamento ibrido per gestire sia scenari complessi che quotidiani.",
"zai-org/GLM-4.5.description": "GLM-4.5 è un modello base progettato per applicazioni agentiche con architettura Mixture-of-Experts. Ottimizzato per l'uso di strumenti, navigazione web, ingegneria software e programmazione frontend, si integra con agenti di codice come Claude Code e Roo Code. Utilizza ragionamento ibrido per gestire sia scenari complessi che quotidiani.",
"zai-org/GLM-4.5V.description": "GLM-4.5V è il più recente VLM di Zhipu AI, basato sul modello testuale di punta GLM-4.5-Air (106B totali, 12B attivi) con architettura MoE per prestazioni elevate a costi ridotti. Segue il percorso GLM-4.1V-Thinking e aggiunge 3D-RoPE per migliorare il ragionamento spaziale 3D. Ottimizzato tramite pretraining, SFT e RL, gestisce immagini, video e documenti lunghi, classificandosi tra i migliori modelli open source su 41 benchmark multimodali pubblici. Una modalità Thinking consente di bilanciare velocità e profondità.",
"zai-org/GLM-4.6.description": "Rispetto a GLM-4.5, GLM-4.6 estende il contesto da 128K a 200K per compiti agentici più complessi. Ottiene punteggi più alti nei benchmark di codice e mostra prestazioni superiori in applicazioni reali come Claude Code, Cline, Roo Code e Kilo Code, inclusa una migliore generazione di pagine frontend. Il ragionamento è migliorato e l'uso di strumenti è supportato durante il ragionamento, rafforzando le capacità complessive. Si integra meglio nei framework agentici, migliora gli agenti di ricerca/strumenti e offre uno stile di scrittura più naturale e preferito dagli utenti.",
"zai-org/GLM-4.6V.description": "GLM-4.6V raggiunge una precisione SOTA nella comprensione visiva per modelli della stessa scala di parametri e integra per la prima volta la capacità di Function Call (chiamata di strumenti) nativamente nell'architettura del modello visivo, collegando la catena dalla 'percezione visiva' all'azione eseguibile, fornendo una base tecnologica unificata per agenti multimodali in scenari aziendali reali.",
"zai/glm-4.5-air.description": "GLM-4.5 e GLM-4.5-Air sono i nostri modelli di punta più recenti per applicazioni agentiche, entrambi con architettura MoE. GLM-4.5 ha 355B totali e 32B attivi per passaggio; GLM-4.5-Air è più snello con 106B totali e 12B attivi.",
"zai/glm-4.5.description": "La serie GLM-4.5 è progettata per agenti. Il modello di punta GLM-4.5 combina ragionamento, programmazione e capacità agentiche con 355B parametri totali (32B attivi) e offre modalità operative doppie come sistema di ragionamento ibrido.",
"zai/glm-4.5v.description": "GLM-4.5V si basa su GLM-4.5-Air, ereditando le tecniche collaudate di GLM-4.1V-Thinking e scalando con una potente architettura MoE da 106B parametri.",
+14
View File
@@ -24,6 +24,20 @@
"builtins.lobe-agent-builder.inspector.noResults": "Nessun risultato",
"builtins.lobe-agent-builder.inspector.togglePlugin": "Attiva/Disattiva",
"builtins.lobe-agent-builder.title": "Esperto Costruttore di Agenti",
"builtins.lobe-agent-management.apiName.callAgent": "Chiamare agente",
"builtins.lobe-agent-management.apiName.createAgent": "Creare agente",
"builtins.lobe-agent-management.apiName.deleteAgent": "Eliminare agente",
"builtins.lobe-agent-management.apiName.searchAgent": "Cercare agenti",
"builtins.lobe-agent-management.apiName.updateAgent": "Aggiornare agente",
"builtins.lobe-agent-management.inspector.callAgent.sync": "Chiamando:",
"builtins.lobe-agent-management.inspector.callAgent.task": "Assegnando compito a:",
"builtins.lobe-agent-management.inspector.createAgent.title": "Creazione agente:",
"builtins.lobe-agent-management.inspector.searchAgent.all": "Cerca agenti:",
"builtins.lobe-agent-management.inspector.searchAgent.market": "Cerca mercato:",
"builtins.lobe-agent-management.inspector.searchAgent.results": "{{count}} risultati",
"builtins.lobe-agent-management.inspector.searchAgent.user": "Cerca i miei agenti:",
"builtins.lobe-agent-management.inspector.updateAgent.title": "Aggiornamento agente:",
"builtins.lobe-agent-management.title": "Gestore Agenti",
"builtins.lobe-cloud-sandbox.apiName.editLocalFile": "Modifica file",
"builtins.lobe-cloud-sandbox.apiName.executeCode": "Esegui codice",
"builtins.lobe-cloud-sandbox.apiName.exportFile": "Esporta file",
+3
View File
@@ -724,6 +724,9 @@
"tools.builtins.lobe-artifacts.description": "Genera e visualizza in anteprima componenti UI interattivi, grafici e contenuti web",
"tools.builtins.lobe-artifacts.readme": "Genera e visualizza in anteprima componenti UI interattivi, visualizzazioni di dati, grafici, grafica SVG e applicazioni web. Crea contenuti visivi ricchi con cui gli utenti possono interagire direttamente.",
"tools.builtins.lobe-artifacts.title": "Artefatti",
"tools.builtins.lobe-calculator.description": "Esegui calcoli matematici, risolvi equazioni e lavora con espressioni simboliche",
"tools.builtins.lobe-calculator.readme": "Calcolatrice matematica avanzata che supporta aritmetica di base, equazioni algebriche, operazioni di calcolo e matematica simbolica. Include conversione di basi, risoluzione di equazioni, differenziazione, integrazione e altro.",
"tools.builtins.lobe-calculator.title": "Calcolatrice",
"tools.builtins.lobe-cloud-sandbox.description": "Esegui codice, comandi e gestisci file in un ambiente cloud sicuro",
"tools.builtins.lobe-cloud-sandbox.readme": "Esegui codice Python, JavaScript e TypeScript in un ambiente cloud isolato. Esegui comandi shell, gestisci file, cerca contenuti con espressioni regolari ed esporta i risultati in modo sicuro.",
"tools.builtins.lobe-cloud-sandbox.title": "Sandbox Cloud",
+7 -3
View File
@@ -224,15 +224,18 @@
"providerModels.item.modelConfig.extendParams.options.gpt5_2ProReasoningEffort.hint": "GPT-5.2 Proシリーズ向け;推論の強度を制御します。",
"providerModels.item.modelConfig.extendParams.options.gpt5_2ReasoningEffort.hint": "GPT-5.2シリーズ向け;推論の強度を制御します。",
"providerModels.item.modelConfig.extendParams.options.imageAspectRatio.hint": "Gemini画像生成モデル向け;生成される画像のアスペクト比を制御します。",
"providerModels.item.modelConfig.extendParams.options.imageAspectRatio2.hint": "Nano Banana 2用; 生成される画像のアスペクト比を制御します(超ワイド1:4、4:1、1:8、8:1をサポート)。",
"providerModels.item.modelConfig.extendParams.options.imageResolution.hint": "Gemini 3画像生成モデル向け;生成される画像の解像度を制御します。",
"providerModels.item.modelConfig.extendParams.options.imageResolution2.hint": "Gemini 3.1 Flash Imageモデル用; 生成される画像の解像度を制御します(512pxをサポート)。",
"providerModels.item.modelConfig.extendParams.options.reasoningBudgetToken.hint": "Claude、Qwen3などのモデル向け;推論に使用するトークンの予算を制御します。",
"providerModels.item.modelConfig.extendParams.options.reasoningEffort.hint": "OpenAIなどの推論対応モデル向け;推論の努力度を制御します。",
"providerModels.item.modelConfig.extendParams.options.textVerbosity.hint": "GPT-5+シリーズ向け;出力の詳細度を制御します。",
"providerModels.item.modelConfig.extendParams.options.thinking.hint": "一部のDoubaoモデル向け;モデルが深く思考するかどうかを判断させます。",
"providerModels.item.modelConfig.extendParams.options.thinkingBudget.hint": "Geminiシリーズ向け;思考に使う予算を制御します。",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel.hint": "Gemini 3 Flash Previewモデル向け;思考の深さを制御します。",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel2.hint": "Gemini 3 Pro Previewモデル向け;思考の深さを制御します。",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel3.hint": "Gemini 3.1 Proプレビューモデル用; 思考の深さを低/中/高レベルで制御します。",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel.hint": "Gemini 3 Flash Previewモデル用; 思考の深さを制御します。",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel2.hint": "Gemini 3 Pro Previewモデル用; 思考の深さを制御します。",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel3.hint": "Gemini 3.1 Pro Previewモデル用; 低/中/高レベルで思考の深さを制御します。",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel4.hint": "Gemini 3.1 Flash Imageモデル用; 思考のオン/オフを切り替えます。",
"providerModels.item.modelConfig.extendParams.options.urlContext.hint": "Geminiシリーズ向け;URLコンテキストの提供をサポートします。",
"providerModels.item.modelConfig.extendParams.placeholder": "有効にする拡張パラメータを選択",
"providerModels.item.modelConfig.extendParams.previewFallback": "プレビューを利用できません",
@@ -311,6 +314,7 @@
"providerModels.tabs.image": "画像",
"providerModels.tabs.stt": "音声認識",
"providerModels.tabs.tts": "音声合成",
"providerModels.tabs.video": "ビデオ",
"sortModal.success": "ソートが更新されました",
"sortModal.title": "カスタムソート",
"sortModal.update": "更新",
+35 -31
View File
@@ -55,7 +55,8 @@
"FLUX.1-dev.description": "FLUX.1-dev は、Black Forest Labs によるオープンソースのマルチモーダル言語モデル(MLLM)で、画像とテキストの理解・生成を統合しています。高度な LLM(例:Mistral-7B)をベースに、精密に設計されたビジョンエンコーダと多段階の指示チューニングを用いて、マルチモーダルの連携と複雑なタスクの推論を可能にします。",
"Gryphe/MythoMax-L2-13b.description": "MythoMax-L213B)は、多様な分野と複雑なタスクに対応する革新的なモデルです。",
"HelloMeme.description": "HelloMeme は、提供された画像や動作からミーム、GIF、ショート動画を生成するAIツールです。絵を描くスキルやコーディングスキルは不要で、参照画像を用意するだけで、楽しく魅力的でスタイルの一貫したコンテンツを作成できます。",
"HiDream-I1-Full.description": "HiDream-E1-Full は、HiDream.ai によるオープンソースのマルチモーダル画像編集モデルで、高度な Diffusion Transformer アーキテクチャと強力な言語理解(LLaMA 3.1-8B-Instruct 搭載)に基づいています。自然言語による画像生成、スタイル変換、局所編集、再描画をサポートし、優れた画像テキスト理解実行能力を備えています。",
"HiDream-E1-Full.description": "HiDream-E1-Fullは、HiDream.aiによるオープンソースのマルチモーダル画像編集モデルで、高度なDiffusion Transformerアーキテクチャと強力な言語理解(内蔵LLaMA 3.1-8B-Instruct)に基づいています。自然言語駆動の画像生成、スタイル転送、局所編集、リペイントをサポートし、優れた画像テキスト理解および実行能力を備えています。",
"HiDream-I1-Full.description": "HiDream-I1は、HiDreamがリリースした新しいオープンソースのベース画像生成モデルです。17Bパラメータ(Fluxは12B)を持ち、業界トップクラスの画像品質を数秒で提供します。",
"HunyuanDiT-v1.2-Diffusers-Distilled.description": "hunyuandit-v1.2-distilled は、蒸留によって最適化された軽量なテキストから画像への生成モデルで、特にリソースの限られた環境やリアルタイム生成に適した高品質な画像を迅速に生成します。",
"InstantCharacter.description": "InstantCharacter は、Tencent AI により2025年にリリースされたチューニング不要のパーソナライズキャラクター生成モデルで、高忠実度かつシナリオを超えた一貫性のあるキャラクター生成を目指しています。1枚の参照画像からキャラクターをモデリングし、スタイル、動作、背景を柔軟に変換できます。",
"InternVL2-8B.description": "InternVL2-8B は、マルチモーダルな画像・テキスト処理をサポートする強力なビジョン・ランゲージモデルで、画像内容の正確な認識と関連する説明や回答の生成が可能です。",
@@ -80,7 +81,7 @@
"MiniMax-M2.1.description": "MiniMax-M2.1は、MiniMaxが開発したフラッグシップのオープンソース大規模モデルで、複雑な現実世界のタスク解決に特化しています。多言語プログラミング能力とエージェントとしての高度なタスク処理能力が主な強みです。",
"MiniMax-M2.5-Lightning.description": "M2.5 Lightning: 同じ性能で、より高速かつ機敏(約100 tps)。",
"MiniMax-M2.5-highspeed.description": "M2.5と同じ性能で、推論速度が大幅に向上。",
"MiniMax-M2.5.description": "最高クラスの性能と究極のコストパフォーマンスを実現し、複雑なタスクも容易に処理(約60 tps)。",
"MiniMax-M2.5.description": "MiniMax-M2.5は、MiniMaxによるフラッグシップのオープンソース大規模モデルで、複雑な現実世界のタスクを解決することに焦点を当てています。その主な強みは、多言語プログラミング能力とエージェントとして複雑なタスクを解決する能力です。",
"MiniMax-M2.description": "効率的なコーディングとエージェントワークフローのために特化して設計されたモデル",
"MiniMax-Text-01.description": "MiniMax-01は、従来のTransformerを超える大規模な線形アテンションを導入し、4560億のパラメータと1パスあたり45.9億のアクティブパラメータを持ちます。最大400万トークンのコンテキストをサポートし(GPT-4oの32倍、Claude-3.5-Sonnetの20倍)、最高水準の性能を実現します。",
"MiniMaxAI/MiniMax-M1-80k.description": "MiniMax-M1は、4560億の総パラメータとトークンあたり約45.9億のアクティブパラメータを持つ、オープンウェイトの大規模ハイブリッドアテンション推論モデルです。100Kトークン生成時にFLOPsを75%削減するFlash Attentionを採用し、1Mのコンテキストをネイティブにサポートします。MoEアーキテクチャ、CISPO、ハイブリッドアテンション強化学習により、長文推論や実際のソフトウェアエンジニアリングタスクで卓越した性能を発揮します。",
@@ -98,6 +99,7 @@
"Phi-3.5-mini-instruct.description": "Phi-3-miniモデルのアップデート版です。",
"Phi-3.5-vision-instrust.description": "Phi-3-visionモデルのアップデート版です。",
"Pro/MiniMaxAI/MiniMax-M2.1.description": "MiniMax-M2.1は、エージェント機能に最適化されたオープンソースの大規模言語モデルであり、プログラミング、ツールの活用、指示の遵守、長期的な計画に優れています。このモデルは多言語でのソフトウェア開発や複雑なマルチステップのワークフロー実行をサポートし、SWE-bench Verifiedで74.0のスコアを達成し、多言語シナリオにおいてClaude Sonnet 4.5を上回る性能を示しています。",
"Pro/MiniMaxAI/MiniMax-M2.5.description": "MiniMax-M2.5は、MiniMaxが開発した最新の大規模言語モデルで、数十万の複雑な現実世界の環境での大規模強化学習を通じて訓練されています。2290億パラメータのMoEアーキテクチャを特徴とし、プログラミング、エージェントツールの呼び出し、検索、オフィスシナリオなどのタスクで業界トップクラスのパフォーマンスを実現します。",
"Pro/Qwen/Qwen2-7B-Instruct.description": "Qwen2-7B-Instructは、Qwen2シリーズの7B命令調整済みLLMです。TransformerアーキテクチャにSwiGLU、QKVバイアス、グループ化クエリアテンションを採用し、大規模入力に対応。言語理解、生成、多言語、コーディング、数学、推論において優れた性能を発揮し、多くのオープンモデルを上回り、プロプライエタリモデルと競合します。Qwen1.5-7B-Chatを複数のベンチマークで上回ります。",
"Pro/Qwen/Qwen2.5-7B-Instruct.description": "Qwen2.5-7B-Instructは、Alibaba Cloudの最新LLMシリーズの一部です。7Bモデルは、コーディングと数学で顕著な向上を示し、29以上の言語をサポート。命令追従、構造化データの理解、構造化出力(特にJSON)を改善しています。",
"Pro/Qwen/Qwen2.5-Coder-7B-Instruct.description": "Qwen2.5-Coder-7B-Instructは、Alibaba Cloudの最新コード特化型LLMです。Qwen2.5をベースに5.5兆トークンで訓練され、コード生成、推論、修復を大幅に改善。数学や汎用能力も維持し、コーディングエージェントの強力な基盤を提供します。",
@@ -107,13 +109,13 @@
"Pro/deepseek-ai/DeepSeek-R1-Distill-Qwen-7B.description": "DeepSeek-R1-Distill-Qwen-7Bは、Qwen2.5-Math-7Bから蒸留され、800Kの厳選されたDeepSeek-R1サンプルでファインチューニングされています。MATH-500で92.8%、AIME 2024で55.5%、CodeForcesレーティング1189(7Bモデルとして)という高い性能を示します。",
"Pro/deepseek-ai/DeepSeek-R1.description": "DeepSeek-R1は、強化学習による推論モデルで、繰り返しを減らし可読性を向上させます。RL前にコールドスタートデータを使用して推論をさらに強化し、数学、コード、推論タスクでOpenAI-o1に匹敵する性能を発揮。慎重な訓練により全体的な結果を向上させています。",
"Pro/deepseek-ai/DeepSeek-V3.1-Terminus.description": "DeepSeek-V3.1-Terminusは、ハイブリッドエージェントLLMとして位置づけられたV3.1の改良版です。ユーザーから報告された問題を修正し、安定性と言語の一貫性を向上。中英混在や異常文字を削減。思考モードと非思考モードをチャットテンプレートで柔軟に切り替え可能。Code AgentとSearch Agentの性能も向上し、ツール使用やマルチステップタスクの信頼性が高まりました。",
"Pro/deepseek-ai/DeepSeek-V3.2-Exp.description": "DeepSeek-V3.2-Expは、次世代アーキテクチャへの橋渡しとなる実験的なV3.2リリースです。V3.1-TerminusにDeepSeek Sparse AttentionDSA)を追加し、長文コンテキストの学習と推論効率を向上。ツール使用、長文理解、マルチステップ推論に最適化されており、大規模コンテキストでの高効率推論の探求に理想的です。",
"Pro/deepseek-ai/DeepSeek-V3.2.description": "DeepSeek-V3.2は、高い計算効率と優れた推論およびエージェント性能を兼ね備えたモデルです。そのアプローチは、計算複雑性を大幅に削減しながらモデル性能を維持する効率的な注意メカニズムであるDeepSeek Sparse AttentionDSA)、GPT-5に匹敵する性能を持つスケーラブルな強化学習フレームワーク、そしてツール使用シナリオに推論能力を統合する大規模エージェントタスク合成パイプラインという3つの主要な技術的ブレークスルーに基づいています。このモデルは、2025年国際数学オリンピック(IMO)および国際情報オリンピック(IOI)で金メダルを獲得しました。",
"Pro/deepseek-ai/DeepSeek-V3.description": "DeepSeek-V3は、MLAとDeepSeekMoEを使用し、損失のない負荷分散により効率的な推論と学習を実現する6710億パラメータのMoEモデルです。14.8兆の高品質トークンで事前学習され、SFTとRLでさらに調整され、他のオープンモデルを上回り、主要なクローズドモデルに迫る性能を発揮します。",
"Pro/moonshotai/Kimi-K2-Instruct-0905.description": "Kimi K2-Instruct-0905 は、最新かつ最も高性能な Kimi K2 モデルです。1T の総パラメータと 32B のアクティブパラメータを持つ最上位の MoE モデルであり、エージェント型コーディング知能が強化され、ベンチマークおよび実世界のエージェントタスクにおいて大幅な性能向上を実現しています。さらに、フロントエンドのコード美学と使いやすさも改善されています。",
"Pro/moonshotai/Kimi-K2-Thinking.description": "Kimi K2 Thinking Turbo は、K2 Thinking のマルチステップ推論とツール使用能力を維持しつつ、推論速度とスループットを最適化した Turbo バリアントです。約 1T の総パラメータを持つ MoE モデルで、ネイティブで 256K のコンテキスト長をサポートし、低レイテンシーかつ高同時実行性が求められる本番環境において安定した大規模ツール呼び出しが可能です。",
"Pro/moonshotai/Kimi-K2.5.description": "Kimi K2.5は、Kimi-K2-Baseを基盤としたオープンソースのネイティブマルチモーダルエージェントモデルで、約1.5兆の視覚・テキストトークンで訓練されています。MoEアーキテクチャを採用し、総パラメータ数1兆、アクティブパラメータ数32B、256Kのコンテキストウィンドウをサポートし、視覚と言語の理解をシームレスに統合しています。",
"Pro/zai-org/glm-4.7.description": "GLM-4.7は、Zhipuが開発した次世代のフラッグシップモデルで、総パラメータ数355B、アクティブパラメータ数32Bを備えています。一般的な対話、推論、エージェント機能において全面的に強化されており、「交差思考(Interleaved Thinking)」の強化に加え、「保持思考(Preserved Thinking)」や「ターン単位思考(Turn-level Thinking)」といった新たな思考モードも導入されています。",
"Pro/zai-org/glm-5.description": "GLM-5は智谱が開発した新世代の大規模言語モデルで、複雑なシステム工学と長期間のエージェントタスクに特化しています。モデルパラメータは744B40Bアクティブ)に拡張され、DeepSeek Sparse Attentionを統合しています。",
"Pro/zai-org/glm-5.description": "GLM-5は、複雑なシステムエンジニアリングと長期間のエージェントタスクに焦点を当てたZhipuの次世代大規模言語モデルです。モデルパラメータは7440億(アクティブ40億)に拡張され、DeepSeek Sparse Attentionを統合しています。",
"QwQ-32B-Preview.description": "Qwen QwQ は、推論能力の向上に焦点を当てた実験的研究モデルです。",
"Qwen/QVQ-72B-Preview.description": "QVQ-72B-Preview は、Qwen による視覚的推論に特化した研究モデルであり、複雑なシーン理解や視覚的数学問題に強みを持ちます。",
"Qwen/QwQ-32B-Preview.description": "Qwen QwQ は、AI の推論能力向上に焦点を当てた実験的研究モデルです。",
@@ -137,7 +139,7 @@
"Qwen/Qwen3-14B.description": "Qwen3は、次世代のTongyi Qwenモデルであり、推論能力、汎用性、エージェント機能、多言語対応において大幅な向上を実現しています。思考モードの切り替えにも対応しています。",
"Qwen/Qwen3-235B-A22B-Instruct-2507.description": "Qwen3-235B-A22B-Instruct-2507は、Qwen3シリーズのフラッグシップMoEモデルで、総パラメータ数235B、アクティブパラメータ数22Bを備えています。思考モードを使用しないバージョンで、指示追従、論理的推論、テキスト理解、数学、科学、コーディング、ツール使用の性能を強化しています。また、多言語のロングテール知識を拡張し、主観的で自由度の高いタスクにおけるユーザーの好みにより良く適合します。",
"Qwen/Qwen3-235B-A22B-Thinking-2507.description": "Qwen3-235B-A22B-Thinking-2507は、複雑な推論に特化したQwen3モデルです。MoEアーキテクチャを採用し、総パラメータ数235B、トークンごとに約22Bのアクティブパラメータで効率性を高めています。思考専用モデルとして、論理、数学、科学、コーディング、学術ベンチマークにおいて大きな性能向上を示し、トップクラスの思考能力を発揮します。指示追従、ツール使用、テキスト生成にも優れ、256Kのコンテキストをネイティブにサポートし、深い推論や長文処理に対応します。",
"Qwen/Qwen3-235B-A22B.description": "Qwen3は、次世代のTongyi Qwenモデルであり、推論能力、汎用性、エージェント機能、多言語対応において大幅な向上を実現しています。思考モードの切り替えにも対応しています。",
"Qwen/Qwen3-235B-A22B.description": "Qwen3 235B A22Bは、トップクラスのAI能力を提供するQwen3の超大規模モデルです。",
"Qwen/Qwen3-30B-A3B-Instruct-2507.description": "Qwen3-30B-A3B-Instruct-2507は、Qwen3-30B-A3Bの思考非対応バージョンです。MoEアーキテクチャを採用し、総パラメータ数30.5B、アクティブパラメータ数3.3Bを備えています。指示追従、論理的推論、テキスト理解、数学、科学、コーディング、ツール使用の性能を大幅に向上させ、多言語のロングテール知識を拡張し、主観的な自由形式タスクにおけるユーザーの好みにより良く適合します。256Kのコンテキストをサポートし、思考モードには対応せず、`<think></think>`タグは出力されません。",
"Qwen/Qwen3-30B-A3B-Thinking-2507.description": "Qwen3-30B-A3B-Thinking-2507は、Qwen3シリーズの最新の思考モデルです。MoEアーキテクチャを採用し、総パラメータ数30.5B、アクティブパラメータ数3.3Bで、複雑なタスクに特化しています。論理、数学、科学、コーディング、学術ベンチマークにおいて大きな性能向上を示し、指示追従、ツール使用、テキスト生成、ユーザーの好みに対する整合性も改善されています。256Kのコンテキストをネイティブにサポートし、最大1Mトークンまで拡張可能です。詳細なステップバイステップの推論と強力なエージェント機能を備えた思考モードに設計されています。",
"Qwen/Qwen3-30B-A3B.description": "Qwen3は、次世代のTongyi Qwenモデルであり、推論能力、汎用性、エージェント機能、多言語対応において大幅な向上を実現しています。思考モードの切り替えにも対応しています。",
@@ -315,7 +317,6 @@
"codeqwen.description": "CodeQwen1.5は、大規模なコードデータで学習されたLLMで、複雑なプログラミングタスクに対応します。",
"codestral-latest.description": "Codestralは、最も高度なコーディングモデルで、v2(2025年1月)はFIM、コード修正、テスト生成などの低レイテンシ・高頻度タスクに最適化されています。",
"codestral.description": "Codestralは、Mistral AIによる初のコードモデルで、強力なコード生成をサポートします。",
"codex-mini-latest.description": "codex-mini-latest は Codex CLI 用にファインチューニングされた o4-mini モデルです。API を直接使用する場合は、gpt-4.1 から始めることを推奨します。",
"cogito-2.1:671b.description": "Cogito v2.1 671Bは商用利用が可能な米国発のオープンソースLLMであり、主要モデルに匹敵する性能を持ち、トークン推論効率が高く、128kの長文コンテキストに対応し、全体的な能力も優れています。",
"cogview-3-flash.description": "CogView-3-Flashは、Zhipuが提供する無料の画像生成モデルです。ユーザーの指示に沿った画像を生成し、より高い美的品質スコアを実現します。CogView-3-Flashは主に、芸術的創作、デザインの参考、ゲーム開発、仮想現実などの分野で使用され、テキストの説明を迅速に画像に変換することを支援します。",
"cogview-4.description": "CogView-4はZhipuが開発した初のオープンソースのテキストから画像への生成モデルであり、中国語の文字生成に対応しています。意味理解、画像品質、中英テキストの描画能力が向上し、任意の長さのバイリンガルプロンプトをサポートし、指定範囲内で任意の解像度の画像を生成できます。",
@@ -342,7 +343,7 @@
"command-light-nightly.description": "主要リリース間のギャップを短縮するため、Commandのナイトリービルドを提供しています。command-lightシリーズではこれをcommand-light-nightlyと呼びます。これは最新かつ最も実験的(かつ不安定な可能性がある)バージョンであり、予告なく定期的に更新されるため、本番環境での使用は推奨されません。",
"command-light.description": "Commandの小型かつ高速なバリアントであり、ほぼ同等の能力を持ちながらも高速です。",
"command-nightly.description": "主要リリース間のギャップを短縮するため、Commandのナイトリービルドを提供しています。Commandシリーズではこれをcommand-nightlyと呼びます。これは最新かつ最も実験的(かつ不安定な可能性がある)バージョンであり、予告なく定期的に更新されるため、本番環境での使用は推奨されません。",
"command-r-03-2024.description": "Command Rは、従来モデルよりも高品質で信頼性が高く、長いコンテキストウィンドウを持つ命令追従型チャットモデルです。コード生成、RAG、ツール使用、エージェントなどの複雑なワークフローをサポートします。",
"command-r-03-2024.description": "command-rは、以前のモデルよりも高品質で信頼性が高く、長いコンテキストを持つ言語タスクを実行する指示追従型チャットモデルです。コード生成、RAG、ツール使用、エージェントなどの複雑なワークフローをサポートします。",
"command-r-08-2024.description": "command-r-08-2024は、2024年8月にリリースされたCommand Rの更新版です。",
"command-r-plus-04-2024.description": "command-r-plusはcommand-r-plus-04-2024の別名であり、APIでcommand-r-plusを使用するとこのモデルが指定されます。",
"command-r-plus-08-2024.description": "Command R+は、従来モデルよりも高品質で信頼性が高く、長いコンテキストウィンドウを持つ命令追従型チャットモデルです。複雑なRAGワークフローや多段階のツール使用に最適です。",
@@ -366,7 +367,8 @@
"deepseek-ai/DeepSeek-V2.5.description": "DeepSeek-V2.5 は DeepSeek-V2-Chat と DeepSeek-Coder-V2-Instruct を統合し、汎用能力とコーディング能力を兼ね備えたモデルです。文章生成と指示追従性が向上し、AlpacaEval 2.0、ArenaHard、AlignBench、MT-Bench で大きな進歩を示しています。",
"deepseek-ai/DeepSeek-V3.1-Terminus.description": "DeepSeek-V3.1-Terminus は V3.1 の改良版で、ハイブリッドエージェント LLM として位置づけられています。ユーザーから報告された問題を修正し、安定性と言語一貫性を向上させ、中国語と英語の混在や異常文字を削減しています。思考モードと非思考モードをチャットテンプレートで柔軟に切り替えられ、Code Agent や Search Agent の性能も向上し、ツール使用やマルチステップタスクの信頼性が高まりました。",
"deepseek-ai/DeepSeek-V3.1.description": "DeepSeek V3.1 はハイブリッド推論アーキテクチャを採用し、思考モードと非思考モードの両方をサポートします。",
"deepseek-ai/DeepSeek-V3.2-Exp.description": "DeepSeek-V3.2-Exp は次世代アーキテクチャへの橋渡しとなる実験的な V3.2 リリースです。V3.1-Terminus をベースに DeepSeek Sparse AttentionDSA)を追加し、長文コンテキストの学習と推論効率を向上させています。ツール使用、長文理解、マルチステップ推論に最適化されており、大規模コンテキストでの高効率推論の探求に理想的です。",
"deepseek-ai/DeepSeek-V3.2-Exp.description": "DeepSeek V3.2 Expは、ハイブリッド推論アーキテクチャを使用し、思考モードと非思考モードの両方をサポートします。",
"deepseek-ai/DeepSeek-V3.2.description": "DeepSeek-V3.2は、高い計算効率と優れた推論およびエージェント性能を兼ね備えたモデルです。そのアプローチは、計算複雑性を大幅に削減しながらモデル性能を維持する効率的な注意メカニズムであるDeepSeek Sparse AttentionDSA)、GPT-5に匹敵する性能を持つスケーラブルな強化学習フレームワーク、そしてツール使用シナリオに推論能力を統合する大規模エージェントタスク合成パイプラインという3つの主要な技術的ブレークスルーに基づいています。このモデルは、2025年国際数学オリンピック(IMO)および国際情報オリンピック(IOI)で金メダルを獲得しました。",
"deepseek-ai/DeepSeek-V3.description": "DeepSeek-V3 は 671B パラメータの MoE モデルで、MLA と DeepSeekMoE を使用し、損失のない負荷分散により効率的な学習と推論を実現しています。14.8T の高品質トークンで事前学習され、SFT と RL により他のオープンモデルを上回り、クローズドモデルに迫る性能を発揮します。",
"deepseek-ai/deepseek-llm-67b-chat.description": "DeepSeek LLM Chat67B)は、深い言語理解と対話能力を提供する革新的なモデルです。",
"deepseek-ai/deepseek-v3.1-terminus.description": "DeepSeek V3.1 は次世代の推論モデルで、複雑な推論と連想思考に優れ、深い分析タスクに対応します。",
@@ -433,6 +435,7 @@
"deepseek_r1_distill_llama_70b.description": "DeepSeek-R1-Distill-Llama-70Bは、Llama-3.3-70B-Instructから蒸留されたモデルで、DeepSeek-R1シリーズの一部として、DeepSeek-R1が生成したサンプルでファインチューニングされ、数学、コーディング、推論において高い性能を発揮します。",
"deepseek_r1_distill_qwen_14b.description": "DeepSeek-R1-Distill-Qwen-14Bは、Qwen2.5-14Bから蒸留され、DeepSeek-R1が生成した80万件の厳選サンプルでファインチューニングされ、強力な推論能力を発揮します。",
"deepseek_r1_distill_qwen_32b.description": "DeepSeek-R1-Distill-Qwen-32Bは、Qwen2.5-32Bから蒸留され、DeepSeek-R1が生成した80万件の厳選サンプルでファインチューニングされ、数学、コーディング、推論において卓越した性能を発揮します。",
"devstral-2512.description": "Devstral 2は、コードベースの探索、複数ファイルの編集、ソフトウェアエンジニアリングエージェントの強化に優れたエンタープライズレベルのテキストモデルです。",
"devstral-2:123b.description": "Devstral 2 123B は、ツールを活用してコードベースを探索し、複数ファイルを編集し、ソフトウェアエンジニアリングエージェントを支援することに優れています。",
"doubao-1.5-lite-32k.description": "Doubao-1.5-lite は、超高速応答を実現する新しい軽量モデルで、最高水準の品質と低遅延を提供します。",
"doubao-1.5-pro-256k.description": "Doubao-1.5-pro-256k は Doubao-1.5-Pro の包括的なアップグレード版で、全体的な性能が10%向上しています。256kのコンテキストウィンドウと最大12kの出力トークンに対応し、より高性能で広範なユースケースに対応する価値の高いモデルです。",
@@ -546,10 +549,10 @@
"gemini-2.5-pro-preview-06-05.description": "Gemini 2.5 Pro Preview は、Google による最も高度な推論モデルで、コード、数学、STEM 問題に対する推論や、大規模なデータセット、コードベース、文書の分析に対応します。",
"gemini-2.5-pro.description": "Gemini 2.5 Pro は、Google による最も高度な推論モデルで、コード、数学、STEM 問題に対する推論や、大規模なデータセット、コードベース、文書の分析に対応します。",
"gemini-3-flash-preview.description": "Gemini 3 Flash は、最先端の知能と優れた検索基盤を融合し、スピードに特化した最もスマートなモデルです。",
"gemini-3-pro-image-preview.description": "Gemini 3 Pro ImageNano Banana Pro)は、Google による画像生成モデルで、マルチモーダル対話にも対応しています。",
"gemini-3-pro-image-preview.description": "Gemini 3 Pro ImageNano Banana Pro)は、Google画像生成モデルで、マルチモーダル対話もサポートします。",
"gemini-3-pro-image-preview:image.description": "Gemini 3 Pro ImageNano Banana Pro)は、Google による画像生成モデルであり、マルチモーダルチャットにも対応しています。",
"gemini-3-pro-preview.description": "Gemini 3 Pro は、Google による最も強力なエージェントおよびバイブコーディングモデルで、最先端の推論に加え、より豊かなビジュアルと深い対話を実現します。",
"gemini-3.1-flash-image-preview.description": "Gemini 3.1 Flash ImageNano Banana 2)は、フラッシュ速度でプロレベルの画像品質を提供し、マルチモーダルチャットをサポートします。",
"gemini-3.1-flash-image-preview.description": "Gemini 3.1 Flash ImageNano Banana 2)は、Googleの最速のネイティブ画像生成モデルで、思考サポート、対話型画像生成および編集を提供します。",
"gemini-3.1-flash-image-preview:image.description": "Gemini 3.1 Flash ImageNano Banana 2)は、フラッシュ速度でプロレベルの画像品質を提供し、マルチモーダルチャットをサポートします。",
"gemini-3.1-pro-preview.description": "Gemini 3.1 Pro Previewは、Gemini 3 Proの推論能力を強化し、中程度の思考レベルサポートを追加しています。",
"gemini-flash-latest.description": "Gemini Flash の最新リリース",
@@ -605,19 +608,15 @@
"google/gemini-2.0-flash-lite-001.description": "Gemini 2.0 Flash Liteは軽量なGeminiバリアントで、レイテンシとコストを改善するためにデフォルトで思考機能が無効化されていますが、パラメータで有効化可能です。",
"google/gemini-2.0-flash-lite.description": "Gemini 2.0 Flash Liteは、優れた速度、組み込みツール使用、マルチモーダル生成、1Mトークンのコンテキストウィンドウなど、次世代の機能を提供します。",
"google/gemini-2.0-flash.description": "Gemini 2.0 Flashは、拡張されたマルチモーダルタスク向けに設計されたGoogleの高性能推論モデルです。",
"google/gemini-2.5-flash-image-free.description": "Gemini 2.5 Flash Imageの無料枠では、制限付きのマルチモーダル生成が可能です。",
"google/gemini-2.5-flash-image-preview.description": "Gemini 2.5 Flashの実験的モデルで、画像生成をサポートしています。",
"google/gemini-2.5-flash-image.description": "Gemini 2.5 Flash ImageNano Banana)は、マルチモーダル会話をサポートするGoogleの画像生成モデルです。",
"google/gemini-2.5-flash-lite.description": "Gemini 2.5 Flash Liteは、レイテンシとコストに最適化された軽量バリアントで、高スループットなシナリオに適しています。",
"google/gemini-2.5-flash-preview.description": "Gemini 2.5 Flashは、推論、コーディング、数学、科学タスク向けに構築されたGoogleの最先端フラッグシップモデルです。「思考」機能を内蔵しており、より高精度な応答と精緻なコンテキスト処理を実現します。\n\n注:このモデルには「思考あり」と「思考なし」の2つのバリアントがあります。思考が有効かどうかで出力価格が大きく異なります。標準バリアント(「:thinking」サフィックスなし)を選択した場合、モデルは思考トークンの生成を明示的に回避します。\n\n思考を使用し、思考トークンを受け取るには「:thinking」バリアントを選択する必要があり、思考出力の価格が高くなります。\n\nまた、「max reasoning tokens」パラメータで構成可能です(https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning)。",
"google/gemini-2.5-flash-preview:thinking.description": "Gemini 2.5 Flashは、推論、コーディング、数学、科学タスク向けに構築されたGoogleの最先端フラッグシップモデルです。「思考」機能を内蔵しており、より高精度な応答と精緻なコンテキスト処理を実現します。\n\n注:このモデルには「思考あり」と「思考なし」の2つのバリアントがあります。思考が有効かどうかで出力価格が大きく異なります。標準バリアント(「:thinking」サフィックスなし)を選択した場合、モデルは思考トークンの生成を明示的に回避します。\n\n思考を使用し、思考トークンを受け取るには「:thinking」バリアントを選択する必要があり、思考出力の価格が高くなります。\n\nまた、「max reasoning tokens」パラメータで構成可能です(https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning)。",
"google/gemini-2.5-flash.description": "Gemini 2.5 FlashLite/Pro/Flash)は、低レイテンシから高性能推論までをカバーするGoogleのモデルファミリーです。",
"google/gemini-2.5-pro-free.description": "Gemini 2.5 Proの無料枠では、制限付きのマルチモーダル長文コンテキスト処理が可能で、試用や軽量なワークフローに適しています。",
"google/gemini-2.5-flash.description": "Gemini 2.5 Flashは、低遅延から高性能推論までをカバーするGoogleのファミリーです。",
"google/gemini-2.5-pro-preview.description": "Gemini 2.5 Pro Previewは、コード、数学、STEM分野の複雑な問題に対する推論や、大規模データセット、コードベース、長文ドキュメントの分析に最適なGoogleの最先端思考モデルです。",
"google/gemini-2.5-pro.description": "Gemini 2.5 Proは、複雑なタスクに対応する長文コンテキストサポートを備えたGoogleのフラッグシップ推論モデルです。",
"google/gemini-3-pro-image-preview-free.description": "Gemini 3 Pro Imageの無料枠では、制限付きのマルチモーダル生成が可能です。",
"google/gemini-3-pro-image-preview.description": "Gemini 3 Pro ImageNano Banana Pro)は、マルチモーダル会話をサポートするGoogleの画像生成モデルです。",
"google/gemini-3-pro-preview-free.description": "Gemini 3 Pro Preview Freeは、標準版と同等のマルチモーダル理解と推論を提供しますが、クォータとレート制限があるため、試用や低頻度の使用に適しています。",
"google/gemini-3-pro-preview.description": "Gemini 3 Proは、Geminiファミリーの次世代マルチモーダル推論モデルで、テキスト、音声、画像、動画を理解し、複雑なタスクや大規模コードベースを処理できます。",
"google/gemini-embedding-001.description": "英語、多言語、コードタスクにおいて高性能を発揮する最先端の埋め込みモデルです。",
"google/gemini-flash-1.5.description": "Gemini 1.5 Flashは、複雑なタスクに対応する最適化されたマルチモーダル処理を提供します。",
@@ -717,15 +716,24 @@
"hunyuan-a13b.description": "Hunyuan による初のハイブリッド推論モデルで、hunyuan-standard-256K(総パラメータ数 80B、アクティブ 13B)からアップグレードされました。デフォルトでは遅い思考を行い、パラメータやプレフィックス /no_think により高速/低速の切り替えが可能です。前世代と比べて、特に数学、科学、長文理解、エージェントタスクにおいて全体的な能力が向上しています。",
"hunyuan-code.description": "Hunyuanの最新コードモデルは、200Bの高品質コードデータと6か月のSFTデータでトレーニングされ、8Kコンテキストを備えています。自動コードベンチマークおよび5つの言語における専門家の人間評価で上位にランクされています。",
"hunyuan-functioncall.description": "Hunyuanの最新MoE FunctionCallモデルは、高品質なツール呼び出しデータでトレーニングされ、32Kコンテキストウィンドウを備え、さまざまな次元でのベンチマークでリードしています。",
"hunyuan-large-longcontext.description": "長文タスク(要約やQAなど)に優れ、一般的な生成も処理可能です。複雑で詳細なコンテンツの長文分析と生成に強みを持ちます。",
"hunyuan-large.description": "Hunyuan-largeは、総パラメータ約3890億、アクティブ約520億を持つ、Transformerアーキテクチャにおける最大かつ最強のオープンMoEモデルです。",
"hunyuan-lite.description": "MoE アーキテクチャにアップグレードされ、256K のコンテキストウィンドウを備え、NLP、コード、数学、業界ベンチマークにおいて多くのオープンモデルをリードしています。",
"hunyuan-pro.description": "1 兆パラメータの MOE-32K 長文コンテキストモデルで、ベンチマークをリードし、複雑な指示や推論、高度な数学、関数呼び出しに強く、多言語翻訳、金融、法律、医療分野に最適化されています。",
"hunyuan-role.description": "Hunyuanの最新ロールプレイモデルは、ロールプレイデータで正式にファインチューニングされ、ロールプレイシナリオでの基本性能が強化されています。",
"hunyuan-standard-256K.description": "改良されたルーティングを使用して負荷分散とエキスパート崩壊を軽減します。長文の「干し草の中の針」検索が99.9%に達します。MOE-256Kは長さと品質をさらに押し広げ、入力長を大幅に拡大します。",
"hunyuan-standard.description": "改良されたルーティングを使用して負荷分散とエキスパート崩壊を軽減します。長文の「干し草の中の針」検索が99.9%に達します。MOE-32Kは、長文入力の品質と価格のバランスを取りながら、より良い価値を提供します。",
"hunyuan-standard-256K.description": "負荷分散とエキスパート崩壊を軽減する改良されたルーティングを使用します。長いコンテキストで99.9%のニードルインハイスタックを達成します。MOE-256Kはコンテキストの長さと品質をさらに拡張します。",
"hunyuan-standard.description": "負荷分散とエキスパート崩壊を軽減する改良されたルーティングを使用します。長いコンテキストで99.9%のニードルインハイスタックを達成します。MOE-32Kは長い入力を処理しながら高い価値を提供します。",
"hunyuan-t1-20250321.description": "芸術とSTEMの能力をバランスよく構築し、長文情報のキャプチャに優れています。数学、論理、科学、コード問題における推論回答をサポートします。",
"hunyuan-t1-20250403.description": "プロジェクトレベルのコード生成と執筆品質を向上させ、マルチターントピックの理解とToB指示追従を強化し、単語レベルの理解を改善し、簡体字/繁体字および中国語/英語の混在出力問題を軽減します。",
"hunyuan-t1-20250529.description": "創造的な執筆と作曲を改善し、フロントエンドコーディング、数学、論理推論を強化し、指示追従を向上させます。",
"hunyuan-t1-20250711.description": "難しい数学、論理、コーディングを大幅に改善し、出力の安定性を向上させ、長文能力を強化します。",
"hunyuan-t1-latest.description": "難解な数学、複雑な推論、難易度の高いコーディング、指示の遵守、創造的な文章品質において、スローシンキングモデルの性能を大幅に向上させます。",
"hunyuan-t1-vision-20250916.description": "最新のt1-vision深層推論モデルで、VQA、視覚的グラウンディング、OCR、チャート、写真問題の解決、画像ベースの創作において大幅な改善があり、英語および低リソース言語の対応力も強化されています。",
"hunyuan-turbo-20241223.description": "このバージョンは、指示スケーリングを強化して一般化を向上させ、数学/コード/論理推論を大幅に改善し、単語レベルの理解を強化し、執筆品質を向上させます。",
"hunyuan-turbo-latest.description": "NLP理解、執筆、チャット、QA、翻訳、ドメイン全般での体験を向上させます。より人間らしい応答、曖昧な意図の明確化、単語解析の改善、創造性の高い品質と対話性、マルチターン会話の強化を実現します。",
"hunyuan-turbo.description": "Hunyuanの次世代LLMのプレビュー版で、新しいMoEアーキテクチャを採用し、hunyuan-proよりも高速な推論と強力な成果を提供します。",
"hunyuan-turbos-latest.description": "最新のHunyuan TurboSフラッグシップモデルで、より強力な推論能力と全体的な体験の向上を実現します。",
"hunyuan-turbos-longtext-128k-20250325.description": "長文タスク(要約やQAなど)に優れ、一般的な生成も処理可能です。複雑で詳細なコンテンツの長文分析と生成に強みを持ちます。",
"hunyuan-vision-1.5-instruct.description": "TurboSテキストベースを基にした高速思考の画像からテキストへのモデルで、基本的な画像認識と画像分析推論において前バージョンより顕著な改善を示します。",
"hunyuan-vision.description": "Hunyuanの最新マルチモーダルモデルは、画像+テキスト入力をサポートし、テキストを生成します。",
"image-01-live.description": "細部まで表現可能な画像生成モデルで、テキストから画像生成およびスタイルの制御プリセットに対応しています。",
@@ -770,8 +778,7 @@
"kimi-k2:1t.description": "Kimi K2 は、Moonshot AI による大規模 MoE LLM で、総パラメータ数 1T、1回のフォワードパスでアクティブ 32B。高度なツール使用、推論、コード生成などのエージェント機能に最適化されています。",
"kimi-latest.description": "Kimi Latest は最新の Kimi モデルを使用し、実験的な機能を含む場合があります。画像理解をサポートし、コンテキスト長に応じて 8k/32k/128k の課金モデルを自動選択します。",
"kuaishou/kat-coder-pro-v1.description": "KAT-Coder-Pro-V1(期間限定無料)は、効率的なコーディングエージェントのためのコード理解と自動化に特化しています。",
"learnlm-1.5-pro-experimental.description": "LearnLM は、学習科学の原則に基づいてタスク特化型に訓練された実験的モデルで、教育・学習シナリオにおいてシステム指示に従い、専門的なチューターとして機能します。",
"learnlm-2.0-flash-experimental.description": "LearnLM は、学習科学の原則に基づいてタスク特化型に訓練された実験的モデルで、教育・学習シナリオにおいてシステム指示に従い、専門的なチューターとして機能します。",
"labs-devstral-small-2512.description": "Devstral Small 2は、コードベースの探索、複数ファイルの編集、ソフトウェアエンジニアリングエージェントの強化に優れています。",
"lite.description": "Spark Lite は、超低遅延かつ効率的な処理を実現する軽量LLMです。完全無料でリアルタイムのウェブ検索をサポートします。低スペックデバイスやモデルのファインチューニングにおいても高速応答を実現し、知識Q&A、コンテンツ生成、検索シナリオにおいて高いコスト効率と知的体験を提供します。",
"llama-3.1-70b-versatile.description": "Llama 3.1 70B は、複雑なアプリケーション向けに強化されたAI推論を提供し、高効率かつ高精度で大規模計算をサポートします。",
"llama-3.1-8b-instant.description": "Llama 3.1 8B は、高速なテキスト生成を実現する高効率モデルで、大規模かつコスト効率の高いアプリケーションに最適です。",
@@ -782,7 +789,6 @@
"llama-3.2-90b-vision-preview.description": "Llama 3.2 は視覚と言語を組み合わせたタスク向けに設計されており、画像キャプション生成や視覚的Q&Aに優れ、言語生成と視覚推論の橋渡しをします。",
"llama-3.2-vision-instruct.description": "Llama 3.2-Vision インストラクションチューニングモデルは、視覚認識、画像推論、キャプション生成、一般的な画像Q&Aに最適化されています。",
"llama-3.3-70b-versatile.description": "Meta Llama 3.3 は、70Bパラメータを持つ多言語対応LLMで、事前学習版とインストラクションチューニング版を提供します。テキスト専用のインストラクションチューニングモデルは多言語対話に最適化されており、業界の一般的なベンチマークで多くのオープン・クローズドチャットモデルを上回ります。",
"llama-3.3-70b.description": "Llama 3.3 70B は、推論能力とスループットのバランスを取った中〜大規模モデルです。",
"llama-3.3-instruct.description": "Llama 3.3 インストラクションチューニングモデルはチャットに最適化されており、業界の一般的なベンチマークで多くのオープンチャットモデルを上回ります。",
"llama3-70b-8192.description": "Meta Llama 3 70B は、要求の厳しいプロジェクトに対応する卓越した複雑性処理能力を提供します。",
"llama3-8b-8192.description": "Meta Llama 3 8B は、多様なシナリオにおいて強力な推論性能を発揮します。",
@@ -832,7 +838,6 @@
"meta-llama/llama-3.1-8b-instruct:free.description": "LLaMA 3.1は多言語対応を備えた、最先端の生成モデルの一つです。",
"meta-llama/llama-3.2-11b-vision-instruct.description": "LLaMA 3.2は視覚と言語を組み合わせたタスク向けに設計されており、画像キャプション生成や視覚的質問応答に優れ、言語生成と視覚的推論の橋渡しを行います。",
"meta-llama/llama-3.2-3b-instruct.description": "meta-llama/llama-3.2-3b-instruct",
"meta-llama/llama-3.2-90b-vision-instruct.description": "LLaMA 3.2は視覚と言語を組み合わせたタスク向けに設計されており、画像キャプション生成や視覚的質問応答に優れ、言語生成と視覚的推論の橋渡しを行います。",
"meta-llama/llama-3.3-70b-instruct.description": "Llama 3.3は最も高度な多言語対応のオープンソースLlamaモデルで、非常に低コストで405Bに近い性能を提供します。Transformerベースで、SFTとRLHFにより有用性と安全性が向上。命令調整版は多言語チャットに最適化され、業界ベンチマークで多くのオープン・クローズドチャットモデルを上回ります。知識カットオフ:2023年12月。",
"meta-llama/llama-3.3-70b-instruct:free.description": "Llama 3.3は最も高度な多言語対応のオープンソースLlamaモデルで、非常に低コストで405Bに近い性能を提供します。Transformerベースで、SFTとRLHFにより有用性と安全性が向上。命令調整版は多言語チャットに最適化され、業界ベンチマークで多くのオープン・クローズドチャットモデルを上回ります。知識カットオフ:2023年12月。",
"meta.llama3-1-405b-instruct-v1:0.description": "Meta Llama 3.1 405B Instructは、Llama 3.1 Instructモデルの中で最大かつ最も強力なモデルであり、対話推論や合成データ生成に優れ、ドメイン特化の事前学習やファインチューニングの基盤としても最適です。Llama 3.1の多言語LLMは、8B、70B、405Bのサイズで事前学習および命令調整された生成モデル(テキスト入力/出力)です。命令調整モデルは多言語対話に最適化され、業界標準のベンチマークで多くのオープンチャットモデルを上回ります。Llama 3.1は商用および研究用途に対応しており、命令調整モデルはアシスタント型チャットに、事前学習モデルはより広範な自然言語生成タスクに適しています。Llama 3.1の出力は、合成データ生成や精緻化など、他のモデルの改善にも活用可能です。Llama 3.1は自己回帰型Transformerモデルで、最適化されたアーキテクチャを採用。命令調整版はSFT(教師ありファインチューニング)とRLHF(人間のフィードバックによる強化学習)を用いて、人間の好みに沿った有用性と安全性を実現しています。",
@@ -894,7 +899,7 @@
"mistral-large-instruct.description": "Mistral-Large-Instruct-2407は、123Bパラメータを持つ高密度LLMで、最先端の推論力、知識、コーディング能力を備えています。",
"mistral-large-latest.description": "Mistral Largeは、マルチリンガルタスク、複雑な推論、コード生成に強く、高度なアプリケーションに最適なフラッグシップモデルです。",
"mistral-large.description": "Mixtral Largeは、Mistralのフラッグシップモデルで、コード生成、数学、推論を128Kのコンテキストウィンドウで実現します。",
"mistral-medium-latest.description": "Mistral Medium 3は、8倍コスト削減で最先端の性能を提供し、企業導入を簡素化します。",
"mistral-medium-latest.description": "Mistral Medium 3.1は、8倍コストで最先端のパフォーマンスを提供し、エンタープライズ展開を簡素化します。",
"mistral-nemo-instruct.description": "Mistral-Nemo-Instruct-2407は、Mistral-Nemo-Base-2407の命令調整版です。",
"mistral-nemo.description": "Mistral Nemoは、Mistral AIとNVIDIAによる高効率な12Bモデルです。",
"mistral-small-latest.description": "Mistral Smallは、翻訳、要約、感情分析においてコスト効率が高く、迅速かつ信頼性の高い選択肢です。",
@@ -933,7 +938,7 @@
"moonshot-v1-auto.description": "Moonshot V1 Autoは、現在のコンテキストトークンの使用状況に基づいて適切なモデルを自動選択します。",
"moonshotai/Kimi-Dev-72B.description": "Kimi-Dev-72Bは、堅牢で本番環境対応のパッチを生成するために大規模な強化学習で最適化されたオープンソースのコードLLMです。SWE-bench Verifiedで60.4%のスコアを記録し、バグ修正やコードレビューなどの自動ソフトウェアエンジニアリングタスクにおいてオープンモデルの新記録を樹立しました。",
"moonshotai/Kimi-K2-Instruct-0905.description": "Kimi K2-Instruct-0905は、最新かつ最強のKimi K2モデルです。1兆の総パラメータと32Bのアクティブパラメータを持つトップクラスのMoEモデルで、エージェント的なコーディング知能が強化され、ベンチマークや実世界のエージェントタスクで大きな成果を上げています。フロントエンドのコードの美しさと使いやすさも向上しています。",
"moonshotai/Kimi-K2-Thinking.description": "Kimi K2 Thinkingは、最新かつ最強のオープンソース思考モデルで多段階推論の深さを大幅に拡張し、200300回連続ツール使用において安定性を維持します。Humanity's Last ExamHLE)、BrowseCompなどのベンチマークで新記録を樹立しコーディング、数学、論理、エージェントシナリオに優れています。約1兆のパラメータを持つMoEアーキテクチャに基づき、256Kのコンテキストウィンドウとツール呼び出しをサポートします。",
"moonshotai/Kimi-K2-Thinking.description": "Kimi K2 Thinkingは、最新かつ最強のオープンソース思考モデルです。多段階推論の深さを大幅に拡張し、200300回連続の安定したツール使用を維持します。Humanity's Last ExamHLE)、BrowseComp、その他のベンチマークで新記録を樹立しました。コーディング、数学、論理、エージェントシナリオに優れています。約1兆のパラメータを持つMoEアーキテクチャに基づき、256Kのコンテキストウィンドウとツール呼び出しをサポートします。",
"moonshotai/kimi-k2-0711.description": "Kimi K2 0711は、Kimiシリーズのインストラクションバリアントで、高品質なコード生成とツール使用に適しています。",
"moonshotai/kimi-k2-0905.description": "Kimi K2 0905は、コンテキストと推論性能を拡張し、コーディング最適化を施したアップデート版です。",
"moonshotai/kimi-k2-instruct-0905.description": "kimi-k2-0905-previewモデルは、256Kのコンテキストウィンドウをサポートし、エージェント的なコーディング能力が強化され、実用的で洗練されたフロントエンドコードと優れたコンテキスト理解を提供します。",
@@ -948,8 +953,8 @@
"nvidia/Llama-3.1-Nemotron-70B-Instruct-HF.description": "Llama 3.1 Nemotron 70Bは、NVIDIAがカスタマイズしたLLMで、応答の有用性を向上させるよう設計されています。Arena Hard、AlpacaEval 2 LC、GPT-4-Turbo MT-Benchでトップの成績を収め、2024年10月1日時点で3つの自動アライメントベンチマークすべてで1位を獲得しています。Llama-3.1-70B-Instructをベースに、RLHFREINFORCE)、Llama-3.1-Nemotron-70B-Reward、HelpSteer2-Preferenceプロンプトでトレーニングされています。",
"nvidia/llama-3.1-nemotron-51b-instruct.description": "高精度かつ高効率な言語モデルで、独自の特長を持ちます。",
"nvidia/llama-3.1-nemotron-70b-instruct.description": "Llama-3.1-Nemotron-70B-Instructは、NVIDIAがカスタマイズしたモデルで、LLMの応答の有用性を向上させるよう設計されています。",
"o1-mini.description": "o1-previewよりも小型かつ高速でコストは80%削減。コード生成や短いコンテキストのタスクに強みがあります。",
"o1-preview.description": "高度な推論や複雑な問題解決(数学や科学を含む)に特化。深いコンテキスト理解や自律的なワークフローが求められるアプリケーションに最適です。",
"o1-mini.description": "o1-miniは、コーディング、数学、科学向けに設計された高速でコスト効率の高い推論モデルです。128Kのコンテキストと2023年10月の知識カットオフを持ちます。",
"o1-preview.description": "o1は、広範な知識を必要とする複雑なタスク向けのOpenAIの新しい推論モデルです。128Kのコンテキストと2023年10月の知識カットオフを持ちます。",
"o1-pro.description": "o1シリーズは、回答前に思考するよう強化学習で訓練され、複雑な推論を処理できます。o1-proはより多くの計算資源を使用し、より深い思考と一貫して高品質な回答を提供します。",
"o1.description": "o1はOpenAIの新しい推論モデルで、テキスト+画像入力とテキスト出力に対応し、幅広い知識を必要とする複雑なタスクに適しています。200Kのコンテキストウィンドウと2023年10月の知識カットオフを持ちます。",
"o3-2025-04-16.description": "o3はOpenAIの新しい推論モデルで、テキスト+画像入力とテキスト出力に対応し、幅広い知識を必要とする複雑なタスクに適しています。",
@@ -1022,7 +1027,6 @@
"qianfan-check-vl.description": "Qianfan Check VLは、画像とテキストのコンプライアンス確認や認識タスクに対応するマルチモーダルコンテンツ審査モデルです。",
"qianfan-composition.description": "Qianfan Compositionは、画像とテキストの混合理解・生成に対応するマルチモーダル創作モデルです。",
"qianfan-engcard-vl.description": "Qianfan EngCard VLは、英語シナリオに特化したマルチモーダル認識モデルです。",
"qianfan-lightning-128b-a19b.description": "Qianfan Lightning 128B A19Bは、複雑なQAや大規模推論に対応する高性能な中国語汎用モデルです。",
"qianfan-llama-vl-8b.description": "Qianfan Llama VL 8Bは、Llamaをベースにしたマルチモーダルモデルで、一般的な画像と言語の理解に対応します。",
"qianfan-multipicocr.description": "Qianfan MultiPicOCRは、複数画像に対応したOCRモデルで、画像間のテキスト検出と認識を行います。",
"qianfan-qi-vl.description": "Qianfan QI VLは、複雑な画像と言語のシナリオにおける高精度な検索と質問応答に対応するマルチモーダルQAモデルです。",
@@ -1032,7 +1036,6 @@
"qvq-72b-preview.description": "QVQ-72B-Previewは、視覚的推論の向上を目的としたQwenの実験的研究モデルです。",
"qvq-max.description": "Qwen QVQ視覚推論モデルは、視覚入力と連想的思考出力に対応し、数学、コーディング、視覚分析、創造的タスク、一般タスクにおいて高い性能を発揮します。",
"qvq-plus.description": "視覚入力と連想的思考出力に対応する視覚推論モデル。qvq-plusシリーズはqvq-maxの後継で、より高速な推論と優れたコストパフォーマンスを実現します。",
"qwen-3-32b.description": "Qwen 3 32B:多言語対応とコーディングタスクに強く、中規模なプロダクション用途に適しています。",
"qwen-coder-plus.description": "Qwenコードモデル。",
"qwen-coder-turbo-latest.description": "Qwenコードモデル。",
"qwen-coder-turbo.description": "Qwenコードモデル。",
@@ -1128,7 +1131,6 @@
"qwen3-coder-next.description": "次世代Qwenコーダーは、複雑なマルチファイルコード生成、デバッグ、高スループットエージェントワークフローに最適化されています。強力なツール統合と推論性能の向上を目指して設計されています。",
"qwen3-coder-plus.description": "Qwenコードモデル。最新のQwen3-Coderシリーズは、Qwen3をベースにしており、自律的なプログラミングのための強力なコードエージェント機能、ツール使用、環境との対話を提供します。優れたコード性能と堅実な汎用能力を備えています。",
"qwen3-coder:480b.description": "エージェントおよびコーディングタスク向けのAlibabaの高性能長文コンテキストモデルです。",
"qwen3-max-2026-01-23.description": "Qwen3 Maxモデルは、2.5シリーズに比べて汎用能力、中国語・英語理解、複雑な指示追従、主観的なオープンタスク、多言語対応、ツール利用において大幅な向上を実現し、幻覚の発生も抑制されています。最新のqwen3-maxは、qwen3-max-previewよりもエージェントプログラミングとツール利用が改善されており、分野別SOTAを達成し、より複雑なエージェントニーズに対応します。",
"qwen3-max-preview.description": "複雑で多段階のタスクに対応する最高性能のQwenモデル。プレビュー版は思考機能をサポートします。",
"qwen3-max.description": "Qwen3 Maxモデルは、2.5シリーズに比べて汎用能力、中国語/英語理解、複雑な指示の追従、主観的なオープンタスク、多言語対応、ツール使用において大幅な向上を実現し、幻覚の発生も抑制されています。最新のqwen3-maxは、qwen3-max-previewよりもエージェントプログラミングとツール使用が改善されており、分野別SOTAに到達し、より複雑なエージェントニーズに対応します。",
"qwen3-next-80b-a3b-instruct.description": "次世代のQwen3非思考型オープンソースモデル。前バージョン(Qwen3-235B-A22B-Instruct-2507)と比較して、中国語理解、論理的推論、テキスト生成が向上しています。",
@@ -1145,7 +1147,8 @@
"qwen3-vl-flash.description": "Qwen3 VL Flash:遅延に敏感または高トラフィックなリクエスト向けの軽量・高速推論モデルです。",
"qwen3-vl-plus.description": "Qwen VLは、視覚理解を備えたテキスト生成モデルです。OCRや要約、推論が可能で、商品画像から属性を抽出したり、画像から問題を解決したりできます。",
"qwen3.5-397b-a17b.description": "テキスト、画像、ビデオ入力をサポートします。テキストのみのタスクでは、Qwen3 Maxに匹敵する性能を発揮し、効率が高くコストが低いです。マルチモーダル能力においては、Qwen3 VLシリーズよりも大幅に改善されています。",
"qwen3.5-plus.description": "Qwen3.5 Plusは、テキスト、画像、ビデオ入力をサポートします。テキストのみのタスクではQwen3 Maxに匹敵する性能を発揮し、効率が高くコストが低いです。マルチモーダル能力においては、Qwen3 VLシリーズよりも大幅に改善されています。",
"qwen3.5-plus.description": "Qwen3.5 Plusは、テキスト、画像、ビデオ入力をサポートします。純粋なテキストタスクでの性能はQwen3 Maxに匹敵し、より良い性能と低コストを実現します。そのマルチモーダル能力Qwen3 VLシリーズと比較して大幅に向上しています。",
"qwen3.5:397b.description": "Qwen3.5は、ハイブリッドアーキテクチャ(Mixture-of-Experts + 線形注意)を備えた統一的なビジョン・言語基盤モデルで、強力なマルチモーダル推論、コーディング、長文コンテキスト能力を提供し、256Kのコンテキストウィンドウをサポートします。",
"qwen3.description": "Qwen3は、Alibabaが開発した次世代の大規模言語モデルで、多様なユースケースにおいて高い性能を発揮します。",
"qwq-32b-preview.description": "QwQは、推論能力の向上に焦点を当てたQwenの実験的研究モデルです。",
"qwq-32b.description": "QwQは、Qwenファミリーの推論モデルです。標準的な指示調整モデルと比較して、思考と推論能力に優れ、特に複雑な問題において下流性能を大幅に向上させます。QwQ-32Bは、DeepSeek-R1やo1-miniと並ぶ中規模の推論モデルです。",
@@ -1187,7 +1190,7 @@
"step-2-16k.description": "複雑な対話に対応する大規模コンテキスト処理をサポートします。",
"step-2-mini.description": "次世代の社内開発 MFA アテンションアーキテクチャに基づき、Step-1 に近い性能を大幅に低コストで実現し、高スループットと低レイテンシを達成します。一般的なタスクに対応し、コーディング能力にも優れています。",
"step-2x-large.description": "StepFun による次世代画像生成モデルで、テキストプロンプトから高品質な画像を生成します。よりリアルな質感と強力な中英テキスト描画能力を備えています。",
"step-3.5-flash.description": "Stepfunのフラッグシップ言語推論モデル。このモデルは、トップクラスの推論能力と迅速かつ信頼性の高い実行を提供します。複雑なタスクを分解して計画し、それを実行するためのツールを迅速かつ確実に呼び出し、論理推論、数学、ソフトウェアエンジニアリング、深い研究、その他の高度なタスクに優れています。コンテキスト長は256Kです。",
"step-3.5-flash.description": "Stepfunのフラッグシップ言語推論モデル。このモデルは、トップクラスの推論能力と迅速かつ信頼性の高い実行能力を備えています。複雑なタスクを分解して計画し、ツールを迅速かつ確実に呼び出してタスクを実行し、論理推論、数学、ソフトウェアエンジニアリング、深い研究などのさまざまな複雑なタスクに対応できます。",
"step-3.description": "このモデルは優れた視覚認識と複雑な推論能力を持ち、分野横断的な知識理解、数学と視覚の複合分析、日常的な視覚分析タスクに正確に対応します。",
"step-r1-v-mini.description": "画像理解に優れた推論モデルで、画像とテキストを処理し、深い推論を経てテキストを生成します。視覚的推論に強く、数学、コーディング、テキスト推論において最高水準の性能を発揮し、100K のコンテキストウィンドウに対応します。",
"stepfun-ai/step3.description": "Step3 は、StepFun による最先端のマルチモーダル推論モデルで、MoE アーキテクチャに基づき、総パラメータ数 321B、アクティブパラメータ数 38B を備えています。エンドツーエンド設計によりデコードコストを最小化し、最高水準の視覚と言語の推論を実現します。MFA と AFD 設計により、ハイエンドからローエンドのアクセラレータまで効率的に動作します。事前学習には 20T 以上のテキストトークンと 4T の画像テキストトークンを多言語で使用し、数学、コード、マルチモーダルベンチマークでトップクラスのオープンモデル性能を達成しています。",
@@ -1276,10 +1279,11 @@
"z-ai/glm4.7.description": "GLM-4.7は、エージェントコーディングシナリオ向けに強化されたZhipuの最新フラッグシップモデルで、コーディング能力が向上しています。",
"z-ai/glm5.description": "GLM-5は、Zhipu AIの新しいフラッグシップ基盤モデルで、エージェントエンジニアリングにおいてオープンソースのSOTA性能を達成しています。Claude Opus 4.5に匹敵する性能を持っています。",
"z-image-turbo.description": "Z-Imageは軽量なテキストから画像生成モデルで、迅速に画像を生成し、中国語と英語のテキストレンダリングをサポートし、複数の解像度とアスペクト比に柔軟に適応します。",
"zai-glm-4.7.description": "このモデルは、先進的な推論能力、優れたツール使用、エージェント的なコーディングアプリケーションにおける現実世界の性能を強化し、強力なコーディング性能を提供します。",
"zai-org/GLM-4.5-Air.description": "GLM-4.5-Airは、Mixture-of-Expertsアーキテクチャを採用したエージェントアプリケーション向けのベースモデルです。ツール使用、Webブラウジング、ソフトウェア開発、フロントエンドコーディングに最適化されており、Claude CodeやRoo Codeなどのコードエージェントと統合可能です。ハイブリッド推論により、複雑な推論と日常的なシナリオの両方に対応します。",
"zai-org/GLM-4.5.description": "GLM-4.5は、Mixture-of-Expertsアーキテクチャを採用したエージェントアプリケーション向けのベースモデルで、ツール使用、Webブラウジング、ソフトウェア開発、フロントエンドコーディングに深く最適化されています。Claude CodeやRoo Codeなどのコードエージェントと統合可能で、ハイブリッド推論により複雑な推論と日常的なシナリオの両方に対応します。",
"zai-org/GLM-4.5V.description": "GLM-4.5Vは、GLM-4.5-AirをベースにしたZhipu AIの最新VLMで、106B総パラメータ(12Bアクティブ)のMoEアーキテクチャを採用し、低コストで高性能を実現しています。GLM-4.1V-Thinkingの系譜を継承し、3D-RoPEにより3D空間推論を強化。事前学習、SFT、RLを通じて最適化され、画像、動画、長文文書を処理可能。41の公開マルチモーダルベンチマークでトップクラスの評価を獲得。Thinkingモードの切り替えにより、速度と深さのバランスを調整可能です。",
"zai-org/GLM-4.6.description": "GLM-4.5と比較して、GLM-4.6はコンテキスト長を128Kから200Kに拡張し、より複雑なエージェントタスクに対応。コードベンチマークで高スコアを記録し、Claude Code、Cline、Roo Code、Kilo Codeなどのアプリで実用性能が向上。推論能力が強化され、推論中のツール使用も可能に。エージェントフレームワークへの統合性が向上し、ツール/検索エージェントの性能が強化。人間に好まれる文体やロールプレイの自然さも向上しています。",
"zai-org/GLM-4.6V.description": "GLM-4.6Vは、同規模のパラメータで視覚理解精度においてSOTAを達成し、モデルアーキテクチャにFunction Call(ツール呼び出し)能力を初めてネイティブに統合しました。「視覚認識」から「実行可能な行動(Action)」へのチェーンをつなぎ、実際のビジネスシナリオにおけるマルチモーダルエージェントの統一技術基盤を提供します。",
"zai/glm-4.5-air.description": "GLM-4.5およびGLM-4.5-Airは、エージェントアプリケーション向けの最新フラッグシップモデルで、いずれもMoEを採用。GLM-4.5は総パラメータ355B32Bアクティブ)、GLM-4.5-Airはよりスリムな106B12Bアクティブ)構成です。",
"zai/glm-4.5.description": "GLM-4.5シリーズはエージェント向けに設計されており、フラッグシップのGLM-4.5は推論、コーディング、エージェントスキルを統合し、355B総パラメータ(32Bアクティブ)を持つハイブリッド推論システムとしてデュアル動作モードを提供します。",
"zai/glm-4.5v.description": "GLM-4.5Vは、GLM-4.5-Airをベースに、実績あるGLM-4.1V-Thinking技術を継承し、強力な106BパラメータのMoEアーキテクチャでスケーリングされています。",
+14
View File
@@ -24,6 +24,20 @@
"builtins.lobe-agent-builder.inspector.noResults": "結果がありません",
"builtins.lobe-agent-builder.inspector.togglePlugin": "切り替え",
"builtins.lobe-agent-builder.title": "アシスタントビルダー",
"builtins.lobe-agent-management.apiName.callAgent": "エージェントを呼び出す",
"builtins.lobe-agent-management.apiName.createAgent": "エージェントを作成する",
"builtins.lobe-agent-management.apiName.deleteAgent": "エージェントを削除する",
"builtins.lobe-agent-management.apiName.searchAgent": "エージェントを検索する",
"builtins.lobe-agent-management.apiName.updateAgent": "エージェントを更新する",
"builtins.lobe-agent-management.inspector.callAgent.sync": "呼び出し中:",
"builtins.lobe-agent-management.inspector.callAgent.task": "タスクを割り当て中:",
"builtins.lobe-agent-management.inspector.createAgent.title": "エージェントを作成中:",
"builtins.lobe-agent-management.inspector.searchAgent.all": "エージェントを検索:",
"builtins.lobe-agent-management.inspector.searchAgent.market": "マーケットを検索:",
"builtins.lobe-agent-management.inspector.searchAgent.results": "{{count}} 件の結果",
"builtins.lobe-agent-management.inspector.searchAgent.user": "自分のエージェントを検索:",
"builtins.lobe-agent-management.inspector.updateAgent.title": "エージェントを更新中:",
"builtins.lobe-agent-management.title": "エージェントマネージャー",
"builtins.lobe-cloud-sandbox.apiName.editLocalFile": "ファイルを編集",
"builtins.lobe-cloud-sandbox.apiName.executeCode": "コードを実行",
"builtins.lobe-cloud-sandbox.apiName.exportFile": "ファイルをエクスポート",
+3
View File
@@ -724,6 +724,9 @@
"tools.builtins.lobe-artifacts.description": "インタラクティブなUIコンポーネント、データ可視化、チャート、SVGグラフィック、Webアプリケーションを生成し、リアルタイムでプレビューします。ユーザーが直接操作できるリッチなビジュアルコンテンツを作成します。",
"tools.builtins.lobe-artifacts.readme": "インタラクティブなUIコンポーネント、データビジュアライゼーション、チャート、SVGグラフィック、Webアプリケーションを生成し、リアルタイムでプレビューできます。ユーザーが直接操作できるリッチなビジュアルコンテンツを作成しましょう。",
"tools.builtins.lobe-artifacts.title": "アーティファクト",
"tools.builtins.lobe-calculator.description": "数学計算を行い、方程式を解き、記号式を扱います",
"tools.builtins.lobe-calculator.readme": "基本的な算術、代数方程式、微積分操作、記号数学をサポートする高度な数学計算機。基数変換、方程式の解法、微分、積分などを含みます。",
"tools.builtins.lobe-calculator.title": "計算機",
"tools.builtins.lobe-cloud-sandbox.description": "クラウド上の隔離環境でPython、JavaScript、TypeScriptのコードを実行します。シェルコマンドの実行、ファイル管理、正規表現によるコンテンツ検索、結果の安全なエクスポートが可能です。",
"tools.builtins.lobe-cloud-sandbox.readme": "Python、JavaScript、TypeScriptのコードを隔離されたクラウド環境で実行します。シェルコマンドの実行、ファイル管理、正規表現によるコンテンツ検索、結果の安全なエクスポートが可能です。",
"tools.builtins.lobe-cloud-sandbox.title": "クラウドサンドボックス",
+7 -3
View File
@@ -224,15 +224,18 @@
"providerModels.item.modelConfig.extendParams.options.gpt5_2ProReasoningEffort.hint": "GPT-5.2 Pro 시리즈용; 추론 강도를 제어합니다.",
"providerModels.item.modelConfig.extendParams.options.gpt5_2ReasoningEffort.hint": "GPT-5.2 시리즈용; 추론 강도를 제어합니다.",
"providerModels.item.modelConfig.extendParams.options.imageAspectRatio.hint": "Gemini 이미지 생성 모델용; 생성된 이미지의 가로세로 비율을 제어합니다.",
"providerModels.item.modelConfig.extendParams.options.imageAspectRatio2.hint": "Nano Banana 2용; 생성된 이미지의 가로세로 비율을 제어합니다 (초광폭 1:4, 4:1, 1:8, 8:1 지원).",
"providerModels.item.modelConfig.extendParams.options.imageResolution.hint": "Gemini 3 이미지 생성 모델용; 생성된 이미지의 해상도를 제어합니다.",
"providerModels.item.modelConfig.extendParams.options.imageResolution2.hint": "Gemini 3.1 Flash Image 모델용; 생성된 이미지의 해상도를 제어합니다 (512px 지원).",
"providerModels.item.modelConfig.extendParams.options.reasoningBudgetToken.hint": "Claude, Qwen3 등과 유사한 모델용; 추론에 사용할 토큰 예산을 제어합니다.",
"providerModels.item.modelConfig.extendParams.options.reasoningEffort.hint": "OpenAI 및 기타 추론 가능한 모델용; 추론 노력의 정도를 제어합니다.",
"providerModels.item.modelConfig.extendParams.options.textVerbosity.hint": "GPT-5+ 시리즈용; 출력의 상세 정도를 제어합니다.",
"providerModels.item.modelConfig.extendParams.options.thinking.hint": "일부 Doubao 모델용; 모델이 깊이 사고할지 여부를 스스로 결정하도록 허용합니다.",
"providerModels.item.modelConfig.extendParams.options.thinkingBudget.hint": "Gemini 시리즈용; 사고 예산을 제어합니다.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel.hint": "Gemini 3 Flash Preview 모델용; 사고 깊이를 제어합니다.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel2.hint": "Gemini 3 Pro Preview 모델용; 사고 깊이를 제어합니다.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel3.hint": "Gemini 3.1 Pro Preview 모델용; 낮음/중간/높음 수준으로 사고 깊이를 조절합니다.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel.hint": "Gemini 3 Flash Preview 모델용; 사고 깊이를 제어합니다.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel2.hint": "Gemini 3 Pro Preview 모델용; 사고 깊이를 제어합니다.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel3.hint": "Gemini 3.1 Pro Preview 모델용; 낮음/중간/높음 수준으로 사고 깊이를 제어합니다.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel4.hint": "Gemini 3.1 Flash Image 모델용; 사고를 켜거나 끌 수 있습니다.",
"providerModels.item.modelConfig.extendParams.options.urlContext.hint": "Gemini 시리즈용; URL 컨텍스트 제공을 지원합니다.",
"providerModels.item.modelConfig.extendParams.placeholder": "활성화할 확장 매개변수를 선택하세요",
"providerModels.item.modelConfig.extendParams.previewFallback": "미리보기를 사용할 수 없습니다",
@@ -311,6 +314,7 @@
"providerModels.tabs.image": "이미지",
"providerModels.tabs.stt": "ASR",
"providerModels.tabs.tts": "TTS",
"providerModels.tabs.video": "비디오",
"sortModal.success": "정렬이 성공적으로 업데이트되었습니다",
"sortModal.title": "사용자 지정 정렬",
"sortModal.update": "업데이트",
+35 -31
View File
@@ -55,7 +55,8 @@
"FLUX.1-dev.description": "FLUX.1-dev는 Black Forest Labs에서 개발한 오픈소스 다중 모달 언어 모델(MLLM)로, 이미지-텍스트 작업에 최적화되어 있으며 이미지/텍스트 이해 및 생성을 결합합니다. Mistral-7B와 같은 고급 LLM을 기반으로, 정교한 비전 인코더와 다단계 지시 튜닝을 통해 다중 모달 조정 및 복잡한 작업 추론을 가능하게 합니다.",
"Gryphe/MythoMax-L2-13b.description": "MythoMax-L2 (13B)는 다양한 분야와 복잡한 작업을 위한 혁신적인 모델입니다.",
"HelloMeme.description": "HelloMeme은 사용자가 제공한 이미지나 동작을 기반으로 밈, GIF, 짧은 영상을 생성하는 AI 도구입니다. 그림이나 코딩 기술 없이도 참조 이미지 하나만으로 재미있고 매력적이며 스타일이 일관된 콘텐츠를 만들 수 있습니다.",
"HiDream-I1-Full.description": "HiDream-E1-Full은 HiDream.ai에서 개발한 오픈소스 다중 모달 이미지 편집 모델로, 고급 디퓨전 트랜스포머 아키텍처와 강력한 언어 이해력(LLaMA 3.1-8B-Instruct 내장)을 기반으로 합니다. 자연어 기반 이미지 생성, 스타일 전환, 국소 편집, 리페인팅을 지원하며, 이미지-텍스트 이해 실행 능력이 뛰어납니다.",
"HiDream-E1-Full.description": "HiDream-E1-Full은 HiDream.ai에서 개발한 오픈 소스 멀티모달 이미지 편집 모델로, 고급 Diffusion Transformer 아키텍처와 강력한 언어 이해력(내장된 LLaMA 3.1-8B-Instruct)을 기반으로 합니다. 자연어 기반 이미지 생성, 스타일 전환, 로컬 편집 및 재페인팅을 지원하며, 뛰어난 이미지-텍스트 이해력과 실행력을 제공합니다.",
"HiDream-I1-Full.description": "HiDream-I1은 HiDream에서 출시한 새로운 오픈 소스 기반 이미지 생성 모델입니다. 17B 파라미터(Flux는 12B)를 통해 몇 초 만에 업계 최고 수준의 이미지 품질을 제공합니다.",
"HunyuanDiT-v1.2-Diffusers-Distilled.description": "hunyuandit-v1.2-distilled는 경량화된 텍스트-이미지 생성 모델로, 증류를 통해 고품질 이미지를 빠르게 생성할 수 있도록 최적화되었습니다. 저자원 환경 및 실시간 생성에 특히 적합합니다.",
"InstantCharacter.description": "InstantCharacter는 2025년 텐센트 AI에서 출시한 튜닝이 필요 없는 개인화 캐릭터 생성 모델로, 고정밀도 및 다양한 시나리오에서 일관된 캐릭터 생성을 목표로 합니다. 단 하나의 참조 이미지로 캐릭터를 모델링하고, 스타일, 동작, 배경에 유연하게 적용할 수 있습니다.",
"InternVL2-8B.description": "InternVL2-8B는 강력한 비전-언어 모델로, 이미지-텍스트 다중 모달 처리를 지원하며 이미지 내용을 정확히 인식하고 관련 설명이나 답변을 생성할 수 있습니다.",
@@ -80,7 +81,7 @@
"MiniMax-M2.1.description": "MiniMax-M2.1은 MiniMax에서 개발한 대표적인 오픈소스 대형 모델로, 복잡한 실제 과제를 해결하는 데 중점을 둡니다. 다국어 프로그래밍 능력과 에이전트로서 복잡한 작업을 수행하는 능력이 핵심 강점입니다.",
"MiniMax-M2.5-Lightning.description": "M2.5 Lightning: 동일한 성능, 더 빠르고 민첩한 속도 (약 100 tps).",
"MiniMax-M2.5-highspeed.description": "M2.5와 동일한 성능에 훨씬 더 빠른 추론 속도.",
"MiniMax-M2.5.description": "최고 수준의 성능과 궁극적인 비용 효율성으로 복잡한 작업을 손쉽게 처리 (약 60 tps).",
"MiniMax-M2.5.description": "MiniMax-M2.5는 MiniMax의 플래그십 오픈 소스 대형 모델로, 복잡한 실제 과제를 해결하는 데 중점을 둡니다. 이 모델의 핵심 강점은 다중 언어 프로그래밍 기능과 에이전트로서 복잡한 작업을 해결하는 능력입니다.",
"MiniMax-M2.description": "효율적인 코딩 및 에이전트 워크플로우를 위해 특별히 설계됨",
"MiniMax-Text-01.description": "MiniMax-01은 기존 트랜스포머를 넘어선 대규모 선형 어텐션을 도입한 모델로, 4560억 파라미터 중 459억이 활성화됩니다. 최대 400만 토큰의 문맥을 지원하며, GPT-4o의 32배, Claude-3.5-Sonnet의 20배에 해당합니다.",
"MiniMaxAI/MiniMax-M1-80k.description": "MiniMax-M1은 오픈 가중치 기반의 대규모 하이브리드 어텐션 추론 모델로, 총 4560억 파라미터 중 토큰당 약 459억이 활성화됩니다. 100만 문맥을 기본 지원하며, Flash Attention을 통해 10만 토큰 생성 시 FLOPs를 DeepSeek R1 대비 75% 절감합니다. MoE 아키텍처와 CISPO, 하이브리드 어텐션 RL 학습을 통해 장문 추론 및 실제 소프트웨어 엔지니어링 작업에서 선도적인 성능을 보입니다.",
@@ -98,6 +99,7 @@
"Phi-3.5-mini-instruct.description": "Phi-3-mini 모델의 업데이트 버전입니다.",
"Phi-3.5-vision-instrust.description": "Phi-3-vision 모델의 업데이트 버전입니다.",
"Pro/MiniMaxAI/MiniMax-M2.1.description": "MiniMax-M2.1은 에이전트 기능에 최적화된 오픈소스 대형 언어 모델로, 프로그래밍, 도구 사용, 지시 따르기, 장기 계획 수립에 뛰어난 성능을 보입니다. 이 모델은 다국어 소프트웨어 개발과 복잡한 다단계 워크플로우 실행을 지원하며, SWE-bench Verified에서 74.0점을 기록하고 다국어 시나리오에서 Claude Sonnet 4.5를 능가합니다.",
"Pro/MiniMaxAI/MiniMax-M2.5.description": "MiniMax-M2.5는 MiniMax에서 개발한 최신 대형 언어 모델로, 수십만 개의 복잡한 실제 환경에서 대규모 강화 학습을 통해 훈련되었습니다. 2290억 개의 파라미터를 가진 MoE 아키텍처를 특징으로 하며, 프로그래밍, 에이전트 도구 호출, 검색 및 오피스 시나리오와 같은 작업에서 업계 최고 성능을 달성합니다.",
"Pro/Qwen/Qwen2-7B-Instruct.description": "Qwen2-7B-Instruct는 Qwen2 시리즈의 70억 매개변수 기반 지시 조정 LLM입니다. Transformer 아키텍처를 기반으로 SwiGLU, attention QKV bias, grouped-query attention을 사용하며, 대용량 입력을 처리할 수 있습니다. 언어 이해, 생성, 다국어 작업, 코딩, 수학, 추론 등 다양한 분야에서 강력한 성능을 발휘하며, 대부분의 오픈 모델을 능가하고 상용 모델과 경쟁합니다. 여러 벤치마크에서 Qwen1.5-7B-Chat을 능가합니다.",
"Pro/Qwen/Qwen2.5-7B-Instruct.description": "Qwen2.5-7B-Instruct는 알리바바 클라우드의 최신 LLM 시리즈 중 하나입니다. 70억 매개변수 모델로 코딩과 수학에서 눈에 띄는 성능 향상을 보이며, 29개 이상의 언어를 지원합니다. 지시 따르기, 구조화된 데이터 이해, 구조화된 출력(특히 JSON) 생성 능력이 향상되었습니다.",
"Pro/Qwen/Qwen2.5-Coder-7B-Instruct.description": "Qwen2.5-Coder-7B-Instruct는 알리바바 클라우드의 최신 코드 특화 LLM입니다. Qwen2.5를 기반으로 5.5조 토큰으로 학습되었으며, 코드 생성, 추론, 수정 능력을 크게 향상시켰습니다. 수학 및 일반적인 능력도 유지하며, 코딩 에이전트를 위한 강력한 기반을 제공합니다.",
@@ -107,13 +109,13 @@
"Pro/deepseek-ai/DeepSeek-R1-Distill-Qwen-7B.description": "DeepSeek-R1-Distill-Qwen-7B는 Qwen2.5-Math-7B에서 디스틸링되었으며, 80만 개의 정제된 DeepSeek-R1 샘플로 파인튜닝되었습니다. MATH-500에서 92.8%, AIME 2024에서 55.5%, CodeForces에서 7B 모델 기준 1189점을 기록하며 강력한 성능을 보입니다.",
"Pro/deepseek-ai/DeepSeek-R1.description": "DeepSeek-R1은 반복을 줄이고 가독성을 높이기 위해 강화 학습(RL)을 적용한 추론 모델입니다. RL 이전에는 cold-start 데이터를 사용하여 추론 능력을 더욱 향상시켰으며, 수학, 코드, 추론 작업에서 OpenAI-o1과 유사한 성능을 보입니다. 정교한 학습을 통해 전반적인 성능을 개선했습니다.",
"Pro/deepseek-ai/DeepSeek-V3.1-Terminus.description": "DeepSeek-V3.1-Terminus는 하이브리드 에이전트 LLM으로 포지셔닝된 V3.1 모델의 업데이트 버전입니다. 사용자 피드백을 반영하여 안정성, 언어 일관성, 중문/영문 혼합 및 비정상 문자 문제를 개선했습니다. 사고 모드와 비사고 모드를 통합하고, 채팅 템플릿을 통해 유연한 전환이 가능합니다. 또한 코드 에이전트와 검색 에이전트의 성능을 향상시켜 도구 사용과 다단계 작업의 신뢰성을 높였습니다.",
"Pro/deepseek-ai/DeepSeek-V3.2-Exp.description": "DeepSeek-V3.2-Exp는 차세대 아키텍처로의 전환을 위한 실험적 V3.2 릴리스입니다. V3.1-Terminus 위에 DeepSeek Sparse Attention(DSA)을 추가하여 장문 컨텍스트 학습 및 추론 효율을 개선했으며, 도구 사용, 장문 문서 이해, 다단계 추론에 최적화되었습니다. 대규모 컨텍스트 예산에서 높은 추론 효율을 탐색하는 데 이상적입니다.",
"Pro/deepseek-ai/DeepSeek-V3.2.description": "DeepSeek-V3.2는 높은 계산 효율성과 뛰어난 추론 및 에이전트 성능을 결합한 모델입니다. 이 모델은 세 가지 주요 기술적 돌파구를 기반으로 합니다: 계산 복잡성을 크게 줄이면서 모델 성능을 유지하는 효율적인 주의 메커니즘인 DeepSeek Sparse Attention(DSA), 긴 컨텍스트 시나리오에 최적화된 확장 가능한 강화 학습 프레임워크, 그리고 도구 사용 시나리오에 추론 능력을 통합하여 복잡한 상호작용 환경에서 지침 준수 및 일반화를 개선하는 대규모 에이전트 작업 합성 파이프라인. 이 모델은 2025년 국제 수학 올림피아드(IMO)와 국제 정보 올림피아드(IOI)에서 금메달 성과를 달성했습니다.",
"Pro/deepseek-ai/DeepSeek-V3.description": "DeepSeek-V3는 6710억 매개변수의 MoE 모델로, MLA와 DeepSeekMoE를 사용하며 손실 없는 부하 분산을 통해 효율적인 추론과 학습을 실현합니다. 14.8조 고품질 토큰으로 사전 학습되었고, SFT 및 RL로 추가 튜닝되어 다른 오픈 모델을 능가하며 상용 모델에 근접한 성능을 보입니다.",
"Pro/moonshotai/Kimi-K2-Instruct-0905.description": "Kimi K2-Instruct-0905는 최신이자 가장 강력한 Kimi K2 모델입니다. 총 1조, 활성 320억 매개변수를 가진 최상급 MoE 모델로, 에이전트 기반 코딩 지능이 강화되어 벤치마크 및 실제 에이전트 작업에서 큰 성능 향상을 보입니다. 프론트엔드 코드의 미적 품질과 사용성도 개선되었습니다.",
"Pro/moonshotai/Kimi-K2-Thinking.description": "Kimi K2 Thinking Turbo는 추론 속도와 처리량을 최적화한 Turbo 버전으로, K2 Thinking의 다단계 추론 및 도구 사용 능력을 유지합니다. 약 1조 매개변수를 가진 MoE 모델로, 기본 256K 컨텍스트를 지원하며, 대규모 도구 호출이 필요한 실시간 및 동시성 높은 환경에 적합합니다.",
"Pro/moonshotai/Kimi-K2.5.description": "Kimi K2.5는 Kimi-K2-Base를 기반으로 구축된 오픈소스 네이티브 멀티모달 에이전트 모델로, 약 1.5조 개의 비전 및 텍스트 토큰으로 학습되었습니다. MoE 아키텍처를 채택하여 총 1조 파라미터 중 320억 개가 활성화되며, 256K 컨텍스트 윈도우를 지원하여 비전과 언어 이해를 자연스럽게 통합합니다.",
"Pro/zai-org/glm-4.7.description": "GLM-4.7은 Zhipu의 최신 플래그십 모델로, 총 355B 파라미터 중 32B가 활성화되어 있으며, 일반 대화, 추론, 에이전트 기능 전반에서 완전히 업그레이드되었습니다. GLM-4.7은 교차적 사고(Interleaved Thinking)를 강화하고, 보존적 사고(Preserved Thinking) 및 턴 단위 사고(Turn-level Thinking)를 도입하여 성능을 향상시켰습니다.",
"Pro/zai-org/glm-5.description": "GLM-5는 Zhipu에서 출시한 차세대 대형 언어 모델로, 복잡한 시스템 엔지니어링과 장기 에이전트 작업에 중점을 둡니다. 모델 파라미터는 744B 파라미터(40B 활성)로 확장되었으며, DeepSeek Sparse Attention 통합되었습니다.",
"Pro/zai-org/glm-5.description": "GLM-5는 Zhipu 차세대 대형 언어 모델로, 복잡한 시스템 엔지니어링과 장기 지속 에이전트 작업에 중점을 둡니다. 모델 파라미터는 7440억 개(활성화된 40억 개)로 확장되었으며, DeepSeek Sparse Attention 통합니다.",
"QwQ-32B-Preview.description": "Qwen QwQ는 추론 능력 향상을 목표로 한 실험적 연구 모델입니다.",
"Qwen/QVQ-72B-Preview.description": "QVQ-72B-Preview는 복잡한 장면 이해와 시각 수학 문제 해결에 강점을 가진 Qwen의 시각 추론 연구 모델입니다.",
"Qwen/QwQ-32B-Preview.description": "Qwen QwQ는 AI 추론 능력 향상을 목표로 한 실험적 연구 모델입니다.",
@@ -137,7 +139,7 @@
"Qwen/Qwen3-14B.description": "Qwen3는 차세대 Tongyi Qwen 모델로, 추론, 일반 능력, 에이전트 기능, 다국어 성능에서 큰 향상을 이루었으며, 사고 모드 전환을 지원합니다.",
"Qwen/Qwen3-235B-A22B-Instruct-2507.description": "Qwen3-235B-A22B-Instruct-2507은 Qwen3의 플래그십 MoE 모델로, 총 2350억 매개변수 중 220억이 활성화됩니다. 사고 모드가 비활성화된 버전으로, 지시 따르기, 논리적 추론, 텍스트 이해, 수학, 과학, 코딩, 도구 사용 능력을 향상시키는 데 중점을 두었습니다. 또한 다국어 롱테일 지식을 확장하고, 주관적인 개방형 작업에서 사용자 선호에 더 잘 맞도록 조정되었습니다.",
"Qwen/Qwen3-235B-A22B-Thinking-2507.description": "Qwen3-235B-A22B-Thinking-2507은 복잡한 고난도 추론에 중점을 둔 Qwen3 모델입니다. MoE 아키텍처를 사용하며, 총 2350억 매개변수 중 토큰당 약 220억이 활성화되어 효율성을 높입니다. 사고 전용 모델로서 논리, 수학, 과학, 코딩, 학술 벤치마크에서 뛰어난 성능을 보이며, 지시 따르기, 도구 사용, 텍스트 생성 능력도 향상되었습니다. 256K 컨텍스트를 기본 지원하여 심층 추론 및 장문 문서 처리에 적합합니다.",
"Qwen/Qwen3-235B-A22B.description": "Qwen3는 차세대 Tongyi Qwen 모델로, 추론, 일반 능력, 에이전트 기능, 다국어 성능에서 큰 향상을 이루었으며, 사고 모드 전환을 지원합니다.",
"Qwen/Qwen3-235B-A22B.description": "Qwen3 235B A22B는 최상급 AI 성능을 제공하는 Qwen3의 초대형 모델입니다.",
"Qwen/Qwen3-30B-A3B-Instruct-2507.description": "Qwen3-30B-A3B-Instruct-2507은 Qwen3-30B-A3B의 사고 비활성화 버전입니다. 총 305억 매개변수 중 33억이 활성화되는 MoE 모델로, 지시 따르기, 논리적 추론, 텍스트 이해, 수학, 과학, 코딩, 도구 사용 능력을 크게 향상시켰습니다. 다국어 롱테일 지식을 확장하고, 주관적인 개방형 작업에서 사용자 선호에 더 잘 맞도록 조정되었습니다. 256K 컨텍스트를 지원하며, 사고 모드가 비활성화되어 `<think></think>` 태그를 출력하지 않습니다.",
"Qwen/Qwen3-30B-A3B-Thinking-2507.description": "Qwen3-30B-A3B-Thinking-2507은 Qwen3 시리즈의 최신 사고 모델입니다. 총 305억 매개변수 중 33억이 활성화되는 MoE 모델로, 복잡한 작업에 중점을 두고 설계되었습니다. 논리, 수학, 과학, 코딩, 학술 벤치마크에서 뛰어난 성능을 보이며, 지시 따르기, 도구 사용, 텍스트 생성, 선호 정렬 능력도 향상되었습니다. 256K 컨텍스트를 기본 지원하며, 최대 100만 토큰까지 확장 가능합니다. 사고 모드에 최적화되어 단계별 추론과 강력한 에이전트 기능을 제공합니다.",
"Qwen/Qwen3-30B-A3B.description": "Qwen3는 차세대 Tongyi Qwen 모델로, 추론, 일반 능력, 에이전트 기능, 다국어 성능에서 큰 향상을 이루었으며, 사고 모드 전환을 지원합니다.",
@@ -315,7 +317,6 @@
"codeqwen.description": "CodeQwen1.5는 방대한 코드 데이터를 기반으로 학습된 대형 언어 모델로, 복잡한 프로그래밍 작업을 위해 설계되었습니다.",
"codestral-latest.description": "Codestral은 가장 진보된 코딩 모델로, v2(2025년 1월)는 FIM, 코드 수정, 테스트 생성과 같은 저지연 고빈도 작업을 목표로 합니다.",
"codestral.description": "Codestral은 Mistral AI의 첫 번째 코드 모델로, 강력한 코드 생성 지원을 제공합니다.",
"codex-mini-latest.description": "codex-mini-latest는 Codex CLI용으로 미세 조정된 o4-mini 모델입니다. API 직접 사용 시 gpt-4.1을 시작점으로 권장합니다.",
"cogito-2.1:671b.description": "Cogito v2.1 671B는 상업적 사용이 가능한 미국 오픈소스 LLM으로, 최고 수준의 모델과 견줄 수 있는 성능, 높은 토큰 추론 효율성, 128k 긴 컨텍스트, 전반적인 강력한 기능을 갖추고 있습니다.",
"cogview-3-flash.description": "CogView-3-Flash는 Zhipu에서 출시한 무료 이미지 생성 모델입니다. 이 모델은 사용자 지시에 맞는 이미지를 생성하며, 높은 미적 품질 점수를 달성합니다. CogView-3-Flash는 주로 예술 창작, 디자인 참고, 게임 개발, 가상 현실과 같은 분야에서 사용되며, 사용자가 텍스트 설명을 신속하게 이미지로 변환할 수 있도록 돕습니다.",
"cogview-4.description": "CogView-4는 중국어 문자를 생성할 수 있는 Zhipu의 첫 오픈소스 텍스트-투-이미지 모델입니다. 의미 이해, 이미지 품질, 중영문 텍스트 렌더링이 향상되었으며, 길이 제한 없는 이중 언어 프롬프트를 지원하고, 지정된 범위 내에서 해상도에 맞는 이미지 생성을 지원합니다.",
@@ -342,7 +343,7 @@
"command-light-nightly.description": "주요 릴리스 간의 간격을 줄이기 위해, 매일 업데이트되는 Command 빌드를 제공합니다. command-light 시리즈의 경우 이를 command-light-nightly라고 하며, 가장 최신이자 실험적인(그리고 불안정할 수 있는) 버전입니다. 정기적으로 예고 없이 업데이트되므로, 프로덕션 환경에서는 사용을 권장하지 않습니다.",
"command-light.description": "거의 동일한 성능을 유지하면서도 더 빠른 속도를 제공하는 소형 Command 변형 모델입니다.",
"command-nightly.description": "주요 릴리스 간의 간격을 줄이기 위해, 매일 업데이트되는 Command 빌드를 제공합니다. Command 시리즈의 경우 이를 command-nightly라고 하며, 가장 최신이자 실험적인(그리고 불안정할 수 있는) 버전입니다. 정기적으로 예고 없이 업데이트되므로, 프로덕션 환경에서는 사용을 권장하지 않습니다.",
"command-r-03-2024.description": "Command R은 이전 모델보다 더 높은 품질 신뢰성, 더 긴 컨텍스트 윈도우를 제공하는 지시문 기반 채팅 모델입니다. 코드 생성, RAG, 도구 사용, 에이전트 복잡한 워크플로를 지원합니다.",
"command-r-03-2024.description": "command-r은 이전 모델보다 더 높은 품질, 향상된 신뢰성, 더 긴 컨텍스트를 제공하는 지침 준수 채팅 모델입니다. 코드 생성, RAG, 도구 사용 에이전트와 같은 복잡한 워크플로를 지원합니다.",
"command-r-08-2024.description": "command-r-08-2024는 2024년 8월에 출시된 Command R 모델의 업데이트 버전입니다.",
"command-r-plus-04-2024.description": "command-r-plus는 command-r-plus-04-2024의 별칭으로, API에서 command-r-plus를 사용하면 해당 모델을 가리킵니다.",
"command-r-plus-08-2024.description": "Command R+는 이전 모델보다 더 높은 품질과 신뢰성, 더 긴 컨텍스트 윈도우를 제공하는 지시문 기반 채팅 모델입니다. 복잡한 RAG 워크플로우와 다단계 도구 사용에 최적화되어 있습니다.",
@@ -366,7 +367,8 @@
"deepseek-ai/DeepSeek-V2.5.description": "DeepSeek-V2.5는 DeepSeek-V2-Chat과 DeepSeek-Coder-V2-Instruct를 업그레이드하여 일반 및 코딩 능력을 통합합니다. 글쓰기 및 지시문 이행 능력을 향상시켜 선호도 정렬을 개선하며, AlpacaEval 2.0, ArenaHard, AlignBench, MT-Bench에서 큰 성능 향상을 보입니다.",
"deepseek-ai/DeepSeek-V3.1-Terminus.description": "DeepSeek-V3.1-Terminus는 하이브리드 에이전트 LLM으로 포지셔닝된 V3.1 모델의 업데이트 버전입니다. 사용자 피드백 문제를 해결하고 안정성, 언어 일관성, 중문/영문 혼합 및 비정상 문자 출력을 개선합니다. 사고 및 비사고 모드를 통합하고 채팅 템플릿을 통해 유연하게 전환할 수 있으며, Code Agent 및 Search Agent 성능도 향상되어 도구 사용 및 다단계 작업에서 더 높은 신뢰성을 제공합니다.",
"deepseek-ai/DeepSeek-V3.1.description": "DeepSeek V3.1은 하이브리드 추론 아키텍처를 사용하며, 사고 모드와 비사고 모드를 모두 지원합니다.",
"deepseek-ai/DeepSeek-V3.2-Exp.description": "DeepSeek-V3.2-Exp는 차세대 아키텍처로의 전환을 위한 실험적 V3.2 릴리스입니다. V3.1-Terminus 기반 위에 DeepSeek Sparse Attention(DSA)을 추가하여 긴 문맥 학습 및 추론 효율을 향상시켰으며, 도구 사용, 장문 이해, 다단계 추론에 최적화되어 있습니다. 대규모 문맥 처리 예산 하에서 고차원 추론 효율을 탐색하기에 이상적입니다.",
"deepseek-ai/DeepSeek-V3.2-Exp.description": "DeepSeek V3.2 Exp는 하이브리드 추론 아키텍처를 사용하며, 사고 모드와 비사고 모드를 모두 지원합니다.",
"deepseek-ai/DeepSeek-V3.2.description": "DeepSeek-V3.2는 높은 계산 효율성과 뛰어난 추론 및 에이전트 성능을 결합한 모델입니다. 이 모델은 세 가지 주요 기술적 돌파구를 기반으로 합니다: 계산 복잡성을 크게 줄이면서 모델 성능을 유지하는 효율적인 주의 메커니즘인 DeepSeek Sparse Attention(DSA), 긴 컨텍스트 시나리오에 최적화된 확장 가능한 강화 학습 프레임워크, 그리고 도구 사용 시나리오에 추론 능력을 통합하여 복잡한 상호작용 환경에서 지침 준수 및 일반화를 개선하는 대규모 에이전트 작업 합성 파이프라인. 이 모델은 2025년 국제 수학 올림피아드(IMO)와 국제 정보 올림피아드(IOI)에서 금메달 성과를 달성했습니다.",
"deepseek-ai/DeepSeek-V3.description": "DeepSeek-V3는 MLA와 DeepSeekMoE를 활용한 671B 파라미터의 MoE 모델로, 손실 없는 부하 분산을 통해 학습 및 추론 효율을 극대화합니다. 14.8T의 고품질 토큰으로 사전 학습되었으며, SFT와 RL을 통해 다른 오픈 모델을 능가하고 주요 폐쇄형 모델에 근접한 성능을 보입니다.",
"deepseek-ai/deepseek-llm-67b-chat.description": "DeepSeek LLM Chat (67B)은 심층 언어 이해와 상호작용을 제공하는 혁신적인 모델입니다.",
"deepseek-ai/deepseek-v3.1-terminus.description": "DeepSeek V3.1은 복잡한 추론과 연쇄적 사고(chain-of-thought)에 강한 차세대 추론 모델로, 심층 분석 작업에 적합합니다.",
@@ -433,6 +435,7 @@
"deepseek_r1_distill_llama_70b.description": "DeepSeek-R1-Distill-Llama-70B는 Llama-3.3-70B-Instruct에서 경량화된 모델입니다. DeepSeek-R1 시리즈의 일환으로, DeepSeek-R1이 생성한 샘플을 기반으로 파인튜닝되어 수학, 코딩, 추론에서 강력한 성능을 보입니다.",
"deepseek_r1_distill_qwen_14b.description": "DeepSeek-R1-Distill-Qwen-14B는 Qwen2.5-14B에서 경량화된 모델로, DeepSeek-R1이 생성한 80만 개의 정제된 샘플을 기반으로 파인튜닝되어 강력한 추론 능력을 제공합니다.",
"deepseek_r1_distill_qwen_32b.description": "DeepSeek-R1-Distill-Qwen-32B는 Qwen2.5-32B에서 경량화된 모델로, DeepSeek-R1이 생성한 80만 개의 정제된 샘플을 기반으로 파인튜닝되어 수학, 코딩, 추론에서 뛰어난 성능을 발휘합니다.",
"devstral-2512.description": "Devstral 2는 코드베이스 탐색, 여러 파일 편집 및 소프트웨어 엔지니어링 에이전트를 지원하는 데 뛰어난 엔터프라이즈 수준의 텍스트 모델입니다.",
"devstral-2:123b.description": "Devstral 2 123B는 도구를 활용한 코드베이스 탐색, 다중 파일 편집, 소프트웨어 엔지니어링 에이전트 지원에 탁월한 성능을 발휘합니다.",
"doubao-1.5-lite-32k.description": "Doubao-1.5-lite는 초고속 응답을 제공하는 새로운 경량 모델로, 최고 수준의 품질과 지연 시간을 자랑합니다.",
"doubao-1.5-pro-256k.description": "Doubao-1.5-pro-256k는 Doubao-1.5-Pro의 전면적인 업그레이드 버전으로, 전체 성능이 10% 향상되었습니다. 256k 컨텍스트 윈도우와 최대 12k 출력 토큰을 지원하여 더 높은 성능, 더 넓은 윈도우, 다양한 활용 사례에 적합한 가치를 제공합니다.",
@@ -546,10 +549,10 @@
"gemini-2.5-pro-preview-06-05.description": "Gemini 2.5 Pro Preview는 Google의 가장 진보된 추론 모델로, 코드, 수학, STEM 문제에 대한 추론과 대규모 데이터셋, 코드베이스, 문서 분석을 장기 문맥 내에서 수행할 수 있습니다.",
"gemini-2.5-pro.description": "Gemini 2.5 Pro는 Google의 플래그십 추론 모델로, 복잡한 작업을 위한 장기 문맥 지원을 제공합니다.",
"gemini-3-flash-preview.description": "Gemini 3 Flash는 속도를 위해 설계된 가장 스마트한 모델로, 최첨단 지능과 뛰어난 검색 기반을 결합합니다.",
"gemini-3-pro-image-preview.description": "Gemini 3 Pro Image(Nano Banana Pro)는 Google의 이미지 생성 모델로, 멀티모달 대화도 지원합니다.",
"gemini-3-pro-image-preview.description": "Gemini 3 Pro Image (Nano Banana Pro)는 구글의 이미지 생성 모델로, 멀티모달 대화도 지원합니다.",
"gemini-3-pro-image-preview:image.description": "Gemini 3 Pro Image(Nano Banana Pro)는 Google의 이미지 생성 모델로, 멀티모달 대화도 지원합니다.",
"gemini-3-pro-preview.description": "Gemini 3 Pro는 Google의 가장 강력한 에이전트 및 바이브 코딩 모델로, 최첨단 추론 위에 풍부한 시각적 표현과 깊은 상호작용을 제공합니다.",
"gemini-3.1-flash-image-preview.description": "Gemini 3.1 Flash Image (Nano Banana 2)는 플래시 속도로 프로급 이미지 품질을 제공하며 멀티모달 채팅을 지원합니다.",
"gemini-3.1-flash-image-preview.description": "Gemini 3.1 Flash Image (Nano Banana 2)는 구글의 가장 빠른 네이티브 이미지 생성 모델로, 사고 지원, 대화형 이미지 생성 및 편집을 제공합니다.",
"gemini-3.1-flash-image-preview:image.description": "Gemini 3.1 Flash Image (Nano Banana 2)는 플래시 속도로 프로급 이미지 품질을 제공하며 멀티모달 채팅을 지원합니다.",
"gemini-3.1-pro-preview.description": "Gemini 3.1 Pro Preview는 Gemini 3 Pro의 추론 능력을 강화하고 중간 사고 수준 지원을 추가합니다.",
"gemini-flash-latest.description": "Gemini Flash 최신 버전",
@@ -605,19 +608,15 @@
"google/gemini-2.0-flash-lite-001.description": "Gemini 2.0 Flash Lite는 지연 시간과 비용을 줄이기 위해 기본적으로 사고 기능이 비활성화된 경량 Gemini 변형 모델이며, 매개변수를 통해 활성화할 수 있습니다.",
"google/gemini-2.0-flash-lite.description": "Gemini 2.0 Flash Lite는 차세대 기능을 제공하며, 뛰어난 속도, 내장 도구 사용, 멀티모달 생성, 1M 토큰 컨텍스트 윈도우를 지원합니다.",
"google/gemini-2.0-flash.description": "Gemini 2.0 Flash는 Google의 고성능 추론 모델로, 확장된 멀티모달 작업에 적합합니다.",
"google/gemini-2.5-flash-image-free.description": "Gemini 2.5 Flash Image 무료 등급은 제한된 할당량의 멀티모달 생성을 지원합니다.",
"google/gemini-2.5-flash-image-preview.description": "Gemini 2.5 Flash는 이미지 생성을 지원하는 실험용 모델입니다.",
"google/gemini-2.5-flash-image.description": "Gemini 2.5 Flash Image (Nano Banana)는 Google의 이미지 생성 모델로, 멀티모달 대화를 지원합니다.",
"google/gemini-2.5-flash-lite.description": "Gemini 2.5 Flash Lite는 지연 시간과 비용을 최적화한 경량 Gemini 2.5 변형 모델로, 대량 처리 시나리오에 적합합니다.",
"google/gemini-2.5-flash-preview.description": "Gemini 2.5 Flash는 고급 추론, 코딩, 수학, 과학 작업을 위해 설계된 Google의 최첨단 대표 모델입니다. 내장된 '사고(thinking)' 기능을 통해 더 높은 정확도의 응답과 정교한 컨텍스트 처리를 제공합니다.\n\n참고: 이 모델은 사고(thinking)와 비사고(non-thinking) 두 가지 변형이 있으며, 사고 기능의 활성화 여부에 따라 출력 비용이 크게 달라집니다. 기본 변형(:thinking 접미사 없이)을 선택하면 사고 토큰 생성을 명시적으로 피합니다.\n\n사고 기능을 사용하고 사고 토큰을 받으려면 ':thinking' 변형을 선택해야 하며, 이 경우 사고 출력 비용이 더 높습니다.\n\nGemini 2.5 Flash는 문서에 명시된 'max reasoning tokens' 매개변수를 통해 구성할 수 있습니다 (https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning).",
"google/gemini-2.5-flash-preview:thinking.description": "Gemini 2.5 Flash는 고급 추론, 코딩, 수학, 과학 작업을 위해 설계된 Google의 최첨단 대표 모델입니다. 내장된 '사고(thinking)' 기능을 통해 더 높은 정확도의 응답과 정교한 컨텍스트 처리를 제공합니다.\n\n참고: 이 모델은 사고(thinking)와 비사고(non-thinking) 두 가지 변형이 있으며, 사고 기능의 활성화 여부에 따라 출력 비용이 크게 달라집니다. 기본 변형(:thinking 접미사 없이)을 선택하면 사고 토큰 생성을 명시적으로 피합니다.\n\n사고 기능을 사용하고 사고 토큰을 받으려면 ':thinking' 변형을 선택해야 하며, 이 경우 사고 출력 비용이 더 높습니다.\n\nGemini 2.5 Flash는 문서에 명시된 'max reasoning tokens' 매개변수를 통해 구성할 수 있습니다 (https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning).",
"google/gemini-2.5-flash.description": "Gemini 2.5 Flash (Lite/Pro/Flash)는 Google의 저지연부터 고성능 추론까지 아우르는 모델군입니다.",
"google/gemini-2.5-pro-free.description": "Gemini 2.5 Pro 무료 등급은 제한된 할당량의 멀티모달 장문 컨텍스트를 제공하며, 시험 사용 및 가벼운 워크플로우에 적합합니다.",
"google/gemini-2.5-flash.description": "Gemini 2.5 Flash 저지연에서 고성능 추론까지 아우르는 구글의 모델 계열입니다.",
"google/gemini-2.5-pro-preview.description": "Gemini 2.5 Pro Preview는 복잡한 코드, 수학, STEM 문제에 대한 추론과 대규모 데이터셋, 코드베이스, 문서 분석을 위한 Google의 가장 진보된 사고 모델입니다.",
"google/gemini-2.5-pro.description": "Gemini 2.5 Pro는 복잡한 작업을 위한 장문 컨텍스트 지원을 갖춘 Google의 대표 추론 모델입니다.",
"google/gemini-3-pro-image-preview-free.description": "Gemini 3 Pro Image 무료 등급은 제한된 할당량의 멀티모달 생성을 지원합니다.",
"google/gemini-3-pro-image-preview.description": "Gemini 3 Pro Image (Nano Banana Pro)는 Google의 이미지 생성 모델로, 멀티모달 대화를 지원합니다.",
"google/gemini-3-pro-preview-free.description": "Gemini 3 Pro Preview Free는 표준 버전과 동일한 멀티모달 이해 및 추론 기능을 제공하지만, 할당량 및 속도 제한이 있어 시험 사용 및 저빈도 사용에 적합합니다.",
"google/gemini-3-pro-preview.description": "Gemini 3 Pro는 Gemini 시리즈의 차세대 멀티모달 추론 모델로, 텍스트, 오디오, 이미지, 비디오를 이해하며 복잡한 작업과 대규모 코드베이스를 처리할 수 있습니다.",
"google/gemini-embedding-001.description": "영어, 다국어, 코드 작업에서 뛰어난 성능을 보이는 최첨단 임베딩 모델입니다.",
"google/gemini-flash-1.5.description": "Gemini 1.5 Flash는 다양한 복잡한 작업을 위한 최적화된 멀티모달 처리를 제공합니다.",
@@ -717,15 +716,24 @@
"hunyuan-a13b.description": "Hunyuan의 첫 하이브리드 추론 모델로, hunyuan-standard-256K에서 업그레이드되었습니다 (총 80B, 활성 13B). 기본적으로 느린 사고를 사용하며, 매개변수 또는 /no_think 접두어로 빠른/느린 전환이 가능합니다. 수학, 과학, 장문 이해, 에이전트 작업에서 전 세대보다 전반적인 성능이 향상되었습니다.",
"hunyuan-code.description": "Hunyuan의 최신 코드 모델은 200B 고품질 코드 데이터와 6개월간의 SFT 데이터를 기반으로 학습되었으며, 8K 컨텍스트를 제공합니다. 자동화된 코드 벤치마크와 5개 언어에 걸친 전문가 인간 평가에서 상위권에 위치합니다.",
"hunyuan-functioncall.description": "Hunyuan의 최신 MoE FunctionCall 모델은 고품질 도구 호출 데이터를 기반으로 학습되었으며, 32K 컨텍스트 윈도우와 다양한 차원에서 선도적인 벤치마크를 제공합니다.",
"hunyuan-large-longcontext.description": "긴 문서 작업(요약 및 QA)에 뛰어나며, 일반 생성 작업도 처리할 수 있습니다. 복잡하고 세부적인 콘텐츠에 대한 긴 텍스트 분석 및 생성에 강합니다.",
"hunyuan-large.description": "Hunyuan-large는 총 약 3890억 개의 파라미터와 약 520억 개의 활성화된 파라미터를 가진, Transformer 아키텍처에서 가장 크고 강력한 오픈 MoE 모델입니다.",
"hunyuan-lite.description": "MoE 아키텍처로 업그레이드되었으며, 256K 컨텍스트 윈도우를 지원합니다. NLP, 코드, 수학, 산업 벤치마크에서 많은 오픈 모델을 선도합니다.",
"hunyuan-pro.description": "수조 개 파라미터를 가진 MOE-32K 장문 컨텍스트 모델로, 복잡한 지시 및 추론, 고급 수학, 함수 호출에 강하며, 다국어 번역, 금융, 법률, 의료 분야에 최적화되어 있습니다.",
"hunyuan-role.description": "Hunyuan의 최신 역할 수행 모델은 역할 수행 데이터를 공식적으로 미세 조정하여 역할 수행 시나리오에서 더 강력한 기본 성능을 제공합니다.",
"hunyuan-standard-256K.description": "로드 밸런싱 및 전문가 붕괴를 완화하기 위해 개선된 라우팅을 사용합니다. 장문 텍스트 \"건초 더미 속 바늘\"은 99.9%에 도달합니다. MOE-256K는 길이와 품질을 더욱 확장하여 입력 길이를 크게 늘립니다.",
"hunyuan-standard.description": "로드 밸런싱 및 전문가 붕괴를 완화하기 위해 개선된 라우팅을 사용합니다. 장문 텍스트 \"건초 더미 속 바늘\"은 99.9%에 도달합니다. MOE-32K는 품질과 가격의 균형을 유지하면서 장문 텍스트 입력에 더 나은 가치를 제공합니다.",
"hunyuan-standard-256K.description": "로드 밸런싱 및 전문가 붕괴를 완화하기 위해 개선된 라우팅을 사용합니다. 긴 컨텍스트에서 99.9%의 '건초 더미 속 바늘 찾기' 성과를 달성합니다. MOE-256K는 컨텍스트 길이와 품질을 더욱 확장니다.",
"hunyuan-standard.description": "로드 밸런싱 및 전문가 붕괴를 완화하기 위해 개선된 라우팅을 사용합니다. 긴 컨텍스트에서 99.9%의 '건초 더미 속 바늘 찾기' 성과를 달성합니다. MOE-32K는 긴 입력을 처리하면서도 강력한 가치를 제공합니다.",
"hunyuan-t1-20250321.description": "예술과 STEM 능력을 균형 있게 구축하며, 강력한 긴 텍스트 정보 캡처를 지원합니다. 수학, 논리, 과학 및 코드 문제에 대한 추론 답변을 난이도에 따라 제공합니다.",
"hunyuan-t1-20250403.description": "프로젝트 수준의 코드 생성 및 작성 품질을 개선하고, 다중 턴 주제 이해 및 ToB 지침 준수를 강화하며, 단어 수준 이해를 개선하고, 혼합된 간체/번체 및 중국어/영어 출력 문제를 줄입니다.",
"hunyuan-t1-20250529.description": "창의적 글쓰기 및 작문을 개선하고, 프론트엔드 코딩, 수학 및 논리 추론을 강화하며, 지침 준수를 향상시킵니다.",
"hunyuan-t1-20250711.description": "어려운 수학, 논리 및 코딩을 크게 개선하고, 출력 안정성을 높이며, 긴 텍스트 처리 능력을 강화합니다.",
"hunyuan-t1-latest.description": "고난도 수학, 복잡한 추론, 어려운 코딩, 지시 따르기, 창의적 글쓰기 품질에서 느린 사고 모델의 성능을 크게 향상시켰습니다.",
"hunyuan-t1-vision-20250916.description": "VQA, 시각적 정렬, OCR, 차트, 사진 기반 문제 해결, 이미지 기반 창작에서 큰 개선을 이룬 최신 t1-vision 심층 추론 모델로, 영어 및 저자원 언어 지원도 강화되었습니다.",
"hunyuan-turbo-20241223.description": "이 버전은 일반화를 위한 지침 확장을 강화하고, 수학/코드/논리 추론을 크게 개선하며, 단어 수준 이해를 향상시키고, 작성 품질을 개선합니다.",
"hunyuan-turbo-latest.description": "NLP 이해, 작성, 채팅, QA, 번역 및 도메인 전반에 걸친 전반적인 경험을 개선합니다. 더 인간적인 응답, 모호한 의도에 대한 더 나은 명확화, 향상된 단어 분석, 더 높은 창의적 품질 및 상호작용성, 더 강력한 다중 턴 대화를 제공합니다.",
"hunyuan-turbo.description": "Hunyuan의 차세대 LLM 프리뷰 버전으로, 새로운 MoE 아키텍처를 기반으로 하여 hunyuan-pro보다 빠른 추론과 더 강력한 결과를 제공합니다.",
"hunyuan-turbos-latest.description": "최신 Hunyuan TurboS 플래그십 모델로, 더 강력한 추론 능력과 전반적인 향상된 사용자 경험을 제공합니다.",
"hunyuan-turbos-longtext-128k-20250325.description": "긴 문서 작업(요약 및 QA)에 뛰어나며, 일반 생성 작업도 처리할 수 있습니다. 복잡하고 세부적인 콘텐츠에 대한 긴 텍스트 분석 및 생성에 강합니다.",
"hunyuan-vision-1.5-instruct.description": "TurboS 텍스트 기반으로 구축된 빠른 사고 이미지-텍스트 모델로, 이전 버전에 비해 기본 이미지 인식 및 이미지 분석 추론에서 눈에 띄는 개선을 보여줍니다.",
"hunyuan-vision.description": "Hunyuan 최신 멀티모달 모델은 이미지 + 텍스트 입력을 지원하여 텍스트를 생성합니다.",
"image-01-live.description": "세밀한 디테일을 지원하는 이미지 생성 모델로, 텍스트-이미지 변환과 스타일 프리셋 제어를 지원합니다.",
@@ -770,8 +778,7 @@
"kimi-k2:1t.description": "Kimi K2는 Moonshot AI의 대규모 MoE LLM으로, 총 1조 파라미터 중 320억이 활성화됩니다. 고급 도구 사용, 추론, 코드 생성 등 에이전트 기능에 최적화되어 있습니다.",
"kimi-latest.description": "Kimi Latest는 최신 Kimi 모델을 사용하며, 실험적 기능이 포함될 수 있습니다. 이미지 이해를 지원하며, 문맥 길이에 따라 8k/32k/128k 요금 모델을 자동 선택합니다.",
"kuaishou/kat-coder-pro-v1.description": "KAT-Coder-Pro-V1(한시적 무료)은 코드 이해 및 자동화에 중점을 둔 모델로, 효율적인 코딩 에이전트를 위한 기능을 제공합니다.",
"learnlm-1.5-pro-experimental.description": "LearnLM은 학습 과학 원리에 기반하여 훈련된 실험적 과제 특화 모델로, 교육 및 학습 시나리오에서 시스템 지침을 따르며 전문가 튜터 역할을 수행합니다.",
"learnlm-2.0-flash-experimental.description": "LearnLM은 학습 과학 원리에 기반하여 훈련된 실험적 과제 특화 모델로, 교육 및 학습 시나리오에서 시스템 지침을 따르며 전문가 튜터 역할을 수행합니다.",
"labs-devstral-small-2512.description": "Devstral Small 2는 코드베이스 탐색, 여러 파일 편집 및 소프트웨어 엔지니어링 에이전트를 지원하는 데 뛰어납니다.",
"lite.description": "Spark Lite는 초저지연 및 효율적인 처리를 제공하는 경량 LLM입니다. 완전 무료로 실시간 웹 검색을 지원하며, 저사양 장치나 모델 파인튜닝에 적합한 빠른 응답 속도를 제공합니다. 특히 지식 질의응답, 콘텐츠 생성, 검색 시나리오에서 뛰어난 비용 효율성과 지능형 경험을 제공합니다.",
"llama-3.1-70b-versatile.description": "Llama 3.1 70B는 복잡한 애플리케이션을 위한 강력한 AI 추론을 제공하며, 고성능 연산을 효율적이고 정확하게 지원합니다.",
"llama-3.1-8b-instant.description": "Llama 3.1 8B는 빠른 텍스트 생성을 위한 고효율 모델로, 대규모 비용 효율적 애플리케이션에 적합합니다.",
@@ -782,7 +789,6 @@
"llama-3.2-90b-vision-preview.description": "Llama 3.2는 시각과 텍스트를 결합한 작업을 위해 설계되었으며, 이미지 캡션 생성 및 시각적 질의응답에서 뛰어난 성능을 발휘합니다. 언어 생성과 시각 추론을 연결합니다.",
"llama-3.2-vision-instruct.description": "Llama 3.2-Vision 인스트럭션 튜닝 모델은 시각 인식, 이미지 추론, 캡션 생성, 일반 이미지 질의응답에 최적화되어 있습니다.",
"llama-3.3-70b-versatile.description": "Meta Llama 3.3은 70B 파라미터를 가진 다국어 LLM으로, 사전 학습 및 인스트럭션 튜닝 버전을 제공합니다. 텍스트 전용 인스트럭션 튜닝 모델은 다국어 대화에 최적화되어 있으며, 업계 공통 벤치마크에서 다수의 오픈 및 클로즈드 채팅 모델을 능가합니다.",
"llama-3.3-70b.description": "Llama 3.3 70B는 추론과 처리량의 균형을 갖춘 중대형 Llama 모델입니다.",
"llama-3.3-instruct.description": "Llama 3.3 인스트럭션 튜닝 모델은 채팅에 최적화되어 있으며, 업계 공통 벤치마크에서 다수의 오픈 채팅 모델을 능가합니다.",
"llama3-70b-8192.description": "Meta Llama 3 70B는 복잡한 프로젝트를 위한 탁월한 복잡성 처리 능력을 제공합니다.",
"llama3-8b-8192.description": "Meta Llama 3 8B는 다양한 상황에서 강력한 추론 성능을 발휘합니다.",
@@ -832,7 +838,6 @@
"meta-llama/llama-3.1-8b-instruct:free.description": "LLaMA 3.1은 다국어 지원을 제공하며, 선도적인 생성 모델 중 하나입니다.",
"meta-llama/llama-3.2-11b-vision-instruct.description": "LLaMA 3.2는 시각과 텍스트를 결합한 작업을 위해 설계되었으며, 이미지 캡셔닝과 시각적 질의응답에 탁월합니다.",
"meta-llama/llama-3.2-3b-instruct.description": "meta-llama/llama-3.2-3b-instruct",
"meta-llama/llama-3.2-90b-vision-instruct.description": "LLaMA 3.2는 시각과 텍스트를 결합한 작업을 위해 설계되었으며, 이미지 캡셔닝과 시각적 질의응답에 탁월합니다.",
"meta-llama/llama-3.3-70b-instruct.description": "Llama 3.3은 가장 진보된 다국어 오픈소스 Llama 모델로, 매우 낮은 비용으로 405B에 근접한 성능을 제공합니다. Transformer 기반이며, SFT 및 RLHF를 통해 유용성과 안전성이 향상되었습니다. 인스트럭션 튜닝 버전은 다국어 채팅에 최적화되어 있으며, 업계 벤치마크에서 많은 오픈 및 클로즈드 챗 모델을 능가합니다. 지식 기준일: 2023년 12월",
"meta-llama/llama-3.3-70b-instruct:free.description": "Llama 3.3은 가장 진보된 다국어 오픈소스 Llama 모델로, 매우 낮은 비용으로 405B에 근접한 성능을 제공합니다. Transformer 기반이며, SFT 및 RLHF를 통해 유용성과 안전성이 향상되었습니다. 인스트럭션 튜닝 버전은 다국어 채팅에 최적화되어 있으며, 업계 벤치마크에서 많은 오픈 및 클로즈드 챗 모델을 능가합니다. 지식 기준일: 2023년 12월",
"meta.llama3-1-405b-instruct-v1:0.description": "Meta Llama 3.1 405B Instruct는 Llama 3.1 Instruct 모델 중 가장 크고 강력한 모델로, 대화 추론 및 합성 데이터 생성에 특화된 고급 모델입니다. 도메인 특화 사전 학습 또는 파인튜닝의 강력한 기반이 됩니다. Llama 3.1 다국어 LLM은 8B, 70B, 405B 크기로 사전 학습 및 지시 기반 튜닝된 생성 모델 세트이며, 텍스트 입력/출력을 지원합니다. 이 지시 기반 텍스트 모델은 다국어 대화에 최적화되어 있으며, 업계 표준 벤치마크에서 많은 오픈 챗 모델을 능가합니다. Llama 3.1은 상업적 및 연구 목적으로 다양한 언어에서 사용 가능하도록 설계되었습니다. 지시 기반 모델은 어시스턴트 스타일의 채팅에 적합하며, 사전 학습 모델은 보다 일반적인 자연어 생성 작업에 적합합니다. Llama 3.1의 출력은 합성 데이터 생성 및 정제 등 다른 모델의 성능 향상에도 활용될 수 있습니다. Llama 3.1은 최적화된 아키텍처를 갖춘 자기회귀 Transformer 모델이며, 튜닝된 버전은 SFT(지도형 파인튜닝)와 RLHF(인간 피드백 기반 강화 학습)를 통해 유용성과 안전성 측면에서 인간의 선호에 맞춰 조정됩니다.",
@@ -894,7 +899,7 @@
"mistral-large-instruct.description": "Mistral-Large-Instruct-2407은 123B 파라미터를 갖춘 고급 밀집 LLM으로, 최첨단 추론, 지식, 코딩 기능을 제공합니다.",
"mistral-large-latest.description": "Mistral Large는 다국어 작업, 복잡한 추론, 코드 생성에 강력한 플래그십 모델로, 고급 애플리케이션에 이상적입니다.",
"mistral-large.description": "Mixtral Large는 Mistral의 플래그십 모델로, 코드 생성, 수학, 추론을 128K 문맥 창과 결합합니다.",
"mistral-medium-latest.description": "Mistral Medium 3 8배 낮은 비용으로 최첨단 성능을 제공하며, 엔터프라이즈 배포를 간소화합니다.",
"mistral-medium-latest.description": "Mistral Medium 3.1은 8배 낮은 비용으로 최첨단 성능을 제공하며, 엔터프라이즈 배포를 간소화합니다.",
"mistral-nemo-instruct.description": "Mistral-Nemo-Instruct-2407은 Mistral-Nemo-Base-2407의 명령어 튜닝 버전입니다.",
"mistral-nemo.description": "Mistral Nemo는 Mistral AI와 NVIDIA가 공동 개발한 고효율 12B 모델입니다.",
"mistral-small-latest.description": "Mistral Small은 번역, 요약, 감정 분석에 적합한 비용 효율적이고 빠르며 신뢰할 수 있는 옵션입니다.",
@@ -933,7 +938,7 @@
"moonshot-v1-auto.description": "Moonshot V1 Auto는 현재 컨텍스트 토큰 사용량에 따라 적절한 모델을 자동으로 선택합니다.",
"moonshotai/Kimi-Dev-72B.description": "Kimi-Dev-72B는 대규모 강화학습을 통해 최적화된 오픈소스 코드 LLM으로, 견고하고 실용적인 패치를 생성합니다. SWE-bench Verified에서 60.4%를 기록하며 버그 수정 및 코드 리뷰와 같은 자동화 소프트웨어 엔지니어링 작업에서 오픈모델 최고 기록을 세웠습니다.",
"moonshotai/Kimi-K2-Instruct-0905.description": "Kimi K2-Instruct-0905는 가장 최신이자 강력한 Kimi K2 모델로, 총 1조 파라미터 중 320억이 활성화되는 최상급 MoE 모델입니다. 벤치마크 및 실제 에이전트 작업에서 뛰어난 Agentic Coding 지능을 보이며, 프론트엔드 코드의 미적 품질과 사용성도 향상되었습니다.",
"moonshotai/Kimi-K2-Thinking.description": "Kimi K2 Thinking은 최신이자 가장 강력한 오픈소스 사고 모델로, 다단계 추론 깊이를 크게 확장하고 200~300회 연속 도구 사용에서도 안정적인 성능을 유지합니다. HLE, BrowseComp 에서 새로운 기록을 세우며, 코딩, 수학, 논리, 에이전트 시나리오에 탁월합니다. 약 1조 파라미터의 MoE 아키텍처 기반으로, 256K 컨텍스트 윈도우와 도구 호출을 지원합니다.",
"moonshotai/Kimi-K2-Thinking.description": "Kimi K2 Thinking은 최신이자 가장 강력한 오픈 소스 사고 모델입니다. 다단계 추론 깊이를 크게 확장하고, 200~300회 연속 호출 동안 안정적인 도구 사용을 유지하며, Humanity's Last Exam (HLE), BrowseComp 및 기타 벤치마크에서 새로운 기록을 세웠습니다. 코딩, 수학, 논리 에이전트 시나리오에서 뛰어난 성능을 발휘합니다. 약 1조 개의 총 파라미터를 가진 MoE 아키텍처 기반으로 하며, 256K 컨텍스트 윈도우와 도구 호출을 지원합니다.",
"moonshotai/kimi-k2-0711.description": "Kimi K2 0711은 Kimi 시리즈의 Instruct 변형으로, 고품질 코드 작성과 도구 사용에 적합합니다.",
"moonshotai/kimi-k2-0905.description": "Kimi K2 0905는 컨텍스트 확장과 추론 성능 향상을 위한 업데이트로, 코딩 최적화가 포함되어 있습니다.",
"moonshotai/kimi-k2-instruct-0905.description": "kimi-k2-0905-preview 모델은 256K 컨텍스트 윈도우를 지원하며, 향상된 Agentic Coding, 더 정제되고 실용적인 프론트엔드 코드, 뛰어난 컨텍스트 이해력을 제공합니다.",
@@ -948,8 +953,8 @@
"nvidia/Llama-3.1-Nemotron-70B-Instruct-HF.description": "Llama 3.1 Nemotron 70B는 NVIDIA가 사용자 응답의 유용성을 향상시키기 위해 맞춤 제작한 LLM입니다. Arena Hard, AlpacaEval 2 LC, GPT-4-Turbo MT-Bench에서 모두 1위를 기록하며, 2024년 10월 1일 기준 자동 정렬 벤치마크에서 최고의 성능을 보입니다. 이 모델은 Llama-3.1-70B-Instruct를 기반으로 RLHF(REINFORCE), Llama-3.1-Nemotron-70B-Reward, HelpSteer2-Preference 프롬프트를 활용해 학습되었습니다.",
"nvidia/llama-3.1-nemotron-51b-instruct.description": "탁월한 정확도와 효율성을 제공하는 독창적인 언어 모델입니다.",
"nvidia/llama-3.1-nemotron-70b-instruct.description": "Llama-3.1-Nemotron-70B-Instruct는 LLM 응답의 유용성을 높이기 위해 NVIDIA가 맞춤 설계한 모델입니다.",
"o1-mini.description": "o1-preview보다 작고 빠르며, 비용이 80% 저렴합니다. 코드 생성 및 짧은 문맥 작업에 강점을 보입니다.",
"o1-preview.description": "수학 및 과학을 포함한 고급 추론과 복잡한 문제 해결에 중점을 둔 모델입니다. 깊은 문맥 이해와 자율 워크플로우가 필요한 애플리케이션에 적합합니다.",
"o1-mini.description": "o1-mini는 코딩, 수학 및 과학을 위해 설계된 빠르 비용 효율적인 추론 모델입니다. 128K 컨텍스트와 2023년 10월 지식 컷오프를 가지고 있습니다.",
"o1-preview.description": "o1은 광범위한 지식이 필요한 복잡한 작업을 위한 OpenAI의 새로운 추론 모델입니다. 128K 컨텍스트와 2023년 10월 지식 컷오프를 가지고 있습니다.",
"o1-pro.description": "o1 시리즈는 강화 학습을 통해 응답 전에 사고하고 복잡한 추론을 처리하도록 훈련되었습니다. o1-pro는 더 많은 연산을 사용하여 더 깊이 사고하고 일관되게 높은 품질의 응답을 제공합니다.",
"o1.description": "o1은 OpenAI의 새로운 추론 모델로, 텍스트+이미지 입력과 텍스트 출력을 지원하며, 폭넓은 지식이 필요한 복잡한 작업에 적합합니다. 200K 문맥 창과 2023년 10월 지식 기준을 갖추고 있습니다.",
"o3-2025-04-16.description": "o3는 OpenAI의 새로운 추론 모델로, 텍스트+이미지 입력과 텍스트 출력을 지원하며, 폭넓은 지식이 필요한 복잡한 작업에 적합합니다.",
@@ -1022,7 +1027,6 @@
"qianfan-check-vl.description": "Qianfan Check VL은 이미지-텍스트 적합성 및 인식 작업을 위한 멀티모달 콘텐츠 검토 모델입니다.",
"qianfan-composition.description": "Qianfan Composition은 이미지와 텍스트의 혼합 이해 및 생성을 위한 멀티모달 창작 모델입니다.",
"qianfan-engcard-vl.description": "Qianfan EngCard VL은 영어 환경에 특화된 멀티모달 인식 모델입니다.",
"qianfan-lightning-128b-a19b.description": "Qianfan Lightning 128B A19B는 복잡한 질의응답 및 대규모 추론을 위한 고성능 중국어 범용 모델입니다.",
"qianfan-llama-vl-8b.description": "Qianfan Llama VL 8B는 Llama 기반의 멀티모달 모델로, 일반적인 이미지-텍스트 이해를 지원합니다.",
"qianfan-multipicocr.description": "Qianfan MultiPicOCR은 여러 이미지에서 텍스트를 감지하고 인식하는 다중 이미지 OCR 모델입니다.",
"qianfan-qi-vl.description": "Qianfan QI VL은 복잡한 이미지-텍스트 시나리오에서 정확한 검색 및 질의응답을 위한 멀티모달 QA 모델입니다.",
@@ -1032,7 +1036,6 @@
"qvq-72b-preview.description": "QVQ-72B-Preview는 시각적 추론 향상을 목표로 하는 Qwen의 실험적 연구 모델입니다.",
"qvq-max.description": "Qwen QVQ 시각 추론 모델은 시각 입력과 연쇄적 사고 출력을 지원하며, 수학, 코딩, 시각 분석, 창의적 작업 및 일반 작업에서 강력한 성능을 발휘합니다.",
"qvq-plus.description": "시각 입력과 연쇄적 사고 출력을 지원하는 시각 추론 모델입니다. qvq-plus 시리즈는 qvq-max의 후속으로, 더 빠른 추론과 우수한 품질-비용 균형을 제공합니다.",
"qwen-3-32b.description": "Qwen 3 32B: 다국어 및 코딩 작업에 강하며, 중규모 프로덕션 환경에 적합합니다.",
"qwen-coder-plus.description": "Qwen 코드 모델입니다.",
"qwen-coder-turbo-latest.description": "Qwen 코드 모델입니다.",
"qwen-coder-turbo.description": "Qwen 코드 모델입니다.",
@@ -1128,7 +1131,6 @@
"qwen3-coder-next.description": "다중 파일 코드 생성, 디버깅 및 고속 에이전트 워크플로우에 최적화된 차세대 Qwen 코더입니다. 강력한 도구 통합과 향상된 추론 성능을 제공합니다.",
"qwen3-coder-plus.description": "Qwen 코드 모델입니다. 최신 Qwen3-Coder 시리즈는 Qwen3 기반으로, 자율 프로그래밍을 위한 강력한 코딩 에이전트 기능, 도구 활용, 환경 상호작용을 제공하며, 우수한 코드 성능과 견고한 범용 능력을 갖추고 있습니다.",
"qwen3-coder:480b.description": "Alibaba의 고성능 장문 컨텍스트 모델로, 에이전트 및 코딩 작업에 적합합니다.",
"qwen3-max-2026-01-23.description": "Qwen3 Max 모델은 2.5 시리즈 대비 일반 능력, 중영어 이해, 복잡한 지시 따르기, 주관적 개방형 작업, 다국어 능력, 도구 사용에서 큰 향상을 이루었으며, 환각 현상이 줄었습니다. 최신 qwen3-max는 qwen3-max-preview보다 에이전트 프로그래밍 및 도구 사용이 향상되었으며, 복잡한 에이전트 요구를 충족하는 분야 최고 성능을 달성했습니다.",
"qwen3-max-preview.description": "복잡하고 다단계 작업에 최적화된 Qwen 모델의 프리뷰 버전입니다. 사고 기능을 지원합니다.",
"qwen3-max.description": "Qwen3 Max 모델은 2.5 시리즈 대비 전반적인 능력, 중영어 이해, 복잡한 지시 수행, 주관적 개방형 작업, 다국어 처리, 도구 활용 등에서 큰 향상을 보이며, 환각 현상도 줄였습니다. 최신 qwen3-max는 qwen3-max-preview보다 에이전트 프로그래밍과 도구 활용이 향상되었습니다. 이 릴리스는 분야별 SOTA 수준에 도달하며, 더 복잡한 에이전트 요구를 충족합니다.",
"qwen3-next-80b-a3b-instruct.description": "차세대 Qwen3 오픈소스 모델로, 이전 버전(Qwen3-235B-A22B-Instruct-2507) 대비 중국어 이해, 논리적 추론, 텍스트 생성 능력이 향상되었습니다.",
@@ -1145,7 +1147,8 @@
"qwen3-vl-flash.description": "Qwen3 VL Flash는 지연 민감 또는 대량 요청에 적합한 경량 고속 추론 버전입니다.",
"qwen3-vl-plus.description": "Qwen VL은 시각 이해 기능을 갖춘 텍스트 생성 모델입니다. OCR 수행은 물론, 제품 사진에서 속성 추출이나 이미지 기반 문제 해결 등 요약 및 추론도 가능합니다.",
"qwen3.5-397b-a17b.description": "텍스트, 이미지 및 비디오 입력을 지원합니다. 텍스트 전용 작업에서는 Qwen3 Max와 비교 가능한 성능을 제공하며, 더 높은 효율성과 낮은 비용을 자랑합니다. 멀티모달 기능에서는 Qwen3 VL 시리즈에 비해 상당한 개선을 보여줍니다.",
"qwen3.5-plus.description": "Qwen3.5 Plus는 텍스트, 이미지 및 비디오 입력을 지원합니다. 텍스트 전용 작업에서 Qwen3 Max와 비교 가능한 성능을 제공하며, 더 효율성과 낮은 비용을 자랑합니다. 멀티모달 기능에서는 Qwen3 VL 시리즈에 비해 상당한 개선을 보여줍니다.",
"qwen3.5-plus.description": "Qwen3.5 Plus는 텍스트, 이미지 및 비디오 입력을 지원합니다. 순수 텍스트 작업에서 Qwen3 Max와 비한 성능을 제공하며, 더 은 성과 낮은 비용을 자랑합니다. 멀티모달 기능 Qwen3 VL 시리즈에 비해 크게 향상되었습니다.",
"qwen3.5:397b.description": "Qwen3.5는 하이브리드 아키텍처(Mixture-of-Experts + 선형 주의)를 갖춘 통합 비전-언어 기반 모델로, 강력한 멀티모달 추론, 코딩 및 긴 컨텍스트 처리 능력을 제공합니다. 256K 컨텍스트 윈도우를 지원합니다.",
"qwen3.description": "Qwen3는 Alibaba의 차세대 대형 언어 모델로, 다양한 활용 사례에서 강력한 성능을 발휘합니다.",
"qwq-32b-preview.description": "QwQ는 향상된 추론 능력에 중점을 둔 Qwen의 실험적 연구 모델입니다.",
"qwq-32b.description": "QwQ는 Qwen 계열의 추론 모델입니다. 일반적인 지시 조정 모델과 비교해 사고 및 추론 능력이 뛰어나며, 특히 복잡한 문제에서 다운스트림 성능을 크게 향상시킵니다. QwQ-32B는 DeepSeek-R1 및 o1-mini와 경쟁할 수 있는 중형 추론 모델입니다.",
@@ -1187,7 +1190,7 @@
"step-2-16k.description": "복잡한 대화를 위한 대용량 문맥 상호작용을 지원합니다.",
"step-2-mini.description": "차세대 자체 개발 MFA 어텐션 아키텍처 기반으로, Step-1 수준의 결과를 훨씬 낮은 비용으로 제공하며, 처리량과 지연 시간도 개선되었습니다. 일반 작업과 강력한 코딩 능력을 처리합니다.",
"step-2x-large.description": "StepFun의 차세대 이미지 생성 모델로, 텍스트 프롬프트로부터 고품질 이미지를 생성합니다. 더 사실적인 질감과 강력한 중영문 텍스트 렌더링을 제공합니다.",
"step-3.5-flash.description": "Stepfun의 플래그십 언어 추론 모델입니다. 이 모델은 최고 수준의 추론 능력과 빠르고 신뢰할 수 있는 실행을 제공합니다. 복잡한 작업을 분해하고 계획하며, 도구를 빠르고 신뢰성 있게 호출하여 수행하며, 논리적 추론, 수학, 소프트웨어 엔지니어링, 심층 연구 및 기타 정교한 작업에서 뛰어난 성능을 발휘합니다. 컨텍스트 길이는 256K입니다.",
"step-3.5-flash.description": "Stepfun의 플래그십 언어 추론 모델입니다. 이 모델은 최상급 추론 능력과 빠르고 신뢰할 수 있는 실행 능력을 갖추고 있습니다. 복잡한 작업을 분해하고 계획하며, 도구를 빠르고 신뢰성 있게 호출하여 작업을 수행할 수 있으며, 논리적 추론, 수학, 소프트웨어 엔지니어링 심층 연구와 같은 다양한 복잡한 작업에 능숙합니다.",
"step-3.description": "강력한 시각 인식과 복잡한 추론 능력을 갖춘 모델로, 도메인 간 지식 이해, 수학-시각 교차 분석, 다양한 일상 시각 분석 작업을 정확하게 처리합니다.",
"step-r1-v-mini.description": "이미지와 텍스트를 처리한 후 깊은 추론을 통해 텍스트를 생성하는 강력한 이미지 이해 추론 모델입니다. 시각 추론에 뛰어나며, 수학, 코딩, 텍스트 추론에서 최고 수준의 성능을 발휘하며, 100K 문맥 창을 지원합니다.",
"stepfun-ai/step3.description": "Step3는 StepFun의 최첨단 멀티모달 추론 모델로, 총 321B, 활성 38B 파라미터의 MoE 아키텍처 기반입니다. 종단 간 설계로 디코딩 비용을 최소화하면서 최고 수준의 비전-언어 추론을 제공합니다. MFA 및 AFD 설계를 통해 고급 및 저사양 가속기 모두에서 효율적입니다. 사전학습은 20T+ 텍스트 토큰과 4T 이미지-텍스트 토큰을 다국어로 사용하며, 수학, 코드, 멀티모달 벤치마크에서 최고 수준의 오픈모델 성능을 달성합니다.",
@@ -1276,10 +1279,11 @@
"z-ai/glm4.7.description": "GLM-4.7은 Zhipu의 최신 플래그십 모델로, 에이전트 코딩 시나리오에서 향상된 코딩 능력을 제공합니다.",
"z-ai/glm5.description": "GLM-5는 Zhipu AI의 새로운 플래그십 기반 모델로, 에이전트 엔지니어링에서 오픈소스 SOTA 성능을 달성하며 코딩 및 에이전트 능력에서 Claude Opus 4.5와 동등한 성능을 제공합니다.",
"z-image-turbo.description": "Z-Image는 경량 텍스트-이미지 생성 모델로, 이미지를 빠르게 생성하며 중국어와 영어 텍스트 렌더링을 지원하고 다양한 해상도와 종횡비에 유연하게 적응합니다.",
"zai-glm-4.7.description": "이 모델은 고급 추론 능력과 도구 사용 능력을 갖춘 강력한 코딩 성능을 제공하며, 에이전트 코딩 애플리케이션에서 향상된 실제 성능을 발휘합니다.",
"zai-org/GLM-4.5-Air.description": "GLM-4.5-Air는 Mixture-of-Experts 아키텍처를 사용하는 에이전트 애플리케이션용 기본 모델입니다. 도구 사용, 웹 브라우징, 소프트웨어 엔지니어링, 프론트엔드 코딩에 최적화되어 있으며, Claude Code 및 Roo Code와 같은 코드 에이전트와 통합됩니다. 복잡한 추론과 일상적인 시나리오 모두를 처리할 수 있는 하이브리드 추론을 사용합니다.",
"zai-org/GLM-4.5.description": "GLM-4.5는 Mixture-of-Experts 아키텍처를 사용하는 에이전트 애플리케이션용 기본 모델입니다. 도구 사용, 웹 브라우징, 소프트웨어 엔지니어링, 프론트엔드 코딩에 깊이 최적화되어 있으며, Claude Code 및 Roo Code와 같은 코드 에이전트와 통합됩니다. 복잡한 추론과 일상적인 시나리오 모두를 처리할 수 있는 하이브리드 추론을 사용합니다.",
"zai-org/GLM-4.5V.description": "GLM-4.5V는 GLM-4.5-Air 기반의 최신 VLM으로, 106B 총 파라미터(12B 활성)를 갖춘 MoE 아키텍처를 사용하여 낮은 비용으로 강력한 성능을 제공합니다. GLM-4.1V-Thinking 경로를 따르며, 3D-RoPE를 추가하여 3D 공간 추론을 향상시켰습니다. 사전학습, SFT, RL을 통해 최적화되었으며, 이미지, 비디오, 장문 문서를 처리할 수 있습니다. 41개 공개 멀티모달 벤치마크에서 오픈 모델 중 최고 순위를 기록했습니다. Thinking 모드 전환 기능을 통해 속도와 깊이를 조절할 수 있습니다.",
"zai-org/GLM-4.6.description": "GLM-4.5와 비교해 GLM-4.6은 컨텍스트 길이를 128K에서 200K로 확장하여 더 복잡한 에이전트 작업을 처리할 수 있습니다. 코드 벤치마크에서 더 높은 점수를 기록하며, Claude Code, Cline, Roo Code, Kilo Code 등 실제 애플리케이션에서 더 강력한 성능을 보입니다. 추론 능력이 향상되었고, 추론 중 도구 사용이 가능하여 전반적인 역량이 강화되었습니다. 에이전트 프레임워크와의 통합이 개선되었으며, 도구/검색 에이전트 성능이 향상되고, 더 자연스러운 문체와 역할극 표현을 제공합니다.",
"zai-org/GLM-4.6V.description": "GLM-4.6V는 시각적 이해 정확도에서 동일한 파라미터 규모의 SOTA를 달성했으며, 모델 아키텍처에서 Function Call(도구 호출) 기능을 시각 모델에 처음으로 원활히 통합하여 '시각적 인지'에서 '실행 가능한 행동(Action)'으로의 연결을 구축했습니다. 이를 통해 실제 비즈니스 시나리오에서 멀티모달 에이전트를 위한 통합 기술 기반을 제공합니다.",
"zai/glm-4.5-air.description": "GLM-4.5 및 GLM-4.5-Air는 에이전트 애플리케이션을 위한 최신 대표 모델로, 모두 MoE를 사용합니다. GLM-4.5는 총 355B 파라미터(32B 활성), GLM-4.5-Air는 더 슬림한 106B 총 파라미터(12B 활성)를 갖추고 있습니다.",
"zai/glm-4.5.description": "GLM-4.5 시리즈는 에이전트를 위해 설계되었습니다. 대표 모델인 GLM-4.5는 355B 총 파라미터(32B 활성)를 갖추고 있으며, 추론, 코딩, 에이전트 기능을 결합한 하이브리드 추론 시스템으로 이중 작동 모드를 제공합니다.",
"zai/glm-4.5v.description": "GLM-4.5V는 GLM-4.5-Air를 기반으로 하며, 검증된 GLM-4.1V-Thinking 기술을 계승하고, 106B 파라미터의 강력한 MoE 아키텍처로 확장되었습니다.",
+14
View File
@@ -24,6 +24,20 @@
"builtins.lobe-agent-builder.inspector.noResults": "결과 없음",
"builtins.lobe-agent-builder.inspector.togglePlugin": "전환",
"builtins.lobe-agent-builder.title": "도우미 빌더",
"builtins.lobe-agent-management.apiName.callAgent": "통화 에이전트",
"builtins.lobe-agent-management.apiName.createAgent": "에이전트 생성",
"builtins.lobe-agent-management.apiName.deleteAgent": "에이전트 삭제",
"builtins.lobe-agent-management.apiName.searchAgent": "에이전트 검색",
"builtins.lobe-agent-management.apiName.updateAgent": "에이전트 업데이트",
"builtins.lobe-agent-management.inspector.callAgent.sync": "통화 중:",
"builtins.lobe-agent-management.inspector.callAgent.task": "작업 할당 대상:",
"builtins.lobe-agent-management.inspector.createAgent.title": "에이전트 생성 중:",
"builtins.lobe-agent-management.inspector.searchAgent.all": "에이전트 검색:",
"builtins.lobe-agent-management.inspector.searchAgent.market": "시장 검색:",
"builtins.lobe-agent-management.inspector.searchAgent.results": "{{count}} 결과",
"builtins.lobe-agent-management.inspector.searchAgent.user": "내 에이전트 검색:",
"builtins.lobe-agent-management.inspector.updateAgent.title": "에이전트 업데이트 중:",
"builtins.lobe-agent-management.title": "에이전트 관리자",
"builtins.lobe-cloud-sandbox.apiName.editLocalFile": "파일 편집",
"builtins.lobe-cloud-sandbox.apiName.executeCode": "코드 실행",
"builtins.lobe-cloud-sandbox.apiName.exportFile": "파일 내보내기",
+3
View File
@@ -724,6 +724,9 @@
"tools.builtins.lobe-artifacts.description": "인터랙티브 UI 구성 요소, 차트 및 웹 콘텐츠를 생성하고 미리보기",
"tools.builtins.lobe-artifacts.readme": "인터랙티브 UI 구성 요소, 데이터 시각화, 차트, SVG 그래픽 및 웹 애플리케이션을 생성하고 실시간으로 미리보기할 수 있습니다. 사용자가 직접 상호작용할 수 있는 풍부한 시각 콘텐츠를 만들어보세요.",
"tools.builtins.lobe-artifacts.title": "아티팩트",
"tools.builtins.lobe-calculator.description": "수학 계산을 수행하고, 방정식을 풀며, 기호 표현을 다룹니다",
"tools.builtins.lobe-calculator.readme": "기본 산술, 대수 방정식, 미적분 연산 및 기호 수학을 지원하는 고급 수학 계산기입니다. 진법 변환, 방정식 풀이, 미분, 적분 등을 포함합니다.",
"tools.builtins.lobe-calculator.title": "계산기",
"tools.builtins.lobe-cloud-sandbox.description": "보안된 클라우드 환경에서 코드 실행, 명령어 실행 및 파일 관리",
"tools.builtins.lobe-cloud-sandbox.readme": "격리된 클라우드 환경에서 Python, JavaScript, TypeScript 코드를 실행하세요. 셸 명령 실행, 파일 관리, 정규식으로 콘텐츠 검색, 결과 안전하게 내보내기를 지원합니다.",
"tools.builtins.lobe-cloud-sandbox.title": "클라우드 샌드박스",
+7 -3
View File
@@ -224,15 +224,18 @@
"providerModels.item.modelConfig.extendParams.options.gpt5_2ProReasoningEffort.hint": "Voor GPT-5.2 Pro-serie; regelt de intensiteit van het redeneren.",
"providerModels.item.modelConfig.extendParams.options.gpt5_2ReasoningEffort.hint": "Voor GPT-5.2-serie; regelt de intensiteit van het redeneren.",
"providerModels.item.modelConfig.extendParams.options.imageAspectRatio.hint": "Voor Gemini-afbeeldingsgeneratiemodellen; regelt de beeldverhouding van gegenereerde afbeeldingen.",
"providerModels.item.modelConfig.extendParams.options.imageAspectRatio2.hint": "Voor Nano Banana 2; regelt de beeldverhouding van gegenereerde afbeeldingen (ondersteunt extra-breed 1:4, 4:1, 1:8, 8:1).",
"providerModels.item.modelConfig.extendParams.options.imageResolution.hint": "Voor Gemini 3-afbeeldingsgeneratiemodellen; regelt de resolutie van gegenereerde afbeeldingen.",
"providerModels.item.modelConfig.extendParams.options.imageResolution2.hint": "Voor Gemini 3.1 Flash Image-modellen; regelt de resolutie van gegenereerde afbeeldingen (ondersteunt 512px).",
"providerModels.item.modelConfig.extendParams.options.reasoningBudgetToken.hint": "Voor Claude, Qwen3 en vergelijkbare modellen; regelt het tokenbudget voor redeneren.",
"providerModels.item.modelConfig.extendParams.options.reasoningEffort.hint": "Voor OpenAI en andere redeneermodellen; regelt de inspanning voor redeneren.",
"providerModels.item.modelConfig.extendParams.options.textVerbosity.hint": "Voor GPT-5+-serie; regelt de uitvoerige aard van de output.",
"providerModels.item.modelConfig.extendParams.options.thinking.hint": "Voor sommige Doubao-modellen; laat het model beslissen of diep nadenken nodig is.",
"providerModels.item.modelConfig.extendParams.options.thinkingBudget.hint": "Voor Gemini-serie; regelt het denkbudget.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel.hint": "Voor Gemini 3 Flash Preview-modellen; regelt de diepgang van het denken.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel2.hint": "Voor Gemini 3 Pro Preview-modellen; regelt de diepgang van het denken.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel3.hint": "Voor Gemini 3.1 Pro Preview-modellen; regelt de denkdiepte met lage/middelmatige/hoge niveaus.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel.hint": "Voor Gemini 3 Flash Preview-modellen; regelt de diepte van het denken.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel2.hint": "Voor Gemini 3 Pro Preview-modellen; regelt de diepte van het denken.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel3.hint": "Voor Gemini 3.1 Pro Preview-modellen; regelt de diepte van het denken met lage/middelmatige/hoge niveaus.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel4.hint": "Voor Gemini 3.1 Flash Image-modellen; schakelt denken aan/uit.",
"providerModels.item.modelConfig.extendParams.options.urlContext.hint": "Voor Gemini-serie; ondersteunt het aanleveren van URL-context.",
"providerModels.item.modelConfig.extendParams.placeholder": "Selecteer uit te schakelen uitgebreide parameters",
"providerModels.item.modelConfig.extendParams.previewFallback": "Voorbeeld niet beschikbaar",
@@ -311,6 +314,7 @@
"providerModels.tabs.image": "Beeld",
"providerModels.tabs.stt": "ASR",
"providerModels.tabs.tts": "TTS",
"providerModels.tabs.video": "Video",
"sortModal.success": "Sortering succesvol bijgewerkt",
"sortModal.title": "Aangepaste volgorde",
"sortModal.update": "Bijwerken",
+35 -31
View File
@@ -55,7 +55,8 @@
"FLUX.1-dev.description": "FLUX.1-dev is een open-source multimodaal taalmodel (MLLM) van Black Forest Labs, geoptimaliseerd voor beeld-teksttaken en combineert begrip en generatie van beeld/tekst. Gebouwd op geavanceerde LLMs (zoals Mistral-7B), gebruikt het een zorgvuldig ontworpen vision encoder en meertraps instructie-tuning om multimodale coördinatie en complexe redeneertaken mogelijk te maken.",
"Gryphe/MythoMax-L2-13b.description": "MythoMax-L2 (13B) is een innovatief model voor diverse domeinen en complexe taken.",
"HelloMeme.description": "HelloMeme is een AI-tool die memes, GIFs of korte videos genereert op basis van de beelden of bewegingen die je aanlevert. Er zijn geen teken- of programmeervaardigheden nodig—alleen een referentiebeeld—om leuke, aantrekkelijke en stijlvaste content te maken.",
"HiDream-I1-Full.description": "HiDream-E1-Full is een open-source multimodaal beeldbewerkingsmodel van HiDream.ai, gebaseerd op een geavanceerde Diffusion Transformer-architectuur en sterke taalbegrip (met ingebouwde LLaMA 3.1-8B-Instruct). Het ondersteunt beeldgeneratie op basis van natuurlijke taal, stijltransfers, lokale bewerkingen en herschildering, met uitstekend beeld-tekstbegrip en uitvoering.",
"HiDream-E1-Full.description": "HiDream-E1-Full is een open-source multimodaal beeldbewerkingsmodel van HiDream.ai, gebaseerd op een geavanceerde Diffusion Transformer-architectuur en sterke taalbegrip (ingebouwde LLaMA 3.1-8B-Instruct). Het ondersteunt natuurlijke-taalgestuurde beeldgeneratie, stijltransfer, lokale bewerkingen en herschilderen, met uitstekende beeld-tekstbegrip en uitvoering.",
"HiDream-I1-Full.description": "HiDream-I1 is een nieuw open-source basisbeeldgeneratiemodel uitgebracht door HiDream. Met 17 miljard parameters (Flux heeft 12 miljard) kan het binnen enkele seconden toonaangevende beeldkwaliteit leveren.",
"HunyuanDiT-v1.2-Diffusers-Distilled.description": "hunyuandit-v1.2-distilled is een lichtgewicht tekst-naar-beeldmodel dat via distillatie is geoptimaliseerd om snel beelden van hoge kwaliteit te genereren, vooral geschikt voor omgevingen met beperkte middelen en realtime generatie.",
"InstantCharacter.description": "InstantCharacter is een tuning-vrij gepersonaliseerd karaktergeneratiemodel, uitgebracht door Tencent AI in 2025, gericht op getrouwe en consistente karaktergeneratie over verschillende scenarios. Het kan een karakter modelleren op basis van één referentiebeeld en flexibel overdragen naar verschillende stijlen, acties en achtergronden.",
"InternVL2-8B.description": "InternVL2-8B is een krachtig vision-language model dat multimodale beeld-tekstverwerking ondersteunt, beeldinhoud nauwkeurig herkent en relevante beschrijvingen of antwoorden genereert.",
@@ -80,7 +81,7 @@
"MiniMax-M2.1.description": "MiniMax-M2.1 is het vlaggenschip open-source grote model van MiniMax, gericht op het oplossen van complexe, realistische taken. De kernkwaliteiten zijn meertalige programmeermogelijkheden en het vermogen om complexe taken als een Agent op te lossen.",
"MiniMax-M2.5-Lightning.description": "M2.5 Lightning: Zelfde prestaties, sneller en wendbaarder (ongeveer 100 tps).",
"MiniMax-M2.5-highspeed.description": "Zelfde prestaties als M2.5 met aanzienlijk snellere inferentie.",
"MiniMax-M2.5.description": "Topprestaties en ultieme kosteneffectiviteit, eenvoudig omgaan met complexe taken (ongeveer 60 tps).",
"MiniMax-M2.5.description": "MiniMax-M2.5 is een vlaggenschip open-source groot model van MiniMax, gericht op het oplossen van complexe real-world taken. De kernsterktes zijn meertalige programmeermogelijkheden en de capaciteit om complexe taken als een Agent op te lossen.",
"MiniMax-M2.description": "Speciaal ontwikkeld voor efficiënt coderen en agent-workflows.",
"MiniMax-Text-01.description": "MiniMax-01 introduceert grootschalige lineaire aandacht voorbij klassieke Transformers, met 456B parameters en 45,9B geactiveerd per pass. Het levert topprestaties en ondersteunt tot 4M tokens context (32× GPT-4o, 20× Claude-3.5-Sonnet).",
"MiniMaxAI/MiniMax-M1-80k.description": "MiniMax-M1 is een open-gewichten grootschalig hybrid-attention redeneermodel met 456B totale parameters en ~45,9B actief per token. Het ondersteunt native 1M context en gebruikt Flash Attention om FLOPs met 75% te verminderen bij 100K-token generatie versus DeepSeek R1. Met een MoE-architectuur plus CISPO en hybrid-attention RL-training behaalt het toonaangevende prestaties op lang-input redeneren en echte software engineering-taken.",
@@ -98,6 +99,7 @@
"Phi-3.5-mini-instruct.description": "Een bijgewerkte versie van het Phi-3-mini model.",
"Phi-3.5-vision-instrust.description": "Een bijgewerkte versie van het Phi-3-vision model.",
"Pro/MiniMaxAI/MiniMax-M2.1.description": "MiniMax-M2.1 is een open-source groot taalmodel geoptimaliseerd voor agent-capaciteiten, uitblinkend in programmeren, gebruik van tools, het volgen van instructies en langetermijnplanning. Het model ondersteunt meertalige softwareontwikkeling en de uitvoering van complexe workflows in meerdere stappen, behaalt een score van 74,0 op SWE-bench Verified en overtreft Claude Sonnet 4.5 in meertalige scenarios.",
"Pro/MiniMaxAI/MiniMax-M2.5.description": "MiniMax-M2.5 is het nieuwste grote taalmodel ontwikkeld door MiniMax, getraind door grootschalige versterkingsleren in honderdduizenden complexe, real-world omgevingen. Met een MoE-architectuur en 229 miljard parameters levert het toonaangevende prestaties in taken zoals programmeren, agent-toolgebruik, zoeken en kantoorscenario's.",
"Pro/Qwen/Qwen2-7B-Instruct.description": "Qwen2-7B-Instruct is een 7 miljard parameter instructie-afgesteld LLM uit de Qwen2-serie. Het gebruikt een Transformer-architectuur met SwiGLU, attention QKV-bias en gegroepeerde query-attentie, en verwerkt grote invoer. Het presteert sterk op taalbegrip, generatie, meertalige taken, programmeren, wiskunde en redeneren, en overtreft de meeste open modellen en concurreert met gesloten modellen. Het presteert beter dan Qwen1.5-7B-Chat op meerdere benchmarks.",
"Pro/Qwen/Qwen2.5-7B-Instruct.description": "Qwen2.5-7B-Instruct maakt deel uit van de nieuwste LLM-serie van Alibaba Cloud. Het 7 miljard model biedt aanzienlijke verbeteringen in programmeren en wiskunde, ondersteunt meer dan 29 talen en verbetert het volgen van instructies, begrip van gestructureerde data en gestructureerde output (vooral JSON).",
"Pro/Qwen/Qwen2.5-Coder-7B-Instruct.description": "Qwen2.5-Coder-7B-Instruct is het nieuwste codegerichte LLM van Alibaba Cloud. Gebouwd op Qwen2.5 en getraind op 5,5 biljoen tokens, verbetert het aanzienlijk de codegeneratie, redenering en foutcorrectie, terwijl het sterke prestaties behoudt op het gebied van wiskunde en algemene taken. Het biedt een solide basis voor code-agents.",
@@ -107,13 +109,13 @@
"Pro/deepseek-ai/DeepSeek-R1-Distill-Qwen-7B.description": "DeepSeek-R1-Distill-Qwen-7B is gedistilleerd van Qwen2.5-Math-7B en verfijnd op 800.000 zorgvuldig geselecteerde DeepSeek-R1-samples. Het presteert sterk met 92,8% op MATH-500, 55,5% op AIME 2024 en een CodeForces-rating van 1189 voor een 7 miljard model.",
"Pro/deepseek-ai/DeepSeek-R1.description": "DeepSeek-R1 is een redeneringsmodel aangedreven door reinforcement learning dat herhaling vermindert en de leesbaarheid verbetert. Het gebruikt cold-start data vóór RL om redenering verder te verbeteren, evenaart OpenAI-o1 op wiskunde-, code- en redeneertaken, en verbetert de algehele resultaten door zorgvuldige training.",
"Pro/deepseek-ai/DeepSeek-V3.1-Terminus.description": "DeepSeek-V3.1-Terminus is een bijgewerkt V3.1-model gepositioneerd als een hybride agent-LLM. Het lost door gebruikers gemelde problemen op en verbetert de stabiliteit, taalconsistentie en vermindert gemengde Chinees/Engels en abnormale tekens. Het integreert denk- en niet-denkmodi met chatthema's voor flexibele omschakeling. Het verbetert ook de prestaties van Code Agent en Search Agent voor betrouwbaarder gereedschapsgebruik en meerstapstaken.",
"Pro/deepseek-ai/DeepSeek-V3.2-Exp.description": "DeepSeek-V3.2-Exp is een experimentele V3.2-release die de brug slaat naar de volgende architectuur. Het voegt DeepSeek Sparse Attention (DSA) toe bovenop V3.1-Terminus om de efficiëntie van training en inferentie met lange context te verbeteren, met optimalisaties voor gereedschapsgebruik, begrip van lange documenten en meerstapsredenering. Ideaal voor het verkennen van hogere redeneerefficiëntie met grote contextbudgetten.",
"Pro/deepseek-ai/DeepSeek-V3.2.description": "DeepSeek-V3.2 is een model dat hoge computationele efficiëntie combineert met uitstekende redeneer- en Agent-prestaties. De aanpak is gebaseerd op drie belangrijke technologische doorbraken: DeepSeek Sparse Attention (DSA), een efficiënte aandachtmechanisme dat de computationele complexiteit aanzienlijk vermindert terwijl de modelprestaties behouden blijven, specifiek geoptimaliseerd voor lange-contextscenario's; een schaalbaar versterkingsleerframework waarmee de modelprestaties kunnen wedijveren met GPT-5, en de high-compute versie kan wedijveren met Gemini-3.0-Pro in redeneercapaciteiten; en een grootschalige Agent-taaksynthesepijplijn gericht op het integreren van redeneercapaciteiten in toolgebruikscenario's, waardoor instructievolging en generalisatie in complexe interactieve omgevingen worden verbeterd. Het model behaalde gouden medailleprestaties in de Internationale Wiskunde Olympiade (IMO) en Internationale Informatica Olympiade (IOI) van 2025.",
"Pro/deepseek-ai/DeepSeek-V3.description": "DeepSeek-V3 is een MoE-model met 671 miljard parameters dat gebruikmaakt van MLA en DeepSeekMoE met verliesvrije load balancing voor efficiënte inferentie en training. Voorgetraind op 14,8 biljoen hoogwaardige tokens en verder verfijnd met SFT en RL, overtreft het andere open modellen en benadert toonaangevende gesloten modellen.",
"Pro/moonshotai/Kimi-K2-Instruct-0905.description": "Kimi K2-Instruct-0905 is de nieuwste en krachtigste Kimi K2. Het is een topklasse MoE-model met 1 biljoen totale en 32 miljard actieve parameters. Belangrijke kenmerken zijn sterkere agentgerichte programmeerintelligentie met aanzienlijke verbeteringen op benchmarks en echte agenttaken, plus verbeterde esthetiek en bruikbaarheid van frontend-code.",
"Pro/moonshotai/Kimi-K2-Thinking.description": "Kimi K2 Thinking Turbo is de Turbo-variant geoptimaliseerd voor redeneersnelheid en verwerkingscapaciteit, terwijl het de meerstapsredenering en gereedschapsgebruik van K2 Thinking behoudt. Het is een MoE-model met ongeveer 1 biljoen totale parameters, native 256K context en stabiele grootschalige tool-aanroepen voor productieomgevingen met strengere eisen aan latentie en gelijktijdigheid.",
"Pro/moonshotai/Kimi-K2.5.description": "Kimi K2.5 is een open-source native multimodaal agentmodel, gebaseerd op Kimi-K2-Base, getraind op ongeveer 1,5 biljoen gecombineerde visuele en tekstuele tokens. Het model gebruikt een MoE-architectuur met 1T totale parameters en 32B actieve parameters, ondersteunt een contextvenster van 256K en integreert naadloos visuele en taalbegripmogelijkheden.",
"Pro/zai-org/glm-4.7.description": "GLM-4.7 is het nieuwste vlaggenschipmodel van Zhipu met 355 miljard totale parameters en 32 miljard actieve parameters. Het is volledig vernieuwd op het gebied van algemene dialoog, redeneren en agentfunctionaliteit. GLM-4.7 versterkt Interleaved Thinking en introduceert Preserved Thinking en Turn-level Thinking.",
"Pro/zai-org/glm-5.description": "GLM-5 is het nieuwe generatie grote taalmodel van Zhipu, gericht op complexe systeemengineering en langlopende Agent-taken. Het model is uitgebreid tot 744B parameters (40B actief) en integreert DeepSeek Sparse Attention.",
"Pro/zai-org/glm-5.description": "GLM-5 is het volgende-generatie grote taalmodel van Zhipu, gericht op complexe systeemengineering en langdurige Agent-taken. De modelparameters zijn uitgebreid tot 744 miljard (40 miljard actief) en integreren DeepSeek Sparse Attention.",
"QwQ-32B-Preview.description": "Qwen QwQ is een experimenteel onderzoeksmodel gericht op het verbeteren van redenering.",
"Qwen/QVQ-72B-Preview.description": "QVQ-72B-Preview is een onderzoeksmodel van Qwen gericht op visuele redenering, met sterke prestaties in het begrijpen van complexe scènes en visuele wiskundeproblemen.",
"Qwen/QwQ-32B-Preview.description": "Qwen QwQ is een experimenteel onderzoeksmodel gericht op verbeterde AI-redenering.",
@@ -137,7 +139,7 @@
"Qwen/Qwen3-14B.description": "Qwen3 is een next-gen Tongyi Qwen-model met grote verbeteringen in redenering, algemene vaardigheden, agentcapaciteiten en meertalige prestaties, en ondersteunt het schakelen tussen denkmodi.",
"Qwen/Qwen3-235B-A22B-Instruct-2507.description": "Qwen3-235B-A22B-Instruct-2507 is een vlaggenschip MoE-model uit de Qwen3-serie met 235B totale en 22B actieve parameters. Het is een bijgewerkte niet-denkende versie gericht op het verbeteren van instructieopvolging, logische redenering, tekstbegrip, wiskunde, wetenschap, codering en toolgebruik. Het breidt ook meertalige kennis uit en sluit beter aan bij gebruikersvoorkeuren voor open, subjectieve taken.",
"Qwen/Qwen3-235B-A22B-Thinking-2507.description": "Qwen3-235B-A22B-Thinking-2507 is een Qwen3-model gericht op complexe redenering. Het gebruikt een MoE-architectuur met 235B totaal en ~22B actief per token voor meer efficiëntie. Als toegewijd denkmodel toont het grote verbeteringen in logica, wiskunde, wetenschap, codering en academische benchmarks, met topresultaten onder open denkmodellen. Het verbetert ook instructieopvolging, toolgebruik en tekstgeneratie, en ondersteunt standaard 256K context voor diepgaande redenering en lange documenten.",
"Qwen/Qwen3-235B-A22B.description": "Qwen3 is een next-gen Tongyi Qwen-model met grote verbeteringen in redenering, algemene vaardigheden, agentcapaciteiten en meertalige prestaties, en ondersteunt het schakelen tussen denkmodi.",
"Qwen/Qwen3-235B-A22B.description": "Qwen3 235B A22B is het ultra-schaalmodel van Qwen3 dat AI-capaciteiten van topniveau levert.",
"Qwen/Qwen3-30B-A3B-Instruct-2507.description": "Qwen3-30B-A3B-Instruct-2507 is de bijgewerkte niet-denkende versie van Qwen3-30B-A3B. Het is een MoE-model met 30,5B totaal en 3,3B actieve parameters. Het verbetert aanzienlijk de instructieopvolging, logische redenering, tekstbegrip, wiskunde, wetenschap, codering en toolgebruik, breidt meertalige kennis uit en sluit beter aan bij gebruikersvoorkeuren voor subjectieve open taken. Het ondersteunt 256K context. Dit model is uitsluitend niet-denkend en genereert geen `<think></think>` tags.",
"Qwen/Qwen3-30B-A3B-Thinking-2507.description": "Qwen3-30B-A3B-Thinking-2507 is het nieuwste denkmodel in de Qwen3-serie. Het is een MoE-model met 30,5B totaal en 3,3B actieve parameters, gericht op complexe taken. Het toont aanzienlijke verbeteringen in logica, wiskunde, wetenschap, codering en academische benchmarks, en verbetert instructieopvolging, toolgebruik, tekstgeneratie en voorkeurafstemming. Het ondersteunt standaard 256K context en kan worden uitgebreid tot 1M tokens. Deze versie is ontworpen voor denkmodus met gedetailleerde stapsgewijze redenering en sterke agentcapaciteiten.",
"Qwen/Qwen3-30B-A3B.description": "Qwen3 is een next-gen Tongyi Qwen-model met grote verbeteringen in redenering, algemene vaardigheden, agentcapaciteiten en meertalige prestaties, en ondersteunt het schakelen tussen denkmodi.",
@@ -315,7 +317,6 @@
"codeqwen.description": "CodeQwen1.5 is een groot taalmodel getraind op uitgebreide codegegevens, ontworpen voor complexe programmeertaken.",
"codestral-latest.description": "Codestral is ons meest geavanceerde codemodel; versie 2 (jan 2025) is gericht op taken met lage latentie en hoge frequentie zoals FIM, codecorrectie en testgeneratie.",
"codestral.description": "Codestral is het eerste codemodel van Mistral AI, met sterke ondersteuning voor codegeneratie.",
"codex-mini-latest.description": "codex-mini-latest is een verfijnd o4-mini-model voor de Codex CLI. Voor direct API-gebruik raden we aan te beginnen met gpt-4.1.",
"cogito-2.1:671b.description": "Cogito v2.1 671B is een Amerikaans open-source LLM dat vrij is voor commercieel gebruik. Het biedt prestaties die vergelijkbaar zijn met topmodellen, hogere efficiëntie in tokenredenering, een contextlengte van 128k en sterke algemene capaciteiten.",
"cogview-3-flash.description": "CogView-3-Flash is een gratis beeldgeneratiemodel gelanceerd door Zhipu. Het genereert beelden die aansluiten bij de instructies van de gebruiker en tegelijkertijd hogere esthetische kwaliteitsscores behalen. CogView-3-Flash wordt voornamelijk gebruikt in gebieden zoals artistieke creatie, ontwerpreferentie, gameontwikkeling en virtual reality, en helpt gebruikers om tekstbeschrijvingen snel om te zetten in beelden.",
"cogview-4.description": "CogView-4 is het eerste open-source tekst-naar-beeldmodel van Zhipu dat Chinese karakters kan genereren. Het verbetert semantisch begrip, beeldkwaliteit en weergave van Chinese/Engelse tekst, ondersteunt tweetalige prompts van willekeurige lengte en kan beelden genereren in elke resolutie binnen opgegeven bereiken.",
@@ -342,7 +343,7 @@
"command-light-nightly.description": "Om de tijd tussen grote releases te verkorten, bieden we nachtelijke Command-builds aan. Voor de command-light-serie heet dit command-light-nightly. Dit is de nieuwste, meest experimentele (en mogelijk instabiele) versie, die regelmatig zonder aankondiging wordt bijgewerkt. Daarom wordt het niet aanbevolen voor productieomgevingen.",
"command-light.description": "Een kleinere, snellere variant van Command die bijna even krachtig is, maar sneller werkt.",
"command-nightly.description": "Om de tijd tussen grote releases te verkorten, bieden we nachtelijke Command-builds aan. Voor de Command-serie heet dit command-nightly. Dit is de nieuwste, meest experimentele (en mogelijk instabiele) versie, die regelmatig zonder aankondiging wordt bijgewerkt. Daarom wordt het niet aanbevolen voor productieomgevingen.",
"command-r-03-2024.description": "Command R is een chatmodel dat instructies volgt met hogere kwaliteit, grotere betrouwbaarheid en een langer contextvenster dan eerdere modellen. Het ondersteunt complexe workflows zoals codegeneratie, RAG, toolgebruik en agents.",
"command-r-03-2024.description": "command-r is een instructievolgend chatmodel dat taaltaken uitvoert met hogere kwaliteit, verbeterde betrouwbaarheid en langere context dan eerdere modellen. Het ondersteunt complexe workflows zoals codegeneratie, RAG, toolgebruik en agents.",
"command-r-08-2024.description": "command-r-08-2024 is een bijgewerkte versie van het Command R-model, uitgebracht in augustus 2024.",
"command-r-plus-04-2024.description": "command-r-plus is een alias van command-r-plus-04-2024, dus het gebruik van command-r-plus in de API verwijst naar dat model.",
"command-r-plus-08-2024.description": "Command R+ is een chatmodel dat instructies volgt met hogere kwaliteit, grotere betrouwbaarheid en een langer contextvenster dan eerdere modellen. Het is ideaal voor complexe RAG-workflows en meerstapsgebruik van tools.",
@@ -366,7 +367,8 @@
"deepseek-ai/DeepSeek-V2.5.description": "DeepSeek-V2.5 is een upgrade van DeepSeek-V2-Chat en DeepSeek-Coder-V2-Instruct, en combineert algemene en programmeervaardigheden. Het verbetert schrijven en instructievolging voor betere voorkeurafstemming, en toont aanzienlijke vooruitgang op AlpacaEval 2.0, ArenaHard, AlignBench en MT-Bench.",
"deepseek-ai/DeepSeek-V3.1-Terminus.description": "DeepSeek-V3.1-Terminus is een bijgewerkt V3.1-model gepositioneerd als een hybride agent-LLM. Het lost door gebruikers gemelde problemen op en verbetert stabiliteit, taalconsistentie en vermindert gemengde Chinees/Engels en abnormale tekens. Het integreert Denk- en Niet-denkmodi met chattemplates voor flexibele omschakeling. Het verbetert ook de prestaties van Code Agent en Search Agent voor betrouwbaarder gebruik van tools en meerstapstaken.",
"deepseek-ai/DeepSeek-V3.1.description": "DeepSeek V3.1 gebruikt een hybride redeneersarchitectuur en ondersteunt zowel denk- als niet-denkmodi.",
"deepseek-ai/DeepSeek-V3.2-Exp.description": "DeepSeek-V3.2-Exp is een experimentele V3.2-release die de brug slaat naar de volgende architectuur. Het voegt DeepSeek Sparse Attention (DSA) toe bovenop V3.1-Terminus om de efficiëntie van training en inferentie met lange context te verbeteren, met optimalisaties voor toolgebruik, begrip van lange documenten en meerstapsredenering. Ideaal voor het verkennen van hogere redeneerefficiëntie met grote contextbudgetten.",
"deepseek-ai/DeepSeek-V3.2-Exp.description": "DeepSeek V3.2 Exp gebruikt een hybride redeneerarchitectuur en ondersteunt zowel denk- als niet-denkmodi.",
"deepseek-ai/DeepSeek-V3.2.description": "DeepSeek-V3.2 is een model dat hoge computationele efficiëntie combineert met uitstekende redeneer- en Agent-prestaties. De aanpak is gebaseerd op drie belangrijke technologische doorbraken: DeepSeek Sparse Attention (DSA), een efficiënte aandachtmechanisme dat de computationele complexiteit aanzienlijk vermindert terwijl de modelprestaties behouden blijven, specifiek geoptimaliseerd voor lange-contextscenario's; een schaalbaar versterkingsleerframework waarmee de modelprestaties kunnen wedijveren met GPT-5, en de high-compute versie kan wedijveren met Gemini-3.0-Pro in redeneercapaciteiten; en een grootschalige Agent-taaksynthesepijplijn gericht op het integreren van redeneercapaciteiten in toolgebruikscenario's, waardoor instructievolging en generalisatie in complexe interactieve omgevingen worden verbeterd. Het model behaalde gouden medailleprestaties in de Internationale Wiskunde Olympiade (IMO) en Internationale Informatica Olympiade (IOI) van 2025.",
"deepseek-ai/DeepSeek-V3.description": "DeepSeek-V3 is een MoE-model met 671 miljard parameters dat gebruikmaakt van MLA en DeepSeekMoE met verliesvrije load balancing voor efficiënte training en inferentie. Voorgetraind op 14,8T hoogwaardige tokens met SFT en RL, overtreft het andere open modellen en benadert het toonaangevende gesloten modellen.",
"deepseek-ai/deepseek-llm-67b-chat.description": "DeepSeek LLM Chat (67B) is een innovatief model dat diep taalbegrip en interactie biedt.",
"deepseek-ai/deepseek-v3.1-terminus.description": "DeepSeek V3.1 is een next-gen redeneermodel met sterkere complexe redenering en chain-of-thought voor diepgaande analysetaken.",
@@ -433,6 +435,7 @@
"deepseek_r1_distill_llama_70b.description": "DeepSeek-R1-Distill-Llama-70B is gedistilleerd van Llama-3.3-70B-Instruct. Als onderdeel van de DeepSeek-R1-serie is het fijn-afgestemd op door DeepSeek-R1 gegenereerde voorbeelden en presteert het sterk in wiskunde, codering en redeneren.",
"deepseek_r1_distill_qwen_14b.description": "DeepSeek-R1-Distill-Qwen-14B is gedistilleerd van Qwen2.5-14B en fijn-afgestemd op 800K zorgvuldig geselecteerde voorbeelden gegenereerd door DeepSeek-R1, met sterk redeneervermogen.",
"deepseek_r1_distill_qwen_32b.description": "DeepSeek-R1-Distill-Qwen-32B is gedistilleerd van Qwen2.5-32B en fijn-afgestemd op 800K zorgvuldig geselecteerde voorbeelden gegenereerd door DeepSeek-R1, en blinkt uit in wiskunde, codering en redeneren.",
"devstral-2512.description": "Devstral 2 is een tekstmodel op ondernemingsniveau dat uitblinkt in het gebruik van tools om codebases te verkennen, meerdere bestanden te bewerken en software-engineeringagents aan te sturen.",
"devstral-2:123b.description": "Devstral 2 123B blinkt uit in het gebruik van tools om codebases te verkennen, meerdere bestanden te bewerken en software engineering agents te ondersteunen.",
"doubao-1.5-lite-32k.description": "Doubao-1.5-lite is een nieuw lichtgewicht model met ultrasnelle reacties en levert topkwaliteit met lage latentie.",
"doubao-1.5-pro-256k.description": "Doubao-1.5-pro-256k is een uitgebreide upgrade van Doubao-1.5-Pro, met een prestatieverbetering van 10%. Het ondersteunt een contextvenster van 256k en tot 12k outputtokens, wat zorgt voor hogere prestaties, een groter bereik en sterke waarde voor bredere toepassingen.",
@@ -546,10 +549,10 @@
"gemini-2.5-pro-preview-06-05.description": "Gemini 2.5 Pro Preview is het meest geavanceerde redeneermodel van Google, in staat om te redeneren over code, wiskunde en STEM-vraagstukken en grote datasets, codebases en documenten met lange context te analyseren.",
"gemini-2.5-pro.description": "Gemini 2.5 Pro is het meest geavanceerde redeneermodel van Google, in staat om te redeneren over code, wiskunde en STEM-vraagstukken en grote datasets, codebases en documenten met lange context te analyseren.",
"gemini-3-flash-preview.description": "Gemini 3 Flash is het slimste model dat is gebouwd voor snelheid, met geavanceerde intelligentie en uitstekende zoekverankering.",
"gemini-3-pro-image-preview.description": "Gemini 3 Pro Image (Nano Banana Pro) is het beeldgeneratiemodel van Google en ondersteunt ook multimodale gesprekken.",
"gemini-3-pro-image-preview.description": "Gemini 3 Pro Image (Nano Banana Pro) is het beeldgeneratiemodel van Google dat ook multimodale dialogen ondersteunt.",
"gemini-3-pro-image-preview:image.description": "Gemini 3 Pro Image (Nano Banana Pro) is Google's beeldgeneratiemodel en ondersteunt ook multimodale chat.",
"gemini-3-pro-preview.description": "Gemini 3 Pro is het krachtigste agent- en vibe-codingmodel van Google, met rijkere visuele output en diepere interactie bovenop geavanceerde redeneercapaciteiten.",
"gemini-3.1-flash-image-preview.description": "Gemini 3.1 Flash Image (Nano Banana 2) levert Pro-niveau beeldkwaliteit met Flash-snelheid en ondersteuning voor multimodale chat.",
"gemini-3.1-flash-image-preview.description": "Gemini 3.1 Flash Image (Nano Banana 2) is het snelste native beeldgeneratiemodel van Google met denksupport, conversatiebeeldgeneratie en bewerking.",
"gemini-3.1-flash-image-preview:image.description": "Gemini 3.1 Flash Image (Nano Banana 2) levert Pro-niveau beeldkwaliteit met Flash-snelheid en ondersteuning voor multimodale chat.",
"gemini-3.1-pro-preview.description": "Gemini 3.1 Pro Preview verbetert Gemini 3 Pro met verbeterde redeneercapaciteiten en voegt ondersteuning toe voor een gemiddeld denkniveau.",
"gemini-flash-latest.description": "Nieuwste versie van Gemini Flash.",
@@ -605,19 +608,15 @@
"google/gemini-2.0-flash-lite-001.description": "Gemini 2.0 Flash Lite is een lichte variant van Gemini met standaard uitgeschakeld denkvermogen om latentie en kosten te verlagen, maar dit kan worden ingeschakeld via parameters.",
"google/gemini-2.0-flash-lite.description": "Gemini 2.0 Flash Lite biedt functies van de volgende generatie, waaronder uitzonderlijke snelheid, ingebouwd toolgebruik, multimodale generatie en een contextvenster van 1 miljoen tokens.",
"google/gemini-2.0-flash.description": "Gemini 2.0 Flash is het krachtige redeneermodel van Google voor uitgebreide multimodale taken.",
"google/gemini-2.5-flash-image-free.description": "Gratis versie van Gemini 2.5 Flash Image met beperkte multimodale generatiequota.",
"google/gemini-2.5-flash-image-preview.description": "Experimenteel model van Gemini 2.5 Flash met ondersteuning voor beeldgeneratie.",
"google/gemini-2.5-flash-image.description": "Gemini 2.5 Flash Image (Nano Banana) is het beeldgeneratiemodel van Google met ondersteuning voor multimodale conversaties.",
"google/gemini-2.5-flash-lite.description": "Gemini 2.5 Flash Lite is de lichte variant van Gemini 2.5, geoptimaliseerd voor lage latentie en kosten, geschikt voor scenarios met hoge doorvoer.",
"google/gemini-2.5-flash-preview.description": "Gemini 2.5 Flash is het meest geavanceerde vlaggenschipmodel van Google, gebouwd voor geavanceerde redenering, codering, wiskunde en wetenschappelijke taken. Het bevat ingebouwd 'denken' om nauwkeurigere antwoorden te leveren met fijnere contextverwerking.\n\nOpmerking: dit model heeft twee varianten — met en zonder denken. De prijs van de output verschilt aanzienlijk afhankelijk van of denken is ingeschakeld. Als je de standaardvariant kiest (zonder de “:thinking”-suffix), zal het model expliciet vermijden om denkstappen te genereren.\n\nOm denken te gebruiken en denkstappen te ontvangen, moet je de “:thinking”-variant selecteren, wat hogere kosten voor denkoutput met zich meebrengt.\n\nGemini 2.5 Flash kan ook worden geconfigureerd via de parameter “max reasoning tokens” zoals gedocumenteerd (https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning).",
"google/gemini-2.5-flash-preview:thinking.description": "Gemini 2.5 Flash is het meest geavanceerde vlaggenschipmodel van Google, gebouwd voor geavanceerde redenering, codering, wiskunde en wetenschappelijke taken. Het bevat ingebouwd 'denken' om nauwkeurigere antwoorden te leveren met fijnere contextverwerking.\n\nOpmerking: dit model heeft twee varianten — met en zonder denken. De prijs van de output verschilt aanzienlijk afhankelijk van of denken is ingeschakeld. Als je de standaardvariant kiest (zonder de “:thinking”-suffix), zal het model expliciet vermijden om denkstappen te genereren.\n\nOm denken te gebruiken en denkstappen te ontvangen, moet je de “:thinking”-variant selecteren, wat hogere kosten voor denkoutput met zich meebrengt.\n\nGemini 2.5 Flash kan ook worden geconfigureerd via de parameter “max reasoning tokens” zoals gedocumenteerd (https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning).",
"google/gemini-2.5-flash.description": "Gemini 2.5 Flash (Lite/Pro/Flash) is de modelreeks van Google die varieert van lage latentie tot krachtige redenering.",
"google/gemini-2.5-pro-free.description": "Gratis versie van Gemini 2.5 Pro met beperkte multimodale lange-contextcapaciteit, geschikt voor tests en lichte workflows.",
"google/gemini-2.5-flash.description": "Gemini 2.5 Flash is de familie van Google die zich uitstrekt van lage latentie tot hoogpresterend redeneren.",
"google/gemini-2.5-pro-preview.description": "Gemini 2.5 Pro Preview is het meest geavanceerde denkmodel van Google voor redenering over complexe problemen in code, wiskunde en STEM, en voor het analyseren van grote datasets, codebases en documenten met lange context.",
"google/gemini-2.5-pro.description": "Gemini 2.5 Pro is het vlaggenschip redeneermodel van Google met ondersteuning voor lange contexten bij complexe taken.",
"google/gemini-3-pro-image-preview-free.description": "Gratis versie van Gemini 3 Pro Image met beperkte multimodale generatiequota.",
"google/gemini-3-pro-image-preview.description": "Gemini 3 Pro Image (Nano Banana Pro) is het beeldgeneratiemodel van Google met ondersteuning voor multimodale conversaties.",
"google/gemini-3-pro-preview-free.description": "Gemini 3 Pro Preview Free biedt hetzelfde multimodale begrip en redenering als de standaardversie, maar met quota- en snelheidsbeperkingen, waardoor het beter geschikt is voor tests en laagfrequent gebruik.",
"google/gemini-3-pro-preview.description": "Gemini 3 Pro is het multimodale redeneermodel van de volgende generatie binnen de Gemini-familie. Het begrijpt tekst, audio, afbeeldingen en video, en verwerkt complexe taken en grote codebases.",
"google/gemini-embedding-001.description": "Een geavanceerd embeddingmodel met sterke prestaties in Engels, meertalige en codeertaken.",
"google/gemini-flash-1.5.description": "Gemini 1.5 Flash biedt geoptimaliseerde multimodale verwerking voor een breed scala aan complexe taken.",
@@ -717,15 +716,24 @@
"hunyuan-a13b.description": "Het eerste hybride redeneermodel van Hunyuan, een upgrade van hun hunyuan-standard-256K (80B totaal, 13B actief). Standaard ingesteld op langzaam denken, met ondersteuning voor snel/langzaam schakelen via parameters of prefix /no_think. De algehele capaciteit is verbeterd ten opzichte van de vorige generatie, vooral in wiskunde, wetenschap, langetekstbegrip en agenttaken.",
"hunyuan-code.description": "Hunyuan's nieuwste codemodel, getraind op 200B hoogwaardige codegegevens plus zes maanden SFT-gegevens, met 8K context. Het scoort bijna bovenaan in geautomatiseerde codebenchmarks en in deskundige menselijke evaluaties in vijf talen.",
"hunyuan-functioncall.description": "Hunyuan's nieuwste MoE FunctionCall-model, getraind op hoogwaardige toolgebruikgegevens, met een 32K contextvenster en toonaangevende benchmarks over verschillende dimensies.",
"hunyuan-large-longcontext.description": "Blinkt uit in lange-documenttaken zoals samenvattingen en QA, terwijl het ook algemene generatie aankan. Sterk in lange-tekstanalyse en generatie voor complexe, gedetailleerde inhoud.",
"hunyuan-large.description": "Hunyuan-large heeft ~389 miljard totale parameters en ~52 miljard geactiveerd, het grootste en sterkste open MoE-model in een Transformer-architectuur.",
"hunyuan-lite.description": "Geüpgraded naar een MoE-architectuur met een contextvenster van 256K, en overtreft veel open modellen op het gebied van NLP, code, wiskunde en industriële benchmarks.",
"hunyuan-pro.description": "Een MoE-model met biljoenen parameters en een contextvenster van 32K, toonaangevend in benchmarks, sterk in complexe instructies en redenering, geavanceerde wiskunde, functieaanroepen, en geoptimaliseerd voor meertalige vertaling, financiën, recht en medische domeinen.",
"hunyuan-role.description": "Hunyuan's nieuwste rollenspelmodel, officieel fijn afgestemd met rollenspelgegevens, levert sterkere basisprestaties in rollenspelscenario's.",
"hunyuan-standard-256K.description": "Maakt gebruik van verbeterde routering om load balancing en expertinstorting te verminderen. Langetekst 'speld in een hooiberg' bereikt 99,9%. MOE-256K gaat verder in lengte en kwaliteit, waardoor de invoerlengte aanzienlijk wordt uitgebreid.",
"hunyuan-standard.description": "Maakt gebruik van verbeterde routering om load balancing en expertinstorting te verminderen. Langetekst 'speld in een hooiberg' bereikt 99,9%. MOE-32K biedt betere waarde terwijl kwaliteit en prijs voor langetekstinvoer in balans worden gehouden.",
"hunyuan-standard-256K.description": "Gebruikt verbeterde routering om load balancing en expert-collapse te verminderen. Bereikt 99,9% naald-in-een-hooiberg op lange context. MOE-256K breidt de contextlengte en kwaliteit verder uit.",
"hunyuan-standard.description": "Gebruikt verbeterde routering om load balancing en expert-collapse te verminderen. Bereikt 99,9% naald-in-een-hooiberg op lange context. MOE-32K biedt sterke waarde terwijl het lange invoer aankan.",
"hunyuan-t1-20250321.description": "Bouwt gebalanceerde kunst- en STEM-capaciteiten met sterke lange-tekstinformatieopname. Ondersteunt redeneervragen voor wiskunde, logica, wetenschap en codeproblemen op verschillende moeilijkheidsniveaus.",
"hunyuan-t1-20250403.description": "Verbetert projectniveau codegeneratie en schrijfkwaliteit, versterkt multi-turn onderwerpbegrip en ToB-instructievolging, verbetert woordniveau begrip en vermindert gemengde vereenvoudigde/traditionele en Chinese/Engelse outputproblemen.",
"hunyuan-t1-20250529.description": "Verbetert creatief schrijven en compositie, versterkt frontend-codering, wiskunde en logische redenering, en verbetert instructievolging.",
"hunyuan-t1-20250711.description": "Verbetert aanzienlijk moeilijke wiskunde, logica en codering, verhoogt outputstabiliteit en verbetert lange-tekstcapaciteit.",
"hunyuan-t1-latest.description": "Verbetert het langzaam-denkende model aanzienlijk op het gebied van moeilijke wiskunde, complexe redenering, uitdagende codeertaken, instructieopvolging en creatieve schrijfkwaliteit.",
"hunyuan-t1-vision-20250916.description": "Het nieuwste t1-vision diep-redeneermodel met grote verbeteringen in VQA, visuele verankering, OCR, grafieken, het oplossen van gefotografeerde problemen en beeldgebaseerde creatie, plus sterkere prestaties in Engels en talen met weinig middelen.",
"hunyuan-turbo-20241223.description": "Deze versie verhoogt instructieschaling voor betere generalisatie, verbetert aanzienlijk wiskunde/code/logische redenering, versterkt woordniveau begrip en verbetert schrijfkwaliteit.",
"hunyuan-turbo-latest.description": "Algemene verbeteringen in NLP-begrip, schrijven, chatten, QA, vertaling en domeinen; meer mensachtige reacties, betere verduidelijking van onduidelijke intenties, verbeterde woordparsing, hogere creatieve kwaliteit en interactiviteit, en sterkere multi-turn gesprekken.",
"hunyuan-turbo.description": "Voorvertoning van Hunyuans volgende generatie LLM met een nieuwe MoE-architectuur, levert snellere redenering en sterkere resultaten dan hun hunyuan-pro.",
"hunyuan-turbos-latest.description": "Het nieuwste Hunyuan TurboS vlaggenschipmodel met sterkere redenering en een betere algehele ervaring.",
"hunyuan-turbos-longtext-128k-20250325.description": "Blinkt uit in lange-documenttaken zoals samenvattingen en QA, terwijl het ook algemene generatie aankan. Sterk in lange-tekstanalyse en generatie voor complexe, gedetailleerde inhoud.",
"hunyuan-vision-1.5-instruct.description": "Een snel denkend beeld-naar-tekstmodel gebouwd op de TurboS-tekstbasis, met opmerkelijke verbeteringen ten opzichte van de vorige versie in fundamentele beeldherkenning en beeldanalyse-redenering.",
"hunyuan-vision.description": "Hunyuan's nieuwste multimodale model dat beeld + tekstinvoer ondersteunt om tekst te genereren.",
"image-01-live.description": "Een beeldgeneratiemodel met fijne details, dat tekst-naar-beeld en aanpasbare stijlpresets ondersteunt.",
@@ -770,8 +778,7 @@
"kimi-k2:1t.description": "Kimi K2 is een groot MoE LLM van Moonshot AI met 1T totale parameters en 32B actief per voorwaartse stap. Het is geoptimaliseerd voor agentvaardigheden zoals geavanceerd toolgebruik, redeneren en codesynthese.",
"kimi-latest.description": "Kimi Latest gebruikt het nieuwste Kimi-model en kan experimentele functies bevatten. Het ondersteunt beeldbegrip en kiest automatisch 8k/32k/128k factureringsmodellen op basis van contextlengte.",
"kuaishou/kat-coder-pro-v1.description": "KAT-Coder-Pro-V1 (tijdelijk gratis) richt zich op codebegrip en automatisering voor efficiënte programmeeragents.",
"learnlm-1.5-pro-experimental.description": "LearnLM is een experimenteel, taakspecifiek model dat is getraind op basis van leerwetenschappelijke principes om systeeminstructies te volgen in onderwijs-/leerscenarios en fungeert als een deskundige tutor.",
"learnlm-2.0-flash-experimental.description": "LearnLM is een experimenteel, taakspecifiek model dat is getraind op basis van leerwetenschappelijke principes om systeeminstructies te volgen in onderwijs-/leerscenarios en fungeert als een deskundige tutor.",
"labs-devstral-small-2512.description": "Devstral Small 2 blinkt uit in het gebruik van tools om codebases te verkennen, meerdere bestanden te bewerken en software-engineeringagents aan te sturen.",
"lite.description": "Spark Lite is een lichtgewicht LLM met ultralage latentie en efficiënte verwerking. Het is volledig gratis en ondersteunt realtime webzoekopdrachten. Dankzij snelle reacties presteert het goed op apparaten met beperkte rekenkracht en voor modelafstemming, met sterke kostenefficiëntie en een slimme ervaring, vooral voor kennisvragen, contentgeneratie en zoekscenarios.",
"llama-3.1-70b-versatile.description": "Llama 3.1 70B biedt sterkere AI-redenering voor complexe toepassingen, met ondersteuning voor zware berekeningen met hoge efficiëntie en nauwkeurigheid.",
"llama-3.1-8b-instant.description": "Llama 3.1 8B is een efficiënt model met snelle tekstgeneratie, ideaal voor grootschalige, kosteneffectieve toepassingen.",
@@ -782,7 +789,6 @@
"llama-3.2-90b-vision-preview.description": "Llama 3.2 is ontworpen voor taken die visie en tekst combineren, en blinkt uit in beeldonderschriftgeneratie en visuele vraag-en-antwoord, waarmee het de kloof overbrugt tussen taalproductie en visuele redenering.",
"llama-3.2-vision-instruct.description": "Het op instructies afgestemde Llama 3.2-Vision-model is geoptimaliseerd voor visuele herkenning, beeldredenering, onderschriftgeneratie en algemene beeldvraag-en-antwoord.",
"llama-3.3-70b-versatile.description": "Meta Llama 3.3 is een meertalig LLM met 70B parameters (tekst in/tekst uit), beschikbaar als voorgetrainde en op instructies afgestemde varianten. De tekst-only instructieversie is geoptimaliseerd voor meertalige dialoogtoepassingen en presteert beter dan veel open en gesloten chatmodellen op gangbare industriële benchmarks.",
"llama-3.3-70b.description": "Llama 3.3 70B: een middelgroot tot groot Llama-model dat redenering en verwerkingssnelheid in balans houdt.",
"llama-3.3-instruct.description": "Het op instructies afgestemde Llama 3.3-model is geoptimaliseerd voor chat en presteert beter dan veel open chatmodellen op gangbare industriële benchmarks.",
"llama3-70b-8192.description": "Meta Llama 3 70B biedt uitzonderlijke complexiteitsverwerking voor veeleisende projecten.",
"llama3-8b-8192.description": "Meta Llama 3 8B levert sterke redeneercapaciteiten voor uiteenlopende scenarios.",
@@ -832,7 +838,6 @@
"meta-llama/llama-3.1-8b-instruct:free.description": "LLaMA 3.1 biedt meertalige ondersteuning en is een van de toonaangevende generatieve modellen.",
"meta-llama/llama-3.2-11b-vision-instruct.description": "LLaMA 3.2 is ontworpen voor taken die visie en tekst combineren. Het blinkt uit in beeldonderschrijving en visuele vraagbeantwoording, en overbrugt taalproductie en visueel redeneren.",
"meta-llama/llama-3.2-3b-instruct.description": "meta-llama/llama-3.2-3b-instruct",
"meta-llama/llama-3.2-90b-vision-instruct.description": "LLaMA 3.2 is ontworpen voor taken die visie en tekst combineren. Het blinkt uit in beeldonderschrijving en visuele vraagbeantwoording, en overbrugt taalproductie en visueel redeneren.",
"meta-llama/llama-3.3-70b-instruct.description": "Llama 3.3 is het meest geavanceerde meertalige open-source Llama-model, met prestaties vergelijkbaar met 405B tegen zeer lage kosten. Het is gebaseerd op een Transformer-architectuur en verbeterd met SFT en RLHF voor bruikbaarheid en veiligheid. De instructie-afgestemde versie is geoptimaliseerd voor meertalige gesprekken en overtreft veel open en gesloten chatmodellen op industriestandaarden. Kennisgrens: dec 2023.",
"meta-llama/llama-3.3-70b-instruct:free.description": "Llama 3.3 is het meest geavanceerde meertalige open-source Llama-model, met prestaties vergelijkbaar met 405B tegen zeer lage kosten. Het is gebaseerd op een Transformer-architectuur en verbeterd met SFT en RLHF voor bruikbaarheid en veiligheid. De instructie-afgestemde versie is geoptimaliseerd voor meertalige gesprekken en overtreft veel open en gesloten chatmodellen op industriestandaarden. Kennisgrens: dec 2023.",
"meta.llama3-1-405b-instruct-v1:0.description": "Meta Llama 3.1 405B Instruct is het grootste en krachtigste Llama 3.1 Instruct-model, een zeer geavanceerd model voor dialoogredenering en synthetische datageneratie, en een sterke basis voor domeinspecifieke voortgezette pretraining of fine-tuning. De meertalige Llama 3.1 LLMs zijn een reeks voorgetrainde en instructie-afgestemde generatiemodellen in 8B-, 70B- en 405B-varianten (tekst in/tekst uit). De instructie-afgestemde modellen zijn geoptimaliseerd voor meertalige dialogen en presteren beter dan veel beschikbare open chatmodellen op gangbare benchmarks. Llama 3.1 is ontworpen voor commercieel en onderzoeksgebruik in meerdere talen. Instructie-afgestemde modellen zijn geschikt voor assistentachtige gesprekken, terwijl voorgetrainde modellen breder inzetbaar zijn voor natuurlijke taalproductie. De output van Llama 3.1 kan ook worden gebruikt om andere modellen te verbeteren, waaronder synthetische datageneratie en verfijning. Llama 3.1 is een autoregressief Transformer-model met een geoptimaliseerde architectuur. De afgestemde versies gebruiken gesuperviseerde fine-tuning (SFT) en reinforcement learning op basis van menselijke feedback (RLHF) om af te stemmen op menselijke voorkeuren voor behulpzaamheid en veiligheid.",
@@ -894,7 +899,7 @@
"mistral-large-instruct.description": "Mistral-Large-Instruct-2407 is een geavanceerd dense LLM met 123 miljard parameters en toonaangevend redeneervermogen, kennis en programmeercapaciteiten.",
"mistral-large-latest.description": "Mistral Large is het vlaggenschipmodel, sterk in meertalige taken, complexe redenering en codegeneratie—ideaal voor hoogwaardige toepassingen.",
"mistral-large.description": "Mixtral Large is het vlaggenschipmodel van Mistral, dat codegeneratie, wiskunde en redenering combineert met een contextvenster van 128K.",
"mistral-medium-latest.description": "Mistral Medium 3 levert toonaangevende prestaties tegen 8× lagere kosten en vereenvoudigt implementatie in ondernemingen.",
"mistral-medium-latest.description": "Mistral Medium 3.1 levert state-of-the-art prestaties tegen 8× lagere kosten en vereenvoudigt implementatie op ondernemingsniveau.",
"mistral-nemo-instruct.description": "Mistral-Nemo-Instruct-2407 is de instructie-afgestemde versie van Mistral-Nemo-Base-2407.",
"mistral-nemo.description": "Mistral Nemo is een efficiënt 12B-model van Mistral AI en NVIDIA.",
"mistral-small-latest.description": "Mistral Small is een kosteneffectieve, snelle en betrouwbare optie voor vertaling, samenvatting en sentimentanalyse.",
@@ -933,7 +938,7 @@
"moonshot-v1-auto.description": "Moonshot V1 Auto kiest automatisch het juiste model op basis van het huidige gebruik van contexttokens.",
"moonshotai/Kimi-Dev-72B.description": "Kimi-Dev-72B is een open-source code-LLM geoptimaliseerd met grootschalige reinforcement learning om robuuste, productieklare patches te genereren. Het behaalt 60,4% op SWE-bench Verified en vestigt een nieuw record voor open modellen bij geautomatiseerde software-engineeringtaken zoals bugfixes en codebeoordeling.",
"moonshotai/Kimi-K2-Instruct-0905.description": "Kimi K2-Instruct-0905 is de nieuwste en krachtigste Kimi K2. Het is een topklasse MoE-model met 1T totale en 32B actieve parameters. Belangrijke kenmerken zijn sterkere agentmatige code-intelligentie met aanzienlijke verbeteringen op benchmarks en real-world agenttaken, plus verbeterde frontend-code esthetiek en bruikbaarheid.",
"moonshotai/Kimi-K2-Thinking.description": "Kimi K2 Thinking is het nieuwste en krachtigste open-source denkmodel. Het vergroot de diepte van meerstapsredenering aanzienlijk en behoudt stabiel gebruik van tools over 200300 opeenvolgende oproepen. Het vestigt nieuwe records op Humanity's Last Exam (HLE), BrowseComp en andere benchmarks. Het blinkt uit in codering, wiskunde, logica en agentscenario's. Gebouwd op een MoE-architectuur met ~1T totale parameters, ondersteunt het een contextvenster van 256K en toolgebruik.",
"moonshotai/Kimi-K2-Thinking.description": "Kimi K2 Thinking is het nieuwste en krachtigste open-source denkmodel. Het vergroot de diepte van meerstapsredenering aanzienlijk en behoudt stabiel toolgebruik over 200300 opeenvolgende oproepen, waarmee nieuwe records worden gevestigd op Humanity's Last Exam (HLE), BrowseComp en andere benchmarks. Het blinkt uit in codering, wiskunde, logica en agentscenario's. Gebouwd op een MoE-architectuur met ~1 biljoen totale parameters, ondersteunt het een 256K contextvenster en toolgebruik.",
"moonshotai/kimi-k2-0711.description": "Kimi K2 0711 is de instructievariant in de Kimi-serie, geschikt voor hoogwaardige code en toolgebruik.",
"moonshotai/kimi-k2-0905.description": "Kimi K2 0905 is een update die context- en redeneervermogen uitbreidt met optimalisaties voor codering.",
"moonshotai/kimi-k2-instruct-0905.description": "Het kimi-k2-0905-preview model ondersteunt een contextvenster van 256k, met sterkere agentmatige codering, meer verfijnde en praktische frontend-code en beter contextbegrip.",
@@ -948,8 +953,8 @@
"nvidia/Llama-3.1-Nemotron-70B-Instruct-HF.description": "Llama 3.1 Nemotron 70B is een door NVIDIA aangepast LLM om behulpzaamheid te verbeteren. Het presteert sterk op Arena Hard, AlpacaEval 2 LC en GPT-4-Turbo MT-Bench, en staat op 1 in alle drie auto-alignment benchmarks per 1 oktober 2024. Het is getraind vanuit Llama-3.1-70B-Instruct met behulp van RLHF (REINFORCE), Llama-3.1-Nemotron-70B-Reward en HelpSteer2-Preference prompts.",
"nvidia/llama-3.1-nemotron-51b-instruct.description": "Een onderscheidend taalmodel dat uitzonderlijke nauwkeurigheid en efficiëntie levert.",
"nvidia/llama-3.1-nemotron-70b-instruct.description": "Llama-3.1-Nemotron-70B-Instruct is een aangepast NVIDIA-model ontworpen om de behulpzaamheid van LLM-antwoorden te verbeteren.",
"o1-mini.description": "Kleiner en sneller dan o1-preview, 80% lagere kosten, sterk in codegeneratie en taken met korte context.",
"o1-preview.description": "Gefocust op geavanceerde redenering en complexe probleemoplossing, inclusief wiskunde en wetenschap. Ideaal voor toepassingen die diep contextbegrip en autonome workflows vereisen.",
"o1-mini.description": "o1-mini is een snel, kosteneffectief redeneermodel ontworpen voor codering, wiskunde en wetenschap. Het heeft een 128K context en een kennisafsluiting van oktober 2023.",
"o1-preview.description": "o1 is het nieuwe redeneermodel van OpenAI voor complexe taken die brede kennis vereisen. Het heeft een 128K context en een kennisafsluiting van oktober 2023.",
"o1-pro.description": "De o1-serie is getraind met reinforcement learning om eerst te denken en complexe redenering aan te kunnen. o1-pro gebruikt meer rekenkracht voor diepere denkwijzen en levert consistent antwoorden van hogere kwaliteit.",
"o1.description": "o1 is OpenAIs nieuwe redeneermodel met tekst+beeldinvoer en tekstuitvoer, geschikt voor complexe taken die brede kennis vereisen. Het heeft een contextvenster van 200K en een kennisgrens van oktober 2023.",
"o3-2025-04-16.description": "o3 is OpenAIs nieuwe redeneermodel met tekst+beeldinvoer en tekstuitvoer voor complexe taken die brede kennis vereisen.",
@@ -1022,7 +1027,6 @@
"qianfan-check-vl.description": "Qianfan Check VL is een multimodaal contentcontrolemodel voor naleving en herkenning van beeld-tekstinhoud.",
"qianfan-composition.description": "Qianfan Composition is een multimodaal creatiemodel voor gemengde beeld-tekstbegrip en -generatie.",
"qianfan-engcard-vl.description": "Qianfan EngCard VL is een multimodaal herkenningsmodel gericht op Engelstalige scenario's.",
"qianfan-lightning-128b-a19b.description": "Qianfan Lightning 128B A19B is een krachtig Chinees algemeen model voor complexe vraag-antwoordtoepassingen en grootschalige redenering.",
"qianfan-llama-vl-8b.description": "Qianfan Llama VL 8B is een multimodaal model gebaseerd op Llama voor algemene beeld-tekstbegrip.",
"qianfan-multipicocr.description": "Qianfan MultiPicOCR is een OCR-model voor meerdere afbeeldingen dat tekst detecteert en herkent in verschillende beelden.",
"qianfan-qi-vl.description": "Qianfan QI VL is een multimodaal vraag-en-antwoordmodel voor nauwkeurige informatieopvraging en beantwoording in complexe beeld-tekstscenario's.",
@@ -1032,7 +1036,6 @@
"qvq-72b-preview.description": "QVQ-72B-Preview is een experimenteel onderzoeksmodel van Qwen gericht op het verbeteren van visueel redeneren.",
"qvq-max.description": "Het Qwen QVQ visueel redeneermodel ondersteunt visuele input en keten-van-gedachten output, met sterke prestaties in wiskunde, codering, visuele analyse, creativiteit en algemene taken.",
"qvq-plus.description": "Visueel redeneermodel met visuele input en keten-van-gedachten output. De qvq-plus-serie volgt op qvq-max en biedt snellere redenering met een betere balans tussen kwaliteit en kosten.",
"qwen-3-32b.description": "Qwen 3 32B: sterk in meertalige en programmeertaken, geschikt voor middelgrote productieomgevingen.",
"qwen-coder-plus.description": "Qwen codeermodel.",
"qwen-coder-turbo-latest.description": "Qwen codeermodel.",
"qwen-coder-turbo.description": "Qwen codeermodel.",
@@ -1128,7 +1131,6 @@
"qwen3-coder-next.description": "Next-gen Qwen coder geoptimaliseerd voor complexe multi-bestandscodegeneratie, debugging en workflows met hoge doorvoer voor agents. Ontworpen voor sterke toolintegratie en verbeterde redeneerprestaties.",
"qwen3-coder-plus.description": "Qwen-codeermodel. De nieuwste Qwen3-Coder-serie is gebaseerd op Qwen3 en biedt krachtige mogelijkheden voor programmeeragenten, gereedschapsgebruik en interactie met omgevingen voor autonoom programmeren, met uitstekende codeprestaties en solide algemene capaciteiten.",
"qwen3-coder:480b.description": "Alibabas krachtige model met lange context voor agent- en programmeertaken.",
"qwen3-max-2026-01-23.description": "Qwen3 Max-modellen leveren grote verbeteringen ten opzichte van de 2.5-serie in algemene vaardigheden, Chinees/Engels begrip, complexe instructieopvolging, subjectieve open taken, meertalige vaardigheden en toolgebruik, met minder hallucinaties. De nieuwste qwen3-max verbetert agentisch programmeren en toolgebruik ten opzichte van qwen3-max-preview. Deze release bereikt SOTA-niveau en richt zich op complexere agentbehoeften.",
"qwen3-max-preview.description": "Best presterend Qwen-model voor complexe, meerstaps taken. De preview ondersteunt denkprocessen.",
"qwen3-max.description": "Qwen3 Max-modellen bieden aanzienlijke verbeteringen ten opzichte van de 2.5-serie op het gebied van algemene capaciteiten, Chinees/Engels begrip, complexe instructieopvolging, subjectieve open taken, meertaligheid en gereedschapsgebruik, met minder hallucinaties. De nieuwste qwen3-max verbetert programmeeragenten en gereedschapsgebruik ten opzichte van qwen3-max-preview. Deze release bereikt SOTA in het veld en richt zich op complexere agentbehoeften.",
"qwen3-next-80b-a3b-instruct.description": "Volgende generatie Qwen3 open-source model zonder denkmodus. Vergeleken met de vorige versie (Qwen3-235B-A22B-Instruct-2507) heeft het een beter Chinees begrip, sterkere logische redenering en verbeterde tekstgeneratie.",
@@ -1145,7 +1147,8 @@
"qwen3-vl-flash.description": "Qwen3 VL Flash: lichtgewicht, snelle redeneerversie voor latency-gevoelige of grootschalige verzoeken.",
"qwen3-vl-plus.description": "Qwen VL is een tekstgeneratiemodel met visueel begrip. Het kan OCR uitvoeren en ook samenvatten en redeneren, zoals het extraheren van kenmerken uit productfotos of het oplossen van problemen op basis van afbeeldingen.",
"qwen3.5-397b-a17b.description": "Ondersteunt tekst-, beeld- en video-invoer. Voor alleen teksttaken is de prestatie vergelijkbaar met Qwen3 Max, met hogere efficiëntie en lagere kosten. In multimodale capaciteiten levert het significante verbeteringen ten opzichte van de Qwen3 VL-serie.",
"qwen3.5-plus.description": "Qwen3.5 Plus ondersteunt tekst-, beeld- en video-invoer. Voor alleen teksttaken is de prestatie vergelijkbaar met Qwen3 Max, terwijl het betere efficiëntie en lagere kosten biedt. Qua multimodale capaciteiten toont het significante verbeteringen ten opzichte van de Qwen3 VL-serie.",
"qwen3.5-plus.description": "Qwen3.5 Plus ondersteunt tekst-, beeld- en video-invoer. De prestaties op pure teksttaken zijn vergelijkbaar met Qwen3 Max, met betere prestaties en lagere kosten. De multimodale capaciteiten zijn aanzienlijk verbeterd in vergelijking met de Qwen3 VL-serie.",
"qwen3.5:397b.description": "Qwen3.5 is een verenigd visie-taal funderingsmodel met een hybride architectuur (Mixture-of-Experts + lineaire aandacht), dat sterke multimodale redenering, codering en lange-contextcapaciteiten biedt met een 256K contextvenster.",
"qwen3.description": "Qwen3 is Alibabas volgende generatie groot taalmodel met sterke prestaties in diverse toepassingen.",
"qwq-32b-preview.description": "QwQ is een experimenteel onderzoeksmodel van Qwen gericht op verbeterde redenering.",
"qwq-32b.description": "QwQ is een redeneermodel binnen de Qwen-familie. In vergelijking met standaard instructie-getrainde modellen biedt het denk- en redeneervermogen dat de prestaties op complexe problemen aanzienlijk verbetert. QwQ-32B is een middelgroot redeneermodel dat zich kan meten met topmodellen zoals DeepSeek-R1 en o1-mini.",
@@ -1187,7 +1190,7 @@
"step-2-16k.description": "Ondersteunt interacties met grote context voor complexe dialogen.",
"step-2-mini.description": "Gebouwd op de volgende generatie interne MFA-attentiearchitectuur, levert Step-1-achtige resultaten tegen veel lagere kosten met hogere doorvoer en snellere latency. Behandelt algemene taken met sterke codeercapaciteit.",
"step-2x-large.description": "Een nieuwe generatie StepFun-beeldmodel gericht op beeldgeneratie, produceert beelden van hoge kwaliteit op basis van tekstprompts. Levert realistischere texturen en sterkere Chinese/Engelse tekstrendering.",
"step-3.5-flash.description": "Het vlaggenschip taalredeneermodel van Stepfun. Dit model levert topniveau redeneercapaciteiten samen met snelle en betrouwbare uitvoering. Het kan complexe taken ontleden en plannen, snel en betrouwbaar tools oproepen om ze uit te voeren, en uitblinken in logisch redeneren, wiskunde, software-engineering, diepgaand onderzoek en andere geavanceerde taken. De contextlengte is 256K.",
"step-3.5-flash.description": "Stepfun's vlaggenschip taalredeneermodel. Dit model heeft eersteklas redeneercapaciteiten en snelle en betrouwbare uitvoeringsmogelijkheden. Het kan complexe taken ontleden en plannen, snel en betrouwbaar tools oproepen om taken uit te voeren, en is bekwaam in verschillende complexe taken zoals logische redenering, wiskunde, software-engineering en diepgaand onderzoek.",
"step-3.description": "Dit model beschikt over sterke visuele waarneming en complexe redeneercapaciteiten, en verwerkt nauwkeurig domeinoverstijgend begrip, wiskundig-visuele analyses en een breed scala aan alledaagse visuele taken.",
"step-r1-v-mini.description": "Een redeneermodel met sterke beeldbegripcapaciteiten dat afbeeldingen en tekst verwerkt en vervolgens tekst genereert na diepgaande redenering. Het blinkt uit in visueel redeneren en levert topprestaties in wiskunde, programmeren en tekstuele redenering, met een contextvenster van 100K.",
"stepfun-ai/step3.description": "Step3 is een geavanceerd multimodaal redeneermodel van StepFun, gebouwd op een MoE-architectuur met 321B totale en 38B actieve parameters. Het end-to-end ontwerp minimaliseert de decodeerkosten en levert topklasse visueel-taalkundige redenering. Dankzij MFA- en AFD-ontwerp blijft het efficiënt op zowel krachtige als eenvoudige accelerators. De pretraining gebruikt meer dan 20T teksttokens en 4T beeld-teksttokens in meerdere talen. Het behaalt toonaangevende prestaties op benchmarks voor wiskunde, code en multimodaliteit.",
@@ -1276,10 +1279,11 @@
"z-ai/glm4.7.description": "GLM-4.7 is Zhipu's nieuwste vlaggenschipmodel, verbeterd voor Agentic Coding-scenario's met verbeterde codeercapaciteiten.",
"z-ai/glm5.description": "GLM-5 is Zhipu AI's nieuwe vlaggenschipfundamentmodel voor agent-engineering, dat open-source SOTA-prestaties behaalt in codering en agentcapaciteiten. Het evenaart Claude Opus 4.5 in prestaties.",
"z-image-turbo.description": "Z-Image is een lichtgewicht tekst-naar-beeldgeneratiemodel dat snel beelden kan produceren, zowel Chinese als Engelse tekstrendering ondersteunt, en flexibel kan worden aangepast aan meerdere resoluties en beeldverhoudingen.",
"zai-glm-4.7.description": "Dit model levert sterke codeerprestaties met geavanceerde redeneercapaciteiten, superieur toolgebruik en verbeterde real-world prestaties in agent-gebaseerde codeertoepassingen.",
"zai-org/GLM-4.5-Air.description": "GLM-4.5-Air is een basismodel voor agenttoepassingen met een Mixture-of-Experts-architectuur. Het is geoptimaliseerd voor toolgebruik, webnavigatie, softwareontwikkeling en frontend-codering, en integreert met code-agents zoals Claude Code en Roo Code. Het gebruikt hybride redenering om zowel complexe als alledaagse scenarios aan te kunnen.",
"zai-org/GLM-4.5.description": "GLM-4.5 is een basismodel gebouwd voor agenttoepassingen met een Mixture-of-Experts-architectuur. Het is diepgaand geoptimaliseerd voor toolgebruik, webnavigatie, softwareontwikkeling en frontend-codering, en integreert met code-agents zoals Claude Code en Roo Code. Het gebruikt hybride redenering om zowel complexe als alledaagse scenarios aan te kunnen.",
"zai-org/GLM-4.5V.description": "GLM-4.5V is Zhipu AIs nieuwste VLM, gebaseerd op het GLM-4.5-Air vlaggenschiptekstmodel (106B totaal, 12B actief) met een MoE-architectuur voor sterke prestaties tegen lagere kosten. Het volgt het GLM-4.1V-Thinking pad en voegt 3D-RoPE toe voor verbeterde 3D-ruimtelijke redenering. Geoptimaliseerd via pretraining, SFT en RL, verwerkt het beelden, videos en lange documenten en scoort het hoog op 41 openbare multimodale benchmarks. Een Thinking-modus schakelaar laat gebruikers kiezen tussen snelheid en diepgang.",
"zai-org/GLM-4.6.description": "In vergelijking met GLM-4.5 breidt GLM-4.6 de context uit van 128K naar 200K voor complexere agenttaken. Het scoort hoger op codebenchmarks en toont sterkere prestaties in toepassingen zoals Claude Code, Cline, Roo Code en Kilo Code, inclusief betere frontendpagina-generatie. Redenering is verbeterd en toolgebruik wordt ondersteund tijdens het redeneren, wat de algehele capaciteit versterkt. Het integreert beter in agentframeworks, verbetert tool-/zoekagents en heeft een natuurlijkere schrijfstijl en rolspelervaring.",
"zai-org/GLM-4.6V.description": "GLM-4.6V bereikt SOTA-nauwkeurigheid in visueel begrip binnen dezelfde parameterschaal en integreert voor het eerst Function Call (toolgebruik) mogelijkheden direct in het visuele model, waardoor de keten van 'visuele perceptie' naar 'uitvoerbare actie' wordt geopend. Dit biedt een uniforme technologische basis voor multimodale agents in echte zakelijke scenario's.",
"zai/glm-4.5-air.description": "GLM-4.5 en GLM-4.5-Air zijn onze nieuwste vlaggenschipmodellen voor agenttoepassingen, beide gebruikmakend van MoE. GLM-4.5 heeft 355B totaal en 32B actief per forward pass; GLM-4.5-Air is slanker met 106B totaal en 12B actief.",
"zai/glm-4.5.description": "De GLM-4.5-serie is ontworpen voor agents. Het vlaggenschip GLM-4.5 combineert redenering, codering en agentvaardigheden met 355B totale parameters (32B actief) en biedt dubbele werkmodi als hybride redeneersysteem.",
"zai/glm-4.5v.description": "GLM-4.5V is gebaseerd op GLM-4.5-Air, erft bewezen technieken van GLM-4.1V-Thinking en schaalt met een krachtige 106B-parameter MoE-architectuur.",
+14
View File
@@ -24,6 +24,20 @@
"builtins.lobe-agent-builder.inspector.noResults": "Geen resultaten",
"builtins.lobe-agent-builder.inspector.togglePlugin": "Wisselen",
"builtins.lobe-agent-builder.title": "Agent Builder Expert",
"builtins.lobe-agent-management.apiName.callAgent": "Bel agent",
"builtins.lobe-agent-management.apiName.createAgent": "Maak agent aan",
"builtins.lobe-agent-management.apiName.deleteAgent": "Verwijder agent",
"builtins.lobe-agent-management.apiName.searchAgent": "Zoek agents",
"builtins.lobe-agent-management.apiName.updateAgent": "Werk agent bij",
"builtins.lobe-agent-management.inspector.callAgent.sync": "Bellen:",
"builtins.lobe-agent-management.inspector.callAgent.task": "Taak toewijzen aan:",
"builtins.lobe-agent-management.inspector.createAgent.title": "Agent aanmaken:",
"builtins.lobe-agent-management.inspector.searchAgent.all": "Zoek agents:",
"builtins.lobe-agent-management.inspector.searchAgent.market": "Zoek markt:",
"builtins.lobe-agent-management.inspector.searchAgent.results": "{{count}} resultaten",
"builtins.lobe-agent-management.inspector.searchAgent.user": "Zoek mijn agents:",
"builtins.lobe-agent-management.inspector.updateAgent.title": "Agent bijwerken:",
"builtins.lobe-agent-management.title": "Agentbeheer",
"builtins.lobe-cloud-sandbox.apiName.editLocalFile": "Bestand bewerken",
"builtins.lobe-cloud-sandbox.apiName.executeCode": "Code uitvoeren",
"builtins.lobe-cloud-sandbox.apiName.exportFile": "Bestand exporteren",
+3
View File
@@ -724,6 +724,9 @@
"tools.builtins.lobe-artifacts.description": "Genereer en bekijk interactieve UI-componenten, datavisualisaties, grafieken, SVG-afbeeldingen en webapplicaties in realtime. Creëer rijke visuele content waarmee gebruikers direct kunnen interageren.",
"tools.builtins.lobe-artifacts.readme": "Genereer en bekijk interactieve UI-componenten, datavisualisaties, grafieken, SVG-afbeeldingen en webapplicaties in realtime. Creëer rijke visuele content waarmee gebruikers direct kunnen interageren.",
"tools.builtins.lobe-artifacts.title": "Artefacten",
"tools.builtins.lobe-calculator.description": "Voer wiskundige berekeningen uit, los vergelijkingen op en werk met symbolische expressies",
"tools.builtins.lobe-calculator.readme": "Geavanceerde wiskundige rekenmachine die basisrekenkunde, algebraïsche vergelijkingen, calculusbewerkingen en symbolische wiskunde ondersteunt. Inclusief basisconversie, vergelijkingsoplossing, differentiëren, integreren en meer.",
"tools.builtins.lobe-calculator.title": "Rekenmachine",
"tools.builtins.lobe-cloud-sandbox.description": "Voer Python-, JavaScript- en TypeScript-code uit in een geïsoleerde cloudomgeving. Voer shellopdrachten uit, beheer bestanden, doorzoek inhoud met regex en exporteer resultaten veilig.",
"tools.builtins.lobe-cloud-sandbox.readme": "Voer Python-, JavaScript- en TypeScript-code uit in een geïsoleerde cloudomgeving. Voer shellcommandos uit, beheer bestanden, doorzoek inhoud met regex en exporteer resultaten veilig.",
"tools.builtins.lobe-cloud-sandbox.title": "Cloud Sandbox",
+4
View File
@@ -224,7 +224,9 @@
"providerModels.item.modelConfig.extendParams.options.gpt5_2ProReasoningEffort.hint": "Dla serii GPT-5.2 Pro; kontroluje intensywność rozumowania.",
"providerModels.item.modelConfig.extendParams.options.gpt5_2ReasoningEffort.hint": "Dla serii GPT-5.2; kontroluje intensywność rozumowania.",
"providerModels.item.modelConfig.extendParams.options.imageAspectRatio.hint": "Dla modeli generujących obrazy Gemini; kontroluje proporcje generowanych obrazów.",
"providerModels.item.modelConfig.extendParams.options.imageAspectRatio2.hint": "Dla Nano Banana 2; kontroluje proporcje generowanych obrazów (obsługuje bardzo szerokie 1:4, 4:1, 1:8, 8:1).",
"providerModels.item.modelConfig.extendParams.options.imageResolution.hint": "Dla modeli generujących obrazy Gemini 3; kontroluje rozdzielczość generowanych obrazów.",
"providerModels.item.modelConfig.extendParams.options.imageResolution2.hint": "Dla modeli Gemini 3.1 Flash Image; kontroluje rozdzielczość generowanych obrazów (obsługuje 512px).",
"providerModels.item.modelConfig.extendParams.options.reasoningBudgetToken.hint": "Dla modeli Claude, Qwen3 i podobnych; kontroluje budżet tokenów na rozumowanie.",
"providerModels.item.modelConfig.extendParams.options.reasoningEffort.hint": "Dla modeli OpenAI i innych wspierających rozumowanie; kontroluje nakład rozumowania.",
"providerModels.item.modelConfig.extendParams.options.textVerbosity.hint": "Dla serii GPT-5+; kontroluje szczegółowość odpowiedzi.",
@@ -233,6 +235,7 @@
"providerModels.item.modelConfig.extendParams.options.thinkingLevel.hint": "Dla modeli Gemini 3 Flash Preview; kontroluje głębokość myślenia.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel2.hint": "Dla modeli Gemini 3 Pro Preview; kontroluje głębokość myślenia.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel3.hint": "Dla modeli Gemini 3.1 Pro Preview; kontroluje głębokość myślenia na poziomach niskim/średnim/wysokim.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel4.hint": "Dla modeli Gemini 3.1 Flash Image; przełączanie myślenia włącz/wyłącz.",
"providerModels.item.modelConfig.extendParams.options.urlContext.hint": "Dla serii Gemini; umożliwia podanie kontekstu w postaci adresu URL.",
"providerModels.item.modelConfig.extendParams.placeholder": "Wybierz parametry rozszerzone do włączenia",
"providerModels.item.modelConfig.extendParams.previewFallback": "Podgląd niedostępny",
@@ -311,6 +314,7 @@
"providerModels.tabs.image": "Obraz",
"providerModels.tabs.stt": "ASR",
"providerModels.tabs.tts": "TTS",
"providerModels.tabs.video": "Wideo",
"sortModal.success": "Pomyślnie zaktualizowano sortowanie",
"sortModal.title": "Niestandardowa kolejność",
"sortModal.update": "Aktualizuj",
+34 -30
View File
@@ -55,7 +55,8 @@
"FLUX.1-dev.description": "FLUX.1-dev to otwartoźródłowy multimodalny model językowy (MLLM) od Black Forest Labs, zoptymalizowany do zadań obraz-tekst, łączący rozumienie i generowanie obrazów/tekstu. Zbudowany na zaawansowanych LLM (np. Mistral-7B), wykorzystuje starannie zaprojektowany enkoder wizji i wieloetapowe dostrajanie instrukcji, umożliwiając multimodalną koordynację i złożone rozumowanie.",
"Gryphe/MythoMax-L2-13b.description": "MythoMax-L2 (13B) to innowacyjny model do różnorodnych dziedzin i złożonych zadań.",
"HelloMeme.description": "HelloMeme to narzędzie AI do generowania memów, GIF-ów lub krótkich filmów z dostarczonych obrazów lub ruchów. Nie wymaga umiejętności rysowania ani kodowania — wystarczy obraz referencyjny, aby stworzyć zabawne, atrakcyjne i stylistycznie spójne treści.",
"HiDream-I1-Full.description": "HiDream-E1-Full to otwartoźródłowy multimodalny model edycji obrazów od HiDream.ai, oparty na zaawansowanej architekturze Diffusion Transformer i silnym rozumieniu języka (wbudowany LLaMA 3.1-8B-Instruct). Obsługuje generowanie obrazów sterowane językiem naturalnym, transfer stylu, lokalne edycje i przemalowywanie, z doskonałym rozumieniem i wykonaniem obraz-tekst.",
"HiDream-E1-Full.description": "HiDream-E1-Full to otwartoźródłowy model edycji obrazów multimodalnych od HiDream.ai, oparty na zaawansowanej architekturze Diffusion Transformer i silnym rozumieniu języka (wbudowany LLaMA 3.1-8B-Instruct). Obsługuje generowanie obrazów na podstawie języka naturalnego, transfer stylu, lokalne edycje i przemalowywanie, z doskonałym zrozumieniem i realizacją tekstu i obrazu.",
"HiDream-I1-Full.description": "HiDream-I1 to nowy otwartoźródłowy model generowania obrazów bazowych wydany przez HiDream. Dzięki 17 miliardom parametrów (Flux ma 12 miliardów) może dostarczać obrazy o wiodącej jakości w branży w ciągu kilku sekund.",
"HunyuanDiT-v1.2-Diffusers-Distilled.description": "hunyuandit-v1.2-distilled to lekki model tekst-na-obraz zoptymalizowany przez destylację do szybkiego generowania wysokiej jakości obrazów, szczególnie odpowiedni dla środowisk o ograniczonych zasobach i generowania w czasie rzeczywistym.",
"InstantCharacter.description": "InstantCharacter to model generowania spersonalizowanych postaci bez potrzeby dostrajania, wydany przez Tencent AI w 2025 roku, mający na celu wierne i spójne generowanie postaci w różnych scenariuszach. Może modelować postać na podstawie jednego obrazu referencyjnego i elastycznie przenosić ją między stylami, działaniami i tłami.",
"InternVL2-8B.description": "InternVL2-8B to potężny model wizja-język obsługujący multimodalne przetwarzanie obraz-tekst, dokładnie rozpoznający zawartość obrazu i generujący odpowiednie opisy lub odpowiedzi.",
@@ -80,7 +81,7 @@
"MiniMax-M2.1.description": "MiniMax-M2.1 to flagowy, otwartoźródłowy model dużej skali od MiniMax, zaprojektowany do rozwiązywania złożonych zadań rzeczywistych. Jego główne atuty to wielojęzyczne możliwości programistyczne oraz zdolność działania jako Agent do rozwiązywania skomplikowanych problemów.",
"MiniMax-M2.5-Lightning.description": "M2.5 Lightning: Ta sama wydajność, szybszy i bardziej zwinny (około 100 tps).",
"MiniMax-M2.5-highspeed.description": "Ta sama wydajność co M2.5, z znacząco szybszym wnioskowaniem.",
"MiniMax-M2.5.description": "Najwyższa wydajność i maksymalna opłacalność, łatwo radzi sobie z złożonymi zadaniami (około 60 tps).",
"MiniMax-M2.5.description": "MiniMax-M2.5 to flagowy otwartoźródłowy duży model od MiniMax, skoncentrowany na rozwiązywaniu złożonych zadań rzeczywistych. Jego główne zalety to wielojęzyczne możliwości programowania i zdolność do rozwiązywania złożonych zadań jako Agent.",
"MiniMax-M2.description": "Stworzony specjalnie z myślą o efektywnym kodowaniu i przepływach pracy agentów",
"MiniMax-Text-01.description": "MiniMax-01 wprowadza dużą skalę uwagi liniowej wykraczającą poza klasyczne Transformatory, z 456 mld parametrów i 45,9 mld aktywowanych na przebieg. Osiąga najwyższą wydajność i obsługuje do 4 mln tokenów kontekstu (32× GPT-4o, 20× Claude-3.5-Sonnet).",
"MiniMaxAI/MiniMax-M1-80k.description": "MiniMax-M1 to model rozumowania o otwartych wagach, oparty na hybrydowej uwadze, z 456 mld parametrów ogółem i ~45,9 mld aktywnych na token. Natywnie obsługuje kontekst 1 mln tokenów i wykorzystuje Flash Attention, redukując FLOPs o 75% przy generowaniu 100 tys. tokenów w porównaniu do DeepSeek R1. Dzięki architekturze MoE, CISPO i treningowi RL z hybrydową uwagą, osiąga czołowe wyniki w zadaniach rozumowania z długim wejściem i rzeczywistym inżynierii oprogramowania.",
@@ -98,6 +99,7 @@
"Phi-3.5-mini-instruct.description": "Zaktualizowana wersja modelu Phi-3-mini.",
"Phi-3.5-vision-instrust.description": "Zaktualizowana wersja modelu Phi-3-vision.",
"Pro/MiniMaxAI/MiniMax-M2.1.description": "MiniMax-M2.1 to otwartoźródłowy duży model językowy zoptymalizowany pod kątem możliwości działania jako agent, wyróżniający się w programowaniu, korzystaniu z narzędzi, wykonywaniu poleceń i długoterminowym planowaniu. Model wspiera wielojęzyczne tworzenie oprogramowania i realizację złożonych, wieloetapowych procesów, osiągając wynik 74,0 w teście SWE-bench Verified i przewyższając Claude Sonnet 4.5 w scenariuszach wielojęzycznych.",
"Pro/MiniMaxAI/MiniMax-M2.5.description": "MiniMax-M2.5 to najnowszy duży model językowy opracowany przez MiniMax, trenowany za pomocą uczenia przez wzmocnienie na dużą skalę w setkach tysięcy złożonych środowisk rzeczywistych. Dzięki architekturze MoE z 229 miliardami parametrów osiąga wiodącą w branży wydajność w zadaniach takich jak programowanie, wywoływanie narzędzi przez agenta, wyszukiwanie i scenariusze biurowe.",
"Pro/Qwen/Qwen2-7B-Instruct.description": "Qwen2-7B-Instruct to 7-miliardowy model LLM z serii Qwen2, dostrojony do instrukcji. Wykorzystuje architekturę Transformera z SwiGLU, biasem QKV i grupowaną uwagę zapytań, obsługuje duże wejścia. Wyróżnia się w rozumieniu języka, generowaniu, zadaniach wielojęzycznych, kodowaniu, matematyce i rozumowaniu, przewyższając większość modeli otwartych i konkurując z zamkniętymi. Przewyższa Qwen1.5-7B-Chat w wielu testach.",
"Pro/Qwen/Qwen2.5-7B-Instruct.description": "Qwen2.5-7B-Instruct to część najnowszej serii LLM Alibaba Cloud. Model 7B przynosi znaczące ulepszenia w kodowaniu i matematyce, obsługuje ponad 29 języków i poprawia wykonywanie instrukcji, rozumienie danych strukturalnych i generowanie strukturalnych wyników (szczególnie JSON).",
"Pro/Qwen/Qwen2.5-Coder-7B-Instruct.description": "Qwen2.5-Coder-7B-Instruct to najnowszy model LLM Alibaba Cloud skoncentrowany na kodzie. Zbudowany na bazie Qwen2.5 i wytrenowany na 5,5 bln tokenów, znacząco poprawia generowanie kodu, rozumowanie i naprawę, zachowując mocne strony w matematyce i ogólnych zadaniach, stanowiąc solidną bazę dla agentów kodujących.",
@@ -107,13 +109,13 @@
"Pro/deepseek-ai/DeepSeek-R1-Distill-Qwen-7B.description": "DeepSeek-R1-Distill-Qwen-7B to model zdestylowany z Qwen2.5-Math-7B i dostrojony na 800 tys. starannie dobranych próbkach DeepSeek-R1. Osiąga wysokie wyniki: 92,8% na MATH-500, 55,5% na AIME 2024 i ocenę 1189 na CodeForces dla modelu 7B.",
"Pro/deepseek-ai/DeepSeek-R1.description": "DeepSeek-R1 to model rozumowania oparty na RL, który redukuje powtórzenia i poprawia czytelność. Wykorzystuje dane cold-start przed RL, by dodatkowo zwiększyć zdolności rozumowania, dorównuje OpenAI-o1 w zadaniach matematycznych, kodowych i rozumowania, a dzięki starannemu treningowi poprawia ogólne wyniki.",
"Pro/deepseek-ai/DeepSeek-V3.1-Terminus.description": "DeepSeek-V3.1-Terminus to zaktualizowany model V3.1, pozycjonowany jako hybrydowy agent LLM. Naprawia zgłoszone przez użytkowników problemy, poprawia stabilność, spójność językową i redukuje mieszane znaki chińskie/angielskie oraz nieprawidłowe znaki. Integruje tryby myślenia i nie-myślenia z szablonami czatu dla elastycznego przełączania. Poprawia również wydajność agentów kodu i wyszukiwania dla bardziej niezawodnego użycia narzędzi i zadań wieloetapowych.",
"Pro/deepseek-ai/DeepSeek-V3.2-Exp.description": "DeepSeek-V3.2-Exp to eksperymentalne wydanie V3.2, łączące się z nową architekturą. Dodaje DeepSeek Sparse Attention (DSA) do V3.1-Terminus, poprawiając efektywność treningu i wnioskowania w długim kontekście, z optymalizacjami dla użycia narzędzi, rozumienia długich dokumentów i rozumowania wieloetapowego. Idealny do eksploracji wyższej efektywności rozumowania przy dużych budżetach kontekstu.",
"Pro/deepseek-ai/DeepSeek-V3.2.description": "DeepSeek-V3.2 to model łączący wysoką wydajność obliczeniową z doskonałym rozumowaniem i wydajnością Agenta. Jego podejście opiera się na trzech kluczowych przełomach technologicznych: DeepSeek Sparse Attention (DSA), wydajnym mechanizmie uwagi, który znacznie zmniejsza złożoność obliczeniową przy zachowaniu wydajności modelu i jest specjalnie zoptymalizowany dla scenariuszy z długim kontekstem; skalowalnym frameworku uczenia przez wzmocnienie, dzięki któremu wydajność modelu może rywalizować z GPT-5, a jego wersja o wysokiej mocy obliczeniowej dorównuje Gemini-3.0-Pro w zdolnościach rozumowania; oraz dużej skali pipeline'owi syntezy zadań Agenta, mającemu na celu integrację zdolności rozumowania w scenariuszach użycia narzędzi, co poprawia przestrzeganie instrukcji i uogólnianie w złożonych interaktywnych środowiskach. Model osiągnął złote medale w Międzynarodowej Olimpiadzie Matematycznej (IMO) i Międzynarodowej Olimpiadzie Informatycznej (IOI) w 2025 roku.",
"Pro/deepseek-ai/DeepSeek-V3.description": "DeepSeek-V3 to model MoE z 671 mld parametrów, wykorzystujący MLA i DeepSeekMoE z równoważeniem obciążenia bez strat, zapewniający efektywne wnioskowanie i trening. Wstępnie wytrenowany na 14,8 bln wysokiej jakości tokenów i dalej dostrojony za pomocą SFT i RL, przewyższa inne modele otwarte i zbliża się do czołowych modeli zamkniętych.",
"Pro/moonshotai/Kimi-K2-Instruct-0905.description": "Kimi K2-Instruct-0905 to najnowsza i najpotężniejsza wersja Kimi K2. Jest to model MoE najwyższej klasy z 1T łącznych i 32B aktywnych parametrów. Kluczowe cechy to silniejsza inteligencja kodowania agentowego z istotnymi poprawami w testach porównawczych i zadaniach agentowych w rzeczywistych warunkach, a także ulepszona estetyka i użyteczność kodowania frontendowego.",
"Pro/moonshotai/Kimi-K2-Thinking.description": "Kimi K2 Thinking Turbo to wariant Turbo zoptymalizowany pod kątem szybkości rozumowania i przepustowości, zachowując jednocześnie wieloetapowe rozumowanie i obsługę narzędzi znane z K2 Thinking. Jest to model MoE z około 1T łącznych parametrów, natywnym kontekstem 256K i stabilnym wywoływaniem narzędzi na dużą skalę, przeznaczony do zastosowań produkcyjnych z rygorystycznymi wymaganiami dotyczącymi opóźnień i współbieżności.",
"Pro/moonshotai/Kimi-K2.5.description": "Kimi K2.5 to natywny, otwartoźródłowy model agenta multimodalnego, zbudowany na bazie Kimi-K2-Base, wytrenowany na około 1,5 biliona mieszanych tokenów wizualnych i tekstowych. Model wykorzystuje architekturę MoE z 1T całkowitych parametrów i 32B aktywnych parametrów, obsługuje kontekst o długości 256K, płynnie integrując rozumienie wizji i języka.",
"Pro/zai-org/glm-4.7.description": "GLM-4.7 to najnowszy flagowy model Zhipu, oferujący ulepszone ogólne możliwości, prostsze i bardziej naturalne odpowiedzi oraz bardziej wciągające doświadczenie pisarskie.",
"Pro/zai-org/glm-5.description": "GLM-5 to nowa generacja dużego modelu językowego od Zhipu, skoncentrowana na inżynierii złożonych systemów i zadaniach Agent o długim horyzoncie czasowym. Model rozszerzony do 744B parametrów (40B aktywnych) i zintegrowany z DeepSeek Sparse Attention.",
"Pro/zai-org/glm-5.description": "GLM-5 to model językowy nowej generacji od Zhipu, skoncentrowany na złożonej inżynierii systemowej i długotrwałych zadaniach Agenta. Parametry modelu zostały rozszerzone do 744 miliardów (40 miliardów aktywnych) i integrują DeepSeek Sparse Attention.",
"QwQ-32B-Preview.description": "Qwen QwQ to eksperymentalny model badawczy skoncentrowany na ulepszaniu zdolności rozumowania.",
"Qwen/QVQ-72B-Preview.description": "QVQ-72B-Preview to model badawczy od Qwen, skoncentrowany na rozumowaniu wizualnym, wyróżniający się w złożonym rozumieniu scen i problemach matematycznych opartych na obrazie.",
"Qwen/QwQ-32B-Preview.description": "Qwen QwQ to eksperymentalny model badawczy skoncentrowany na ulepszonym rozumowaniu sztucznej inteligencji.",
@@ -137,7 +139,7 @@
"Qwen/Qwen3-14B.description": "Qwen3 to nowej generacji model Tongyi Qwen, oferujący znaczne ulepszenia w zakresie rozumowania, ogólnych zdolności, możliwości działania jako agent oraz wydajności wielojęzycznej. Obsługuje przełączanie trybów myślenia.",
"Qwen/Qwen3-235B-A22B-Instruct-2507.description": "Qwen3-235B-A22B-Instruct-2507 to flagowy model Qwen3 MoE z 235 miliardami parametrów ogólnych i 22 miliardami aktywnych. Jest to zaktualizowana wersja bez trybu myślenia, skoncentrowana na poprawie wykonywania instrukcji, rozumowania logicznego, rozumienia tekstu, matematyki, nauk ścisłych, programowania i obsługi narzędzi. Rozszerza również wiedzę długiego ogona w wielu językach i lepiej dopasowuje się do preferencji użytkowników w zadaniach subiektywnych i otwartych.",
"Qwen/Qwen3-235B-A22B-Thinking-2507.description": "Qwen3-235B-A22B-Thinking-2507 to model Qwen3 skoncentrowany na złożonym rozumowaniu. Wykorzystuje architekturę MoE z 235 miliardami parametrów ogólnych i około 22 miliardami aktywnych na token, co zwiększa efektywność. Jako dedykowany model myślący, osiąga znaczne postępy w logice, matematyce, naukach ścisłych, programowaniu i testach akademickich, osiągając najwyższy poziom otwartego rozumowania. Poprawia również wykonywanie instrukcji, obsługę narzędzi i generowanie tekstu, a także natywnie obsługuje kontekst 256K dla głębokiego rozumowania i długich dokumentów.",
"Qwen/Qwen3-235B-A22B.description": "Qwen3 to nowej generacji model Tongyi Qwen, oferujący znaczne ulepszenia w zakresie rozumowania, ogólnych zdolności, możliwości działania jako agent oraz wydajności wielojęzycznej. Obsługuje przełączanie trybów myślenia.",
"Qwen/Qwen3-235B-A22B.description": "Qwen3 235B A22B to ultra-skalowy model Qwen3 dostarczający najwyższej klasy możliwości AI.",
"Qwen/Qwen3-30B-A3B-Instruct-2507.description": "Qwen3-30B-A3B-Instruct-2507 to zaktualizowana wersja modelu Qwen3-30B-A3B bez trybu myślenia. Jest to model MoE z 30,5 miliardami parametrów ogólnych i 3,3 miliardami aktywnych. Znacząco poprawia wykonywanie instrukcji, rozumowanie logiczne, rozumienie tekstu, matematykę, nauki ścisłe, programowanie i obsługę narzędzi, rozszerza wiedzę długiego ogona w wielu językach i lepiej dopasowuje się do preferencji użytkowników w zadaniach subiektywnych. Obsługuje kontekst 256K. Ten model działa wyłącznie w trybie bez myślenia i nie generuje znaczników `<think></think>`.",
"Qwen/Qwen3-30B-A3B-Thinking-2507.description": "Qwen3-30B-A3B-Thinking-2507 to najnowszy model myślący z serii Qwen3. Jest to model MoE z 30,5 miliardami parametrów ogólnych i 3,3 miliardami aktywnych, skoncentrowany na złożonych zadaniach. Osiąga znaczące postępy w logice, matematyce, naukach ścisłych, programowaniu i testach akademickich, a także poprawia wykonywanie instrukcji, obsługę narzędzi, generowanie tekstu i dopasowanie do preferencji. Natywnie obsługuje kontekst 256K i może zostać rozszerzony do 1 miliona tokenów. Ta wersja została zaprojektowana do trybu myślenia z dokładnym rozumowaniem krok po kroku i silnymi możliwościami agenta.",
"Qwen/Qwen3-30B-A3B.description": "Qwen3 to nowej generacji model Tongyi Qwen, oferujący znaczne ulepszenia w zakresie rozumowania, ogólnych zdolności, możliwości działania jako agent oraz wydajności wielojęzycznej. Obsługuje przełączanie trybów myślenia.",
@@ -315,7 +317,6 @@
"codeqwen.description": "CodeQwen1.5 to duży model językowy wytrenowany na obszernych danych kodu, zaprojektowany do realizacji złożonych zadań programistycznych.",
"codestral-latest.description": "Codestral to nasz najbardziej zaawansowany model kodujący; wersja 2 (styczeń 2025) została zoptymalizowana pod kątem niskich opóźnień i zadań o wysokiej częstotliwości, takich jak FIM, poprawa kodu i generowanie testów.",
"codestral.description": "Codestral to pierwszy model kodujący od Mistral AI, oferujący solidne wsparcie dla generowania kodu.",
"codex-mini-latest.description": "codex-mini-latest to dostrojony model o4-mini dla interfejsu Codex CLI. Do bezpośredniego użycia przez API zalecamy rozpoczęcie od gpt-4.1.",
"cogito-2.1:671b.description": "Cogito v2.1 671B to amerykański otwartoźródłowy model LLM dostępny do użytku komercyjnego, dorównujący wydajnością czołowym modelom, oferujący wyższą efektywność rozumowania tokenów, kontekst długości 128k i ogólnie wysokie możliwości.",
"cogview-3-flash.description": "CogView-3-Flash to darmowy model generowania obrazów opracowany przez Zhipu. Generuje obrazy zgodne z instrukcjami użytkownika, jednocześnie osiągając wyższe oceny estetyczne. CogView-3-Flash jest głównie wykorzystywany w takich dziedzinach jak twórczość artystyczna, projektowanie, rozwój gier i rzeczywistość wirtualna, pomagając użytkownikom szybko przekształcać opisy tekstowe w obrazy.",
"cogview-4.description": "CogView-4 to pierwszy otwartoźródłowy model tekst-na-obraz od Zhipu, który potrafi generować chińskie znaki. Poprawia zrozumienie semantyczne, jakość obrazu i renderowanie tekstu w języku chińskim i angielskim, obsługuje dwujęzyczne podpowiedzi o dowolnej długości i generuje obrazy w dowolnej rozdzielczości w określonych zakresach.",
@@ -342,7 +343,7 @@
"command-light-nightly.description": "Aby skrócić czas między głównymi wydaniami, oferujemy nocne kompilacje Command. W serii command-light nazywa się to command-light-nightly. Jest to najnowsza, najbardziej eksperymentalna (i potencjalnie niestabilna) wersja, aktualizowana regularnie bez zapowiedzi, dlatego nie jest zalecana do produkcji.",
"command-light.description": "Mniejszy, szybszy wariant Command, niemal równie wydajny, ale szybszy.",
"command-nightly.description": "Aby skrócić czas między głównymi wydaniami, oferujemy nocne kompilacje Command. W serii Command nazywa się to command-nightly. Jest to najnowsza, najbardziej eksperymentalna (i potencjalnie niestabilna) wersja, aktualizowana regularnie bez zapowiedzi, dlatego nie jest zalecana do produkcji.",
"command-r-03-2024.description": "Command R to model czatu podążający za instrukcjami, oferujący wyższą jakość, większą niezawodność i dłuższe okno kontekstu niż wcześniejsze modele. Obsługuje złożone przepływy pracy, takie jak generowanie kodu, RAG, użycie narzędzi i agentów.",
"command-r-03-2024.description": "command-r to model czatu podążający za instrukcjami, który wykonuje zadania językowe z wyższą jakością, większą niezawodnością i dłuższym kontekstem niż poprzednie modele. Obsługuje złożone przepływy pracy, takie jak generowanie kodu, RAG, użycie narzędzi i agentów.",
"command-r-08-2024.description": "command-r-08-2024 to zaktualizowany model Command R wydany w sierpniu 2024.",
"command-r-plus-04-2024.description": "command-r-plus to alias modelu command-r-plus-04-2024, więc użycie command-r-plus w API wskazuje na ten model.",
"command-r-plus-08-2024.description": "Command R+ to model czatu podążający za instrukcjami, oferujący wyższą jakość, większą niezawodność i dłuższe okno kontekstu niż wcześniejsze modele. Najlepiej sprawdza się w złożonych przepływach RAG i wieloetapowym użyciu narzędzi.",
@@ -366,7 +367,8 @@
"deepseek-ai/DeepSeek-V2.5.description": "DeepSeek-V2.5 to ulepszona wersja DeepSeek-V2-Chat i DeepSeek-Coder-V2-Instruct, łącząca ogólne i programistyczne zdolności. Poprawia pisanie i wykonywanie instrukcji, lepiej dopasowując się do preferencji użytkownika, i osiąga znaczące wyniki w AlpacaEval 2.0, ArenaHard, AlignBench i MT-Bench.",
"deepseek-ai/DeepSeek-V3.1-Terminus.description": "DeepSeek-V3.1-Terminus to zaktualizowany model V3.1 pełniący rolę hybrydowego agenta LLM. Naprawia zgłoszone przez użytkowników problemy, poprawia stabilność, spójność językową i redukuje mieszane znaki chińskie/angielskie oraz anomalie. Integruje tryby myślenia i nie-myślenia z szablonami czatu dla elastycznego przełączania. Ulepsza także działanie Code Agent i Search Agent, zapewniając bardziej niezawodne korzystanie z narzędzi i realizację zadań wieloetapowych.",
"deepseek-ai/DeepSeek-V3.1.description": "DeepSeek V3.1 wykorzystuje hybrydową architekturę rozumowania i obsługuje zarówno tryby myślenia, jak i nie-myślenia.",
"deepseek-ai/DeepSeek-V3.2-Exp.description": "DeepSeek-V3.2-Exp to eksperymentalna wersja V3.2, stanowiąca pomost do nowej architektury. Dodaje DeepSeek Sparse Attention (DSA) do V3.1-Terminus, poprawiając efektywność treningu i wnioskowania w długim kontekście, z optymalizacjami dla użycia narzędzi, rozumienia długich dokumentów i rozumowania wieloetapowego. Idealny do eksploracji wyższej efektywności rozumowania przy dużych budżetach kontekstowych.",
"deepseek-ai/DeepSeek-V3.2-Exp.description": "DeepSeek V3.2 Exp wykorzystuje hybrydową architekturę rozumowania i obsługuje zarówno tryby myślenia, jak i nie-myślenia.",
"deepseek-ai/DeepSeek-V3.2.description": "DeepSeek-V3.2 to model łączący wysoką wydajność obliczeniową z doskonałym rozumowaniem i wydajnością Agenta. Jego podejście opiera się na trzech głównych przełomach technologicznych: DeepSeek Sparse Attention (DSA), wydajnym mechanizmie uwagi, który znacznie zmniejsza złożoność obliczeniową przy zachowaniu wydajności modelu i jest specjalnie zoptymalizowany dla scenariuszy z długim kontekstem; skalowalnym frameworku uczenia przez wzmocnienie, dzięki któremu wydajność modelu może rywalizować z GPT-5, a jego wersja o wysokiej mocy obliczeniowej dorównuje Gemini-3.0-Pro w zdolnościach rozumowania; oraz dużej skali pipeline'owi syntezy zadań Agenta, mającemu na celu integrację zdolności rozumowania w scenariuszach użycia narzędzi, co poprawia przestrzeganie instrukcji i uogólnianie w złożonych interaktywnych środowiskach. Model osiągnął złote medale w Międzynarodowej Olimpiadzie Matematycznej (IMO) i Międzynarodowej Olimpiadzie Informatycznej (IOI) w 2025 roku.",
"deepseek-ai/DeepSeek-V3.description": "DeepSeek-V3 to model MoE z 671 miliardami parametrów, wykorzystujący MLA i DeepSeekMoE z bezstratnym równoważeniem obciążenia dla efektywnego treningu i wnioskowania. Wytrenowany na 14,8T wysokiej jakości tokenach z SFT i RL, przewyższa inne modele open-source i zbliża się do czołowych modeli zamkniętych.",
"deepseek-ai/deepseek-llm-67b-chat.description": "DeepSeek LLM Chat (67B) to innowacyjny model oferujący głębokie zrozumienie języka i interakcję.",
"deepseek-ai/deepseek-v3.1-terminus.description": "DeepSeek V3.1 to model nowej generacji do rozumowania z silniejszym rozumowaniem złożonym i łańcuchem myśli do zadań wymagających głębokiej analizy.",
@@ -433,6 +435,7 @@
"deepseek_r1_distill_llama_70b.description": "DeepSeek-R1-Distill-Llama-70B to model odchudzony z Llama-3.3-70B-Instruct. Jako część serii DeepSeek-R1, został dostrojony na próbkach wygenerowanych przez DeepSeek-R1 i osiąga wysokie wyniki w matematyce, programowaniu i rozumowaniu.",
"deepseek_r1_distill_qwen_14b.description": "DeepSeek-R1-Distill-Qwen-14B to model odchudzony z Qwen2.5-14B, dostrojony na 800 tysiącach starannie wyselekcjonowanych próbek wygenerowanych przez DeepSeek-R1, zapewniający silne zdolności rozumowania.",
"deepseek_r1_distill_qwen_32b.description": "DeepSeek-R1-Distill-Qwen-32B to model odchudzony z Qwen2.5-32B, dostrojony na 800 tysiącach starannie wyselekcjonowanych próbek wygenerowanych przez DeepSeek-R1, wyróżniający się w matematyce, programowaniu i rozumowaniu.",
"devstral-2512.description": "Devstral 2 to model tekstowy na poziomie korporacyjnym, który doskonale radzi sobie z eksploracją baz kodu, edycją wielu plików i wspieraniem agentów inżynierii oprogramowania.",
"devstral-2:123b.description": "Devstral 2 123B doskonale wykorzystuje narzędzia do eksploracji baz kodu, edycji wielu plików i wspierania agentów inżynierii oprogramowania.",
"doubao-1.5-lite-32k.description": "Doubao-1.5-lite to nowy, lekki model o ultrabłyskawicznej odpowiedzi, oferujący najwyższą jakość i niskie opóźnienia.",
"doubao-1.5-pro-256k.description": "Doubao-1.5-pro-256k to kompleksowa aktualizacja modelu Doubao-1.5-Pro, poprawiająca ogólną wydajność o 10%. Obsługuje kontekst do 256k i do 12k tokenów wyjściowych, oferując wyższą wydajność, większe okno i dużą wartość dla szerokiego zakresu zastosowań.",
@@ -549,7 +552,7 @@
"gemini-3-pro-image-preview.description": "Gemini 3 Pro Image (Nano Banana Pro) to model generowania obrazów od Google, który obsługuje również dialogi multimodalne.",
"gemini-3-pro-image-preview:image.description": "Gemini 3 Pro Image (Nano Banana Pro) to model generowania obrazów od Google, który obsługuje również czat multimodalny.",
"gemini-3-pro-preview.description": "Gemini 3 Pro to najpotężniejszy model agenta i kodowania nastrojów od Google, oferujący bogatsze wizualizacje i głębszą interakcję przy zaawansowanym rozumowaniu.",
"gemini-3.1-flash-image-preview.description": "Gemini 3.1 Flash Image (Nano Banana 2) oferuje jakość obrazu na poziomie Pro w błyskawicznym tempie, wspierając multimodalne rozmowy.",
"gemini-3.1-flash-image-preview.description": "Gemini 3.1 Flash Image (Nano Banana 2) to najszybszy natywny model generowania obrazów od Google z obsługą myślenia, generowaniem obrazów w rozmowach i edycją.",
"gemini-3.1-flash-image-preview:image.description": "Gemini 3.1 Flash Image (Nano Banana 2) oferuje jakość obrazu na poziomie Pro w błyskawicznym tempie, wspierając multimodalne rozmowy.",
"gemini-3.1-pro-preview.description": "Gemini 3.1 Pro Preview ulepsza Gemini 3 Pro, oferując lepsze zdolności rozumowania i wsparcie dla średniego poziomu myślenia.",
"gemini-flash-latest.description": "Najnowsza wersja Gemini Flash",
@@ -605,19 +608,15 @@
"google/gemini-2.0-flash-lite-001.description": "Gemini 2.0 Flash Lite to lekka wersja Gemini z domyślnie wyłączonym myśleniem, co poprawia opóźnienia i koszty; można je włączyć za pomocą parametrów.",
"google/gemini-2.0-flash-lite.description": "Gemini 2.0 Flash Lite oferuje funkcje nowej generacji, w tym wyjątkową szybkość, wbudowane narzędzia, generację multimodalną i kontekst do 1 miliona tokenów.",
"google/gemini-2.0-flash.description": "Gemini 2.0 Flash to wysokowydajny model wnioskowania Google do zaawansowanych zadań multimodalnych.",
"google/gemini-2.5-flash-image-free.description": "Gemini 2.5 Flash Image darmowy poziom z ograniczonym limitem generacji multimodalnej.",
"google/gemini-2.5-flash-image-preview.description": "Eksperymentalny model Gemini 2.5 Flash z obsługą generowania obrazów.",
"google/gemini-2.5-flash-image.description": "Gemini 2.5 Flash Image (Nano Banana) to model generowania obrazów Google z obsługą konwersacji multimodalnych.",
"google/gemini-2.5-flash-lite.description": "Gemini 2.5 Flash Lite to lekka wersja Gemini 2.5 zoptymalizowana pod kątem opóźnień i kosztów, odpowiednia do scenariuszy o dużym przepływie danych.",
"google/gemini-2.5-flash-preview.description": "Gemini 2.5 Flash to najbardziej zaawansowany flagowy model Google, stworzony do zaawansowanego wnioskowania, kodowania, matematyki i nauk ścisłych. Zawiera wbudowane „myślenie” dla dokładniejszych odpowiedzi i lepszego przetwarzania kontekstu.\n\nUwaga: model ma dwie wersje — z myśleniem i bez. Ceny różnią się w zależności od wybranej wersji. Wybierając standardową wersję (bez sufiksu „:thinking”), model unika generowania tokenów myślenia.\n\nAby korzystać z myślenia i otrzymywać tokeny myślenia, należy wybrać wariant „:thinking”, który wiąże się z wyższymi kosztami.\n\nGemini 2.5 Flash można również skonfigurować za pomocą parametru „max reasoning tokens” zgodnie z dokumentacją (https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning).",
"google/gemini-2.5-flash-preview:thinking.description": "Gemini 2.5 Flash to najbardziej zaawansowany flagowy model Google, stworzony do zaawansowanego wnioskowania, kodowania, matematyki i nauk ścisłych. Zawiera wbudowane „myślenie” dla dokładniejszych odpowiedzi i lepszego przetwarzania kontekstu.\n\nUwaga: model ma dwie wersje — z myśleniem i bez. Ceny różnią się w zależności od wybranej wersji. Wybierając standardową wersję (bez sufiksu „:thinking”), model unika generowania tokenów myślenia.\n\nAby korzystać z myślenia i otrzymywać tokeny myślenia, należy wybrać wariant „:thinking”, który wiąże się z wyższymi kosztami.\n\nGemini 2.5 Flash można również skonfigurować za pomocą parametru „max reasoning tokens” zgodnie z dokumentacją (https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning).",
"google/gemini-2.5-flash.description": "Gemini 2.5 Flash (Lite/Pro/Flash) to rodzina modeli Google obejmująca od niskich opóźnień po wysokowydajne wnioskowanie.",
"google/gemini-2.5-pro-free.description": "Darmowa wersja Gemini 2.5 Pro z ograniczonym limitem multimodalnego długiego kontekstu, odpowiednia do testów i lekkich zadań.",
"google/gemini-2.5-flash.description": "Gemini 2.5 Flash to rodzina modeli Google obejmująca niskie opóźnienia i wysoką wydajność rozumowania.",
"google/gemini-2.5-pro-preview.description": "Gemini 2.5 Pro Preview to najbardziej zaawansowany model myślący Google do rozwiązywania złożonych problemów w kodzie, matematyce i naukach ścisłych oraz do analizy dużych zbiorów danych, baz kodu i dokumentów z długim kontekstem.",
"google/gemini-2.5-pro.description": "Gemini 2.5 Pro to flagowy model wnioskowania Google z obsługą długiego kontekstu do złożonych zadań.",
"google/gemini-3-pro-image-preview-free.description": "Gemini 3 Pro Image darmowy poziom z ograniczonym limitem generacji multimodalnej.",
"google/gemini-3-pro-image-preview.description": "Gemini 3 Pro Image (Nano Banana Pro) to model generowania obrazów Google z obsługą konwersacji multimodalnych.",
"google/gemini-3-pro-preview-free.description": "Gemini 3 Pro Preview Free oferuje te same możliwości rozumienia i wnioskowania multimodalnego co wersja standardowa, ale z limitami, co czyni go odpowiednim do testów i rzadkich zastosowań.",
"google/gemini-3-pro-preview.description": "Gemini 3 Pro to model nowej generacji do wnioskowania multimodalnego w rodzinie Gemini, rozumiejący tekst, dźwięk, obrazy i wideo, obsługujący złożone zadania i duże bazy kodu.",
"google/gemini-embedding-001.description": "Nowoczesny model osadzania tekstu o wysokiej wydajności w języku angielskim, wielojęzycznym i kodzie.",
"google/gemini-flash-1.5.description": "Gemini 1.5 Flash zapewnia zoptymalizowane przetwarzanie multimodalne dla szerokiego zakresu złożonych zadań.",
@@ -717,15 +716,24 @@
"hunyuan-a13b.description": "Pierwszy model hybrydowego rozumowania od Hunyuan, ulepszony względem hunyuan-standard-256K (łącznie 80B, 13B aktywnych). Domyślnie działa w trybie wolnego myślenia i obsługuje przełączanie między trybem szybkim i wolnym za pomocą parametrów lub prefiksu /no_think. Ogólne możliwości zostały poprawione względem poprzedniej generacji, szczególnie w matematyce, naukach ścisłych, rozumieniu długich tekstów i zadaniach agentowych.",
"hunyuan-code.description": "Najnowszy model kodowania Hunyuan, wytrenowany na 200 miliardach wysokiej jakości danych kodu oraz sześciu miesiącach danych SFT, z kontekstem 8K. Osiąga czołowe wyniki w automatycznych benchmarkach kodowania i w ocenach ekspertów w pięciu językach.",
"hunyuan-functioncall.description": "Najnowszy model MoE FunctionCall Hunyuan, wytrenowany na wysokiej jakości danych wywoływania narzędzi, z oknem kontekstowym 32K i wiodącymi wynikami w różnych wymiarach.",
"hunyuan-large-longcontext.description": "Doskonale radzi sobie z zadaniami na długich dokumentach, takimi jak streszczenia i QA, a także obsługuje ogólne generowanie. Silny w analizie i generowaniu długich tekstów dla złożonych, szczegółowych treści.",
"hunyuan-large.description": "Hunyuan-large ma ~389 miliardów parametrów całkowitych i ~52 miliardy aktywowanych, największy i najsilniejszy otwarty model MoE w architekturze Transformera.",
"hunyuan-lite.description": "Ulepszony do architektury MoE z oknem kontekstu 256K, przewyższa wiele otwartych modeli w dziedzinach NLP, kodowania, matematyki i benchmarków branżowych.",
"hunyuan-pro.description": "Model MOE-32K z bilionem parametrów i długim kontekstem, lider w testach, silny w złożonych instrukcjach i rozumowaniu, zaawansowanej matematyce, wywoływaniu funkcji i zoptymalizowany pod kątem tłumaczeń wielojęzycznych, finansów, prawa i medycyny.",
"hunyuan-role.description": "Najnowszy model odgrywania ról Hunyuan, oficjalnie dostrojony na podstawie danych odgrywania ról, oferujący lepszą wydajność w scenariuszach odgrywania ról.",
"hunyuan-standard-256K.description": "Wykorzystuje ulepszone trasowanie, aby złagodzić problemy z równoważeniem obciążenia i zapadaniem się ekspertów. Długie teksty \"igła w stogu siana\" osiągają 99,9%. MOE-256K jeszcze bardziej zwiększa długość i jakość wejść.",
"hunyuan-standard.description": "Wykorzystuje ulepszone trasowanie, aby złagodzić problemy z równoważeniem obciążenia i zapadaniem się ekspertów. Długie teksty \"igła w stogu siana\" osiągają 99,9%. MOE-32K oferuje lepszą wartość, równoważąc jakość i cenę dla długich tekstów.",
"hunyuan-standard-256K.description": "Wykorzystuje ulepszone routowanie, aby złagodzić problemy z równoważeniem obciążenia i zapadaniem się ekspertów. Osiąga 99,9% skuteczności w zadaniach typu 'igła w stogu siana' na długim kontekście. MOE-256K dodatkowo rozszerza długość i jakość kontekstu.",
"hunyuan-standard.description": "Wykorzystuje ulepszone routowanie, aby złagodzić problemy z równoważeniem obciążenia i zapadaniem się ekspertów. Osiąga 99,9% skuteczności w zadaniach typu 'igła w stogu siana' na długim kontekście. MOE-32K oferuje dużą wartość przy obsłudze długich wejść.",
"hunyuan-t1-20250321.description": "Buduje zrównoważone zdolności artystyczne i STEM z silnym uchwyceniem informacji w długich tekstach. Obsługuje odpowiedzi rozumujące dla problemów z matematyki, logiki, nauki i kodowania na różnych poziomach trudności.",
"hunyuan-t1-20250403.description": "Poprawia generowanie kodu na poziomie projektów i jakość pisania, wzmacnia zrozumienie tematów w wielu turach i przestrzeganie instrukcji ToB, poprawia zrozumienie na poziomie słów i redukuje problemy z mieszaniem uproszczonego/tradycyjnego chińskiego i angielskiego.",
"hunyuan-t1-20250529.description": "Poprawia kreatywne pisanie i kompozycję, wzmacnia kodowanie frontendowe, rozumowanie matematyczne i logiczne oraz poprawia przestrzeganie instrukcji.",
"hunyuan-t1-20250711.description": "Znacznie poprawia trudne zadania matematyczne, logiczne i kodowanie, zwiększa stabilność wyników i wzmacnia zdolności do pracy z długimi tekstami.",
"hunyuan-t1-latest.description": "Znacząco ulepsza model wolnego myślenia w zakresie trudnej matematyki, złożonego rozumowania, skomplikowanego kodowania, wykonywania instrukcji i jakości kreatywnego pisania.",
"hunyuan-t1-vision-20250916.description": "Najnowszy model głębokiego rozumowania t1-vision z dużymi ulepszeniami w zakresie VQA, lokalizacji wizualnej, OCR, wykresów, rozwiązywania sfotografowanych problemów i tworzenia treści na podstawie obrazów, a także silniejszym wsparciem dla języka angielskiego i języków niskozasobowych.",
"hunyuan-turbo-20241223.description": "Ta wersja zwiększa skalowanie instrukcji dla lepszej generalizacji, znacznie poprawia rozumowanie matematyczne/kodowe/logiczne, wzmacnia zrozumienie na poziomie słów i poprawia jakość pisania.",
"hunyuan-turbo-latest.description": "Ogólne ulepszenia doświadczenia w zakresie zrozumienia NLP, pisania, czatu, QA, tłumaczenia i domen; bardziej ludzkie odpowiedzi, lepsze wyjaśnianie niejasnych intencji, ulepszone parsowanie słów, wyższa jakość kreatywna i interaktywność oraz silniejsze rozmowy wielotur.",
"hunyuan-turbo.description": "Podgląd nowej generacji LLM Hunyuan z nową architekturą MoE, oferujący szybsze rozumowanie i lepsze wyniki niż hunyuan-pro.",
"hunyuan-turbos-latest.description": "Najnowszy flagowy model Hunyuan TurboS z silniejszym rozumowaniem i lepszym ogólnym doświadczeniem.",
"hunyuan-turbos-longtext-128k-20250325.description": "Doskonale radzi sobie z zadaniami na długich dokumentach, takimi jak streszczenia i QA, a także obsługuje ogólne generowanie. Silny w analizie i generowaniu długich tekstów dla złożonych, szczegółowych treści.",
"hunyuan-vision-1.5-instruct.description": "Szybki model rozumowania obraz-do-tekst oparty na bazie tekstowej TurboS, wykazujący znaczące ulepszenia w podstawowym rozpoznawaniu obrazów i analizie rozumowania obrazowego w porównaniu do poprzedniej wersji.",
"hunyuan-vision.description": "Najnowszy multimodalny model Hunyuan obsługujący wejścia obraz + tekst do generowania tekstu.",
"image-01-live.description": "Model generowania obrazów z drobnymi szczegółami, obsługujący konwersję tekstu na obraz i kontrolowane style.",
@@ -770,8 +778,7 @@
"kimi-k2:1t.description": "Kimi K2 to duży model MoE LLM firmy Moonshot AI z 1T parametrów i 32B aktywnych na każde przejście. Zoptymalizowany pod kątem zdolności agentowych, w tym zaawansowanego użycia narzędzi, rozumowania i syntezy kodu.",
"kimi-latest.description": "Kimi Latest korzysta z najnowszego modelu Kimi i może zawierać funkcje eksperymentalne. Obsługuje rozumienie obrazów i automatycznie wybiera modele rozliczeniowe 8k/32k/128k w zależności od długości kontekstu.",
"kuaishou/kat-coder-pro-v1.description": "KAT-Coder-Pro-V1 (dostępny za darmo przez ograniczony czas) koncentruje się na rozumieniu kodu i automatyzacji dla wydajnych agentów programistycznych.",
"learnlm-1.5-pro-experimental.description": "LearnLM to eksperymentalny model zadaniowy, trenowany zgodnie z zasadami nauki o uczeniu się, aby podążać za instrukcjami systemowymi w scenariuszach edukacyjnych, działając jako ekspert-nauczyciel.",
"learnlm-2.0-flash-experimental.description": "LearnLM to eksperymentalny model zadaniowy, trenowany zgodnie z zasadami nauki o uczeniu się, aby podążać za instrukcjami systemowymi w scenariuszach edukacyjnych, działając jako ekspert-nauczyciel.",
"labs-devstral-small-2512.description": "Devstral Small 2 doskonale radzi sobie z eksploracją baz kodu, edycją wielu plików i wspieraniem agentów inżynierii oprogramowania.",
"lite.description": "Spark Lite to lekki LLM o ultraniskim opóźnieniu i wydajnym przetwarzaniu. Jest całkowicie darmowy i obsługuje wyszukiwanie w czasie rzeczywistym. Szybkie odpowiedzi sprawdzają się na urządzeniach o niskiej mocy obliczeniowej i przy dostrajaniu modeli, zapewniając wysoką efektywność kosztową i inteligentne doświadczenie, szczególnie w scenariuszach pytań i odpowiedzi, generowania treści i wyszukiwania.",
"llama-3.1-70b-versatile.description": "Llama 3.1 70B zapewnia zaawansowane wnioskowanie AI dla złożonych zastosowań, oferując wysoką wydajność i precyzję przy dużym obciążeniu obliczeniowym.",
"llama-3.1-8b-instant.description": "Llama 3.1 8B to wydajny model generujący tekst w szybkim tempie, idealny do zastosowań na dużą skalę przy niskich kosztach.",
@@ -782,7 +789,6 @@
"llama-3.2-90b-vision-preview.description": "Llama 3.2 został zaprojektowany do zadań łączących obraz i tekst, doskonale radząc sobie z opisywaniem obrazów i wizualnym Q&A, łącząc generowanie języka z rozumieniem wizualnym.",
"llama-3.2-vision-instruct.description": "Model Llama 3.2-Vision dostrojony do instrukcji jest zoptymalizowany pod kątem rozpoznawania obrazów, wnioskowania wizualnego, opisywania oraz ogólnego Q&A opartego na obrazach.",
"llama-3.3-70b-versatile.description": "Meta Llama 3.3 to wielojęzyczny model LLM z 70 miliardami parametrów (tekst wejściowy/wyjściowy), dostępny w wersjach wstępnie wytrenowanej i dostrojonej do instrukcji. Wersja dostrojona do instrukcji jest zoptymalizowana pod kątem wielojęzycznych rozmów i przewyższa wiele otwartych i zamkniętych modeli czatu w standardowych testach branżowych.",
"llama-3.3-70b.description": "Llama 3.3 70B: średnio-duży model Llama łączący wnioskowanie i przepustowość.",
"llama-3.3-instruct.description": "Model Llama 3.3 dostrojony do instrukcji jest zoptymalizowany pod kątem rozmów i przewyższa wiele otwartych modeli czatu w standardowych testach branżowych.",
"llama3-70b-8192.description": "Meta Llama 3 70B oferuje wyjątkową zdolność obsługi złożonych zadań w wymagających projektach.",
"llama3-8b-8192.description": "Meta Llama 3 8B zapewnia silne wnioskowanie w różnorodnych scenariuszach.",
@@ -832,7 +838,6 @@
"meta-llama/llama-3.1-8b-instruct:free.description": "LLaMA 3.1 oferuje wsparcie wielojęzyczne i jest jednym z wiodących modeli generatywnych.",
"meta-llama/llama-3.2-11b-vision-instruct.description": "LLaMA 3.2 został zaprojektowany do zadań łączących obraz i tekst. Doskonale sprawdza się w opisywaniu obrazów i wizualnym QA, łącząc generowanie języka z rozumowaniem wizualnym.",
"meta-llama/llama-3.2-3b-instruct.description": "meta-llama/llama-3.2-3b-instruct",
"meta-llama/llama-3.2-90b-vision-instruct.description": "LLaMA 3.2 został zaprojektowany do zadań łączących obraz i tekst. Doskonale sprawdza się w opisywaniu obrazów i wizualnym QA, łącząc generowanie języka z rozumowaniem wizualnym.",
"meta-llama/llama-3.3-70b-instruct.description": "Llama 3.3 to najbardziej zaawansowany wielojęzyczny model open-source z rodziny Llama, oferujący wydajność zbliżoną do 405B przy bardzo niskim koszcie. Bazuje na architekturze Transformer i został ulepszony za pomocą SFT i RLHF dla większej użyteczności i bezpieczeństwa. Wersja dostrojona do instrukcji jest zoptymalizowana pod kątem czatu wielojęzycznego i przewyższa wiele modeli otwartych i zamkniętych w branżowych testach. Data odcięcia wiedzy: grudzień 2023.",
"meta-llama/llama-3.3-70b-instruct:free.description": "Llama 3.3 to najbardziej zaawansowany wielojęzyczny model open-source z rodziny Llama, oferujący wydajność zbliżoną do 405B przy bardzo niskim koszcie. Bazuje na architekturze Transformer i został ulepszony za pomocą SFT i RLHF dla większej użyteczności i bezpieczeństwa. Wersja dostrojona do instrukcji jest zoptymalizowana pod kątem czatu wielojęzycznego i przewyższa wiele modeli otwartych i zamkniętych w branżowych testach. Data odcięcia wiedzy: grudzień 2023.",
"meta.llama3-1-405b-instruct-v1:0.description": "Meta Llama 3.1 405B Instruct to największy i najpotężniejszy model Llama 3.1 Instruct, zaawansowany model do rozumowania dialogowego i generowania danych syntetycznych, stanowiący solidną bazę do dalszego pretrenowania lub dostrajania w konkretnych dziedzinach. Modele Llama 3.1 to zestaw modeli generacyjnych w wersjach 8B, 70B i 405B (tekst wejściowy/wyjściowy), dostrojonych do instrukcji i zoptymalizowanych pod kątem dialogu wielojęzycznego. Przewyższają wiele dostępnych modeli czatu w testach branżowych. Llama 3.1 jest przeznaczony do zastosowań komercyjnych i badawczych w różnych językach. Modele dostrojone do instrukcji nadają się do czatu w stylu asystenta, a modele pretrenowane do szerszych zadań generowania języka naturalnego. Wyniki Llama 3.1 mogą być również wykorzystywane do ulepszania innych modeli, w tym do generowania i udoskonalania danych syntetycznych. Llama 3.1 to model autoregresyjny oparty na Transformerze z zoptymalizowaną architekturą. Wersje dostrojone wykorzystują nadzorowane dostrajanie (SFT) i uczenie przez wzmocnienie z informacją zwrotną od ludzi (RLHF), aby lepiej odpowiadać ludzkim preferencjom w zakresie pomocności i bezpieczeństwa.",
@@ -894,7 +899,7 @@
"mistral-large-instruct.description": "Mistral-Large-Instruct-2407 to zaawansowany gęsty LLM z 123 miliardami parametrów, oferujący najnowocześniejsze rozumowanie, wiedzę i programowanie.",
"mistral-large-latest.description": "Mistral Large to flagowy model, silny w zadaniach wielojęzycznych, złożonym rozumowaniu i generowaniu kodu — idealny do zastosowań klasy premium.",
"mistral-large.description": "Mixtral Large to flagowy model Mistral, łączący generowanie kodu, matematykę i rozumowanie z oknem kontekstu 128K.",
"mistral-medium-latest.description": "Mistral Medium 3 oferuje najnowocześniejszą wydajność przy 8× niższych kosztach i upraszcza wdrażanie w przedsiębiorstwach.",
"mistral-medium-latest.description": "Mistral Medium 3.1 dostarcza wydajność na najwyższym poziomie przy 8× niższych kosztach i upraszcza wdrożenia w przedsiębiorstwach.",
"mistral-nemo-instruct.description": "Mistral-Nemo-Instruct-2407 to wersja dostrojona do instrukcji modelu Mistral-Nemo-Base-2407.",
"mistral-nemo.description": "Mistral Nemo to wydajny model 12B od Mistral AI i NVIDIA.",
"mistral-small-latest.description": "Mistral Small to opłacalna, szybka i niezawodna opcja do tłumaczeń, streszczeń i analizy sentymentu.",
@@ -933,7 +938,7 @@
"moonshot-v1-auto.description": "Moonshot V1 Auto automatycznie wybiera odpowiedni model na podstawie bieżącego użycia tokenów kontekstu.",
"moonshotai/Kimi-Dev-72B.description": "Kimi-Dev-72B to otwartoźródłowy model kodu LLM zoptymalizowany za pomocą RL na dużą skalę, generujący solidne, gotowe do produkcji poprawki. Osiąga wynik 60,4% w SWE-bench Verified, ustanawiając nowy rekord wśród otwartych modeli dla zadań inżynierii oprogramowania, takich jak naprawa błędów i przegląd kodu.",
"moonshotai/Kimi-K2-Instruct-0905.description": "Kimi K2-Instruct-0905 to najnowszy i najpotężniejszy model Kimi K2. To model MoE najwyższej klasy z 1T łącznych i 32B aktywnych parametrów. Kluczowe cechy to silniejsza inteligencja agentowa w kodowaniu, znaczne postępy w testach i zadaniach agentowych, a także ulepszona estetyka i użyteczność kodu frontendowego.",
"moonshotai/Kimi-K2-Thinking.description": "Kimi K2 Thinking to najnowszy i najpotężniejszy otwartoźródłowy model myślenia. Znacznie zwiększa głębokość rozumowania wieloetapowego i utrzymuje stabilne użycie narzędzi przez 200300 kolejnych wywołań, ustanawiając nowe rekordy w Humanity's Last Exam (HLE), BrowseComp i innych testach. Doskonale sprawdza s w kodowaniu, matematyce, logice i scenariuszach agentowych. Zbudowany na architekturze MoE z ~1T parametrów, obsługuje okno kontekstu 256K i wywoływanie narzędzi.",
"moonshotai/Kimi-K2-Thinking.description": "Kimi K2 Thinking to najnowszy i najpotężniejszy otwartoźródłowy model myślenia. Znacznie zwiększa głębokość rozumowania wieloetapowego i utrzymuje stabilne użycie narzędzi w 200300 kolejnych wywołaniach, ustanawiając nowe rekordy w Humanity's Last Exam (HLE), BrowseComp i innych benchmarkach. Doskonale radzi sobie w kodowaniu, matematyce, logice i scenariuszach agenta. Zbudowany na architekturze MoE z ~1 bilionem parametrów całkowitych, obsługuje okno kontekstowe 256K i wywoływanie narzędzi.",
"moonshotai/kimi-k2-0711.description": "Kimi K2 0711 to wariant instruct z serii Kimi, odpowiedni do wysokiej jakości kodu i użycia narzędzi.",
"moonshotai/kimi-k2-0905.description": "Kimi K2 0905 to aktualizacja rozszerzająca kontekst i wydajność rozumowania z optymalizacjami kodu.",
"moonshotai/kimi-k2-instruct-0905.description": "Model kimi-k2-0905-preview obsługuje okno kontekstu 256K, z silniejszym kodowaniem agentowym, bardziej dopracowanym i praktycznym kodem frontendowym oraz lepszym rozumieniem kontekstu.",
@@ -948,8 +953,8 @@
"nvidia/Llama-3.1-Nemotron-70B-Instruct-HF.description": "Llama 3.1 Nemotron 70B to dostosowany przez NVIDIA model LLM poprawiający pomocność. Osiąga najwyższe wyniki w Arena Hard, AlpacaEval 2 LC i GPT-4-Turbo MT-Bench, zajmując 1. miejsce we wszystkich trzech testach auto-alignment na dzień 1 października 2024. Trening oparty na Llama-3.1-70B-Instruct z użyciem RLHF (REINFORCE), Llama-3.1-Nemotron-70B-Reward i HelpSteer2-Preference prompts.",
"nvidia/llama-3.1-nemotron-51b-instruct.description": "Wyjątkowy model językowy zapewniający doskonałą dokładność i wydajność.",
"nvidia/llama-3.1-nemotron-70b-instruct.description": "Llama-3.1-Nemotron-70B-Instruct to dostosowany model NVIDIA zaprojektowany w celu poprawy pomocności odpowiedzi LLM.",
"o1-mini.description": "Mniejszy i szybszy niż o1-preview, o 80% tańszy, doskonały w generowaniu kodu i zadaniach wymagających krótkiego kontekstu.",
"o1-preview.description": "Skoncentrowany na zaawansowanym rozumowaniu i rozwiązywaniu złożonych problemów, w tym matematycznych i naukowych. Idealny do zastosowań wymagających głębokiego zrozumienia kontekstu i autonomicznych przepływów pracy.",
"o1-mini.description": "o1-mini to szybki, opłacalny model rozumowania zaprojektowany do kodowania, matematyki i nauki. Ma 128K kontekstu i datę odcięcia wiedzy w październiku 2023.",
"o1-preview.description": "o1 to nowy model rozumowania OpenAI do złożonych zadań wymagających szerokiej wiedzy. Ma 128K kontekstu i datę odcięcia wiedzy w październiku 2023.",
"o1-pro.description": "Seria o1 została wytrenowana z użyciem uczenia przez wzmocnienie, aby myśleć przed udzieleniem odpowiedzi i radzić sobie ze złożonym rozumowaniem. o1-pro wykorzystuje więcej zasobów obliczeniowych dla głębszego myślenia i zapewnia konsekwentnie wyższą jakość odpowiedzi.",
"o1.description": "o1 to nowy model rozumowania OpenAI z wejściem tekstowym i obrazowym oraz wyjściem tekstowym, przeznaczony do złożonych zadań wymagających szerokiej wiedzy. Posiada okno kontekstu 200K i datę odcięcia wiedzy z października 2023.",
"o3-2025-04-16.description": "o3 to nowy model rozumowania OpenAI z wejściem tekstowym i obrazowym oraz wyjściem tekstowym, przeznaczony do złożonych zadań wymagających szerokiej wiedzy.",
@@ -1022,7 +1027,6 @@
"qianfan-check-vl.description": "Qianfan Check VL to multimodalny model do przeglądu treści, oceniający zgodność obrazów i tekstów oraz wykonujący zadania rozpoznawania.",
"qianfan-composition.description": "Qianfan Composition to multimodalny model twórczy do zrozumienia i generowania treści łączących obrazy i tekst.",
"qianfan-engcard-vl.description": "Qianfan EngCard VL to multimodalny model rozpoznawania skoncentrowany na scenariuszach w języku angielskim.",
"qianfan-lightning-128b-a19b.description": "Qianfan Lightning 128B A19B to wysokowydajny chiński model ogólnego przeznaczenia do złożonego odpowiadania na pytania i rozumowania na dużą skalę.",
"qianfan-llama-vl-8b.description": "Qianfan Llama VL 8B to multimodalny model oparty na Llama, przeznaczony do ogólnego zrozumienia obrazów i tekstu.",
"qianfan-multipicocr.description": "Qianfan MultiPicOCR to model OCR do wielu obrazów, wykrywający i rozpoznający tekst na różnych obrazach.",
"qianfan-qi-vl.description": "Qianfan QI VL to multimodalny model QA do precyzyjnego wyszukiwania i odpowiadania na pytania w złożonych scenariuszach obraz-tekst.",
@@ -1032,7 +1036,6 @@
"qvq-72b-preview.description": "QVQ-72B-Preview to eksperymentalny model badawczy od Qwen, skoncentrowany na ulepszonym rozumowaniu wizualnym.",
"qvq-max.description": "Model rozumowania wizualnego Qwen QVQ obsługuje wejścia wizualne i wyjścia w formie łańcucha myśli, oferując lepsze wyniki w matematyce, kodowaniu, analizie wizualnej, twórczości i zadaniach ogólnych.",
"qvq-plus.description": "Model rozumowania wizualnego z wejściem wizualnym i wyjściem w formie łańcucha myśli. Seria qvq-plus kontynuuje qvq-max, oferując szybsze rozumowanie przy lepszym stosunku jakości do kosztu.",
"qwen-3-32b.description": "Qwen 3 32B: silny w zadaniach wielojęzycznych i programistycznych, odpowiedni do średnioskalowej produkcji.",
"qwen-coder-plus.description": "Model kodowania Qwen.",
"qwen-coder-turbo-latest.description": "Model kodowania Qwen.",
"qwen-coder-turbo.description": "Model kodowania Qwen.",
@@ -1128,7 +1131,6 @@
"qwen3-coder-next.description": "Następna generacja kodera Qwen zoptymalizowana pod kątem złożonego generowania kodu wieloplikowego, debugowania i wysokowydajnych przepływów pracy agentów. Zaprojektowana z myślą o silnej integracji narzędzi i ulepszonej wydajności rozumowania.",
"qwen3-coder-plus.description": "Model kodujący Qwen. Najnowsza seria Qwen3-Coder oparta jest na Qwen3 i oferuje zaawansowane możliwości agenta kodującego, korzystania z narzędzi i interakcji ze środowiskiem do autonomicznego programowania, z doskonałą wydajnością kodu i solidnymi zdolnościami ogólnymi.",
"qwen3-coder:480b.description": "Wysokowydajny model Alibaba do zadań agenta i kodowania z długim kontekstem.",
"qwen3-max-2026-01-23.description": "Modele Qwen3 Max oferują znaczne ulepszenia względem serii 2.5 w zakresie ogólnych zdolności, rozumienia języka chińskiego i angielskiego, realizacji złożonych instrukcji, zadań subiektywnych i otwartych, wielojęzyczności oraz korzystania z narzędzi, przy mniejszej liczbie halucynacji. Najnowszy qwen3-max poprawia programowanie agentowe i użycie narzędzi względem wersji qwen3-max-preview. Wydanie to osiąga poziom SOTA i odpowiada na bardziej złożone potrzeby agentów.",
"qwen3-max-preview.description": "Najlepszy model Qwen do złożonych, wieloetapowych zadań. Wersja podglądowa obsługuje myślenie.",
"qwen3-max.description": "Modele Qwen3 Max oferują znaczne ulepszenia względem serii 2.5 w zakresie ogólnych zdolności, rozumienia chińskiego/angielskiego, złożonych instrukcji, zadań otwartych, wielojęzyczności i korzystania z narzędzi, z mniejszą liczbą halucynacji. Najnowszy qwen3-max poprawia programowanie agentowe i korzystanie z narzędzi względem qwen3-max-preview. Wersja ta osiąga SOTA w swojej klasie i jest przeznaczona do bardziej złożonych potrzeb agentów.",
"qwen3-next-80b-a3b-instruct.description": "Nowej generacji otwartoźródłowy model Qwen3 bez myślenia. W porównaniu do poprzedniej wersji (Qwen3-235B-A22B-Instruct-2507) oferuje lepsze rozumienie chińskiego, silniejsze rozumowanie logiczne i ulepszone generowanie tekstu.",
@@ -1145,7 +1147,8 @@
"qwen3-vl-flash.description": "Qwen3 VL Flash: lekka, szybka wersja rozumująca do zadań wrażliwych na opóźnienia lub o dużym wolumenie.",
"qwen3-vl-plus.description": "Qwen VL to model generowania tekstu z rozumieniem wizji. Potrafi wykonywać OCR, podsumowywać i rozumować, np. wyodrębniać atrybuty ze zdjęć produktów lub rozwiązywać problemy na podstawie obrazów.",
"qwen3.5-397b-a17b.description": "Obsługuje wejścia tekstowe, obrazowe i wideo. W przypadku zadań tekstowych jego wydajność jest porównywalna z Qwen3 Max, oferując wyższą efektywność i niższe koszty. W zakresie możliwości multimodalnych oferuje znaczące ulepszenia w porównaniu z serią Qwen3 VL.",
"qwen3.5-plus.description": "Qwen3.5 Plus obsługuje wejścia tekstowe, obrazowe i wideo. W przypadku zadań tekstowych jego wydajność jest porównywalna z Qwen3 Max, oferując wyższą efektywność i niższe koszty. W zakresie możliwości multimodalnych oferuje znaczące ulepszenia w porównaniu z serią Qwen3 VL.",
"qwen3.5-plus.description": "Qwen3.5 Plus obsługuje tekst, obraz i wideo jako dane wejściowe. Jego wydajność w zadaniach tekstowych jest porównywalna z Qwen3 Max, z lepszą wydajnością i niższymi kosztami. Jego możliwości multimodalne są znacznie ulepszone w porównaniu do serii Qwen3 VL.",
"qwen3.5:397b.description": "Qwen3.5 to zunifikowany model podstawowy wizja-język z hybrydową architekturą (Mixture-of-Experts + uwaga liniowa), oferujący silne rozumowanie multimodalne, kodowanie i zdolności do pracy z długim kontekstem z oknem kontekstowym 256K.",
"qwen3.description": "Qwen3 to nowej generacji duży model językowy Alibaba o wysokiej wydajności w różnych zastosowaniach.",
"qwq-32b-preview.description": "QwQ to eksperymentalny model badawczy z serii Qwen, skoncentrowany na ulepszonym rozumowaniu.",
"qwq-32b.description": "QwQ to model rozumowania z rodziny Qwen. W porównaniu do standardowych modeli dostrojonych instrukcyjnie, oferuje zaawansowane myślenie i rozumowanie, co znacząco poprawia wydajność w zadaniach złożonych. QwQ-32B to model średniej wielkości, konkurujący z czołowymi modelami rozumowania, takimi jak DeepSeek-R1 i o1-mini.",
@@ -1187,7 +1190,7 @@
"step-2-16k.description": "Obsługuje interakcje z dużym kontekstem dla złożonych dialogów.",
"step-2-mini.description": "Zbudowany na nowej architekturze MFA attention, oferuje wyniki podobne do Step-1 przy znacznie niższych kosztach, wyższej przepustowości i szybszym czasie odpowiedzi. Obsługuje zadania ogólne z silnymi zdolnościami kodowania.",
"step-2x-large.description": "Nowej generacji model obrazowy StepFun skoncentrowany na generowaniu obrazów, tworzący wysokiej jakości obrazy z promptów tekstowych. Oferuje bardziej realistyczne tekstury i lepsze renderowanie tekstu chińskiego/angielskiego.",
"step-3.5-flash.description": "Flagowy model rozumowania językowego od Stepfun. Model ten oferuje najwyższej klasy zdolności rozumowania wraz z szybkim i niezawodnym wykonaniem. Potrafi rozkładać i planować złożone zadania, szybko i niezawodnie wywoływać narzędzia do ich realizacji oraz wyróżnia się w logicznym rozumowaniu, matematyce, inżynierii oprogramowania, głębokich badaniach i innych zaawansowanych zadaniach. Długość kontekstu wynosi 256K.",
"step-3.5-flash.description": "Flagowy model rozumowania językowego Stepfun. Model ten ma najwyższej klasy zdolności rozumowania i szybkie oraz niezawodne możliwości wykonawcze. Potrafi rozkładać i planować złożone zadania, szybko i niezawodnie wywoływać narzędzia do wykonywania zadań oraz być kompetentnym w różnych złożonych zadaniach, takich jak rozumowanie logiczne, matematyka, inżynieria oprogramowania i dogłębne badania.",
"step-3.description": "Model o silnej percepcji wizualnej i złożonym rozumowaniu, dokładnie radzący sobie z rozumieniem wiedzy międzydziedzinowej, analizą matematyczno-wizualną i szerokim zakresem codziennych zadań wizualnych.",
"step-r1-v-mini.description": "Model rozumowania z silnym rozumieniem obrazów, przetwarza obrazy i tekst, a następnie generuje tekst po głębokim rozumowaniu. Doskonale radzi sobie z rozumowaniem wizualnym i osiąga najwyższy poziom w matematyce, kodowaniu i rozumowaniu tekstowym, z oknem kontekstu 100K.",
"stepfun-ai/step3.description": "Step3 to nowoczesny model rozumowania multimodalnego od StepFun, oparty na architekturze MoE z 321 miliardami parametrów ogółem i 38 miliardami aktywnych. Jego kompleksowa konstrukcja minimalizuje koszty dekodowania, zapewniając jednocześnie najwyższy poziom rozumienia wizualno-językowego. Dzięki projektowi MFA i AFD pozostaje wydajny zarówno na flagowych, jak i budżetowych akceleratorach. Wstępne trenowanie obejmuje ponad 20 bilionów tokenów tekstowych i 4 biliony tokenów obraz-tekst w wielu językach. Osiąga czołowe wyniki wśród otwartych modeli w zadaniach matematycznych, kodowaniu i benchmarkach multimodalnych.",
@@ -1276,10 +1279,11 @@
"z-ai/glm4.7.description": "GLM-4.7 to najnowszy flagowy model Zhipu, ulepszony pod kątem scenariuszy kodowania agentów z poprawionymi zdolnościami kodowania.",
"z-ai/glm5.description": "GLM-5 to nowy flagowy model bazowy Zhipu AI do inżynierii agentów, osiągający otwartoźródłową wydajność SOTA w kodowaniu i zdolnościach agentów. Dorównuje wydajnością Claude Opus 4.5.",
"z-image-turbo.description": "Z-Image to lekki model generowania obrazów z tekstu, który może szybko tworzyć obrazy, obsługuje renderowanie tekstu w języku chińskim i angielskim oraz elastycznie dostosowuje się do różnych rozdzielczości i proporcji.",
"zai-glm-4.7.description": "Ten model dostarcza silną wydajność kodowania z zaawansowanymi zdolnościami rozumowania, lepszym wykorzystaniem narzędzi i ulepszoną wydajnością w rzeczywistych zastosowaniach kodowania agentowego.",
"zai-org/GLM-4.5-Air.description": "GLM-4.5-Air to bazowy model dla aplikacji agentowych, oparty na architekturze Mixture-of-Experts. Zoptymalizowany do korzystania z narzędzi, przeglądania internetu, inżynierii oprogramowania i kodowania frontendowego. Integruje się z agentami kodu, takimi jak Claude Code i Roo Code. Wykorzystuje hybrydowe rozumowanie do obsługi zarówno złożonych, jak i codziennych scenariuszy.",
"zai-org/GLM-4.5.description": "GLM-4.5 to bazowy model stworzony dla aplikacji agentowych, oparty na architekturze Mixture-of-Experts. Głęboko zoptymalizowany do korzystania z narzędzi, przeglądania internetu, inżynierii oprogramowania i kodowania frontendowego. Integruje się z agentami kodu, takimi jak Claude Code i Roo Code. Wykorzystuje hybrydowe rozumowanie do obsługi zarówno złożonych, jak i codziennych scenariuszy.",
"zai-org/GLM-4.5V.description": "GLM-4.5V to najnowszy VLM Zhipu AI, oparty na flagowym modelu tekstowym GLM-4.5-Air (106B parametrów ogółem, 12B aktywnych) z architekturą MoE zapewniającą wysoką wydajność przy niższych kosztach. Podąża ścieżką GLM-4.1V-Thinking i dodaje 3D-RoPE dla lepszego rozumienia przestrzeni 3D. Zoptymalizowany poprzez pretrening, SFT i RL, obsługuje obrazy, wideo i długie dokumenty, zajmując czołowe miejsca wśród otwartych modeli w 41 publicznych benchmarkach multimodalnych. Przełącznik trybu Thinking pozwala użytkownikom balansować między szybkością a głębokością analizy.",
"zai-org/GLM-4.6.description": "W porównaniu do GLM-4.5, GLM-4.6 rozszerza kontekst z 128K do 200K, umożliwiając realizację bardziej złożonych zadań agentowych. Osiąga lepsze wyniki w benchmarkach kodu i wykazuje wyższą skuteczność w aplikacjach takich jak Claude Code, Cline, Roo Code i Kilo Code, w tym lepsze generowanie stron frontendowych. Ulepszono rozumowanie oraz obsługę narzędzi w trakcie rozumowania, co wzmacnia ogólne możliwości. Lepsza integracja z frameworkami agentowymi, usprawnione działanie agentów narzędziowych i wyszukiwawczych oraz bardziej naturalny styl pisania i odgrywania ról preferowany przez użytkowników.",
"zai-org/GLM-4.6V.description": "GLM-4.6V osiąga SOTA w precyzji rozumienia wizualnego w tej samej skali parametrów i po raz pierwszy w architekturze modelu natywnie integruje zdolność Function Call (wywoływanie narzędzi), łącząc 'percepcję wizualną' z 'wykonywalnym działaniem (Action)', tworząc jednolitą podstawę technologiczną dla multimodalnych Agentów w rzeczywistych scenariuszach biznesowych.",
"zai/glm-4.5-air.description": "GLM-4.5 i GLM-4.5-Air to nasze najnowsze flagowe modele dla aplikacji agentowych, oba oparte na architekturze MoE. GLM-4.5 ma 355B parametrów ogółem i 32B aktywnych na jedno przejście; GLM-4.5-Air jest lżejszy 106B ogółem i 12B aktywnych.",
"zai/glm-4.5.description": "Seria GLM-4.5 została zaprojektowana z myślą o agentach. Flagowy model GLM-4.5 łączy rozumowanie, kodowanie i umiejętności agentowe, posiada 355B parametrów ogółem (32B aktywnych) i oferuje dwa tryby działania jako system hybrydowego rozumowania.",
"zai/glm-4.5v.description": "GLM-4.5V bazuje na GLM-4.5-Air, dziedzicząc sprawdzone techniki GLM-4.1V-Thinking i skalując się dzięki silnej architekturze MoE z 106 miliardami parametrów.",
+14
View File
@@ -24,6 +24,20 @@
"builtins.lobe-agent-builder.inspector.noResults": "Brak wyników",
"builtins.lobe-agent-builder.inspector.togglePlugin": "Przełącz",
"builtins.lobe-agent-builder.title": "Ekspert Budowy Agenta",
"builtins.lobe-agent-management.apiName.callAgent": "Zadzwoń do agenta",
"builtins.lobe-agent-management.apiName.createAgent": "Utwórz agenta",
"builtins.lobe-agent-management.apiName.deleteAgent": "Usuń agenta",
"builtins.lobe-agent-management.apiName.searchAgent": "Wyszukaj agentów",
"builtins.lobe-agent-management.apiName.updateAgent": "Zaktualizuj agenta",
"builtins.lobe-agent-management.inspector.callAgent.sync": "Dzwonienie:",
"builtins.lobe-agent-management.inspector.callAgent.task": "Przypisywanie zadania do:",
"builtins.lobe-agent-management.inspector.createAgent.title": "Tworzenie agenta:",
"builtins.lobe-agent-management.inspector.searchAgent.all": "Wyszukaj agentów:",
"builtins.lobe-agent-management.inspector.searchAgent.market": "Wyszukaj rynek:",
"builtins.lobe-agent-management.inspector.searchAgent.results": "{{count}} wyników",
"builtins.lobe-agent-management.inspector.searchAgent.user": "Wyszukaj moich agentów:",
"builtins.lobe-agent-management.inspector.updateAgent.title": "Aktualizowanie agenta:",
"builtins.lobe-agent-management.title": "Menedżer Agentów",
"builtins.lobe-cloud-sandbox.apiName.editLocalFile": "Edytuj plik",
"builtins.lobe-cloud-sandbox.apiName.executeCode": "Wykonaj kod",
"builtins.lobe-cloud-sandbox.apiName.exportFile": "Eksportuj plik",
+3
View File
@@ -724,6 +724,9 @@
"tools.builtins.lobe-artifacts.description": "Twórz i podglądaj na żywo interaktywne komponenty UI, wizualizacje danych, wykresy, grafikę SVG i aplikacje internetowe. Twórz bogate treści wizualne, z którymi użytkownicy mogą bezpośrednio wchodzić w interakcję.",
"tools.builtins.lobe-artifacts.readme": "Twórz i podglądaj na żywo interaktywne komponenty UI, wizualizacje danych, wykresy, grafiki SVG oraz aplikacje internetowe. Twórz bogate treści wizualne, z którymi użytkownicy mogą wchodzić w interakcję bezpośrednio.",
"tools.builtins.lobe-artifacts.title": "Artefakty",
"tools.builtins.lobe-calculator.description": "Wykonuj obliczenia matematyczne, rozwiązuj równania i pracuj z wyrażeniami symbolicznymi",
"tools.builtins.lobe-calculator.readme": "Zaawansowany kalkulator matematyczny obsługujący podstawową arytmetykę, równania algebraiczne, operacje rachunku różniczkowego i matematyki symbolicznej. Obejmuje konwersję podstaw, rozwiązywanie równań, różniczkowanie, całkowanie i więcej.",
"tools.builtins.lobe-calculator.title": "Kalkulator",
"tools.builtins.lobe-cloud-sandbox.description": "Uruchamiaj kod w Pythonie, JavaScripcie i TypeScripcie w izolowanym środowisku chmurowym. Wykonuj polecenia powłoki, zarządzaj plikami, przeszukuj treści za pomocą wyrażeń regularnych i bezpiecznie eksportuj wyniki.",
"tools.builtins.lobe-cloud-sandbox.readme": "Uruchamiaj kod w Pythonie, JavaScript i TypeScript w izolowanym środowisku chmurowym. Wykonuj polecenia powłoki, zarządzaj plikami, przeszukuj treści za pomocą wyrażeń regularnych i bezpiecznie eksportuj wyniki.",
"tools.builtins.lobe-cloud-sandbox.title": "Piaskownica w chmurze",
+6 -2
View File
@@ -224,15 +224,18 @@
"providerModels.item.modelConfig.extendParams.options.gpt5_2ProReasoningEffort.hint": "Para a série GPT-5.2 Pro; controla a intensidade do raciocínio.",
"providerModels.item.modelConfig.extendParams.options.gpt5_2ReasoningEffort.hint": "Para a série GPT-5.2; controla a intensidade do raciocínio.",
"providerModels.item.modelConfig.extendParams.options.imageAspectRatio.hint": "Para modelos de geração de imagem Gemini; controla a proporção da imagem gerada.",
"providerModels.item.modelConfig.extendParams.options.imageAspectRatio2.hint": "Para Nano Banana 2; controla a proporção de aspecto das imagens geradas (suporta extra-largo 1:4, 4:1, 1:8, 8:1).",
"providerModels.item.modelConfig.extendParams.options.imageResolution.hint": "Para modelos de geração de imagem Gemini 3; controla a resolução das imagens geradas.",
"providerModels.item.modelConfig.extendParams.options.imageResolution2.hint": "Para modelos Gemini 3.1 Flash Image; controla a resolução das imagens geradas (suporta 512px).",
"providerModels.item.modelConfig.extendParams.options.reasoningBudgetToken.hint": "Para Claude, Qwen3 e similares; controla o orçamento de tokens para raciocínio.",
"providerModels.item.modelConfig.extendParams.options.reasoningEffort.hint": "Para modelos da OpenAI e outros com capacidade de raciocínio; controla o esforço de raciocínio.",
"providerModels.item.modelConfig.extendParams.options.textVerbosity.hint": "Para a série GPT-5+; controla a verbosidade da saída.",
"providerModels.item.modelConfig.extendParams.options.thinking.hint": "Para alguns modelos Doubao; permite que o modelo decida se deve pensar profundamente.",
"providerModels.item.modelConfig.extendParams.options.thinkingBudget.hint": "Para a série Gemini; controla o orçamento de pensamento.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel.hint": "Para modelos Gemini 3 Flash Preview; controla a profundidade do pensamento.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel2.hint": "Para modelos Gemini 3 Pro Preview; controla a profundidade do pensamento.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel.hint": "Para modelos Gemini 3 Flash Preview; controla a profundidade de pensamento.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel2.hint": "Para modelos Gemini 3 Pro Preview; controla a profundidade de pensamento.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel3.hint": "Para modelos Gemini 3.1 Pro Preview; controla a profundidade de pensamento com níveis baixo/médio/alto.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel4.hint": "Para modelos Gemini 3.1 Flash Image; alterna o pensamento ligado/desligado.",
"providerModels.item.modelConfig.extendParams.options.urlContext.hint": "Para a série Gemini; permite fornecer contexto via URL.",
"providerModels.item.modelConfig.extendParams.placeholder": "Selecione os parâmetros estendidos a serem ativados",
"providerModels.item.modelConfig.extendParams.previewFallback": "Pré-visualização indisponível",
@@ -311,6 +314,7 @@
"providerModels.tabs.image": "Imagem",
"providerModels.tabs.stt": "ASR",
"providerModels.tabs.tts": "TTS",
"providerModels.tabs.video": "Vídeo",
"sortModal.success": "Ordenação atualizada com sucesso",
"sortModal.title": "Ordem Personalizada",
"sortModal.update": "Atualizar",
+35 -31
View File
@@ -55,7 +55,8 @@
"FLUX.1-dev.description": "FLUX.1-dev é um modelo de linguagem multimodal de código aberto (MLLM) do Black Forest Labs, otimizado para tarefas de imagem e texto, combinando compreensão e geração de imagem/texto. Baseado em LLMs avançados (como Mistral-7B), utiliza um codificador visual cuidadosamente projetado e ajuste de instruções em múltiplas etapas para permitir coordenação multimodal e raciocínio em tarefas complexas.",
"Gryphe/MythoMax-L2-13b.description": "MythoMax-L2 (13B) é um modelo inovador para diversos domínios e tarefas complexas.",
"HelloMeme.description": "HelloMeme é uma ferramenta de IA que gera memes, GIFs ou vídeos curtos a partir de imagens ou movimentos fornecidos. Não requer habilidades de desenho ou programação—basta uma imagem de referência para criar conteúdo divertido, atrativo e estilisticamente consistente.",
"HiDream-I1-Full.description": "HiDream-E1-Full é um modelo de edição de imagem multimodal de código aberto da HiDream.ai, baseado em uma arquitetura Diffusion Transformer avançada e forte compreensão de linguagem (com LLaMA 3.1-8B-Instruct embutido). Suporta geração de imagens guiada por linguagem natural, transferência de estilo, edições locais e repintura, com excelente compreensão e execução imagem-texto.",
"HiDream-E1-Full.description": "HiDream-E1-Full é um modelo de edição de imagens multimodal de código aberto da HiDream.ai, baseado em uma arquitetura avançada de Transformer de Difusão e com forte compreensão de linguagem (LLaMA 3.1-8B-Instruct embutido). Ele suporta geração de imagens orientada por linguagem natural, transferência de estilo, edições locais e repintura, com excelente compreensão e execução de texto e imagem.",
"HiDream-I1-Full.description": "HiDream-I1 é um novo modelo base de geração de imagens de código aberto lançado pela HiDream. Com 17 bilhões de parâmetros (Flux possui 12 bilhões), ele pode oferecer qualidade de imagem líder na indústria em segundos.",
"HunyuanDiT-v1.2-Diffusers-Distilled.description": "hunyuandit-v1.2-distilled é um modelo leve de texto para imagem otimizado via destilação para gerar imagens de alta qualidade rapidamente, especialmente adequado para ambientes com poucos recursos e geração em tempo real.",
"InstantCharacter.description": "InstantCharacter é um modelo de geração de personagens personalizados sem necessidade de ajuste, lançado pela Tencent AI em 2025, com foco em geração de personagens de alta fidelidade e consistência entre cenários. Pode modelar um personagem a partir de uma única imagem de referência e transferi-lo com flexibilidade entre estilos, ações e cenários.",
"InternVL2-8B.description": "InternVL2-8B é um poderoso modelo visão-linguagem que suporta processamento multimodal de imagem e texto, reconhecendo com precisão o conteúdo visual e gerando descrições ou respostas relevantes.",
@@ -80,7 +81,7 @@
"MiniMax-M2.1.description": "MiniMax-M2.1 é o principal modelo open-source da MiniMax, focado em resolver tarefas complexas do mundo real. Seus principais pontos fortes são as capacidades de programação multilíngue e a habilidade de atuar como um Agente para resolver tarefas complexas.",
"MiniMax-M2.5-Lightning.description": "M2.5 Lightning: Mesma performance, mais rápido e ágil (aprox. 100 tps).",
"MiniMax-M2.5-highspeed.description": "Mesma performance do M2.5 com inferência significativamente mais rápida.",
"MiniMax-M2.5.description": "Desempenho de alto nível e custo-benefício excepcional, lidando facilmente com tarefas complexas (aprox. 60 tps).",
"MiniMax-M2.5.description": "MiniMax-M2.5 é um modelo de grande porte de código aberto da MiniMax, focado em resolver tarefas complexas do mundo real. Seus principais pontos fortes são as capacidades de programação multilíngue e a habilidade de resolver tarefas complexas como um Agente.",
"MiniMax-M2.description": "Desenvolvido especificamente para codificação eficiente e fluxos de trabalho com agentes",
"MiniMax-Text-01.description": "O MiniMax-01 introduz atenção linear em larga escala além dos Transformers clássicos, com 456 bilhões de parâmetros e 45,9 bilhões ativados por passagem. Alcança desempenho de ponta e suporta até 4 milhões de tokens de contexto (32× GPT-4o, 20× Claude-3.5-Sonnet).",
"MiniMaxAI/MiniMax-M1-80k.description": "MiniMax-M1 é um modelo de raciocínio com pesos abertos, atenção híbrida em larga escala, com 456 bilhões de parâmetros totais e ~45,9 bilhões ativos por token. Suporta nativamente 1 milhão de tokens de contexto e utiliza Flash Attention para reduzir FLOPs em 75% na geração de 100 mil tokens em comparação com o DeepSeek R1. Com arquitetura MoE, CISPO e treinamento com atenção híbrida via RL, atinge desempenho líder em raciocínio com entradas longas e tarefas reais de engenharia de software.",
@@ -98,6 +99,7 @@
"Phi-3.5-mini-instruct.description": "Uma versão atualizada do modelo Phi-3-mini.",
"Phi-3.5-vision-instrust.description": "Uma versão atualizada do modelo Phi-3-vision.",
"Pro/MiniMaxAI/MiniMax-M2.1.description": "MiniMax-M2.1 é um modelo de linguagem de código aberto otimizado para capacidades de agentes, com excelência em programação, uso de ferramentas, seguimento de instruções e planejamento de longo prazo. O modelo oferece suporte ao desenvolvimento de software multilíngue e à execução de fluxos de trabalho complexos em várias etapas, alcançando uma pontuação de 74,0 no SWE-bench Verified e superando o Claude Sonnet 4.5 em cenários multilíngues.",
"Pro/MiniMaxAI/MiniMax-M2.5.description": "MiniMax-M2.5 é o mais recente modelo de linguagem de grande porte desenvolvido pela MiniMax, treinado por meio de aprendizado por reforço em larga escala em centenas de milhares de ambientes complexos do mundo real. Com uma arquitetura MoE e 229 bilhões de parâmetros, ele alcança desempenho líder na indústria em tarefas como programação, uso de ferramentas por agentes, busca e cenários de escritório.",
"Pro/Qwen/Qwen2-7B-Instruct.description": "Qwen2-7B-Instruct é um LLM de 7 bilhões de parâmetros ajustado para instruções da série Qwen2. Utiliza arquitetura Transformer com SwiGLU, viés QKV na atenção e atenção com consultas agrupadas, lidando com entradas grandes. Apresenta forte desempenho em compreensão de linguagem, geração, tarefas multilíngues, codificação, matemática e raciocínio, superando a maioria dos modelos abertos e competindo com modelos proprietários. Supera o Qwen1.5-7B-Chat em vários benchmarks.",
"Pro/Qwen/Qwen2.5-7B-Instruct.description": "Qwen2.5-7B-Instruct faz parte da mais recente série de LLMs da Alibaba Cloud. O modelo de 7 bilhões traz ganhos notáveis em codificação e matemática, suporta mais de 29 idiomas e melhora o seguimento de instruções, compreensão de dados estruturados e geração de saídas estruturadas (especialmente JSON).",
"Pro/Qwen/Qwen2.5-Coder-7B-Instruct.description": "Qwen2.5-Coder-7B-Instruct é o mais recente LLM da Alibaba Cloud focado em código. Baseado no Qwen2.5 e treinado com 5,5 trilhões de tokens, melhora significativamente a geração, raciocínio e correção de código, mantendo pontos fortes em matemática e capacidades gerais, oferecendo uma base sólida para agentes de codificação.",
@@ -107,13 +109,13 @@
"Pro/deepseek-ai/DeepSeek-R1-Distill-Qwen-7B.description": "DeepSeek-R1-Distill-Qwen-7B é destilado do Qwen2.5-Math-7B e ajustado com 800 mil amostras curadas do DeepSeek-R1. Apresenta desempenho forte, com 92,8% no MATH-500, 55,5% no AIME 2024 e uma pontuação de 1189 no CodeForces para um modelo de 7B.",
"Pro/deepseek-ai/DeepSeek-R1.description": "DeepSeek-R1 é um modelo de raciocínio orientado por RL que reduz repetições e melhora a legibilidade. Utiliza dados de início a frio antes do RL para impulsionar ainda mais o raciocínio, iguala o OpenAI-o1 em tarefas de matemática, código e raciocínio, e melhora os resultados gerais por meio de treinamento cuidadoso.",
"Pro/deepseek-ai/DeepSeek-V3.1-Terminus.description": "DeepSeek-V3.1-Terminus é uma versão atualizada do modelo V3.1, posicionado como um LLM híbrido para agentes. Corrige problemas relatados por usuários e melhora a estabilidade, consistência linguística e reduz caracteres anormais e mistura de chinês/inglês. Integra modos de pensamento e não-pensamento com templates de chat para alternância flexível. Também melhora o desempenho dos agentes de código e de busca para uso mais confiável de ferramentas e tarefas em múltiplas etapas.",
"Pro/deepseek-ai/DeepSeek-V3.2-Exp.description": "DeepSeek-V3.2-Exp é uma versão experimental da série V3.2 que faz a ponte para a próxima arquitetura. Adiciona DeepSeek Sparse Attention (DSA) sobre o V3.1-Terminus para melhorar o treinamento e a inferência com contexto longo, com otimizações para uso de ferramentas, compreensão de documentos longos e raciocínio em múltiplas etapas. Ideal para explorar maior eficiência de raciocínio com orçamentos de contexto amplos.",
"Pro/deepseek-ai/DeepSeek-V3.2.description": "DeepSeek-V3.2 é um modelo que combina alta eficiência computacional com excelente desempenho em raciocínio e como Agente. Sua abordagem é baseada em três avanços tecnológicos principais: DeepSeek Sparse Attention (DSA), um mecanismo de atenção eficiente que reduz significativamente a complexidade computacional enquanto mantém o desempenho do modelo, otimizado especificamente para cenários de longo contexto; uma estrutura escalável de aprendizado por reforço, através da qual o desempenho do modelo pode rivalizar com o GPT-5, e sua versão de alta computação pode igualar o Gemini-3.0-Pro em capacidades de raciocínio; e um pipeline de síntese de tarefas de Agente em larga escala, projetado para integrar capacidades de raciocínio em cenários de uso de ferramentas, melhorando o seguimento de instruções e a generalização em ambientes interativos complexos. O modelo alcançou desempenho medalha de ouro na Olimpíada Internacional de Matemática (IMO) e na Olimpíada Internacional de Informática (IOI) de 2025.",
"Pro/deepseek-ai/DeepSeek-V3.description": "DeepSeek-V3 é um modelo MoE com 671 bilhões de parâmetros, utilizando MLA e DeepSeekMoE com balanceamento de carga sem perdas para inferência e treinamento eficientes. Pré-treinado com 14,8 trilhões de tokens de alta qualidade e ajustado com SFT e RL, supera outros modelos abertos e se aproxima dos modelos fechados líderes.",
"Pro/moonshotai/Kimi-K2-Instruct-0905.description": "Kimi K2-Instruct-0905 é o mais novo e poderoso modelo Kimi K2. Trata-se de um modelo MoE de alto nível com 1 trilhão de parâmetros totais e 32 bilhões de parâmetros ativos. Seus principais recursos incluem inteligência de codificação agentica aprimorada, com ganhos significativos em benchmarks e tarefas reais de agentes, além de melhorias na estética e usabilidade da codificação de frontend.",
"Pro/moonshotai/Kimi-K2-Thinking.description": "Kimi K2 Thinking Turbo é a variante Turbo otimizada para velocidade de raciocínio e rendimento, mantendo o raciocínio em múltiplas etapas e o uso de ferramentas do K2 Thinking. É um modelo MoE com aproximadamente 1 trilhão de parâmetros totais, contexto nativo de 256K e chamadas de ferramentas em larga escala estáveis para cenários de produção com exigências mais rigorosas de latência e concorrência.",
"Pro/moonshotai/Kimi-K2.5.description": "Kimi K2.5 é um modelo agente multimodal nativo open-source, baseado no Kimi-K2-Base, treinado com aproximadamente 1,5 trilhão de tokens mistos de visão e texto. O modelo adota uma arquitetura MoE com 1 trilhão de parâmetros totais e 32 bilhões de parâmetros ativos, suportando uma janela de contexto de 256K, integrando perfeitamente capacidades de compreensão visual e linguística.",
"Pro/zai-org/glm-4.7.description": "GLM-4.7 é o modelo carro-chefe de nova geração da Zhipu, com 355 bilhões de parâmetros totais e 32 bilhões de parâmetros ativos, totalmente aprimorado em diálogo geral, raciocínio e capacidades de agente. O GLM-4.7 aprimora o Pensamento Intercalado e introduz o Pensamento Preservado e o Pensamento por Turno.",
"Pro/zai-org/glm-5.description": "GLM-5 é o novo modelo de linguagem avançado lançado pela Zhipu, focado em engenharia de sistemas complexos e tarefas de Agente de longo prazo. Os parâmetros do modelo foram expandidos para 744B (40B ativos) e integram DeepSeek Sparse Attention.",
"Pro/zai-org/glm-5.description": "GLM-5 é o modelo de linguagem de próxima geração da Zhipu, focado em engenharia de sistemas complexos e tarefas de Agente de longa duração. Os parâmetros do modelo foram expandidos para 744 bilhões (40 bilhões ativos) e integram DeepSeek Sparse Attention.",
"QwQ-32B-Preview.description": "Qwen QwQ é um modelo de pesquisa experimental focado em aprimorar o raciocínio.",
"Qwen/QVQ-72B-Preview.description": "QVQ-72B-Preview é um modelo de pesquisa da Qwen focado em raciocínio visual, com pontos fortes em compreensão de cenas complexas e problemas visuais de matemática.",
"Qwen/QwQ-32B-Preview.description": "Qwen QwQ é um modelo de pesquisa experimental focado em aprimorar o raciocínio da IA.",
@@ -137,7 +139,7 @@
"Qwen/Qwen3-14B.description": "Qwen3 é um modelo Tongyi Qwen de nova geração com avanços significativos em raciocínio, capacidade geral, habilidades de agente e desempenho multilíngue, além de suportar a alternância entre modos de pensamento.",
"Qwen/Qwen3-235B-A22B-Instruct-2507.description": "Qwen3-235B-A22B-Instruct-2507 é o modelo MoE carro-chefe da série Qwen3, com 235 bilhões de parâmetros totais e 22 bilhões ativos. Esta versão não-pensante foi atualizada com foco em seguir instruções, raciocínio lógico, compreensão de texto, matemática, ciências, programação e uso de ferramentas. Também amplia o conhecimento multilíngue de cauda longa e se alinha melhor às preferências dos usuários em tarefas subjetivas e abertas.",
"Qwen/Qwen3-235B-A22B-Thinking-2507.description": "Qwen3-235B-A22B-Thinking-2507 é um modelo Qwen3 voltado para raciocínio complexo e desafiador. Utiliza uma arquitetura MoE com 235 bilhões de parâmetros totais e cerca de 22 bilhões ativos por token, otimizando a eficiência. Como modelo dedicado ao pensamento, apresenta grandes avanços em lógica, matemática, ciências, programação e benchmarks acadêmicos, atingindo desempenho de ponta em raciocínio aberto. Também melhora a execução de instruções, uso de ferramentas e geração de texto, com suporte nativo a contexto de 256K para raciocínio profundo e documentos longos.",
"Qwen/Qwen3-235B-A22B.description": "Qwen3 é um modelo Tongyi Qwen de nova geração com avanços significativos em raciocínio, capacidade geral, habilidades de agente e desempenho multilíngue, além de suportar a alternância entre modos de pensamento.",
"Qwen/Qwen3-235B-A22B.description": "Qwen3 235B A22B é o modelo ultra-escalável Qwen3 que oferece capacidade de IA de ponta.",
"Qwen/Qwen3-30B-A3B-Instruct-2507.description": "Qwen3-30B-A3B-Instruct-2507 é a versão não-pensante atualizada do Qwen3-30B-A3B. É um modelo MoE com 30,5 bilhões de parâmetros totais e 3,3 bilhões ativos. Apresenta melhorias significativas em seguir instruções, raciocínio lógico, compreensão de texto, matemática, ciências, programação e uso de ferramentas, além de expandir o conhecimento multilíngue de cauda longa e alinhar-se melhor às preferências dos usuários em tarefas abertas e subjetivas. Suporta contexto de 256K. Este modelo é exclusivamente não-pensante e não gera tags `<think></think>`.",
"Qwen/Qwen3-30B-A3B-Thinking-2507.description": "Qwen3-30B-A3B-Thinking-2507 é o mais recente modelo de pensamento da série Qwen3. É um modelo MoE com 30,5 bilhões de parâmetros totais e 3,3 bilhões ativos, focado em tarefas complexas. Apresenta avanços significativos em lógica, matemática, ciências, programação e benchmarks acadêmicos, além de melhorias em seguir instruções, uso de ferramentas, geração de texto e alinhamento com preferências. Suporta nativamente contexto de 256K e pode ser estendido para até 1 milhão de tokens. Esta versão é projetada para modo de pensamento, com raciocínio detalhado passo a passo e fortes capacidades de agente.",
"Qwen/Qwen3-30B-A3B.description": "Qwen3 é um modelo Tongyi Qwen de nova geração com avanços significativos em raciocínio, capacidade geral, habilidades de agente e desempenho multilíngue, além de suportar a alternância entre modos de pensamento.",
@@ -315,7 +317,6 @@
"codeqwen.description": "CodeQwen1.5 é um modelo de linguagem grande treinado com uma ampla base de dados de código, projetado para tarefas complexas de programação.",
"codestral-latest.description": "Codestral é nosso modelo de codificação mais avançado; a versão v2 (jan 2025) é voltada para tarefas de baixa latência e alta frequência como FIM, correção de código e geração de testes.",
"codestral.description": "Codestral é o primeiro modelo de código da Mistral AI, oferecendo suporte robusto à geração de código.",
"codex-mini-latest.description": "codex-mini-latest é um modelo o4-mini ajustado para o Codex CLI. Para uso direto via API, recomendamos começar com o gpt-4.1.",
"cogito-2.1:671b.description": "Cogito v2.1 671B é um modelo de linguagem grande de código aberto dos EUA, gratuito para uso comercial, com desempenho comparável aos melhores modelos, maior eficiência de raciocínio por token, contexto longo de 128k e capacidade geral robusta.",
"cogview-3-flash.description": "CogView-3-Flash é um modelo gratuito de geração de imagens lançado pela Zhipu. Ele gera imagens que estão alinhadas com as instruções do usuário, ao mesmo tempo em que alcança pontuações mais altas de qualidade estética. O CogView-3-Flash é amplamente utilizado em áreas como criação artística, referência de design, desenvolvimento de jogos e realidade virtual, ajudando os usuários a converter rapidamente descrições de texto em imagens.",
"cogview-4.description": "CogView-4 é o primeiro modelo de texto para imagem de código aberto da Zhipu que pode gerar caracteres chineses. Ele melhora a compreensão semântica, a qualidade da imagem e a renderização de texto em chinês/inglês, suporta prompts bilíngues de qualquer comprimento e pode gerar imagens em qualquer resolução dentro de faixas especificadas.",
@@ -342,7 +343,7 @@
"command-light-nightly.description": "Para reduzir o intervalo entre grandes lançamentos, oferecemos versões noturnas do Command. Na série command-light, essa versão é chamada de command-light-nightly. É a versão mais recente e experimental (e potencialmente instável), atualizada regularmente sem aviso prévio, portanto não é recomendada para ambientes de produção.",
"command-light.description": "Uma variante menor e mais rápida do Command, quase tão capaz quanto, mas com maior velocidade.",
"command-nightly.description": "Para reduzir o intervalo entre grandes lançamentos, oferecemos versões noturnas do Command. Na série Command, essa versão é chamada de command-nightly. É a versão mais recente e experimental (e potencialmente instável), atualizada regularmente sem aviso prévio, portanto não é recomendada para ambientes de produção.",
"command-r-03-2024.description": "O Command R é um modelo de chat que segue instruções, com maior qualidade, confiabilidade e uma janela de contexto mais longa do que os modelos anteriores. Suporta fluxos de trabalho complexos como geração de código, RAG, uso de ferramentas e agentes.",
"command-r-03-2024.description": "command-r é um modelo de chat orientado por instruções que realiza tarefas de linguagem com maior qualidade, confiabilidade aprimorada e contexto mais longo do que modelos anteriores. Ele suporta fluxos de trabalho complexos, como geração de código, RAG, uso de ferramentas e agentes.",
"command-r-08-2024.description": "command-r-08-2024 é uma versão atualizada do modelo Command R, lançada em agosto de 2024.",
"command-r-plus-04-2024.description": "command-r-plus é um alias de command-r-plus-04-2024, portanto, ao usar command-r-plus na API, você estará acessando esse modelo.",
"command-r-plus-08-2024.description": "O Command R+ é um modelo de chat que segue instruções, com maior qualidade, confiabilidade e uma janela de contexto mais longa do que os modelos anteriores. É ideal para fluxos de trabalho RAG complexos e uso de ferramentas em múltiplas etapas.",
@@ -366,7 +367,8 @@
"deepseek-ai/DeepSeek-V2.5.description": "O DeepSeek-V2.5 aprimora os modelos DeepSeek-V2-Chat e DeepSeek-Coder-V2-Instruct, combinando habilidades gerais e de programação. Melhora a escrita e o seguimento de instruções para melhor alinhamento de preferências, com ganhos significativos no AlpacaEval 2.0, ArenaHard, AlignBench e MT-Bench.",
"deepseek-ai/DeepSeek-V3.1-Terminus.description": "O DeepSeek-V3.1-Terminus é uma versão atualizada do modelo V3.1, posicionado como um LLM híbrido com foco em agentes. Corrige problemas relatados por usuários e melhora a estabilidade, consistência linguística e reduz caracteres anômalos e mistura de idiomas. Integra modos de pensamento e não-pensamento com templates de chat para alternância flexível. Também aprimora o desempenho dos agentes de código e busca para uso mais confiável de ferramentas e tarefas em múltiplas etapas.",
"deepseek-ai/DeepSeek-V3.1.description": "O DeepSeek V3.1 utiliza uma arquitetura de raciocínio híbrida e suporta modos de pensamento e não-pensamento.",
"deepseek-ai/DeepSeek-V3.2-Exp.description": "O DeepSeek-V3.2-Exp é uma versão experimental do V3.2 que faz a ponte para a próxima arquitetura. Adiciona DeepSeek Sparse Attention (DSA) sobre o V3.1-Terminus para melhorar o treinamento e inferência em contextos longos, com otimizações para uso de ferramentas, compreensão de documentos longos e raciocínio em múltiplas etapas. Ideal para explorar maior eficiência de raciocínio com grandes orçamentos de contexto.",
"deepseek-ai/DeepSeek-V3.2-Exp.description": "DeepSeek V3.2 Exp utiliza uma arquitetura de raciocínio híbrida e suporta modos de pensamento e não-pensamento.",
"deepseek-ai/DeepSeek-V3.2.description": "DeepSeek-V3.2 é um modelo que combina alta eficiência computacional com excelente desempenho em raciocínio e como Agente. Sua abordagem é baseada em três avanços tecnológicos principais: DeepSeek Sparse Attention (DSA), um mecanismo de atenção eficiente que reduz significativamente a complexidade computacional enquanto mantém o desempenho do modelo, otimizado especificamente para cenários de longo contexto; uma estrutura escalável de aprendizado por reforço, através da qual o desempenho do modelo pode rivalizar com o GPT-5, e sua versão de alta computação pode igualar o Gemini-3.0-Pro em capacidades de raciocínio; e um pipeline de síntese de tarefas de Agente em larga escala, projetado para integrar capacidades de raciocínio em cenários de uso de ferramentas, melhorando o seguimento de instruções e a generalização em ambientes interativos complexos. O modelo alcançou desempenho medalha de ouro na Olimpíada Internacional de Matemática (IMO) e na Olimpíada Internacional de Informática (IOI) de 2025.",
"deepseek-ai/DeepSeek-V3.description": "O DeepSeek-V3 é um modelo MoE com 671 bilhões de parâmetros, utilizando MLA e DeepSeekMoE com balanceamento de carga sem perdas para treinamento e inferência eficientes. Pré-treinado com 14,8 trilhões de tokens de alta qualidade, com SFT e RL, supera outros modelos abertos e se aproxima dos modelos fechados líderes.",
"deepseek-ai/deepseek-llm-67b-chat.description": "O DeepSeek LLM Chat (67B) é um modelo inovador que oferece compreensão profunda da linguagem e interação.",
"deepseek-ai/deepseek-v3.1-terminus.description": "O DeepSeek V3.1 é um modelo de raciocínio de nova geração com raciocínio complexo mais forte e cadeia de pensamento para tarefas de análise profunda.",
@@ -433,6 +435,7 @@
"deepseek_r1_distill_llama_70b.description": "DeepSeek-R1-Distill-Llama-70B é destilado do Llama-3.3-70B-Instruct. Como parte da série DeepSeek-R1, é ajustado com amostras geradas pelo DeepSeek-R1 e apresenta forte desempenho em matemática, programação e raciocínio.",
"deepseek_r1_distill_qwen_14b.description": "DeepSeek-R1-Distill-Qwen-14B é destilado do Qwen2.5-14B e ajustado com 800 mil amostras selecionadas geradas pelo DeepSeek-R1, oferecendo raciocínio robusto.",
"deepseek_r1_distill_qwen_32b.description": "DeepSeek-R1-Distill-Qwen-32B é destilado do Qwen2.5-32B e ajustado com 800 mil amostras selecionadas geradas pelo DeepSeek-R1, destacando-se em matemática, programação e raciocínio.",
"devstral-2512.description": "Devstral 2 é um modelo de texto em nível empresarial que se destaca no uso de ferramentas para explorar bases de código, editar múltiplos arquivos e alimentar agentes de engenharia de software.",
"devstral-2:123b.description": "O Devstral 2 123B se destaca no uso de ferramentas para explorar bases de código, editar múltiplos arquivos e oferecer suporte a agentes de engenharia de software.",
"doubao-1.5-lite-32k.description": "O Doubao-1.5-lite é um novo modelo leve com resposta ultrarrápida, oferecendo qualidade e latência de alto nível.",
"doubao-1.5-pro-256k.description": "O Doubao-1.5-pro-256k é uma atualização abrangente do Doubao-1.5-Pro, com melhoria de 10% no desempenho geral. Suporta uma janela de contexto de 256k e até 12k tokens de saída, oferecendo maior desempenho, janela expandida e excelente custo-benefício para casos de uso mais amplos.",
@@ -546,10 +549,10 @@
"gemini-2.5-pro-preview-06-05.description": "Gemini 2.5 Pro Preview é o modelo de raciocínio mais avançado do Google, capaz de raciocinar sobre código, matemática e problemas STEM, além de analisar grandes conjuntos de dados, bases de código e documentos com contexto longo.",
"gemini-2.5-pro.description": "Gemini 2.5 Pro é o modelo de raciocínio mais avançado do Google, capaz de raciocinar sobre código, matemática e problemas STEM, além de analisar grandes conjuntos de dados, bases de código e documentos com contexto longo.",
"gemini-3-flash-preview.description": "Gemini 3 Flash é o modelo mais inteligente desenvolvido para velocidade, combinando inteligência de ponta com excelente fundamentação em buscas.",
"gemini-3-pro-image-preview.description": "Gemini 3 Pro Image (Nano Banana Pro) é o modelo de geração de imagens do Google, com suporte a conversas multimodais.",
"gemini-3-pro-image-preview.description": "Gemini 3 Pro Image (Nano Banana Pro) é o modelo de geração de imagens do Google que também suporta diálogo multimodal.",
"gemini-3-pro-image-preview:image.description": "Gemini 3 Pro Image (Nano Banana Pro) é o modelo de geração de imagens do Google e também oferece suporte a chat multimodal.",
"gemini-3-pro-preview.description": "Gemini 3 Pro é o agente mais poderoso do Google, com capacidades de codificação emocional e visuais aprimoradas, além de raciocínio de última geração.",
"gemini-3.1-flash-image-preview.description": "Gemini 3.1 Flash Image (Nano Banana 2) oferece qualidade de imagem em nível profissional com velocidade Flash e suporte a chat multimodal.",
"gemini-3.1-flash-image-preview.description": "Gemini 3.1 Flash Image (Nano Banana 2) é o modelo de geração de imagens nativo mais rápido do Google, com suporte a raciocínio, geração e edição de imagens conversacionais.",
"gemini-3.1-flash-image-preview:image.description": "Gemini 3.1 Flash Image (Nano Banana 2) oferece qualidade de imagem em nível profissional com velocidade Flash e suporte a chat multimodal.",
"gemini-3.1-pro-preview.description": "Gemini 3.1 Pro Preview melhora o Gemini 3 Pro com capacidades de raciocínio aprimoradas e adiciona suporte a nível médio de pensamento.",
"gemini-flash-latest.description": "Última versão do Gemini Flash",
@@ -605,19 +608,15 @@
"google/gemini-2.0-flash-lite-001.description": "Gemini 2.0 Flash Lite é uma variante leve do Gemini com raciocínio desativado por padrão para melhorar latência e custo, podendo ser ativado via parâmetros.",
"google/gemini-2.0-flash-lite.description": "Gemini 2.0 Flash Lite oferece recursos de nova geração, incluindo velocidade excepcional, uso integrado de ferramentas, geração multimodal e janela de contexto de 1 milhão de tokens.",
"google/gemini-2.0-flash.description": "Gemini 2.0 Flash é o modelo de raciocínio de alto desempenho do Google para tarefas multimodais estendidas.",
"google/gemini-2.5-flash-image-free.description": "Camada gratuita do Gemini 2.5 Flash Image com geração multimodal limitada por cota.",
"google/gemini-2.5-flash-image-preview.description": "Modelo experimental Gemini 2.5 Flash com suporte à geração de imagens.",
"google/gemini-2.5-flash-image.description": "Gemini 2.5 Flash Image (Nano Banana) é o modelo de geração de imagens do Google com suporte a conversas multimodais.",
"google/gemini-2.5-flash-lite.description": "Gemini 2.5 Flash Lite é a variante leve do Gemini 2.5, otimizada para latência e custo, ideal para cenários de alto volume.",
"google/gemini-2.5-flash-preview.description": "Gemini 2.5 Flash é o modelo principal mais avançado do Google, projetado para raciocínio avançado, programação, matemática e ciências. Inclui raciocínio embutido para respostas mais precisas e processamento de contexto refinado.\n\nNota: Este modelo possui duas variantes — com e sem raciocínio. O preço de saída varia significativamente dependendo da ativação do raciocínio.\n\nPara usar o raciocínio e receber tokens de raciocínio, selecione a variante “:thinking”, que possui custo adicional.\n\nO Gemini 2.5 Flash também pode ser configurado via o parâmetro “max reasoning tokens” conforme documentado (https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning).",
"google/gemini-2.5-flash-preview:thinking.description": "Gemini 2.5 Flash é o modelo principal mais avançado do Google, projetado para raciocínio avançado, programação, matemática e ciências. Inclui raciocínio embutido para respostas mais precisas e processamento de contexto refinado.\n\nNota: Este modelo possui duas variantes — com e sem raciocínio. O preço de saída varia significativamente dependendo da ativação do raciocínio.\n\nPara usar o raciocínio e receber tokens de raciocínio, selecione a variante “:thinking”, que possui custo adicional.\n\nO Gemini 2.5 Flash também pode ser configurado via o parâmetro “max reasoning tokens” conforme documentado (https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning).",
"google/gemini-2.5-flash.description": "Gemini 2.5 Flash (Lite/Pro/Flash) é a família de modelos do Google que abrange desde baixa latência até raciocínio de alto desempenho.",
"google/gemini-2.5-pro-free.description": "Camada gratuita do Gemini 2.5 Pro com geração multimodal de contexto longo limitada por cota, ideal para testes e fluxos leves.",
"google/gemini-2.5-flash.description": "Gemini 2.5 Flash é a família do Google que abrange desde baixa latência até raciocínio de alto desempenho.",
"google/gemini-2.5-pro-preview.description": "Gemini 2.5 Pro Preview é o modelo de raciocínio mais avançado do Google para resolver problemas complexos em código, matemática e STEM, além de analisar grandes conjuntos de dados, bases de código e documentos com contexto longo.",
"google/gemini-2.5-pro.description": "Gemini 2.5 Pro é o modelo principal de raciocínio do Google com suporte a contexto longo para tarefas complexas.",
"google/gemini-3-pro-image-preview-free.description": "Camada gratuita do Gemini 3 Pro Image com geração multimodal limitada por cota.",
"google/gemini-3-pro-image-preview.description": "Gemini 3 Pro Image (Nano Banana Pro) é o modelo de geração de imagens do Google com suporte a conversas multimodais.",
"google/gemini-3-pro-preview-free.description": "Gemini 3 Pro Preview Free oferece a mesma compreensão e raciocínio multimodal da versão padrão, mas com limites de cota e taxa, ideal para testes e uso de baixa frequência.",
"google/gemini-3-pro-preview.description": "Gemini 3 Pro é o modelo de raciocínio multimodal de próxima geração da família Gemini, com compreensão de texto, áudio, imagens e vídeo, capaz de lidar com tarefas complexas e grandes bases de código.",
"google/gemini-embedding-001.description": "Modelo de embedding de última geração com desempenho robusto em tarefas em inglês, multilíngues e de código.",
"google/gemini-flash-1.5.description": "Gemini 1.5 Flash oferece processamento multimodal otimizado para uma variedade de tarefas complexas.",
@@ -717,15 +716,24 @@
"hunyuan-a13b.description": "O primeiro modelo de raciocínio híbrido da Hunyuan, atualizado a partir do hunyuan-standard-256K (80B no total, 13B ativos). Opera por padrão em modo de pensamento lento e permite alternância entre rápido/lento via parâmetros ou prefixo /no_think. A capacidade geral foi aprimorada em relação à geração anterior, especialmente em matemática, ciências, compreensão de textos longos e tarefas de agentes.",
"hunyuan-code.description": "O mais recente modelo de código Hunyuan treinado com 200 bilhões de dados de código de alta qualidade e seis meses de dados SFT, com contexto de 8K. Classifica-se próximo ao topo em benchmarks automatizados de código e em avaliações humanas especializadas em cinco idiomas.",
"hunyuan-functioncall.description": "O mais recente modelo MoE FunctionCall da Hunyuan treinado com dados de chamadas de ferramentas de alta qualidade, com uma janela de contexto de 32K e benchmarks líderes em várias dimensões.",
"hunyuan-large-longcontext.description": "Excelente em tarefas de documentos longos, como sumarização e QA, além de lidar com geração geral. Forte em análise e geração de textos longos para conteúdos complexos e detalhados.",
"hunyuan-large.description": "Hunyuan-large possui ~389 bilhões de parâmetros totais e ~52 bilhões ativados, sendo o maior e mais forte modelo MoE aberto em uma arquitetura Transformer.",
"hunyuan-lite.description": "Atualizado para uma arquitetura MoE com janela de contexto de 256K, liderando muitos modelos abertos em benchmarks de NLP, código, matemática e indústria.",
"hunyuan-pro.description": "Modelo MoE com trilhões de parâmetros e contexto longo de 32K, líder em benchmarks, excelente em instruções complexas e raciocínio, matemática avançada, chamadas de função e otimizado para tradução multilíngue, finanças, direito e medicina.",
"hunyuan-role.description": "O mais recente modelo de interpretação de papéis da Hunyuan, ajustado oficialmente com dados de interpretação de papéis, oferecendo desempenho base mais forte em cenários de interpretação.",
"hunyuan-standard-256K.description": "Usa roteamento aprimorado para mitigar o balanceamento de carga e o colapso de especialistas. Texto longo \"agulha no palheiro\" atinge 99,9%. MOE-256K avança ainda mais em comprimento e qualidade, expandindo significativamente o comprimento de entrada.",
"hunyuan-standard.description": "Usa roteamento aprimorado para mitigar o balanceamento de carga e o colapso de especialistas. Texto longo \"agulha no palheiro\" atinge 99,9%. MOE-32K oferece melhor valor enquanto equilibra qualidade e preço para entradas de texto longo.",
"hunyuan-standard-256K.description": "Utiliza roteamento aprimorado para mitigar balanceamento de carga e colapso de especialistas. Alcança 99,9% de precisão em cenários de longo contexto. MOE-256K expande ainda mais o comprimento e a qualidade do contexto.",
"hunyuan-standard.description": "Utiliza roteamento aprimorado para mitigar balanceamento de carga e colapso de especialistas. Alcança 99,9% de precisão em cenários de longo contexto. MOE-32K oferece grande valor enquanto lida com entradas longas.",
"hunyuan-t1-20250321.description": "Desenvolve capacidades equilibradas em artes e STEM com forte captura de informações em textos longos. Suporta respostas de raciocínio para problemas de matemática, lógica, ciência e código em diferentes níveis de dificuldade.",
"hunyuan-t1-20250403.description": "Melhora a geração de código em nível de projeto e a qualidade da escrita, fortalece a compreensão de tópicos em múltiplas interações e o seguimento de instruções ToB, melhora a compreensão de palavras e reduz problemas de saída mista entre chinês simplificado/tradicional e chinês/inglês.",
"hunyuan-t1-20250529.description": "Aprimora a escrita criativa e a composição, fortalece a codificação frontend, o raciocínio matemático e lógico, e melhora o seguimento de instruções.",
"hunyuan-t1-20250711.description": "Melhora significativamente matemática difícil, lógica e codificação, aumenta a estabilidade da saída e aprimora a capacidade de textos longos.",
"hunyuan-t1-latest.description": "Melhora significativamente o modelo de pensamento lento em matemática avançada, raciocínio complexo, programação difícil, seguimento de instruções e qualidade da escrita criativa.",
"hunyuan-t1-vision-20250916.description": "Modelo de raciocínio profundo t1-vision mais recente com grandes avanços em VQA, ancoragem visual, OCR, gráficos, resolução de problemas fotografados e criação baseada em imagem, além de melhor desempenho em inglês e idiomas de poucos recursos.",
"hunyuan-turbo-20241223.description": "Esta versão aumenta a escala de instruções para melhor generalização, melhora significativamente o raciocínio matemático/código/lógico, aprimora a compreensão de palavras e melhora a qualidade da escrita.",
"hunyuan-turbo-latest.description": "Melhorias gerais na experiência de compreensão de PNL, escrita, chat, QA, tradução e domínios; respostas mais humanas, melhor esclarecimento de intenções ambíguas, melhor análise de palavras, maior qualidade criativa e interatividade, e conversas de múltiplas interações mais fortes.",
"hunyuan-turbo.description": "Prévia do LLM de próxima geração da Hunyuan com nova arquitetura MoE, oferecendo raciocínio mais rápido e resultados superiores ao hunyuan-pro.",
"hunyuan-turbos-latest.description": "O mais recente modelo principal Hunyuan TurboS com raciocínio mais forte e melhor experiência geral.",
"hunyuan-turbos-longtext-128k-20250325.description": "Excelente em tarefas de documentos longos, como sumarização e QA, além de lidar com geração geral. Forte em análise e geração de textos longos para conteúdos complexos e detalhados.",
"hunyuan-vision-1.5-instruct.description": "Um modelo de imagem-para-texto de pensamento rápido baseado na base de texto TurboS, mostrando melhorias notáveis em relação à versão anterior no reconhecimento fundamental de imagens e raciocínio de análise de imagens.",
"hunyuan-vision.description": "O mais recente modelo multimodal da Hunyuan que suporta entradas de imagem + texto para gerar texto.",
"image-01-live.description": "Modelo de geração de imagem com detalhes refinados, suportando geração de imagem a partir de texto e estilos controláveis.",
@@ -770,8 +778,7 @@
"kimi-k2:1t.description": "Kimi K2 é um grande modelo MoE LLM da Moonshot AI com 1T de parâmetros totais e 32B ativos por passagem. É otimizado para capacidades de agentes, incluindo uso avançado de ferramentas, raciocínio e síntese de código.",
"kimi-latest.description": "Kimi Latest usa o modelo Kimi mais recente e pode incluir recursos experimentais. Suporta compreensão de imagens e seleciona automaticamente modelos de cobrança 8k/32k/128k com base no comprimento do contexto.",
"kuaishou/kat-coder-pro-v1.description": "KAT-Coder-Pro-V1 (gratuito por tempo limitado) foca em compreensão de código e automação para agentes de codificação eficientes.",
"learnlm-1.5-pro-experimental.description": "LearnLM é um modelo experimental específico para tarefas, treinado com base em princípios da ciência da aprendizagem para seguir instruções do sistema em cenários de ensino/aprendizagem, atuando como um tutor especialista.",
"learnlm-2.0-flash-experimental.description": "LearnLM é um modelo experimental específico para tarefas, treinado com base em princípios da ciência da aprendizagem para seguir instruções do sistema em cenários de ensino/aprendizagem, atuando como um tutor especialista.",
"labs-devstral-small-2512.description": "Devstral Small 2 se destaca no uso de ferramentas para explorar bases de código, editar múltiplos arquivos e alimentar agentes de engenharia de software.",
"lite.description": "Spark Lite é um LLM leve com latência ultrabaixa e processamento eficiente. É totalmente gratuito e suporta busca em tempo real na web. Suas respostas rápidas funcionam bem em dispositivos com pouca capacidade de computação e para ajuste fino de modelos, oferecendo excelente custo-benefício e uma experiência inteligente, especialmente para perguntas e respostas de conhecimento, geração de conteúdo e cenários de busca.",
"llama-3.1-70b-versatile.description": "Llama 3.1 70B oferece raciocínio de IA mais robusto para aplicações complexas, com suporte a computação intensiva com alta eficiência e precisão.",
"llama-3.1-8b-instant.description": "Llama 3.1 8B é um modelo altamente eficiente com geração de texto rápida, ideal para aplicações em larga escala e com bom custo-benefício.",
@@ -782,7 +789,6 @@
"llama-3.2-90b-vision-preview.description": "Llama 3.2 foi projetado para tarefas que combinam visão e texto, com excelência em legendagem de imagens e perguntas e respostas visuais, unindo geração de linguagem e raciocínio visual.",
"llama-3.2-vision-instruct.description": "O modelo Llama 3.2-Vision ajustado por instruções é otimizado para reconhecimento visual, raciocínio com imagens, legendagem e perguntas e respostas visuais em geral.",
"llama-3.3-70b-versatile.description": "Meta Llama 3.3 é um LLM multilíngue com 70B de parâmetros (entrada/saída de texto), oferecendo variantes pré-treinadas e ajustadas por instruções. A versão ajustada por instruções é otimizada para diálogos multilíngues e supera muitos modelos de chat abertos e fechados em benchmarks do setor.",
"llama-3.3-70b.description": "Llama 3.3 70B: um modelo Llama de médio a grande porte que equilibra raciocínio e rendimento.",
"llama-3.3-instruct.description": "O modelo Llama 3.3 ajustado por instruções é otimizado para chat e supera muitos modelos de chat abertos em benchmarks do setor.",
"llama3-70b-8192.description": "Meta Llama 3 70B oferece excelente capacidade de lidar com tarefas complexas para projetos exigentes.",
"llama3-8b-8192.description": "Meta Llama 3 8B oferece desempenho sólido de raciocínio para cenários diversos.",
@@ -832,7 +838,6 @@
"meta-llama/llama-3.1-8b-instruct:free.description": "LLaMA 3.1 oferece suporte multilíngue e é um dos principais modelos generativos.",
"meta-llama/llama-3.2-11b-vision-instruct.description": "LLaMA 3.2 foi projetado para tarefas que combinam visão e texto. Destaca-se em legendagem de imagens e perguntas visuais, unindo geração de linguagem e raciocínio visual.",
"meta-llama/llama-3.2-3b-instruct.description": "meta-llama/llama-3.2-3b-instruct",
"meta-llama/llama-3.2-90b-vision-instruct.description": "LLaMA 3.2 foi projetado para tarefas que combinam visão e texto. Destaca-se em legendagem de imagens e perguntas visuais, unindo geração de linguagem e raciocínio visual.",
"meta-llama/llama-3.3-70b-instruct.description": "Llama 3.3 é o modelo Llama multilíngue de código aberto mais avançado, oferecendo desempenho próximo ao de 405B com custo muito baixo. Baseado em Transformer, aprimorado com SFT e RLHF para utilidade e segurança. A versão ajustada por instruções é otimizada para chat multilíngue e supera muitos modelos abertos e fechados em benchmarks do setor. Corte de conhecimento: dez/2023.",
"meta-llama/llama-3.3-70b-instruct:free.description": "Llama 3.3 é o modelo Llama multilíngue de código aberto mais avançado, oferecendo desempenho próximo ao de 405B com custo muito baixo. Baseado em Transformer, aprimorado com SFT e RLHF para utilidade e segurança. A versão ajustada por instruções é otimizada para chat multilíngue e supera muitos modelos abertos e fechados em benchmarks do setor. Corte de conhecimento: dez/2023.",
"meta.llama3-1-405b-instruct-v1:0.description": "Meta Llama 3.1 405B Instruct é o maior e mais poderoso modelo Llama 3.1 Instruct, altamente avançado para raciocínio em diálogos e geração de dados sintéticos, sendo uma base sólida para pré-treinamento ou ajuste fino em domínios específicos. Os LLMs multilíngues Llama 3.1 são modelos de geração pré-treinados e ajustados por instruções nos tamanhos 8B, 70B e 405B (entrada/saída de texto). Os modelos ajustados por instruções são otimizados para diálogos multilíngues e superam muitos modelos de chat abertos disponíveis em benchmarks da indústria. O Llama 3.1 é projetado para uso comercial e de pesquisa em vários idiomas. Os modelos ajustados por instruções são ideais para chat estilo assistente, enquanto os modelos pré-treinados são adequados para tarefas mais amplas de geração de linguagem natural. As saídas do Llama 3.1 também podem ser usadas para melhorar outros modelos, incluindo geração e refinamento de dados sintéticos. O Llama 3.1 é um modelo Transformer autoregressivo com arquitetura otimizada. As versões ajustadas utilizam ajuste supervisionado (SFT) e aprendizado por reforço com feedback humano (RLHF) para alinhar com preferências humanas de utilidade e segurança.",
@@ -894,7 +899,7 @@
"mistral-large-instruct.description": "Mistral-Large-Instruct-2407 é um LLM denso avançado com 123B parâmetros e raciocínio, conhecimento e programação de última geração.",
"mistral-large-latest.description": "Mistral Large é o modelo principal, com excelente desempenho em tarefas multilíngues, raciocínio complexo e geração de código — ideal para aplicações de alto nível.",
"mistral-large.description": "Mixtral Large é o modelo principal da Mistral, combinando geração de código, matemática e raciocínio com uma janela de contexto de 128K.",
"mistral-medium-latest.description": "Mistral Medium 3 oferece desempenho de ponta com custo 8× menor e facilita a implantação em ambientes corporativos.",
"mistral-medium-latest.description": "Mistral Medium 3.1 oferece desempenho de última geração com custo 8× menor e simplifica a implantação empresarial.",
"mistral-nemo-instruct.description": "Mistral-Nemo-Instruct-2407 é a versão ajustada por instruções do Mistral-Nemo-Base-2407.",
"mistral-nemo.description": "Mistral Nemo é um modelo de alta eficiência com 12B parâmetros, desenvolvido pela Mistral AI e NVIDIA.",
"mistral-small-latest.description": "Mistral Small é uma opção econômica, rápida e confiável para tradução, sumarização e análise de sentimento.",
@@ -933,7 +938,7 @@
"moonshot-v1-auto.description": "Moonshot V1 Auto seleciona o modelo apropriado com base no uso atual de tokens de contexto.",
"moonshotai/Kimi-Dev-72B.description": "Kimi-Dev-72B é um LLM de código open-source otimizado com RL em larga escala para produzir correções robustas e prontas para produção. Alcança 60,4% no SWE-bench Verified, estabelecendo um novo recorde entre modelos abertos para tarefas de engenharia de software automatizada como correção de bugs e revisão de código.",
"moonshotai/Kimi-K2-Instruct-0905.description": "Kimi K2-Instruct-0905 é a versão mais nova e poderosa do Kimi K2. É um modelo MoE de ponta com 1T total e 32B de parâmetros ativos. Os principais recursos incluem inteligência de programação com agentes mais forte, grandes avanços em benchmarks e tarefas reais de agentes, além de melhorias na estética e usabilidade de código frontend.",
"moonshotai/Kimi-K2-Thinking.description": "Kimi K2 Thinking é o modelo de raciocínio open-source mais poderoso até o momento. Ele amplia significativamente a profundidade de raciocínio em múltiplas etapas e mantém o uso estável de ferramentas por 200300 chamadas consecutivas, estabelecendo novos recordes em Humanity's Last Exam (HLE), BrowseComp e outros benchmarks. Destaca-se em programação, matemática, lógica e cenários com agentes. Baseado em arquitetura MoE com ~1T de parâmetros totais, suporta janela de contexto de 256K e chamadas de ferramentas.",
"moonshotai/Kimi-K2-Thinking.description": "Kimi K2 Thinking é o mais recente e poderoso modelo de raciocínio de código aberto. Ele amplia significativamente a profundidade do raciocínio em múltiplas etapas e mantém o uso estável de ferramentas em 200300 chamadas consecutivas, estabelecendo novos recordes no Humanity's Last Exam (HLE), BrowseComp e outros benchmarks. Ele se destaca em cenários de codificação, matemática, lógica e agentes. Construído em uma arquitetura MoE com ~1 trilhão de parâmetros totais, suporta uma janela de contexto de 256K e chamadas de ferramentas.",
"moonshotai/kimi-k2-0711.description": "Kimi K2 0711 é a variante instruct da série Kimi, ideal para geração de código de alta qualidade e uso de ferramentas.",
"moonshotai/kimi-k2-0905.description": "Kimi K2 0905 é uma atualização que amplia o contexto e melhora o desempenho em raciocínio com otimizações para programação.",
"moonshotai/kimi-k2-instruct-0905.description": "O modelo kimi-k2-0905-preview oferece uma janela de contexto de 256k, com codificação mais autônoma, código frontend mais refinado e prático, e melhor compreensão de contexto.",
@@ -948,8 +953,8 @@
"nvidia/Llama-3.1-Nemotron-70B-Instruct-HF.description": "Llama 3.1 Nemotron 70B é um LLM personalizado da NVIDIA para melhorar a utilidade. Apresenta desempenho superior nos benchmarks Arena Hard, AlpacaEval 2 LC e GPT-4-Turbo MT-Bench, ocupando o 1º lugar em todos os três benchmarks de autoalinhamento em 1º de outubro de 2024. Treinado a partir do Llama-3.1-70B-Instruct usando RLHF (REINFORCE), Llama-3.1-Nemotron-70B-Reward e prompts HelpSteer2-Preference.",
"nvidia/llama-3.1-nemotron-51b-instruct.description": "Modelo de linguagem distinto com precisão e eficiência excepcionais.",
"nvidia/llama-3.1-nemotron-70b-instruct.description": "Llama-3.1-Nemotron-70B-Instruct é um modelo personalizado da NVIDIA projetado para melhorar a utilidade das respostas de LLMs.",
"o1-mini.description": "Menor e mais rápido que o o1-preview, com custo 80% menor, forte em geração de código e tarefas de contexto curto.",
"o1-preview.description": "Focado em raciocínio avançado e resolução de problemas complexos, incluindo matemática e ciência. Ideal para aplicações que exigem compreensão profunda de contexto e fluxos de trabalho autônomos.",
"o1-mini.description": "o1-mini é um modelo de raciocínio rápido e econômico projetado para codificação, matemática e ciência. Possui contexto de 128K e um limite de conhecimento de outubro de 2023.",
"o1-preview.description": "o1 é o novo modelo de raciocínio da OpenAI para tarefas complexas que exigem amplo conhecimento. Possui contexto de 128K e um limite de conhecimento de outubro de 2023.",
"o1-pro.description": "A série o1 é treinada com aprendizado por reforço para pensar antes de responder e lidar com raciocínio complexo. O o1-pro usa mais recursos computacionais para raciocínio mais profundo e respostas consistentemente melhores.",
"o1.description": "o1 é o novo modelo de raciocínio da OpenAI com entrada de texto+imagem e saída de texto, adequado para tarefas complexas que exigem amplo conhecimento. Possui janela de contexto de 200K e corte de conhecimento em outubro de 2023.",
"o3-2025-04-16.description": "o3 é o novo modelo de raciocínio da OpenAI com entrada de texto+imagem e saída de texto para tarefas complexas que exigem amplo conhecimento.",
@@ -1022,7 +1027,6 @@
"qianfan-check-vl.description": "Qianfan Check VL é um modelo de revisão de conteúdo multimodal para conformidade e reconhecimento de imagem-texto.",
"qianfan-composition.description": "Qianfan Composition é um modelo de criação multimodal para compreensão e geração mista de imagem e texto.",
"qianfan-engcard-vl.description": "Qianfan EngCard VL é um modelo de reconhecimento multimodal focado em cenários em inglês.",
"qianfan-lightning-128b-a19b.description": "Qianfan Lightning 128B A19B é um modelo chinês de alto desempenho para perguntas e respostas complexas e raciocínio em larga escala.",
"qianfan-llama-vl-8b.description": "Qianfan Llama VL 8B é um modelo multimodal baseado em Llama para compreensão geral de imagem e texto.",
"qianfan-multipicocr.description": "Qianfan MultiPicOCR é um modelo de OCR para múltiplas imagens, detectando e reconhecendo texto em várias imagens.",
"qianfan-qi-vl.description": "Qianfan QI VL é um modelo de perguntas e respostas multimodal para recuperação precisa e respostas em cenários complexos de imagem e texto.",
@@ -1032,7 +1036,6 @@
"qvq-72b-preview.description": "QVQ-72B-Preview é um modelo experimental da Qwen focado em aprimorar o raciocínio visual.",
"qvq-max.description": "O modelo de raciocínio visual Qwen QVQ aceita entrada visual e gera saídas com cadeia de raciocínio, com desempenho superior em matemática, programação, análise visual, criatividade e tarefas gerais.",
"qvq-plus.description": "Modelo de raciocínio visual com entrada de imagem e saída com cadeia de raciocínio. A série qvq-plus sucede a qvq-max, oferecendo raciocínio mais rápido com melhor equilíbrio entre qualidade e custo.",
"qwen-3-32b.description": "Qwen 3 32B: forte em tarefas multilíngues e de programação, adequado para uso em produção de médio porte.",
"qwen-coder-plus.description": "Modelo de código Qwen.",
"qwen-coder-turbo-latest.description": "Modelo de código Qwen.",
"qwen-coder-turbo.description": "Modelo de código Qwen.",
@@ -1128,7 +1131,6 @@
"qwen3-coder-next.description": "Próxima geração do codificador Qwen otimizado para geração de código complexo em múltiplos arquivos, depuração e fluxos de trabalho de agentes de alta produtividade. Projetado para forte integração de ferramentas e desempenho de raciocínio aprimorado.",
"qwen3-coder-plus.description": "Modelo de código Qwen. A série Qwen3-Coder mais recente é baseada no Qwen3 e oferece fortes habilidades de agente de codificação, uso de ferramentas e interação com o ambiente para programação autônoma, com excelente desempenho de código e sólida capacidade geral.",
"qwen3-coder:480b.description": "Modelo de alto desempenho da Alibaba com suporte a contexto longo para tarefas de agente e codificação.",
"qwen3-max-2026-01-23.description": "Os modelos Qwen3 Max apresentam grandes avanços em relação à série 2.5 em capacidade geral, compreensão de chinês/inglês, seguimento de instruções complexas, tarefas subjetivas abertas, habilidade multilíngue e uso de ferramentas, com menos alucinações. A versão mais recente do qwen3-max melhora a programação agente e o uso de ferramentas em relação ao qwen3-max-preview. Este lançamento atinge o SOTA da área e atende a necessidades mais complexas de agentes.",
"qwen3-max-preview.description": "Modelo Qwen com melhor desempenho para tarefas complexas e de múltiplas etapas. A prévia oferece suporte a raciocínio.",
"qwen3-max.description": "Os modelos Qwen3 Max apresentam grandes avanços em relação à série 2.5 em capacidade geral, compreensão de chinês/inglês, seguimento de instruções complexas, tarefas subjetivas abertas, capacidade multilíngue e uso de ferramentas, com menos alucinações. O qwen3-max mais recente melhora a programação agente e o uso de ferramentas em relação ao qwen3-max-preview. Esta versão atinge o estado da arte e atende a necessidades mais complexas de agentes.",
"qwen3-next-80b-a3b-instruct.description": "Modelo Qwen3 de próxima geração, de código aberto e sem raciocínio. Em comparação com a versão anterior (Qwen3-235B-A22B-Instruct-2507), possui melhor compreensão do chinês, raciocínio lógico mais forte e geração de texto aprimorada.",
@@ -1145,7 +1147,8 @@
"qwen3-vl-flash.description": "Qwen3 VL Flash: versão leve e de raciocínio rápido para solicitações com baixa latência ou alto volume.",
"qwen3-vl-plus.description": "Qwen VL é um modelo de geração de texto com compreensão visual. Pode realizar OCR, além de resumir e raciocinar, como extrair atributos de fotos de produtos ou resolver problemas a partir de imagens.",
"qwen3.5-397b-a17b.description": "Suporta entradas de texto, imagem e vídeo. Para tarefas apenas de texto, seu desempenho é comparável ao Qwen3 Max, oferecendo maior eficiência e menor custo. Em capacidades multimodais, oferece melhorias significativas em relação à série Qwen3 VL.",
"qwen3.5-plus.description": "Qwen3.5 Plus suporta entradas de texto, imagem e vídeo. Para tarefas apenas de texto, seu desempenho é comparável ao Qwen3 Max, enquanto oferece melhor eficiência e menor custo. Em termos de capacidades multimodais, apresenta melhorias significativas em relação à série Qwen3 VL.",
"qwen3.5-plus.description": "Qwen3.5 Plus suporta entrada de texto, imagem e vídeo. Seu desempenho em tarefas puramente textuais é comparável ao Qwen3 Max, com melhor desempenho e menor custo. Suas capacidades multimodais são significativamente aprimoradas em comparação com a série Qwen3 VL.",
"qwen3.5:397b.description": "Qwen3.5 é um modelo de base unificada visão-linguagem com uma arquitetura híbrida (Mixture-of-Experts + atenção linear), oferecendo forte raciocínio multimodal, codificação e capacidades de longo contexto com uma janela de contexto de 256K.",
"qwen3.description": "Qwen3 é o modelo de linguagem de próxima geração da Alibaba com desempenho robusto em diversos casos de uso.",
"qwq-32b-preview.description": "QwQ é um modelo de pesquisa experimental da Qwen focado em raciocínio aprimorado.",
"qwq-32b.description": "QwQ é um modelo de raciocínio da família Qwen. Em comparação com modelos ajustados por instruções padrão, oferece raciocínio e pensamento que aumentam significativamente o desempenho em tarefas complexas. O QwQ-32B é um modelo de raciocínio de porte médio que rivaliza com os principais modelos como DeepSeek-R1 e o1-mini.",
@@ -1187,7 +1190,7 @@
"step-2-16k.description": "Suporta interações com contexto amplo para diálogos complexos.",
"step-2-mini.description": "Baseado na arquitetura de atenção MFA de próxima geração, oferece resultados semelhantes ao Step-1 com custo muito menor, maior rendimento e menor latência. Lida com tarefas gerais com forte capacidade de programação.",
"step-2x-large.description": "Modelo de imagem StepFun de nova geração focado em geração de imagens, produzindo imagens de alta qualidade a partir de prompts de texto. Oferece texturas mais realistas e melhor renderização de texto em chinês/inglês.",
"step-3.5-flash.description": "O modelo de raciocínio linguístico carro-chefe da Stepfun. Este modelo oferece capacidades de raciocínio de alto nível junto com execução rápida e confiável. Ele pode decompor e planejar tarefas complexas, invocar ferramentas rapidamente e de forma confiável para realizá-las, e se destacar em raciocínio lógico, matemática, engenharia de software, pesquisa profunda e outras tarefas sofisticadas. O comprimento do contexto é de 256K.",
"step-3.5-flash.description": "O modelo de raciocínio linguístico carro-chefe da Stepfun. Este modelo possui capacidades de raciocínio de alto nível e execução rápida e confiável. Capaz de decompor e planejar tarefas complexas, chamar ferramentas de forma rápida e confiável para realizar tarefas, e ser competente em várias tarefas complexas, como raciocínio lógico, matemática, engenharia de software e pesquisa aprofundada.",
"step-3.description": "Este modelo possui forte percepção visual e raciocínio complexo, lidando com precisão com compreensão de conhecimento entre domínios, análise cruzada de matemática e visão, e uma ampla gama de tarefas visuais do cotidiano.",
"step-r1-v-mini.description": "Modelo de raciocínio com forte compreensão de imagem que pode processar imagens e textos, gerando texto após raciocínio profundo. Destaca-se em raciocínio visual e oferece desempenho de ponta em matemática, programação e raciocínio textual, com janela de contexto de 100K.",
"stepfun-ai/step3.description": "Step3 é um modelo de raciocínio multimodal de ponta da StepFun, baseado em arquitetura MoE com 321B de parâmetros totais e 38B ativos. Seu design de ponta a ponta minimiza o custo de decodificação enquanto entrega raciocínio visão-linguagem de alto nível. Com design MFA e AFD, mantém eficiência tanto em aceleradores topo de linha quanto de entrada. Pré-treinado com mais de 20T de tokens de texto e 4T de tokens imagem-texto em vários idiomas. Alcança desempenho líder entre modelos abertos em benchmarks de matemática, código e multimodalidade.",
@@ -1276,10 +1279,11 @@
"z-ai/glm4.7.description": "GLM-4.7 é o mais recente modelo carro-chefe da Zhipu, aprimorado para cenários de Codificação Agente com capacidades de codificação melhoradas.",
"z-ai/glm5.description": "GLM-5 é o novo modelo base carro-chefe da Zhipu AI para engenharia de agentes, alcançando desempenho SOTA de código aberto em capacidades de codificação e agentes. Ele iguala o desempenho do Claude Opus 4.5.",
"z-image-turbo.description": "Z-Image é um modelo leve de geração de texto-para-imagem que pode produzir rapidamente imagens, suporta renderização de texto em chinês e inglês e se adapta de forma flexível a múltiplas resoluções e proporções de aspecto.",
"zai-glm-4.7.description": "Este modelo oferece forte desempenho em codificação com capacidades avançadas de raciocínio, uso superior de ferramentas e desempenho aprimorado no mundo real em aplicações de codificação agentiva.",
"zai-org/GLM-4.5-Air.description": "GLM-4.5-Air é um modelo base para aplicações com agentes, utilizando uma arquitetura Mixture-of-Experts. Ele é otimizado para uso de ferramentas, navegação na web, engenharia de software e codificação frontend, e integra-se com agentes de código como Claude Code e Roo Code. Utiliza raciocínio híbrido para lidar tanto com cenários complexos quanto com situações do dia a dia.",
"zai-org/GLM-4.5.description": "GLM-4.5 é um modelo base desenvolvido para aplicações com agentes, utilizando uma arquitetura Mixture-of-Experts. É profundamente otimizado para uso de ferramentas, navegação na web, engenharia de software e codificação frontend, e integra-se com agentes de código como Claude Code e Roo Code. Utiliza raciocínio híbrido para lidar com raciocínios complexos e situações cotidianas.",
"zai-org/GLM-4.5V.description": "GLM-4.5V é o mais recente VLM da Zhipu AI, baseado no modelo de texto principal GLM-4.5-Air (106B no total, 12B ativos), com uma arquitetura MoE que oferece alto desempenho a um custo reduzido. Segue a linha de desenvolvimento do GLM-4.1V-Thinking e adiciona 3D-RoPE para melhorar o raciocínio espacial em 3D. Otimizado por meio de pré-treinamento, SFT e RL, lida com imagens, vídeos e documentos longos, e está entre os melhores modelos abertos em 41 benchmarks multimodais públicos. Um modo de alternância de raciocínio permite ao usuário equilibrar velocidade e profundidade.",
"zai-org/GLM-4.6.description": "Comparado ao GLM-4.5, o GLM-4.6 expande o contexto de 128K para 200K para tarefas de agentes mais complexas. Apresenta pontuações mais altas em benchmarks de código e desempenho superior em aplicações reais como Claude Code, Cline, Roo Code e Kilo Code, incluindo melhor geração de páginas frontend. O raciocínio foi aprimorado e o uso de ferramentas é suportado durante o processo, fortalecendo a capacidade geral. Integra-se melhor a frameworks de agentes, melhora agentes de busca/ferramentas e apresenta estilo de escrita mais natural e preferido por humanos, além de maior naturalidade em simulações de papéis.",
"zai-org/GLM-4.6V.description": "GLM-4.6V atinge precisão SOTA em compreensão visual para modelos de escala semelhante e, pela primeira vez, integra nativamente a capacidade de Function Call (chamada de ferramentas) na arquitetura do modelo visual, conectando a cadeia de \"percepção visual\" a \"ação executável\". Isso fornece uma base técnica unificada para agentes multimodais em cenários de negócios reais.",
"zai/glm-4.5-air.description": "GLM-4.5 e GLM-4.5-Air são nossos modelos principais mais recentes para aplicações com agentes, ambos utilizando MoE. O GLM-4.5 possui 355B no total e 32B ativos por passagem; o GLM-4.5-Air é mais enxuto, com 106B no total e 12B ativos.",
"zai/glm-4.5.description": "A série GLM-4.5 foi projetada para agentes. O modelo principal GLM-4.5 combina raciocínio, codificação e habilidades de agente com 355B de parâmetros totais (32B ativos) e oferece modos de operação duplos como um sistema de raciocínio híbrido.",
"zai/glm-4.5v.description": "GLM-4.5V é baseado no GLM-4.5-Air, herdando técnicas comprovadas do GLM-4.1V-Thinking e escalando com uma robusta arquitetura MoE de 106B parâmetros.",
+14
View File
@@ -24,6 +24,20 @@
"builtins.lobe-agent-builder.inspector.noResults": "Nenhum resultado",
"builtins.lobe-agent-builder.inspector.togglePlugin": "Alternar",
"builtins.lobe-agent-builder.title": "Especialista em Criação de Agentes",
"builtins.lobe-agent-management.apiName.callAgent": "Agente de chamada",
"builtins.lobe-agent-management.apiName.createAgent": "Criar agente",
"builtins.lobe-agent-management.apiName.deleteAgent": "Excluir agente",
"builtins.lobe-agent-management.apiName.searchAgent": "Pesquisar agentes",
"builtins.lobe-agent-management.apiName.updateAgent": "Atualizar agente",
"builtins.lobe-agent-management.inspector.callAgent.sync": "Chamando:",
"builtins.lobe-agent-management.inspector.callAgent.task": "Atribuindo tarefa para:",
"builtins.lobe-agent-management.inspector.createAgent.title": "Criando agente:",
"builtins.lobe-agent-management.inspector.searchAgent.all": "Pesquisar agentes:",
"builtins.lobe-agent-management.inspector.searchAgent.market": "Pesquisar mercado:",
"builtins.lobe-agent-management.inspector.searchAgent.results": "{{count}} resultados",
"builtins.lobe-agent-management.inspector.searchAgent.user": "Pesquisar meus agentes:",
"builtins.lobe-agent-management.inspector.updateAgent.title": "Atualizando agente:",
"builtins.lobe-agent-management.title": "Gerenciador de Agentes",
"builtins.lobe-cloud-sandbox.apiName.editLocalFile": "Editar arquivo",
"builtins.lobe-cloud-sandbox.apiName.executeCode": "Executar código",
"builtins.lobe-cloud-sandbox.apiName.exportFile": "Exportar arquivo",
+3
View File
@@ -724,6 +724,9 @@
"tools.builtins.lobe-artifacts.description": "Gere e visualize em tempo real componentes de interface interativos, visualizações de dados, gráficos, imagens SVG e aplicações web. Crie conteúdos visuais ricos com os quais os usuários possam interagir diretamente.",
"tools.builtins.lobe-artifacts.readme": "Gere e visualize em tempo real componentes de interface interativos, visualizações de dados, gráficos, gráficos SVG e aplicações web. Crie conteúdos visuais ricos com os quais os usuários possam interagir diretamente.",
"tools.builtins.lobe-artifacts.title": "Artefatos",
"tools.builtins.lobe-calculator.description": "Realize cálculos matemáticos, resolva equações e trabalhe com expressões simbólicas",
"tools.builtins.lobe-calculator.readme": "Calculadora matemática avançada que suporta aritmética básica, equações algébricas, operações de cálculo e matemática simbólica. Inclui conversão de bases, resolução de equações, diferenciação, integração e mais.",
"tools.builtins.lobe-calculator.title": "Calculadora",
"tools.builtins.lobe-cloud-sandbox.description": "Execute códigos em Python, JavaScript e TypeScript em um ambiente isolado na nuvem. Rode comandos de terminal, gerencie arquivos, pesquise conteúdos com regex e exporte resultados com segurança.",
"tools.builtins.lobe-cloud-sandbox.readme": "Execute códigos em Python, JavaScript e TypeScript em um ambiente isolado na nuvem. Rode comandos de terminal, gerencie arquivos, pesquise conteúdos com regex e exporte resultados com segurança.",
"tools.builtins.lobe-cloud-sandbox.title": "Sandbox na Nuvem",
+5 -1
View File
@@ -224,7 +224,9 @@
"providerModels.item.modelConfig.extendParams.options.gpt5_2ProReasoningEffort.hint": "Для серии GPT-5.2 Pro; управляет интенсивностью рассуждений.",
"providerModels.item.modelConfig.extendParams.options.gpt5_2ReasoningEffort.hint": "Для серии GPT-5.2; управляет интенсивностью рассуждений.",
"providerModels.item.modelConfig.extendParams.options.imageAspectRatio.hint": "Для моделей генерации изображений Gemini; управляет соотношением сторон создаваемых изображений.",
"providerModels.item.modelConfig.extendParams.options.imageAspectRatio2.hint": "Для Nano Banana 2; управляет соотношением сторон создаваемых изображений (поддерживает сверхширокие 1:4, 4:1, 1:8, 8:1).",
"providerModels.item.modelConfig.extendParams.options.imageResolution.hint": "Для моделей генерации изображений Gemini 3; управляет разрешением создаваемых изображений.",
"providerModels.item.modelConfig.extendParams.options.imageResolution2.hint": "Для моделей Gemini 3.1 Flash Image; управляет разрешением создаваемых изображений (поддерживает 512px).",
"providerModels.item.modelConfig.extendParams.options.reasoningBudgetToken.hint": "Для моделей Claude, Qwen3 и аналогичных; управляет бюджетом токенов для рассуждений.",
"providerModels.item.modelConfig.extendParams.options.reasoningEffort.hint": "Для моделей OpenAI и других с поддержкой рассуждений; управляет усилиями на рассуждение.",
"providerModels.item.modelConfig.extendParams.options.textVerbosity.hint": "Для серии GPT-5+; управляет подробностью вывода.",
@@ -232,7 +234,8 @@
"providerModels.item.modelConfig.extendParams.options.thinkingBudget.hint": "Для серии Gemini; управляет бюджетом на размышления.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel.hint": "Для моделей Gemini 3 Flash Preview; управляет глубиной размышлений.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel2.hint": "Для моделей Gemini 3 Pro Preview; управляет глубиной размышлений.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel3.hint": "Для моделей Gemini 3.1 Pro Preview; управляет глубиной мышления с низким/средним/высоким уровнями.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel3.hint": "Для моделей Gemini 3.1 Pro Preview; управляет глубиной размышлений с уровнями низкий/средний/высокий.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel4.hint": "Для моделей Gemini 3.1 Flash Image; переключает размышления вкл/выкл.",
"providerModels.item.modelConfig.extendParams.options.urlContext.hint": "Для серии Gemini; поддерживает предоставление контекста по URL.",
"providerModels.item.modelConfig.extendParams.placeholder": "Выберите параметры для активации",
"providerModels.item.modelConfig.extendParams.previewFallback": "Предпросмотр недоступен",
@@ -311,6 +314,7 @@
"providerModels.tabs.image": "Изображения",
"providerModels.tabs.stt": "ASR",
"providerModels.tabs.tts": "TTS",
"providerModels.tabs.video": "Видео",
"sortModal.success": "Сортировка успешно обновлена",
"sortModal.title": "Пользовательский порядок",
"sortModal.update": "Обновить",
+35 -31
View File
@@ -55,7 +55,8 @@
"FLUX.1-dev.description": "FLUX.1-dev — это мультимодальная языковая модель с открытым исходным кодом (MLLM) от Black Forest Labs, оптимизированная для задач, связанных с изображениями и текстом. Она объединяет понимание и генерацию изображений/текста. Построена на базе передовых LLM (например, Mistral-7B), использует тщательно разработанный визуальный энкодер и многоступенчатую настройку инструкций для обеспечения мультимодальной координации и сложного логического вывода.",
"Gryphe/MythoMax-L2-13b.description": "MythoMax-L2 (13B) — инновационная модель для различных областей и сложных задач.",
"HelloMeme.description": "HelloMeme — это ИИ-инструмент, который создает мемы, GIF-файлы или короткие видео на основе предоставленных вами изображений или движений. Не требует навыков рисования или программирования — достаточно эталонного изображения, чтобы получить веселый, привлекательный и стилистически согласованный контент.",
"HiDream-I1-Full.description": "HiDream-E1-Full — это мультимодальная модель редактирования изображений с открытым исходным кодом от HiDream.ai, основанная на передовой архитектуре Diffusion Transformer и мощном языковом понимании (встроенная LLaMA 3.1-8B-Instruct). Поддерживает генерацию изображений на основе естественного языка, перенос стиля, локальное редактирование и перерисовку, с отличным пониманием и выполнением задач, связанных с изображениями и текстом.",
"HiDream-E1-Full.description": "HiDream-E1-Full — это открытая модель мультимодального редактирования изображений от HiDream.ai, основанная на передовой архитектуре Diffusion Transformer и мощном языковом понимании (встроенный LLaMA 3.1-8B-Instruct). Она поддерживает генерацию изображений на основе естественного языка, перенос стиля, локальные правки и перерисовку, обеспечивая превосходное понимание и выполнение задач, связанных с текстом и изображениями.",
"HiDream-I1-Full.description": "HiDream-I1 — это новая открытая базовая модель генерации изображений, выпущенная HiDream. С 17 миллиардами параметров (Flux имеет 12 миллиардов) она обеспечивает лидирующее в отрасли качество изображений за считанные секунды.",
"HunyuanDiT-v1.2-Diffusers-Distilled.description": "hunyuandit-v1.2-distilled — это легковесная модель преобразования текста в изображение, оптимизированная с помощью дистилляции для быстрой генерации высококачественных изображений. Особенно подходит для сред с ограниченными ресурсами и задач в реальном времени.",
"InstantCharacter.description": "InstantCharacter — это модель персонализированной генерации персонажей без необходимости настройки, выпущенная Tencent AI в 2025 году. Она обеспечивает высокую точность и согласованность персонажей в различных сценариях. Модель может создать персонажа по одному эталонному изображению и гибко переносить его в разные стили, действия и фоны.",
"InternVL2-8B.description": "InternVL2-8B — это мощная модель визуально-языкового понимания, поддерживающая мультимодальную обработку изображений и текста, точно распознающая содержимое изображений и генерирующая соответствующие описания или ответы.",
@@ -80,7 +81,7 @@
"MiniMax-M2.1.description": "MiniMax-M2.1 — это флагманская модель с открытым исходным кодом от MiniMax, ориентированная на решение сложных задач из реального мира. Её ключевые преимущества — поддержка многозадачного программирования и способность выступать в роли интеллектуального агента.",
"MiniMax-M2.5-Lightning.description": "M2.5 Lightning: та же производительность, быстрее и более гибкий (примерно 100 tps).",
"MiniMax-M2.5-highspeed.description": "Та же производительность, что и у M2.5, с значительно более быстрым выводом.",
"MiniMax-M2.5.description": "Высококлассная производительность и максимальная экономичность, легко справляется с сложными задачами (примерно 60 tps).",
"MiniMax-M2.5.description": "MiniMax-M2.5 — это флагманская открытая крупная модель от MiniMax, ориентированная на решение сложных реальных задач. Её основные преимущества — многоязычные программные возможности и способность решать сложные задачи в качестве агента.",
"MiniMax-M2.description": "Создан специально для эффективного программирования и рабочих процессов с агентами",
"MiniMax-Text-01.description": "MiniMax-01 представляет масштабное линейное внимание, выходящее за рамки классических трансформеров, с 456B параметрами и 45.9B активируемыми за проход. Обеспечивает производительность высшего уровня и поддерживает до 4M токенов контекста (в 32 раза больше GPT-4o, в 20 раз больше Claude-3.5-Sonnet).",
"MiniMaxAI/MiniMax-M1-80k.description": "MiniMax-M1 — это модель рассуждений с открытыми весами, использующая гибридное внимание, с общим числом параметров 456B и ~45.9B активных на токен. Поддерживает 1M контекста и использует Flash Attention для снижения FLOPs на 75% при генерации 100K токенов по сравнению с DeepSeek R1. Благодаря архитектуре MoE, CISPO и обучению с подкреплением на гибридном внимании достигает лидирующих результатов в задачах рассуждения на длинных входах и реальных инженерных задачах.",
@@ -98,6 +99,7 @@
"Phi-3.5-mini-instruct.description": "Обновлённая версия модели Phi-3-mini.",
"Phi-3.5-vision-instrust.description": "Обновлённая версия модели Phi-3-vision.",
"Pro/MiniMaxAI/MiniMax-M2.1.description": "MiniMax-M2.1 — это модель большого языка с открытым исходным кодом, оптимизированная для агентных возможностей. Она превосходно справляется с программированием, использованием инструментов, следованием инструкциям и долгосрочным планированием. Модель поддерживает многоязычную разработку программного обеспечения и выполнение сложных многошаговых рабочих процессов, набирая 74.0 балла на SWE-bench Verified и превосходя Claude Sonnet 4.5 в многоязычных сценариях.",
"Pro/MiniMaxAI/MiniMax-M2.5.description": "MiniMax-M2.5 — это новейшая крупная языковая модель, разработанная MiniMax, обученная с использованием масштабного обучения с подкреплением в сотнях тысяч сложных реальных сред. Благодаря архитектуре MoE с 229 миллиардами параметров она достигает лидирующих в отрасли результатов в таких задачах, как программирование, вызов инструментов агентами, поиск и офисные сценарии.",
"Pro/Qwen/Qwen2-7B-Instruct.description": "Qwen2-7B-Instruct — это 7B модель с настройкой на инструкции из серии Qwen2. Использует архитектуру Transformer с SwiGLU, смещением QKV внимания и групповым вниманием по запросу, обрабатывает большие входные данные. Демонстрирует высокие результаты в понимании языка, генерации, многоязычных задачах, программировании, математике и рассуждении, превосходя большинство открытых моделей и конкурируя с закрытыми.",
"Pro/Qwen/Qwen2.5-7B-Instruct.description": "Qwen2.5-7B-Instruct входит в последнюю серию LLM от Alibaba Cloud. Модель на 7B параметров демонстрирует значительный прогресс в программировании и математике, поддерживает более 29 языков и улучшает следование инструкциям, понимание структурированных данных и структурированный вывод (особенно JSON).",
"Pro/Qwen/Qwen2.5-Coder-7B-Instruct.description": "Qwen2.5-Coder-7B-Instruct — последняя модель от Alibaba Cloud, ориентированная на программирование. Построена на базе Qwen2.5 и обучена на 5.5T токенов, значительно улучшает генерацию кода, рассуждение и исправление ошибок, сохраняя при этом сильные стороны в математике и общем интеллекте, обеспечивая надёжную основу для кодирующих агентов.",
@@ -107,13 +109,13 @@
"Pro/deepseek-ai/DeepSeek-R1-Distill-Qwen-7B.description": "DeepSeek-R1-Distill-Qwen-7B — это дистиллированная модель на основе Qwen2.5-Math-7B, дообученная на 800K отобранных выборках DeepSeek-R1. Обеспечивает высокую производительность: 92.8% на MATH-500, 55.5% на AIME 2024 и рейтинг 1189 на CodeForces для модели с 7B параметрами.",
"Pro/deepseek-ai/DeepSeek-R1.description": "DeepSeek-R1 — это модель рассуждений, обученная с использованием обучения с подкреплением, которая снижает повторяемость и повышает читаемость. Использует данные холодного старта до RL для дальнейшего улучшения рассуждений, сопоставима с OpenAI-o1 в задачах математики, программирования и логики, улучшает общие результаты благодаря тщательному обучению.",
"Pro/deepseek-ai/DeepSeek-V3.1-Terminus.description": "DeepSeek-V3.1-Terminus — обновлённая модель V3.1, позиционируемая как гибридная агентная LLM. Исправляет ошибки, сообщённые пользователями, повышает стабильность, согласованность языка и снижает количество смешанных китайско-английских и аномальных символов. Интегрирует режимы размышления и без размышлений с шаблонами чата для гибкого переключения. Также улучшает производительность агентов кода и поиска для более надёжного использования инструментов и многошаговых задач.",
"Pro/deepseek-ai/DeepSeek-V3.2-Exp.description": "DeepSeek-V3.2-Exp — экспериментальный выпуск V3.2, переходящий к следующей архитектуре. Добавляет DeepSeek Sparse Attention (DSA) поверх V3.1-Terminus для повышения эффективности обучения и вывода на длинных контекстах, с оптимизациями для использования инструментов, понимания длинных документов и многошагового рассуждения. Идеально подходит для изучения более эффективного рассуждения при больших бюджетах контекста.",
"Pro/deepseek-ai/DeepSeek-V3.2.description": "DeepSeek-V3.2 — это модель, сочетающая высокую вычислительную эффективность с превосходными возможностями рассуждения и работы в качестве агента. Её подход основан на трёх ключевых технологических прорывах: DeepSeek Sparse Attention (DSA) — эффективный механизм внимания, который значительно снижает вычислительную сложность при сохранении производительности модели и оптимизирован для сценариев с длинным контекстом; масштабируемая структура обучения с подкреплением, благодаря которой производительность модели может соперничать с GPT-5, а её версия с высокой вычислительной мощностью соответствует Gemini-3.0-Pro по возможностям рассуждения; и крупномасштабный конвейер синтеза задач для агентов, направленный на интеграцию возможностей рассуждения в сценарии использования инструментов, что улучшает следование инструкциям и обобщение в сложных интерактивных средах. Модель достигла золотых медалей на Международной математической олимпиаде (IMO) и Международной олимпиаде по информатике (IOI) 2025 года.",
"Pro/deepseek-ai/DeepSeek-V3.description": "DeepSeek-V3 — это модель MoE с 671B параметрами, использующая MLA и DeepSeekMoE с балансировкой нагрузки без потерь для эффективного вывода и обучения. Предобучена на 14.8T высококачественных токенов и дополнительно дообучена с использованием SFT и RL, превосходит другие открытые модели и приближается к ведущим закрытым моделям.",
"Pro/moonshotai/Kimi-K2-Instruct-0905.description": "Kimi K2-Instruct-0905 — новейшая и самая мощная версия Kimi K2. Это передовая модель MoE с общим числом параметров 1 трлн и 32 млрд активных. Ключевые особенности включают усиленный агентный интеллект в программировании с заметным улучшением результатов на тестах и в реальных задачах, а также улучшенную эстетику и удобство интерфейсного кода.",
"Pro/moonshotai/Kimi-K2-Thinking.description": "Kimi K2 Thinking Turbo — это ускоренный вариант, оптимизированный для скорости рассуждений и пропускной способности, при сохранении многошагового мышления и использования инструментов K2 Thinking. Это модель MoE с ~1 трлн параметров, нативной поддержкой контекста 256K и стабильным вызовом инструментов в масштабных производственных сценариях с жёсткими требованиями к задержке и параллельности.",
"Pro/moonshotai/Kimi-K2.5.description": "Kimi K2.5 — это нативная мультимодальная агентная модель с открытым исходным кодом, построенная на базе Kimi-K2-Base и обученная на ~1,5 трлн токенов текста и изображений. Модель использует архитектуру MoE с 1 трлн общих параметров и 32 млрд активных, поддерживает контекст до 256K и объединяет визуальное и языковое понимание.",
"Pro/zai-org/glm-4.7.description": "GLM-4.7 — флагманская модель нового поколения от Zhipu с общим числом параметров 355B и 32B активных. Полностью обновлена для улучшения диалога, логического мышления и возможностей агента. GLM-4.7 усиливает межшаговое мышление и вводит концепции сохранённого и пошагового мышления.",
"Pro/zai-org/glm-5.description": "GLM-5 — это новая генерация больших языковых моделей от Zhipu, ориентированная на сложную системную инженерию и задачи долгосрочных агентов. Параметры модели расширены до 744B (40B активных) и интегрированы с DeepSeek Sparse Attention.",
"Pro/zai-org/glm-5.description": "GLM-5 — это модель следующего поколения от Zhipu, ориентированная на сложную системную инженерию и длительные задачи агентов. Параметры модели расширены до 744 миллиардов (40 миллиардов активных) и интегрируют DeepSeek Sparse Attention.",
"QwQ-32B-Preview.description": "Qwen QwQ — это экспериментальная исследовательская модель, направленная на улучшение логического мышления.",
"Qwen/QVQ-72B-Preview.description": "QVQ-72B-Preview — исследовательская модель от Qwen, ориентированная на визуальное мышление, с сильными сторонами в понимании сложных сцен и решении визуальных математических задач.",
"Qwen/QwQ-32B-Preview.description": "Qwen QwQ — экспериментальная исследовательская модель, сосредоточенная на улучшении логического мышления ИИ.",
@@ -137,7 +139,7 @@
"Qwen/Qwen3-14B.description": "Qwen3 — это модель нового поколения Tongyi Qwen с существенными улучшениями в области рассуждений, общей способности, агентных возможностей и многоязычной производительности. Поддерживает переключение режимов мышления.",
"Qwen/Qwen3-235B-A22B-Instruct-2507.description": "Qwen3-235B-A22B-Instruct-2507 — флагманская модель Qwen3 MoE с общим числом параметров 235B и 22B активных. Это обновлённая версия без режима мышления, ориентированная на улучшение следования инструкциям, логических рассуждений, понимания текста, математики, науки, программирования и использования инструментов. Также расширяет знания на длинном хвосте в многоязычной среде и лучше соответствует пользовательским предпочтениям в субъективных и открытых задачах.",
"Qwen/Qwen3-235B-A22B-Thinking-2507.description": "Qwen3-235B-A22B-Thinking-2507 — модель Qwen3, ориентированная на сложные логические рассуждения. Использует архитектуру MoE с общим числом параметров 235B и ~22B активных на токен, что повышает эффективность. Как специализированная модель для мышления, она демонстрирует значительные улучшения в логике, математике, науке, программировании и академических тестах, достигая уровня лучших открытых моделей мышления. Также улучшает следование инструкциям, использование инструментов и генерацию текста, нативно поддерживает контекст до 256K для глубоких рассуждений и работы с длинными документами.",
"Qwen/Qwen3-235B-A22B.description": "Qwen3 — это модель нового поколения Tongyi Qwen с существенными улучшениями в области рассуждений, общей способности, агентных возможностей и многоязычной производительности. Поддерживает переключение режимов мышления.",
"Qwen/Qwen3-235B-A22B.description": "Qwen3 235B A22B — это ультрамасштабная модель Qwen3, обеспечивающая первоклассные возможности ИИ.",
"Qwen/Qwen3-30B-A3B-Instruct-2507.description": "Qwen3-30B-A3B-Instruct-2507 — обновлённая версия модели Qwen3-30B-A3B без режима мышления. Это модель MoE с общим числом параметров 30.5B и 3.3B активных. Существенно улучшает следование инструкциям, логические рассуждения, понимание текста, математику, науку, программирование и использование инструментов, расширяет знания на длинном хвосте в многоязычной среде и лучше соответствует пользовательским предпочтениям в субъективных открытых задачах. Поддерживает контекст до 256K. Эта модель работает только в режиме без мышления и не будет выводить теги `<think></think>`.",
"Qwen/Qwen3-30B-A3B-Thinking-2507.description": "Qwen3-30B-A3B-Thinking-2507 — новейшая модель мышления в серии Qwen3. Это модель MoE с общим числом параметров 30.5B и 3.3B активных, ориентированная на сложные задачи. Демонстрирует значительные улучшения в логике, математике, науке, программировании и академических тестах, а также улучшает следование инструкциям, использование инструментов, генерацию текста и соответствие предпочтениям. Нативно поддерживает контекст до 256K и может быть расширена до 1M токенов. Эта версия предназначена для режима мышления с пошаговыми рассуждениями и развитыми агентными возможностями.",
"Qwen/Qwen3-30B-A3B.description": "Qwen3 — это модель нового поколения Tongyi Qwen с существенными улучшениями в области рассуждений, общей способности, агентных возможностей и многоязычной производительности. Поддерживает переключение режимов мышления.",
@@ -315,7 +317,6 @@
"codeqwen.description": "CodeQwen1.5 — крупная языковая модель, обученная на обширных данных кода, предназначенная для сложных задач программирования.",
"codestral-latest.description": "Codestral — наша самая продвинутая модель для программирования; версия v2 (январь 2025) оптимизирована для задач с низкой задержкой и высокой частотой, таких как FIM, исправление кода и генерация тестов.",
"codestral.description": "Codestral — первая модель для программирования от Mistral AI, обеспечивающая высокое качество генерации кода.",
"codex-mini-latest.description": "codex-mini-latest — дообученная модель o4-mini для Codex CLI. Для прямого использования через API мы рекомендуем начать с gpt-4.1.",
"cogito-2.1:671b.description": "Cogito v2.1 671B — открытая LLM из США, свободная для коммерческого использования. Обеспечивает производительность на уровне ведущих моделей, более эффективную работу с токенами, поддержку контекста до 128k и высокую общую мощность.",
"cogview-3-flash.description": "CogView-3-Flash — это бесплатная модель генерации изображений, запущенная Zhipu. Она создает изображения, соответствующие инструкциям пользователя, при этом достигая более высоких оценок эстетического качества. CogView-3-Flash в основном используется в таких областях, как художественное творчество, дизайн, разработка игр и виртуальная реальность, помогая пользователям быстро преобразовывать текстовые описания в изображения.",
"cogview-4.description": "CogView-4 — первая открытая модель от Zhipu для генерации изображений по тексту с поддержкой китайских иероглифов. Улучшает семантическое понимание, качество изображений и рендеринг текста на китайском и английском языках, поддерживает произвольную длину двуязычных подсказок и может генерировать изображения в любом разрешении в заданных пределах.",
@@ -342,7 +343,7 @@
"command-light-nightly.description": "Чтобы сократить интервал между основными релизами, мы предлагаем ночные сборки Command. Для серии command-light это называется command-light-nightly. Это самая новая и экспериментальная (возможно, нестабильная) версия, обновляется без уведомлений, поэтому не рекомендуется для продакшена.",
"command-light.description": "Упрощённый и более быстрый вариант Command, почти такой же мощный, но с более высокой скоростью.",
"command-nightly.description": "Чтобы сократить интервал между основными релизами, мы предлагаем ночные сборки Command. Для основной серии это называется command-nightly. Это самая новая и экспериментальная (возможно, нестабильная) версия, обновляется без уведомлений, поэтому не рекомендуется для продакшена.",
"command-r-03-2024.description": "Command R — модель чата, следящая за инструкциями, с более высоким качеством, надёжностью и увеличенным окном контекста по сравнению с предыдущими версиями. Поддерживает сложные рабочие процессы, такие как генерация кода, RAG, использование инструментов и агентов.",
"command-r-03-2024.description": "command-r — это модель чата, следящая за инструкциями, которая выполняет языковые задачи с более высоким качеством, улучшенной надёжностью и более длинным контекстом по сравнению с предыдущими моделями. Она поддерживает сложные рабочие процессы, такие как генерация кода, RAG, использование инструментов и агентов.",
"command-r-08-2024.description": "command-r-08-2024 — обновлённая модель Command R, выпущенная в августе 2024 года.",
"command-r-plus-04-2024.description": "command-r-plus — псевдоним модели command-r-plus-04-2024, поэтому использование command-r-plus в API указывает на эту модель.",
"command-r-plus-08-2024.description": "Command R+ — модель чата, следящая за инструкциями, с более высоким качеством, надёжностью и увеличенным окном контекста по сравнению с предыдущими версиями. Идеальна для сложных RAG-процессов и многошагового использования инструментов.",
@@ -366,7 +367,8 @@
"deepseek-ai/DeepSeek-V2.5.description": "DeepSeek-V2.5 — это обновление моделей DeepSeek-V2-Chat и DeepSeek-Coder-V2-Instruct, объединяющее общие и программные способности. Улучшает написание текстов и следование инструкциям для лучшего соответствия предпочтениям, демонстрируя значительный прогресс на AlpacaEval 2.0, ArenaHard, AlignBench и MT-Bench.",
"deepseek-ai/DeepSeek-V3.1-Terminus.description": "DeepSeek-V3.1-Terminus — обновлённая модель V3.1, позиционируемая как гибридный агентный LLM. Исправляет ошибки, сообщённые пользователями, повышает стабильность, согласованность языка и снижает количество смешанных китайско-английских и некорректных символов. Интегрирует режимы мышления и немышления с шаблонами чата для гибкого переключения. Также улучшает производительность Code Agent и Search Agent для более надёжного использования инструментов и выполнения многошаговых задач.",
"deepseek-ai/DeepSeek-V3.1.description": "DeepSeek V3.1 использует гибридную архитектуру рассуждений и поддерживает как режим мышления, так и немышления.",
"deepseek-ai/DeepSeek-V3.2-Exp.description": "DeepSeek-V3.2-Exp — экспериментальный выпуск V3.2, переходный к следующей архитектуре. Добавляет DeepSeek Sparse Attention (DSA) поверх V3.1-Terminus для повышения эффективности обучения и вывода на длинных контекстах, с оптимизациями для использования инструментов, понимания длинных документов и многошагового рассуждения. Идеально подходит для изучения более эффективного рассуждения при больших объёмах контекста.",
"deepseek-ai/DeepSeek-V3.2-Exp.description": "DeepSeek V3.2 Exp использует гибридную архитектуру рассуждений и поддерживает как режимы мышления, так и немышления.",
"deepseek-ai/DeepSeek-V3.2.description": "DeepSeek-V3.2 — это модель, сочетающая высокую вычислительную эффективность с превосходными возможностями рассуждения и работы в качестве агента. Её подход основан на трёх основных технологических прорывах: DeepSeek Sparse Attention (DSA) — эффективный механизм внимания, который значительно снижает вычислительную сложность при сохранении производительности модели и оптимизирован для сценариев с длинным контекстом; масштабируемая структура обучения с подкреплением, благодаря которой производительность модели может соперничать с GPT-5, а её версия с высокой вычислительной мощностью может соперничать с Gemini-3.0-Pro по возможностям рассуждения; и крупномасштабный конвейер синтеза задач для агентов, разработанный для интеграции возможностей рассуждения в сценарии использования инструментов, что улучшает следование инструкциям и обобщение в сложных интерактивных средах. Модель достигла золотых медалей на Международной математической олимпиаде (IMO) и Международной олимпиаде по информатике (IOI) 2025 года.",
"deepseek-ai/DeepSeek-V3.description": "DeepSeek-V3 — модель MoE с 671 миллиардами параметров, использующая MLA и DeepSeekMoE с балансировкой нагрузки без потерь для эффективного обучения и вывода. Предобучена на 14.8 триллионах высококачественных токенов с использованием SFT и RL, превосходит другие открытые модели и приближается к ведущим закрытым решениям.",
"deepseek-ai/deepseek-llm-67b-chat.description": "DeepSeek LLM Chat (67B) — инновационная модель с глубоким пониманием языка и возможностью взаимодействия.",
"deepseek-ai/deepseek-v3.1-terminus.description": "DeepSeek V3.1 — модель нового поколения для рассуждений, обладающая улучшенными возможностями для сложных рассуждений и цепочек размышлений, подходящая для задач глубокого анализа.",
@@ -433,6 +435,7 @@
"deepseek_r1_distill_llama_70b.description": "DeepSeek-R1-Distill-Llama-70B — дистиллированная модель на основе Llama-3.3-70B-Instruct. Является частью серии DeepSeek-R1, дообучена на выборках, сгенерированных DeepSeek-R1, и демонстрирует высокие результаты в математике, программировании и логике.",
"deepseek_r1_distill_qwen_14b.description": "DeepSeek-R1-Distill-Qwen-14B — дистиллированная модель на основе Qwen2.5-14B, дообученная на 800K отобранных выборках, сгенерированных DeepSeek-R1, обеспечивая высокое качество логического мышления.",
"deepseek_r1_distill_qwen_32b.description": "DeepSeek-R1-Distill-Qwen-32B — дистиллированная модель на основе Qwen2.5-32B, дообученная на 800K отобранных выборках, сгенерированных DeepSeek-R1, превосходящая в математике, программировании и логике.",
"devstral-2512.description": "Devstral 2 — это корпоративная текстовая модель, которая превосходно справляется с использованием инструментов для исследования кодовых баз, редактирования нескольких файлов и поддержки агентов для разработки программного обеспечения.",
"devstral-2:123b.description": "Devstral 2 123B превосходно использует инструменты для анализа кодовой базы, редактирования нескольких файлов и поддержки агентов в области программной инженерии.",
"doubao-1.5-lite-32k.description": "Doubao-1.5-lite — новая облегчённая модель с ультрабыстрым откликом, обеспечивающая высокое качество и низкую задержку.",
"doubao-1.5-pro-256k.description": "Doubao-1.5-pro-256k — комплексное обновление модели Doubao-1.5-Pro, повышающее общую производительность на 10%. Поддерживает контекстное окно 256k и до 12k токенов вывода, обеспечивая высокую производительность, расширенное окно и отличную ценность для широкого спектра задач.",
@@ -546,10 +549,10 @@
"gemini-2.5-pro-preview-06-05.description": "Gemini 2.5 Pro Preview — самая продвинутая модель рассуждения от Google, способная анализировать код, математику и задачи STEM, а также обрабатывать большие наборы данных, кодовые базы и документы с длинным контекстом.",
"gemini-2.5-pro.description": "Gemini 2.5 Pro — флагманская модель рассуждения от Google с поддержкой длинного контекста для сложных задач.",
"gemini-3-flash-preview.description": "Gemini 3 Flash — самая быстрая и интеллектуальная модель, сочетающая передовые ИИ-возможности с точной привязкой к поисковым данным.",
"gemini-3-pro-image-preview.description": "Gemini 3 Pro Image (Nano Banana Pro) — модель генерации изображений от Google с поддержкой мультимодального диалога.",
"gemini-3-pro-image-preview.description": "Gemini 3 Pro Image (Nano Banana Pro) — это модель генерации изображений от Google, которая также поддерживает мультимодальный диалог.",
"gemini-3-pro-image-preview:image.description": "Gemini 3 Pro Image (Nano Banana Pro) — модель генерации изображений от Google, также поддерживающая мультимодальный чат.",
"gemini-3-pro-preview.description": "Gemini 3 Pro — самая мощная агентная модель от Google с поддержкой визуализации и глубокой интерактивности, основанная на передовых возможностях рассуждения.",
"gemini-3.1-flash-image-preview.description": "Gemini 3.1 Flash Image (Nano Banana 2) обеспечивает профессиональное качество изображений на высокой скорости с поддержкой мультимодального чата.",
"gemini-3.1-flash-image-preview.description": "Gemini 3.1 Flash Image (Nano Banana 2) — это самая быстрая нативная модель генерации изображений от Google с поддержкой мышления, генерации и редактирования изображений в диалоговом режиме.",
"gemini-3.1-flash-image-preview:image.description": "Gemini 3.1 Flash Image (Nano Banana 2) обеспечивает профессиональное качество изображений на высокой скорости с поддержкой мультимодального чата.",
"gemini-3.1-pro-preview.description": "Gemini 3.1 Pro Preview улучшает Gemini 3 Pro с расширенными возможностями рассуждений и добавляет поддержку среднего уровня мышления.",
"gemini-flash-latest.description": "Последний выпуск Gemini Flash",
@@ -605,19 +608,15 @@
"google/gemini-2.0-flash-lite-001.description": "Gemini 2.0 Flash Lite — облегчённый вариант Gemini с отключённым по умолчанию режимом мышления для снижения задержек и стоимости, который можно включить с помощью параметров.",
"google/gemini-2.0-flash-lite.description": "Gemini 2.0 Flash Lite предлагает функции следующего поколения, включая высокую скорость, встроенную работу с инструментами, мультимодальную генерацию и контекстное окно объёмом 1 миллион токенов.",
"google/gemini-2.0-flash.description": "Gemini 2.0 Flash — высокопроизводительная модель от Google, предназначенная для расширенных мультимодальных задач с элементами логического мышления.",
"google/gemini-2.5-flash-image-free.description": "Бесплатный уровень Gemini 2.5 Flash Image с ограниченной квотой на мультимодальную генерацию.",
"google/gemini-2.5-flash-image-preview.description": "Экспериментальная модель Gemini 2.5 Flash с поддержкой генерации изображений.",
"google/gemini-2.5-flash-image.description": "Gemini 2.5 Flash Image (Nano Banana) — модель генерации изображений от Google с поддержкой мультимодального общения.",
"google/gemini-2.5-flash-lite.description": "Gemini 2.5 Flash Lite — облегчённый вариант Gemini 2.5, оптимизированный по задержке и стоимости, подходит для сценариев с высокой пропускной способностью.",
"google/gemini-2.5-flash-preview.description": "Gemini 2.5 Flash — самая продвинутая флагманская модель Google, созданная для сложных задач в области логики, программирования, математики и науки. Включает встроенное «мышление» для более точных ответов и тонкой обработки контекста.\n\nПримечание: у модели есть два варианта — с мышлением и без. Стоимость вывода значительно различается в зависимости от включения мышления. Если вы выберете стандартный вариант (без суффикса «:thinking»), модель будет явно избегать генерации токенов мышления.\n\nЧтобы использовать мышление и получать соответствующие токены, необходимо выбрать вариант с суффиксом «:thinking», что приведёт к более высокой стоимости вывода.\n\nGemini 2.5 Flash также можно настроить с помощью параметра «максимум токенов рассуждения», как указано в документации (https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning).",
"google/gemini-2.5-flash-preview:thinking.description": "Gemini 2.5 Flash — самая продвинутая флагманская модель Google, созданная для сложных задач в области логики, программирования, математики и науки. Включает встроенное «мышление» для более точных ответов и тонкой обработки контекста.\n\nПримечание: у модели есть два варианта — с мышлением и без. Стоимость вывода значительно различается в зависимости от включения мышления. Если вы выберете стандартный вариант (без суффикса «:thinking»), модель будет явно избегать генерации токенов мышления.\n\nЧтобы использовать мышление и получать соответствующие токены, необходимо выбрать вариант с суффиксом «:thinking», что приведёт к более высокой стоимости вывода.\n\nGemini 2.5 Flash также можно настроить с помощью параметра «максимум токенов рассуждения», как указано в документации (https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning).",
"google/gemini-2.5-flash.description": "Gemini 2.5 Flash (Lite/Pro/Flash) — семейство моделей Google, охватывающее от низкой задержки до высокопроизводительного логического мышления.",
"google/gemini-2.5-pro-free.description": "Бесплатный уровень Gemini 2.5 Pro с ограниченной квотой на мультимодальную генерацию с длинным контекстом, подходит для тестирования и лёгких рабочих процессов.",
"google/gemini-2.5-flash.description": "Gemini 2.5 Flash — это семейство моделей Google, охватывающее задачи от низкой задержки до высокопроизводительного рассуждения.",
"google/gemini-2.5-pro-preview.description": "Gemini 2.5 Pro Preview — самая продвинутая модель Google с режимом мышления, предназначенная для решения сложных задач в области программирования, математики и STEM, а также для анализа больших наборов данных, кодовых баз и документов с длинным контекстом.",
"google/gemini-2.5-pro.description": "Gemini 2.5 Pro — флагманская модель логического мышления от Google с поддержкой длинного контекста для сложных задач.",
"google/gemini-3-pro-image-preview-free.description": "Бесплатный уровень Gemini 3 Pro Image с ограниченной квотой на мультимодальную генерацию.",
"google/gemini-3-pro-image-preview.description": "Gemini 3 Pro Image (Nano Banana Pro) — модель генерации изображений от Google с поддержкой мультимодального общения.",
"google/gemini-3-pro-preview-free.description": "Бесплатная версия Gemini 3 Pro Preview с теми же возможностями мультимодального понимания и логики, что и стандартная версия, но с ограничениями по квоте и частоте, что делает её подходящей для тестирования и редкого использования.",
"google/gemini-3-pro-preview.description": "Gemini 3 Pro — модель следующего поколения в семействе Gemini, способная понимать текст, аудио, изображения и видео, а также справляться со сложными задачами и большими кодовыми базами.",
"google/gemini-embedding-001.description": "Современная модель встраивания с высокой производительностью для задач на английском языке, в многоязычной среде и в программировании.",
"google/gemini-flash-1.5.description": "Gemini 1.5 Flash обеспечивает оптимизированную мультимодальную обработку для широкого спектра сложных задач.",
@@ -717,15 +716,24 @@
"hunyuan-a13b.description": "Первая гибридная модель рассуждения от Hunyuan, улучшенная версия hunyuan-standard-256K (всего 80B, активных 13B). По умолчанию использует медленное мышление, поддерживает переключение между быстрым и медленным режимами через параметры или префикс /no_think. Общие возможности улучшены по сравнению с предыдущим поколением, особенно в математике, науке, понимании длинных текстов и задачах агентов.",
"hunyuan-code.description": "Последняя модель кода Hunyuan, обученная на 200B высококачественных данных кода плюс шесть месяцев данных SFT, с контекстом 8K. Она занимает лидирующие позиции в автоматизированных тестах кода и экспертных оценках на пяти языках.",
"hunyuan-functioncall.description": "Последняя модель MoE FunctionCall от Hunyuan, обученная на высококачественных данных вызова инструментов, с окном контекста 32K и ведущими показателями по различным измерениям.",
"hunyuan-large-longcontext.description": "Превосходно справляется с задачами на длинных документах, такими как суммаризация и вопросы-ответы, а также с общей генерацией. Сильна в анализе и генерации длинных текстов для сложного, детализированного контента.",
"hunyuan-large.description": "Hunyuan-large имеет ~389 миллиардов общих параметров и ~52 миллиарда активных, являясь крупнейшей и самой мощной открытой моделью MoE в архитектуре Transformer.",
"hunyuan-lite.description": "Обновлена до архитектуры MoE с контекстом 256K, опережает многие открытые модели в NLP, коде, математике и отраслевых тестах.",
"hunyuan-pro.description": "Модель MoE с триллионом параметров и контекстом 32K, лидирующая в тестах, сильна в сложных инструкциях и рассуждениях, продвинутой математике, вызове функций и оптимизирована для перевода, финансов, права и медицины.",
"hunyuan-role.description": "Последняя модель ролевой игры Hunyuan, официально дообученная на данных ролевой игры, обеспечивающая более сильную базовую производительность в сценариях ролевой игры.",
"hunyuan-standard-256K.description": "Использует улучшенную маршрутизацию для смягчения дисбаланса нагрузки и коллапса экспертов. Длинные тексты \"иголка в стоге сена\" достигают 99.9%. MOE-256K продвигает длину и качество дальше, значительно расширяя длину ввода.",
"hunyuan-standard.description": "Использует улучшенную маршрутизацию для смягчения дисбаланса нагрузки и коллапса экспертов. Длинные тексты \"иголка в стоге сена\" достигают 99.9%. MOE-32K предлагает лучшее соотношение цены и качества для длинных текстов.",
"hunyuan-standard-256K.description": "Использует улучшенную маршрутизацию для смягчения дисбаланса нагрузки и коллапса экспертов. Достигает 99,9% точности в задачах с длинным контекстом. MOE-256K дополнительно расширяет длину и качество контекста.",
"hunyuan-standard.description": "Использует улучшенную маршрутизацию для смягчения дисбаланса нагрузки и коллапса экспертов. Достигает 99,9% точности в задачах с длинным контекстом. MOE-32K предлагает высокую ценность при обработке длинных входных данных.",
"hunyuan-t1-20250321.description": "Развивает сбалансированные способности в искусстве и STEM, с сильным захватом информации из длинных текстов. Поддерживает рассуждения и ответы на вопросы по математике, логике, науке и программированию на разных уровнях сложности.",
"hunyuan-t1-20250403.description": "Улучшает генерацию кода на уровне проектов и качество написания, усиливает понимание многотемных диалогов и следование инструкциям ToB, улучшает понимание на уровне слов и снижает проблемы смешанного упрощённого/традиционного китайского и китайско-английского вывода.",
"hunyuan-t1-20250529.description": "Улучшает творческое письмо и композицию, усиливает фронтенд-кодирование, математическое и логическое рассуждение, а также улучшает следование инструкциям.",
"hunyuan-t1-20250711.description": "Значительно улучшает сложные задачи по математике, логике и программированию, повышает стабильность вывода и усиливает возможности работы с длинными текстами.",
"hunyuan-t1-latest.description": "Существенно улучшает модель медленного мышления в сложной математике, рассуждениях, трудном программировании, следовании инструкциям и качестве креативного письма.",
"hunyuan-t1-vision-20250916.description": "Новейшая модель глубокого рассуждения t1-vision с серьёзными улучшениями в VQA, визуальной привязке, OCR, графиках, решении задач по фото и создании изображений, а также с усиленной поддержкой английского и языков с низкими ресурсами.",
"hunyuan-turbo-20241223.description": "Эта версия улучшает масштабирование инструкций для лучшей обобщённости, значительно улучшает математическое/программное/логическое рассуждение, усиливает понимание на уровне слов и улучшает качество написания.",
"hunyuan-turbo-latest.description": "Общие улучшения в понимании NLP, написании, чатах, вопросах-ответах, переводах и других областях; более человекоподобные ответы, лучшее уточнение неоднозначных намерений, улучшенный разбор слов, более высокое качество творчества и интерактивности, а также более сильные многотемные диалоги.",
"hunyuan-turbo.description": "Предварительная версия LLM нового поколения от Hunyuan с новой архитектурой MoE, обеспечивающая более быстрое рассуждение и лучшие результаты, чем hunyuan-pro.",
"hunyuan-turbos-latest.description": "Новейшая флагманская модель Hunyuan TurboS с более сильным рассуждением и улучшенным общим пользовательским опытом.",
"hunyuan-turbos-longtext-128k-20250325.description": "Превосходно справляется с задачами на длинных документах, такими как суммаризация и вопросы-ответы, а также с общей генерацией. Сильна в анализе и генерации длинных текстов для сложного, детализированного контента.",
"hunyuan-vision-1.5-instruct.description": "Быстродействующая модель преобразования изображения в текст, построенная на текстовой базе TurboS, демонстрирующая заметные улучшения по сравнению с предыдущей версией в области базового распознавания изображений и анализа рассуждений.",
"hunyuan-vision.description": "Последняя мультимодальная модель Hunyuan, поддерживающая ввод изображения + текста для генерации текста.",
"image-01-live.description": "Модель генерации изображений с высокой детализацией, поддерживает генерацию по тексту и управляемые стили.",
@@ -770,8 +778,7 @@
"kimi-k2:1t.description": "Kimi K2 — крупная модель MoE LLM от Moonshot AI с 1T параметров и 32B активных на проход. Оптимизирована для агентных задач, включая продвинутое использование инструментов, логическое мышление и синтез кода.",
"kimi-latest.description": "Kimi Latest использует новейшую модель Kimi и может включать экспериментальные функции. Поддерживает понимание изображений и автоматически выбирает модели тарификации 8k/32k/128k в зависимости от длины контекста.",
"kuaishou/kat-coder-pro-v1.description": "KAT-Coder-Pro-V1 (бесплатно на ограниченное время) ориентирован на понимание кода и автоматизацию для эффективных кодирующих агентов.",
"learnlm-1.5-pro-experimental.description": "LearnLM — экспериментальная специализированная модель, обученная на принципах педагогики для выполнения системных инструкций в образовательных сценариях, выступая в роли эксперта-наставника.",
"learnlm-2.0-flash-experimental.description": "LearnLM — экспериментальная специализированная модель, обученная на принципах педагогики для выполнения системных инструкций в образовательных сценариях, выступая в роли эксперта-наставника.",
"labs-devstral-small-2512.description": "Devstral Small 2 превосходно справляется с использованием инструментов для исследования кодовых баз, редактирования нескольких файлов и поддержки агентов для разработки программного обеспечения.",
"lite.description": "Spark Lite — легковесная LLM с ультранизкой задержкой и эффективной обработкой. Полностью бесплатна и поддерживает поиск в интернете в реальном времени. Быстрые ответы хорошо работают на устройствах с низкой вычислительной мощностью и при дообучении модели, обеспечивая высокую экономичность и интеллектуальный опыт, особенно в задачах вопросов-ответов, генерации контента и поиска.",
"llama-3.1-70b-versatile.description": "Llama 3.1 70B обеспечивает улучшенное логическое мышление для сложных приложений, поддерживая высокую вычислительную нагрузку с высокой эффективностью и точностью.",
"llama-3.1-8b-instant.description": "Llama 3.1 8B — высокоэффективная модель с быстрой генерацией текста, идеально подходящая для масштабных и экономичных приложений.",
@@ -782,7 +789,6 @@
"llama-3.2-90b-vision-preview.description": "Llama 3.2 разработана для задач, сочетающих зрение и текст, превосходно справляется с описанием изображений и визуальными вопросами-ответами, объединяя генерацию языка и визуальное мышление.",
"llama-3.2-vision-instruct.description": "Модель Llama 3.2-Vision, настроенная на выполнение инструкций, оптимизирована для визуального распознавания, логики по изображениям, описания и общих визуальных вопросов-ответов.",
"llama-3.3-70b-versatile.description": "Meta Llama 3.3 — многоязычная LLM с 70B параметров (ввод/вывод текста), доступна в вариантах предварительного обучения и настройки на инструкции. Вариант, настроенный на инструкции, оптимизирован для многоязычного диалога и превосходит многие открытые и закрытые модели чатов по отраслевым бенчмаркам.",
"llama-3.3-70b.description": "Llama 3.3 70B: модель среднего и крупного размера, обеспечивающая баланс между логикой и пропускной способностью.",
"llama-3.3-instruct.description": "Модель Llama 3.3, настроенная на выполнение инструкций, оптимизирована для чатов и превосходит многие открытые модели чатов по отраслевым бенчмаркам.",
"llama3-70b-8192.description": "Meta Llama 3 70B обеспечивает исключительную обработку сложных задач для требовательных проектов.",
"llama3-8b-8192.description": "Meta Llama 3 8B демонстрирует высокую логическую производительность в различных сценариях.",
@@ -832,7 +838,6 @@
"meta-llama/llama-3.1-8b-instruct:free.description": "LLaMA 3.1 поддерживает многоязычие и является одной из ведущих генеративных моделей.",
"meta-llama/llama-3.2-11b-vision-instruct.description": "LLaMA 3.2 разработан для задач, сочетающих зрение и текст. Превосходно справляется с описанием изображений и визуальными вопросами-ответами, объединяя генерацию языка и визуальное рассуждение.",
"meta-llama/llama-3.2-3b-instruct.description": "meta-llama/llama-3.2-3b-instruct",
"meta-llama/llama-3.2-90b-vision-instruct.description": "LLaMA 3.2 разработан для задач, сочетающих зрение и текст. Превосходно справляется с описанием изображений и визуальными вопросами-ответами, объединяя генерацию языка и визуальное рассуждение.",
"meta-llama/llama-3.3-70b-instruct.description": "Llama 3.3 — самая продвинутая многоязычная модель Llama с открытым исходным кодом, обеспечивающая производительность, близкую к 405B, при очень низкой стоимости. Основана на архитектуре Transformer и улучшена с помощью SFT и RLHF для повышения полезности и безопасности. Вариант, настроенный на инструкции, оптимизирован для многоязычного чата и превосходит многие открытые и закрытые модели в отраслевых бенчмарках. Дата отсечения знаний: декабрь 2023.",
"meta-llama/llama-3.3-70b-instruct:free.description": "Llama 3.3 — самая продвинутая многоязычная модель Llama с открытым исходным кодом, обеспечивающая производительность, близкую к 405B, при очень низкой стоимости. Основана на архитектуре Transformer и улучшена с помощью SFT и RLHF для повышения полезности и безопасности. Вариант, настроенный на инструкции, оптимизирован для многоязычного чата и превосходит многие открытые и закрытые модели в отраслевых бенчмарках. Дата отсечения знаний: декабрь 2023.",
"meta.llama3-1-405b-instruct-v1:0.description": "Meta Llama 3.1 405B Instruct — самая крупная и мощная модель Llama 3.1 Instruct, высокоразвитая модель для диалогового рассуждения и генерации синтетических данных, а также прочная основа для дообучения в конкретных доменах. Многоязычные LLM Llama 3.1 — это набор предварительно обученных и настроенных на инструкции моделей генерации в размерах 8B, 70B и 405B (ввод текста/вывод текста). Модели, настроенные на инструкции, оптимизированы для многоязычного диалога и превосходят многие доступные открытые чат-модели в отраслевых бенчмарках. Llama 3.1 предназначена для коммерческого и исследовательского использования на разных языках. Модели, настроенные на инструкции, подходят для чатов в стиле помощника, а предварительно обученные модели — для более широких задач генерации естественного языка. Выводы Llama 3.1 также можно использовать для улучшения других моделей, включая генерацию и доработку синтетических данных. Llama 3.1 — это авторегрессионная модель Transformer с оптимизированной архитектурой. Настроенные версии используют SFT и RLHF для соответствия человеческим предпочтениям в полезности и безопасности.",
@@ -894,7 +899,7 @@
"mistral-large-instruct.description": "Mistral-Large-Instruct-2407 — продвинутая плотная LLM с 123 миллиардами параметров, обладающая передовыми возможностями рассуждения, знаний и программирования.",
"mistral-large-latest.description": "Mistral Large — флагманская модель, сильная в многоязычных задачах, сложном рассуждении и генерации кода — идеально подходит для высокоуровневых приложений.",
"mistral-large.description": "Mixtral Large — флагманская модель от Mistral, сочетающая генерацию кода, математику и рассуждение с контекстным окном на 128K.",
"mistral-medium-latest.description": "Mistral Medium 3 обеспечивает передовую производительность при 8-кратном снижении стоимости и упрощает корпоративное внедрение.",
"mistral-medium-latest.description": "Mistral Medium 3.1 обеспечивает передовую производительность при 8-кратном снижении затрат и упрощает корпоративное развертывание.",
"mistral-nemo-instruct.description": "Mistral-Nemo-Instruct-2407 — версия модели Mistral-Nemo-Base-2407, адаптированная под инструкции.",
"mistral-nemo.description": "Mistral Nemo — высокоэффективная модель на 12B параметров от Mistral AI и NVIDIA.",
"mistral-small-latest.description": "Mistral Small — экономичное, быстрое и надежное решение для перевода, суммирования и анализа тональности.",
@@ -933,7 +938,7 @@
"moonshot-v1-auto.description": "Moonshot V1 Auto автоматически выбирает подходящую модель в зависимости от текущего использования токенов контекста.",
"moonshotai/Kimi-Dev-72B.description": "Kimi-Dev-72B — открытая языковая модель для программирования, оптимизированная с помощью масштабного обучения с подкреплением для создания надёжных, готовых к производству патчей. Набирает 60.4% на SWE-bench Verified, устанавливая новый рекорд среди открытых моделей для задач автоматизированной разработки ПО, таких как исправление ошибок и ревью кода.",
"moonshotai/Kimi-K2-Instruct-0905.description": "Kimi K2-Instruct-0905 — новейшая и самая мощная версия Kimi K2. Это топовая модель MoE с 1 триллионом общих и 32 миллиардами активных параметров. Ключевые особенности: улучшенный интеллект в программировании агентов, значительный прирост в бенчмарках и реальных задачах, а также улучшенная эстетика и удобство фронтенд-кода.",
"moonshotai/Kimi-K2-Thinking.description": "Kimi K2 Thinking — самая мощная открытая модель для рассуждений. Существенно увеличивает глубину многошагового мышления и стабильно использует инструменты на протяжении 200–300 последовательных вызовов. Устанавливает новые рекорды на Humanity's Last Exam (HLE), BrowseComp и других бенчмарках. Отлично справляется с программированием, математикой, логикой и агентными сценариями. Построена на архитектуре MoE с ~1 триллионом параметров, поддерживает окно контекста 256K и вызов инструментов.",
"moonshotai/Kimi-K2-Thinking.description": "Kimi K2 Thinking — это последняя и самая мощная открытая модель мышления. Она значительно увеличивает глубину многошагового рассуждения и поддерживает стабильное использование инструментов в течение 200–300 последовательных вызовов, устанавливая новые рекорды на Humanity's Last Exam (HLE), BrowseComp и других тестах. Она превосходна в программировании, математике, логике и сценариях агентов. Построена на архитектуре MoE с ~1 триллионом общих параметров, поддерживает окно контекста 256K и вызов инструментов.",
"moonshotai/kimi-k2-0711.description": "Kimi K2 0711 — вариант instruct в серии Kimi, предназначен для высококачественного кода и использования инструментов.",
"moonshotai/kimi-k2-0905.description": "Kimi K2 0905 — обновление, расширяющее контекст и логические возможности с оптимизациями для программирования.",
"moonshotai/kimi-k2-instruct-0905.description": "Модель kimi-k2-0905-preview поддерживает окно контекста 256K, обладает улучшенными возможностями программирования агентов, более качественным и практичным фронтенд-кодом и лучшим пониманием контекста.",
@@ -948,8 +953,8 @@
"nvidia/Llama-3.1-Nemotron-70B-Instruct-HF.description": "Llama 3.1 Nemotron 70B — кастомизированная модель от NVIDIA, улучшающая полезность. Демонстрирует высокие результаты на Arena Hard, AlpacaEval 2 LC и GPT-4-Turbo MT-Bench, занимая первое место на всех трёх бенчмарках авто-выравнивания по состоянию на 1 октября 2024 года. Обучена на основе Llama-3.1-70B-Instruct с использованием RLHF (REINFORCE), Llama-3.1-Nemotron-70B-Reward и HelpSteer2-Preference prompts.",
"nvidia/llama-3.1-nemotron-51b-instruct.description": "Уникальная языковая модель с выдающейся точностью и эффективностью.",
"nvidia/llama-3.1-nemotron-70b-instruct.description": "Llama-3.1-Nemotron-70B-Instruct — кастомизированная модель от NVIDIA, созданная для повышения полезности ответов LLM.",
"o1-mini.description": "Меньше и быстрее, чем o1-preview, на 80% дешевле, силен в генерации кода и задачах с коротким контекстом.",
"o1-preview.description": "Сфокусирован на продвинутом рассуждении и решении сложных задач, включая математику и науку. Идеален для приложений, требующих глубокого понимания контекста и автономных рабочих процессов.",
"o1-mini.description": "o1-mini — это быстрая, экономичная модель рассуждений, разработанная для программирования, математики и науки. Она имеет контекст 128K и отсечку знаний на октябрь 2023 года.",
"o1-preview.description": "o1 — это новая модель рассуждений от OpenAI для сложных задач, требующих обширных знаний. Она имеет контекст 128K и отсечку знаний на октябрь 2023 года.",
"o1-pro.description": "Серия o1 обучена с использованием обучения с подкреплением для предварительного обдумывания ответов и решения сложных задач. o1-pro использует больше вычислений для более глубокого мышления и стабильно высокого качества ответов.",
"o1.description": "o1 — новая модель рассуждения от OpenAI с вводом текст+изображение и текстовым выводом, подходящая для сложных задач, требующих обширных знаний. Имеет контекстное окно 200K и отсечку знаний на октябрь 2023 года.",
"o3-2025-04-16.description": "o3 — новая модель рассуждения от OpenAI с вводом текст+изображение и текстовым выводом для сложных задач, требующих обширных знаний.",
@@ -1022,7 +1027,6 @@
"qianfan-check-vl.description": "Qianfan Check VL — это мультимодальная модель для проверки соответствия контента изображений и текста, а также задач распознавания.",
"qianfan-composition.description": "Qianfan Composition — это мультимодальная модель для создания и понимания смешанного контента изображение-текст.",
"qianfan-engcard-vl.description": "Qianfan EngCard VL — это мультимодальная модель распознавания, ориентированная на англоязычные сценарии.",
"qianfan-lightning-128b-a19b.description": "Qianfan Lightning 128B A19B — это высокопроизводительная китайская универсальная модель для сложных вопросов и масштабного рассуждения.",
"qianfan-llama-vl-8b.description": "Qianfan Llama VL 8B — мультимодальная модель на базе Llama для общего понимания изображений и текста.",
"qianfan-multipicocr.description": "Qianfan MultiPicOCR — это модель OCR для нескольких изображений, предназначенная для обнаружения и распознавания текста на изображениях.",
"qianfan-qi-vl.description": "Qianfan QI VL — мультимодальная модель для точного поиска и ответов на вопросы в сложных сценариях изображение-текст.",
@@ -1032,7 +1036,6 @@
"qvq-72b-preview.description": "QVQ-72B-Preview — это экспериментальная исследовательская модель от Qwen, направленная на улучшение визуального рассуждения.",
"qvq-max.description": "Модель визуального рассуждения Qwen QVQ поддерживает ввод изображений и вывод в виде цепочки рассуждений, демонстрируя высокую производительность в математике, программировании, визуальном анализе, творческих и общих задачах.",
"qvq-plus.description": "Модель визуального рассуждения с вводом изображений и выводом в виде цепочки рассуждений. Серия qvq-plus следует за qvq-max и обеспечивает более быстрое рассуждение с лучшим соотношением качества и стоимости.",
"qwen-3-32b.description": "Qwen 3 32B: сильна в многоязычных и программных задачах, подходит для средне-масштабного промышленного использования.",
"qwen-coder-plus.description": "Модель программирования Qwen.",
"qwen-coder-turbo-latest.description": "Модель программирования Qwen.",
"qwen-coder-turbo.description": "Модель программирования Qwen.",
@@ -1128,7 +1131,6 @@
"qwen3-coder-next.description": "Следующее поколение Qwen coder, оптимизированное для сложной генерации кода из нескольких файлов, отладки и высокопроизводительных рабочих процессов агентов. Разработано для сильной интеграции инструментов и улучшенной производительности рассуждений.",
"qwen3-coder-plus.description": "Модель кода Qwen. Новейшая серия Qwen3-Coder основана на Qwen3 и обладает мощными возможностями кодирующего агента, использования инструментов и взаимодействия со средой для автономного программирования, с отличной производительностью кода и общей функциональностью.",
"qwen3-coder:480b.description": "Высокопроизводительная модель от Alibaba с длинным контекстом для задач агентов и программирования.",
"qwen3-max-2026-01-23.description": "Модели Qwen3 Max значительно превосходят серию 2.5 по общей способности, пониманию китайского/английского, следованию сложным инструкциям, выполнению субъективных задач, многоязычности и использованию инструментов, с меньшим количеством галлюцинаций. Последняя версия qwen3-max улучшает агентное программирование и использование инструментов по сравнению с qwen3-max-preview. Эта версия достигает уровня SOTA и ориентирована на более сложные агентные задачи.",
"qwen3-max-preview.description": "Лучшая модель Qwen для сложных многошаговых задач. Превью-версия поддерживает рассуждение.",
"qwen3-max.description": "Модели Qwen3 Max значительно превосходят серию 2.5 по общим возможностям, пониманию китайского и английского языков, следованию сложным инструкциям, выполнению открытых задач, многоязычности и использованию инструментов, с меньшим количеством галлюцинаций. Последняя версия qwen3-max улучшает программирование агентов и использование инструментов по сравнению с qwen3-max-preview. Эта версия достигает SOTA в своей области и ориентирована на более сложные потребности агентов.",
"qwen3-next-80b-a3b-instruct.description": "Модель следующего поколения Qwen3 без рассуждений с открытым исходным кодом. По сравнению с предыдущей версией (Qwen3-235B-A22B-Instruct-2507), улучшено понимание китайского языка, логическое мышление и генерация текста.",
@@ -1145,7 +1147,8 @@
"qwen3-vl-flash.description": "Qwen3 VL Flash: легковесная, высокоскоростная версия рассуждений для задач с низкой задержкой или высоким объемом запросов.",
"qwen3-vl-plus.description": "Qwen VL — модель генерации текста с пониманием изображений. Поддерживает OCR, а также умеет обобщать и рассуждать, например, извлекать атрибуты с фото товаров или решать задачи по изображениям.",
"qwen3.5-397b-a17b.description": "Поддерживает текст, изображения и видео. Для задач только с текстом его производительность сопоставима с Qwen3 Max, обеспечивая более высокую эффективность и меньшую стоимость. В мультимодальных возможностях он демонстрирует значительные улучшения по сравнению с серией Qwen3 VL.",
"qwen3.5-plus.description": "Qwen3.5 Plus поддерживает текст, изображения и видео. Для задач только с текстом его производительность сопоставима с Qwen3 Max, обеспечивая более высокую эффективность и меньшую стоимость. В мультимодальных возможностях он демонстрирует значительные улучшения по сравнению с серией Qwen3 VL.",
"qwen3.5-plus.description": "Qwen3.5 Plus поддерживает текстовый, графический и видео ввод. Её производительность в чисто текстовых задачах сопоставима с Qwen3 Max, с лучшей производительностью и меньшими затратами. Её мультимодальные возможности значительно улучшены по сравнению с серией Qwen3 VL.",
"qwen3.5:397b.description": "Qwen3.5 — это унифицированная модель для работы с текстом и изображениями с гибридной архитектурой (Mixture-of-Experts + линейное внимание), предлагающая сильные мультимодальные возможности рассуждения, программирования и работы с длинным контекстом с окном 256K.",
"qwen3.description": "Qwen3 — это LLM нового поколения от Alibaba с высокой производительностью в различных сценариях использования.",
"qwq-32b-preview.description": "QwQ — экспериментальная исследовательская модель от Qwen, ориентированная на улучшенный логический вывод.",
"qwq-32b.description": "QwQ — модель логического вывода из семейства Qwen. По сравнению со стандартными моделями, обученными на инструкциях, она обеспечивает более глубокое мышление и логический анализ, значительно повышая производительность на сложных задачах. QwQ-32B — среднеразмерная модель, сопоставимая с ведущими моделями, такими как DeepSeek-R1 и o1-mini.",
@@ -1187,7 +1190,7 @@
"step-2-16k.description": "Поддержка взаимодействия с большим контекстом для сложных диалогов.",
"step-2-mini.description": "Построена на архитектуре MFA следующего поколения, обеспечивает производительность уровня Step-1 при значительно меньших затратах, с высокой пропускной способностью и низкой задержкой. Отлично справляется с общими задачами и программированием.",
"step-2x-large.description": "Модель нового поколения StepFun для генерации изображений, создает изображения высокого качества по текстовому описанию. Обеспечивает реалистичную текстуру и качественную отрисовку текста на китайском и английском языках.",
"step-3.5-flash.description": "Флагманская модель языковых рассуждений от Stepfun. Эта модель обеспечивает первоклассные возможности рассуждений вместе с быстрой и надежной реализацией. Она может разбирать и планировать сложные задачи, быстро и надежно вызывать инструменты для их выполнения, а также превосходить в логических рассуждениях, математике, программной инженерии, глубоких исследованиях и других сложных задачах. Длина контекста составляет 256K.",
"step-3.5-flash.description": "Флагманская модель языкового рассуждения от Stepfun. Эта модель обладает первоклассными возможностями рассуждения и быстрой и надёжной способностью выполнения задач. Она способна разбирать и планировать сложные задачи, быстро и надёжно вызывать инструменты для выполнения задач, а также справляться с различными сложными задачами, такими как логическое рассуждение, математика, разработка программного обеспечения и углублённые исследования.",
"step-3.description": "Модель с мощным визуальным восприятием и сложным логическим выводом, точно обрабатывает знания из разных областей, анализ математики и изображений, а также широкий спектр повседневных визуальных задач.",
"step-r1-v-mini.description": "Модель логического вывода с продвинутым пониманием изображений, способна обрабатывать изображения и текст, а затем генерировать текст после глубокого анализа. Отлично справляется с визуальной логикой, математикой, программированием и текстовыми задачами, поддерживает контекст до 100K.",
"stepfun-ai/step3.description": "Step3 — передовая мультимодальная модель логического вывода от StepFun, построенная на архитектуре MoE с 321 миллиардами параметров (38 миллиардов активных). Эффективна по затратам на декодирование и обеспечивает высококлассный логико-визуальный анализ. Благодаря архитектурам MFA и AFD работает эффективно как на флагманских, так и на недорогих ускорителях. Предобучена на более чем 20 триллионах текстов и 4 триллионах пар изображение-текст на разных языках. Достигает лидирующих результатов среди открытых моделей в математике, программировании и мультимодальных задачах.",
@@ -1276,10 +1279,11 @@
"z-ai/glm4.7.description": "GLM-4.7 — это последняя флагманская модель Zhipu, улучшенная для сценариев Agentic Coding с улучшенными возможностями кодирования.",
"z-ai/glm5.description": "GLM-5 — это новая флагманская базовая модель Zhipu AI для инженерии агентов, достигающая открытого SOTA-результата в кодировании и возможностях агентов. Она сопоставима с производительностью Claude Opus 4.5.",
"z-image-turbo.description": "Z-Image — это легковесная модель генерации изображений из текста, которая может быстро создавать изображения, поддерживает рендеринг текста на китайском и английском языках, а также гибко адаптируется к различным разрешениям и соотношениям сторон.",
"zai-glm-4.7.description": "Эта модель обеспечивает высокую производительность в программировании с продвинутыми возможностями рассуждения, превосходным использованием инструментов и улучшенной реальной производительностью в агентных приложениях для программирования.",
"zai-org/GLM-4.5-Air.description": "GLM-4.5-Air — базовая модель для агентных приложений с архитектурой Mixture-of-Experts. Оптимизирована для использования инструментов, веб-браузинга, программной инженерии и фронтенд-разработки, интегрируется с агентами кода, такими как Claude Code и Roo Code. Использует гибридное рассуждение для решения как сложных, так и повседневных задач.",
"zai-org/GLM-4.5.description": "GLM-4.5 — базовая модель, созданная для агентных приложений с архитектурой Mixture-of-Experts. Глубоко оптимизирована для использования инструментов, веб-браузинга, программной инженерии и фронтенд-разработки, интегрируется с агентами кода, такими как Claude Code и Roo Code. Использует гибридное рассуждение для решения как сложных, так и повседневных задач.",
"zai-org/GLM-4.5V.description": "GLM-4.5V — последняя мультимодальная модель Zhipu AI, построенная на флагманской текстовой модели GLM-4.5-Air (106B всего, 12B активно) с архитектурой MoE для высокой производительности при низкой стоимости. Следует пути GLM-4.1V-Thinking и добавляет 3D-RoPE для улучшения пространственного 3D-рассуждения. Оптимизирована через предобучение, SFT и RL, обрабатывает изображения, видео и длинные документы, занимает лидирующие позиции среди открытых моделей на 41 мультимодальном бенчмарке. Переключатель Thinking mode позволяет пользователям выбирать между скоростью и глубиной.",
"zai-org/GLM-4.6.description": "По сравнению с GLM-4.5, GLM-4.6 расширяет контекст с 128K до 200K для более сложных агентных задач. Получает более высокие оценки на бенчмарках кода и демонстрирует лучшую производительность в реальных приложениях, таких как Claude Code, Cline, Roo Code и Kilo Code, включая улучшенную генерацию фронтенд-страниц. Улучшено рассуждение и поддержка инструментов во время рассуждения, что усиливает общие возможности. Лучше интегрируется в агентные фреймворки, улучшает агентов поиска/инструментов и обладает более естественным стилем письма и ролевой игрой, предпочтительным для человека.",
"zai-org/GLM-4.6V.description": "GLM-4.6V достигает SOTA точности в визуальном понимании для моделей аналогичного масштаба параметров и впервые интегрирует возможность Function Call (вызов инструментов) непосредственно в архитектуру визуальной модели, создавая связь от «визуального восприятия» до «исполняемых действий (Action)», предоставляя единую технологическую основу для мультимодальных агентов в реальных бизнес-сценариях.",
"zai/glm-4.5-air.description": "GLM-4.5 и GLM-4.5-Air — наши последние флагманские модели для агентных приложений, обе используют MoE. GLM-4.5 имеет 355B параметров всего и 32B активно на проход; GLM-4.5-Air — более легкая версия с 106B всего и 12B активно.",
"zai/glm-4.5.description": "Серия GLM-4.5 разработана для агентов. Флагманская модель GLM-4.5 сочетает рассуждение, программирование и агентные навыки с 355B параметров (32B активно) и предлагает два режима работы как гибридная система рассуждения.",
"zai/glm-4.5v.description": "GLM-4.5V построена на базе GLM-4.5-Air, унаследовав проверенные техники GLM-4.1V-Thinking и масштабируясь с мощной архитектурой MoE на 106B параметров.",
+14
View File
@@ -24,6 +24,20 @@
"builtins.lobe-agent-builder.inspector.noResults": "Нет результатов",
"builtins.lobe-agent-builder.inspector.togglePlugin": "Переключить",
"builtins.lobe-agent-builder.title": "Эксперт по созданию агентов",
"builtins.lobe-agent-management.apiName.callAgent": "Вызвать агента",
"builtins.lobe-agent-management.apiName.createAgent": "Создать агента",
"builtins.lobe-agent-management.apiName.deleteAgent": "Удалить агента",
"builtins.lobe-agent-management.apiName.searchAgent": "Искать агентов",
"builtins.lobe-agent-management.apiName.updateAgent": "Обновить агента",
"builtins.lobe-agent-management.inspector.callAgent.sync": "Вызов:",
"builtins.lobe-agent-management.inspector.callAgent.task": "Назначение задачи для:",
"builtins.lobe-agent-management.inspector.createAgent.title": "Создание агента:",
"builtins.lobe-agent-management.inspector.searchAgent.all": "Искать агентов:",
"builtins.lobe-agent-management.inspector.searchAgent.market": "Искать на рынке:",
"builtins.lobe-agent-management.inspector.searchAgent.results": "{{count}} результатов",
"builtins.lobe-agent-management.inspector.searchAgent.user": "Искать моих агентов:",
"builtins.lobe-agent-management.inspector.updateAgent.title": "Обновление агента:",
"builtins.lobe-agent-management.title": "Менеджер агентов",
"builtins.lobe-cloud-sandbox.apiName.editLocalFile": "Редактировать файл",
"builtins.lobe-cloud-sandbox.apiName.executeCode": "Выполнить код",
"builtins.lobe-cloud-sandbox.apiName.exportFile": "Экспортировать файл",
+3
View File
@@ -724,6 +724,9 @@
"tools.builtins.lobe-artifacts.description": "Создавайте и просматривайте в реальном времени интерактивные UI-компоненты, визуализации данных, графики, SVG-изображения и веб-приложения. Создавайте насыщенный визуальный контент с возможностью взаимодействия.",
"tools.builtins.lobe-artifacts.readme": "Создавайте и просматривайте в реальном времени интерактивные UI-компоненты, визуализации данных, графики, SVG-изображения и веб-приложения. Создавайте насыщенный визуальный контент, с которым пользователи могут взаимодействовать напрямую.",
"tools.builtins.lobe-artifacts.title": "Артефакты",
"tools.builtins.lobe-calculator.description": "Выполняйте математические расчеты, решайте уравнения и работайте с символьными выражениями",
"tools.builtins.lobe-calculator.readme": "Продвинутый математический калькулятор, поддерживающий базовую арифметику, алгебраические уравнения, операции с исчислением и символьную математику. Включает преобразование оснований, решение уравнений, дифференцирование, интегрирование и многое другое.",
"tools.builtins.lobe-calculator.title": "Калькулятор",
"tools.builtins.lobe-cloud-sandbox.description": "Выполняйте код на Python, JavaScript и TypeScript в изолированной облачной среде. Запускайте команды оболочки, управляйте файлами, ищите с помощью регулярных выражений и безопасно экспортируйте результаты.",
"tools.builtins.lobe-cloud-sandbox.readme": "Выполняйте код на Python, JavaScript и TypeScript в изолированной облачной среде. Запускайте команды оболочки, управляйте файлами, ищите контент с помощью регулярных выражений и безопасно экспортируйте результаты.",
"tools.builtins.lobe-cloud-sandbox.title": "Облачная песочница",
+7 -3
View File
@@ -224,15 +224,18 @@
"providerModels.item.modelConfig.extendParams.options.gpt5_2ProReasoningEffort.hint": "GPT-5.2 Pro serisi için; akıl yürütme yoğunluğunu kontrol eder.",
"providerModels.item.modelConfig.extendParams.options.gpt5_2ReasoningEffort.hint": "GPT-5.2 serisi için; akıl yürütme yoğunluğunu kontrol eder.",
"providerModels.item.modelConfig.extendParams.options.imageAspectRatio.hint": "Gemini görsel üretim modelleri için; oluşturulan görsellerin en-boy oranını kontrol eder.",
"providerModels.item.modelConfig.extendParams.options.imageAspectRatio2.hint": "Nano Banana 2 için; oluşturulan görüntülerin en-boy oranını kontrol eder (ekstra geniş 1:4, 4:1, 1:8, 8:1 desteklenir).",
"providerModels.item.modelConfig.extendParams.options.imageResolution.hint": "Gemini 3 görsel üretim modelleri için; oluşturulan görsellerin çözünürlüğünü kontrol eder.",
"providerModels.item.modelConfig.extendParams.options.imageResolution2.hint": "Gemini 3.1 Flash Image modelleri için; oluşturulan görüntülerin çözünürlüğünü kontrol eder (512px desteklenir).",
"providerModels.item.modelConfig.extendParams.options.reasoningBudgetToken.hint": "Claude, Qwen3 ve benzeri modeller için; akıl yürütme için ayrılan token bütçesini kontrol eder.",
"providerModels.item.modelConfig.extendParams.options.reasoningEffort.hint": "OpenAI ve akıl yürütme yeteneğine sahip diğer modeller için; akıl yürütme çabasını kontrol eder.",
"providerModels.item.modelConfig.extendParams.options.textVerbosity.hint": "GPT-5+ serisi için; çıktıdaki ayrıntı düzeyini kontrol eder.",
"providerModels.item.modelConfig.extendParams.options.thinking.hint": "Bazı Doubao modelleri için; modelin derin düşünme gerekip gerekmediğine karar vermesine izin verir.",
"providerModels.item.modelConfig.extendParams.options.thinkingBudget.hint": "Gemini serisi için; düşünme bütçesini kontrol eder.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel.hint": "Gemini 3 Flash Önizleme modelleri için; düşünme derinliğini kontrol eder.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel2.hint": "Gemini 3 Pro Önizleme modelleri için; düşünme derinliğini kontrol eder.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel3.hint": "Gemini 3.1 Pro Önizleme modelleri için; düşünme derinliğini düşük/orta/yüksek seviyelerle kontrol eder.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel.hint": "Gemini 3 Flash Preview modelleri için; düşünme derinliğini kontrol eder.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel2.hint": "Gemini 3 Pro Preview modelleri için; düşünme derinliğini kontrol eder.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel3.hint": "Gemini 3.1 Pro Preview modelleri için; düşük/orta/yüksek seviyelerde düşünme derinliğini kontrol eder.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel4.hint": "Gemini 3.1 Flash Image modelleri için; düşünmeyi aç/kapat seçeneği.",
"providerModels.item.modelConfig.extendParams.options.urlContext.hint": "Gemini serisi için; URL bağlamı sağlamayı destekler.",
"providerModels.item.modelConfig.extendParams.placeholder": "Etkinleştirilecek gelişmiş parametreleri seçin",
"providerModels.item.modelConfig.extendParams.previewFallback": "Önizleme kullanılamıyor",
@@ -311,6 +314,7 @@
"providerModels.tabs.image": "Görsel",
"providerModels.tabs.stt": "ASR",
"providerModels.tabs.tts": "TTS",
"providerModels.tabs.video": "Video",
"sortModal.success": "Sıralama güncellemesi başarılı",
"sortModal.title": "Özel Sıralama",
"sortModal.update": "Güncelle",
+35 -31
View File
@@ -55,7 +55,8 @@
"FLUX.1-dev.description": "FLUX.1-dev, Black Forest Labs tarafından geliştirilen açık kaynaklı çok modlu bir dil modelidir (MLLM). Görsel/metin anlama ve üretimini birleştirerek görsel-metin görevleri için optimize edilmiştir. Gelişmiş dil modelleri (örneğin Mistral-7B) üzerine inşa edilmiştir ve dikkatle tasarlanmış bir görsel kodlayıcı ile çok aşamalı yönerge ayarı kullanarak çok modlu koordinasyon ve karmaşık görev akıl yürütmesini mümkün kılar.",
"Gryphe/MythoMax-L2-13b.description": "MythoMax-L2 (13B), çeşitli alanlar ve karmaşık görevler için yenilikçi bir modeldir.",
"HelloMeme.description": "HelloMeme, sağladığınız görseller veya hareketlerden meme, GIF veya kısa video oluşturan bir yapay zeka aracıdır. Çizim veya kodlama becerisi gerekmez—sadece bir referans görsel yeterlidir. Eğlenceli, dikkat çekici ve stil açısından tutarlı içerikler üretir.",
"HiDream-I1-Full.description": "HiDream-E1-Full, HiDream.ai tarafından geliştirilen açık kaynaklı çok modlu bir görsel düzenleme modelidir. Gelişmiş Difüzyon Dönüştürücü mimarisi ve güçlü dil anlama (yerleşik LLaMA 3.1-8B-Instruct) üzerine kuruludur. Doğal dil ile yönlendirilen görsel üretimi, stil aktarımı, yerel düzenlemeler ve yeniden boyama işlemlerini destekler. Görsel-metin anlama ve uygulama konusunda üst düzey performans sunar.",
"HiDream-E1-Full.description": "HiDream-E1-Full, HiDream.ai tarafından geliştirilen açık kaynaklı bir çok modlu görüntü düzenleme modelidir. Gelişmiş Diffusion Transformer mimarisi ve güçlü dil anlayışı (yerleşik LLaMA 3.1-8B-Instruct) üzerine kuruludur. Doğal dil odaklı görüntü oluşturma, stil transferi, yerel düzenlemeler ve yeniden boyama işlemlerini destekler ve mükemmel görüntü-metni anlama ve uygulama yeteneklerine sahiptir.",
"HiDream-I1-Full.description": "HiDream-I1, HiDream tarafından piyasaya sürülen yeni bir açık kaynaklı temel görüntü oluşturma modelidir. 17B parametreye (Flux 12B'ye sahiptir) sahip olan bu model, saniyeler içinde sektör lideri görüntü kalitesi sunabilir.",
"HunyuanDiT-v1.2-Diffusers-Distilled.description": "hunyuandit-v1.2-distilled, düşük kaynaklı ortamlarda ve gerçek zamanlı üretim için optimize edilmiş, yüksek kaliteli görselleri hızlıca üretebilen hafif bir metinden-görüntüye modeldir.",
"InstantCharacter.description": "InstantCharacter, Tencent AI tarafından 2025 yılında yayınlanan, ayarlama gerektirmeyen kişiselleştirilmiş karakter üretim modelidir. Tek bir referans görselden karakter modelleyebilir ve bu karakteri farklı stiller, hareketler ve arka planlara esnek şekilde aktarabilir. Yüksek doğrulukta ve senaryolar arası tutarlı karakter üretimi hedefler.",
"InternVL2-8B.description": "InternVL2-8B, çok modlu görsel-metin işleme destekleyen güçlü bir görsel-dil modelidir. Görsel içeriği doğru şekilde tanır ve ilgili açıklamalar veya yanıtlar üretir.",
@@ -80,7 +81,7 @@
"MiniMax-M2.1.description": "MiniMax-M2.1, MiniMax tarafından geliştirilen amiral gemisi açık kaynak büyük modeldir ve karmaşık gerçek dünya görevlerini çözmeye odaklanır. Temel güçlü yönleri çok dilli programlama yetenekleri ve bir Ajan olarak karmaşık görevleri çözme becerisidir.",
"MiniMax-M2.5-Lightning.description": "M2.5 Lightning: Aynı performans, daha hızlı ve daha çevik (yaklaşık 100 tps).",
"MiniMax-M2.5-highspeed.description": "M2.5 ile aynı performans, ancak önemli ölçüde daha hızlı çıkarım.",
"MiniMax-M2.5.description": "Üst düzey performans ve nihai maliyet etkinliği, karmaşık görevleri kolayca yönetir (yaklaşık 60 tps).",
"MiniMax-M2.5.description": "MiniMax-M2.5, MiniMax'in karmaşık gerçek dünya görevlerini çözmeye odaklanan amiral gemisi açık kaynaklı büyük modelidir. Temel güçlü yönleri çok dilli programlama yetenekleri ve bir Agent olarak karmaşık görevleri çözme yeteneğidir.",
"MiniMax-M2.description": "Verimli kodlama ve Akıllı Ajan iş akışları için özel olarak geliştirilmiştir",
"MiniMax-Text-01.description": "MiniMax-01, klasik Dönüştürücüler ötesinde büyük ölçekli doğrusal dikkat sunar. 456B parametreye ve geçiş başına 45.9B etkin parametreye sahiptir. Üst düzey performans sunar ve 4M bağlam (32× GPT-4o, 20× Claude-3.5-Sonnet) destekler.",
"MiniMaxAI/MiniMax-M1-80k.description": "MiniMax-M1, 456B toplam parametreye ve token başına yaklaşık 45.9B etkin parametreye sahip açık ağırlıklı büyük ölçekli karma dikkatli bir akıl yürütme modelidir. Doğal olarak 1M bağlamı destekler ve 100K-token üretiminde FLOPları %75 azaltmak için Flash Attention kullanır. MoE mimarisi, CISPO ve karma dikkatli RL eğitimi ile uzun girişli akıl yürütme ve gerçek yazılım mühendisliği görevlerinde lider performans sunar.",
@@ -98,6 +99,7 @@
"Phi-3.5-mini-instruct.description": "Phi-3-mini modelinin güncellenmiş versiyonudur.",
"Phi-3.5-vision-instrust.description": "Phi-3-vision modelinin güncellenmiş versiyonudur.",
"Pro/MiniMaxAI/MiniMax-M2.1.description": "MiniMax-M2.1, açık kaynaklı bir büyük dil modeli olup, ajan yetenekleri için optimize edilmiştir. Programlama, araç kullanımı, talimatlara uyum ve uzun vadeli planlama konularında üstün performans sergiler. Model, çok dilli yazılım geliştirme ve karmaşık çok adımlı iş akışlarını yürütme desteği sunar. SWE-bench Verified testinde 74.0 puan alarak Claude Sonnet 4.5i çok dilli senaryolarda geride bırakmıştır.",
"Pro/MiniMaxAI/MiniMax-M2.5.description": "MiniMax-M2.5, MiniMax tarafından geliştirilen en son büyük dil modelidir ve yüz binlerce karmaşık gerçek dünya ortamında büyük ölçekli pekiştirmeli öğrenme ile eğitilmiştir. 229 milyar parametreye sahip MoE mimarisi ile programlama, araç çağırma, arama ve ofis senaryoları gibi görevlerde sektör lideri performans sağlar.",
"Pro/Qwen/Qwen2-7B-Instruct.description": "Qwen2-7B-Instruct, Qwen2 serisinde yer alan 7B parametreli, yönergeye göre ayarlanmış bir büyük dil modelidir. Transformer mimarisi, SwiGLU, dikkat QKV önyargısı ve gruplandırılmış sorgu dikkat mekanizması kullanır; büyük girişleri işleyebilir. Dil anlama, üretim, çok dilli görevler, kodlama, matematik ve akıl yürütme alanlarında güçlü performans gösterir. Çoğu açık modeli geride bırakır ve özel modellerle rekabet eder. Qwen1.5-7B-Chat modelini birçok ölçüt üzerinde geçmiştir.",
"Pro/Qwen/Qwen2.5-7B-Instruct.description": "Qwen2.5-7B-Instruct, Alibaba Cloudun en yeni büyük dil modeli serisinin bir parçasıdır. 7B modeli, kodlama ve matematikte önemli kazanımlar sağlar, 29'dan fazla dili destekler ve yönerge takibi, yapılandırılmış veri anlama ve yapılandırılmış çıktı (özellikle JSON) üretiminde gelişmiştir.",
"Pro/Qwen/Qwen2.5-Coder-7B-Instruct.description": "Qwen2.5-Coder-7B-Instruct, Alibaba Cloudun en yeni kod odaklı büyük dil modelidir. Qwen2.5 üzerine inşa edilmiştir ve 5.5T token ile eğitilmiştir. Kod üretimi, akıl yürütme ve hata düzeltmede önemli gelişmeler sunar; matematik ve genel yetenekleri koruyarak kodlama ajanları için sağlam bir temel sağlar.",
@@ -107,13 +109,13 @@
"Pro/deepseek-ai/DeepSeek-R1-Distill-Qwen-7B.description": "DeepSeek-R1-Distill-Qwen-7B, Qwen2.5-Math-7B modelinden damıtılmış ve 800K özenle seçilmiş DeepSeek-R1 örneğiyle ince ayar yapılmıştır. MATH-500'de %92.8, AIME 2024'te %55.5 ve 7B model için 1189 CodeForces puanı ile güçlü performans sergiler.",
"Pro/deepseek-ai/DeepSeek-R1.description": "DeepSeek-R1, tekrarları azaltan ve okunabilirliği artıran pekiştirmeli öğrenme odaklı bir akıl yürütme modelidir. RL öncesinde soğuk başlangıç verileri kullanılarak akıl yürütme daha da geliştirilmiştir. Matematik, kodlama ve akıl yürütme görevlerinde OpenAI-o1 ile eşleşir ve dikkatli eğitimle genel sonuçlar iyileştirilmiştir.",
"Pro/deepseek-ai/DeepSeek-V3.1-Terminus.description": "DeepSeek-V3.1-Terminus, hibrit ajan büyük dil modeli olarak konumlandırılmış güncellenmiş bir V3.1 modelidir. Kullanıcı geri bildirimleriyle bildirilen sorunları düzeltir, kararlılığı ve dil tutarlılığını artırır, karışık Çince/İngilizce ve anormal karakterleri azaltır. Düşünme ve düşünmeme modlarını sohbet şablonlarıyla entegre ederek esnek geçiş sağlar. Ayrıca, daha güvenilir araç kullanımı ve çok adımlı görevler için Kod Ajanı ve Arama Ajanı performansını geliştirir.",
"Pro/deepseek-ai/DeepSeek-V3.2-Exp.description": "DeepSeek-V3.2-Exp, bir sonraki mimariye geçişi sağlayan deneysel bir V3.2 sürümüdür. V3.1-Terminus üzerine DeepSeek Seyrek Dikkat (DSA) eklenerek uzun bağlam eğitimi ve çıkarım verimliliği artırılmıştır. Araç kullanımı, uzun belge anlama ve çok adımlı akıl yürütme için optimize edilmiştir. Geniş bağlam bütçeleriyle daha yüksek akıl yürütme verimliliğini keşfetmek için idealdir.",
"Pro/deepseek-ai/DeepSeek-V3.2.description": "DeepSeek-V3.2, yüksek hesaplama verimliliğini mükemmel akıl yürütme ve Agent performansı ile birleştiren bir modeldir. Yaklaşımı üç önemli teknolojik atılım üzerine kuruludur: Hesaplama karmaşıklığını önemli ölçüde azaltırken model performansını koruyan ve uzun bağlam senaryoları için özel olarak optimize edilmiş verimli bir dikkat mekanizması olan DeepSeek Sparse Attention (DSA); model performansının GPT-5 ile rekabet edebileceği ve yüksek hesaplama versiyonunun Gemini-3.0-Pro ile akıl yürütme yeteneklerinde eşleşebileceği ölçeklenebilir bir pekiştirmeli öğrenme çerçevesi; ve karmaşık etkileşimli ortamlarda talimat takibi ve genelleme yeteneklerini geliştirmek için araç kullanma senaryolarına akıl yürütme yeteneklerini entegre etmeyi amaçlayan büyük ölçekli bir Agent görev sentezleme hattı. Model, 2025 Uluslararası Matematik Olimpiyatı (IMO) ve Uluslararası Bilişim Olimpiyatı (IOI) yarışmalarında altın madalya performansı elde etti.",
"Pro/deepseek-ai/DeepSeek-V3.description": "DeepSeek-V3, 671B parametreli bir MoE modelidir. MLA ve DeepSeekMoE kullanır, kayıpsız yük dengelemesiyle verimli çıkarım ve eğitim sağlar. 14.8T yüksek kaliteli token ile önceden eğitilmiş, SFT ve RL ile daha da ayarlanmıştır. Diğer açık modelleri geride bırakır ve önde gelen kapalı modellere yaklaşır.",
"Pro/moonshotai/Kimi-K2-Instruct-0905.description": "Kimi K2-Instruct-0905, en yeni ve en güçlü Kimi K2 modelidir. 1T toplam ve 32B aktif parametreye sahip üst düzey bir MoE modelidir. Temel özellikleri arasında, kıyaslama testlerinde ve gerçek dünya ajan görevlerinde önemli kazanımlar sağlayan daha güçlü ajan kodlama zekası, geliştirilmiş ön yüz kodlama estetiği ve kullanılabilirlik yer alır.",
"Pro/moonshotai/Kimi-K2-Thinking.description": "Kimi K2 Thinking Turbo, K2 Thinkingin çok adımlı akıl yürütme ve araç kullanımı yeteneklerini korurken, akıl yürütme hızı ve işlem hacmi için optimize edilmiş Turbo varyantıdır. Yaklaşık 1T toplam parametreye sahip bir MoE modelidir, yerel olarak 256K bağlamı destekler ve üretim senaryoları için kararlı büyük ölçekli araç çağrısı sağlar; düşük gecikme ve yüksek eşzamanlılık gereksinimlerini karşılar.",
"Pro/moonshotai/Kimi-K2.5.description": "Kimi K2.5, Kimi-K2-Base üzerine inşa edilmiş açık kaynaklı yerel çok modlu bir ajan modelidir. Yaklaşık 1,5 trilyon görsel ve metin karışımı token ile eğitilmiştir. Model, toplamda 1T parametreye ve 32B aktif parametreye sahip MoE mimarisini benimser, 256K bağlam penceresini destekler ve görsel ile dil anlama yeteneklerini sorunsuz bir şekilde entegre eder.",
"Pro/zai-org/glm-4.7.description": "GLM-4.7, Zhipu'nun yeni nesil amiral gemisi modelidir. Toplam 355 milyar parametreye ve 32 milyar aktif parametreye sahiptir. Genel diyalog, akıl yürütme ve ajan yeteneklerinde tamamen yenilenmiştir. GLM-4.7, Katmanlı Düşünme'yi geliştirir ve Korunan Düşünme ile Tur Bazlı Düşünme'yi tanıtır.",
"Pro/zai-org/glm-5.description": "GLM-5, Zhipu tarafından sunulan yeni nesil büyük dil modeli olup, karmaşık sistem mühendisliği ve uzun süreli Agent görevlerine odaklanır. Model parametreleri 744B parametreye (40B aktif) genişletilmiş ve DeepSeek Sparse Attention ile entegre edilmiştir.",
"Pro/zai-org/glm-5.description": "GLM-5, karmaşık sistem mühendisliği ve uzun süreli Agent görevlerine odaklanan Zhipu'nun yeni nesil büyük dil modelidir. Model parametreleri 744B'ye (40B aktif) genişletilmiş ve DeepSeek Sparse Attention entegrasyonu sağlanmıştır.",
"QwQ-32B-Preview.description": "Qwen QwQ, akıl yürütme yeteneğini geliştirmeye odaklanan deneysel bir araştırma modelidir.",
"Qwen/QVQ-72B-Preview.description": "QVQ-72B-Preview, karmaşık sahne anlama ve görsel matematik problemlerinde güçlü olan görsel akıl yürütmeye odaklanan Qwen araştırma modelidir.",
"Qwen/QwQ-32B-Preview.description": "Qwen QwQ, geliştirilmiş yapay zeka akıl yürütmesine odaklanan deneysel bir araştırma modelidir.",
@@ -137,7 +139,7 @@
"Qwen/Qwen3-14B.description": "Qwen3, akıl yürütme, genel yetenek, ajan kabiliyeti ve çok dilli performansta büyük gelişmeler sunan yeni nesil Tongyi Qwen modelidir ve düşünme modları arasında geçişi destekler.",
"Qwen/Qwen3-235B-A22B-Instruct-2507.description": "Qwen3-235B-A22B-Instruct-2507, 235 milyar toplam ve 22 milyar aktif parametreye sahip amiral gemisi Qwen3 MoE modelidir. Düşünme modunu içermeyen bu güncellenmiş sürüm, yönerge takibi, mantıksal akıl yürütme, metin anlama, matematik, fen, kodlama ve araç kullanımı konularında gelişmiş performans sunar. Ayrıca çok dilli uzun kuyruk bilgilerini genişletir ve öznel, açık uçlu görevlerde kullanıcı tercihleriyle daha iyi hizalanır.",
"Qwen/Qwen3-235B-A22B-Thinking-2507.description": "Qwen3-235B-A22B-Thinking-2507, karmaşık akıl yürütmeye odaklanan bir Qwen3 modelidir. Verimliliği artırmak için 235 milyar toplam ve her belirteç için yaklaşık 22 milyar aktif parametreye sahip MoE mimarisi kullanır. Bu özel düşünme modeli, mantık, matematik, fen, kodlama ve akademik ölçütlerde önemli gelişmeler göstererek üst düzey açık düşünme performansına ulaşır. Ayrıca yönerge takibi, araç kullanımı ve metin üretimini geliştirir ve 256K bağlamı yerel olarak destekleyerek derin akıl yürütme ve uzun belgelerle çalışmayı mümkün kılar.",
"Qwen/Qwen3-235B-A22B.description": "Qwen3, akıl yürütme, genel yetenek, ajan kabiliyeti ve çok dilli performansta büyük gelişmeler sunan yeni nesil Tongyi Qwen modelidir ve düşünme modları arasında geçişi destekler.",
"Qwen/Qwen3-235B-A22B.description": "Qwen3 235B A22B, üst düzey yapay zeka yetenekleri sunan Qwen3 ultra ölçekli modelidir.",
"Qwen/Qwen3-30B-A3B-Instruct-2507.description": "Qwen3-30B-A3B-Instruct-2507, Qwen3-30B-A3B modelinin düşünme içermeyen güncellenmiş sürümüdür. 30,5 milyar toplam ve 3,3 milyar aktif parametreye sahip bir MoE modelidir. Yönerge takibi, mantıksal akıl yürütme, metin anlama, matematik, fen, kodlama ve araç kullanımı konularında önemli gelişmeler sunar, çok dilli uzun kuyruk bilgilerini genişletir ve öznel açık görevlerde kullanıcı tercihleriyle daha iyi hizalanır. 256K bağlamı destekler. Bu model yalnızca düşünme içermeyen modda çalışır ve `<think></think>` etiketleri üretmez.",
"Qwen/Qwen3-30B-A3B-Thinking-2507.description": "Qwen3-30B-A3B-Thinking-2507, Qwen3 serisinin en yeni düşünme modelidir. 30,5 milyar toplam ve 3,3 milyar aktif parametreye sahip bir MoE modelidir ve karmaşık görevlere odaklanır. Mantık, matematik, fen, kodlama ve akademik ölçütlerde önemli gelişmeler gösterir; yönerge takibi, araç kullanımı, metin üretimi ve tercih hizalamasını geliştirir. 256K bağlamı yerel olarak destekler ve 1 milyon belirtece kadar genişletilebilir. Bu sürüm, ayrıntılı adım adım akıl yürütme ve güçlü ajan yetenekleriyle düşünme modu için tasarlanmıştır.",
"Qwen/Qwen3-30B-A3B.description": "Qwen3, akıl yürütme, genel yetenek, ajan kabiliyeti ve çok dilli performansta büyük gelişmeler sunan yeni nesil Tongyi Qwen modelidir ve düşünme modları arasında geçişi destekler.",
@@ -315,7 +317,6 @@
"codeqwen.description": "CodeQwen1.5, kapsamlı kod verileriyle eğitilmiş büyük bir dil modelidir ve karmaşık programlama görevleri için tasarlanmıştır.",
"codestral-latest.description": "Codestral, en gelişmiş kodlama modelimizdir; v2 (Ocak 2025), FIM, kod düzeltme ve test üretimi gibi düşük gecikmeli, yüksek frekanslı görevleri hedefler.",
"codestral.description": "Codestral, Mistral AInin ilk kod modelidir ve güçlü kod üretim desteği sunar.",
"codex-mini-latest.description": "codex-mini-latest, Codex CLI için ince ayarlanmış bir o4-mini modelidir. Doğrudan API kullanımı için gpt-4.1 ile başlamanız önerilir.",
"cogito-2.1:671b.description": "Cogito v2.1 671B, ticari kullanıma açık ABD menşeli açık kaynaklı bir büyük dil modelidir. Önde gelen modellerle rekabet eden performansa, daha yüksek token akıl yürütme verimliliğine, 128k uzun bağlam desteğine ve güçlü genel yeteneklere sahiptir.",
"cogview-3-flash.description": "CogView-3-Flash, Zhipu tarafından piyasaya sürülen ücretsiz bir görüntü oluşturma modelidir. Kullanıcı talimatlarına uygun görüntüler oluştururken daha yüksek estetik kalite puanlarına ulaşır. CogView-3-Flash, sanatsal yaratım, tasarım referansı, oyun geliştirme ve sanal gerçeklik gibi alanlarda kullanılır ve kullanıcıların metin açıklamalarını hızla görüntülere dönüştürmesine yardımcı olur.",
"cogview-4.description": "CogView-4, Zhipunun Çince karakter üretebilen ilk açık kaynaklı metinden-görüntüye modelidir. Anlamsal anlama, görüntü kalitesi ve Çince/İngilizce metin işleme konularında gelişmeler sunar. Her uzunlukta iki dilli istemleri destekler ve belirtilen aralıklarda herhangi bir çözünürlükte görüntü üretebilir.",
@@ -342,7 +343,7 @@
"command-light-nightly.description": "Büyük sürümler arasındaki boşluğu azaltmak için her gece güncellenen Command sürümleri sunuyoruz. command-light serisi için bu sürüm command-light-nightly olarak adlandırılır. En yeni, en deneysel (ve potansiyel olarak kararsız) sürümdür. Düzenli olarak bildirim yapılmadan güncellenir, bu nedenle üretim ortamlarında önerilmez.",
"command-light.description": "Neredeyse aynı yetenekte ancak daha hızlı olan daha küçük ve hızlı bir Command varyantı.",
"command-nightly.description": "Büyük sürümler arasındaki boşluğu azaltmak için her gece güncellenen Command sürümleri sunuyoruz. Command serisi için bu sürüm command-nightly olarak adlandırılır. En yeni, en deneysel (ve potansiyel olarak kararsız) sürümdür. Düzenli olarak bildirim yapılmadan güncellenir, bu nedenle üretim ortamlarında önerilmez.",
"command-r-03-2024.description": "Command R, önceki modellere göre daha yüksek kalite, daha fazla güvenilirlik ve daha uzun bağlam penceresi sunan bir talimat izleme sohbet modelidir. Kod üretimi, RAG, araç kullanımı ve yapay zeka ajanları gibi karmaşık iş akışlarını destekler.",
"command-r-03-2024.description": "command-r, önceki modellere kıyasla daha yüksek kalite, geliştirilmiş güvenilirlik ve daha uzun bağlam ile dil görevlerini yerine getiren bir talimat takip eden sohbet modelidir. Kod oluşturma, RAG, araç kullanımı ve Agent gibi karmaşık iş akışlarını destekler.",
"command-r-08-2024.description": "command-r-08-2024, Ağustos 2024te yayınlanan güncellenmiş bir Command R modelidir.",
"command-r-plus-04-2024.description": "command-r-plus, command-r-plus-04-2024’ün takma adıdır. APIde command-r-plus kullanıldığında bu modele yönlendirilir.",
"command-r-plus-08-2024.description": "Command R+, önceki modellere göre daha yüksek kalite, daha fazla güvenilirlik ve daha uzun bağlam penceresi sunan bir talimat izleme sohbet modelidir. Karmaşık RAG iş akışları ve çok adımlı araç kullanımı için en uygunudur.",
@@ -366,7 +367,8 @@
"deepseek-ai/DeepSeek-V2.5.description": "DeepSeek-V2.5, DeepSeek-V2-Chat ve DeepSeek-Coder-V2-Instruct modellerini geliştirerek genel ve kodlama yeteneklerini birleştirir. Yazma ve talimat takibini geliştirerek tercih uyumunu artırır; AlpacaEval 2.0, ArenaHard, AlignBench ve MT-Bench testlerinde önemli kazanımlar sağlar.",
"deepseek-ai/DeepSeek-V3.1-Terminus.description": "DeepSeek-V3.1-Terminus, hibrit ajan LLM olarak konumlandırılmış güncellenmiş V3.1 modelidir. Kullanıcı geri bildirimleriyle tespit edilen sorunları düzeltir, kararlılığı ve dil tutarlılığını artırır, karışık Çince/İngilizce ve anormal karakterleri azaltır. Düşünen ve düşünmeyen modları sohbet şablonlarıyla entegre eder, esnek geçiş sağlar. Ayrıca Code Agent ve Search Agent performansını geliştirerek daha güvenilir araç kullanımı ve çok adımlı görevler sunar.",
"deepseek-ai/DeepSeek-V3.1.description": "DeepSeek V3.1, hibrit akıl yürütme mimarisi kullanır ve hem düşünen hem de düşünmeyen modları destekler.",
"deepseek-ai/DeepSeek-V3.2-Exp.description": "DeepSeek-V3.2-Exp, bir sonraki mimariye geçişi sağlayan deneysel V3.2 sürümüdür. V3.1-Terminus üzerine DeepSeek Sparse Attention (DSA) ekleyerek uzun bağlamlı eğitim ve çıkarım verimliliğini artırır. Araç kullanımı, uzun belge anlama ve çok adımlı akıl yürütme için optimize edilmiştir. Geniş bağlam bütçeleriyle daha yüksek akıl yürütme verimliliğini keşfetmek için idealdir.",
"deepseek-ai/DeepSeek-V3.2-Exp.description": "DeepSeek V3.2 Exp, hibrit bir akıl yürütme mimarisi kullanır ve hem düşünme hem de düşünmeme modlarını destekler.",
"deepseek-ai/DeepSeek-V3.2.description": "DeepSeek-V3.2, yüksek hesaplama verimliliğini mükemmel akıl yürütme ve Agent performansı ile birleştiren bir modeldir. Yaklaşımı üç büyük teknolojik atılım üzerine kuruludur: Hesaplama karmaşıklığını önemli ölçüde azaltırken model performansını koruyan ve uzun bağlam senaryoları için özel olarak optimize edilmiş verimli bir dikkat mekanizması olan DeepSeek Sparse Attention (DSA); model performansının GPT-5 ile rekabet edebileceği ve yüksek hesaplama versiyonunun Gemini-3.0-Pro ile akıl yürütme yeteneklerinde eşleşebileceği ölçeklenebilir bir pekiştirmeli öğrenme çerçevesi; ve karmaşık etkileşimli ortamlarda talimat takibi ve genelleme yeteneklerini geliştirmek için araç kullanma senaryolarına akıl yürütme yeteneklerini entegre etmeyi amaçlayan büyük ölçekli bir Agent görev sentezleme hattı. Model, 2025 Uluslararası Matematik Olimpiyatı (IMO) ve Uluslararası Bilişim Olimpiyatı (IOI) yarışmalarında altın madalya sonuçları elde etti.",
"deepseek-ai/DeepSeek-V3.description": "DeepSeek-V3, MLA ve DeepSeekMoE kullanan 671B parametreli bir MoE modelidir. Kayıpsız yük dengelemesiyle verimli eğitim ve çıkarım sağlar. 14.8T yüksek kaliteli token ile önceden eğitilmiş, SFT ve RL ile güçlendirilmiştir; diğer açık modelleri geride bırakır ve önde gelen kapalı modellere yaklaşır.",
"deepseek-ai/deepseek-llm-67b-chat.description": "DeepSeek LLM Chat (67B), derin dil anlama ve etkileşim sunan yenilikçi bir modeldir.",
"deepseek-ai/deepseek-v3.1-terminus.description": "DeepSeek V3.1, karmaşık akıl yürütme ve düşünce zinciriyle derin analiz görevleri için geliştirilmiş yeni nesil bir modeldir.",
@@ -433,6 +435,7 @@
"deepseek_r1_distill_llama_70b.description": "DeepSeek-R1-Distill-Llama-70B, Llama-3.3-70B-Instruct'tan damıtılmıştır. DeepSeek-R1 serisinin bir parçası olarak, DeepSeek-R1 tarafından üretilen örneklerle ince ayar yapılmıştır ve matematik, kodlama ve akıl yürütme alanlarında güçlü performans sunar.",
"deepseek_r1_distill_qwen_14b.description": "DeepSeek-R1-Distill-Qwen-14B, Qwen2.5-14B'den damıtılmıştır ve DeepSeek-R1 tarafından üretilen 800K seçilmiş örnekle ince ayar yapılmıştır. Güçlü akıl yürütme yetenekleri sunar.",
"deepseek_r1_distill_qwen_32b.description": "DeepSeek-R1-Distill-Qwen-32B, Qwen2.5-32B'den damıtılmıştır ve DeepSeek-R1 tarafından üretilen 800K seçilmiş örnekle ince ayar yapılmıştır. Matematik, kodlama ve akıl yürütme alanlarında üstün performans gösterir.",
"devstral-2512.description": "Devstral 2, kod tabanlarını keşfetmek, birden fazla dosyayı düzenlemek ve yazılım mühendisliği Agent'larını güçlendirmek konusunda üstün olan bir kurumsal düzeyde metin modelidir.",
"devstral-2:123b.description": "Devstral 2 123B, kod tabanlarını keşfetme, birden fazla dosyayı düzenleme ve yazılım mühendisliği ajanlarını destekleme konusunda araçları etkili bir şekilde kullanma yeteneğiyle öne çıkar.",
"doubao-1.5-lite-32k.description": "Doubao-1.5-lite, ultra hızlı yanıt süresiyle hafif bir modeldir ve üst düzey kalite ile düşük gecikme sunar.",
"doubao-1.5-pro-256k.description": "Doubao-1.5-pro-256k, Doubao-1.5-Pro'nun kapsamlı bir yükseltmesidir ve genel performansta %10 artış sağlar. 256k bağlam penceresini ve 12k'ya kadar çıktı belirtecini destekler; daha yüksek performans, daha geniş pencere ve daha fazla kullanım senaryosu için güçlü bir değer sunar.",
@@ -546,10 +549,10 @@
"gemini-2.5-pro-preview-06-05.description": "Gemini 2.5 Pro Preview, Google’ın en gelişmiş akıl yürütme modelidir. Kod, matematik ve STEM problemleri üzerinde akıl yürütebilir; büyük veri kümeleri, kod tabanları ve uzun belgeleri analiz edebilir.",
"gemini-2.5-pro.description": "Gemini 2.5 Pro, Google’ın en gelişmiş akıl yürütme modelidir. Uzun bağlam desteğiyle karmaşık görevleri analiz edebilir.",
"gemini-3-flash-preview.description": "Gemini 3 Flash, hız için tasarlanmış en akıllı modeldir. En son yapay zeka zekasını mükemmel arama temellendirmesiyle birleştirir.",
"gemini-3-pro-image-preview.description": "Gemini 3 Pro Image (Nano Banana Pro), Googleın görsel üretim modelidir ve çok modlu sohbeti destekler.",
"gemini-3-pro-image-preview.description": "Gemini 3 Pro Image (Nano Banana Pro), Google'ın çok modlu diyaloğu da destekleyen görüntü oluşturma modelidir.",
"gemini-3-pro-image-preview:image.description": "Gemini 3 Pro Image (Nano Banana Pro), Google'ın görüntü oluşturma modeli olup, aynı zamanda çok modlu sohbeti destekler.",
"gemini-3-pro-preview.description": "Gemini 3 Pro, Google’ın en güçlü ajan ve vibe-coding modelidir. En yeni akıl yürütme yeteneklerinin üzerine zengin görseller ve derin etkileşim sunar.",
"gemini-3.1-flash-image-preview.description": "Gemini 3.1 Flash Image (Nano Banana 2), Flash hızında Pro düzeyinde görüntü kalitesi sunar ve çok modlu sohbet desteği sağlar.",
"gemini-3.1-flash-image-preview.description": "Gemini 3.1 Flash Image (Nano Banana 2), Google'ın düşünme desteği, konuşmalı görüntü oluşturma ve düzenleme özelliklerine sahip en hızlı yerel görüntü oluşturma modelidir.",
"gemini-3.1-flash-image-preview:image.description": "Gemini 3.1 Flash Image (Nano Banana 2), Flash hızında Pro düzeyinde görüntü kalitesi sunar ve çok modlu sohbet desteği sağlar.",
"gemini-3.1-pro-preview.description": "Gemini 3.1 Pro Preview, Gemini 3 Pro'ya kıyasla geliştirilmiş akıl yürütme yetenekleri sunar ve orta düzey düşünme desteği ekler.",
"gemini-flash-latest.description": "Gemini Flash'ın en son sürümü",
@@ -605,19 +608,15 @@
"google/gemini-2.0-flash-lite-001.description": "Gemini 2.0 Flash Lite, gecikme süresi ve maliyeti azaltmak için varsayılan olarak düşünme özelliği devre dışı bırakılmış hafif bir Gemini varyantıdır; bu özellik parametrelerle etkinleştirilebilir.",
"google/gemini-2.0-flash-lite.description": "Gemini 2.0 Flash Lite, olağanüstü hız, yerleşik araç kullanımı, çok modlu üretim ve 1M-token bağlam penceresi gibi yeni nesil özellikler sunar.",
"google/gemini-2.0-flash.description": "Gemini 2.0 Flash, Google’ın uzun süreli çok modlu görevler için yüksek performanslı akıl yürütme modelidir.",
"google/gemini-2.5-flash-image-free.description": "Gemini 2.5 Flash Image, sınırlı kotaya sahip çok modlu üretim sunan ücretsiz katmandır.",
"google/gemini-2.5-flash-image-preview.description": "Gemini 2.5 Flash, görsel üretim desteği sunan deneysel bir modeldir.",
"google/gemini-2.5-flash-image.description": "Gemini 2.5 Flash Image (Nano Banana), Google’ın çok modlu sohbet desteği sunan görsel üretim modelidir.",
"google/gemini-2.5-flash-lite.description": "Gemini 2.5 Flash Lite, gecikme süresi ve maliyet açısından optimize edilmiş, yüksek hacimli senaryolar için uygun hafif Gemini 2.5 varyantıdır.",
"google/gemini-2.5-flash-preview.description": "Gemini 2.5 Flash, gelişmiş akıl yürütme, kodlama, matematik ve bilim görevleri için geliştirilmiş Google’ın en gelişmiş amiral gemisi modelidir. Daha yüksek doğrulukta yanıtlar ve daha hassas bağlam işleme sağlamak için yerleşik \"düşünme\" özelliğine sahiptir.\n\nNot: Bu modelin düşünme ve düşünmesiz olmak üzere iki varyantı vardır. Düşünme etkinleştirildiğinde çıktı fiyatlandırması önemli ölçüde farklılık gösterir. Standart varyantı (\":thinking\" soneki olmadan) seçerseniz, model düşünme token'ları üretmekten kaçınır.\n\nDüşünme özelliğini kullanmak ve düşünme token'ları almak için \":thinking\" varyantını seçmeniz gerekir; bu, daha yüksek çıktı fiyatlandırmasına tabidir.\n\nGemini 2.5 Flash ayrıca belgelenmiş “maksimum akıl yürütme token'ları” parametresiyle yapılandırılabilir (https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning).",
"google/gemini-2.5-flash-preview:thinking.description": "Gemini 2.5 Flash, gelişmiş akıl yürütme, kodlama, matematik ve bilim görevleri için geliştirilmiş Google’ın en gelişmiş amiral gemisi modelidir. Daha yüksek doğrulukta yanıtlar ve daha hassas bağlam işleme sağlamak için yerleşik \"düşünme\" özelliğine sahiptir.\n\nNot: Bu modelin düşünme ve düşünmesiz olmak üzere iki varyantı vardır. Düşünme etkinleştirildiğinde çıktı fiyatlandırması önemli ölçüde farklılık gösterir. Standart varyantı (\":thinking\" soneki olmadan) seçerseniz, model düşünme token'ları üretmekten kaçınır.\n\nDüşünme özelliğini kullanmak ve düşünme token'ları almak için \":thinking\" varyantını seçmeniz gerekir; bu, daha yüksek çıktı fiyatlandırmasına tabidir.\n\nGemini 2.5 Flash ayrıca belgelenmiş “maksimum akıl yürütme token'ları” parametresiyle yapılandırılabilir (https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning).",
"google/gemini-2.5-flash.description": "Gemini 2.5 Flash (Lite/Pro/Flash), düşük gecikmeden yüksek performanslı akıl yürütmeye kadar uzanan Google model ailesidir.",
"google/gemini-2.5-pro-free.description": "Gemini 2.5 Pro ücretsiz katmanı, denemeler ve hafif iş akışları için uygun sınırlı kotaya sahip çok modlu uzun bağlam desteği sunar.",
"google/gemini-2.5-flash.description": "Gemini 2.5 Flash, düşük gecikmeden yüksek performanslı akıl yürütmeye kadar uzanan Google ailesidir.",
"google/gemini-2.5-pro-preview.description": "Gemini 2.5 Pro Preview, kod, matematik ve STEM alanlarında karmaşık problemler üzerinde akıl yürütme ve büyük veri kümeleri, kod tabanları ve belgeleri analiz etme konusunda Google’ın en gelişmiş düşünme modelidir.",
"google/gemini-2.5-pro.description": "Gemini 2.5 Pro, karmaşık görevler için uzun bağlam desteği sunan Google’ın amiral gemisi akıl yürütme modelidir.",
"google/gemini-3-pro-image-preview-free.description": "Gemini 3 Pro Image ücretsiz katmanı, sınırlı kotaya sahip çok modlu üretim sunar.",
"google/gemini-3-pro-image-preview.description": "Gemini 3 Pro Image (Nano Banana Pro), çok modlu sohbet desteği sunan Google’ın görsel üretim modelidir.",
"google/gemini-3-pro-preview-free.description": "Gemini 3 Pro Preview Free, standart sürümle aynı çok modlu anlama ve akıl yürütme yeteneklerini sunar, ancak kota ve hız sınırlarıyla birlikte gelir; bu da onu denemeler ve düşük frekanslı kullanım için daha uygun hale getirir.",
"google/gemini-3-pro-preview.description": "Gemini 3 Pro, Gemini ailesinin yeni nesil çok modlu akıl yürütme modelidir; metin, ses, görsel ve videoyu anlayabilir, karmaşık görevleri ve büyük kod tabanlarını işleyebilir.",
"google/gemini-embedding-001.description": "İngilizce, çok dilli ve kod görevlerinde güçlü performans sunan son teknoloji gömme modeli.",
"google/gemini-flash-1.5.description": "Gemini 1.5 Flash, çeşitli karmaşık görevler için optimize edilmiş çok modlu işlem sunar.",
@@ -717,15 +716,24 @@
"hunyuan-a13b.description": "Hunyuan'ın ilk hibrit akıl yürütme modeli, hunyuan-standard-256K'dan (toplam 80B, aktif 13B) yükseltilmiştir. Varsayılan olarak yavaş düşünme modundadır ve parametreler veya /no_think öneki ile hızlı/yavaş geçişi destekler. Özellikle matematik, bilim, uzun metin anlama ve ajan görevlerinde önceki nesle göre genel yetenek artışı sağlar.",
"hunyuan-code.description": "Hunyuan'ın en son kod modeli, 200B yüksek kaliteli kod verisi ve altı aylık SFT verisi üzerinde eğitilmiştir, 8K bağlam sunar. Otomatik kodlama kıyaslamalarında ve beş dilde uzman insan değerlendirmelerinde üst sıralarda yer alır.",
"hunyuan-functioncall.description": "Hunyuan'ın en son MoE FunctionCall modeli, yüksek kaliteli araç çağrısı verileri üzerinde eğitilmiştir, 32K bağlam penceresi sunar ve çeşitli boyutlarda lider kıyaslamalar sağlar.",
"hunyuan-large-longcontext.description": "Uzun belgelerle ilgili görevlerde, özetleme ve soru-cevap gibi işlemlerde mükemmel performans gösterir ve genel üretimi de yönetir. Karmaşık, ayrıntılı içerik için güçlü uzun metin analizi ve üretimi sağlar.",
"hunyuan-large.description": "Hunyuan-large, ~389B toplam parametreye ve ~52B aktif parametreye sahiptir; Transformer mimarisinde en büyük ve en güçlü açık MoE modelidir.",
"hunyuan-lite.description": "MoE mimarisine yükseltilmiş ve 256K bağlam penceresi ile donatılmıştır; NLP, kod, matematik ve sektör ölçütlerinde birçok açık modeli geride bırakır.",
"hunyuan-pro.description": "Trilyon parametreli MOE-32K uzun bağlam modeli; karmaşık talimatlar ve akıl yürütmede güçlüdür. Gelişmiş matematik, fonksiyon çağrısı ve çok dilli çeviri, finans, hukuk ve tıp alanları için optimize edilmiştir.",
"hunyuan-role.description": "Hunyuan'ın en son rol yapma modeli, rol yapma verileriyle resmi olarak ince ayar yapılmış olup, rol yapma senaryolarında daha güçlü temel performans sunar.",
"hunyuan-standard-256K.description": "Yük dengeleme ve uzman çökmesini azaltmak için geliştirilmiş yönlendirme kullanır. Uzun metin \"samanlıkta iğne\" %99.9'a ulaşır. MOE-256K, uzunluk ve kaliteyi daha da ileriye taşıyarak giriş uzunluğunu büyük ölçüde genişletir.",
"hunyuan-standard.description": "Yük dengeleme ve uzman çökmesini azaltmak için geliştirilmiş yönlendirme kullanır. Uzun metin \"samanlıkta iğne\" %99.9'a ulaşır. MOE-32K, uzun metin girişleri için kalite ve fiyat arasında daha iyi bir denge sunar.",
"hunyuan-standard-256K.description": "Yük dengeleme ve uzman çöküşünü azaltmak için geliştirilmiş yönlendirme kullanır. Uzun bağlamda %99.9 iğne-çuvalda performansı sağlar. MOE-256K bağlam uzunluğunu ve kalitesini daha da genişletir.",
"hunyuan-standard.description": "Yük dengeleme ve uzman çöküşünü azaltmak için geliştirilmiş yönlendirme kullanır. Uzun bağlamda %99.9 iğne-çuvalda performansı sağlar. MOE-32K uzun girdileri yönetirken güçlü bir değer sunar.",
"hunyuan-t1-20250321.description": "Sanat ve STEM yeteneklerini dengeli bir şekilde geliştirir ve güçlü uzun metin bilgi yakalama sağlar. Matematik, mantık, bilim ve kod problemleri için zorluk seviyelerine göre akıl yürütme yanıtlarını destekler.",
"hunyuan-t1-20250403.description": "Proje düzeyinde kod oluşturma ve yazma kalitesini iyileştirir, çoklu dönüş konu anlayışını ve ToB talimat takibini güçlendirir, kelime düzeyinde anlayışı geliştirir ve karışık basitleştirilmiş/geleneksel ve Çince/İngilizce çıktı sorunlarını azaltır.",
"hunyuan-t1-20250529.description": "Yaratıcı yazma ve kompozisyonu geliştirir, ön uç kodlama, matematik ve mantık akıl yürütmesini güçlendirir ve talimat takibini iyileştirir.",
"hunyuan-t1-20250711.description": "Zor matematik, mantık ve kodlama yeteneklerini büyük ölçüde geliştirir, çıktı kararlılığını artırır ve uzun metin yeteneklerini güçlendirir.",
"hunyuan-t1-latest.description": "Zor matematik, karmaşık akıl yürütme, zorlu kodlama, talimat takibi ve yaratıcı yazım kalitesinde yavaş düşünme modelini önemli ölçüde geliştirir.",
"hunyuan-t1-vision-20250916.description": "VQA, görsel eşleme, OCR, grafikler, fotoğraflı problem çözme ve görsel tabanlı üretimde büyük gelişmeler sunan en yeni t1-vision derin akıl yürütme modeli; ayrıca İngilizce ve düşük kaynaklı dillerde daha güçlüdür.",
"hunyuan-turbo-20241223.description": "Bu sürüm, daha iyi genelleme için talimat ölçeklendirmeyi artırır, matematik/kod/mantık akıl yürütmesini önemli ölçüde iyileştirir, kelime düzeyinde anlayışı geliştirir ve yazma kalitesini artırır.",
"hunyuan-turbo-latest.description": "NLP anlayışı, yazma, sohbet, QA, çeviri ve alanlar genelinde genel deneyim iyileştirmeleri; daha insansı yanıtlar, belirsiz niyetlerde daha iyi açıklama, kelime ayrıştırmada iyileştirme, daha yüksek yaratıcı kalite ve etkileşim, ve daha güçlü çoklu dönüş konuşmaları sağlar.",
"hunyuan-turbo.description": "Hunyuan’ın yeni nesil LLM önizlemesi; yeni MoE mimarisiyle daha hızlı akıl yürütme ve hunyuan-pro'dan daha güçlü sonuçlar sunar.",
"hunyuan-turbos-latest.description": "En yeni Hunyuan TurboS amiral gemisi modeli; daha güçlü akıl yürütme ve genel deneyim sunar.",
"hunyuan-turbos-longtext-128k-20250325.description": "Uzun belgelerle ilgili görevlerde, özetleme ve soru-cevap gibi işlemlerde mükemmel performans gösterir ve genel üretimi de yönetir. Karmaşık, ayrıntılı içerik için güçlü uzun metin analizi ve üretimi sağlar.",
"hunyuan-vision-1.5-instruct.description": "TurboS metin tabanında oluşturulmuş hızlı düşünme görüntüden metne modeli, temel görüntü tanıma ve görüntü analizi akıl yürütme alanlarında önceki sürüme göre belirgin iyileştirmeler gösterir.",
"hunyuan-vision.description": "Hunyuan'ın en son çok modlu modeli, metin ve görüntü girişlerini destekleyerek metin oluşturur.",
"image-01-live.description": "İnce detaylara sahip görüntü üretim modeli; metinden görsele ve kontrol edilebilir stil ön ayarlarını destekler.",
@@ -770,8 +778,7 @@
"kimi-k2:1t.description": "Kimi K2, Moonshot AI tarafından geliştirilen büyük bir MoE LLM'dir; toplamda 1T parametreye ve her ileri geçişte 32B aktif parametreye sahiptir. Gelişmiş araç kullanımı, akıl yürütme ve kod üretimi gibi ajan yetenekleri için optimize edilmiştir.",
"kimi-latest.description": "Kimi Latest, en yeni Kimi modelini kullanır ve deneysel özellikler içerebilir. Görsel anlama desteği sunar ve bağlam uzunluğuna göre 8k/32k/128k faturalama modellerini otomatik olarak seçer.",
"kuaishou/kat-coder-pro-v1.description": "KAT-Coder-Pro-V1 (sınırlı süreli ücretsiz), verimli kodlama ajanları için kod anlama ve otomasyonu üzerine odaklanır.",
"learnlm-1.5-pro-experimental.description": "LearnLM, öğrenme bilimi ilkelerine göre eğitilmiş deneysel, görev odaklı bir modeldir; öğretim/öğrenme senaryolarında sistem talimatlarını izleyerek uzman bir eğitmen gibi davranır.",
"learnlm-2.0-flash-experimental.description": "LearnLM, öğrenme bilimi ilkelerine göre eğitilmiş deneysel, görev odaklı bir modeldir; öğretim/öğrenme senaryolarında sistem talimatlarını izleyerek uzman bir eğitmen gibi davranır.",
"labs-devstral-small-2512.description": "Devstral Small 2, kod tabanlarını keşfetmek, birden fazla dosyayı düzenlemek ve yazılım mühendisliği Agent'larını güçlendirmek konusunda üstün performans gösterir.",
"lite.description": "Spark Lite, ultra düşük gecikmeli ve verimli işlemeye sahip hafif bir LLM'dir. Tamamen ücretsizdir ve gerçek zamanlı web aramasını destekler. Hızlı yanıtları, düşük hesaplama gücüne sahip cihazlarda ve model ince ayarlarında iyi performans gösterir; özellikle bilgi tabanlı soru-cevap, içerik üretimi ve arama senaryolarında maliyet etkinliği ve akıllı deneyim sunar.",
"llama-3.1-70b-versatile.description": "Llama 3.1 70B, karmaşık uygulamalar için güçlü yapay zeka akıl yürütmesi sunar; yüksek verimlilik ve doğrulukla yoğun hesaplamaları destekler.",
"llama-3.1-8b-instant.description": "Llama 3.1 8B, hızlı metin üretimi sağlayan yüksek verimli bir modeldir; büyük ölçekli ve maliyet etkin uygulamalar için idealdir.",
@@ -782,7 +789,6 @@
"llama-3.2-90b-vision-preview.description": "Llama 3.2, görsel ve metin görevlerini birleştirmek üzere tasarlanmıştır; görsel açıklama ve görsel Soru-Cevap'ta üstün performans göstererek dil üretimi ile görsel akıl yürütme arasında köprü kurar.",
"llama-3.2-vision-instruct.description": "Llama 3.2-Vision, görsel tanıma, görsel akıl yürütme, açıklama ve genel görsel Soru-Cevap için optimize edilmiş talimat ayarlı bir modeldir.",
"llama-3.3-70b-versatile.description": "Meta Llama 3.3, 70B parametreli çok dilli bir büyük dil modelidir (metin girişi/çıkışı) ve önceden eğitilmiş ile talimat ayarlı varyantlar sunar. Talimat ayarlı yalnızca metin modeli, çok dilli diyalog senaryoları için optimize edilmiştir ve yaygın endüstri kıyaslamalarında birçok açık ve kapalı sohbet modelini geride bırakır.",
"llama-3.3-70b.description": "Llama 3.3 70B: akıl yürütme ve işlem hacmi arasında denge kuran orta-büyük boyutlu bir Llama modelidir.",
"llama-3.3-instruct.description": "Llama 3.3, sohbet için optimize edilmiş talimat ayarlı bir modeldir ve yaygın endüstri kıyaslamalarında birçok açık sohbet modelini geride bırakır.",
"llama3-70b-8192.description": "Meta Llama 3 70B, zorlu projeler için olağanüstü karmaşıklık yönetimi sunar.",
"llama3-8b-8192.description": "Meta Llama 3 8B, çeşitli senaryolarda güçlü akıl yürütme performansı sağlar.",
@@ -832,7 +838,6 @@
"meta-llama/llama-3.1-8b-instruct:free.description": "LLaMA 3.1 çok dilli desteğe sahiptir ve önde gelen üretken modellerden biridir.",
"meta-llama/llama-3.2-11b-vision-instruct.description": "LLaMA 3.2, görsel ve metin görevlerini birleştirmek için tasarlanmıştır. Görsel açıklama ve görsel soru-cevapta mükemmeldir; dil üretimi ile görsel akıl yürütme arasında köprü kurar.",
"meta-llama/llama-3.2-3b-instruct.description": "meta-llama/llama-3.2-3b-instruct",
"meta-llama/llama-3.2-90b-vision-instruct.description": "LLaMA 3.2, görsel ve metin görevlerini birleştirmek için tasarlanmıştır. Görsel açıklama ve görsel soru-cevapta mükemmeldir; dil üretimi ile görsel akıl yürütme arasında köprü kurar.",
"meta-llama/llama-3.3-70b-instruct.description": "Llama 3.3, en gelişmiş çok dilli açık kaynaklı Llama modelidir; düşük maliyetle neredeyse 405B performansı sunar. Transformer tabanlıdır ve faydalılık ve güvenlik için SFT ve RLHF ile geliştirilmiştir. Talimat odaklı sürüm çok dilli sohbet için optimize edilmiştir ve sektör testlerinde birçok açık ve kapalı sohbet modelini geride bırakır. Bilgi kesimi: Aralık 2023.",
"meta-llama/llama-3.3-70b-instruct:free.description": "Llama 3.3, en gelişmiş çok dilli açık kaynaklı Llama modelidir; düşük maliyetle neredeyse 405B performansı sunar. Transformer tabanlıdır ve faydalılık ve güvenlik için SFT ve RLHF ile geliştirilmiştir. Talimat odaklı sürüm çok dilli sohbet için optimize edilmiştir ve sektör testlerinde birçok açık ve kapalı sohbet modelini geride bırakır. Bilgi kesimi: Aralık 2023.",
"meta.llama3-1-405b-instruct-v1:0.description": "Meta Llama 3.1 405B Instruct, Llama 3.1 serisinin en büyük ve en güçlü talimat modeli olup, diyalog akıl yürütme ve sentetik veri üretimi için ileri düzeyde bir modeldir. 8B, 70B ve 405B boyutlarında önceden eğitilmiş ve talimatla ayarlanmış çok dilli üretim modelleri içerir (metin girdi/çıktı). Talimatla ayarlanmış metin modelleri çok dilli sohbet için optimize edilmiştir ve sektör testlerinde birçok açık sohbet modelini geride bırakır. Llama 3.1, ticari ve araştırma amaçlı çok dilli kullanım için tasarlanmıştır. Talimat modelleri asistan tarzı sohbet için uygundur; önceden eğitilmiş modeller ise daha geniş doğal dil üretim görevlerine yöneliktir. Llama 3.1 çıktıları, sentetik veri üretimi ve iyileştirme dahil olmak üzere diğer modelleri geliştirmek için de kullanılabilir. Llama 3.1, optimize edilmiş mimariye sahip otoregresif bir Transformer modelidir. Ayarlanmış sürümler, insan tercihleriyle uyumlu hale getirmek için denetimli ince ayar (SFT) ve insan geri bildirimiyle pekiştirmeli öğrenme (RLHF) kullanır.",
@@ -894,7 +899,7 @@
"mistral-large-instruct.description": "Mistral-Large-Instruct-2407, 123B parametreli gelişmiş yoğun bir büyük dil modelidir ve en son akıl yürütme, bilgi ve kodlama yeteneklerine sahiptir.",
"mistral-large-latest.description": "Mistral Large, çok dilli görevlerde, karmaşık akıl yürütmede ve kod üretiminde güçlüdür—üst düzey uygulamalar için idealdir.",
"mistral-large.description": "Mixtral Large, Mistralin amiral gemisi modelidir; kod üretimi, matematik ve akıl yürütmeyi 128K bağlam penceresiyle birleştirir.",
"mistral-medium-latest.description": "Mistral Medium 3, 8 kat daha düşük maliyetle en son performansı sunar ve kurumsal dağıtımı kolaylaştırır.",
"mistral-medium-latest.description": "Mistral Medium 3.1, 8× daha düşük maliyetle en son teknoloji performansı sunar ve kurumsal dağıtımı basitleştirir.",
"mistral-nemo-instruct.description": "Mistral-Nemo-Instruct-2407, Mistral-Nemo-Base-2407nin talimat ayarlı sürümüdür.",
"mistral-nemo.description": "Mistral Nemo, Mistral AI ve NVIDIA tarafından geliştirilen, yüksek verimliliğe sahip 12B modeldir.",
"mistral-small-latest.description": "Mistral Small, çeviri, özetleme ve duygu analizi için uygun maliyetli, hızlı ve güvenilir bir seçenektir.",
@@ -933,7 +938,7 @@
"moonshot-v1-auto.description": "Moonshot V1 Auto, mevcut bağlam token kullanımına göre uygun modeli otomatik olarak seçer.",
"moonshotai/Kimi-Dev-72B.description": "Kimi-Dev-72B, büyük ölçekli pekiştirmeli öğrenme ile optimize edilmiş açık kaynaklı bir kod LLMdir. SWE-bench Verified testinde %60.4 puan alarak hata düzeltme ve kod inceleme gibi otomatik yazılım mühendisliği görevlerinde açık model rekoru kırmıştır.",
"moonshotai/Kimi-K2-Instruct-0905.description": "Kimi K2-Instruct-0905, Kimi K2 serisinin en yeni ve en güçlü modelidir. 1T toplam ve 32B aktif parametreye sahip üst düzey bir MoE modelidir. Gelişmiş ajan kodlama zekası, ön yüz kodlama estetiği ve kullanılabilirliği ile öne çıkar.",
"moonshotai/Kimi-K2-Thinking.description": "Kimi K2 Thinking, çok adımlı akıl yürütme derinliğini büyük ölçüde artıran ve 200300 ardışık araç çağrısında kararlılığı koruyan en yeni ve en güçlü açık kaynaklı düşünme modelidir. Kodlama, matematik, mantık ve ajan senaryolarında üstündür. ~1T parametreli MoE mimarisi üzerine kuruludur, 256K bağlam penceresi ve araç çağırma desteği sunar.",
"moonshotai/Kimi-K2-Thinking.description": "Kimi K2 Thinking, en son ve en güçlü açık kaynaklı düşünme modelidir. Çok adımlı akıl yürütme derinliğini büyük ölçüde genişletir ve 200300 ardışık çağrı boyunca kararlı araç kullanımı sağlar, Humanity's Last Exam (HLE), BrowseComp ve diğer ölçütlerde yeni rekorlar kırar. Kodlama, matematik, mantık ve Agent senaryolarında üstün performans gösterir. ~1T toplam parametreye sahip bir MoE mimarisi üzerine kuruludur, 256K bağlam penceresi ve araç çağırma desteği sunar.",
"moonshotai/kimi-k2-0711.description": "Kimi K2 0711, Kimi serisinin talimat odaklı varyantıdır; yüksek kaliteli kodlama ve araç kullanımı için uygundur.",
"moonshotai/kimi-k2-0905.description": "Kimi K2 0905, bağlam ve akıl yürütme performansını artıran, kodlama optimizasyonları içeren bir güncellemedir.",
"moonshotai/kimi-k2-instruct-0905.description": "kimi-k2-0905-preview modeli, 256K bağlam penceresini destekler; daha güçlü ajan kodlama, daha rafine ve pratik ön yüz kodu ve daha iyi bağlam anlama sunar.",
@@ -948,8 +953,8 @@
"nvidia/Llama-3.1-Nemotron-70B-Instruct-HF.description": "Llama 3.1 Nemotron 70B, NVIDIA tarafından özelleştirilmiş bir LLMdir. Arena Hard, AlpacaEval 2 LC ve GPT-4-Turbo MT-Bench testlerinde 1. sırada yer alır. Llama-3.1-70B-Instruct modelinden RLHF (REINFORCE), Llama-3.1-Nemotron-70B-Reward ve HelpSteer2-Preference istemleriyle eğitilmiştir.",
"nvidia/llama-3.1-nemotron-51b-instruct.description": "Olağanüstü doğruluk ve verimlilik sunan özgün bir dil modelidir.",
"nvidia/llama-3.1-nemotron-70b-instruct.description": "Llama-3.1-Nemotron-70B-Instruct, LLM yanıtlarının yardımseverliğini artırmak için NVIDIA tarafından özelleştirilmiş bir modeldir.",
"o1-mini.description": "o1-preview'den daha küçük ve hızlıdır, %80 daha düşük maliyetlidir. Kod üretimi ve kısa bağlamlı görevlerde güçlüdür.",
"o1-preview.description": "İleri düzey akıl yürütme ve karmaşık problem çözme (matematik ve bilim dahil) odaklıdır. Derin bağlam anlayışı ve otonom iş akışları gerektiren uygulamalar için idealdir.",
"o1-mini.description": "o1-mini, kodlama, matematik ve bilim için tasarlanmış hızlı ve uygun maliyetli bir akıl yürütme modelidir. 128K bağlam ve Ekim 2023 bilgi kesim noktasına sahiptir.",
"o1-preview.description": "o1, geniş bilgi gerektiren karmaşık görevler için OpenAI'nin yeni akıl yürütme modelidir. 128K bağlam ve Ekim 2023 bilgi kesim noktasına sahiptir.",
"o1-pro.description": "o1 serisi, yanıtlamadan önce düşünmek ve karmaşık akıl yürütmeyi yönetmek için pekiştirmeli öğrenme ile eğitilmiştir. o1-pro, daha fazla hesaplama gücü kullanarak daha derin düşünme ve tutarlı yüksek kaliteli yanıtlar sunar.",
"o1.description": "o1, metin+görsel girdi ve metin çıktısı ile çalışan, karmaşık görevler için geniş bilgi gerektiren OpenAInin yeni akıl yürütme modelidir. 200K bağlam penceresi ve Ekim 2023 bilgi kesimi vardır.",
"o3-2025-04-16.description": "o3, metin+görsel girdi ve metin çıktısı ile karmaşık görevler için geniş bilgi gerektiren OpenAInin yeni akıl yürütme modelidir.",
@@ -1022,7 +1027,6 @@
"qianfan-check-vl.description": "Qianfan Check VL, görsel-metin uygunluğu ve tanıma görevleri için çok modlu içerik denetim modelidir.",
"qianfan-composition.description": "Qianfan Composition, karışık görsel-metin anlama ve üretim için çok modlu bir yaratım modelidir.",
"qianfan-engcard-vl.description": "Qianfan EngCard VL, İngilizce senaryolara odaklanan çok modlu bir tanıma modelidir.",
"qianfan-lightning-128b-a19b.description": "Qianfan Lightning 128B A19B, karmaşık SSS ve büyük ölçekli akıl yürütme için yüksek performanslı bir Çince genel modeldir.",
"qianfan-llama-vl-8b.description": "Qianfan Llama VL 8B, genel görsel-metin anlama için Llama tabanlı çok modlu bir modeldir.",
"qianfan-multipicocr.description": "Qianfan MultiPicOCR, birden fazla görselde metin tespiti ve tanıma yapan çok görselli bir OCR modelidir.",
"qianfan-qi-vl.description": "Qianfan QI VL, karmaşık görsel-metin senaryolarında doğru bilgi alma ve SSS için çok modlu bir modeldir.",
@@ -1032,7 +1036,6 @@
"qvq-72b-preview.description": "QVQ-72B-Preview, görsel akıl yürütmeyi geliştirmeye odaklanan Qwenin deneysel araştırma modelidir.",
"qvq-max.description": "Qwen QVQ görsel akıl yürütme modeli, görsel girdi ve zincirleme düşünme çıktısını destekler; matematik, kodlama, görsel analiz, yaratıcı ve genel görevlerde güçlü performans sunar.",
"qvq-plus.description": "Görsel girdi ve zincirleme düşünme çıktısı sunan görsel akıl yürütme modeli. qvq-plus serisi, qvq-maxin ardından gelir ve daha hızlı akıl yürütme ile daha iyi kalite-maliyet dengesi sunar.",
"qwen-3-32b.description": "Qwen 3 32B: çok dilli ve kodlama görevlerinde güçlü, orta ölçekli üretim kullanımı için uygun.",
"qwen-coder-plus.description": "Qwen kod modeli.",
"qwen-coder-turbo-latest.description": "Qwen kod modeli.",
"qwen-coder-turbo.description": "Qwen kod modeli.",
@@ -1128,7 +1131,6 @@
"qwen3-coder-next.description": "Karmaşık çok dosyalı kod oluşturma, hata ayıklama ve yüksek verimli ajan iş akışları için optimize edilmiş yeni nesil Qwen kodlayıcı. Güçlü araç entegrasyonu ve geliştirilmiş akıl yürütme performansı için tasarlanmıştır.",
"qwen3-coder-plus.description": "Qwen kod modeli. En yeni Qwen3-Coder serisi, Qwen3 tabanlıdır ve otonom programlama için güçlü kodlama ajan yetenekleri, araç kullanımı ve ortam etkileşimi sunar. Mükemmel kod performansı ve sağlam genel yetenek sağlar.",
"qwen3-coder:480b.description": "Ajan ve kodlama görevleri için Alibaba'nın yüksek performanslı uzun bağlam modeli.",
"qwen3-max-2026-01-23.description": "Qwen3 Max modelleri, genel yetenek, Çince/İngilizce anlama, karmaşık yönerge takibi, öznel açık görevler, çok dilli yetenek ve araç kullanımı gibi alanlarda 2.5 serisine göre büyük gelişmeler sunar ve daha az halüsinasyon üretir. En son qwen3-max, qwen3-max-preview'e göre ajan programlama ve araç kullanımında gelişmiştir. Bu sürüm, alanında SOTA seviyesine ulaşır ve daha karmaşık ajan ihtiyaçlarını hedefler.",
"qwen3-max-preview.description": "Karmaşık, çok adımlı görevler için en iyi performans gösteren Qwen modeli. Önizleme sürümü düşünme desteği sunar.",
"qwen3-max.description": "Qwen3 Max modelleri, genel yetenek, Çince/İngilizce anlama, karmaşık talimat takibi, öznel açık görevler, çok dilli yetenek ve araç kullanımı konularında 2.5 serisine göre büyük gelişmeler sunar. Daha az halüsinasyon üretir. En yeni qwen3-max, qwen3-max-preview'e göre ajan programlama ve araç kullanımında gelişmiştir. Bu sürüm, alanında SOTA seviyesine ulaşır ve daha karmaşık ajan ihtiyaçlarını hedefler.",
"qwen3-next-80b-a3b-instruct.description": "Yeni nesil Qwen3 düşünmeyen açık kaynaklı model. Önceki sürüme (Qwen3-235B-A22B-Instruct-2507) kıyasla daha iyi Çince anlama, daha güçlü mantıksal akıl yürütme ve geliştirilmiş metin üretimi sunar.",
@@ -1145,7 +1147,8 @@
"qwen3-vl-flash.description": "Qwen3 VL Flash: gecikmeye duyarlı veya yüksek hacimli istekler için hafif, yüksek hızlı akıl yürütme sürümüdür.",
"qwen3-vl-plus.description": "Qwen VL, görsel anlama yeteneğine sahip bir metin üretim modelidir. OCR yapabilir, özetleyebilir ve akıl yürütebilir; örneğin ürün fotoğraflarından özellik çıkarabilir veya görsellerden problemleri çözebilir.",
"qwen3.5-397b-a17b.description": "Metin, görüntü ve video girişlerini destekler. Yalnızca metin görevlerinde, performansı Qwen3 Max ile karşılaştırılabilir olup, daha yüksek verimlilik ve daha düşük maliyet sunar. Çok modlu yeteneklerde, Qwen3 VL serisine göre önemli iyileştirmeler sağlar.",
"qwen3.5-plus.description": "Qwen3.5 Plus, metin, görüntü ve video girişlerini destekler. Yalnızca metin görevlerinde, performansı Qwen3 Max ile karşılaştırılabilir olup, daha yüksek verimlilik ve daha düşük maliyet sunar. Çok modlu yeteneklerde, Qwen3 VL serisine göre önemli iyileştirmeler sağlar.",
"qwen3.5-plus.description": "Qwen3.5 Plus, metin, görüntü ve video girişini destekler. Saf metin görevlerindeki performansı Qwen3 Max ile karşılaştırılabilir olup, daha iyi performans ve daha düşük maliyet sunar. Çok modlu yetenekleri Qwen3 VL serisine kıyasla önemli ölçüde geliştirilmiştir.",
"qwen3.5:397b.description": "Qwen3.5, 256K bağlam penceresi ile güçlü çok modlu akıl yürütme, kodlama ve uzun bağlam yetenekleri sunan bir hibrit mimariye (Mixture-of-Experts + lineer dikkat) sahip birleşik bir görsel-dil temel modelidir.",
"qwen3.description": "Qwen3, Alibabanın çeşitli kullanım senaryolarında güçlü performans sunan yeni nesil büyük dil modelidir.",
"qwq-32b-preview.description": "QwQ, geliştirilmiş akıl yürütmeye odaklanan Qwen'in deneysel bir araştırma modelidir.",
"qwq-32b.description": "QwQ, Qwen ailesine ait bir akıl yürütme modelidir. Standart talimatla eğitilmiş modellere kıyasla düşünme ve akıl yürütme yetenekleriyle özellikle karmaşık problemler üzerinde performansı önemli ölçüde artırır. QwQ-32B, DeepSeek-R1 ve o1-mini gibi üst düzey modellerle rekabet eden orta boyutlu bir modeldir.",
@@ -1187,7 +1190,7 @@
"step-2-16k.description": "Karmaşık diyaloglar için geniş bağlamlı etkileşimleri destekler.",
"step-2-mini.description": "Yeni nesil kurum içi MFA dikkat mimarisi üzerine inşa edilmiştir, Step-1 benzeri sonuçları çok daha düşük maliyetle sunar, daha yüksek verim ve daha hızlı gecikme sağlar. Genel görevleri güçlü kodlama yeteneğiyle işler.",
"step-2x-large.description": "Metin istemlerinden yüksek kaliteli görseller üreten yeni nesil StepFun görsel modeli. Daha gerçekçi dokular ve daha güçlü Çince/İngilizce metin işleme sunar.",
"step-3.5-flash.description": "Stepfun'un amiral gemisi dil akıl yürütme modeli. Bu model, üst düzey akıl yürütme yetenekleri ile hızlı ve güvenilir yürütme sağlar. Karmaşık görevleri çözebilir ve planlayabilir, bunları gerçekleştirmek için araçları hızlı ve güvenilir bir şekilde çağırabilir ve mantıksal akıl yürütme, matematik, yazılım mühendisliği, derin araştırma ve diğer sofistike görevlerde üstün performans gösterir. Bağlam uzunluğu 256K'dir.",
"step-3.5-flash.description": "Stepfunun amiral gemisi dil akıl yürütme modeli. Bu model, üst düzey akıl yürütme yetenekleri ve hızlı ve güvenilir yürütme yetenekleri sunar. Karmaşık görevleri çözmek ve planlamak, araçları hızlı ve güvenilir bir şekilde çağırmak ve mantıksal akıl yürütme, matematik, yazılım mühendisliği ve derinlemesine araştırma gibi çeşitli karmaşık görevlerde yetkin olmak için uygundur.",
"step-3.description": "Bu model güçlü görsel algı ve karmaşık akıl yürütme yeteneklerine sahiptir, alanlar arası bilgi anlama, matematik-görsel analiz ve günlük görsel analiz görevlerini doğru şekilde işler.",
"step-r1-v-mini.description": "Görselleri ve metni işleyip derin akıl yürütme sonrası metin üretebilen güçlü görsel anlama yeteneğine sahip bir akıl yürütme modelidir. Görsel akıl yürütmede üst düzey performans sunar ve 100K bağlam penceresiyle matematik, kodlama ve metin akıl yürütmede en üst düzeyde performans gösterir.",
"stepfun-ai/step3.description": "Step3, StepFun tarafından geliştirilen son teknoloji çok modlu akıl yürütme modelidir. 321B toplam ve 38B aktif parametreye sahip MoE mimarisi üzerine kuruludur. Uçtan uca tasarımı, kod çözme maliyetini en aza indirirken üst düzey görsel-dil akıl yürütmesi sunar. MFA ve AFD tasarımı sayesinde hem üst düzey hem de düşük seviye hızlandırıcılarda verimlidir. 20T+ metin ve 4T görsel-metin verisiyle çok dilli ön eğitimden geçirilmiştir. Matematik, kodlama ve çok modlu kıyaslamalarda lider açık model performansına ulaşır.",
@@ -1276,10 +1279,11 @@
"z-ai/glm4.7.description": "GLM-4.7, Zhipu'nun en son amiral gemisi modeli olup, Agentic Kodlama senaryoları için geliştirilmiş kodlama yetenekleri sunar.",
"z-ai/glm5.description": "GLM-5, Zhipu AI'nın ajan mühendisliği için yeni amiral gemisi temel modelidir ve kodlama ve ajan yeteneklerinde açık kaynaklı SOTA performansı elde eder. Claude Opus 4.5 ile performans açısından eşleşir.",
"z-image-turbo.description": "Z-Image, hızlı bir şekilde görüntü üretebilen hafif bir metinden görüntüye oluşturma modelidir, hem Çince hem de İngilizce metin işleme destekler ve birden fazla çözünürlük ve en-boy oranına esnek bir şekilde uyum sağlar.",
"zai-glm-4.7.description": "Bu model, gelişmiş akıl yürütme yetenekleri, üstün araç kullanımı ve Agent kodlama uygulamalarında geliştirilmiş gerçek dünya performansı ile güçlü kodlama performansı sunar.",
"zai-org/GLM-4.5-Air.description": "GLM-4.5-Air, Mixture-of-Experts mimarisi kullanan ajan uygulamaları için temel bir modeldir. Araç kullanımı, web tarama, yazılım mühendisliği ve ön yüz kodlama için optimize edilmiştir ve Claude Code ile Roo Code gibi kod ajanlarıyla entegre çalışır. Karmaşık akıl yürütme ve günlük senaryoları hibrit akıl yürütme ile ele alır.",
"zai-org/GLM-4.5.description": "GLM-4.5, Mixture-of-Experts mimarisi kullanan ajan uygulamaları için geliştirilmiş temel bir modeldir. Araç kullanımı, web tarama, yazılım mühendisliği ve ön yüz kodlama için derinlemesine optimize edilmiştir ve Claude Code ile Roo Code gibi kod ajanlarıyla entegre çalışır. Karmaşık akıl yürütme ve günlük senaryoları hibrit akıl yürütme ile ele alır.",
"zai-org/GLM-4.5V.description": "GLM-4.5V, GLM-4.5-Air amiral gemisi metin modeli (106B toplam, 12B aktif) üzerine inşa edilmiş Zhipu AInin en yeni VLM modelidir. Daha düşük maliyetle yüksek performans sunan MoE mimarisi kullanır. GLM-4.1V-Thinking yolunu izler ve 3D-RoPE ile 3B mekansal akıl yürütmeyi geliştirir. Ön eğitim, SFT ve RL ile optimize edilmiştir; görüntü, video ve uzun belgeleri işler ve 41 açık çok modlu benchmarkta en üst sıralarda yer alır. Düşünme modu geçişi, hız ve derinlik arasında denge sağlar.",
"zai-org/GLM-4.6.description": "GLM-4.5'e kıyasla, GLM-4.6 bağlam uzunluğunu 128K'dan 200K'ya çıkararak daha karmaşık ajan görevlerini destekler. Kodlama testlerinde daha yüksek puan alır ve Claude Code, Cline, Roo Code ve Kilo Code gibi uygulamalarda daha güçlü gerçek dünya performansı gösterir. Akıl yürütme geliştirilmiş ve araç kullanımı desteklenmiştir, bu da genel yetenekleri güçlendirir. Ajan çerçevelerine daha iyi entegre olur, araç/arama ajanlarını geliştirir ve daha insani yazım tarzı ile rol yapma doğallığı sunar.",
"zai-org/GLM-4.6V.description": "GLM-4.6V, görsel anlama doğruluğunda aynı parametre ölçeğinde SOTA'ya ulaşır ve model mimarisinde Function Call (araç çağırma) yeteneğini görsel modele yerel olarak entegre ederek 'görsel algıdan' 'yürütülebilir eyleme (Action)' kadar olan zinciri açar. Gerçek iş senaryolarındaki çok modlu Agent için birleşik bir teknik temel sağlar.",
"zai/glm-4.5-air.description": "GLM-4.5 ve GLM-4.5-Air, ajan uygulamaları için geliştirilmiş en yeni amiral gemisi modellerimizdir ve her ikisi de MoE mimarisi kullanır. GLM-4.5, toplamda 355B ve her geçişte 32B aktif parametreye sahiptir; GLM-4.5-Air ise daha hafif olup 106B toplam ve 12B aktif parametreye sahiptir.",
"zai/glm-4.5.description": "GLM-4.5 serisi, ajanlar için tasarlanmıştır. Amiral gemisi GLM-4.5, 355B toplam (32B aktif) parametre ile akıl yürütme, kodlama ve ajan becerilerini birleştirir ve hibrit akıl yürütme sistemi olarak çift çalışma modları sunar.",
"zai/glm-4.5v.description": "GLM-4.5V, GLM-4.5-Air üzerine inşa edilmiştir; kanıtlanmış GLM-4.1V-Thinking tekniklerini devralır ve güçlü 106B parametreli MoE mimarisiyle ölçeklenir.",
+14
View File
@@ -24,6 +24,20 @@
"builtins.lobe-agent-builder.inspector.noResults": "Sonuç yok",
"builtins.lobe-agent-builder.inspector.togglePlugin": "Aç/Kapat",
"builtins.lobe-agent-builder.title": "Ajan Oluşturma Uzmanı",
"builtins.lobe-agent-management.apiName.callAgent": "Çağrı temsilcisi",
"builtins.lobe-agent-management.apiName.createAgent": "Temsilci oluştur",
"builtins.lobe-agent-management.apiName.deleteAgent": "Temsilci sil",
"builtins.lobe-agent-management.apiName.searchAgent": "Temsilcileri ara",
"builtins.lobe-agent-management.apiName.updateAgent": "Temsilci güncelle",
"builtins.lobe-agent-management.inspector.callAgent.sync": "Çağrılıyor:",
"builtins.lobe-agent-management.inspector.callAgent.task": "Görev atanıyor:",
"builtins.lobe-agent-management.inspector.createAgent.title": "Temsilci oluşturuluyor:",
"builtins.lobe-agent-management.inspector.searchAgent.all": "Temsilcileri ara:",
"builtins.lobe-agent-management.inspector.searchAgent.market": "Pazarı ara:",
"builtins.lobe-agent-management.inspector.searchAgent.results": "{{count}} sonuç",
"builtins.lobe-agent-management.inspector.searchAgent.user": "Kendi temsilcilerimi ara:",
"builtins.lobe-agent-management.inspector.updateAgent.title": "Temsilci güncelleniyor:",
"builtins.lobe-agent-management.title": "Temsilci Yöneticisi",
"builtins.lobe-cloud-sandbox.apiName.editLocalFile": "Dosyayı düzenle",
"builtins.lobe-cloud-sandbox.apiName.executeCode": "Kodu çalıştır",
"builtins.lobe-cloud-sandbox.apiName.exportFile": "Dosyayı dışa aktar",
+3
View File
@@ -724,6 +724,9 @@
"tools.builtins.lobe-artifacts.description": "Etkileşimli arayüz bileşenleri, grafikler ve web içeriği oluşturun ve önizleyin",
"tools.builtins.lobe-artifacts.readme": "Etkileşimli kullanıcı arayüzü bileşenleri, veri görselleştirmeleri, grafikler, SVG görselleri ve web uygulamaları oluşturun ve canlı önizleme yapın. Kullanıcıların doğrudan etkileşimde bulunabileceği zengin görsel içerikler oluşturun.",
"tools.builtins.lobe-artifacts.title": "Artefaktlar",
"tools.builtins.lobe-calculator.description": "Matematiksel hesaplamalar yapın, denklemleri çözün ve sembolik ifadelerle çalışın",
"tools.builtins.lobe-calculator.readme": "Temel aritmetik, cebirsel denklemler, kalkülüs işlemleri ve sembolik matematiği destekleyen gelişmiş matematiksel hesap makinesi. Taban dönüşümü, denklem çözme, türev alma, integral hesaplama ve daha fazlasını içerir.",
"tools.builtins.lobe-calculator.title": "Hesap Makinesi",
"tools.builtins.lobe-cloud-sandbox.description": "Kod çalıştırın, komutlar yürütün ve dosyaları güvenli bir bulut ortamında yönetin",
"tools.builtins.lobe-cloud-sandbox.readme": "Python, JavaScript ve TypeScript kodlarını izole bir bulut ortamında çalıştırın. Kabuk komutları çalıştırın, dosyaları yönetin, regex ile içerik arayın ve sonuçları güvenli bir şekilde dışa aktarın.",
"tools.builtins.lobe-cloud-sandbox.title": "Bulut Sandbox",
+4
View File
@@ -224,7 +224,9 @@
"providerModels.item.modelConfig.extendParams.options.gpt5_2ProReasoningEffort.hint": "Dành cho dòng GPT-5.2 Pro; điều chỉnh cường độ suy luận.",
"providerModels.item.modelConfig.extendParams.options.gpt5_2ReasoningEffort.hint": "Dành cho dòng GPT-5.2; điều chỉnh cường độ suy luận.",
"providerModels.item.modelConfig.extendParams.options.imageAspectRatio.hint": "Dành cho các mô hình tạo ảnh Gemini; điều chỉnh tỷ lệ khung hình của ảnh được tạo.",
"providerModels.item.modelConfig.extendParams.options.imageAspectRatio2.hint": "Dành cho Nano Banana 2; điều chỉnh tỷ lệ khung hình của hình ảnh được tạo (hỗ trợ tỷ lệ siêu rộng 1:4, 4:1, 1:8, 8:1).",
"providerModels.item.modelConfig.extendParams.options.imageResolution.hint": "Dành cho các mô hình tạo ảnh Gemini 3; điều chỉnh độ phân giải của ảnh được tạo.",
"providerModels.item.modelConfig.extendParams.options.imageResolution2.hint": "Dành cho các mô hình hình ảnh Gemini 3.1 Flash; điều chỉnh độ phân giải của hình ảnh được tạo (hỗ trợ 512px).",
"providerModels.item.modelConfig.extendParams.options.reasoningBudgetToken.hint": "Dành cho Claude, Qwen3 và các mô hình tương tự; điều chỉnh ngân sách token cho suy luận.",
"providerModels.item.modelConfig.extendParams.options.reasoningEffort.hint": "Dành cho OpenAI và các mô hình có khả năng suy luận khác; điều chỉnh mức độ suy luận.",
"providerModels.item.modelConfig.extendParams.options.textVerbosity.hint": "Dành cho dòng GPT-5+; điều chỉnh độ dài và chi tiết của đầu ra.",
@@ -233,6 +235,7 @@
"providerModels.item.modelConfig.extendParams.options.thinkingLevel.hint": "Dành cho các mô hình Gemini 3 Flash Preview; điều chỉnh độ sâu suy nghĩ.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel2.hint": "Dành cho các mô hình Gemini 3 Pro Preview; điều chỉnh độ sâu suy nghĩ.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel3.hint": "Dành cho các mô hình Gemini 3.1 Pro Preview; điều chỉnh độ sâu suy nghĩ với các mức thấp/trung bình/cao.",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel4.hint": "Dành cho các mô hình Gemini 3.1 Flash Image; bật/tắt suy nghĩ.",
"providerModels.item.modelConfig.extendParams.options.urlContext.hint": "Dành cho dòng Gemini; hỗ trợ cung cấp ngữ cảnh từ URL.",
"providerModels.item.modelConfig.extendParams.placeholder": "Chọn các tham số mở rộng để kích hoạt",
"providerModels.item.modelConfig.extendParams.previewFallback": "Không thể xem trước",
@@ -311,6 +314,7 @@
"providerModels.tabs.image": "Hình ảnh",
"providerModels.tabs.stt": "ASR",
"providerModels.tabs.tts": "TTS",
"providerModels.tabs.video": "Video",
"sortModal.success": "Cập nhật sắp xếp thành công",
"sortModal.title": "Thứ tự tùy chỉnh",
"sortModal.update": "Cập nhật",
+35 -31
View File
@@ -55,7 +55,8 @@
"FLUX.1-dev.description": "FLUX.1-dev là một mô hình ngôn ngữ đa phương thức mã nguồn mở (MLLM) từ Black Forest Labs, được tối ưu hóa cho các tác vụ hình ảnh-văn bản, kết hợp khả năng hiểu và tạo hình ảnh/văn bản. Dựa trên các LLM tiên tiến (như Mistral-7B), mô hình sử dụng bộ mã hóa thị giác được thiết kế cẩn thận và tinh chỉnh theo nhiều giai đoạn để hỗ trợ phối hợp đa phương thức và suy luận các tác vụ phức tạp.",
"Gryphe/MythoMax-L2-13b.description": "MythoMax-L2 (13B) là một mô hình sáng tạo cho nhiều lĩnh vực và tác vụ phức tạp.",
"HelloMeme.description": "HelloMeme là một công cụ AI tạo meme, GIF hoặc video ngắn từ hình ảnh hoặc chuyển động bạn cung cấp. Không cần kỹ năng vẽ hoặc lập trình—chỉ cần một hình ảnh tham chiếu—để tạo ra nội dung vui nhộn, hấp dẫn và nhất quán về mặt phong cách.",
"HiDream-I1-Full.description": "HiDream-E1-Full là một mô hình chỉnh sửa hình ảnh đa phương thức mã nguồn mở từ HiDream.ai, dựa trên kiến trúc Diffusion Transformer tiên tiến và khả năng hiểu ngôn ngữ mạnh mẽ (tích hợp sẵn LLaMA 3.1-8B-Instruct). Mô hình hỗ trợ tạo hình ảnh bằng ngôn ngữ tự nhiên, chuyển đổi phong cách, chỉnh sửa cục bộ và vẽ lại, với khả năng hiểu và thực thi văn bản-hình ảnh xuất sắc.",
"HiDream-E1-Full.description": "HiDream-E1-Full là một mô hình chỉnh sửa hình ảnh đa phương thức mã nguồn mở từ HiDream.ai, dựa trên kiến trúc Diffusion Transformer tiên tiến và khả năng hiểu ngôn ngữ mạnh mẽ (tích hợp LLaMA 3.1-8B-Instruct). hỗ trợ tạo hình ảnh dựa trên ngôn ngữ tự nhiên, chuyển đổi phong cách, chỉnh sửa cục bộ và vẽ lại, với khả năng hiểu và thực thi hình ảnh-văn bản xuất sắc.",
"HiDream-I1-Full.description": "HiDream-I1 là mô hình tạo hình ảnh cơ bản mã nguồn mở mới được phát hành bởi HiDream. Với 17 tỷ tham số (Flux có 12 tỷ), nó có thể cung cấp chất lượng hình ảnh hàng đầu trong ngành chỉ trong vài giây.",
"HunyuanDiT-v1.2-Diffusers-Distilled.description": "hunyuandit-v1.2-distilled là một mô hình chuyển văn bản thành hình ảnh nhẹ, được tối ưu hóa thông qua quá trình chưng cất để tạo hình ảnh chất lượng cao nhanh chóng, đặc biệt phù hợp với môi trường tài nguyên thấp và yêu cầu tạo thời gian thực.",
"InstantCharacter.description": "InstantCharacter là một mô hình tạo nhân vật cá nhân hóa không cần tinh chỉnh do Tencent AI phát hành năm 2025, hướng đến việc tạo nhân vật nhất quán, độ trung thực cao trong nhiều bối cảnh khác nhau. Mô hình có thể tạo nhân vật từ một hình ảnh tham chiếu duy nhất và linh hoạt chuyển đổi qua các phong cách, hành động và nền khác nhau.",
"InternVL2-8B.description": "InternVL2-8B là một mô hình ngôn ngữ-thị giác mạnh mẽ hỗ trợ xử lý hình ảnh-văn bản đa phương thức, nhận diện chính xác nội dung hình ảnh và tạo mô tả hoặc câu trả lời phù hợp.",
@@ -80,7 +81,7 @@
"MiniMax-M2.1.description": "Khả năng lập trình đa ngôn ngữ mạnh mẽ, trải nghiệm lập trình được nâng cấp toàn diện",
"MiniMax-M2.5-Lightning.description": "M2.5 Lightning: Hiệu suất tương tự, nhanh hơn và linh hoạt hơn (khoảng 100 tps).",
"MiniMax-M2.5-highspeed.description": "Hiệu suất tương tự như M2.5 với suy luận nhanh hơn đáng kể.",
"MiniMax-M2.5.description": "Hiệu suất hàng đầu và hiệu quả chi phí tối ưu, dễ dàng xử lý các nhiệm vụ phức tạp (khoảng 60 tps).",
"MiniMax-M2.5.description": "MiniMax-M2.5 là mô hình lớn mã nguồn mở hàng đầu từ MiniMax, tập trung vào việc giải quyết các nhiệm vụ thực tế phức tạp. Điểm mạnh cốt lõi của nó là khả năng lập trình đa ngôn ngữ và khả năng giải quyết các nhiệm vụ phức tạp như một Agent.",
"MiniMax-M2.description": "Được xây dựng chuyên biệt cho lập trình hiệu quả và quy trình làm việc của Agent",
"MiniMax-Text-01.description": "MiniMax-01 giới thiệu cơ chế chú ý tuyến tính quy mô lớn vượt ra ngoài Transformer cổ điển, với 456B tham số và 45.9B được kích hoạt mỗi lượt. Mô hình đạt hiệu suất hàng đầu và hỗ trợ ngữ cảnh lên đến 4M token (gấp 32 lần GPT-4o, 20 lần Claude-3.5-Sonnet).",
"MiniMaxAI/MiniMax-M1-80k.description": "MiniMax-M1 là mô hình suy luận quy mô lớn với trọng số mở, sử dụng kiến trúc chú ý lai với tổng 456B tham số và khoảng 45.9B được kích hoạt mỗi token. Mô hình hỗ trợ ngữ cảnh 1M gốc và sử dụng Flash Attention để giảm 75% FLOPs khi tạo 100K token so với DeepSeek R1. Với kiến trúc MoE cùng CISPO và huấn luyện RL chú ý lai, mô hình đạt hiệu suất hàng đầu trong suy luận đầu vào dài và các tác vụ kỹ thuật phần mềm thực tế.",
@@ -98,6 +99,7 @@
"Phi-3.5-mini-instruct.description": "Phiên bản cập nhật của mô hình Phi-3-mini.",
"Phi-3.5-vision-instrust.description": "Phiên bản cập nhật của mô hình Phi-3-vision.",
"Pro/MiniMaxAI/MiniMax-M2.1.description": "MiniMax-M2.1 là một mô hình ngôn ngữ lớn mã nguồn mở được tối ưu hóa cho khả năng tác nhân, nổi bật trong lập trình, sử dụng công cụ, tuân thủ hướng dẫn và lập kế hoạch dài hạn. Mô hình hỗ trợ phát triển phần mềm đa ngôn ngữ và thực thi quy trình làm việc phức tạp nhiều bước, đạt điểm 74.0 trên SWE-bench Verified và vượt qua Claude Sonnet 4.5 trong các tình huống đa ngôn ngữ.",
"Pro/MiniMaxAI/MiniMax-M2.5.description": "MiniMax-M2.5 là mô hình ngôn ngữ lớn mới nhất được phát triển bởi MiniMax, được huấn luyện thông qua học tăng cường quy mô lớn trên hàng trăm nghìn môi trường thực tế phức tạp. Với kiến trúc MoE và 229 tỷ tham số, nó đạt hiệu suất hàng đầu trong ngành ở các nhiệm vụ như lập trình, gọi công cụ Agent, tìm kiếm và các tình huống văn phòng.",
"Pro/Qwen/Qwen2-7B-Instruct.description": "Qwen2-7B-Instruct là mô hình LLM 7B được tinh chỉnh theo hướng dẫn trong dòng Qwen2. Sử dụng kiến trúc Transformer với SwiGLU, thiên vị QKV trong attention và attention theo nhóm, hỗ trợ đầu vào lớn. Mô hình thể hiện hiệu suất mạnh mẽ trong hiểu ngôn ngữ, sinh văn bản, đa ngôn ngữ, lập trình, toán học và suy luận, vượt trội hơn hầu hết các mô hình mã nguồn mở và cạnh tranh với các mô hình độc quyền. Nó vượt qua Qwen1.5-7B-Chat trong nhiều bài đánh giá.",
"Pro/Qwen/Qwen2.5-7B-Instruct.description": "Qwen2.5-7B-Instruct là một phần của dòng LLM mới nhất từ Alibaba Cloud. Mô hình 7B mang lại cải tiến đáng kể trong lập trình và toán học, hỗ trợ hơn 29 ngôn ngữ, và cải thiện khả năng tuân theo hướng dẫn, hiểu dữ liệu có cấu trúc và xuất dữ liệu có cấu trúc (đặc biệt là JSON).",
"Pro/Qwen/Qwen2.5-Coder-7B-Instruct.description": "Qwen2.5-Coder-7B-Instruct là mô hình LLM mới nhất của Alibaba Cloud tập trung vào lập trình. Được xây dựng trên Qwen2.5 và huấn luyện với 5.5T token, nó cải thiện đáng kể khả năng sinh mã, suy luận và sửa lỗi trong khi vẫn giữ được thế mạnh về toán học và khả năng tổng quát, cung cấp nền tảng vững chắc cho các đại lý lập trình.",
@@ -107,13 +109,13 @@
"Pro/deepseek-ai/DeepSeek-R1-Distill-Qwen-7B.description": "DeepSeek-R1-Distill-Qwen-7B được chưng cất từ Qwen2.5-Math-7B và tinh chỉnh trên 800K mẫu DeepSeek-R1 được chọn lọc. Nó thể hiện hiệu suất mạnh mẽ, đạt 92.8% trên MATH-500, 55.5% trên AIME 2024 và xếp hạng CodeForces 1189 cho mô hình 7B.",
"Pro/deepseek-ai/DeepSeek-R1.description": "DeepSeek-R1 là mô hình suy luận dựa trên học tăng cường (RL) giúp giảm lặp lại và cải thiện khả năng đọc. Nó sử dụng dữ liệu khởi động lạnh trước RL để tăng cường khả năng suy luận, đạt hiệu suất tương đương OpenAI-o1 trong các tác vụ toán học, lập trình và suy luận, và cải thiện kết quả tổng thể thông qua huấn luyện cẩn thận.",
"Pro/deepseek-ai/DeepSeek-V3.1-Terminus.description": "DeepSeek-V3.1-Terminus là phiên bản cập nhật của mô hình V3.1, được định vị là LLM đại lý lai. Nó khắc phục các vấn đề do người dùng báo cáo và cải thiện độ ổn định, tính nhất quán ngôn ngữ, đồng thời giảm ký tự bất thường và trộn tiếng Trung/Anh. Nó tích hợp chế độ Tư duy và Không tư duy với mẫu trò chuyện để chuyển đổi linh hoạt. Ngoài ra, nó còn cải thiện hiệu suất của Code Agent và Search Agent để sử dụng công cụ đáng tin cậy hơn và thực hiện các tác vụ nhiều bước.",
"Pro/deepseek-ai/DeepSeek-V3.2-Exp.description": "DeepSeek-V3.2-Exp là bản phát hành thử nghiệm của V3.2, là cầu nối đến kiến trúc tiếp theo. Nó bổ sung DeepSeek Sparse Attention (DSA) trên nền tảng V3.1-Terminus để cải thiện hiệu quả huấn luyện và suy luận với ngữ cảnh dài, được tối ưu hóa cho sử dụng công cụ, hiểu tài liệu dài và suy luận nhiều bước. Lýng để khám phá hiệu quả suy luận cao hơn với ngân sách ngữ cảnh lớn.",
"Pro/deepseek-ai/DeepSeek-V3.2.description": "DeepSeek-V3.2 là một mô hình kết hợp hiệu suất tính toán cao với khả năng suy luận và hiệu suất Agent xuất sắc. Phương pháp của nó dựa trên ba đột phá công nghệ chính: DeepSeek Sparse Attention (DSA), một cơ chế chú ý hiệu quả giúp giảm đáng kể độ phức tạp tính toán trong khi duy trì hiệu suất mô hình, và được tối ưu hóa đặc biệt cho các kịch bản ngữ cảnh dài; một khung học tăng cường có thể mở rộng, qua đó hiệu suất mô hình có thể cạnh tranh với GPT-5, với phiên bản tính toán cao của nóơng đương với Gemini-3.0-Pro về khả năng suy luận; và một quy trình tổng hợp nhiệm vụ Agent quy mô lớn nhằm tích hợp khả năng suy luận vào các kịch bản sử dụng công cụ, từ đó cải thiện khả năng theo dõi hướng dẫn và tổng quát hóa trong các môi trường tương tác phức tạp. Mô hình đã đạt thành tích huy chương vàng tại Olympic Toán học Quốc tế (IMO) và Olympic Tin học Quốc tế (IOI) năm 2025.",
"Pro/deepseek-ai/DeepSeek-V3.description": "DeepSeek-V3 là mô hình MoE với 671B tham số, sử dụng MLA và DeepSeekMoE với cân bằng tải không mất mát để suy luận và huấn luyện hiệu quả. Được huấn luyện sơ bộ trên 14.8T token chất lượng cao và tinh chỉnh thêm bằng SFT và RL, nó vượt trội hơn các mô hình mã nguồn mở khác và tiệm cận các mô hình đóng hàng đầu.",
"Pro/moonshotai/Kimi-K2-Instruct-0905.description": "Kimi K2-Instruct-0905 là phiên bản mới nhất và mạnh nhất của Kimi K2. Đây là mô hình MoE hàng đầu với tổng 1T và 32B tham số đang hoạt động. Các tính năng chính bao gồm trí tuệ lập trình đại lý mạnh hơn với cải tiến đáng kể trên các điểm chuẩn và tác vụ đại lý thực tế, cùng với thẩm mỹ và khả năng sử dụng mã giao diện người dùng được cải thiện.",
"Pro/moonshotai/Kimi-K2-Thinking.description": "Kimi K2 Thinking Turbo là biến thể Turbo được tối ưu hóa cho tốc độ suy luận và thông lượng trong khi vẫn giữ khả năng suy luận nhiều bước và sử dụng công cụ của K2 Thinking. Đây là mô hình MoE với khoảng 1T tham số, hỗ trợ ngữ cảnh gốc 256K và gọi công cụ quy mô lớn ổn định cho các tình huống sản xuất có yêu cầu nghiêm ngặt về độ trễ và đồng thời.",
"Pro/moonshotai/Kimi-K2.5.description": "Kimi K2.5 là mô hình tác tử đa phương thức mã nguồn mở, được xây dựng trên nền tảng Kimi-K2-Base, huấn luyện với khoảng 1,5 nghìn tỷ token kết hợp giữa thị giác và văn bản. Mô hình sử dụng kiến trúc MoE với tổng 1 nghìn tỷ tham số và 32 tỷ tham số hoạt động, hỗ trợ cửa sổ ngữ cảnh 256K, tích hợp liền mạch khả năng hiểu thị giác và ngôn ngữ.",
"Pro/zai-org/glm-4.7.description": "GLM-4.7 là mô hình chủ lực thế hệ mới của Zhipu với tổng số tham số 355 tỷ và 32 tỷ tham số hoạt động, được nâng cấp toàn diện về khả năng đối thoại, suy luận và tác tử. GLM-4.7 tăng cường khả năng Tư duy Đan xen và giới thiệu thêm Tư duy Bảo tồn và Tư duy theo lượt.",
"Pro/zai-org/glm-5.description": "GLM-5 là mô hình ngôn ngữ lớn thế hệ mới của Zhipu, tập trung vào kỹ thuật hệ thống phức tạp và nhiệm vụ Agent dài hạn. Số lượng tham số mở rộng lên đến 744B (40B kích hoạt) và tích hợp DeepSeek Sparse Attention.",
"Pro/zai-org/glm-5.description": "GLM-5 là mô hình ngôn ngữ lớn thế hệ tiếp theo của Zhipu, tập trung vào kỹ thuật hệ thống phức tạp và các nhiệm vụ Agent kéo dài. Các tham số mô hình đã được mở rộng lên 744 tỷ (40 tỷ hoạt động) và tích hợp DeepSeek Sparse Attention.",
"QwQ-32B-Preview.description": "Qwen QwQ là một mô hình nghiên cứu thử nghiệm tập trung vào việc cải thiện khả năng suy luận.",
"Qwen/QVQ-72B-Preview.description": "QVQ-72B-Preview là một mô hình nghiên cứu từ Qwen tập trung vào suy luận thị giác, nổi bật trong việc hiểu các cảnh phức tạp và giải các bài toán thị giác.",
"Qwen/QwQ-32B-Preview.description": "Qwen QwQ là một mô hình nghiên cứu thử nghiệm tập trung vào việc nâng cao khả năng suy luận của AI.",
@@ -137,7 +139,7 @@
"Qwen/Qwen3-14B.description": "Qwen3 là mô hình Tongyi Qwen thế hệ mới với những cải tiến vượt bậc về suy luận, năng lực tổng quát, khả năng tác nhân và hiệu suất đa ngôn ngữ, đồng thời hỗ trợ chuyển đổi giữa các chế độ tư duy.",
"Qwen/Qwen3-235B-A22B-Instruct-2507.description": "Qwen3-235B-A22B-Instruct-2507 là mô hình MoE hàng đầu trong dòng Qwen3 với tổng 235 tỷ và 22 tỷ tham số hoạt động. Đây là phiên bản không tư duy được cập nhật, tập trung vào việc cải thiện khả năng làm theo hướng dẫn, suy luận logic, hiểu văn bản, toán học, khoa học, lập trình và sử dụng công cụ. Mô hình cũng mở rộng kiến thức đa ngôn ngữ hiếm gặp và điều chỉnh tốt hơn với sở thích người dùng trong các tác vụ mở mang tính chủ quan.",
"Qwen/Qwen3-235B-A22B-Thinking-2507.description": "Qwen3-235B-A22B-Thinking-2507 là mô hình Qwen3 tập trung vào suy luận phức tạp. Sử dụng kiến trúc MoE với tổng 235 tỷ và khoảng 22 tỷ tham số hoạt động mỗi token để tăng hiệu quả. Là mô hình tư duy chuyên biệt, nó đạt được cải tiến lớn trong logic, toán học, khoa học, lập trình và các chuẩn học thuật, đạt hiệu suất tư duy hàng đầu. Mô hình cũng cải thiện khả năng làm theo hướng dẫn, sử dụng công cụ và tạo văn bản, đồng thời hỗ trợ ngữ cảnh 256K gốc cho suy luận sâu và tài liệu dài.",
"Qwen/Qwen3-235B-A22B.description": "Qwen3 là mô hình Tongyi Qwen thế hệ mới với những cải tiến vượt bậc về suy luận, năng lực tổng quát, khả năng tác nhân và hiệu suất đa ngôn ngữ, đồng thời hỗ trợ chuyển đổi giữa các chế độ tư duy.",
"Qwen/Qwen3-235B-A22B.description": "Qwen3 235B A22B là mô hình siêu quy mô của Qwen3, mang lại khả năng AI hàng đầu.",
"Qwen/Qwen3-30B-A3B-Instruct-2507.description": "Qwen3-30B-A3B-Instruct-2507 là phiên bản không tư duy được cập nhật của Qwen3-30B-A3B. Đây là mô hình MoE với tổng 30,5 tỷ và 3,3 tỷ tham số hoạt động. Mô hình cải thiện đáng kể khả năng làm theo hướng dẫn, suy luận logic, hiểu văn bản, toán học, khoa học, lập trình và sử dụng công cụ, mở rộng kiến thức đa ngôn ngữ hiếm gặp và điều chỉnh tốt hơn với sở thích người dùng trong các tác vụ mở mang tính chủ quan. Hỗ trợ ngữ cảnh 256K. Phiên bản này chỉ hỗ trợ chế độ không tư duy và sẽ không tạo thẻ `<think></think>`.",
"Qwen/Qwen3-30B-A3B-Thinking-2507.description": "Qwen3-30B-A3B-Thinking-2507 là mô hình tư duy mới nhất trong dòng Qwen3. Đây là mô hình MoE với tổng 30,5 tỷ và 3,3 tỷ tham số hoạt động, tập trung vào các tác vụ phức tạp. Mô hình đạt được cải tiến đáng kể trong logic, toán học, khoa học, lập trình và các chuẩn học thuật, đồng thời cải thiện khả năng làm theo hướng dẫn, sử dụng công cụ, tạo văn bản và điều chỉnh theo sở thích. Hỗ trợ ngữ cảnh 256K gốc và có thể mở rộng đến 1 triệu token. Phiên bản này được thiết kế cho chế độ tư duy với suy luận từng bước chi tiết và khả năng tác nhân mạnh mẽ.",
"Qwen/Qwen3-30B-A3B.description": "Qwen3 là mô hình Tongyi Qwen thế hệ mới với những cải tiến vượt bậc về suy luận, năng lực tổng quát, khả năng tác nhân và hiệu suất đa ngôn ngữ, đồng thời hỗ trợ chuyển đổi giữa các chế độ tư duy.",
@@ -315,7 +317,6 @@
"codeqwen.description": "CodeQwen1.5 là mô hình ngôn ngữ lớn được huấn luyện trên dữ liệu mã phong phú, được xây dựng cho các tác vụ lập trình phức tạp.",
"codestral-latest.description": "Codestral là mô hình lập trình tiên tiến nhất của chúng tôi; phiên bản v2 (tháng 1 năm 2025) nhắm đến các tác vụ tần suất cao, độ trễ thấp như FIM, sửa mã và sinh bài kiểm tra.",
"codestral.description": "Codestral là mô hình lập trình đầu tiên của Mistral AI, cung cấp hỗ trợ sinh mã mạnh mẽ.",
"codex-mini-latest.description": "codex-mini-latest là một mô hình o4-mini được tinh chỉnh dành cho Codex CLI. Đối với việc sử dụng API trực tiếp, chúng tôi khuyến nghị bắt đầu với gpt-4.1.",
"cogito-2.1:671b.description": "Cogito v2.1 671B là một mô hình ngôn ngữ mã nguồn mở của Mỹ, miễn phí cho mục đích thương mại, có hiệu suất sánh ngang với các mô hình hàng đầu, hiệu quả suy luận theo token cao hơn, hỗ trợ ngữ cảnh dài 128k và khả năng tổng thể mạnh mẽ.",
"cogview-3-flash.description": "CogView-3-Flash là một mô hình tạo hình ảnh miễn phí được ra mắt bởi Zhipu. Nó tạo ra các hình ảnh phù hợp với hướng dẫn của người dùng đồng thời đạt được điểm chất lượng thẩm mỹ cao hơn. CogView-3-Flash chủ yếu được sử dụng trong các lĩnh vực như sáng tạo nghệ thuật, tham khảo thiết kế, phát triển trò chơi và thực tế ảo, giúp người dùng nhanh chóng chuyển đổi mô tả văn bản thành hình ảnh.",
"cogview-4.description": "CogView-4 là mô hình chuyển văn bản thành hình ảnh mã nguồn mở đầu tiên của Zhipu có khả năng tạo ký tự Trung Quốc. Mô hình cải thiện khả năng hiểu ngữ nghĩa, chất lượng hình ảnh và hiển thị văn bản Trung/Anh, hỗ trợ lời nhắc song ngữ với độ dài tùy ý và có thể tạo hình ảnh ở bất kỳ độ phân giải nào trong phạm vi chỉ định.",
@@ -342,7 +343,7 @@
"command-light-nightly.description": "Để rút ngắn khoảng cách giữa các bản phát hành chính, chúng tôi cung cấp các bản dựng Command hàng đêm. Với dòng command-light, đây là command-light-nightly. Đây là phiên bản mới nhất, mang tính thử nghiệm cao (và có thể không ổn định), được cập nhật thường xuyên mà không báo trước, do đó không khuyến nghị sử dụng trong môi trường sản xuất.",
"command-light.description": "Biến thể Command nhỏ hơn, nhanh hơn, gần như mạnh mẽ như bản gốc nhưng có tốc độ cao hơn.",
"command-nightly.description": "Để rút ngắn khoảng cách giữa các bản phát hành chính, chúng tôi cung cấp các bản dựng Command hàng đêm. Với dòng Command, đây là command-nightly. Đây là phiên bản mới nhất, mang tính thử nghiệm cao (và có thể không ổn định), được cập nhật thường xuyên mà không báo trước, do đó không khuyến nghị sử dụng trong môi trường sản xuất.",
"command-r-03-2024.description": "Command R là mô hình trò chuyện theo hướng dẫn với chất lượng cao hơn, độ tin cậy lớn hơn và cửa sổ ngữ cảnh dài hơn so với các mô hình trước đó. Mô hình hỗ trợ các quy trình phức tạp như tạo mã, RAG, sử dụng công cụ và tác tử.",
"command-r-03-2024.description": "command-r là mô hình chat theo hướng dẫn, thực hiện các nhiệm vụ ngôn ngữ với chất lượng cao hơn, độ tin cậy được cải thiện và ngữ cảnh dài hơn so với các mô hình trước đó. hỗ trợ các quy trình phức tạp như tạo mã, RAG, sử dụng công cụ và Agent.",
"command-r-08-2024.description": "command-r-08-2024 là phiên bản cập nhật của mô hình Command R được phát hành vào tháng 8 năm 2024.",
"command-r-plus-04-2024.description": "command-r-plus là bí danh của command-r-plus-04-2024, vì vậy sử dụng command-r-plus trong API sẽ trỏ đến mô hình đó.",
"command-r-plus-08-2024.description": "Command R+ là mô hình trò chuyện theo hướng dẫn với chất lượng cao hơn, độ tin cậy lớn hơn và cửa sổ ngữ cảnh dài hơn so với các mô hình trước đó. Mô hình phù hợp nhất cho các quy trình RAG phức tạp và sử dụng công cụ nhiều bước.",
@@ -366,7 +367,8 @@
"deepseek-ai/DeepSeek-V2.5.description": "DeepSeek-V2.5 nâng cấp từ DeepSeek-V2-Chat và DeepSeek-Coder-V2-Instruct, kết hợp khả năng tổng quát và lập trình. Mô hình cải thiện khả năng viết và tuân thủ hướng dẫn để phù hợp hơn với sở thích người dùng, và đạt tiến bộ đáng kể trên các bài kiểm tra như AlpacaEval 2.0, ArenaHard, AlignBench và MT-Bench.",
"deepseek-ai/DeepSeek-V3.1-Terminus.description": "DeepSeek-V3.1-Terminus là phiên bản cập nhật của mô hình V3.1, được định vị như một mô hình đại lý lai (hybrid agent LLM). Mô hình khắc phục các vấn đề do người dùng báo cáo, cải thiện độ ổn định, tính nhất quán ngôn ngữ và giảm ký tự bất thường hoặc pha trộn Trung-Anh. Nó tích hợp chế độ Suy nghĩ và Không suy nghĩ với mẫu trò chuyện để chuyển đổi linh hoạt. Ngoài ra, mô hình còn nâng cao hiệu suất của Code Agent và Search Agent để sử dụng công cụ đáng tin cậy hơn và thực hiện các tác vụ nhiều bước.",
"deepseek-ai/DeepSeek-V3.1.description": "DeepSeek V3.1 sử dụng kiến trúc suy luận lai và hỗ trợ cả chế độ suy nghĩ và không suy nghĩ.",
"deepseek-ai/DeepSeek-V3.2-Exp.description": "DeepSeek-V3.2-Exp là phiên bản thử nghiệm của V3.2, là cầu nối đến kiến trúc tiếp theo. Mô hình bổ sung DeepSeek Sparse Attention (DSA) trên nền tảng V3.1-Terminus để cải thiện hiệu quả huấn luyện và suy luận với ngữ cảnh dài, cùng các tối ưu hóa cho việc sử dụng công cụ, hiểu tài liệu dài và suy luận nhiều bước. Đây là lựa chọn lý tưởng để khám phá hiệu quả suy luận cao hơn với ngân sách ngữ cảnh lớn.",
"deepseek-ai/DeepSeek-V3.2-Exp.description": "DeepSeek V3.2 Exp sử dụng kiến trúc suy luận lai và hỗ trợ cả chế độ suy nghĩ và không suy nghĩ.",
"deepseek-ai/DeepSeek-V3.2.description": "DeepSeek-V3.2 là một mô hình kết hợp hiệu suất tính toán cao với khả năng suy luận và hiệu suất Agent xuất sắc. Phương pháp của nó dựa trên ba đột phá công nghệ chính: DeepSeek Sparse Attention (DSA), một cơ chế chú ý hiệu quả giúp giảm đáng kể độ phức tạp tính toán trong khi duy trì hiệu suất mô hình, và được tối ưu hóa đặc biệt cho các kịch bản ngữ cảnh dài; một khung học tăng cường có thể mở rộng, qua đó hiệu suất mô hình có thể cạnh tranh với GPT-5, và phiên bản tính toán cao của nó có thể cạnh tranh với Gemini-3.0-Pro về khả năng suy luận; và một quy trình tổng hợp nhiệm vụ Agent quy mô lớn, được thiết kế để tích hợp khả năng suy luận vào các kịch bản sử dụng công cụ, từ đó cải thiện khả năng theo dõi hướng dẫn và khả năng tổng quát hóa trong các môi trường tương tác phức tạp. Mô hình đã đạt thành tích huy chương vàng tại Olympic Toán học Quốc tế (IMO) và Olympic Tin học Quốc tế (IOI) năm 2025.",
"deepseek-ai/DeepSeek-V3.description": "DeepSeek-V3 là mô hình MoE với 671 tỷ tham số, sử dụng MLA và DeepSeekMoE với cân bằng tải không tổn thất để huấn luyện và suy luận hiệu quả. Được huấn luyện trước trên 14.8T token chất lượng cao với SFT và RL, mô hình vượt trội so với các mô hình mã nguồn mở khác và tiệm cận các mô hình đóng hàng đầu.",
"deepseek-ai/deepseek-llm-67b-chat.description": "DeepSeek LLM Chat (67B) là một mô hình sáng tạo cung cấp khả năng hiểu và tương tác ngôn ngữ sâu sắc.",
"deepseek-ai/deepseek-v3.1-terminus.description": "DeepSeek V3.1 là mô hình suy luận thế hệ mới với khả năng suy luận phức tạp mạnh mẽ và chuỗi suy nghĩ cho các tác vụ phân tích chuyên sâu.",
@@ -433,6 +435,7 @@
"deepseek_r1_distill_llama_70b.description": "DeepSeek-R1-Distill-Llama-70B được chưng cất từ Llama-3.3-70B-Instruct. Là một phần của dòng DeepSeek-R1, mô hình được tinh chỉnh trên các mẫu do DeepSeek-R1 tạo ra và thể hiện hiệu suất mạnh mẽ trong toán học, lập trình và suy luận.",
"deepseek_r1_distill_qwen_14b.description": "DeepSeek-R1-Distill-Qwen-14B được chưng cất từ Qwen2.5-14B và tinh chỉnh trên 800K mẫu được chọn lọc do DeepSeek-R1 tạo ra, mang lại khả năng suy luận mạnh mẽ.",
"deepseek_r1_distill_qwen_32b.description": "DeepSeek-R1-Distill-Qwen-32B được chưng cất từ Qwen2.5-32B và tinh chỉnh trên 800K mẫu được chọn lọc do DeepSeek-R1 tạo ra, vượt trội trong toán học, lập trình và suy luận.",
"devstral-2512.description": "Devstral 2 là mô hình văn bản cấp doanh nghiệp, xuất sắc trong việc sử dụng công cụ để khám phá cơ sở mã, chỉnh sửa nhiều tệp và hỗ trợ các Agent kỹ thuật phần mềm.",
"devstral-2:123b.description": "Devstral 2 123B vượt trội trong việc sử dụng công cụ để khám phá mã nguồn, chỉnh sửa nhiều tệp và hỗ trợ các đại lý kỹ thuật phần mềm.",
"doubao-1.5-lite-32k.description": "Doubao-1.5-lite là mô hình nhẹ mới với phản hồi siêu nhanh, mang lại chất lượng và độ trễ hàng đầu.",
"doubao-1.5-pro-256k.description": "Doubao-1.5-pro-256k là bản nâng cấp toàn diện của Doubao-1.5-Pro, cải thiện hiệu suất tổng thể 10%. Mô hình hỗ trợ cửa sổ ngữ cảnh 256k và tối đa 12k token đầu ra, mang lại hiệu suất cao hơn, cửa sổ lớn hơn và giá trị mạnh mẽ cho nhiều trường hợp sử dụng.",
@@ -546,10 +549,10 @@
"gemini-2.5-pro-preview-06-05.description": "Gemini 2.5 Pro Preview là mô hình suy luận tiên tiến nhất của Google, có khả năng suy luận trên mã, toán học và các vấn đề STEM, cũng như phân tích tập dữ liệu lớn, mã nguồn và tài liệu với ngữ cảnh dài.",
"gemini-2.5-pro.description": "Gemini 2.5 Pro là mô hình suy luận tiên tiến nhất của Google, có khả năng suy luận trên mã, toán học và các vấn đề STEM, cũng như phân tích tập dữ liệu lớn, mã nguồn và tài liệu với ngữ cảnh dài.",
"gemini-3-flash-preview.description": "Gemini 3 Flash là mô hình thông minh nhất được xây dựng để tối ưu tốc độ, kết hợp trí tuệ tiên tiến với khả năng tìm kiếm chính xác.",
"gemini-3-pro-image-preview.description": "Gemini 3 Pro ImageNano Banana Prolà mô hình tạo hình ảnh của Google, đồng thời hỗ trợ hội thoại đa phương thức.",
"gemini-3-pro-image-preview.description": "Gemini 3 Pro Image (Nano Banana Pro) là mô hình tạo hình ảnh của Google, ng hỗ trợ đối thoại đa phương thức.",
"gemini-3-pro-image-preview:image.description": "Gemini 3 Pro Image (Nano Banana Pro) là mô hình tạo hình ảnh của Google, đồng thời hỗ trợ trò chuyện đa phương thức.",
"gemini-3-pro-preview.description": "Gemini 3 Pro là mô hình mạnh mẽ nhất của Google, kết hợp khả năng mã hóa cảm xúc và suy luận tiên tiến, mang đến hình ảnh phong phú và tương tác sâu sắc.",
"gemini-3.1-flash-image-preview.description": "Gemini 3.1 Flash Image (Nano Banana 2) mang lại chất lượng hình ảnh cấp độ chuyên nghiệp với tốc độ Flash và hỗ trợ hội thoại đa phương thức.",
"gemini-3.1-flash-image-preview.description": "Gemini 3.1 Flash Image (Nano Banana 2) là mô hình tạo hình ảnh bản địa nhanh nhất của Google với hỗ trợ suy nghĩ, tạo hình ảnh đối thoại và chỉnh sửa.",
"gemini-3.1-flash-image-preview:image.description": "Gemini 3.1 Flash Image (Nano Banana 2) mang lại chất lượng hình ảnh cấp độ chuyên nghiệp với tốc độ Flash và hỗ trợ hội thoại đa phương thức.",
"gemini-3.1-pro-preview.description": "Gemini 3.1 Pro Preview cải tiến Gemini 3 Pro với khả năng suy luận nâng cao và bổ sung hỗ trợ mức suy nghĩ trung bình.",
"gemini-flash-latest.description": "Phiên bản mới nhất của Gemini Flash",
@@ -605,19 +608,15 @@
"google/gemini-2.0-flash-lite-001.description": "Gemini 2.0 Flash Lite là biến thể nhẹ của Gemini với chế độ suy nghĩ bị tắt mặc định để cải thiện độ trễ và chi phí, nhưng có thể bật thông qua tham số.",
"google/gemini-2.0-flash-lite.description": "Gemini 2.0 Flash Lite cung cấp các tính năng thế hệ mới bao gồm tốc độ vượt trội, sử dụng công cụ tích hợp, tạo nội dung đa phương thức và cửa sổ ngữ cảnh lên đến 1 triệu token.",
"google/gemini-2.0-flash.description": "Gemini 2.0 Flash là mô hình suy luận hiệu suất cao của Google dành cho các tác vụ đa phương thức mở rộng.",
"google/gemini-2.5-flash-image-free.description": "Gemini 2.5 Flash Image phiên bản miễn phí với hạn ngạch tạo nội dung đa phương thức giới hạn.",
"google/gemini-2.5-flash-image-preview.description": "Gemini 2.5 Flash là mô hình thử nghiệm hỗ trợ tạo hình ảnh.",
"google/gemini-2.5-flash-image.description": "Gemini 2.5 Flash Image (Nano Banana) là mô hình tạo hình ảnh của Google với hỗ trợ hội thoại đa phương thức.",
"google/gemini-2.5-flash-lite.description": "Gemini 2.5 Flash Lite là biến thể nhẹ của Gemini 2.5 được tối ưu hóa cho độ trễ và chi phí, phù hợp với các tình huống yêu cầu thông lượng cao.",
"google/gemini-2.5-flash-preview.description": "Gemini 2.5 Flash là mô hình chủ lực tiên tiến nhất của Google, được xây dựng cho các tác vụ suy luận, lập trình, toán học và khoa học nâng cao. Mô hình tích hợp khả năng “suy nghĩ” để cung cấp phản hồi chính xác hơn với xử lý ngữ cảnh tinh tế hơn.\n\nLưu ý: Mô hình này có hai biến thể — có suy nghĩ và không suy nghĩ. Giá đầu ra khác nhau đáng kể tùy theo việc suy nghĩ có được bật hay không. Nếu bạn chọn biến thể tiêu chuẩn (không có hậu tố “:thinking”), mô hình sẽ tránh tạo token suy nghĩ.\n\nĐể sử dụng suy nghĩ và nhận token suy nghĩ, bạn phải chọn biến thể “:thinking”, điều này sẽ tính giá cao hơn cho đầu ra suy nghĩ.\n\nGemini 2.5 Flash cũng có thể được cấu hình thông qua tham số “max reasoning tokens” như được tài liệu hóa (https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning).",
"google/gemini-2.5-flash-preview:thinking.description": "Gemini 2.5 Flash là mô hình chủ lực tiên tiến nhất của Google, được xây dựng cho các tác vụ suy luận, lập trình, toán học và khoa học nâng cao. Mô hình tích hợp khả năng “suy nghĩ” để cung cấp phản hồi chính xác hơn với xử lý ngữ cảnh tinh tế hơn.\n\nLưu ý: Mô hình này có hai biến thể — có suy nghĩ và không suy nghĩ. Giá đầu ra khác nhau đáng kể tùy theo việc suy nghĩ có được bật hay không. Nếu bạn chọn biến thể tiêu chuẩn (không có hậu tố “:thinking”), mô hình sẽ tránh tạo token suy nghĩ.\n\nĐể sử dụng suy nghĩ và nhận token suy nghĩ, bạn phải chọn biến thể “:thinking”, điều này sẽ tính giá cao hơn cho đầu ra suy nghĩ.\n\nGemini 2.5 Flash cũng có thể được cấu hình thông qua tham số “max reasoning tokens” như được tài liệu hóa (https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning).",
"google/gemini-2.5-flash.description": "Gemini 2.5 Flash (Lite/Pro/Flash) là dòng sản phẩm của Google trải dài từ độ trễ thấp đến suy luận hiệu suất cao.",
"google/gemini-2.5-pro-free.description": "Gemini 2.5 Pro phiên bản miễn phí cung cấp ngữ cảnh dài đa phương thức với hạn ngạch giới hạn, phù hợp cho thử nghiệm và quy trình nhẹ.",
"google/gemini-2.5-flash.description": "Gemini 2.5 Flash là dòng sản phẩm của Google trải dài từ độ trễ thấp đến suy luận hiệu suất cao.",
"google/gemini-2.5-pro-preview.description": "Gemini 2.5 Pro Preview là mô hình suy nghĩ tiên tiến nhất của Google để suy luận các vấn đề phức tạp trong lập trình, toán học và STEM, cũng như phân tích tập dữ liệu lớn, mã nguồn và tài liệu với ngữ cảnh dài.",
"google/gemini-2.5-pro.description": "Gemini 2.5 Pro là mô hình suy luận chủ lực của Google với hỗ trợ ngữ cảnh dài cho các tác vụ phức tạp.",
"google/gemini-3-pro-image-preview-free.description": "Gemini 3 Pro Image phiên bản miễn phí với hạn ngạch tạo nội dung đa phương thức giới hạn.",
"google/gemini-3-pro-image-preview.description": "Gemini 3 Pro Image (Nano Banana Pro) là mô hình tạo hình ảnh của Google với hỗ trợ hội thoại đa phương thức.",
"google/gemini-3-pro-preview-free.description": "Gemini 3 Pro Preview Free cung cấp khả năng hiểu và suy luận đa phương thức giống như phiên bản tiêu chuẩn, nhưng có giới hạn về hạn ngạch và tốc độ, phù hợp hơn cho thử nghiệm và sử dụng tần suất thấp.",
"google/gemini-3-pro-preview.description": "Gemini 3 Pro là mô hình suy luận đa phương thức thế hệ tiếp theo trong dòng Gemini, có khả năng hiểu văn bản, âm thanh, hình ảnh và video, xử lý các tác vụ phức tạp và mã nguồn lớn.",
"google/gemini-embedding-001.description": "Mô hình embedding tiên tiến với hiệu suất mạnh mẽ trong tiếng Anh, đa ngôn ngữ và lập trình.",
"google/gemini-flash-1.5.description": "Gemini 1.5 Flash cung cấp xử lý đa phương tiện tối ưu cho nhiều tác vụ phức tạp.",
@@ -717,15 +716,24 @@
"hunyuan-a13b.description": "Mô hình suy luận lai đầu tiên từ Hunyuan, được nâng cấp từ hunyuan-standard-256K (80B tổng, 13B hoạt động). Mặc định suy nghĩ chậm và hỗ trợ chuyển đổi nhanh/chậm thông qua tham số hoặc tiền tố /no_think. Năng lực tổng thể được cải thiện so với thế hệ trước, đặc biệt trong toán học, khoa học, hiểu văn bản dài và các tác vụ tác nhân.",
"hunyuan-code.description": "Mô hình mã mới nhất của Hunyuan được huấn luyện trên 200 tỷ dữ liệu mã chất lượng cao cộng với sáu tháng dữ liệu SFT, với ngữ cảnh 8K. Nó xếp gần đầu trong các tiêu chuẩn mã hóa tự động và trong các đánh giá của chuyên gia con người trên năm ngôn ngữ.",
"hunyuan-functioncall.description": "Mô hình MoE FunctionCall mới nhất của Hunyuan được huấn luyện trên dữ liệu gọi công cụ chất lượng cao, với cửa sổ ngữ cảnh 32K và đạt tiêu chuẩn hàng đầu trên nhiều khía cạnh.",
"hunyuan-large-longcontext.description": "Xuất sắc trong các nhiệm vụ tài liệu dài như tóm tắt và hỏi đáp, đồng thời xử lý việc tạo nội dung chung. Mạnh mẽ trong phân tích và tạo văn bản dài cho nội dung phức tạp, chi tiết.",
"hunyuan-large.description": "Hunyuan-large có ~389 tỷ tham số tổng cộng và ~52 tỷ được kích hoạt, là mô hình MoE mở lớn nhất và mạnh nhất trong kiến trúc Transformer.",
"hunyuan-lite.description": "Được nâng cấp lên kiến trúc MoE với cửa sổ ngữ cảnh 256K, dẫn đầu nhiều mô hình mở trong các bài kiểm tra NLP, mã hóa, toán học và ngành công nghiệp.",
"hunyuan-pro.description": "Mô hình MoE-32K với hàng nghìn tỷ tham số, dẫn đầu các bài kiểm tra, mạnh mẽ trong hướng dẫn phức tạp và suy luận, toán học nâng cao, gọi hàm và tối ưu hóa cho dịch đa ngôn ngữ, tài chính, pháp lý và y tế.",
"hunyuan-role.description": "Mô hình nhập vai mới nhất của Hunyuan, được tinh chỉnh chính thức với dữ liệu nhập vai, mang lại hiệu suất cơ bản mạnh mẽ hơn trong các tình huống nhập vai.",
"hunyuan-standard-256K.description": "Sử dụng định tuyến cải tiến để giảm thiểu cân bằng tải và sự sụp đổ của chuyên gia. Văn bản dài \"kim trong đống rơm\" đạt 99,9%. MOE-256K đẩy xa hơn về độ dài và chất lượng, mở rộng đáng kể độ dài đầu vào.",
"hunyuan-standard.description": "Sử dụng định tuyến cải tiến để giảm thiểu cân bằng tải và sự sụp đổ của chuyên gia. Văn bản dài \"kim trong đống rơm\" đạt 99,9%. MOE-32K mang lại giá trị tốt hơn trong khi cân bằng chất lượng và giá cả cho các đầu vào văn bản dài.",
"hunyuan-standard-256K.description": "Sử dụng định tuyến cải tiến để giảm thiểu cân bằng tải và sụp đổ chuyên gia. Đạt 99,9% tìm kim trong đống rơm trên ngữ cảnh dài. MOE-256K mở rộng thêm độ dài và chất lượng ngữ cảnh.",
"hunyuan-standard.description": "Sử dụng định tuyến cải tiến để giảm thiểu cân bằng tải và sụp đổ chuyên gia. Đạt 99,9% tìm kim trong đống rơm trên ngữ cảnh dài. MOE-32K mang lại giá trị mạnh mẽ trong khi xử lý các đầu vào dài.",
"hunyuan-t1-20250321.description": "Xây dựng khả năng cân bằng giữa nghệ thuật và STEM với khả năng nắm bắt thông tin văn bản dài mạnh mẽ. Hỗ trợ trả lời suy luận cho các vấn đề toán học, logic, khoa học và mã hóa ở các mức độ khó khác nhau.",
"hunyuan-t1-20250403.description": "Cải thiện chất lượng viết mã cấp dự án và viết văn, tăng cường hiểu biết về chủ đề nhiều lượt và theo dõi hướng dẫn ToB, cải thiện hiểu biết từ cấp độ từ, và giảm các vấn đề đầu ra hỗn hợp giữa giản thể/truyền thống và tiếng Trung/tiếng Anh.",
"hunyuan-t1-20250529.description": "Cải thiện viết sáng tạo và sáng tác, tăng cường mã hóa giao diện, toán học và suy luận logic, và nâng cao khả năng theo dõi hướng dẫn.",
"hunyuan-t1-20250711.description": "Cải thiện đáng kể toán học khó, logic và mã hóa, tăng cường độ ổn định đầu ra, và nâng cao khả năng văn bản dài.",
"hunyuan-t1-latest.description": "Cải thiện đáng kể mô hình suy nghĩ chậm trong toán học khó, suy luận phức tạp, mã hóa khó, tuân theo hướng dẫn và chất lượng viết sáng tạo.",
"hunyuan-t1-vision-20250916.description": "Mô hình suy luận sâu t1-vision mới nhất với cải tiến lớn trong VQA, định vị hình ảnh, OCR, biểu đồ, giải bài toán qua ảnh và sáng tạo dựa trên hình ảnh, cùng khả năng tiếng Anh và ngôn ngữ ít tài nguyên mạnh hơn.",
"hunyuan-turbo-20241223.description": "Phiên bản này tăng cường khả năng mở rộng hướng dẫn để tổng quát hóa tốt hơn, cải thiện đáng kể suy luận toán học/mã hóa/logic, nâng cao hiểu biết từ cấp độ từ, và cải thiện chất lượng viết.",
"hunyuan-turbo-latest.description": "Cải thiện trải nghiệm tổng thể trong hiểu biết NLP, viết, chat, hỏi đáp, dịch thuật và các lĩnh vực; phản hồi giống con người hơn, làm rõ ý định mơ hồ tốt hơn, cải thiện phân tích từ, chất lượng sáng tạo cao hơn và tương tác, và tăng cường các cuộc trò chuyện nhiều lượt.",
"hunyuan-turbo.description": "Bản xem trước của LLM thế hệ tiếp theo từ Hunyuan với kiến trúc MoE mới, mang lại suy luận nhanh hơn và kết quả mạnh mẽ hơn so với hunyuan-pro.",
"hunyuan-turbos-latest.description": "Mô hình hàng đầu Hunyuan TurboS mới nhất với khả năng suy luận mạnh mẽ hơn và trải nghiệm tổng thể tốt hơn.",
"hunyuan-turbos-longtext-128k-20250325.description": "Xuất sắc trong các nhiệm vụ tài liệu dài như tóm tắt và hỏi đáp, đồng thời xử lý việc tạo nội dung chung. Mạnh mẽ trong phân tích và tạo văn bản dài cho nội dung phức tạp, chi tiết.",
"hunyuan-vision-1.5-instruct.description": "Mô hình hình ảnh-to-văn bản suy nghĩ nhanh được xây dựng trên nền tảng văn bản TurboS, cho thấy những cải tiến đáng chú ý so với phiên bản trước trong nhận diện hình ảnh cơ bản và suy luận phân tích hình ảnh.",
"hunyuan-vision.description": "Mô hình đa phương thức mới nhất của Hunyuan hỗ trợ đầu vào hình ảnh + văn bản để tạo văn bản.",
"image-01-live.description": "Mô hình tạo ảnh với chi tiết tinh xảo, hỗ trợ chuyển văn bản thành hình ảnh và các kiểu dáng có thể điều chỉnh.",
@@ -770,8 +778,7 @@
"kimi-k2:1t.description": "Kimi K2 là mô hình LLM MoE lớn từ Moonshot AI với 1T tham số tổng và 32B đang hoạt động mỗi lần truyền. Nó được tối ưu hóa cho khả năng tác nhân bao gồm sử dụng công cụ nâng cao, suy luận và tổng hợp mã.",
"kimi-latest.description": "Kimi Latest sử dụng mô hình Kimi mới nhất và có thể bao gồm các tính năng thử nghiệm. Hỗ trợ hiểu hình ảnh và tự động chọn mô hình tính phí 8k/32k/128k dựa trên độ dài ngữ cảnh.",
"kuaishou/kat-coder-pro-v1.description": "KAT-Coder-Pro-V1 (miễn phí trong thời gian giới hạn) tập trung vào hiểu mã và tự động hóa để hỗ trợ lập trình hiệu quả.",
"learnlm-1.5-pro-experimental.description": "LearnLM là một mô hình thử nghiệm, được huấn luyện theo các nguyên lý khoa học giáo dục để tuân theo hướng dẫn hệ thống trong các tình huống giảng dạy/học tập, đóng vai trò như một gia sư chuyên gia.",
"learnlm-2.0-flash-experimental.description": "LearnLM là một mô hình thử nghiệm, được huấn luyện theo các nguyên lý khoa học giáo dục để tuân theo hướng dẫn hệ thống trong các tình huống giảng dạy/học tập, đóng vai trò như một gia sư chuyên gia.",
"labs-devstral-small-2512.description": "Devstral Small 2 xuất sắc trong việc sử dụng công cụ để khám phá cơ sở mã, chỉnh sửa nhiều tệp và hỗ trợ các Agent kỹ thuật phần mềm.",
"lite.description": "Spark Lite là một mô hình ngôn ngữ nhẹ với độ trễ cực thấp và xử lý hiệu quả. Hoàn toàn miễn phí và hỗ trợ tìm kiếm web theo thời gian thực. Phản hồi nhanh, hoạt động tốt trên thiết bị có tài nguyên hạn chế và phù hợp cho tinh chỉnh mô hình, mang lại hiệu quả chi phí cao và trải nghiệm thông minh, đặc biệt trong hỏi đáp kiến thức, tạo nội dung và tìm kiếm.",
"llama-3.1-70b-versatile.description": "Llama 3.1 70B cung cấp khả năng suy luận AI mạnh mẽ cho các ứng dụng phức tạp, hỗ trợ tính toán nặng với hiệu suất và độ chính xác cao.",
"llama-3.1-8b-instant.description": "Llama 3.1 8B là mô hình hiệu suất cao với khả năng tạo văn bản nhanh, lý tưởng cho các ứng dụng quy mô lớn và tiết kiệm chi phí.",
@@ -782,7 +789,6 @@
"llama-3.2-90b-vision-preview.description": "Llama 3.2 được thiết kế cho các tác vụ kết hợp giữa thị giác và văn bản, xuất sắc trong mô tả hình ảnh và hỏi đáp thị giác, kết nối giữa tạo ngôn ngữ và suy luận hình ảnh.",
"llama-3.2-vision-instruct.description": "Mô hình Llama 3.2-Vision được tinh chỉnh theo hướng dẫn, tối ưu cho nhận diện hình ảnh, suy luận hình ảnh, mô tả và hỏi đáp hình ảnh tổng quát.",
"llama-3.3-70b-versatile.description": "Meta Llama 3.3 là mô hình ngôn ngữ đa ngữ với 70 tỷ tham số (văn bản vào/ra), cung cấp các phiên bản huấn luyện sẵn và tinh chỉnh theo hướng dẫn. Phiên bản chỉ văn bản được tinh chỉnh theo hướng dẫn tối ưu cho đối thoại đa ngữ và vượt trội hơn nhiều mô hình trò chuyện mã nguồn mở và đóng trong các tiêu chuẩn ngành.",
"llama-3.3-70b.description": "Llama 3.3 70B: mô hình Llama cỡ trung đến lớn cân bằng giữa suy luận và thông lượng.",
"llama-3.3-instruct.description": "Mô hình Llama 3.3 được tinh chỉnh theo hướng dẫn, tối ưu cho trò chuyện và vượt trội hơn nhiều mô hình trò chuyện mã nguồn mở trong các tiêu chuẩn ngành.",
"llama3-70b-8192.description": "Meta Llama 3 70B cung cấp khả năng xử lý độ phức tạp vượt trội cho các dự án đòi hỏi cao.",
"llama3-8b-8192.description": "Meta Llama 3 8B mang lại hiệu suất suy luận mạnh mẽ cho nhiều tình huống khác nhau.",
@@ -832,7 +838,6 @@
"meta-llama/llama-3.1-8b-instruct:free.description": "LLaMA 3.1 hỗ trợ đa ngôn ngữ và là một trong những mô hình sinh ngôn ngữ hàng đầu.",
"meta-llama/llama-3.2-11b-vision-instruct.description": "LLaMA 3.2 được thiết kế cho các tác vụ kết hợp giữa hình ảnh và văn bản. Mô hình vượt trội trong việc tạo chú thích hình ảnh và hỏi đáp trực quan, kết nối giữa sinh ngôn ngữ và suy luận thị giác.",
"meta-llama/llama-3.2-3b-instruct.description": "meta-llama/llama-3.2-3b-instruct",
"meta-llama/llama-3.2-90b-vision-instruct.description": "LLaMA 3.2 được thiết kế cho các tác vụ kết hợp giữa hình ảnh và văn bản. Mô hình vượt trội trong việc tạo chú thích hình ảnh và hỏi đáp trực quan, kết nối giữa sinh ngôn ngữ và suy luận thị giác.",
"meta-llama/llama-3.3-70b-instruct.description": "Llama 3.3 là mô hình Llama mã nguồn mở đa ngữ tiên tiến nhất, mang lại hiệu suất gần tương đương 405B với chi phí rất thấp. Mô hình dựa trên Transformer và được cải tiến bằng SFT và RLHF để tăng tính hữu ích và an toàn. Phiên bản tinh chỉnh theo hướng dẫn được tối ưu cho trò chuyện đa ngữ và vượt trội hơn nhiều mô hình trò chuyện mở và đóng trên các tiêu chuẩn đánh giá trong ngành. Mốc kiến thức: Tháng 12 năm 2023.",
"meta-llama/llama-3.3-70b-instruct:free.description": "Llama 3.3 là mô hình Llama mã nguồn mở đa ngữ tiên tiến nhất, mang lại hiệu suất gần tương đương 405B với chi phí rất thấp. Mô hình dựa trên Transformer và được cải tiến bằng SFT và RLHF để tăng tính hữu ích và an toàn. Phiên bản tinh chỉnh theo hướng dẫn được tối ưu cho trò chuyện đa ngữ và vượt trội hơn nhiều mô hình trò chuyện mở và đóng trên các tiêu chuẩn đánh giá trong ngành. Mốc kiến thức: Tháng 12 năm 2023.",
"meta.llama3-1-405b-instruct-v1:0.description": "Meta Llama 3.1 405B Instruct là mô hình Llama 3.1 Instruct lớn nhất và mạnh mẽ nhất, rất tiên tiến cho suy luận đối thoại và tạo dữ liệu tổng hợp, đồng thời là nền tảng vững chắc cho huấn luyện tiếp theo hoặc tinh chỉnh theo miền cụ thể. Các mô hình LLM đa ngữ Llama 3.1 bao gồm các mô hình sinh văn bản được huấn luyện trước và tinh chỉnh theo hướng dẫn với kích thước 8B, 70B và 405B (văn bản vào/ra). Các mô hình tinh chỉnh theo hướng dẫn được tối ưu cho đối thoại đa ngữ và vượt trội hơn nhiều mô hình trò chuyện mở hiện có trên các tiêu chuẩn đánh giá phổ biến. Llama 3.1 được thiết kế cho mục đích thương mại và nghiên cứu trên nhiều ngôn ngữ. Các mô hình tinh chỉnh theo hướng dẫn phù hợp với trò chuyện kiểu trợ lý, trong khi các mô hình huấn luyện trước phù hợp với các tác vụ sinh ngôn ngữ rộng hơn. Đầu ra của Llama 3.1 cũng có thể được sử dụng để cải thiện các mô hình khác, bao gồm tạo và tinh chỉnh dữ liệu tổng hợp. Llama 3.1 là mô hình Transformer tự hồi tiếp với kiến trúc được tối ưu hóa. Các phiên bản tinh chỉnh sử dụng huấn luyện có giám sát (SFT) và học tăng cường từ phản hồi con người (RLHF) để phù hợp với sở thích của con người về tính hữu ích và an toàn.",
@@ -894,7 +899,7 @@
"mistral-large-instruct.description": "Mistral-Large-Instruct-2407 là mô hình LLM dày đặc tiên tiến với 123 tỷ tham số, nổi bật về suy luận, kiến thức và lập trình.",
"mistral-large-latest.description": "Mistral Large là mô hình hàng đầu, mạnh mẽ trong các tác vụ đa ngôn ngữ, suy luận phức tạp và tạo mã—lý tưởng cho các ứng dụng cao cấp.",
"mistral-large.description": "Mixtral Large là mô hình hàng đầu của Mistral, kết hợp tạo mã, toán học và suy luận với cửa sổ ngữ cảnh 128K.",
"mistral-medium-latest.description": "Mistral Medium 3 mang lại hiệu suất hàng đầu với chi phí thấp hơn 8 lần và đơn giản hóa triển khai doanh nghiệp.",
"mistral-medium-latest.description": "Mistral Medium 3.1 mang lại hiệu suất tiên tiến với chi phí thấp hơn 8 lần và đơn giản hóa triển khai doanh nghiệp.",
"mistral-nemo-instruct.description": "Mistral-Nemo-Instruct-2407 là phiên bản tinh chỉnh theo hướng dẫn của Mistral-Nemo-Base-2407.",
"mistral-nemo.description": "Mistral Nemo là mô hình 12B hiệu quả cao từ Mistral AI và NVIDIA.",
"mistral-small-latest.description": "Mistral Small là lựa chọn tiết kiệm, nhanh và đáng tin cậy cho dịch thuật, tóm tắt và phân tích cảm xúc.",
@@ -933,7 +938,7 @@
"moonshot-v1-auto.description": "Moonshot V1 Auto tự động chọn mô hình phù hợp dựa trên mức sử dụng token ngữ cảnh hiện tại.",
"moonshotai/Kimi-Dev-72B.description": "Kimi-Dev-72B là mô hình mã nguồn mở được tối ưu hóa bằng học tăng cường quy mô lớn để tạo ra các bản vá ổn định, sẵn sàng cho sản xuất. Mô hình đạt 60,4% trên SWE-bench Verified, lập kỷ lục mới cho các tác vụ kỹ thuật phần mềm tự động như sửa lỗi và đánh giá mã.",
"moonshotai/Kimi-K2-Instruct-0905.description": "Kimi K2-Instruct-0905 là phiên bản Kimi K2 mới nhất và mạnh mẽ nhất. Đây là mô hình MoE hàng đầu với tổng 1T và 32B tham số hoạt động. Các điểm nổi bật bao gồm trí tuệ lập trình tác tử mạnh hơn với cải thiện đáng kể trên các bài kiểm tra và tác vụ thực tế, cùng với mã giao diện người dùng đẹp hơn và dễ sử dụng hơn.",
"moonshotai/Kimi-K2-Thinking.description": "Kimi K2 Thinking là mô hình tư duy mã nguồn mở mới nhất và mạnh mẽ nhất. Nó mở rộng đáng kể độ sâu suy luận nhiều bước và duy trì việc sử dụng công cụ ổn định qua 200300 lượt gọi liên tiếp, lập kỷ lục mới trên Humanity's Last Exam (HLE), BrowseComp và các bài kiểm tra khác. Mô hình vượt trội trong lập trình, toán học, logic và các kịch bản tác tử. Được xây dựng trên kiến trúc MoE với khoảng 1T tham số, hỗ trợ cửa sổ ngữ cảnh 256K và gọi công cụ.",
"moonshotai/Kimi-K2-Thinking.description": "Kimi K2 Thinking là mô hình suy nghĩ mã nguồn mở mới nhất và mạnh mẽ nhất. Nó mở rộng đáng kể độ sâu suy luận nhiều bước và duy trì sử dụng công cụ ổn định qua 200300 lần gọi liên tiếp, thiết lập kỷ lục mới trên Humanity's Last Exam (HLE), BrowseComp và các tiêu chuẩn khác. Nó xuất sắc trong mã hóa, toán học, logic và các kịch bản Agent. Được xây dựng trên kiến trúc MoE với ~1 nghìn tỷ tham số tổng cộng, nó hỗ trợ cửa sổ ngữ cảnh 256K và gọi công cụ.",
"moonshotai/kimi-k2-0711.description": "Kimi K2 0711 là biến thể instruct trong dòng Kimi, phù hợp cho mã chất lượng cao và sử dụng công cụ.",
"moonshotai/kimi-k2-0905.description": "Kimi K2 0905 là bản cập nhật mở rộng hiệu suất ngữ cảnh và suy luận với các tối ưu hóa lập trình.",
"moonshotai/kimi-k2-instruct-0905.description": "Mô hình kimi-k2-0905-preview hỗ trợ cửa sổ ngữ cảnh 256k, với khả năng lập trình tác tử mạnh hơn, mã giao diện người dùng mượt mà và thực tế hơn, cùng khả năng hiểu ngữ cảnh tốt hơn.",
@@ -948,8 +953,8 @@
"nvidia/Llama-3.1-Nemotron-70B-Instruct-HF.description": "Llama 3.1 Nemotron 70B là mô hình LLM tùy chỉnh của NVIDIA nhằm cải thiện tính hữu ích. Nó đạt hiệu suất cao trên Arena Hard, AlpacaEval 2 LC và GPT-4-Turbo MT-Bench, xếp hạng #1 trên cả ba bài kiểm tra tự động căn chỉnh tính đến ngày 1 tháng 10 năm 2024. Mô hình được huấn luyện từ Llama-3.1-70B-Instruct bằng RLHF (REINFORCE), Llama-3.1-Nemotron-70B-Reward và các prompt HelpSteer2-Preference.",
"nvidia/llama-3.1-nemotron-51b-instruct.description": "Mô hình ngôn ngữ đặc biệt với độ chính xác và hiệu quả vượt trội.",
"nvidia/llama-3.1-nemotron-70b-instruct.description": "Llama-3.1-Nemotron-70B-Instruct là mô hình tùy chỉnh của NVIDIA được thiết kế để cải thiện tính hữu ích của phản hồi LLM.",
"o1-mini.description": "Nhỏ hơn và nhanh hơn o1-preview, chi phí thấp hơn 80%, mạnh về tạo mã và các tác vụ ngữ cảnh ngắn.",
"o1-preview.description": "Tập trung vào suy luận nâng cao và giải quyết vấn đề phức tạp, bao gồm toán học và khoa học. Lý tưởng cho các ứng dụng cần hiểu ngữ cảnh sâu và quy trình tự động.",
"o1-mini.description": "o1-mini là mô hình suy luận nhanh, hiệu quả về chi phí, được thiết kế cho mã hóa, toán học và khoa học. Nó có ngữ cảnh 128K và cắt đứt kiến thức vào tháng 10 năm 2023.",
"o1-preview.description": "o1 là mô hình suy luận mới của OpenAI dành cho các nhiệm vụ phức tạp yêu cầu kiến thức rộng. Nó có ngữ cảnh 128K và cắt đứt kiến thức vào tháng 10 năm 2023.",
"o1-pro.description": "Dòng o1 được huấn luyện bằng học tăng cường để suy nghĩ trước khi trả lời và xử lý suy luận phức tạp. o1-pro sử dụng nhiều tài nguyên tính toán hơn để suy nghĩ sâu hơn và cung cấp câu trả lời chất lượng cao hơn một cách nhất quán.",
"o1.description": "o1 là mô hình suy luận mới của OpenAI với đầu vào văn bản + hình ảnh và đầu ra văn bản, phù hợp cho các tác vụ phức tạp đòi hỏi kiến thức rộng. Nó có cửa sổ ngữ cảnh 200K và mốc kiến thức đến tháng 10 năm 2023.",
"o3-2025-04-16.description": "o3 là mô hình suy luận mới của OpenAI với đầu vào văn bản+hình ảnh và đầu ra văn bản cho các tác vụ phức tạp đòi hỏi kiến thức rộng.",
@@ -1022,7 +1027,6 @@
"qianfan-check-vl.description": "Qianfan Check VL là mô hình kiểm duyệt nội dung đa phương thức cho các nhiệm vụ tuân thủ và nhận diện hình ảnh-văn bản.",
"qianfan-composition.description": "Qianfan Composition là mô hình sáng tạo đa phương thức cho việc hiểu và tạo nội dung hình ảnh-văn bản kết hợp.",
"qianfan-engcard-vl.description": "Qianfan EngCard VL là mô hình nhận diện đa phương thức tập trung vào các tình huống tiếng Anh.",
"qianfan-lightning-128b-a19b.description": "Qianfan Lightning 128B A19B là mô hình tổng quát tiếng Trung hiệu suất cao dành cho hỏi đáp phức tạp và lý luận quy mô lớn.",
"qianfan-llama-vl-8b.description": "Qianfan Llama VL 8B là mô hình đa phương thức dựa trên Llama dành cho việc hiểu hình ảnh-văn bản tổng quát.",
"qianfan-multipicocr.description": "Qianfan MultiPicOCR là mô hình OCR đa hình ảnh dành cho việc phát hiện và nhận diện văn bản trên nhiều hình ảnh.",
"qianfan-qi-vl.description": "Qianfan QI VL là mô hình hỏi đáp đa phương thức dành cho việc truy xuất và hỏi đáp chính xác trong các tình huống hình ảnh-văn bản phức tạp.",
@@ -1032,7 +1036,6 @@
"qvq-72b-preview.description": "QVQ-72B-Preview là mô hình nghiên cứu thử nghiệm từ Qwen tập trung vào cải thiện lý luận hình ảnh.",
"qvq-max.description": "Mô hình lý luận hình ảnh Qwen QVQ hỗ trợ đầu vào hình ảnh và đầu ra chuỗi suy nghĩ, với hiệu suất mạnh mẽ hơn trong toán học, lập trình, phân tích hình ảnh, sáng tạo và các nhiệm vụ tổng quát.",
"qvq-plus.description": "Mô hình lý luận hình ảnh với đầu vào hình ảnh và đầu ra chuỗi suy nghĩ. Dòng qvq-plus theo sau qvq-max và cung cấp lý luận nhanh hơn với sự cân bằng tốt hơn giữa chất lượng và chi phí.",
"qwen-3-32b.description": "Qwen 3 32B: mạnh mẽ trong các nhiệm vụ đa ngôn ngữ và lập trình, phù hợp cho sử dụng sản xuất quy mô trung bình.",
"qwen-coder-plus.description": "Mô hình mã Qwen.",
"qwen-coder-turbo-latest.description": "Mô hình mã Qwen.",
"qwen-coder-turbo.description": "Mô hình mã Qwen.",
@@ -1128,7 +1131,6 @@
"qwen3-coder-next.description": "Mã hóa Qwen thế hệ tiếp theo được tối ưu hóa cho việc tạo mã phức tạp nhiều tệp, gỡ lỗi và quy trình làm việc tác nhân thông lượng cao. Được thiết kế để tích hợp công cụ mạnh mẽ và cải thiện hiệu suất suy luận.",
"qwen3-coder-plus.description": "Mô hình mã Qwen. Dòng Qwen3-Coder mới nhất dựa trên Qwen3 và mang lại khả năng tác nhân lập trình mạnh mẽ, sử dụng công cụ và tương tác môi trường cho lập trình tự động, với hiệu suất mã xuất sắc và khả năng tổng quát vững chắc.",
"qwen3-coder:480b.description": "Mô hình hiệu suất cao của Alibaba dành cho các nhiệm vụ tác nhân và lập trình với ngữ cảnh dài.",
"qwen3-max-2026-01-23.description": "Các mô hình Qwen3 Max mang lại những cải tiến lớn so với dòng 2.5 về khả năng tổng quát, hiểu biết tiếng Trung/tiếng Anh, tuân thủ hướng dẫn phức tạp, nhiệm vụ mở chủ quan, khả năng đa ngôn ngữ và sử dụng công cụ, với ít ảo giác hơn. Phiên bản qwen3-max mới nhất cải thiện lập trình tác nhân và sử dụng công cụ so với qwen3-max-preview. Phiên bản này đạt SOTA trong lĩnh vực và nhắm đến các nhu cầu tác nhân phức tạp hơn.",
"qwen3-max-preview.description": "Mô hình Qwen hiệu suất cao nhất cho các nhiệm vụ phức tạp, nhiều bước. Phiên bản xem trước hỗ trợ khả năng tư duy.",
"qwen3-max.description": "Các mô hình Qwen3 Max mang lại cải tiến lớn so với dòng 2.5 về năng lực tổng thể, hiểu tiếng Trung/Anh, tuân thủ hướng dẫn phức tạp, xử lý nhiệm vụ mở mang tính chủ quan, khả năng đa ngôn ngữ và sử dụng công cụ, với ít ảo giác hơn. Phiên bản qwen3-max mới nhất cải thiện lập trình tác tử và sử dụng công cụ so với qwen3-max-preview. Bản phát hành này đạt chuẩn SOTA thực tế và nhắm đến các nhu cầu tác tử phức tạp hơn.",
"qwen3-next-80b-a3b-instruct.description": "Mô hình mã nguồn mở Qwen3 thế hệ tiếp theo không hỗ trợ tư duy. So với phiên bản trước (Qwen3-235B-A22B-Instruct-2507), nó có khả năng hiểu tiếng Trung tốt hơn, lý luận logic mạnh hơn và cải thiện khả năng sinh văn bản.",
@@ -1145,7 +1147,8 @@
"qwen3-vl-flash.description": "Qwen3 VL Flash: phiên bản lập luận nhẹ, tốc độ cao cho các yêu cầu nhạy cảm với độ trễ hoặc khối lượng lớn.",
"qwen3-vl-plus.description": "Qwen VL là mô hình sinh văn bản với khả năng hiểu hình ảnh. Nó có thể thực hiện OCR, tóm tắt và lập luận, chẳng hạn như trích xuất thuộc tính từ ảnh sản phẩm hoặc giải quyết vấn đề từ hình ảnh.",
"qwen3.5-397b-a17b.description": "Hỗ trợ đầu vào văn bản, hình ảnh và video. Đối với các nhiệm vụ chỉ văn bản, hiệu suất của nó tương đương với Qwen3 Max, mang lại hiệu quả cao hơn và chi phí thấp hơn. Trong khả năng đa phương thức, nó mang lại cải tiến đáng kể so với dòng Qwen3 VL.",
"qwen3.5-plus.description": "Qwen3.5 Plus hỗ trợ đầu vào văn bản, hình ảnh và video. Đối với các nhiệm vụ chỉ văn bản, hiệu suất của nó tương đương với Qwen3 Max, trong khi mang lại hiệu quả cao hơn và chi phí thấp hơn. Về khả năng đa phương thức, nó cho thấy cải tiến đáng kể so với dòng Qwen3 VL.",
"qwen3.5-plus.description": "Qwen3.5 Plus hỗ trợ đầu vào văn bản, hình ảnh và video. Hiệu suất của nó trên các nhiệm vụ văn bản thuần tương đương với Qwen3 Max, với hiệu suất tốt hơn và chi phí thấp hơn. Khả năng đa phương thức của nó được cải thiện đáng kể so với dòng Qwen3 VL.",
"qwen3.5:397b.description": "Qwen3.5 là mô hình nền tảng kết hợp thị giác-ngôn ngữ với kiến trúc lai (Mixture-of-Experts + linear attention), mang lại khả năng suy luận đa phương thức mạnh mẽ, mã hóa và khả năng ngữ cảnh dài với cửa sổ ngữ cảnh 256K.",
"qwen3.description": "Qwen3 là mô hình ngôn ngữ lớn thế hệ tiếp theo của Alibaba với hiệu suất mạnh mẽ trên nhiều trường hợp sử dụng khác nhau.",
"qwq-32b-preview.description": "QwQ là mô hình nghiên cứu thử nghiệm từ Qwen tập trung vào cải thiện khả năng lập luận.",
"qwq-32b.description": "QwQ là mô hình lập luận trong họ Qwen. So với các mô hình điều chỉnh theo hướng dẫn tiêu chuẩn, nó mang lại khả năng tư duy và lập luận giúp cải thiện đáng kể hiệu suất các tác vụ phía sau, đặc biệt là các vấn đề phức tạp. QwQ-32B là mô hình lập luận tầm trung có thể cạnh tranh với các mô hình hàng đầu như DeepSeek-R1 và o1-mini.",
@@ -1187,7 +1190,7 @@
"step-2-16k.description": "Hỗ trợ tương tác ngữ cảnh lớn cho các cuộc hội thoại phức tạp.",
"step-2-mini.description": "Được xây dựng trên kiến trúc MFA thế hệ tiếp theo trong nhà, cung cấp kết quả tương tự như Step-1 với chi phí thấp hơn nhiều trong khi đạt được thông lượng cao hơn và độ trễ nhanh hơn. Xử lý các nhiệm vụ tổng quát với khả năng lập trình mạnh mẽ.",
"step-2x-large.description": "Mô hình hình ảnh StepFun thế hệ mới tập trung vào tạo hình ảnh, tạo ra hình ảnh chất lượng cao từ các gợi ý văn bản. Nó mang lại kết cấu thực tế hơn và khả năng hiển thị văn bản tiếng Trung/tiếng Anh mạnh mẽ hơn.",
"step-3.5-flash.description": "Mô hình suy luận ngôn ngữ hàng đầu từ Stepfun. Mô hình này mang lại khả năng suy luận hàng đầu cùng với thực thi nhanh đáng tin cậy. Nó có thể phân tích và lập kế hoạch các nhiệm vụ phức tạp, nhanh chóng và đáng tin cậy gọi công cụ để thực hiện chúng, và xuất sắc trong suy luận logic, toán học, kỹ thuật phần mềm, nghiên cứu sâu và các nhiệm vụ tinh vi khác. Độ dài ngữ cảnh là 256K.",
"step-3.5-flash.description": "Mô hình suy luận ngôn ngữ hàng đầu của Stepfun. Mô hình này khả năng suy luận xuất sắc và khả năng thực thi nhanh chóng, đáng tin cậy. Có thể phân tích và lập kế hoạch các nhiệm vụ phức tạp, gọi công cụ nhanh chóng và đáng tin cậy để thực hiện nhiệm vụ, và đủ khả năng cho các nhiệm vụ phức tạp như suy luận logic, toán học, kỹ thuật phần mềm nghiên cứu chuyên sâu.",
"step-3.description": "Mô hình này có khả năng nhận thức thị giác mạnh mẽ và lý luận phức tạp, xử lý chính xác việc hiểu biết kiến thức đa lĩnh vực, phân tích chéo toán học-thị giác và một loạt các nhiệm vụ phân tích thị giác hàng ngày.",
"step-r1-v-mini.description": "Mô hình lý luận với khả năng hiểu hình ảnh mạnh mẽ có thể xử lý hình ảnh và văn bản, sau đó tạo văn bản sau khi lý luận sâu. Nó xuất sắc trong lý luận thị giác và mang lại khả năng toán học, lập trình và lý luận văn bản hàng đầu, với cửa sổ ngữ cảnh 100K.",
"stepfun-ai/step3.description": "Step3 là mô hình lý luận đa phương thức tiên tiến từ StepFun, được xây dựng trên kiến trúc MoE với tổng số 321B và 38B tham số hoạt động. Thiết kế đầu-cuối của nó giảm thiểu chi phí giải mã trong khi mang lại lý luận ngôn ngữ-thị giác hàng đầu. Với thiết kế MFA và AFD, nó vẫn hiệu quả trên cả các bộ tăng tốc hàng đầu và cấp thấp. Tiền huấn luyện sử dụng hơn 20T token văn bản và 4T token hình ảnh-văn bản trên nhiều ngôn ngữ. Nó đạt hiệu suất hàng đầu trong các mô hình mở trên các tiêu chuẩn toán học, mã và đa phương thức.",
@@ -1276,10 +1279,11 @@
"z-ai/glm4.7.description": "GLM-4.7 là mô hình hàng đầu mới nhất của Zhipu, được tăng cường cho các tình huống mã hóa Agentic với khả năng mã hóa được cải thiện.",
"z-ai/glm5.description": "GLM-5 là mô hình nền tảng hàng đầu mới của Zhipu AI dành cho kỹ thuật tác nhân, đạt hiệu suất SOTA mã nguồn mở trong khả năng mã hóa và tác nhân. Nó tương đương với Claude Opus 4.5 về hiệu suất.",
"z-image-turbo.description": "Z-Image là mô hình tạo hình ảnh từ văn bản nhẹ có thể nhanh chóng tạo ra hình ảnh, hỗ trợ cả hiển thị văn bản tiếng Trung và tiếng Anh, và linh hoạt thích ứng với nhiều độ phân giải và tỷ lệ khung hình.",
"zai-glm-4.7.description": "Mô hình này mang lại hiệu suất mã hóa mạnh mẽ với khả năng suy luận tiên tiến, sử dụng công cụ vượt trội và hiệu suất thực tế được cải thiện trong các ứng dụng mã hóa Agent.",
"zai-org/GLM-4.5-Air.description": "GLM-4.5-Air là mô hình cơ bản dành cho các ứng dụng tác nhân sử dụng kiến trúc Mixture-of-Experts. Nó được tối ưu hóa cho sử dụng công cụ, duyệt web, kỹ thuật phần mềm và lập trình giao diện, và tích hợp với các tác nhân mã như Claude Code và Roo Code. Nó sử dụng lý luận lai để xử lý cả lý luận phức tạp và các kịch bản hàng ngày.",
"zai-org/GLM-4.5.description": "GLM-4.5 là mô hình cơ bản được xây dựng cho các ứng dụng tác nhân sử dụng kiến trúc Mixture-of-Experts. Nó được tối ưu hóa sâu cho sử dụng công cụ, duyệt web, kỹ thuật phần mềm và lập trình giao diện, và tích hợp với các tác nhân mã như Claude Code và Roo Code. Nó sử dụng lý luận lai để xử lý cả lý luận phức tạp và các kịch bản hàng ngày.",
"zai-org/GLM-4.5V.description": "GLM-4.5V là mô hình VLM mới nhất của Zhipu AI, được xây dựng trên mô hình văn bản hàng đầu GLM-4.5-Air (106B tổng, 12B hoạt động) với kiến trúc MoE để mang lại hiệu suất mạnh mẽ với chi phí thấp hơn. Nó theo con đường GLM-4.1V-Thinking và thêm 3D-RoPE để cải thiện lý luận không gian 3D. Được tối ưu hóa thông qua tiền huấn luyện, SFT và RL, nó xử lý hình ảnh, video và tài liệu dài và xếp hạng hàng đầu trong các mô hình mở trên 41 tiêu chuẩn đa phương thức công khai. Chế độ Thinking cho phép người dùng cân bằng giữa tốc độ và độ sâu.",
"zai-org/GLM-4.6.description": "So với GLM-4.5, GLM-4.6 mở rộng ngữ cảnh từ 128K lên 200K cho các nhiệm vụ tác nhân phức tạp hơn. Nó đạt điểm cao hơn trên các tiêu chuẩn mã và cho thấy hiệu suất thực tế mạnh mẽ hơn trong các ứng dụng như Claude Code, Cline, Roo Code và Kilo Code, bao gồm cả việc tạo trang giao diện tốt hơn. Lý luận được cải thiện và sử dụng công cụ được hỗ trợ trong quá trình lý luận, tăng cường khả năng tổng thể. Nó tích hợp tốt hơn vào các khung tác nhân, cải thiện các tác nhân công cụ/tìm kiếm và có phong cách viết được người dùng ưa thích hơn và tự nhiên hơn trong vai trò chơi.",
"zai-org/GLM-4.6V.description": "GLM-4.6V đạt độ chính xác hiểu thị giác ở mức SOTA với cùng quy mô tham số, và lần đầu tiên tích hợp khả năng Function Call (gọi công cụ) một cách nguyên bản vào mô hình thị giác, kết nối từ 'nhận thức thị giác' đến 'hành động có thể thực thi (Action)', cung cấp nền tảng công nghệ thống nhất cho các Agent đa phương thức trong các kịch bản kinh doanh thực tế.",
"zai/glm-4.5-air.description": "GLM-4.5 và GLM-4.5-Air là các mô hình hàng đầu mới nhất của chúng tôi dành cho các ứng dụng tác nhân, cả hai đều sử dụng MoE. GLM-4.5 có tổng số 355B và 32B tham số hoạt động mỗi lần chuyển tiếp; GLM-4.5-Air mỏng hơn với tổng số 106B và 12B tham số hoạt động.",
"zai/glm-4.5.description": "Dòng GLM-4.5 được thiết kế cho các tác nhân. GLM-4.5 hàng đầu kết hợp lý luận, lập trình và kỹ năng tác nhân với tổng số 355B tham số (32B hoạt động) và cung cấp các chế độ hoạt động kép như một hệ thống lý luận lai.",
"zai/glm-4.5v.description": "GLM-4.5V được xây dựng trên GLM-4.5-Air, kế thừa các kỹ thuật GLM-4.1V-Thinking đã được chứng minh và mở rộng với kiến trúc MoE mạnh mẽ 106B tham số.",
+14
View File
@@ -24,6 +24,20 @@
"builtins.lobe-agent-builder.inspector.noResults": "Không có kết quả",
"builtins.lobe-agent-builder.inspector.togglePlugin": "Chuyển đổi",
"builtins.lobe-agent-builder.title": "Chuyên gia Xây dựng Tác nhân",
"builtins.lobe-agent-management.apiName.callAgent": "Gọi đại lý",
"builtins.lobe-agent-management.apiName.createAgent": "Tạo đại lý",
"builtins.lobe-agent-management.apiName.deleteAgent": "Xóa đại lý",
"builtins.lobe-agent-management.apiName.searchAgent": "Tìm kiếm đại lý",
"builtins.lobe-agent-management.apiName.updateAgent": "Cập nhật đại lý",
"builtins.lobe-agent-management.inspector.callAgent.sync": "Đang gọi:",
"builtins.lobe-agent-management.inspector.callAgent.task": "Giao nhiệm vụ cho:",
"builtins.lobe-agent-management.inspector.createAgent.title": "Đang tạo đại lý:",
"builtins.lobe-agent-management.inspector.searchAgent.all": "Tìm kiếm đại lý:",
"builtins.lobe-agent-management.inspector.searchAgent.market": "Tìm kiếm thị trường:",
"builtins.lobe-agent-management.inspector.searchAgent.results": "{{count}} kết quả",
"builtins.lobe-agent-management.inspector.searchAgent.user": "Tìm kiếm đại lý của tôi:",
"builtins.lobe-agent-management.inspector.updateAgent.title": "Đang cập nhật đại lý:",
"builtins.lobe-agent-management.title": "Quản lý Đại lý",
"builtins.lobe-cloud-sandbox.apiName.editLocalFile": "Chỉnh sửa tệp",
"builtins.lobe-cloud-sandbox.apiName.executeCode": "Thực thi mã",
"builtins.lobe-cloud-sandbox.apiName.exportFile": "Xuất tệp",
+3
View File
@@ -724,6 +724,9 @@
"tools.builtins.lobe-artifacts.description": "Tạo và xem trước trực tiếp các thành phần giao diện tương tác, biểu đồ dữ liệu, đồ họa SVG và ứng dụng web. Tạo nội dung trực quan phong phú mà người dùng có thể tương tác trực tiếp.",
"tools.builtins.lobe-artifacts.readme": "Tạo và xem trước trực tiếp các thành phần giao diện người dùng tương tác, biểu đồ dữ liệu, đồ họa SVG và ứng dụng web. Tạo nội dung trực quan phong phú mà người dùng có thể tương tác trực tiếp.",
"tools.builtins.lobe-artifacts.title": "Tạo tác",
"tools.builtins.lobe-calculator.description": "Thực hiện các phép tính toán học, giải phương trình và làm việc với các biểu thức ký hiệu",
"tools.builtins.lobe-calculator.readme": "Máy tính toán học nâng cao hỗ trợ số học cơ bản, phương trình đại số, các phép tính giải tích và toán học ký hiệu. Bao gồm chuyển đổi cơ số, giải phương trình, đạo hàm, tích phân và nhiều hơn nữa.",
"tools.builtins.lobe-calculator.title": "Máy tính",
"tools.builtins.lobe-cloud-sandbox.description": "Thực thi mã Python, JavaScript và TypeScript trong môi trường đám mây cách ly. Chạy lệnh shell, quản lý tệp, tìm kiếm nội dung bằng regex và xuất kết quả một cách an toàn.",
"tools.builtins.lobe-cloud-sandbox.readme": "Thực thi mã Python, JavaScript và TypeScript trong môi trường đám mây cách ly. Chạy lệnh shell, quản lý tệp, tìm kiếm nội dung bằng regex và xuất kết quả một cách an toàn.",
"tools.builtins.lobe-cloud-sandbox.title": "Hộp cát đám mây",
+5 -4
View File
@@ -232,10 +232,10 @@
"providerModels.item.modelConfig.extendParams.options.textVerbosity.hint": "适用于 GPT-5+ 系列;控制输出内容的详尽程度。",
"providerModels.item.modelConfig.extendParams.options.thinking.hint": "适用于部分豆包模型;允许模型自行决定是否进行深度思考。",
"providerModels.item.modelConfig.extendParams.options.thinkingBudget.hint": "适用于 Gemini 系列;控制思考预算。",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel.hint": "适用于 Gemini 3 Flash 预览模型;控制思考深度。",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel2.hint": "适用于 Gemini 3 Pro 预览模型;控制思考深度。",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel3.hint": "适用于 Gemini 3.1 Pro 预览模型;通过低/中/高等级控制思深度。",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel4.hint": "适用于 Gemini 3.1 Flash Image 模型;开关思考能力。",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel.hint": "适用于 Gemini 3 Flash Preview 模型;控制思考深度。",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel2.hint": "适用于 Gemini 3 Pro Preview 模型;控制思考深度。",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel3.hint": "适用于 Gemini 3.1 Pro Preview 模型;通过低/中/高等级控制思深度。",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel4.hint": "适用于 Gemini 3.1 Flash Image 模型;切换思考开/关。",
"providerModels.item.modelConfig.extendParams.options.urlContext.hint": "适用于 Gemini 系列;支持提供 URL 上下文。",
"providerModels.item.modelConfig.extendParams.placeholder": "选择要启用的扩展参数",
"providerModels.item.modelConfig.extendParams.previewFallback": "无法预览",
@@ -314,6 +314,7 @@
"providerModels.tabs.image": "图片",
"providerModels.tabs.stt": "ASR",
"providerModels.tabs.tts": "TTS",
"providerModels.tabs.video": "视频",
"sortModal.success": "排序更新成功",
"sortModal.title": "自定义排序",
"sortModal.update": "更新",
+34 -30
View File
@@ -55,7 +55,8 @@
"FLUX.1-dev.description": "FLUX.1-dev 是 Black Forest Labs 推出的开源多模态语言模型(MLLM),优化用于图文任务,融合图像/文本理解与生成能力。基于先进的大语言模型(如 Mistral-7B),采用精心设计的视觉编码器和多阶段指令微调,实现多模态协同与复杂任务推理。",
"Gryphe/MythoMax-L2-13b.description": "MythoMax-L213B)是一款面向多领域和复杂任务的创新模型。",
"HelloMeme.description": "HelloMeme 是一款 AI 工具,可根据用户提供的图像或动作生成表情包、GIF 或短视频。无需绘画或编程技能,仅需参考图像即可生成有趣、吸引人且风格统一的内容。",
"HiDream-I1-Full.description": "HiDream-E1-Full 是来自 HiDream.ai 的开源多模态图像编辑模型,基于先进的 Diffusion Transformer 架构和强大的语言理解能力(内置 LLaMA 3.1-8B-Instruct)。支持自然语言驱动的图像生成、风格迁移、局部编辑和重绘,具备出色的图文理解执行能力。",
"HiDream-E1-Full.description": "HiDream-E1-Full 是 HiDream.ai 推出的开源多模态图像编辑模型,基于先进的扩散变压器架构和强大的语言理解能力(内置 LLaMA 3.1-8B-Instruct)。支持自然语言驱动的图像生成、风格迁移、局部编辑和重绘,具备卓越的图像-文本理解执行能力。",
"HiDream-I1-Full.description": "HiDream-I1 是 HiDream 发布的新一代开源基础图像生成模型,拥有 170 亿参数(Flux 为 120 亿),能够在数秒内提供行业领先的图像质量。",
"HunyuanDiT-v1.2-Diffusers-Distilled.description": "hunyuandit-v1.2-distilled 是一款轻量级文本生成图像模型,通过蒸馏优化以快速生成高质量图像,特别适合低资源环境和实时生成场景。",
"InstantCharacter.description": "InstantCharacter 是腾讯 AI 于 2025 年发布的免调优个性化角色生成模型,致力于高保真、跨场景一致的角色生成。可通过单张参考图像建模角色,并灵活迁移至不同风格、动作和背景。",
"InternVL2-8B.description": "InternVL2-8B 是一款强大的视觉语言模型,支持多模态图文处理,能够准确识别图像内容并生成相关描述或答案。",
@@ -80,7 +81,7 @@
"MiniMax-M2.1.description": "MiniMax-M2.1 是 MiniMax 推出的旗舰开源大模型,专注于解决复杂的现实世界任务。其核心优势在于多语言编程能力以及作为智能体解决复杂任务的能力。",
"MiniMax-M2.5-Lightning.description": "M2.5 Lightning:相同性能,更快更灵活(约 100 tps)。",
"MiniMax-M2.5-highspeed.description": "与 M2.5 性能相同,但推理速度显著提升。",
"MiniMax-M2.5.description": "顶级性能与极致性价比,轻松应对复杂任务(约 60 tps)。",
"MiniMax-M2.5.description": "MiniMax-M2.5 是 MiniMax 推出的旗舰开源大模型,专注于解决复杂的现实世界任务。其核心优势在于多语言编程能力以及作为 Agent 解决复杂任务的能力。",
"MiniMax-M2.description": "专为高效编程与智能体工作流打造",
"MiniMax-Text-01.description": "MiniMax-01 引入超越传统 Transformer 的大规模线性注意力机制,拥有 4560 亿参数,每次激活 459 亿,支持最长 400 万上下文(为 GPT-4o 的 32 倍,Claude-3.5-Sonnet 的 20 倍),性能顶尖。",
"MiniMaxAI/MiniMax-M1-80k.description": "MiniMax-M1 是一款开源权重的大规模混合注意力推理模型,总参数 4560 亿,每个 token 激活约 459 亿。原生支持 100 万上下文,使用 Flash Attention,在生成 10 万 token 时比 DeepSeek R1 减少 75% FLOPs。采用 MoE 架构,结合 CISPO 和混合注意力 RL 训练,在长输入推理和真实软件工程任务中表现领先。",
@@ -98,6 +99,7 @@
"Phi-3.5-mini-instruct.description": "Phi-3-mini 模型的更新版本。",
"Phi-3.5-vision-instrust.description": "Phi-3-vision 模型的更新版本。",
"Pro/MiniMaxAI/MiniMax-M2.1.description": "MiniMax-M2.1 是一个开源的大型语言模型,专为智能体能力优化,擅长编程、工具使用、指令执行和长期规划。该模型支持多语言软件开发和复杂的多步骤工作流执行,在 SWE-bench Verified 中获得 74.0 分,在多语言场景中超越了 Claude Sonnet 4.5。",
"Pro/MiniMaxAI/MiniMax-M2.5.description": "MiniMax-M2.5 是 MiniMax 开发的最新大语言模型,通过在数十万复杂的现实环境中进行大规模强化学习训练。采用 2290 亿参数的 MoE 架构,在编程、Agent 工具调用、搜索和办公场景等任务中实现了行业领先的性能。",
"Pro/Qwen/Qwen2-7B-Instruct.description": "Qwen2-7B-Instruct 是 Qwen2 系列中的一款 70 亿参数指令微调大模型。采用 Transformer 架构,结合 SwiGLU、注意力 QKV 偏置和分组查询注意力,支持大输入,语言理解、生成、多语言、编程、数学和推理能力强,超越大多数开源模型,媲美闭源模型。在多个基准测试中优于 Qwen1.5-7B-Chat。",
"Pro/Qwen/Qwen2.5-7B-Instruct.description": "Qwen2.5-7B-Instruct 是阿里云最新大模型系列的一部分。该 70 亿参数模型在编程和数学方面有显著提升,支持 29+ 种语言,增强了指令理解、结构化数据处理和结构化输出(特别是 JSON)。",
"Pro/Qwen/Qwen2.5-Coder-7B-Instruct.description": "Qwen2.5-Coder-7B-Instruct 是阿里云最新面向编程的大模型。基于 Qwen2.5 构建,训练数据达 5.5 万亿 token,显著提升代码生成、推理与修复能力,同时保留数学与通用能力,为编程智能体提供坚实基础。",
@@ -107,13 +109,13 @@
"Pro/deepseek-ai/DeepSeek-R1-Distill-Qwen-7B.description": "DeepSeek-R1-Distill-Qwen-7B 是从 Qwen2.5-Math-7B 蒸馏而来,并在 80 万条精心挑选的 DeepSeek-R1 样本上进行微调。该模型表现出色,在 MATH-500 上达到 92.8%,在 AIME 2024 上达到 55.5%,在 CodeForces 上的评分为 11897B 模型)。",
"Pro/deepseek-ai/DeepSeek-R1.description": "DeepSeek-R1 是一个基于强化学习(RL)的推理模型,旨在减少重复并提升可读性。在 RL 之前使用冷启动数据进一步增强推理能力,在数学、编程和推理任务上可与 OpenAI-o1 相媲美,并通过精细训练提升整体表现。",
"Pro/deepseek-ai/DeepSeek-V3.1-Terminus.description": "DeepSeek-V3.1-Terminus 是 V3.1 的更新版本,定位为混合代理大模型。该版本修复了用户反馈的问题,提升了稳定性、语言一致性,并减少了中英文混杂和异常字符。它集成了思维模式与非思维模式,并配备聊天模板以实现灵活切换。同时还提升了代码代理和搜索代理的性能,使工具使用和多步骤任务更加可靠。",
"Pro/deepseek-ai/DeepSeek-V3.2-Exp.description": "DeepSeek-V3.2-Exp 是 V3.2 的实验性版本,作为通往下一代架构的桥梁。在 V3.1-Terminus 的基础上引入了 DeepSeek 稀疏注意力(DSA),以提升长上下文训练与推理效率,并针对工具使用、长文档理解和多步骤推理进行了优化。非常适合探索在大上下文预算下的高效推理能力。",
"Pro/deepseek-ai/DeepSeek-V3.2.description": "DeepSeek-V3.2 是一款结合高计算效率与卓越推理和 Agent 性能的模型。其方法基于三项关键技术突破:DeepSeek 稀疏注意力(DSA),一种高效的注意力机制,在显著降低计算复杂度的同时保持模型性能,特别针对长上下文场景进行了优化;可扩展的强化学习框架,使模型性能可媲美 GPT-5,其高计算版本在推理能力上可匹敌 Gemini-3.0-Pro;以及一个大规模 Agent 任务合成管道,旨在将推理能力集成到工具使用场景中,从而提升复杂交互环境中的指令遵循和泛化能力。该模型在 2025 年国际数学奥林匹克(IMO)和国际信息学奥林匹克(IOI)中获得金牌成绩。",
"Pro/deepseek-ai/DeepSeek-V3.description": "DeepSeek-V3 是一个拥有 6710 亿参数的 MoE 模型,采用 MLA 和 DeepSeekMoE 架构,并通过无损负载均衡实现高效推理与训练。预训练数据量达 14.8 万亿高质量 token,并通过 SFT 和 RL 进一步调优,性能超越其他开源模型,接近领先的闭源模型。",
"Pro/moonshotai/Kimi-K2-Instruct-0905.description": "Kimi K2-Instruct-0905 是最新且最强大的 Kimi K2 模型。作为顶级 MoE 模型,拥有 1 万亿总参数和 320 亿激活参数。其主要特点包括更强的代理式编程智能,在基准测试和真实代理任务中取得显著提升,同时前端代码美观性和可用性也得到优化。",
"Pro/moonshotai/Kimi-K2-Thinking.description": "Kimi K2 Thinking Turbo 是 K2 Thinking 的高性能变体,在保持多步骤推理和工具使用能力的同时,优化了推理速度和吞吐量。该模型为 MoE 架构,拥有约 1 万亿总参数,原生支持 256K 上下文,并在生产场景中具备稳定的大规模工具调用能力,满足更严格的延迟与并发需求。",
"Pro/moonshotai/Kimi-K2.5.description": "Kimi K2.5 是一款原生开源多模态智能体模型,基于 Kimi-K2-Base 构建,训练数据包含约 1.5 万亿视觉与文本混合标记。该模型采用 MoE 架构,总参数量达 1 万亿,活跃参数为 320 亿,支持 256K 上下文窗口,能够无缝融合视觉与语言理解能力。",
"Pro/zai-org/glm-4.7.description": "GLM-4.7 是智谱推出的新一代旗舰大模型,拥有 3550 亿总参数和 320 亿激活参数,在通用对话、推理和智能体能力方面实现全面升级。GLM-4.7 强化了交错式思维,并引入了保留式思维和轮次级思维。",
"Pro/zai-org/glm-5.description": "GLM-5 是智谱推出的一代大语言模型,专注于复杂系统工程和长周期 Agent 任务。模型参数扩展至 744B 参数40B 激活),并集成了 DeepSeek Sparse Attention。",
"Pro/zai-org/glm-5.description": "GLM-5 是智谱推出的一代大语言模型,专注于复杂系统工程和长时段 Agent 任务。模型参数扩展至 7440 亿(活跃参数 400 亿),并集成了 DeepSeek 稀疏注意力。",
"QwQ-32B-Preview.description": "Qwen QwQ 是一个实验性研究模型,专注于提升推理能力。",
"Qwen/QVQ-72B-Preview.description": "QVQ-72B-Preview 是 Qwen 团队推出的研究模型,专注于视觉推理,擅长复杂场景理解和视觉数学问题。",
"Qwen/QwQ-32B-Preview.description": "Qwen QwQ 是一个实验性研究模型,致力于提升 AI 的推理能力。",
@@ -137,7 +139,7 @@
"Qwen/Qwen3-14B.description": "Qwen3 是新一代通义千问模型,在推理能力、通用能力、智能体能力和多语言表现方面有重大提升,支持思维模式切换。",
"Qwen/Qwen3-235B-A22B-Instruct-2507.description": "Qwen3-235B-A22B-Instruct-2507 是 Qwen3 的旗舰 MoE 模型,总参数 235B,激活参数 22B。该版本为非思维模式,专注于提升指令理解、逻辑推理、文本理解、数学、科学、编程和工具使用能力。同时扩展多语言长尾知识,更好地契合用户在主观开放任务中的偏好。",
"Qwen/Qwen3-235B-A22B-Thinking-2507.description": "Qwen3-235B-A22B-Thinking-2507 是专注于复杂推理的 Qwen3 模型。采用 MoE 架构,总参数 235B,每个 token 激活约 22B 参数,提升效率。作为专用思维模型,在逻辑、数学、科学、编程和学术基准测试中表现卓越,达到顶级开放思维性能。同时提升了指令理解、工具使用和文本生成能力,原生支持 256K 上下文,适用于深度推理和长文档处理。",
"Qwen/Qwen3-235B-A22B.description": "Qwen3 是新一代通义千问模型,在推理能力、通用能力、智能体能力和多语言表现方面有重大提升,支持思维模式切换。",
"Qwen/Qwen3-235B-A22B.description": "Qwen3 235B A22B 是 Qwen3 的超大规模模型,提供顶级的 AI 能力。",
"Qwen/Qwen3-30B-A3B-Instruct-2507.description": "Qwen3-30B-A3B-Instruct-2507 是 Qwen3-30B-A3B 的更新版非思维模型。该模型为 MoE 架构,总参数 30.5B,激活参数 3.3B。显著提升了指令理解、逻辑推理、文本理解、数学、科学、编程和工具使用能力,扩展多语言长尾知识,并更好地契合用户在主观开放任务中的偏好。支持 256K 上下文。该模型仅为非思维模式,不会输出 `<think></think>` 标签。",
"Qwen/Qwen3-30B-A3B-Thinking-2507.description": "Qwen3-30B-A3B-Thinking-2507 是 Qwen3 系列中最新的思维模型。采用 MoE 架构,总参数 30.5B,激活参数 3.3B,专注于复杂任务。在逻辑、数学、科学、编程和学术基准测试中表现显著提升,同时增强了指令理解、工具使用、文本生成和偏好对齐能力。原生支持 256K 上下文,并可扩展至 1M tokens。该版本专为思维模式设计,具备详细的逐步推理能力和强大的智能体能力。",
"Qwen/Qwen3-30B-A3B.description": "Qwen3 是新一代通义千问模型,在推理能力、通用能力、智能体能力和多语言表现方面有重大提升,支持思维模式切换。",
@@ -315,7 +317,6 @@
"codeqwen.description": "CodeQwen1.5 是一款在大规模代码数据上训练的大语言模型,专为复杂编程任务设计。",
"codestral-latest.description": "Codestral 是我们最先进的代码模型;v2(2025年1月)专为低延迟、高频任务(如 FIM、代码修复和测试生成)而设计。",
"codestral.description": "Codestral 是 Mistral AI 推出的首个代码模型,具备强大的代码生成能力。",
"codex-mini-latest.description": "codex-mini-latest 是为 Codex CLI 微调的 o4-mini 模型。若需直接通过 API 使用,建议从 gpt-4.1 开始。",
"cogito-2.1:671b.description": "Cogito v2.1 671B 是一款美国开源大语言模型,可免费商用,性能媲美顶级模型,具备更高的 Token 推理效率、128k 长上下文能力以及强大的综合能力。",
"cogview-3-flash.description": "CogView-3-Flash 是智谱推出的免费图像生成模型。它能够根据用户指令生成与之匹配的图像,同时实现更高的美学质量评分。CogView-3-Flash 主要应用于艺术创作、设计参考、游戏开发和虚拟现实等领域,帮助用户快速将文本描述转化为图像。",
"cogview-4.description": "CogView-4 是智谱推出的首个支持中文字符生成的开源文生图模型,提升了语义理解、图像质量和中英文文本渲染能力,支持任意长度的中英文提示词,并可在指定范围内生成任意分辨率图像。",
@@ -342,7 +343,7 @@
"command-light-nightly.description": "为缩短主要版本之间的发布间隔,我们提供 Command 系列的每晚构建版本。command-light-nightly 是 command-light 系列中最新、最具实验性(可能不稳定)的版本,定期更新,适合测试用途,不建议用于生产环境。",
"command-light.description": "Command 的轻量快速版本,几乎同样强大但响应更快。",
"command-nightly.description": "为缩短主要版本之间的发布间隔,我们提供 Command 系列的每晚构建版本。command-nightly 是 Command 系列中最新、最具实验性(可能不稳定)的版本,定期更新,适合测试用途,不建议用于生产环境。",
"command-r-03-2024.description": "Command R 是一款遵循指令的聊天模型,质量更高可靠性更强、上下文窗口更长,支持代码生成、RAG、工具使用和智能体等复杂工作流。",
"command-r-03-2024.description": "command-r 是一款指令跟随型聊天模型,在语言任务中表现出更高的质量更高可靠性和更长的上下文支持。它支持复杂的工作流,如代码生成、RAG、工具使用和 Agent。",
"command-r-08-2024.description": "command-r-08-2024 是 2024 年 8 月发布的 Command R 模型更新版本。",
"command-r-plus-04-2024.description": "command-r-plus 是 command-r-plus-04-2024 的别名,API 中使用 command-r-plus 即指向该模型。",
"command-r-plus-08-2024.description": "Command R+ 是一款遵循指令的聊天模型,质量更高、可靠性更强、上下文窗口更长,特别适用于复杂的 RAG 工作流和多步骤工具使用。",
@@ -366,7 +367,8 @@
"deepseek-ai/DeepSeek-V2.5.description": "DeepSeek-V2.5 升级了 DeepSeek-V2-Chat 和 DeepSeek-Coder-V2-Instruct,融合通用与编程能力。提升了写作和指令遵循能力,实现更好的偏好对齐,在 AlpacaEval 2.0、ArenaHard、AlignBench 和 MT-Bench 上取得显著进步。",
"deepseek-ai/DeepSeek-V3.1-Terminus.description": "DeepSeek-V3.1-Terminus 是 V3.1 的更新版本,定位为混合智能体大模型。修复用户反馈问题,提升稳定性、语言一致性,减少中英混杂和异常字符。集成思考与非思考模式,支持通过聊天模板灵活切换。Code Agent 和 Search Agent 性能也得到提升,工具使用更可靠,多步任务执行更高效。",
"deepseek-ai/DeepSeek-V3.1.description": "DeepSeek V3.1 采用混合推理架构,支持思考与非思考模式。",
"deepseek-ai/DeepSeek-V3.2-Exp.description": "DeepSeek-V3.2-Exp 是 V3.2 的实验版本,连接下一代架构。在 V3.1-Terminus 基础上引入 DeepSeek 稀疏注意力(DSA),提升长上下文训练与推理效率,优化工具使用、长文档理解和多步推理。适合探索大上下文预算下的高效推理。",
"deepseek-ai/DeepSeek-V3.2-Exp.description": "DeepSeek V3.2 Exp 使用混合推理架构,支持思考模式和非思考模式。",
"deepseek-ai/DeepSeek-V3.2.description": "DeepSeek-V3.2 是一款结合高计算效率与卓越推理和 Agent 性能的模型。其方法基于三项主要技术突破:DeepSeek 稀疏注意力(DSA),一种高效的注意力机制,在显著降低计算复杂度的同时保持模型性能,特别针对长上下文场景进行了优化;可扩展的强化学习框架,使模型性能可媲美 GPT-5,其高计算版本在推理能力上可媲美 Gemini-3.0-Pro;以及一个大规模 Agent 任务合成管道,旨在将推理能力集成到工具使用场景中,从而提升复杂交互环境中的指令遵循和泛化能力。该模型在 2025 年国际数学奥林匹克(IMO)和国际信息学奥林匹克(IOI)中获得金牌成绩。",
"deepseek-ai/DeepSeek-V3.description": "DeepSeek-V3 是一个拥有 671B 参数的 MoE 模型,采用 MLA 和 DeepSeekMoE 架构,具备无损负载均衡,实现高效训练与推理。在 14.8T 高质量数据上预训练,并结合 SFT 与 RL,性能超越其他开源模型,接近领先闭源模型。",
"deepseek-ai/deepseek-llm-67b-chat.description": "DeepSeek LLM Chat67B)是一款创新模型,具备深度语言理解与交互能力。",
"deepseek-ai/deepseek-v3.1-terminus.description": "DeepSeek V3.1 是下一代推理模型,具备更强的复杂推理与链式思维能力,适用于深度分析任务。",
@@ -433,6 +435,7 @@
"deepseek_r1_distill_llama_70b.description": "DeepSeek-R1-Distill-Llama-70B 是基于 Llama-3.3-70B-Instruct 蒸馏而成。作为 DeepSeek-R1 系列的一部分,使用 DeepSeek-R1 生成的样本进行微调,在数学、编程和推理方面表现出色。",
"deepseek_r1_distill_qwen_14b.description": "DeepSeek-R1-Distill-Qwen-14B 是基于 Qwen2.5-14B 蒸馏而成,并使用 DeepSeek-R1 生成的 80 万高质量样本进行微调,具备强大的推理能力。",
"deepseek_r1_distill_qwen_32b.description": "DeepSeek-R1-Distill-Qwen-32B 是基于 Qwen2.5-32B 蒸馏而成,并使用 DeepSeek-R1 生成的 80 万高质量样本进行微调,在数学、编程和推理方面表现卓越。",
"devstral-2512.description": "Devstral 2 是一款企业级文本模型,擅长使用工具探索代码库、编辑多个文件,并为软件工程 Agent 提供支持。",
"devstral-2:123b.description": "Devstral 2 123B 擅长使用工具探索代码库、编辑多个文件,并支持软件工程代理。",
"doubao-1.5-lite-32k.description": "Doubao-1.5-lite 是一款全新轻量级模型,响应速度极快,兼具卓越质量与低延迟。",
"doubao-1.5-pro-256k.description": "Doubao-1.5-pro-256k 是 Doubao-1.5-Pro 的全面升级版,整体性能提升 10%。支持 256k 上下文窗口和最多 12k 输出 token,性能更强、窗口更大,适用于更广泛的场景。",
@@ -549,7 +552,7 @@
"gemini-3-pro-image-preview.description": "Gemini 3 Pro ImageNano Banana Pro)是 Google 的图像生成模型,同时支持多模态对话。",
"gemini-3-pro-image-preview:image.description": "Gemini 3 Pro ImageNano Banana Pro)是 Google 的图像生成模型,同时支持多模态对话。",
"gemini-3-pro-preview.description": "Gemini 3 Pro 是 Google 最强大的智能体与编程模型,在最先进推理基础上提供更丰富的视觉效果与更深入的交互体验。",
"gemini-3.1-flash-image-preview.description": "Gemini 3.1 Flash ImageNano Banana 2以 Flash 速度提供 Pro 级图像质量,同时支持多模态对话。",
"gemini-3.1-flash-image-preview.description": "Gemini 3.1 Flash ImageNano Banana 2是 Google 最快的原生图像生成模型,支持思考、对话式图像生成和编辑。",
"gemini-3.1-flash-image-preview:image.description": "Gemini 3.1 Flash ImageNano Banana 2)以 Flash 速度提供 Pro 级图像质量,同时支持多模态对话。",
"gemini-3.1-pro-preview.description": "Gemini 3.1 Pro Preview在Gemini 3 Pro的基础上增强了推理能力,并增加了中等思维水平支持。",
"gemini-flash-latest.description": "Latest release of Gemini Flash",
@@ -605,19 +608,15 @@
"google/gemini-2.0-flash-lite-001.description": "Gemini 2.0 Flash Lite 是轻量级 Gemini 变体,默认关闭推理功能以优化延迟和成本,但可通过参数启用。",
"google/gemini-2.0-flash-lite.description": "Gemini 2.0 Flash Lite 提供下一代特性,包括极快速度、内置工具使用、多模态生成和 100 万 token 上下文窗口。",
"google/gemini-2.0-flash.description": "Gemini 2.0 Flash 是 Google 面向扩展多模态任务的高性能推理模型。",
"google/gemini-2.5-flash-image-free.description": "Gemini 2.5 Flash Image 免费版,支持有限配额的多模态生成。",
"google/gemini-2.5-flash-image-preview.description": "Gemini 2.5 Flash 实验模型,支持图像生成。",
"google/gemini-2.5-flash-image.description": "Gemini 2.5 Flash ImageNano Banana)是 Google 的图像生成模型,支持多模态对话。",
"google/gemini-2.5-flash-lite.description": "Gemini 2.5 Flash Lite 是 Gemini 2.5 的轻量级变体,优化延迟和成本,适用于高吞吐场景。",
"google/gemini-2.5-flash-preview.description": "Gemini 2.5 Flash 是 Google 最先进的旗舰模型,专为高级推理、编程、数学和科学任务打造。内置“思考”机制,提供更高准确率和更精细的上下文处理。\n\n注意:该模型有两个变体——思考版与非思考版。启用思考功能将显著影响输出计费。\n\n如需启用思考并接收思考 token,请选择带“:thinking”后缀的变体。\n\nGemini 2.5 Flash 还可通过“max reasoning tokens”参数进行配置,详见文档:https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning。",
"google/gemini-2.5-flash-preview:thinking.description": "Gemini 2.5 Flash 是 Google 最先进的旗舰模型,专为高级推理、编程、数学和科学任务打造。内置“思考”机制,提供更高准确率和更精细的上下文处理。\n\n注意:该模型有两个变体——思考版与非思考版。启用思考功能将显著影响输出计费。\n\n如需启用思考并接收思考 token,请选择带“:thinking”后缀的变体。\n\nGemini 2.5 Flash 还可通过“max reasoning tokens”参数进行配置,详见文档:https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning。",
"google/gemini-2.5-flash.description": "Gemini 2.5 FlashLite/Pro/Flash是 Google 的模型家族,覆盖从低延迟到高性能推理的多种需求。",
"google/gemini-2.5-pro-free.description": "Gemini 2.5 Pro 免费版提供有限配额的多模态长上下文支持,适合试用和轻量工作流。",
"google/gemini-2.5-flash.description": "Gemini 2.5 Flash 是 Google 的家族模型,覆盖从低延迟到高性能推理。",
"google/gemini-2.5-pro-preview.description": "Gemini 2.5 Pro Preview 是 Google 最先进的思考模型,擅长处理代码、数学、STEM 等复杂问题,并能分析大规模数据集、代码库和长文档。",
"google/gemini-2.5-pro.description": "Gemini 2.5 Pro 是 Google 的旗舰推理模型,支持长上下文,适用于复杂任务。",
"google/gemini-3-pro-image-preview-free.description": "Gemini 3 Pro Image 免费版,支持有限配额的多模态生成。",
"google/gemini-3-pro-image-preview.description": "Gemini 3 Pro ImageNano Banana Pro)是 Google 的图像生成模型,支持多模态对话。",
"google/gemini-3-pro-preview-free.description": "Gemini 3 Pro Preview 免费版具备与标准版相同的多模态理解与推理能力,但有配额和速率限制,适合试用和低频使用。",
"google/gemini-3-pro-preview.description": "Gemini 3 Pro 是 Gemini 系列的下一代多模态推理模型,支持文本、音频、图像和视频理解,能处理复杂任务和大型代码库。",
"google/gemini-embedding-001.description": "一款先进的嵌入模型,在英文、多语言和代码任务中表现出色。",
"google/gemini-flash-1.5.description": "Gemini 1.5 Flash 针对多模态处理进行了优化,适用于多种复杂任务。",
@@ -717,15 +716,24 @@
"hunyuan-a13b.description": "混合推理模型 Hunyuan-A13B 是混元推出的首个此类模型,由 hunyuan-standard-256K(总参数 800 亿,激活参数 130 亿)升级而来。默认采用慢思考模式,可通过参数或前缀 /no_think 切换快/慢思维。整体能力较前代显著提升,尤其在数学、科学、长文本理解和智能体任务方面表现优异。",
"hunyuan-code.description": "混元最新代码模型,基于200B高质量代码数据和六个月的SFT数据训练,支持8K上下文。在自动代码基准测试和五种语言的专家人工评估中排名靠前。",
"hunyuan-functioncall.description": "混元最新专家混合工具调用模型,基于高质量工具调用数据训练,支持32K上下文窗口,在各维度基准测试中表现领先。",
"hunyuan-large-longcontext.description": "擅长长文档任务,如摘要和问答,同时也能处理一般生成任务。对复杂、详细内容的长文本分析和生成表现出色。",
"hunyuan-large.description": "Hunyuan-large 拥有约 3890 亿总参数和约 520 亿激活参数,是基于 Transformer 架构的最大最强开源 MoE 模型。",
"hunyuan-lite.description": "升级为 MoE 架构,具备 256K 上下文窗口,在 NLP、代码、数学和行业基准测试中领先众多开源模型。",
"hunyuan-pro.description": "万亿参数的 MOE-32K 长上下文模型,在复杂指令与推理、高级数学、函数调用等方面表现强劲,针对多语言翻译、金融、法律和医疗等领域进行了优化。",
"hunyuan-role.description": "混元最新角色扮演模型,经过角色扮演数据的正式微调,在角色扮演场景中表现更强。",
"hunyuan-standard-256K.description": "通过改进路由技术缓解负载均衡和专家崩溃问题。长文本“海底捞针”准确率达到99.9%。MOE-256K在长度和质量上进一步突破,显著扩展输入长度。",
"hunyuan-standard.description": "通过改进路由技术缓解负载均衡和专家崩溃问题。长文本“海底捞针”准确率达到99.9%。MOE-32K在质量和价格之间实现更好的平衡,适用于长文本输入。",
"hunyuan-standard-256K.description": "通过改进路由机制缓解负载均衡和专家崩溃问题。在长上下文中实现 99.9% 的大海捞针任务成功率。MOE-256K 进一步扩展了上下文长度和质量。",
"hunyuan-standard.description": "通过改进路由机制缓解负载均衡和专家崩溃问题。在长上下文中实现 99.9% 的大海捞针任务成功率。MOE-32K 在处理长输入时提供了强大的价值。",
"hunyuan-t1-20250321.description": "在艺术与 STEM 能力之间实现平衡,具备强大的长文本信息捕获能力。支持数学、逻辑、科学和代码问题的推理解答,覆盖不同难度级别。",
"hunyuan-t1-20250403.description": "改进了项目级代码生成和写作质量,加强了多轮主题理解和 ToB 指令遵循能力,提升了词汇级理解能力,并减少了简繁混用和中英文混用问题。",
"hunyuan-t1-20250529.description": "提升了创意写作和作文能力,加强了前端编码、数学和逻辑推理能力,并增强了指令遵循能力。",
"hunyuan-t1-20250711.description": "大幅提升了高难度数学、逻辑和编码能力,增强了输出稳定性,并提升了长文本处理能力。",
"hunyuan-t1-latest.description": "显著提升慢思考模型在高难数学、复杂推理、困难编程、指令遵循与创意写作方面的能力。",
"hunyuan-t1-vision-20250916.description": "最新 t1-vision 深度推理模型,在 VQA、视觉定位、OCR、图表理解、拍照题解与图像创作等方面有重大提升,同时增强英文与低资源语言能力。",
"hunyuan-turbo-20241223.description": "此版本提升了指令扩展能力以实现更好的泛化,大幅改进了数学/代码/逻辑推理能力,增强了词汇级理解能力,并提升了写作质量。",
"hunyuan-turbo-latest.description": "在 NLP 理解、写作、聊天、问答、翻译和领域任务方面实现了全面的体验改进;提供更接近人类的响应,对模糊意图的澄清更好,词汇解析能力更强,创意质量和交互性更高,多轮对话能力更强。",
"hunyuan-turbo.description": "混元下一代大模型预览版,采用全新 MoE 架构,推理速度更快,性能超越 hunyuan-pro。",
"hunyuan-turbos-latest.description": "最新的 Hunyuan TurboS 旗舰模型,具备更强推理能力与更优整体体验。",
"hunyuan-turbos-longtext-128k-20250325.description": "擅长长文档任务,如摘要和问答,同时也能处理一般生成任务。对复杂、详细内容的长文本分析和生成表现出色。",
"hunyuan-vision-1.5-instruct.description": "基于TurboS文本基础构建的快速思维图像转文本模型,与上一版本相比,在基础图像识别和图像分析推理方面有显著提升。",
"hunyuan-vision.description": "混元最新多模态模型,支持图像+文本输入以生成文本。",
"image-01-live.description": "一款细节精致的图像生成模型,支持文本生成图像与可控风格预设。",
@@ -770,8 +778,7 @@
"kimi-k2:1t.description": "Kimi K2 是 Moonshot AI 推出的超大规模 MoE 语言模型,总参数量 1T,每次前向传播激活 32B 参数。该模型专为智能体能力优化,包括高级工具使用、推理与代码生成。",
"kimi-latest.description": "Kimi Latest 使用最新版本的 Kimi 模型,可能包含实验性功能。支持图像理解,并根据上下文长度自动选择 8k/32k/128k 计费模型。",
"kuaishou/kat-coder-pro-v1.description": "KAT-Coder-Pro-V1(限时免费)专注于代码理解与自动化,助力高效编程智能体。",
"learnlm-1.5-pro-experimental.description": "LearnLM 是一款实验性、任务导向的模型,基于学习科学原理训练,能在教学/学习场景中遵循系统指令,充当专家导师。",
"learnlm-2.0-flash-experimental.description": "LearnLM 是一款实验性、任务导向的模型,基于学习科学原理训练,能在教学/学习场景中遵循系统指令,充当专家导师。",
"labs-devstral-small-2512.description": "Devstral Small 2 擅长使用工具探索代码库、编辑多个文件,并为软件工程 Agent 提供支持。",
"lite.description": "Spark Lite 是一款轻量级大语言模型,具备超低延迟与高效处理能力,完全免费,支持实时网页搜索。其快速响应在低算力设备与模型微调中表现出色,尤其适用于知识问答、内容生成与搜索场景,兼具高性价比与智能体验。",
"llama-3.1-70b-versatile.description": "Llama 3.1 70B 提供更强的 AI 推理能力,适用于复杂应用,支持高效能计算与高准确率。",
"llama-3.1-8b-instant.description": "Llama 3.1 8B 是一款高效模型,文本生成速度快,适合大规模、低成本应用。",
@@ -782,7 +789,6 @@
"llama-3.2-90b-vision-preview.description": "Llama 3.2 专为视觉与文本结合任务设计,擅长图像描述与视觉问答,连接语言生成与视觉推理。",
"llama-3.2-vision-instruct.description": "Llama 3.2-Vision 指令微调模型,专为视觉识别、图像推理、图像描述与通用图像问答优化。",
"llama-3.3-70b-versatile.description": "Meta Llama 3.3 是一款多语言大语言模型,拥有 70B 参数(文本输入/输出),提供预训练与指令微调版本。指令微调的文本模型专为多语言对话场景优化,在多个行业基准测试中超越众多开源与闭源聊天模型。",
"llama-3.3-70b.description": "Llama 3.3 70B:一款中大型 Llama 模型,在推理能力与吞吐量之间实现平衡。",
"llama-3.3-instruct.description": "Llama 3.3 指令微调模型专为对话优化,在多个行业通用基准测试中超越众多开源聊天模型。",
"llama3-70b-8192.description": "Meta Llama 3 70B 在处理复杂任务方面表现卓越,适用于高要求项目。",
"llama3-8b-8192.description": "Meta Llama 3 8B 在多种场景中展现出强大的推理能力。",
@@ -832,7 +838,6 @@
"meta-llama/llama-3.1-8b-instruct:free.description": "LLaMA 3.1 支持多语言,是领先的生成模型之一。",
"meta-llama/llama-3.2-11b-vision-instruct.description": "LLaMA 3.2 专为视觉与文本结合任务设计,擅长图像描述与视觉问答,连接语言生成与视觉推理。",
"meta-llama/llama-3.2-3b-instruct.description": "meta-llama/llama-3.2-3b-instruct",
"meta-llama/llama-3.2-90b-vision-instruct.description": "LLaMA 3.2 专为视觉与文本结合任务设计,擅长图像描述与视觉问答,连接语言生成与视觉推理。",
"meta-llama/llama-3.3-70b-instruct.description": "Llama 3.3 是最先进的多语言开源 Llama 模型,以极低成本实现接近 405B 的性能。基于 Transformer 架构,结合 SFT 与 RLHF 提升实用性与安全性。指令微调版本针对多语言对话优化,在行业基准测试中超越众多开源与闭源模型。知识截止时间:2023 年 12 月。",
"meta-llama/llama-3.3-70b-instruct:free.description": "Llama 3.3 是最先进的多语言开源 Llama 模型,以极低成本实现接近 405B 的性能。基于 Transformer 架构,结合 SFT 与 RLHF 提升实用性与安全性。指令微调版本针对多语言对话优化,在行业基准测试中超越众多开源与闭源模型。知识截止时间:2023 年 12 月。",
"meta.llama3-1-405b-instruct-v1:0.description": "Meta Llama 3.1 405B Instruct 是 Llama 3.1 Instruct 系列中最大且最强大的模型,专为对话推理和合成数据生成而设计,是进行领域特定持续预训练或微调的强大基础。Llama 3.1 多语言大模型(LLM)包括 8B、70B 和 405B 三种规模的预训练与指令微调生成模型(文本输入/输出)。这些指令微调模型针对多语言对话进行了优化,在多个行业通用基准测试中优于许多开源聊天模型。Llama 3.1 适用于商业和科研用途,支持多语言。指令微调模型适合助手式聊天场景,预训练模型则适用于更广泛的自然语言生成任务。Llama 3.1 的输出还可用于提升其他模型的性能,包括合成数据生成与优化。Llama 3.1 是一种自回归 Transformer 模型,采用优化架构。其微调版本结合了监督微调(SFT)和基于人类反馈的强化学习(RLHF),以更好地符合人类对有用性与安全性的偏好。",
@@ -894,7 +899,7 @@
"mistral-large-instruct.description": "Mistral-Large-Instruct-2407 是一款先进的密集型大语言模型,拥有 1230 亿参数,具备最先进的推理、知识和编程能力。",
"mistral-large-latest.description": "Mistral Large 是旗舰模型,擅长多语言任务、复杂推理和代码生成,适用于高端应用。",
"mistral-large.description": "Mixtral Large 是 Mistral 的旗舰模型,结合代码生成、数学和推理能力,支持 128K 上下文窗口。",
"mistral-medium-latest.description": "Mistral Medium 3 以 8 倍更低的成本实现最先进性能,并简化企业部署。",
"mistral-medium-latest.description": "Mistral Medium 3.1 以 8 倍更低的成本提供最先进性能,并简化企业部署。",
"mistral-nemo-instruct.description": "Mistral-Nemo-Instruct-2407 是 Mistral-Nemo-Base-2407 的指令微调版本。",
"mistral-nemo.description": "Mistral Nemo 是 Mistral AI 与 NVIDIA 联合开发的高效 120 亿参数模型。",
"mistral-small-latest.description": "Mistral Small 是一款高性价比、快速且可靠的模型,适用于翻译、摘要和情感分析。",
@@ -933,7 +938,7 @@
"moonshot-v1-auto.description": "Moonshot V1 Auto 会根据当前上下文 token 使用情况自动选择合适的模型。",
"moonshotai/Kimi-Dev-72B.description": "Kimi-Dev-72B 是一款开源代码大模型,结合大规模强化学习优化,能够生成稳健、可用于生产的补丁。在 SWE-bench Verified 上得分 60.4%,刷新开源模型在自动化软件工程任务(如修复 Bug 和代码审查)上的记录。",
"moonshotai/Kimi-K2-Instruct-0905.description": "Kimi K2-Instruct-0905 是 Kimi K2 系列中最新最强的模型,采用 1 万亿总参数和 320 亿激活参数的顶级 MoE 架构。其主要特性包括更强的智能体编程能力,在基准测试和真实任务中表现显著提升,同时前端代码美观性和可用性也得到优化。",
"moonshotai/Kimi-K2-Thinking.description": "Kimi K2 Thinking 是目前最强的开源思模型,显著提升多步推理深度,并在 200300 次连续调用中保持稳定工具使用能力,在 Humanity's Last ExamHLE)、BrowseComp 基准测试中创下新纪录。擅长编程、数学、逻辑和智能体场景。基于约 1 万亿参数的 MoE 架构,支持 256K 上下文窗口和工具调用。",
"moonshotai/Kimi-K2-Thinking.description": "Kimi K2 Thinking 是最新、最强的开源思模型,大幅扩展了多步推理深度,并在 200-300 次连续调用中保持稳定工具使用能力,在 Humanity's Last ExamHLE)、BrowseComp 和其他基准测试中创下新纪录。它在编码、数学、逻辑和 Agent 场景中表现出色。基于约 1 万亿参数的 MoE 架构,支持 256K 上下文窗口和工具调用。",
"moonshotai/kimi-k2-0711.description": "Kimi K2 0711 是 Kimi 系列中的指令微调版本,适用于高质量代码生成和工具使用。",
"moonshotai/kimi-k2-0905.description": "Kimi K2 0905 是一次更新,扩展了上下文和推理能力,并进行了编程优化。",
"moonshotai/kimi-k2-instruct-0905.description": "kimi-k2-0905-preview 模型支持 256K 上下文窗口,具备更强的智能体编程能力、更精致实用的前端代码,以及更好的上下文理解能力。",
@@ -948,8 +953,8 @@
"nvidia/Llama-3.1-Nemotron-70B-Instruct-HF.description": "Llama 3.1 Nemotron 70B 是 NVIDIA 定制的大语言模型,旨在提升有用性。在 Arena Hard、AlpacaEval 2 LC 和 GPT-4-Turbo MT-Bench 三项自动对齐基准测试中均排名第一(截至 2024 年 10 月 1 日)。该模型基于 Llama-3.1-70B-Instruct,通过 RLHFREINFORCE)、Llama-3.1-Nemotron-70B-Reward 和 HelpSteer2-Preference 提示训练。",
"nvidia/llama-3.1-nemotron-51b-instruct.description": "一款独特的语言模型,具备卓越的准确性与效率。",
"nvidia/llama-3.1-nemotron-70b-instruct.description": "Llama-3.1-Nemotron-70B-Instruct 是 NVIDIA 定制的大语言模型,旨在提升模型响应的有用性。",
"o1-mini.description": "o1-preview 更小更快,成本降低 80%,擅长代码生成和短上下文任务。",
"o1-preview.description": "专注于高级推理和复杂问题解决,包括数学和科学,适用于需要深度上下文理解和自主工作流的应用。",
"o1-mini.description": "o1-mini 是一款快速、经济高效的推理模型,专为编码、数学和科学设计。支持 128K 上下文,知识截止日期为 2023 年 10 月。",
"o1-preview.description": "o1 是 OpenAI 推出的新推理模型,适用于需要广泛知识的复杂任务。支持 128K 上下文,知识截止日期为 2023 年 10 月。",
"o1-pro.description": "o1 系列通过强化学习训练,具备先思考后作答的能力,能处理复杂推理任务。o1-pro 使用更多计算资源,提供更深入的思考和更高质量的回答。",
"o1.description": "o1 是 OpenAI 推出的新型推理模型,支持文本+图像输入和文本输出,适用于需要广泛知识的复杂任务。具备 200K 上下文窗口,知识截止于 2023 年 10 月。",
"o3-2025-04-16.description": "o3 是 OpenAI 推出的新型推理模型,支持文本+图像输入和文本输出,适用于需要广泛知识的复杂任务。",
@@ -1022,7 +1027,6 @@
"qianfan-check-vl.description": "千帆 Check VL 是一款多模态内容审核模型,适用于图文合规性识别与审核任务。",
"qianfan-composition.description": "千帆 Composition 是一款多模态创作模型,支持图文混合理解与生成。",
"qianfan-engcard-vl.description": "千帆 EngCard VL 是一款专注于英文场景的多模态识别模型。",
"qianfan-lightning-128b-a19b.description": "千帆 Lightning 128B A19B 是一款高性能中文通用模型,擅长复杂问答与大规模推理任务。",
"qianfan-llama-vl-8b.description": "千帆 Llama VL 8B 是基于 Llama 的多模态模型,适用于通用图文理解任务。",
"qianfan-multipicocr.description": "千帆 MultiPicOCR 是一款多图 OCR 模型,支持跨图像的文本检测与识别。",
"qianfan-qi-vl.description": "千帆 QI VL 是一款多模态问答模型,适用于复杂图文场景下的精准检索与问答。",
@@ -1032,7 +1036,6 @@
"qvq-72b-preview.description": "QVQ-72B-Preview 是 Qwen 推出的实验性研究模型,专注于提升视觉推理能力。",
"qvq-max.description": "Qwen QVQ 视觉推理模型支持视觉输入与链式思维输出,在数学、编程、视觉分析、创意及通用任务中表现出色。",
"qvq-plus.description": "视觉推理模型,支持视觉输入与链式思维输出。qvq-plus 系列延续 qvq-max,推理更快,质量与成本更优平衡。",
"qwen-3-32b.description": "Qwen 3 32B:多语言与编程任务表现强劲,适用于中型生产场景。",
"qwen-coder-plus.description": "Qwen 编程模型。",
"qwen-coder-turbo-latest.description": "Qwen 编程模型。",
"qwen-coder-turbo.description": "Qwen 编程模型。",
@@ -1128,7 +1131,6 @@
"qwen3-coder-next.description": "下一代Qwen编码器,优化用于复杂多文件代码生成、调试和高吞吐代理工作流。设计用于强大的工具集成和改进的推理性能。",
"qwen3-coder-plus.description": "Qwen 编程模型。最新的 Qwen3-Coder 系列基于 Qwen3,具备强大的编程代理能力、工具使用与环境交互能力,编程表现优异,通用能力扎实。",
"qwen3-coder:480b.description": "阿里巴巴高性能长上下文模型,适用于代理与编程任务。",
"qwen3-max-2026-01-23.description": "Qwen3 Max 系列在通用能力、中英文理解、复杂指令执行、主观开放任务、多语言能力与工具使用方面相较 2.5 系列有显著提升,幻觉更少。最新版本在智能体编程与工具使用方面优于 qwen3-max-preview,达到领域 SOTA,面向更复杂的智能体需求。",
"qwen3-max-preview.description": "Qwen 最强模型预览版,适用于复杂多步任务,支持思维能力。",
"qwen3-max.description": "Qwen3 Max 系列在通用能力、中英文理解、复杂指令跟随、主观开放任务、多语言能力与工具使用方面相较 2.5 系列有大幅提升,幻觉更少。最新版本在编程代理与工具使用方面优于 qwen3-max-preview,达到领域 SOTA,面向更复杂的代理需求。",
"qwen3-next-80b-a3b-instruct.description": "下一代 Qwen3 非推理开源模型。相比上一版本(Qwen3-235B-A22B-Instruct-2507),在中文理解、逻辑推理和文本生成方面均有显著提升。",
@@ -1145,7 +1147,8 @@
"qwen3-vl-flash.description": "Qwen3 VL Flash:轻量级、高速推理版本,适用于对延迟敏感或高并发请求。",
"qwen3-vl-plus.description": "Qwen VL 是一款具备视觉理解能力的文本生成模型,支持 OCR、摘要与推理,可从商品图片中提取属性或解决图像问题。",
"qwen3.5-397b-a17b.description": "支持文本、图像和视频输入。在仅文本任务中,其性能可与Qwen3 Max媲美,效率更高且成本更低。在多模态能力方面,相比Qwen3 VL系列有显著提升。",
"qwen3.5-plus.description": "Qwen3.5 Plus支持文本、图像和视频输入。在文本任务中,其性能可与Qwen3 Max媲美,同时效率更高且成本更低。多模态能力方面,相比Qwen3 VL系列有显著提升。",
"qwen3.5-plus.description": "Qwen3.5 Plus 支持文本、图像和视频输入。在文本任务上的性能可与 Qwen3 Max媲美,且性能更优、成本更低。多模态能力相比 Qwen3 VL 系列有显著提升。",
"qwen3.5:397b.description": "Qwen3.5 是一款统一的视觉-语言基础模型,采用混合架构(专家混合 + 线性注意力),在 256K 上下文窗口内提供强大的多模态推理、编码和长上下文能力。",
"qwen3.description": "Qwen3 是阿里巴巴推出的下一代大语言模型,在多种应用场景中表现出色。",
"qwq-32b-preview.description": "QwQ 是 Qwen 推出的实验性研究模型,专注于推理能力的提升。",
"qwq-32b.description": "QwQ 是 Qwen 系列中的推理模型。相比标准指令微调模型,具备更强的思维与推理能力,显著提升下游复杂任务表现。QwQ-32B 是一款中型推理模型,性能可媲美 DeepSeek-R1 和 o1-mini 等顶级模型。",
@@ -1187,7 +1190,7 @@
"step-2-16k.description": "支持大上下文交互,适用于复杂对话。",
"step-2-mini.description": "基于下一代自研 MFA 注意力架构构建,在大幅降低成本的同时实现 Step-1 级别效果,具备更高吞吐与更低延迟,适用于通用任务,编程能力强。",
"step-2x-large.description": "新一代 StepFun 图像模型,专注于图像生成,可根据文本提示生成高质量图像,具备更真实的纹理与更强的中英文文本渲染能力。",
"step-3.5-flash.description": "Stepfun的旗舰语言推理模型。该模型提供顶级推理能力以及快速可靠的执行能力。能够分解和规划复杂任务,快速可靠地调用工具完成任务,并逻辑推理、数学、软件工程、深度研究等复杂任务中表现卓越。上下文长度为256K。",
"step-3.5-flash.description": "Stepfun 的旗舰语言推理模型。该模型具备顶级推理能力快速可靠的执行能力。能够分解和规划复杂任务,快速可靠地调用工具执行任务,并胜任逻辑推理、数学、软件工程和深入研究等各种复杂任务。",
"step-3.description": "该模型具备强大的视觉感知与复杂推理能力,能准确处理跨领域知识理解、数学与视觉交叉分析及多种日常视觉分析任务。",
"step-r1-v-mini.description": "具备强图像理解能力的推理模型,可处理图像与文本,并在深度推理后生成文本。擅长视觉推理,在数学、编程与文本推理方面表现出色,支持 100K 上下文窗口。",
"stepfun-ai/step3.description": "Step3 是 StepFun 推出的前沿多模态推理模型,基于 MoE 架构,总参数 321B,激活参数 38B。端到端设计降低解码成本,同时实现顶级视觉语言推理能力。采用 MFA 与 AFD 架构,在旗舰与低端加速器上均保持高效。预训练使用超过 20T 文本与 4T 图文数据,覆盖多种语言,在数学、编程与多模态评测中表现领先。",
@@ -1276,10 +1279,11 @@
"z-ai/glm4.7.description": "GLM-4.7是智谱最新旗舰模型,针对代理编码场景优化,提升了编码能力。",
"z-ai/glm5.description": "GLM-5是智谱AI的新旗舰基础模型,专为代理工程设计,在编码和代理能力方面实现了开源SOTA性能,与Claude Opus 4.5性能相当。",
"z-image-turbo.description": "Z-Image是一个轻量级文本生成图像模型,能够快速生成图像,支持中英文文本渲染,并灵活适应多种分辨率和纵横比。",
"zai-glm-4.7.description": "此模型在高级推理能力、工具使用和 Agent 编程应用中的真实世界性能表现卓越,提供强大的编码能力。",
"zai-org/GLM-4.5-Air.description": "GLM-4.5-Air 是一款面向智能体应用的基础模型,采用专家混合架构,优化用于工具使用、网页浏览、软件工程和前端编程,并可与 Claude Code 和 Roo Code 等代码智能体集成。采用混合推理,兼顾复杂推理与日常任务。",
"zai-org/GLM-4.5.description": "GLM-4.5 是一款面向智能体应用的基础模型,采用专家混合架构,深度优化用于工具使用、网页浏览、软件工程和前端编程,并可与 Claude Code 和 Roo Code 等代码智能体集成。采用混合推理,兼顾复杂推理与日常任务。",
"zai-org/GLM-4.5V.description": "GLM-4.5V 是智谱 AI 最新的多模态语言模型,基于 GLM-4.5-Air 旗舰文本模型(总参数 106B,激活参数 12B),采用 MoE 架构,在成本更低的同时保持强大性能。继承 GLM-4.1V-Thinking 路线,加入 3D-RoPE 提升三维空间推理能力。通过预训练、SFT 和 RL 优化,支持图像、视频和长文档,在 41 个公开多模态基准中排名领先。提供“思考模式”切换,平衡速度与深度。",
"zai-org/GLM-4.6.description": "相比 GLM-4.5GLM-4.6 将上下文长度从 128K 扩展至 200K,适用于更复杂的智能体任务。在代码基准测试中得分更高,在 Claude Code、Cline、Roo Code 和 Kilo Code 等应用中表现更强,包括更好的前端页面生成。推理能力增强,支持推理过程中的工具使用,整体能力更强。更好地集成于智能体框架,提升工具/搜索智能体能力,具备更符合人类偏好的写作风格和角色扮演自然度。",
"zai-org/GLM-4.6V.description": "GLM-4.6V 在视觉理解精度上达到同参数规模的 SOTA,并首次在模型架构中将 Function Call(工具调用)能力原生融入视觉模型,打通从「视觉感知」到「可执行行动(Action)」的链路,为真实业务场景中的多模态 Agent 提供统一的技术底座。",
"zai/glm-4.5-air.description": "GLM-4.5 和 GLM-4.5-Air 是我们面向智能体应用的最新旗舰模型,均采用 MoE 架构。GLM-4.5 总参数 355B,每次前向激活 32B;GLM-4.5-Air 更轻量,总参数 106B,激活参数 12B。",
"zai/glm-4.5.description": "GLM-4.5 系列专为智能体设计,旗舰版 GLM-4.5 结合推理、编程和智能体能力,总参数 355B(激活 32B),提供双模式混合推理系统。",
"zai/glm-4.5v.description": "GLM-4.5V 基于 GLM-4.5-Air 构建,继承 GLM-4.1V-Thinking 的成熟技术,采用强大的 106B 参数 MoE 架构扩展能力。",
+14
View File
@@ -24,6 +24,20 @@
"builtins.lobe-agent-builder.inspector.noResults": "无结果",
"builtins.lobe-agent-builder.inspector.togglePlugin": "切换",
"builtins.lobe-agent-builder.title": "助理构建专家",
"builtins.lobe-agent-management.apiName.callAgent": "呼叫代理",
"builtins.lobe-agent-management.apiName.createAgent": "创建代理",
"builtins.lobe-agent-management.apiName.deleteAgent": "删除代理",
"builtins.lobe-agent-management.apiName.searchAgent": "搜索代理",
"builtins.lobe-agent-management.apiName.updateAgent": "更新代理",
"builtins.lobe-agent-management.inspector.callAgent.sync": "正在呼叫:",
"builtins.lobe-agent-management.inspector.callAgent.task": "分配任务给:",
"builtins.lobe-agent-management.inspector.createAgent.title": "正在创建代理:",
"builtins.lobe-agent-management.inspector.searchAgent.all": "搜索代理:",
"builtins.lobe-agent-management.inspector.searchAgent.market": "搜索市场:",
"builtins.lobe-agent-management.inspector.searchAgent.results": "{{count}} 个结果",
"builtins.lobe-agent-management.inspector.searchAgent.user": "搜索我的代理:",
"builtins.lobe-agent-management.inspector.updateAgent.title": "正在更新代理:",
"builtins.lobe-agent-management.title": "代理管理器",
"builtins.lobe-cloud-sandbox.apiName.editLocalFile": "编辑文件",
"builtins.lobe-cloud-sandbox.apiName.executeCode": "执行代码",
"builtins.lobe-cloud-sandbox.apiName.exportFile": "导出文件",
+5 -1
View File
@@ -224,7 +224,9 @@
"providerModels.item.modelConfig.extendParams.options.gpt5_2ProReasoningEffort.hint": "適用於 GPT-5.2 Pro 系列;控制推理強度。",
"providerModels.item.modelConfig.extendParams.options.gpt5_2ReasoningEffort.hint": "適用於 GPT-5.2 系列;控制推理強度。",
"providerModels.item.modelConfig.extendParams.options.imageAspectRatio.hint": "適用於 Gemini 圖像生成模型;控制生成圖像的長寬比。",
"providerModels.item.modelConfig.extendParams.options.imageAspectRatio2.hint": "適用於 Nano Banana 2;控制生成影像的長寬比(支持超寬 1:4、4:1、1:8、8:1)。",
"providerModels.item.modelConfig.extendParams.options.imageResolution.hint": "適用於 Gemini 3 圖像生成模型;控制生成圖像的解析度。",
"providerModels.item.modelConfig.extendParams.options.imageResolution2.hint": "適用於 Gemini 3.1 Flash Image 模型;控制生成影像的解析度(支持 512px)。",
"providerModels.item.modelConfig.extendParams.options.reasoningBudgetToken.hint": "適用於 Claude、Qwen3 等模型;控制推理所用的 Token 預算。",
"providerModels.item.modelConfig.extendParams.options.reasoningEffort.hint": "適用於 OpenAI 及其他具推理能力的模型;控制推理程度。",
"providerModels.item.modelConfig.extendParams.options.textVerbosity.hint": "適用於 GPT-5+ 系列;控制輸出內容的詳盡程度。",
@@ -232,7 +234,8 @@
"providerModels.item.modelConfig.extendParams.options.thinkingBudget.hint": "適用於 Gemini 系列;控制思考預算。",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel.hint": "適用於 Gemini 3 Flash Preview 模型;控制思考深度。",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel2.hint": "適用於 Gemini 3 Pro Preview 模型;控制思考深度。",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel3.hint": "適用於 Gemini 3.1 Pro Preview 模型;通過低/中/高等級控制思考深度。",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel3.hint": "適用於 Gemini 3.1 Pro Preview 模型;控制思考深度,提供低/中/高等級。",
"providerModels.item.modelConfig.extendParams.options.thinkingLevel4.hint": "適用於 Gemini 3.1 Flash Image 模型;切換思考功能開啟/關閉。",
"providerModels.item.modelConfig.extendParams.options.urlContext.hint": "適用於 Gemini 系列;支援提供 URL 作為上下文。",
"providerModels.item.modelConfig.extendParams.placeholder": "選擇要啟用的擴充參數",
"providerModels.item.modelConfig.extendParams.previewFallback": "無法預覽",
@@ -311,6 +314,7 @@
"providerModels.tabs.image": "圖片",
"providerModels.tabs.stt": "ASR",
"providerModels.tabs.tts": "TTS",
"providerModels.tabs.video": "影片",
"sortModal.success": "排序更新成功",
"sortModal.title": "自定義排序",
"sortModal.update": "更新",
+35 -31
View File
@@ -55,7 +55,8 @@
"FLUX.1-dev.description": "FLUX.1-dev 是來自 Black Forest Labs 的開源多模態語言模型(MLLM),針對圖文任務進行優化,結合圖像與文字的理解與生成能力。該模型基於先進的大型語言模型(如 Mistral-7B),搭配精心設計的視覺編碼器與多階段指令微調,實現多模態協同與複雜任務推理。",
"Gryphe/MythoMax-L2-13b.description": "MythoMax-L213B)是一款創新模型,適用於多領域與複雜任務。",
"HelloMeme.description": "HelloMeme 是一款 AI 工具,可根據您提供的圖像或動作生成迷因、GIF 或短影片。無需繪圖或程式設計技能,只需一張參考圖像,即可創作出有趣、吸睛且風格一致的內容。",
"HiDream-I1-Full.description": "HiDream-E1-Full 是來自 HiDream.ai 的開源多模態像編輯模型,基於先進的 Diffusion Transformer 架構與強大的語言理解能力(內建 LLaMA 3.1-8B-Instruct)。支援自然語言驅動的像生成、風格轉換、局部編輯重繪,具備優異的圖文理解與執行能力。",
"HiDream-E1-Full.description": "HiDream-E1-Full 是 HiDream.ai 推出的開源多模態像編輯模型,基於先進的擴散變壓器架構以及強大的語言理解能力(內建 LLaMA 3.1-8B-Instruct)。它支持自然語言驅動的像生成、風格轉換、局部編輯重繪,具備卓越的影像-文本理解與執行能力。",
"HiDream-I1-Full.description": "HiDream-I1 是 HiDream 推出的全新開源基礎影像生成模型。擁有 17B 參數(Flux 為 12B),能在數秒內提供業界領先的影像品質。",
"HunyuanDiT-v1.2-Diffusers-Distilled.description": "hunyuandit-v1.2-distilled 是一款經過蒸餾優化的輕量級文字轉圖像模型,可快速生成高品質圖像,特別適合資源有限的環境與即時生成場景。",
"InstantCharacter.description": "InstantCharacter 是騰訊 AI 於 2025 年推出的免微調個人化角色生成模型,致力於高保真、跨場景一致的角色建模。它可從單張參考圖像建構角色,並靈活轉換風格、動作與背景。",
"InternVL2-8B.description": "InternVL2-8B 是一款強大的視覺語言模型,支援多模態圖文處理,能準確識別圖像內容並生成相關描述或回答。",
@@ -80,7 +81,7 @@
"MiniMax-M2.1.description": "MiniMax-M2.1 是 MiniMax 推出的旗艦開源大型模型,專注於解決複雜的真實世界任務。其核心優勢在於多語言程式設計能力與作為智能代理執行複雜任務的能力。",
"MiniMax-M2.5-Lightning.description": "M2.5 Lightning:相同性能,更快更靈活(約 100 tps)。",
"MiniMax-M2.5-highspeed.description": "與 M2.5 相同的性能,但推理速度顯著提升。",
"MiniMax-M2.5.description": "頂級性能與極致性價比,輕鬆應對複雜任務(約 60 tps)。",
"MiniMax-M2.5.description": "MiniMax-M2.5 是 MiniMax 推出的旗艦開源大型模型,專注於解決複雜的現實世界任務。其核心優勢包括多語言編程能力以及作為代理解決複雜任務的能力。",
"MiniMax-M2.description": "專為高效編碼與智能體工作流程打造",
"MiniMax-Text-01.description": "MiniMax-01 採用超越傳統 Transformer 的大規模線性注意力機制,擁有 4560 億參數,每次啟用 459 億,支援最多 400 萬字元上下文(為 GPT-4o 的 32 倍,Claude-3.5-Sonnet 的 20 倍),效能頂尖。",
"MiniMaxAI/MiniMax-M1-80k.description": "MiniMax-M1 是一款開源權重的大型混合注意力推理模型,總參數 4560 億,每個 token 啟用約 459 億。原生支援 100 萬上下文,使用 Flash Attention 技術,在 10 萬 token 生成任務中比 DeepSeek R1 減少 75% FLOPs。採用 MoE 架構、CISPO 與混合注意力強化學習訓練,在長輸入推理與真實軟體工程任務中表現領先。",
@@ -98,6 +99,7 @@
"Phi-3.5-mini-instruct.description": "Phi-3-mini 模型的更新版本。",
"Phi-3.5-vision-instrust.description": "Phi-3-vision 模型的更新版本。",
"Pro/MiniMaxAI/MiniMax-M2.1.description": "MiniMax-M2.1 是一款開源的大型語言模型,專為代理能力進行優化,擅長程式設計、工具使用、指令遵循與長期規劃。該模型支援多語言軟體開發與複雜的多步驟工作流程執行,在 SWE-bench Verified 測試中獲得 74.0 分,並在多語言場景中超越 Claude Sonnet 4.5。",
"Pro/MiniMaxAI/MiniMax-M2.5.description": "MiniMax-M2.5 是 MiniMax 開發的最新大型語言模型,通過在數十萬個複雜的現實環境中進行大規模強化學習訓練。採用 MoE 架構,擁有 2290 億參數,在編程、代理工具調用、搜索和辦公場景等任務中實現業界領先的性能。",
"Pro/Qwen/Qwen2-7B-Instruct.description": "Qwen2-7B-Instruct 是 Qwen2 系列中的一款 70 億參數指令微調大型語言模型。它採用 Transformer 架構,結合 SwiGLU、注意力 QKV 偏置與分組查詢注意力機制,能處理大規模輸入內容。該模型在語言理解、生成、多語言任務、程式碼、數學與推理等方面表現優異,超越多數開源模型,並可與商業模型競爭。在多項基準測試中表現優於 Qwen1.5-7B-Chat。",
"Pro/Qwen/Qwen2.5-7B-Instruct.description": "Qwen2.5-7B-Instruct 是阿里雲最新大型語言模型系列的一部分。此 70 億參數模型在程式碼與數學方面有顯著提升,支援超過 29 種語言,並加強了指令遵循、結構化資料理解與結構化輸出(特別是 JSON)能力。",
"Pro/Qwen/Qwen2.5-Coder-7B-Instruct.description": "Qwen2.5-Coder-7B-Instruct 是阿里雲最新專注於程式碼的語言模型。基於 Qwen2.5 架構並訓練於 5.5 兆詞元上,顯著提升了程式碼生成、推理與修復能力,同時保有數學與通用能力,為開發智能程式代理提供堅實基礎。",
@@ -107,13 +109,13 @@
"Pro/deepseek-ai/DeepSeek-R1-Distill-Qwen-7B.description": "DeepSeek-R1-Distill-Qwen-7B 是從 Qwen2.5-Math-7B 蒸餾而來,並在 80 萬條精選 DeepSeek-R1 數據上微調。其表現優異,在 MATH-500 上達到 92.8%、AIME 2024 為 55.5%CodeForces 評分為 1189,為 7B 模型中的佼佼者。",
"Pro/deepseek-ai/DeepSeek-R1.description": "DeepSeek-R1 是一款以強化學習驅動的推理模型,能減少重複並提升可讀性。透過在強化學習前使用冷啟動資料,進一步增強推理能力,在數學、程式與推理任務上與 OpenAI-o1 表現相當,並透過精心訓練提升整體表現。",
"Pro/deepseek-ai/DeepSeek-V3.1-Terminus.description": "DeepSeek-V3.1-Terminus 是 V3.1 版本的更新模型,定位為混合代理型大型語言模型。修復了用戶回報的問題,提升穩定性與語言一致性,減少中英混雜與異常字符。整合思考與非思考模式,並提供聊天模板以靈活切換。強化了程式代理與搜尋代理的表現,提升工具使用與多步任務的可靠性。",
"Pro/deepseek-ai/DeepSeek-V3.2-Exp.description": "DeepSeek-V3.2-Exp 是 V3.2 的實驗版本,為下一代架構鋪路。在 V3.1-Terminus 基礎上加入 DeepSeek 稀疏注意力(DSA),提升長上下文訓練與推理效率,並針對工具使用、長文檔理解與多步推理進行優化。非常適合探索在大上下文預算下的高效推理能力。",
"Pro/deepseek-ai/DeepSeek-V3.2.description": "DeepSeek-V3.2 是一款結合高計算效率與卓越推理及代理性能的模型。其方法基於三項關鍵技術突破:DeepSeek Sparse Attention (DSA),一種高效的注意力機制,顯著降低計算複雜度並保持模型性能,特別針對長上下文場景進行優化;可擴展的強化學習框架,使模型性能可媲美 GPT-5,其高計算版本在推理能力上可匹敵 Gemini-3.0-Pro;以及大規模代理任務合成管道,旨在將推理能力整合到工具使用場景中,從而提升指令遵循和在複雜交互環境中的泛化能力。該模型在 2025 年國際數學奧林匹克(IMO)和國際信息學奧林匹克(IOI)中獲得金牌表現。",
"Pro/deepseek-ai/DeepSeek-V3.description": "DeepSeek-V3 是一款擁有 6710 億參數的 MoE 模型,採用 MLA 與 DeepSeekMoE 架構,並透過無損負載平衡實現高效推理與訓練。預訓練於 14.8 兆高品質詞元上,並經過 SFT 與強化學習微調,表現超越其他開源模型,接近領先的封閉模型。",
"Pro/moonshotai/Kimi-K2-Instruct-0905.description": "Kimi K2-Instruct-0905 是最新且最強大的 Kimi K2 模型。這是一款頂級的 MoE 模型,總參數達 1 兆,啟用參數為 320 億。其主要特點包括更強的代理式程式設計智能,在基準測試與真實世界代理任務中表現大幅提升,並且前端程式碼的美學與可用性也獲得顯著改善。",
"Pro/moonshotai/Kimi-K2-Thinking.description": "Kimi K2 Thinking Turbo 是 K2 Thinking 的 Turbo 變體,針對推理速度與吞吐量進行優化,同時保留多步推理與工具使用能力。這是一款 MoE 模型,總參數約為 1 兆,原生支援 256K 上下文,並具備穩定的大規模工具調用能力,適用於對延遲與併發有嚴格要求的生產場景。",
"Pro/moonshotai/Kimi-K2.5.description": "Kimi K2.5 是一款原生開源多模態代理模型,基於 Kimi-K2-Base 架構,訓練資料包含約 1.5 兆視覺與文字混合標記。模型採用 MoE 架構,總參數量達 1 兆,啟用參數為 320 億,支援 256K 上下文視窗,實現視覺與語言理解的無縫整合。",
"Pro/zai-org/glm-4.7.description": "GLM-4.7 是智譜推出的新一代旗艦模型,擁有 3550 億總參數與 320 億活躍參數,在通用對話、推理與智能體能力方面全面升級。GLM-4.7 強化了交錯思維,並引入了保留思維與輪次級思維。",
"Pro/zai-org/glm-5.description": "GLM-5 是智譜推出的一代大型語言模型,專注於複雜系統工程和長周期 Agent 任務。模型參數擴展至 744B 參數40B 激活),並集成了 DeepSeek 稀疏注意力技術。",
"Pro/zai-org/glm-5.description": "GLM-5 是智譜推出的一代大型語言模型,專注於複雜系統工程和長時間代理任務。模型參數擴展至 7440 億(活躍參數 400 億),並整合 DeepSeek Sparse Attention。",
"QwQ-32B-Preview.description": "Qwen QwQ 是一個實驗性研究模型,專注於提升推理能力。",
"Qwen/QVQ-72B-Preview.description": "QVQ-72B-Preview 是來自 Qwen 的研究模型,專注於視覺推理,擅長複雜場景理解與視覺數學問題。",
"Qwen/QwQ-32B-Preview.description": "Qwen QwQ 是一個實驗性研究模型,致力於提升 AI 推理能力。",
@@ -137,7 +139,7 @@
"Qwen/Qwen3-14B.description": "Qwen3 是新一代通義千問模型,在推理、通用能力、代理能力與多語言表現方面取得重大突破,並支援思維模式切換。",
"Qwen/Qwen3-235B-A22B-Instruct-2507.description": "Qwen3-235B-A22B-Instruct-2507 是 Qwen3 MoE 系列的旗艦模型,總參數量為 235B,啟用參數為 22B。此版本為更新後的非思考模式,專注於提升指令遵循、邏輯推理、文本理解、數學、科學、程式編寫與工具使用能力。它亦擴展了多語言長尾知識,並更好地對齊使用者在主觀開放任務上的偏好。",
"Qwen/Qwen3-235B-A22B-Thinking-2507.description": "Qwen3-235B-A22B-Thinking-2507 是 Qwen3 系列中專注於高難度複雜推理的模型。採用 MoE 架構,總參數為 235B,每個 token 啟用約 22B 參數以提升效率。作為專用思考模型,在邏輯、數學、科學、程式編寫與學術基準測試中表現卓越,達到頂尖開放式思考水準。它同時提升了指令遵循、工具使用與文本生成能力,並原生支援 256K 上下文長度,適用於深度推理與長文處理。",
"Qwen/Qwen3-235B-A22B.description": "Qwen3 是新一代通義千問模型,在推理能力、通用能力、智能體能力與多語言表現方面有重大突破,並支援思考模式切換。",
"Qwen/Qwen3-235B-A22B.description": "Qwen3 235B A22B 是 Qwen3 超大規模模型,提供頂級 AI 能力。",
"Qwen/Qwen3-30B-A3B-Instruct-2507.description": "Qwen3-30B-A3B-Instruct-2507 是 Qwen3-30B-A3B 的更新版非思考模型。採用 MoE 架構,總參數為 30.5B,啟用參數為 3.3B。顯著提升了指令遵循、邏輯推理、文本理解、數學、科學、程式編寫與工具使用能力,擴展多語言長尾知識,並更好地對齊使用者在主觀開放任務上的偏好。支援 256K 上下文長度。此模型僅支援非思考模式,不會輸出 `<think></think>` 標籤。",
"Qwen/Qwen3-30B-A3B-Thinking-2507.description": "Qwen3-30B-A3B-Thinking-2507 是 Qwen3 系列中最新的思考模型。採用 MoE 架構,總參數為 30.5B,啟用參數為 3.3B,專注於處理複雜任務。在邏輯、數學、科學、程式編寫與學術基準測試中表現顯著提升,並改善了指令遵循、工具使用、文本生成與偏好對齊能力。原生支援 256K 上下文,並可擴展至 1M token。此版本設計為思考模式,具備詳細的逐步推理與強大的智能體能力。",
"Qwen/Qwen3-30B-A3B.description": "Qwen3 是新一代通義千問模型,在推理能力、通用能力、智能體能力與多語言表現方面有重大突破,並支援思考模式切換。",
@@ -315,7 +317,6 @@
"codeqwen.description": "CodeQwen1.5 是一款以大量程式碼資料訓練的大型語言模型,專為處理複雜的程式任務而設計。",
"codestral-latest.description": "Codestral 是我們最先進的程式模型;v2(2025 年 1 月)針對低延遲、高頻率任務如 FIM、程式碼修正與測試生成進行優化。",
"codestral.description": "Codestral 是 Mistral AI 推出的首款程式模型,具備強大的程式碼生成能力。",
"codex-mini-latest.description": "codex-mini-latest 是針對 Codex CLI 微調的 o4-mini 模型。如需直接使用 API,建議從 gpt-4.1 開始。",
"cogito-2.1:671b.description": "Cogito v2.1 671B 是一款美國開源的大型語言模型,可商業使用,效能媲美頂尖模型,具備更高的 Token 推理效率、128k 長上下文能力與整體強大表現。",
"cogview-3-flash.description": "CogView-3-Flash 是智譜推出的免費圖像生成模型。它能根據使用者指令生成符合要求的圖像,同時達到更高的美學品質分數。CogView-3-Flash 主要應用於藝術創作、設計參考、遊戲開發和虛擬現實等領域,幫助使用者快速將文字描述轉換為圖像。",
"cogview-4.description": "CogView-4 是智譜推出的首款開源文字轉圖像模型,支援中文字符生成。它提升了語意理解、圖像品質與中英文文字渲染能力,支援任意長度的雙語提示詞,並可在指定範圍內生成任意解析度的圖像。",
@@ -342,7 +343,7 @@
"command-light-nightly.description": "為縮短主要版本之間的間隔,我們提供 Command 系列的夜間版本。command-light-nightly 是 command-light 系列中最新、最具實驗性(可能不穩定)的版本,會定期更新,建議僅用於測試環境。",
"command-light.description": "Command 的輕量快速版本,功能接近但速度更快。",
"command-nightly.description": "為縮短主要版本之間的間隔,我們提供 Command 系列的夜間版本。command-nightly 是 Command 系列中最新、最具實驗性(可能不穩定)的版本,會定期更新,建議僅用於測試環境。",
"command-r-03-2024.description": "Command R 是一款遵循指令的聊天模型,品質更高、穩定性更強,並具備比早期模型更長的上下文視窗。支援程式碼生成、RAG、工具使用代理等複雜工作流程。",
"command-r-03-2024.description": "command-r 是一款指令跟隨聊天模型,執行語言任務的質量更高、可靠性更強,並支持比以往模型更長的上下文。它支持複雜的工作流程,例如代碼生成、RAG、工具使用代理。",
"command-r-08-2024.description": "command-r-08-2024 是 2024 年 8 月發布的 Command R 模型更新版本。",
"command-r-plus-04-2024.description": "command-r-plus 是 command-r-plus-04-2024 的別名,因此在 API 中使用 command-r-plus 即指向該模型。",
"command-r-plus-08-2024.description": "Command R+ 是一款遵循指令的聊天模型,品質更高、穩定性更強,並具備比前代模型更長的上下文視窗。最適合用於複雜的 RAG 工作流程與多步驟工具使用。",
@@ -366,7 +367,8 @@
"deepseek-ai/DeepSeek-V2.5.description": "DeepSeek-V2.5 升級了 DeepSeek-V2-Chat 與 DeepSeek-Coder-V2-Instruct,融合通用與程式能力。提升寫作與指令遵循能力,偏好對齊更佳,在 AlpacaEval 2.0、ArenaHard、AlignBench 與 MT-Bench 上有顯著進步。",
"deepseek-ai/DeepSeek-V3.1-Terminus.description": "DeepSeek-V3.1-Terminus 是 V3.1 的更新版本,定位為混合智能體大模型。修復用戶回報問題,提升穩定性與語言一致性,減少中英混雜與異常字元。整合思考與非思考模式,支援聊天模板靈活切換。Code Agent 與 Search Agent 表現也獲得提升,工具使用與多步任務更可靠。",
"deepseek-ai/DeepSeek-V3.1.description": "DeepSeek V3.1 採用混合推理架構,支援思考與非思考模式。",
"deepseek-ai/DeepSeek-V3.2-Exp.description": "DeepSeek-V3.2-Exp 是 V3.2 的實驗版本,銜接下一代架構。在 V3.1-Terminus 基礎上加入 DeepSeek Sparse AttentionDSA),提升長上下文訓練與推理效率,並針對工具使用、長文理解與多步推理進行優化,適合探索高效推理與大上下文應用。",
"deepseek-ai/DeepSeek-V3.2-Exp.description": "DeepSeek V3.2 Exp 採用混合推理架構,支持思考模式和非思考模式。",
"deepseek-ai/DeepSeek-V3.2.description": "DeepSeek-V3.2 是一款結合高計算效率與卓越推理及代理性能的模型。其方法基於三項主要技術突破:DeepSeek Sparse Attention (DSA),一種高效的注意力機制,顯著降低計算複雜度並保持模型性能,特別針對長上下文場景進行優化;可擴展的強化學習框架,使模型性能可媲美 GPT-5,其高計算版本在推理能力上可媲美 Gemini-3.0-Pro;以及大規模代理任務合成管道,旨在將推理能力整合到工具使用場景中,從而提升指令遵循和在複雜交互環境中的泛化能力。該模型在 2025 年國際數學奧林匹克(IMO)和國際信息學奧林匹克(IOI)中獲得金牌表現。",
"deepseek-ai/DeepSeek-V3.description": "DeepSeek-V3 是一款擁有 671B 參數的 MoE 模型,採用 MLA 與 DeepSeekMoE 架構,具備無損負載平衡,訓練與推理效率高。預訓練資料達 14.8T 高品質 token,並經過 SFT 與 RL 微調,表現超越其他開源模型,接近封閉模型領先水準。",
"deepseek-ai/deepseek-llm-67b-chat.description": "DeepSeek LLM Chat67B)是一款創新模型,具備深層語言理解與互動能力。",
"deepseek-ai/deepseek-v3.1-terminus.description": "DeepSeek V3.1 是新一代推理模型,具備更強的複雜推理與思維鏈能力,適用於深度分析任務。",
@@ -433,6 +435,7 @@
"deepseek_r1_distill_llama_70b.description": "DeepSeek-R1-Distill-Llama-70B 是從 Llama-3.3-70B-Instruct 精煉而來。作為 DeepSeek-R1 系列的一部分,該模型以 DeepSeek-R1 生成樣本進行微調,在數學、程式設計與推理方面表現出色。",
"deepseek_r1_distill_qwen_14b.description": "DeepSeek-R1-Distill-Qwen-14B 是從 Qwen2.5-14B 精煉而來,並以 DeepSeek-R1 生成的 80 萬條精選樣本進行微調,展現強大推理能力。",
"deepseek_r1_distill_qwen_32b.description": "DeepSeek-R1-Distill-Qwen-32B 是從 Qwen2.5-32B 精煉而來,並以 DeepSeek-R1 生成的 80 萬條精選樣本進行微調,在數學、程式設計與推理方面表現卓越。",
"devstral-2512.description": "Devstral 2 是一款企業級文本模型,擅長使用工具探索代碼庫、編輯多個文件並驅動軟件工程代理。",
"devstral-2:123b.description": "Devstral 2 123B 擅長使用工具探索程式碼庫、編輯多個檔案,並支援軟體工程代理人。",
"doubao-1.5-lite-32k.description": "Doubao-1.5-lite 是一款全新輕量級模型,具備極速回應能力,提供頂級品質與低延遲表現。",
"doubao-1.5-pro-256k.description": "Doubao-1.5-pro-256k 是 Doubao-1.5-Pro 的全面升級版,整體效能提升 10%。支援 256k 上下文視窗與最多 12k 輸出字元,提供更高效能、更大視窗與更廣泛應用價值。",
@@ -546,10 +549,10 @@
"gemini-2.5-pro-preview-06-05.description": "Gemini 2.5 Pro Preview 是 Google 最先進的推理模型,能處理程式碼、數學與 STEM 問題,並分析大型資料集、程式碼庫與長篇文件。",
"gemini-2.5-pro.description": "Gemini 2.5 Pro 是 Google 的旗艦推理模型,支援長上下文,適用於處理複雜任務。",
"gemini-3-flash-preview.description": "Gemini 3 Flash 是一款以速度為核心的智慧模型,結合尖端智能與卓越的搜尋基礎能力。",
"gemini-3-pro-image-preview.description": "Gemini 3 Pro ImageNano Banana Pro是 Google 的像生成模型,支援多模態對話。",
"gemini-3-pro-image-preview.description": "Gemini 3 Pro Image (Nano Banana Pro) 是 Google 的像生成模型,亦支持多模態對話。",
"gemini-3-pro-image-preview:image.description": "Gemini 3 Pro ImageNano Banana Pro)是 Google 的圖像生成模型,同時支援多模態對話功能。",
"gemini-3-pro-preview.description": "Gemini 3 Pro 是 Google 最強大的智能代理與情境編碼模型,具備頂尖推理能力、豐富視覺表現與深度互動。",
"gemini-3.1-flash-image-preview.description": "Gemini 3.1 Flash ImageNano Banana 2)以閃電速度提供專業級圖像質量,並支持多模態聊天。",
"gemini-3.1-flash-image-preview.description": "Gemini 3.1 Flash Image (Nano Banana 2) 是 Google 最快的原生影像生成模型,支持思考、對話式影像生成與編輯。",
"gemini-3.1-flash-image-preview:image.description": "Gemini 3.1 Flash ImageNano Banana 2)以閃電速度提供專業級圖像質量,並支持多模態聊天。",
"gemini-3.1-pro-preview.description": "Gemini 3.1 Pro Preview 在 Gemini 3 Pro 的基礎上增強了推理能力,並新增了中等思考層級支持。",
"gemini-flash-latest.description": "Gemini Flash 最新版本",
@@ -605,19 +608,15 @@
"google/gemini-2.0-flash-lite-001.description": "Gemini 2.0 Flash Lite 是輕量版 Gemini,預設關閉思考功能以降低延遲與成本,但可透過參數啟用。",
"google/gemini-2.0-flash-lite.description": "Gemini 2.0 Flash Lite 提供新一代功能,包括極速處理、內建工具使用、多模態生成,以及 100 萬 token 的上下文視窗。",
"google/gemini-2.0-flash.description": "Gemini 2.0 Flash 是 Google 的高效能推理模型,適用於延伸多模態任務。",
"google/gemini-2.5-flash-image-free.description": "Gemini 2.5 Flash Image 免費層,支援有限配額的多模態生成。",
"google/gemini-2.5-flash-image-preview.description": "Gemini 2.5 Flash 實驗模型,支援圖像生成。",
"google/gemini-2.5-flash-image.description": "Gemini 2.5 Flash ImageNano Banana)是 Google 的圖像生成模型,支援多模態對話。",
"google/gemini-2.5-flash-lite.description": "Gemini 2.5 Flash Lite 是 Gemini 2.5 的輕量版本,針對延遲與成本進行優化,適合高吞吐量場景。",
"google/gemini-2.5-flash-preview.description": "Gemini 2.5 Flash 是 Google 最先進的旗艦模型,專為高階推理、程式設計、數學與科學任務打造。內建「思考」功能,能提供更高準確度與更細緻的上下文處理。\n\n注意:此模型有兩種變體——思考與非思考。啟用思考功能會產生額外費用。若選擇標準版本(無「:thinking」後綴),模型將避免生成思考 token。\n\n若需使用思考功能並接收思考 token,請選擇「:thinking」變體,將產生較高的輸出費用。\n\nGemini 2.5 Flash 亦可透過「max reasoning tokens」參數進行配置,詳見文件:https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning。",
"google/gemini-2.5-flash-preview:thinking.description": "Gemini 2.5 Flash 是 Google 最先進的旗艦模型,專為高階推理、程式設計、數學與科學任務打造。內建「思考」功能,能提供更高準確度與更細緻的上下文處理。\n\n注意:此模型有兩種變體——思考與非思考。啟用思考功能會產生額外費用。若選擇標準版本(無「:thinking」後綴),模型將避免生成思考 token。\n\n若需使用思考功能並接收思考 token,請選擇「:thinking」變體,將產生較高的輸出費用。\n\nGemini 2.5 Flash 亦可透過「max reasoning tokens」參數進行配置,詳見文件:https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning。",
"google/gemini-2.5-flash.description": "Gemini 2.5 FlashLite/Pro/Flash是 Google 的模型家族,涵蓋低延遲至高效能推理應用。",
"google/gemini-2.5-pro-free.description": "Gemini 2.5 Pro 免費層提供有限配額的多模態長上下文支援,適合試用與輕量工作流程。",
"google/gemini-2.5-flash.description": "Gemini 2.5 Flash 是 Google 的家族模型,涵蓋低延遲到高性能推理。",
"google/gemini-2.5-pro-preview.description": "Gemini 2.5 Pro Preview 是 Google 最先進的思考模型,適用於程式碼、數學與 STEM 領域的複雜推理,並能分析大型資料集、程式碼庫與長文件。",
"google/gemini-2.5-pro.description": "Gemini 2.5 Pro 是 Google 的旗艦推理模型,支援長上下文處理,適用於複雜任務。",
"google/gemini-3-pro-image-preview-free.description": "Gemini 3 Pro Image 免費層,支援有限配額的多模態生成。",
"google/gemini-3-pro-image-preview.description": "Gemini 3 Pro ImageNano Banana Pro)是 Google 的圖像生成模型,支援多模態對話。",
"google/gemini-3-pro-preview-free.description": "Gemini 3 Pro Preview 免費版具備與標準版相同的多模態理解與推理能力,但有配額與速率限制,適合試用與低頻使用。",
"google/gemini-3-pro-preview.description": "Gemini 3 Pro 是 Gemini 家族的次世代多模態推理模型,能理解文字、音訊、圖像與影片,處理複雜任務與大型程式碼庫。",
"google/gemini-embedding-001.description": "一款最先進的嵌入模型,在英文、多語言與程式任務中表現優異。",
"google/gemini-flash-1.5.description": "Gemini 1.5 Flash 提供針對複雜任務的多模態處理最佳化。",
@@ -717,15 +716,24 @@
"hunyuan-a13b.description": "混合推理模型 Hunyuan-A13B,從 hunyuan-standard-256K(總參數 800 億,活躍參數 130 億)升級而來。預設為慢思考模式,並可透過參數或前綴 /no_think 切換快/慢思考。整體能力較前代大幅提升,特別是在數學、科學、長文本理解與智能體任務方面。",
"hunyuan-code.description": "Hunyuan 最新的代碼模型,基於 200B 高質量代碼數據和六個月的 SFT 數據訓練,支持 8K 上下文。在自動化代碼基準測試和五種語言的專家人工評估中排名靠前。",
"hunyuan-functioncall.description": "Hunyuan 最新的 MoE FunctionCall 模型,基於高質量工具調用數據訓練,支持 32K 上下文窗口,在多維度基準測試中表現領先。",
"hunyuan-large-longcontext.description": "擅長長文檔任務,例如摘要和問答,同時也能處理一般生成。對於複雜、詳細內容的長文本分析和生成表現出色。",
"hunyuan-large.description": "Hunyuan-large 擁有約 3890 億總參數和約 520 億活躍參數,是基於 Transformer 架構的最大最強開源 MoE 模型。",
"hunyuan-lite.description": "升級為 MoE 架構,支援 256K 上下文視窗,在 NLP、程式碼、數學與產業基準測試中領先多數開源模型。",
"hunyuan-pro.description": "兆級參數 MOE-32K 長上下文模型,在複雜指令與推理、高階數學、函數調用方面表現優異,並針對多語翻譯、金融、法律與醫療領域進行優化。",
"hunyuan-role.description": "Hunyuan 最新的角色扮演模型,經過角色扮演數據的正式微調,在角色扮演場景中提供更強的基礎性能。",
"hunyuan-standard-256K.description": "使用改進的路由技術來緩解負載平衡和專家崩潰問題。長文本“海底撈針”達到 99.9%。MOE-256K 在長度和質量上更進一步,大幅擴展輸入長度。",
"hunyuan-standard.description": "使用改進的路由技術來緩解負載平衡和專家崩潰問題。長文本“海底撈針”達到 99.9%。MOE-32K 在平衡質量和價格的同時提供更高的價值。",
"hunyuan-standard-256K.description": "使用改進的路由技術以減輕負載平衡和專家崩潰問題。MOE-256K 進一步擴展了上下文長度和質量,實現了 99.9% 的「大海撈針」精準度。",
"hunyuan-standard.description": "使用改進的路由技術以減輕負載平衡和專家崩潰問題。MOE-32K 提供強大的價值,同時能處理長輸入。",
"hunyuan-t1-20250321.description": "在藝術與 STEM 能力之間建立平衡,具備強大的長文本信息捕捉能力。支持數學、邏輯、科學和代碼問題的推理回答,涵蓋各種難度級別。",
"hunyuan-t1-20250403.description": "改進項目級代碼生成和寫作質量,加強多輪主題理解和 ToB 指令遵循,提升詞彙理解能力,減少簡繁混合及中英文輸出問題。",
"hunyuan-t1-20250529.description": "提升創意寫作與構思能力,加強前端編程、數學和邏輯推理,並增強指令遵循能力。",
"hunyuan-t1-20250711.description": "大幅提升高難度數學、邏輯和編程能力,增強輸出穩定性,並提升長文本處理能力。",
"hunyuan-t1-latest.description": "顯著提升慢思考模型在高難度數學、複雜推理、困難編碼、指令遵循與創意寫作品質方面的表現。",
"hunyuan-t1-vision-20250916.description": "最新 t1-vision 深度推理模型,在 VQA、視覺對齊、OCR、圖表、拍照題解與圖像創作方面有重大突破,並強化英文與低資源語言能力。",
"hunyuan-turbo-20241223.description": "此版本提升指令擴展能力以改善泛化性能,顯著增強數學/代碼/邏輯推理能力,提升詞彙理解能力並改善寫作質量。",
"hunyuan-turbo-latest.description": "在 NLP 理解、寫作、聊天、問答、翻譯及領域方面的整體體驗改進;提供更具人性化的回應,對模糊意圖的澄清更佳,提升詞彙解析能力、更高的創意質量與互動性,以及更強的多輪對話能力。",
"hunyuan-turbo.description": "混元下一代大型語言模型預覽版,採用全新 MoE 架構,推理速度更快,整體表現超越 hunyuan-pro。",
"hunyuan-turbos-latest.description": "最新混元 TurboS 旗艦模型,推理能力更強,整體體驗更佳。",
"hunyuan-turbos-longtext-128k-20250325.description": "擅長長文檔任務,例如摘要和問答,同時也能處理一般生成。對於複雜、詳細內容的長文本分析和生成表現出色。",
"hunyuan-vision-1.5-instruct.description": "基於 TurboS 文本基礎構建的快速思考圖像轉文本模型,與上一版本相比,在基礎圖像識別和圖像分析推理方面有顯著改進。",
"hunyuan-vision.description": "Hunyuan 最新的多模態模型,支持圖像+文本輸入以生成文本。",
"image-01-live.description": "一款具備精細細節的圖像生成模型,支援文字轉圖像與可控風格預設。",
@@ -770,8 +778,7 @@
"kimi-k2:1t.description": "Kimi K2 是 Moonshot AI 推出的大型 MoE 語言模型,總參數達 1 兆,每次前向傳遞啟用 320 億參數。針對代理能力進行最佳化,包括進階工具使用、推理與程式碼生成。",
"kimi-latest.description": "Kimi Latest 採用最新版本的 Kimi 模型,可能包含實驗性功能。支援圖像理解,並根據上下文長度自動選擇 8k/32k/128k 計費模型。",
"kuaishou/kat-coder-pro-v1.description": "KAT-Coder-Pro-V1(限時免費)專注於程式碼理解與自動化,提升程式代理效率。",
"learnlm-1.5-pro-experimental.description": "LearnLM 是一款實驗性任務導向模型,基於學習科學原則訓練,能在教學/學習場景中遵循系統指令,扮演專業導師角色。",
"learnlm-2.0-flash-experimental.description": "LearnLM 是一款實驗性任務導向模型,基於學習科學原則訓練,能在教學/學習場景中遵循系統指令,扮演專業導師角色。",
"labs-devstral-small-2512.description": "Devstral Small 2 擅長使用工具探索代碼庫、編輯多個文件並驅動軟件工程代理。",
"lite.description": "Spark Lite 是一款輕量級語言模型,具備超低延遲與高效處理能力,完全免費,支援即時網頁搜尋。其快速回應在低算力設備與模型微調場景中表現優異,特別適用於知識問答、內容生成與搜尋應用。",
"llama-3.1-70b-versatile.description": "Llama 3.1 70B 提供更強的 AI 推理能力,適用於複雜應用,支援高效能運算與高準確度。",
"llama-3.1-8b-instant.description": "Llama 3.1 8B 是一款高效率模型,具備快速文字生成能力,適合大規模、具成本效益的應用場景。",
@@ -782,7 +789,6 @@
"llama-3.2-90b-vision-preview.description": "Llama 3.2 專為結合視覺與文字任務設計,擅長圖像描述與視覺問答,實現語言生成與視覺推理的橋接。",
"llama-3.2-vision-instruct.description": "Llama 3.2-Vision 指令微調模型針對視覺辨識、圖像推理、圖像描述與一般圖像問答進行最佳化。",
"llama-3.3-70b-versatile.description": "Meta Llama 3.3 是一款多語言大型語言模型,擁有 700 億參數(文字輸入/輸出),提供預訓練與指令微調版本。文字專用指令微調模型針對多語言對話進行最佳化,在多項業界基準測試中超越多數開放與封閉對話模型。",
"llama-3.3-70b.description": "Llama 3.3 70B:中大型 Llama 模型,在推理能力與處理效率間取得平衡。",
"llama-3.3-instruct.description": "Llama 3.3 指令微調模型針對對話進行最佳化,在多項業界基準測試中超越多數開源對話模型。",
"llama3-70b-8192.description": "Meta Llama 3 70B 具備卓越的複雜任務處理能力,適用於高需求專案。",
"llama3-8b-8192.description": "Meta Llama 3 8B 在多樣化場景中展現強大的推理能力。",
@@ -832,7 +838,6 @@
"meta-llama/llama-3.1-8b-instruct:free.description": "LLaMA 3.1 提供多語言支援,是領先的生成式模型之一。",
"meta-llama/llama-3.2-11b-vision-instruct.description": "LLaMA 3.2 專為結合視覺與文字的任務設計,擅長圖像描述與視覺問答,連結語言生成與視覺推理。",
"meta-llama/llama-3.2-3b-instruct.description": "meta-llama/llama-3.2-3b-instruct",
"meta-llama/llama-3.2-90b-vision-instruct.description": "LLaMA 3.2 專為結合視覺與文字的任務設計,擅長圖像描述與視覺問答,連結語言生成與視覺推理。",
"meta-llama/llama-3.3-70b-instruct.description": "Llama 3.3 是最先進的多語言開源 Llama 模型,以極低成本提供接近 405B 的效能。基於 Transformer 架構,並透過 SFT 與 RLHF 提升實用性與安全性。指令微調版本針對多語言對話進行優化,在業界基準測試中超越多數開源與封閉模型。知識截止時間:2023 年 12 月。",
"meta-llama/llama-3.3-70b-instruct:free.description": "Llama 3.3 是最先進的多語言開源 Llama 模型,以極低成本提供接近 405B 的效能。基於 Transformer 架構,並透過 SFT 與 RLHF 提升實用性與安全性。指令微調版本針對多語言對話進行優化,在業界基準測試中超越多數開源與封閉模型。知識截止時間:2023 年 12 月。",
"meta.llama3-1-405b-instruct-v1:0.description": "Meta Llama 3.1 405B Instruct 是 Llama 3.1 Instruct 系列中最大且最強的模型,專為對話推理與合成資料生成設計,亦是領域特定持續預訓練或微調的強大基礎。Llama 3.1 多語言 LLM 系列包含 8B、70B 與 405B 模型,經過預訓練與指令微調,優化多語言對話,並在多項業界基準中超越其他開源聊天模型。Llama 3.1 適用於商業與研究用途,指令微調模型適合助理型對話,預訓練模型則適用於更廣泛的自然語言生成任務。其輸出亦可用於改進其他模型,包括合成資料生成與優化。Llama 3.1 採用自回歸 Transformer 架構,經由監督式微調(SFT)與人類回饋強化學習(RLHF)對齊人類偏好,提升有用性與安全性。",
@@ -894,7 +899,7 @@
"mistral-large-instruct.description": "Mistral-Large-Instruct-2407 是一款擁有 123B 參數的先進密集型大型語言模型,具備頂尖的推理、知識與編碼能力。",
"mistral-large-latest.description": "Mistral Large 是旗艦模型,擅長多語言任務、複雜推理與代碼生成,適用於高端應用場景。",
"mistral-large.description": "Mixtral Large 是 Mistral 的旗艦模型,結合代碼生成、數學與推理能力,支援 128K 上下文視窗。",
"mistral-medium-latest.description": "Mistral Medium 3 以 8 倍成本效益提供同級最佳效能,簡化企業部署流程。",
"mistral-medium-latest.description": "Mistral Medium 3.1 以 8 倍更低成本提供最先進性能,簡化企業部署。",
"mistral-nemo-instruct.description": "Mistral-Nemo-Instruct-2407 是 Mistral-Nemo-Base-2407 的指令微調版本。",
"mistral-nemo.description": "Mistral Nemo 是 Mistral AI 與 NVIDIA 推出的高效能 12B 模型。",
"mistral-small-latest.description": "Mistral Small 是翻譯、摘要與情感分析等任務的高效、快速且可靠選擇。",
@@ -933,7 +938,7 @@
"moonshot-v1-auto.description": "Moonshot V1 Auto 會根據當前上下文 token 使用情況自動選擇合適模型。",
"moonshotai/Kimi-Dev-72B.description": "Kimi-Dev-72B 是一款開源程式語言模型,透過大規模強化學習優化,可產出穩健、可用於生產環境的修補程式。其在 SWE-bench Verified 測試中取得 60.4% 的成績,創下自動化軟體工程任務(如除錯與程式碼審查)的開源模型新紀錄。",
"moonshotai/Kimi-K2-Instruct-0905.description": "Kimi K2-Instruct-0905 是最新且最強大的 Kimi K2 模型。這是一款頂級 MoE 模型,總參數達 1 兆,啟用參數為 320 億。其特色包括更強的代理式程式智能,在基準測試與真實任務中表現卓越,並提升前端程式美學與可用性。",
"moonshotai/Kimi-K2-Thinking.description": "Kimi K2 Thinking 是最新且最強大的開源推理模型。大幅提升多步推理深度,並在 200300 次連續調用中穩定使用工具,在 Humanity's Last Exam (HLE)、BrowseComp 等基準測試中創下新紀錄。擅長程式設計、數學、邏輯與智能代理場景。採用 MoE 架構,總參數約為 1 兆,支 256K 上下文視窗與工具調用。",
"moonshotai/Kimi-K2-Thinking.description": "Kimi K2 Thinking 是最新且最強大的開源思考模型。大幅延展多步推理深度,並在 200–300 次連續調用中保持穩定的工具使用,創下 Humanity's Last Exam (HLE)、BrowseComp 等基準新紀錄。擅長程、數學、邏輯代理場景。基於 MoE 架構,擁有約 1T 總參數,支 256K 上下文窗口及工具調用。",
"moonshotai/kimi-k2-0711.description": "Kimi K2 0711 是 Kimi 系列中的指令變體,適用於高品質程式碼生成與工具使用。",
"moonshotai/kimi-k2-0905.description": "Kimi K2 0905 是一項更新,提升了上下文擴展與推理效能,並優化了程式碼能力。",
"moonshotai/kimi-k2-instruct-0905.description": "kimi-k2-0905-preview 模型支援 256K 上下文視窗,具備更強的智能代理程式設計能力、更精緻實用的前端程式碼,以及更佳的上下文理解。",
@@ -948,8 +953,8 @@
"nvidia/Llama-3.1-Nemotron-70B-Instruct-HF.description": "Llama 3.1 Nemotron 70B 是 NVIDIA 客製化的大型語言模型,旨在提升回應的有用性。於 2024 年 10 月 1 日,在 Arena Hard、AlpacaEval 2 LC 和 GPT-4-Turbo MT-Bench 三項自動對齊基準測試中皆排名第一。該模型基於 Llama-3.1-70B-Instruct,並透過 RLHFREINFORCE)、Llama-3.1-Nemotron-70B-Reward 與 HelpSteer2-Preference 提示進行訓練。",
"nvidia/llama-3.1-nemotron-51b-instruct.description": "一款具備卓越準確性與效率的獨特語言模型。",
"nvidia/llama-3.1-nemotron-70b-instruct.description": "Llama-3.1-Nemotron-70B-Instruct 是 NVIDIA 客製化模型,旨在提升大型語言模型回應的有用性。",
"o1-mini.description": "o1-preview 更小更快,成本降低 80%,擅長程式碼生成與短上下文任務。",
"o1-preview.description": "專注於進階推理與複雜問題解決,包括數學與科學。適用於需要深度上下文理解與自主工作流程的應用場景。",
"o1-mini.description": "o1-mini 是一款快速且具成本效益的推理模型,專為編程、數學和科學設計。擁有 128K 上下文及 2023 年 10 月的知識截止。",
"o1-preview.description": "o1 是 OpenAI 的新推理模型,適用於需要廣泛知識的複雜任務。擁有 128K 上下文及 2023 年 10 月的知識截止。",
"o1-pro.description": "o1 系列透過強化學習訓練,具備先思考再作答的能力,能處理複雜推理任務。o1-pro 使用更多運算資源以進行更深入思考,並穩定提供更高品質的回答。",
"o1.description": "o1 是 OpenAI 的新一代推理模型,支援文字與圖像輸入、文字輸出,適用於需要廣泛知識的複雜任務。具備 200K 上下文視窗,知識截止於 2023 年 10 月。",
"o3-2025-04-16.description": "o3 是 OpenAI 的新一代推理模型,支援文字與圖像輸入、文字輸出,適用於需要廣泛知識的複雜任務。",
@@ -1022,7 +1027,6 @@
"qianfan-check-vl.description": "千帆 Check VL 是一款多模態內容審核模型,支援圖文合規與識別任務。",
"qianfan-composition.description": "千帆 Composition 是一款多模態創作模型,支援圖文混合理解與生成。",
"qianfan-engcard-vl.description": "千帆 EngCard VL 是一款聚焦英語場景的多模態識別模型。",
"qianfan-lightning-128b-a19b.description": "千帆 Lightning 128B A19B 是一款高效能中文通用模型,適用於複雜問答與大規模推理任務。",
"qianfan-llama-vl-8b.description": "千帆 Llama VL 8B 是基於 Llama 的多模態模型,支援通用圖文理解。",
"qianfan-multipicocr.description": "千帆 MultiPicOCR 是一款多圖像 OCR 模型,支援跨圖像的文字檢測與識別。",
"qianfan-qi-vl.description": "千帆 QI VL 是一款多模態問答模型,適用於複雜圖文場景中的精準檢索與問答。",
@@ -1032,7 +1036,6 @@
"qvq-72b-preview.description": "QVQ-72B-Preview 是 Qwen 推出的實驗性研究模型,專注於提升視覺推理能力。",
"qvq-max.description": "Qwen QVQ 視覺推理模型支援視覺輸入與思維鏈式輸出,在數學、程式碼、視覺分析、創意與通用任務中表現更強。",
"qvq-plus.description": "具備視覺輸入與思維鏈式輸出的視覺推理模型。qvq-plus 系列延續 qvq-max,提供更快速的推理能力與更佳的品質成本平衡。",
"qwen-3-32b.description": "Qwen 3 32B:擅長多語言與程式碼任務,適合中型規模的生產應用。",
"qwen-coder-plus.description": "Qwen 程式碼模型。",
"qwen-coder-turbo-latest.description": "Qwen 程式碼模型。",
"qwen-coder-turbo.description": "Qwen 程式碼模型。",
@@ -1128,7 +1131,6 @@
"qwen3-coder-next.description": "下一代 Qwen 編碼器,針對複雜的多文件代碼生成、調試和高吞吐量代理工作流進行了優化。設計上強調工具集成和推理性能的提升。",
"qwen3-coder-plus.description": "Qwen 程式碼模型。最新的 Qwen3-Coder 系列基於 Qwen3,具備強大的程式代理能力、工具使用與環境互動能力,支援自主編程,程式碼表現優異,通用能力穩健。",
"qwen3-coder:480b.description": "阿里巴巴推出的高效能長上下文模型,適用於代理與程式任務。",
"qwen3-max-2026-01-23.description": "Qwen3 Max 系列在通用能力、中英文理解、複雜指令執行、主觀開放任務、多語言能力與工具使用方面相較 2.5 系列有大幅提升,幻覺更少。最新版本在代理程式設計與工具使用方面優於 qwen3-max-preview,達到領域 SOTA,針對更複雜的代理需求而設計。",
"qwen3-max-preview.description": "Qwen 最佳效能模型,適用於複雜多步驟任務。預覽版本支援思考能力。",
"qwen3-max.description": "Qwen3 Max 模型在通用能力、中文/英文理解、複雜指令遵循、主觀開放任務、多語言能力與工具使用方面,相較 2.5 系列有大幅提升,且幻覺更少。最新版本在代理編程與工具使用方面優於 qwen3-max-preview。此版本達到領先水準,針對更複雜的代理需求設計。",
"qwen3-next-80b-a3b-instruct.description": "下一代 Qwen3 非思考開源模型。相較前代(Qwen3-235B-A22B-Instruct-2507),具備更佳中文理解、更強邏輯推理與更優文本生成能力。",
@@ -1145,7 +1147,8 @@
"qwen3-vl-flash.description": "Qwen3 VL Flash:輕量高速推理版本,適用於對延遲敏感或高頻請求場景。",
"qwen3-vl-plus.description": "Qwen VL 是一款具備視覺理解能力的文字生成模型,能進行文字辨識(OCR)、摘要與推理,例如從商品圖片中提取屬性或解決圖像問題。",
"qwen3.5-397b-a17b.description": "支持文本、圖像和視頻輸入。對於僅文本任務,其性能可與 Qwen3 Max 媲美,效率更高且成本更低。在多模態能力方面,與 Qwen3 VL 系列相比有顯著提升。",
"qwen3.5-plus.description": "Qwen3.5 Plus 支持文本、像和視頻輸入。對於僅文本任務,其性能可 Qwen3 Max 媲美,同時提供更高的效率和更低成本。多模態能力方面,與 Qwen3 VL 系列相比有顯著提升。",
"qwen3.5-plus.description": "Qwen3.5 Plus 支持文本、像和視頻輸入。在純文本任務上的性能可媲美 Qwen3 Max,並具備更佳性能及更低成本。多模態能力相比 Qwen3 VL 系列有顯著提升。",
"qwen3.5:397b.description": "Qwen3.5 是一款統一的視覺-語言基礎模型,採用混合架構(專家混合 + 線性注意力),提供強大的多模態推理、編程及長上下文能力,支持 256K 上下文窗口。",
"qwen3.description": "Qwen3 是阿里巴巴新一代大型語言模型,在多種應用場景中展現出強大效能。",
"qwq-32b-preview.description": "QwQ 是 Qwen 的實驗性研究模型,專注於推理能力的提升。",
"qwq-32b.description": "QwQ 是 Qwen 系列中的推理模型。相較於標準指令微調模型,它具備更強的思考與推理能力,顯著提升下游任務表現,特別是在處理複雜問題時。QwQ-32B 是中型推理模型,表現可媲美 DeepSeek-R1 與 o1-mini 等頂尖模型。",
@@ -1187,7 +1190,7 @@
"step-2-16k.description": "支援大上下文互動,適合複雜對話場景。",
"step-2-mini.description": "基於新一代自研 MFA 注意力架構,提供類似 Step-1 的效能,成本更低、吞吐更高、延遲更低。具備強大程式能力,適用於通用任務。",
"step-2x-large.description": "新一代 StepFun 圖像模型,專注於文字提示圖像生成,能產出高品質圖像,具備更真實的質感與更強的中英文文字渲染能力。",
"step-3.5-flash.description": "Stepfun 的旗艦語言推理模型。該模型提供頂級推理能力及快速可靠的執行。能分解規劃複雜任務,快速可靠地調用工具執行,並在邏輯推理、數學、軟件工程、深度研究等高級任務中表現出色。上下文長度為 256K。",
"step-3.5-flash.description": "Stepfun 的旗艦語言推理模型。該模型具備頂級推理能力及快速可靠的執行能力。能分解規劃複雜任務,快速可靠地調用工具執行任務,並勝任邏輯推理、數學、軟件工程及深入研究等各種複雜任務。",
"step-3.description": "此模型具備強大的視覺感知與複雜推理能力,能準確處理跨領域知識理解、數學與視覺交叉分析,以及多種日常視覺分析任務。",
"step-r1-v-mini.description": "具備強大圖像理解能力的推理模型,能處理圖像與文字,並在深度推理後生成文字。擅長視覺推理,在數學、程式碼與文字推理方面表現頂尖,支援 100K 上下文。",
"stepfun-ai/step3.description": "Step3 是 StepFun 推出的尖端多模態推理模型,採用 MoE 架構,總參數 321B,啟用參數 38B。其端到端設計降低解碼成本,實現頂級視覺語言推理能力。透過 MFA 與 AFD 設計,在旗艦與低階加速器上皆具高效能。預訓練涵蓋超過 20 兆文字與 4 兆圖文資料,支援多語言,於數學、程式與多模態基準測試中表現領先。",
@@ -1276,10 +1279,11 @@
"z-ai/glm4.7.description": "GLM-4.7 是智譜最新的旗艦模型,針對代理編碼場景進行了增強,提升了編碼能力。",
"z-ai/glm5.description": "GLM-5 是智譜 AI 的新一代旗艦基礎模型,在編碼和代理能力方面實現了開源 SOTA 性能,與 Claude Opus 4.5 的性能相當。",
"z-image-turbo.description": "Z-Image 是一款輕量級文本生成圖像模型,能快速生成圖像,支持中英文文本渲染,並靈活適應多種分辨率和長寬比。",
"zai-glm-4.7.description": "此模型提供強大的編程性能,具備先進的推理能力、卓越的工具使用能力,以及在代理編程應用中的增強現實世界性能。",
"zai-org/GLM-4.5-Air.description": "GLM-4.5-Air 是一款基於專家混合架構的代理應用基礎模型,針對工具使用、網頁瀏覽、軟體工程與前端編碼進行優化,並可與 Claude Code、Roo Code 等程式代理整合。採用混合推理處理複雜與日常任務。",
"zai-org/GLM-4.5.description": "GLM-4.5 是一款基於專家混合架構的代理應用基礎模型,深度優化工具使用、網頁瀏覽、軟體工程與前端編碼,並可與 Claude Code、Roo Code 等程式代理整合。採用混合推理處理複雜與日常任務。",
"zai-org/GLM-4.5V.description": "GLM-4.5V 是智譜 AI 最新 VLM,基於 GLM-4.5-Air 旗艦文本模型(總參數 106B,啟用 12B),採用 MoE 架構,在成本較低的情況下提供強大效能。延續 GLM-4.1V-Thinking 路線,加入 3D-RoPE 提升三維空間推理能力。透過預訓練、SFT 與強化學習優化,支援圖像、影片與長文檔,在 41 項公開多模態基準中名列前茅。提供「思考模式」切換,讓用戶在速度與深度間取得平衡。",
"zai-org/GLM-4.6.description": "相較於 GLM-4.5GLM-4.6 將上下文從 128K 擴展至 200K,適用於更複雜的代理任務。在程式碼基準上得分更高,並在 Claude Code、Cline、Roo Code、Kilo Code 等應用中展現更強的實際效能,包括更佳的前端頁面生成。推理能力提升,推理過程中支援工具使用,整體能力更強。更好地整合至代理框架,強化工具/搜尋代理,並具備更符合人類偏好的寫作風格與角色扮演自然度。",
"zai-org/GLM-4.6V.description": "GLM-4.6V 在視覺理解精度上達到同參數規模的 SOTA,並首次在模型架構中將 Function Call(工具調用)能力原生融入視覺模型,打通從「視覺感知」到「可執行行動(Action)」的鏈路,為真實業務場景中的多模態代理提供統一的技術基礎。",
"zai/glm-4.5-air.description": "GLM-4.5 與 GLM-4.5-Air 是我們針對代理應用推出的最新旗艦模型,皆採用 MoE 架構。GLM-4.5 總參數 355B,啟用 32BGLM-4.5-Air 較輕量,總參數 106B,啟用 12B。",
"zai/glm-4.5.description": "GLM-4.5 系列專為代理設計。旗艦版 GLM-4.5 結合推理、編碼與代理能力,總參數 355B(啟用 32B),提供混合推理系統的雙模式運行。",
"zai/glm-4.5v.description": "GLM-4.5V 建構於 GLM-4.5-Air 基礎上,延續 GLM-4.1V-Thinking 技術,並以強大的 106B MoE 架構擴展能力。",
+14
View File
@@ -24,6 +24,20 @@
"builtins.lobe-agent-builder.inspector.noResults": "沒有結果",
"builtins.lobe-agent-builder.inspector.togglePlugin": "切換",
"builtins.lobe-agent-builder.title": "Agent 建構器",
"builtins.lobe-agent-management.apiName.callAgent": "呼叫代理",
"builtins.lobe-agent-management.apiName.createAgent": "建立代理",
"builtins.lobe-agent-management.apiName.deleteAgent": "刪除代理",
"builtins.lobe-agent-management.apiName.searchAgent": "搜尋代理",
"builtins.lobe-agent-management.apiName.updateAgent": "更新代理",
"builtins.lobe-agent-management.inspector.callAgent.sync": "呼叫中:",
"builtins.lobe-agent-management.inspector.callAgent.task": "指派任務至:",
"builtins.lobe-agent-management.inspector.createAgent.title": "建立代理中:",
"builtins.lobe-agent-management.inspector.searchAgent.all": "搜尋代理:",
"builtins.lobe-agent-management.inspector.searchAgent.market": "搜尋市場:",
"builtins.lobe-agent-management.inspector.searchAgent.results": "{{count}} 個結果",
"builtins.lobe-agent-management.inspector.searchAgent.user": "搜尋我的代理:",
"builtins.lobe-agent-management.inspector.updateAgent.title": "更新代理中:",
"builtins.lobe-agent-management.title": "代理管理器",
"builtins.lobe-cloud-sandbox.apiName.editLocalFile": "編輯檔案",
"builtins.lobe-cloud-sandbox.apiName.executeCode": "執行程式碼",
"builtins.lobe-cloud-sandbox.apiName.exportFile": "匯出檔案",
+3
View File
@@ -724,6 +724,9 @@
"tools.builtins.lobe-artifacts.description": "產生並即時預覽互動式 UI 元件、資料視覺化、圖表、SVG 圖形與網頁應用程式。建立使用者可直接互動的豐富視覺內容。",
"tools.builtins.lobe-artifacts.readme": "生成並即時預覽互動式 UI 元件、資料視覺化、圖表、SVG 圖形與網頁應用程式。創建使用者可直接互動的豐富視覺內容。",
"tools.builtins.lobe-artifacts.title": "視覺產物",
"tools.builtins.lobe-calculator.description": "執行數學計算、解方程式,並處理符號運算",
"tools.builtins.lobe-calculator.readme": "先進的數學計算器,支援基本算術、代數方程式、微積分運算和符號數學。包括進位制轉換、方程式求解、微分、積分等功能。",
"tools.builtins.lobe-calculator.title": "計算器",
"tools.builtins.lobe-cloud-sandbox.description": "在隔離的雲端環境中執行 Python、JavaScript 和 TypeScript 程式碼。可執行 shell 指令、管理檔案、使用正規表達式搜尋內容,並安全地匯出結果。",
"tools.builtins.lobe-cloud-sandbox.readme": "在隔離的雲端環境中執行 Python、JavaScript 和 TypeScript 程式碼。執行 Shell 指令、管理檔案、使用正規表示式搜尋內容,並安全地匯出結果。",
"tools.builtins.lobe-cloud-sandbox.title": "雲端沙盒",
@@ -10,6 +10,7 @@ import {
ImageIcon,
MessageSquareTextIcon,
MicIcon,
VideoIcon,
} from 'lucide-react';
import { memo, Suspense, useMemo, useState } from 'react';
import { useTranslation } from 'react-i18next';
@@ -54,6 +55,7 @@ const Content = memo<ContentProps>(({ id }) => {
image: 0,
stt: 0,
tts: 0,
video: 0,
};
allModels.forEach((model) => {
@@ -90,6 +92,12 @@ const Content = memo<ContentProps>(({ id }) => {
key: 'image',
label: formatTabLabel(t('providerModels.tabs.image'), modelCounts.image),
},
{
count: modelCounts.video,
icon: <Icon icon={VideoIcon} size={16} />,
key: 'video',
label: formatTabLabel(t('providerModels.tabs.video'), modelCounts.video),
},
{
count: modelCounts.embedding,
icon: <Icon icon={BoltIcon} size={16} />,
+1
View File
@@ -380,6 +380,7 @@ export default {
'providerModels.tabs.image': 'Image',
'providerModels.tabs.stt': 'ASR',
'providerModels.tabs.tts': 'TTS',
'providerModels.tabs.video': 'Video',
'sortModal.success': 'Sort update successful',
'sortModal.title': 'Custom Order',
'sortModal.update': 'Update',