diff --git a/.i18nrc.js b/.i18nrc.js
index ea002dee94..5619d00895 100644
--- a/.i18nrc.js
+++ b/.i18nrc.js
@@ -24,7 +24,7 @@ module.exports = defineConfig({
     'fa-IR',
   ],
   temperature: 0,
-  modelName: 'gpt-4o-mini',
+  modelName: 'gpt-4.1-mini',
   experimental: {
     jsonMode: true,
   },
diff --git a/locales/ar/chat.json b/locales/ar/chat.json
index 2190a9efb5..43a3d2c44f 100644
--- a/locales/ar/chat.json
+++ b/locales/ar/chat.json
@@ -43,6 +43,9 @@
     "reasoningBudgetToken": {
       "title": "استهلاك توكن التفكير"
     },
+    "reasoningEffort": {
+      "title": "شدة الاستدلال"
+    },
     "title": "وظائف توسيع النموذج"
   },
   "history": {
diff --git a/locales/ar/models.json b/locales/ar/models.json
index 4cbc710c7a..326506477d 100644
--- a/locales/ar/models.json
+++ b/locales/ar/models.json
@@ -341,9 +341,6 @@
   "Qwen2.5-Coder-32B-Instruct": {
     "description": "Qwen2.5-Coder-32B-Instruct هو نموذج لغوي كبير مصمم خصيصًا لتوليد الشيفرات، وفهم الشيفرات، ومشاهد التطوير الفعالة، مع استخدام حجم 32B من المعلمات الرائدة في الصناعة، مما يلبي احتياجات البرمجة المتنوعة."
   },
-  "SenseCat-5-1202": {
-    "description": "هو الإصدار الأحدث المبني على V5.5، وقد شهد تحسينات ملحوظة في القدرات الأساسية باللغة الصينية والإنجليزية، والدردشة، والمعرفة العلمية، والمعرفة الأدبية، والكتابة، والمنطق الرياضي، والتحكم في عدد الكلمات."
-  },
   "SenseChat": {
     "description": "نموذج الإصدار الأساسي (V4)، بطول سياق 4K، يمتلك قدرات قوية وعامة."
   },
@@ -356,6 +353,9 @@
   "SenseChat-5": {
     "description": "أحدث إصدار من النموذج (V5.5)، بطول سياق 128K، مع تحسينات ملحوظة في القدرة على الاستدلال الرياضي، المحادثات باللغة الإنجليزية، اتباع التعليمات وفهم النصوص الطويلة، مما يجعله في مستوى GPT-4o."
   },
+  "SenseChat-5-1202": {
+    "description": "الإصدار الأحدث المبني على V5.5، يظهر تحسينات ملحوظة في القدرات الأساسية باللغتين الصينية والإنجليزية، الدردشة، المعرفة العلمية، المعرفة الأدبية، الكتابة، المنطق الرياضي، والتحكم في عدد الكلمات."
+  },
   "SenseChat-5-Cantonese": {
     "description": "بطول سياق 32K، يتفوق في فهم المحادثات باللغة الكانتونية مقارنة بـ GPT-4، ويضاهي GPT-4 Turbo في مجالات المعرفة، الاستدلال، الرياضيات وكتابة الأكواد."
   },
@@ -515,6 +515,12 @@
   "ai21-jamba-1.5-mini": {
     "description": "نموذج متعدد اللغات بحجم 52B (12B نشط)، يقدم نافذة سياق طويلة بحجم 256K، واستدعاء وظائف، وإخراج منظم، وتوليد مستند."
   },
+  "ai21-labs/AI21-Jamba-1.5-Large": {
+    "description": "نموذج متعدد اللغات يحتوي على 398 مليار معلمة (94 مليار نشطة)، يوفر نافذة سياق طويلة تصل إلى 256 ألف كلمة، استدعاء دوال، إخراج منظم وتوليد قائم على الحقائق."
+  },
+  "ai21-labs/AI21-Jamba-1.5-Mini": {
+    "description": "نموذج متعدد اللغات يحتوي على 52 مليار معلمة (12 مليار نشطة)، يوفر نافذة سياق طويلة تصل إلى 256 ألف كلمة، استدعاء دوال، إخراج منظم وتوليد قائم على الحقائق."
+  },
   "anthropic.claude-3-5-sonnet-20240620-v1:0": {
     "description": "Claude 3.5 Sonnet يرفع المعايير في الصناعة، حيث يتفوق على نماذج المنافسين وClaude 3 Opus، ويظهر أداءً ممتازًا في تقييمات واسعة، مع سرعة وتكلفة تتناسب مع نماذجنا المتوسطة."
   },
@@ -668,6 +674,12 @@
   "cohere-command-r-plus": {
     "description": "نموذج RAG محسّن من الطراز الأول مصمم للتعامل مع أحمال العمل على مستوى المؤسسات."
   },
+  "cohere/Cohere-command-r": {
+    "description": "Command R هو نموذج توليدي قابل للتوسع، مصمم للاستخدام مع RAG والأدوات، لتمكين الشركات من تحقيق ذكاء اصطناعي بمستوى الإنتاج."
+  },
+  "cohere/Cohere-command-r-plus": {
+    "description": "Command R+ هو نموذج متقدم محسّن لـ RAG، مصمم للتعامل مع أعباء العمل على مستوى المؤسسات."
+  },
   "command": {
     "description": "نموذج حواري يتبع التعليمات، يظهر جودة عالية وموثوقية أكبر في المهام اللغوية، ويتميز بطول سياق أطول مقارنة بنموذجنا الأساسي للتوليد."
   },
@@ -1028,6 +1040,12 @@
   "gemini-2.5-flash-preview-04-17": {
     "description": "معاينة فلاش جمنّي 2.5 هي النموذج الأكثر كفاءة من جوجل، حيث تقدم مجموعة شاملة من الميزات."
   },
+  "gemini-2.5-flash-preview-04-17-thinking": {
+    "description": "Gemini 2.5 Flash Preview هو نموذج Google الأكثر فعالية من حيث التكلفة، يقدم وظائف شاملة."
+  },
+  "gemini-2.5-flash-preview-05-20": {
+    "description": "Gemini 2.5 Flash Preview هو نموذج Google الأكثر فعالية من حيث التكلفة، يقدم وظائف شاملة."
+  },
   "gemini-2.5-pro-exp-03-25": {
     "description": "نموذج Gemini 2.5 Pro التجريبي هو الأكثر تقدمًا من Google، قادر على استنتاج المشكلات المعقدة في البرمجة والرياضيات وعلوم STEM، بالإضافة إلى تحليل مجموعات البيانات الكبيرة ومكتبات الشيفرات والمستندات باستخدام سياقات طويلة."
   },
@@ -1262,23 +1280,17 @@
   "grok-2-vision-1212": {
     "description": "لقد تم تحسين هذا النموذج في الدقة، والامتثال للتعليمات، والقدرة على التعامل مع لغات متعددة."
   },
-  "grok-3-beta": {
-    "description": "نموذج رائد، يتفوق في استخراج البيانات، البرمجة، وتلخيص النصوص في التطبيقات المؤسسية، ويملك معرفة عميقة في مجالات المالية، الطب، القانون، والعلوم."
+  "grok-3": {
+    "description": "نموذج رائد، بارع في استخراج البيانات، البرمجة، وتلخيص النصوص لتطبيقات المؤسسات، يمتلك معرفة عميقة في مجالات المالية، الطب، القانون، والعلوم."
   },
-  "grok-3-fast-beta": {
-    "description": "نموذج رائد، يتفوق في استخراج البيانات، البرمجة، وتلخيص النصوص في التطبيقات المؤسسية، ويملك معرفة عميقة في مجالات المالية، الطب، القانون، والعلوم."
+  "grok-3-fast": {
+    "description": "نموذج رائد، بارع في استخراج البيانات، البرمجة، وتلخيص النصوص لتطبيقات المؤسسات، يمتلك معرفة عميقة في مجالات المالية، الطب، القانون، والعلوم."
   },
-  "grok-3-mini-beta": {
-    "description": "نموذج خفيف الوزن، يفكر قبل بدء المحادثة. يعمل بسرعة وذكاء، مناسب للمهام المنطقية التي لا تتطلب معرفة عميقة في المجالات، ويمكنه الحصول على مسارات التفكير الأصلية."
+  "grok-3-mini": {
+    "description": "نموذج خفيف الوزن، يفكر قبل المحادثة. سريع وذكي، مناسب للمهام المنطقية التي لا تتطلب معرفة متخصصة عميقة، ويستطيع تتبع مسار التفكير الأصلي."
   },
-  "grok-3-mini-fast-beta": {
-    "description": "نموذج خفيف الوزن، يفكر قبل بدء المحادثة. يعمل بسرعة وذكاء، مناسب للمهام المنطقية التي لا تتطلب معرفة عميقة في المجالات، ويمكنه الحصول على مسارات التفكير الأصلية."
-  },
-  "grok-beta": {
-    "description": "يمتلك أداءً يعادل Grok 2، ولكنه يتمتع بكفاءة وسرعة ووظائف أعلى."
-  },
-  "grok-vision-beta": {
-    "description": "أحدث نموذج لفهم الصور، يمكنه معالجة مجموعة متنوعة من المعلومات البصرية، بما في ذلك الوثائق، الرسوم البيانية، لقطات الشاشة، والصور."
+  "grok-3-mini-fast": {
+    "description": "نموذج خفيف الوزن، يفكر قبل المحادثة. سريع وذكي، مناسب للمهام المنطقية التي لا تتطلب معرفة متخصصة عميقة، ويستطيع تتبع مسار التفكير الأصلي."
   },
   "gryphe/mythomax-l2-13b": {
     "description": "MythoMax l2 13B هو نموذج لغوي يجمع بين الإبداع والذكاء من خلال دمج عدة نماذج رائدة."
@@ -1322,6 +1334,9 @@
   "hunyuan-t1-latest": {
     "description": "أول نموذج استدلال هجين ضخم في الصناعة، يوسع قدرات الاستدلال، بسرعة فك تشفير فائقة، ويعزز التوافق مع تفضيلات البشر."
   },
+  "hunyuan-t1-vision": {
+    "description": "نموذج تفكير عميق متعدد الوسائط من Hunyuan، يدعم سلاسل التفكير الأصلية متعددة الوسائط، بارع في معالجة مختلف سيناريوهات الاستدلال على الصور، ويحقق تحسينًا شاملاً مقارنة بنموذج التفكير السريع في مسائل العلوم."
+  },
   "hunyuan-translation": {
     "description": "يدعم الترجمة بين 15 لغة بما في ذلك الصينية والإنجليزية واليابانية والفرنسية والبرتغالية والإسبانية والتركية والروسية والعربية والكورية والإيطالية والألمانية والفيتنامية والماليزية والإندونيسية، ويعتمد على مجموعة تقييم الترجمة متعددة السيناريوهات لتقييم تلقائي باستخدام درجة COMET، حيث يتفوق بشكل عام على نماذج السوق المماثلة في القدرة على الترجمة بين اللغات الشائعة."
   },
@@ -1586,6 +1601,30 @@
   "meta.llama3-8b-instruct-v1:0": {
     "description": "Meta Llama 3 هو نموذج لغوي كبير مفتوح (LLM) موجه للمطورين والباحثين والشركات، يهدف إلى مساعدتهم في بناء وتجربة وتوسيع أفكارهم في الذكاء الاصطناعي بشكل مسؤول. كجزء من نظام الابتكار المجتمعي العالمي، فهو مثالي للأجهزة ذات القدرة الحاسوبية والموارد المحدودة، والأجهزة الطرفية، وأوقات التدريب الأسرع."
   },
+  "meta/Llama-3.2-11B-Vision-Instruct": {
+    "description": "يتميز بقدرات استدلال على الصور عالية الدقة، مناسب لتطبيقات الفهم البصري."
+  },
+  "meta/Llama-3.2-90B-Vision-Instruct": {
+    "description": "قدرات استدلال متقدمة على الصور لتطبيقات الوكلاء في الفهم البصري."
+  },
+  "meta/Llama-3.3-70B-Instruct": {
+    "description": "Llama 3.3 هو أحدث نموذج لغوي كبير متعدد اللغات مفتوح المصدر من سلسلة Llama، يقدم أداءً مماثلاً لنموذج 405 مليار معلمات بتكلفة منخفضة جدًا. يعتمد على بنية Transformer، وتم تحسينه من خلال التعديل الدقيق الخاضع للإشراف (SFT) والتعلم المعزز من خلال تغذية راجعة بشرية (RLHF) لتعزيز الفائدة والأمان. النسخة المعدلة للتعليمات مخصصة للحوار متعدد اللغات، وتتفوق على العديد من نماذج الدردشة المفتوحة والمغلقة في معايير الصناعة المتعددة. تاريخ المعرفة حتى ديسمبر 2023."
+  },
+  "meta/Meta-Llama-3-70B-Instruct": {
+    "description": "نموذج قوي يحتوي على 70 مليار معلمة، يتميز بأداء ممتاز في الاستدلال، البرمجة، وتطبيقات اللغة المتنوعة."
+  },
+  "meta/Meta-Llama-3-8B-Instruct": {
+    "description": "نموذج متعدد الاستخدامات يحتوي على 8 مليارات معلمة، محسن لمهام الحوار وتوليد النصوص."
+  },
+  "meta/Meta-Llama-3.1-405B-Instruct": {
+    "description": "نموذج نصي معدل للتعليمات من Llama 3.1، محسن لحالات استخدام الحوار متعدد اللغات، ويحقق أداءً ممتازًا في العديد من معايير الصناعة مقارنة بالعديد من نماذج الدردشة المفتوحة والمغلقة."
+  },
+  "meta/Meta-Llama-3.1-70B-Instruct": {
+    "description": "نموذج نصي معدل للتعليمات من Llama 3.1، محسن لحالات استخدام الحوار متعدد اللغات، ويحقق أداءً ممتازًا في العديد من معايير الصناعة مقارنة بالعديد من نماذج الدردشة المفتوحة والمغلقة."
+  },
+  "meta/Meta-Llama-3.1-8B-Instruct": {
+    "description": "نموذج نصي معدل للتعليمات من Llama 3.1، محسن لحالات استخدام الحوار متعدد اللغات، ويحقق أداءً ممتازًا في العديد من معايير الصناعة مقارنة بالعديد من نماذج الدردشة المفتوحة والمغلقة."
+  },
   "meta/llama-3.1-405b-instruct": {
     "description": "نموذج لغوي متقدم، يدعم توليد البيانات الاصطناعية، وتقطير المعرفة، والاستدلال، مناسب للدردشة، والبرمجة، والمهام الخاصة."
   },
@@ -1610,6 +1649,30 @@
   "meta/llama-3.3-70b-instruct": {
     "description": "نموذج لغوي متقدم، بارع في الاستدلال، والرياضيات، والمعرفة العامة، واستدعاء الدوال."
   },
+  "microsoft/Phi-3-medium-128k-instruct": {
+    "description": "نفس نموذج Phi-3-medium ولكن مع حجم سياق أكبر، مناسب لـ RAG أو القليل من التلميحات."
+  },
+  "microsoft/Phi-3-medium-4k-instruct": {
+    "description": "نموذج يحتوي على 14 مليار معلمة، جودة أفضل من Phi-3-mini، يركز على بيانات عالية الجودة وكثيفة الاستدلال."
+  },
+  "microsoft/Phi-3-mini-128k-instruct": {
+    "description": "نفس نموذج Phi-3-mini ولكن مع حجم سياق أكبر، مناسب لـ RAG أو القليل من التلميحات."
+  },
+  "microsoft/Phi-3-mini-4k-instruct": {
+    "description": "أصغر عضو في عائلة Phi-3، محسن للجودة وزمن الاستجابة المنخفض."
+  },
+  "microsoft/Phi-3-small-128k-instruct": {
+    "description": "نفس نموذج Phi-3-small ولكن مع حجم سياق أكبر، مناسب لـ RAG أو القليل من التلميحات."
+  },
+  "microsoft/Phi-3-small-8k-instruct": {
+    "description": "نموذج يحتوي على 7 مليارات معلمة، جودة أفضل من Phi-3-mini، يركز على بيانات عالية الجودة وكثيفة الاستدلال."
+  },
+  "microsoft/Phi-3.5-mini-instruct": {
+    "description": "نسخة محدثة من نموذج Phi-3-mini."
+  },
+  "microsoft/Phi-3.5-vision-instruct": {
+    "description": "نسخة محدثة من نموذج Phi-3-vision."
+  },
   "microsoft/WizardLM-2-8x22B": {
     "description": "WizardLM 2 هو نموذج لغوي تقدمه Microsoft AI، يتميز بأداء ممتاز في المحادثات المعقدة، واللغات المتعددة، والاستدلال، ومساعدات الذكاء."
   },
@@ -1628,6 +1691,15 @@
   "mistral": {
     "description": "Mistral هو نموذج 7B أطلقته Mistral AI، مناسب لاحتياجات معالجة اللغة المتغيرة."
   },
+  "mistral-ai/Mistral-Large-2411": {
+    "description": "النموذج الرائد من Mistral، مناسب للمهام المعقدة التي تتطلب قدرات استدلال واسعة النطاق أو تخصص عالي (توليد نصوص مركبة، توليد أكواد، RAG أو وكلاء)."
+  },
+  "mistral-ai/Mistral-Nemo": {
+    "description": "Mistral Nemo هو نموذج لغوي متقدم (LLM) يتمتع بأحدث قدرات الاستدلال والمعرفة العالمية والبرمجة ضمن فئته الحجمية."
+  },
+  "mistral-ai/mistral-small-2503": {
+    "description": "Mistral Small مناسب لأي مهمة لغوية تتطلب كفاءة عالية وزمن استجابة منخفض."
+  },
   "mistral-large": {
     "description": "Mixtral Large هو النموذج الرائد من Mistral، يجمع بين قدرات توليد الشيفرة، والرياضيات، والاستدلال، ويدعم نافذة سياق تصل إلى 128k."
   },
@@ -1769,6 +1841,9 @@
   "openai/gpt-4o-mini": {
     "description": "GPT-4o mini هو أحدث نموذج من OpenAI تم إطلاقه بعد GPT-4 Omni، ويدعم إدخال النصوص والصور وإخراج النصوص. كأحد نماذجهم المتقدمة الصغيرة، فهو أرخص بكثير من النماذج الرائدة الأخرى في الآونة الأخيرة، وأرخص بأكثر من 60% من GPT-3.5 Turbo. يحتفظ بذكاء متقدم مع قيمة ممتازة. حصل GPT-4o mini على 82% في اختبار MMLU، وهو حاليًا يتفوق على GPT-4 في تفضيلات الدردشة."
   },
+  "openai/o1": {
+    "description": "o1 هو نموذج الاستدلال الجديد من OpenAI، يدعم إدخال الصور والنصوص ويخرج نصًا، مناسب للمهام المعقدة التي تتطلب معرفة عامة واسعة. يتميز هذا النموذج بسياق يصل إلى 200 ألف كلمة وتاريخ معرفة حتى أكتوبر 2023."
+  },
   "openai/o1-mini": {
     "description": "o1-mini هو نموذج استدلال سريع وفعال من حيث التكلفة مصمم لتطبيقات البرمجة والرياضيات والعلوم. يحتوي هذا النموذج على 128K من السياق وتاريخ انتهاء المعرفة في أكتوبر 2023."
   },
diff --git a/locales/ar/setting.json b/locales/ar/setting.json
index 0c74c82ae4..831fba90a7 100644
--- a/locales/ar/setting.json
+++ b/locales/ar/setting.json
@@ -259,9 +259,6 @@
     "enableMaxTokens": {
       "title": "تمكين الحد الأقصى للردود"
     },
-    "enableReasoningEffort": {
-      "title": "تفعيل ضبط قوة الاستدلال"
-    },
     "frequencyPenalty": {
       "desc": "كلما زادت القيمة، كانت المفردات أكثر تنوعًا؛ وكلما انخفضت القيمة، كانت المفردات أكثر بساطة ووضوحًا",
       "title": "تنوع المفردات"
@@ -281,15 +278,6 @@
       "desc": "كلما زادت القيمة، زادت الميل إلى استخدام تعبيرات مختلفة، مما يتجنب تكرار المفاهيم؛ وكلما انخفضت القيمة، زادت الميل إلى استخدام المفاهيم أو السرد المتكرر، مما يجعل التعبير أكثر اتساقًا",
       "title": "تنوع التعبير"
     },
-    "reasoningEffort": {
-      "desc": "كلما زادت القيمة، زادت قدرة الاستدلال، ولكن قد يؤدي ذلك إلى زيادة وقت الاستجابة واستهلاك التوكنات",
-      "options": {
-        "high": "عالي",
-        "low": "منخفض",
-        "medium": "متوسط"
-      },
-      "title": "قوة الاستدلال"
-    },
     "submit": "تحديث إعدادات النموذج",
     "temperature": {
       "desc": "كلما زادت القيمة، كانت الإجابات أكثر إبداعًا وخيالًا؛ وكلما انخفضت القيمة، كانت الإجابات أكثر دقة",
diff --git a/locales/bg-BG/chat.json b/locales/bg-BG/chat.json
index 5cb9436dff..8dc0a0bbe4 100644
--- a/locales/bg-BG/chat.json
+++ b/locales/bg-BG/chat.json
@@ -43,6 +43,9 @@
     "reasoningBudgetToken": {
       "title": "Токени за разходи при мислене"
     },
+    "reasoningEffort": {
+      "title": "Интензитет на разсъждение"
+    },
     "title": "Разширени функции на модела"
   },
   "history": {
diff --git a/locales/bg-BG/models.json b/locales/bg-BG/models.json
index 6d9de131e3..c61b65ab28 100644
--- a/locales/bg-BG/models.json
+++ b/locales/bg-BG/models.json
@@ -341,9 +341,6 @@
   "Qwen2.5-Coder-32B-Instruct": {
     "description": "Qwen2.5-Coder-32B-Instruct е голям езиков модел, проектиран специално за генериране на код, разбиране на код и ефективни сценарии за разработка, с водеща в индустрията параметрична стойност от 32B, способен да отговори на разнообразни програмни нужди."
   },
-  "SenseCat-5-1202": {
-    "description": "Това е най-новата версия, базирана на V5.5, която показва значителни подобрения в основните способности на китайски и английски, чат, научни знания, хуманитарни знания, писане, математическа логика, контрол на броя на думите и други."
-  },
   "SenseChat": {
     "description": "Основна версия на модела (V4), с контекстна дължина 4K, с мощни общи способности."
   },
@@ -356,6 +353,9 @@
   "SenseChat-5": {
     "description": "Най-новата версия на модела (V5.5), с контекстна дължина 128K, значително подобрена способност в области като математическо разсъждение, английски разговори, следване на инструкции и разбиране на дълги текстове, сравнима с GPT-4o."
   },
+  "SenseChat-5-1202": {
+    "description": "Базирана на версия V5.5, последната версия показва значително подобрение в основните умения на китайски и английски, чат, научни знания, хуманитарни знания, писане, математическа логика и контрол на броя думи."
+  },
   "SenseChat-5-Cantonese": {
     "description": "С контекстна дължина 32K, надминава GPT-4 в разбирането на разговори на кантонски, сравним с GPT-4 Turbo в множество области като знания, разсъждение, математика и писане на код."
   },
@@ -515,6 +515,12 @@
   "ai21-jamba-1.5-mini": {
     "description": "Многоезичен модел с 52B параметри (12B активни), предлагащ контекстен прозорец с дължина 256K, извикване на функции, структурирани изходи и генериране на основа."
   },
+  "ai21-labs/AI21-Jamba-1.5-Large": {
+    "description": "Многоезичен модел с 398 милиарда параметри (94 милиарда активни), предлагащ прозорец за дълъг контекст от 256K, извикване на функции, структурирани изходи и генериране, базирано на факти."
+  },
+  "ai21-labs/AI21-Jamba-1.5-Mini": {
+    "description": "Многоезичен модел с 52 милиарда параметри (12 милиарда активни), предлагащ прозорец за дълъг контекст от 256K, извикване на функции, структурирани изходи и генериране, базирано на факти."
+  },
   "anthropic.claude-3-5-sonnet-20240620-v1:0": {
     "description": "Claude 3.5 Sonnet повишава индустриалните стандарти, с производителност, надвишаваща конкурентните модели и Claude 3 Opus, с отлични резултати в широки оценки, като същевременно предлага скорост и разходи на нашите модели от средно ниво."
   },
@@ -668,6 +674,12 @@
   "cohere-command-r-plus": {
     "description": "Command R+ е модел, оптимизиран за RAG, проектиран да се справя с натоварвания на ниво предприятие."
   },
+  "cohere/Cohere-command-r": {
+    "description": "Command R е мащабируем генеративен модел, предназначен за RAG и използване на инструменти, който позволява на предприятията да внедрят AI на производствено ниво."
+  },
+  "cohere/Cohere-command-r-plus": {
+    "description": "Command R+ е усъвършенстван оптимизиран модел за RAG, предназначен да се справя с натоварвания на корпоративно ниво."
+  },
   "command": {
     "description": "Диалогов модел, следващ инструкции, който показва високо качество и надеждност в езиковите задачи, с по-дълга контекстна дължина в сравнение с нашия основен генеративен модел."
   },
@@ -1028,6 +1040,12 @@
   "gemini-2.5-flash-preview-04-17": {
     "description": "Gemini 2.5 Flash Preview е моделът с най-добро съотношение цена-качество на Google, предлагащ пълна функционалност."
   },
+  "gemini-2.5-flash-preview-04-17-thinking": {
+    "description": "Gemini 2.5 Flash Preview е най-ефективният модел на Google, предлагащ пълна функционалност."
+  },
+  "gemini-2.5-flash-preview-05-20": {
+    "description": "Gemini 2.5 Flash Preview е най-ефективният модел на Google, предлагащ пълна функционалност."
+  },
   "gemini-2.5-pro-exp-03-25": {
     "description": "Gemini 2.5 Pro Experimental е най-напредналият модел на мислене на Google, способен да разсъждава по сложни проблеми в код, математика и STEM области, както и да анализира големи набори от данни, кодови библиотеки и документи, използвайки дълъг контекст."
   },
@@ -1262,23 +1280,17 @@
   "grok-2-vision-1212": {
     "description": "Този модел е подобрен по отношение на точност, спазване на инструкции и многоезични способности."
   },
-  "grok-3-beta": {
-    "description": "Флагмански модел, специализиран в извличането на данни, програмирането и обобщаването на текстове за корпоративни приложения, с дълбоки познания в области като финанси, здравеопазване, право и наука."
+  "grok-3": {
+    "description": "Флагмански модел, експертен в извличане на данни, програмиране и обобщаване на текст за корпоративни приложения, с дълбоки знания в областите финанси, медицина, право и наука."
   },
-  "grok-3-fast-beta": {
-    "description": "Флагмански модел, специализиран в извличането на данни, програмирането и обобщаването на текстове за корпоративни приложения, с дълбоки познания в области като финанси, здравеопазване, право и наука."
+  "grok-3-fast": {
+    "description": "Флагмански модел, експертен в извличане на данни, програмиране и обобщаване на текст за корпоративни приложения, с дълбоки знания в областите финанси, медицина, право и наука."
   },
-  "grok-3-mini-beta": {
-    "description": "Лек модел, който обмисля преди разговор. Работи бързо и интелигентно, подходящ за логически задачи, които не изискват дълбоки познания в областта, и може да улови оригиналните мисловни процеси."
+  "grok-3-mini": {
+    "description": "Лек модел, който мисли преди разговор. Работи бързо и интелигентно, подходящ за логически задачи без нужда от дълбоки специализирани знания и позволява проследяване на оригиналния мисловен процес."
   },
-  "grok-3-mini-fast-beta": {
-    "description": "Лек модел, който обмисля преди разговор. Работи бързо и интелигентно, подходящ за логически задачи, които не изискват дълбоки познания в областта, и може да улови оригиналните мисловни процеси."
-  },
-  "grok-beta": {
-    "description": "С производителност, сравнима с Grok 2, но с по-висока ефективност, скорост и функции."
-  },
-  "grok-vision-beta": {
-    "description": "Най-новият модел за разбиране на изображения, способен да обработва разнообразна визуална информация, включително документи, графики, екранни снимки и снимки."
+  "grok-3-mini-fast": {
+    "description": "Лек модел, който мисли преди разговор. Работи бързо и интелигентно, подходящ за логически задачи без нужда от дълбоки специализирани знания и позволява проследяване на оригиналния мисловен процес."
   },
   "gryphe/mythomax-l2-13b": {
     "description": "MythoMax l2 13B е езиков модел, който комбинира креативност и интелигентност, обединявайки множество водещи модели."
@@ -1322,6 +1334,9 @@
   "hunyuan-t1-latest": {
     "description": "Първият в индустрията свръхголям хибриден трансформаторен модел за инференция, който разширява инференционните способности, предлага изключителна скорост на декодиране и допълнително съгласува човешките предпочитания."
   },
+  "hunyuan-t1-vision": {
+    "description": "Модел за дълбоко мултимодално разбиране Hunyuan, поддържащ естествени мултимодални вериги на мислене, експертен в различни сценарии за разсъждение върху изображения, с цялостно подобрение спрямо бързите мисловни модели при научни задачи."
+  },
   "hunyuan-translation": {
     "description": "Поддържа автоматичен превод между 15 езика, включително китайски, английски, японски, френски, португалски, испански, турски, руски, арабски, корейски, италиански, немски, виетнамски, малайски и индонезийски, базиран на автоматизирана оценка COMET, с цялостна преводна способност, която е по-добра от моделите на пазара с подобен мащаб."
   },
@@ -1586,6 +1601,30 @@
   "meta.llama3-8b-instruct-v1:0": {
     "description": "Meta Llama 3 е отворен голям езиков модел (LLM), насочен към разработчици, изследователи и предприятия, предназначен да им помогне да изградят, експериментират и отговорно разширят своите идеи за генеративен ИИ. Като част от основната система на глобалната общност за иновации, той е особено подходящ за устройства с ограничени изчислителни ресурси и по-бързо време за обучение."
   },
+  "meta/Llama-3.2-11B-Vision-Instruct": {
+    "description": "Отлични способности за разсъждение върху изображения с висока резолюция, подходящи за приложения за визуално разбиране."
+  },
+  "meta/Llama-3.2-90B-Vision-Instruct": {
+    "description": "Разширени способности за разсъждение върху изображения, подходящи за визуални агенти за разбиране."
+  },
+  "meta/Llama-3.3-70B-Instruct": {
+    "description": "Llama 3.3 е най-напредналият многоезичен отворен езиков модел от серията Llama, предлагащ производителност, сравнима с 405B модел, при изключително ниски разходи. Базиран на архитектура Transformer и подобрен чрез надзорно фино настройване (SFT) и обучение с човешка обратна връзка (RLHF) за повишаване на полезността и безопасността. Версията с инструкции е оптимизирана за многоезични диалози и превъзхожда множество отворени и затворени чат модели в различни индустриални бенчмаркове. Дата на знание: декември 2023 г."
+  },
+  "meta/Meta-Llama-3-70B-Instruct": {
+    "description": "Мощен модел с 70 милиарда параметри, отличаващ се в разсъждение, кодиране и широк спектър от езикови приложения."
+  },
+  "meta/Meta-Llama-3-8B-Instruct": {
+    "description": "Многофункционален модел с 8 милиарда параметри, оптимизиран за задачи с диалог и генериране на текст."
+  },
+  "meta/Meta-Llama-3.1-405B-Instruct": {
+    "description": "Текстов модел Llama 3.1 с фино настройване за инструкции, оптимизиран за многоезични диалогови случаи, с отлични резултати в множество налични отворени и затворени чат модели при стандартни индустриални бенчмаркове."
+  },
+  "meta/Meta-Llama-3.1-70B-Instruct": {
+    "description": "Текстов модел Llama 3.1 с фино настройване за инструкции, оптимизиран за многоезични диалогови случаи, с отлични резултати в множество налични отворени и затворени чат модели при стандартни индустриални бенчмаркове."
+  },
+  "meta/Meta-Llama-3.1-8B-Instruct": {
+    "description": "Текстов модел Llama 3.1 с фино настройване за инструкции, оптимизиран за многоезични диалогови случаи, с отлични резултати в множество налични отворени и затворени чат модели при стандартни индустриални бенчмаркове."
+  },
   "meta/llama-3.1-405b-instruct": {
     "description": "Напреднал LLM, поддържащ генериране на синтетични данни, дестилация на знания и разсъждение, подходящ за чатботове, програмиране и специфични задачи."
   },
@@ -1610,6 +1649,30 @@
   "meta/llama-3.3-70b-instruct": {
     "description": "Напреднал LLM, специализиран в разсъждения, математика, общи познания и извикване на функции."
   },
+  "microsoft/Phi-3-medium-128k-instruct": {
+    "description": "Същият модел Phi-3-medium, но с по-голям размер на контекста, подходящ за RAG или малко количество подсказки."
+  },
+  "microsoft/Phi-3-medium-4k-instruct": {
+    "description": "Модел с 14 милиарда параметри, с по-добро качество от Phi-3-mini, фокусиран върху висококачествени, разсъждаващи данни."
+  },
+  "microsoft/Phi-3-mini-128k-instruct": {
+    "description": "Същият модел Phi-3-mini, но с по-голям размер на контекста, подходящ за RAG или малко количество подсказки."
+  },
+  "microsoft/Phi-3-mini-4k-instruct": {
+    "description": "Най-малкият член на семейството Phi-3, оптимизиран за качество и ниска латентност."
+  },
+  "microsoft/Phi-3-small-128k-instruct": {
+    "description": "Същият модел Phi-3-small, но с по-голям размер на контекста, подходящ за RAG или малко количество подсказки."
+  },
+  "microsoft/Phi-3-small-8k-instruct": {
+    "description": "Модел с 7 милиарда параметри, с по-добро качество от Phi-3-mini, фокусиран върху висококачествени, разсъждаващи данни."
+  },
+  "microsoft/Phi-3.5-mini-instruct": {
+    "description": "Актуализирана версия на модела Phi-3-mini."
+  },
+  "microsoft/Phi-3.5-vision-instruct": {
+    "description": "Актуализирана версия на модела Phi-3-vision."
+  },
   "microsoft/WizardLM-2-8x22B": {
     "description": "WizardLM 2 е езиков модел, предоставен от Microsoft AI, който показва особени способности в сложни разговори, многоезичност, разсъждения и интелигентни асистенти."
   },
@@ -1628,6 +1691,15 @@
   "mistral": {
     "description": "Mistral е 7B модел, представен от Mistral AI, подходящ за променливи нужди в обработката на език."
   },
+  "mistral-ai/Mistral-Large-2411": {
+    "description": "Флагманският модел на Mistral, подходящ за сложни задачи, изискващи мащабни способности за разсъждение или висока специализация (синтетично генериране на текст, кодиране, RAG или агенти)."
+  },
+  "mistral-ai/Mistral-Nemo": {
+    "description": "Mistral Nemo е водещ езиков модел (LLM), който предлага най-съвременни способности за разсъждение, световни знания и кодиране в своя размерен клас."
+  },
+  "mistral-ai/mistral-small-2503": {
+    "description": "Mistral Small е подходящ за всякакви езикови задачи, изискващи висока ефективност и ниска латентност."
+  },
   "mistral-large": {
     "description": "Mixtral Large е флагманският модел на Mistral, комбиниращ способности за генериране на код, математика и разсъждение, поддържащ контекстен прозорец от 128k."
   },
@@ -1769,6 +1841,9 @@
   "openai/gpt-4o-mini": {
     "description": "GPT-4o mini е най-новият модел на OpenAI, пуснат след GPT-4 Omni, който поддържа вход и изход на текст и изображения. Като най-напредналият им малък модел, той е значително по-евтин от другите нови модели и е с над 60% по-евтин от GPT-3.5 Turbo. Запазва най-съвременната интелигентност, като предлага значителна стойност за парите. GPT-4o mini получи 82% на теста MMLU и в момента е с по-висок рейтинг от GPT-4 в предпочитанията за чат."
   },
+  "openai/o1": {
+    "description": "o1 е новият модел за разсъждение на OpenAI, който поддържа вход с изображения и текст и генерира текст, подходящ за сложни задачи, изискващи широкообхватни общи знания. Моделът разполага с контекст от 200K и дата на знание до октомври 2023 г."
+  },
   "openai/o1-mini": {
     "description": "o1-mini е бърз и икономичен модел за изводи, проектиран за приложения в програмирането, математиката и науката. Моделът разполага с контекст от 128K и дата на знание до октомври 2023."
   },
diff --git a/locales/bg-BG/setting.json b/locales/bg-BG/setting.json
index b453506644..6790cd693f 100644
--- a/locales/bg-BG/setting.json
+++ b/locales/bg-BG/setting.json
@@ -259,9 +259,6 @@
     "enableMaxTokens": {
       "title": "Активиране на ограничението за максимален брой токени"
     },
-    "enableReasoningEffort": {
-      "title": "Активиране на настройките за интензивност на разсъжденията"
-    },
     "frequencyPenalty": {
       "desc": "Колкото по-голяма е стойността, толкова по-богат и разнообразен е речникът; колкото по-ниска е стойността, толкова по-прост и обикновен е речникът.",
       "title": "Богатство на речника"
@@ -281,15 +278,6 @@
       "desc": "Колкото по-голяма е стойността, толкова по-склонен е към различни изрази, избягвайки повторение на концепции; колкото по-ниска е стойността, толкова по-склонен е да използва повторение на концепции или разкази, изразявайки по-голяма последователност.",
       "title": "Разнообразие на изразите"
     },
-    "reasoningEffort": {
-      "desc": "Колкото по-висока е стойността, толкова по-силна е способността за разсъждение, но може да увеличи времето за отговор и консумацията на токени",
-      "options": {
-        "high": "Висока",
-        "low": "Ниска",
-        "medium": "Средна"
-      },
-      "title": "Интензивност на разсъжденията"
-    },
     "submit": "Актуализиране на настройките на модела",
     "temperature": {
       "desc": "Колкото по-голямо е числото, толкова по-креативни и въображаеми са отговорите; колкото по-малко е числото, толкова по-строги са отговорите",
diff --git a/locales/de-DE/chat.json b/locales/de-DE/chat.json
index 75f2b197f1..62f63e34a6 100644
--- a/locales/de-DE/chat.json
+++ b/locales/de-DE/chat.json
@@ -43,6 +43,9 @@
     "reasoningBudgetToken": {
       "title": "Token für Denkaufwand"
     },
+    "reasoningEffort": {
+      "title": "Argumentationsstärke"
+    },
     "title": "Modell Erweiterungsfunktionen"
   },
   "history": {
diff --git a/locales/de-DE/models.json b/locales/de-DE/models.json
index bcc70ea09a..b657a06736 100644
--- a/locales/de-DE/models.json
+++ b/locales/de-DE/models.json
@@ -341,9 +341,6 @@
   "Qwen2.5-Coder-32B-Instruct": {
     "description": "Qwen2.5-Coder-32B-Instruct ist ein großes Sprachmodell, das speziell für die Codegenerierung, das Verständnis von Code und effiziente Entwicklungsszenarien entwickelt wurde. Es verwendet eine branchenführende Parametergröße von 32B und kann vielfältige Programmieranforderungen erfüllen."
   },
-  "SenseCat-5-1202": {
-    "description": "Basierend auf der neuesten Version V5.5, zeigt es im Vergleich zur vorherigen Version signifikante Verbesserungen in den grundlegenden Fähigkeiten in Chinesisch und Englisch, im Chat, in naturwissenschaftlichem Wissen, in geisteswissenschaftlichem Wissen, im Schreiben, in mathematischer Logik und in der Wortanzahlkontrolle."
-  },
   "SenseChat": {
     "description": "Basisversion des Modells (V4) mit 4K Kontextlänge, die über starke allgemeine Fähigkeiten verfügt."
   },
@@ -356,6 +353,9 @@
   "SenseChat-5": {
     "description": "Die neueste Modellversion (V5.5) mit 128K Kontextlänge hat signifikante Verbesserungen in den Bereichen mathematische Schlussfolgerungen, englische Konversation, Befolgen von Anweisungen und Verständnis langer Texte, vergleichbar mit GPT-4o."
   },
+  "SenseChat-5-1202": {
+    "description": "Basierend auf der neuesten Version V5.5 zeigt es im Vergleich zur Vorgängerversion deutliche Verbesserungen in den Bereichen Grundfähigkeiten in Chinesisch und Englisch, Chat, naturwissenschaftliches Wissen, geisteswissenschaftliches Wissen, Schreiben, mathematische Logik und Wortzahlkontrolle."
+  },
   "SenseChat-5-Cantonese": {
     "description": "Mit 32K Kontextlänge übertrifft es GPT-4 im Verständnis von Konversationen auf Kantonesisch und kann in mehreren Bereichen wie Wissen, Schlussfolgerungen, Mathematik und Programmierung mit GPT-4 Turbo konkurrieren."
   },
@@ -515,6 +515,12 @@
   "ai21-jamba-1.5-mini": {
     "description": "Ein mehrsprachiges Modell mit 52 Milliarden Parametern (12 Milliarden aktiv), das ein 256K langes Kontextfenster, Funktionsaufrufe, strukturierte Ausgaben und fundierte Generierung bietet."
   },
+  "ai21-labs/AI21-Jamba-1.5-Large": {
+    "description": "Ein mehrsprachiges Modell mit 398 Milliarden Parametern (davon 94 Milliarden aktiv), das ein 256K langes Kontextfenster, Funktionsaufrufe, strukturierte Ausgaben und faktengestützte Generierung bietet."
+  },
+  "ai21-labs/AI21-Jamba-1.5-Mini": {
+    "description": "Ein mehrsprachiges Modell mit 52 Milliarden Parametern (davon 12 Milliarden aktiv), das ein 256K langes Kontextfenster, Funktionsaufrufe, strukturierte Ausgaben und faktengestützte Generierung bietet."
+  },
   "anthropic.claude-3-5-sonnet-20240620-v1:0": {
     "description": "Claude 3.5 Sonnet hebt den Branchenstandard an, übertrifft die Konkurrenzmodelle und Claude 3 Opus und zeigt in umfassenden Bewertungen hervorragende Leistungen, während es die Geschwindigkeit und Kosten unserer mittleren Modelle beibehält."
   },
@@ -668,6 +674,12 @@
   "cohere-command-r-plus": {
     "description": "Command R+ ist ein hochmodernes, RAG-optimiertes Modell, das für unternehmensgerechte Arbeitslasten konzipiert ist."
   },
+  "cohere/Cohere-command-r": {
+    "description": "Command R ist ein skalierbares Generierungsmodell, das für RAG und Tool-Nutzung entwickelt wurde, um Unternehmen produktionsreife KI zu ermöglichen."
+  },
+  "cohere/Cohere-command-r-plus": {
+    "description": "Command R+ ist ein hochmodernes, für RAG optimiertes Modell, das für unternehmensweite Arbeitslasten ausgelegt ist."
+  },
   "command": {
     "description": "Ein dialogbasiertes Modell, das Anweisungen folgt und in sprachlichen Aufgaben hohe Qualität und Zuverlässigkeit bietet. Im Vergleich zu unserem grundlegenden Generierungsmodell hat es eine längere Kontextlänge."
   },
@@ -1028,6 +1040,12 @@
   "gemini-2.5-flash-preview-04-17": {
     "description": "Gemini 2.5 Flash Preview ist das kosteneffizienteste Modell von Google und bietet umfassende Funktionen."
   },
+  "gemini-2.5-flash-preview-04-17-thinking": {
+    "description": "Gemini 2.5 Flash Preview ist Googles kosteneffizientestes Modell mit umfassenden Funktionen."
+  },
+  "gemini-2.5-flash-preview-05-20": {
+    "description": "Gemini 2.5 Flash Preview ist Googles kosteneffizientestes Modell mit umfassenden Funktionen."
+  },
   "gemini-2.5-pro-exp-03-25": {
     "description": "Gemini 2.5 Pro Experimental ist Googles fortschrittlichstes Denkmodell, das in der Lage ist, komplexe Probleme in den Bereichen Code, Mathematik und STEM zu analysieren. Es kann auch lange Kontexte nutzen, um große Datensätze, Codebasen und Dokumente zu analysieren."
   },
@@ -1262,23 +1280,17 @@
   "grok-2-vision-1212": {
     "description": "Dieses Modell hat Verbesserungen in Bezug auf Genauigkeit, Befolgung von Anweisungen und Mehrsprachigkeit erfahren."
   },
-  "grok-3-beta": {
-    "description": "Flaggschiff-Modell, das sich auf Datenextraktion, Programmierung und Textzusammenfassungen für Unternehmensanwendungen spezialisiert hat und über umfassendes Wissen in den Bereichen Finanzen, Gesundheitswesen, Recht und Wissenschaft verfügt."
+  "grok-3": {
+    "description": "Ein Flaggschiffmodell, spezialisiert auf Datenextraktion, Programmierung und Textzusammenfassung für Unternehmensanwendungen, mit tiefgreifendem Wissen in den Bereichen Finanzen, Medizin, Recht und Wissenschaft."
   },
-  "grok-3-fast-beta": {
-    "description": "Flaggschiff-Modell, das sich auf Datenextraktion, Programmierung und Textzusammenfassungen für Unternehmensanwendungen spezialisiert hat und über umfassendes Wissen in den Bereichen Finanzen, Gesundheitswesen, Recht und Wissenschaft verfügt."
+  "grok-3-fast": {
+    "description": "Ein Flaggschiffmodell, spezialisiert auf Datenextraktion, Programmierung und Textzusammenfassung für Unternehmensanwendungen, mit tiefgreifendem Wissen in den Bereichen Finanzen, Medizin, Recht und Wissenschaft."
   },
-  "grok-3-mini-beta": {
-    "description": "Leichtgewichtiges Modell, das vor dem Gespräch nachdenkt. Es läuft schnell und intelligent und eignet sich für logische Aufgaben, die kein tiefes Fachwissen erfordern, und kann die ursprünglichen Denkprozesse erfassen."
+  "grok-3-mini": {
+    "description": "Ein leichtgewichtiges Modell, das vor der Antwort nachdenkt. Es arbeitet schnell und intelligent, eignet sich für logische Aufgaben ohne tiefgehendes Fachwissen und ermöglicht die Nachverfolgung des ursprünglichen Denkprozesses."
   },
-  "grok-3-mini-fast-beta": {
-    "description": "Leichtgewichtiges Modell, das vor dem Gespräch nachdenkt. Es läuft schnell und intelligent und eignet sich für logische Aufgaben, die kein tiefes Fachwissen erfordern, und kann die ursprünglichen Denkprozesse erfassen."
-  },
-  "grok-beta": {
-    "description": "Bietet eine Leistung, die mit Grok 2 vergleichbar ist, jedoch mit höherer Effizienz, Geschwindigkeit und Funktionalität."
-  },
-  "grok-vision-beta": {
-    "description": "Das neueste Modell zur Bildverständnis, das eine Vielzahl von visuellen Informationen verarbeiten kann, einschließlich Dokumenten, Diagrammen, Screenshots und Fotos."
+  "grok-3-mini-fast": {
+    "description": "Ein leichtgewichtiges Modell, das vor der Antwort nachdenkt. Es arbeitet schnell und intelligent, eignet sich für logische Aufgaben ohne tiefgehendes Fachwissen und ermöglicht die Nachverfolgung des ursprünglichen Denkprozesses."
   },
   "gryphe/mythomax-l2-13b": {
     "description": "MythoMax l2 13B ist ein Sprachmodell, das Kreativität und Intelligenz kombiniert und mehrere führende Modelle integriert."
@@ -1322,6 +1334,9 @@
   "hunyuan-t1-latest": {
     "description": "Das erste ultra-skalierbare Hybrid-Transformer-Mamba-Inferenzmodell der Branche, das die Inferenzfähigkeiten erweitert, eine extrem hohe Dekodierungsgeschwindigkeit bietet und weiter auf menschliche Präferenzen abgestimmt ist."
   },
+  "hunyuan-t1-vision": {
+    "description": "Hunyuan ist ein multimodales Verständnis- und Tiefdenkmodell, das native multimodale lange Denkprozesse unterstützt. Es ist spezialisiert auf verschiedene Bildinferenzszenarien und zeigt im Vergleich zu Schnelldenkmodellen umfassende Verbesserungen bei naturwissenschaftlichen Problemen."
+  },
   "hunyuan-translation": {
     "description": "Unterstützt die Übersetzung zwischen Chinesisch und Englisch, Japanisch, Französisch, Portugiesisch, Spanisch, Türkisch, Russisch, Arabisch, Koreanisch, Italienisch, Deutsch, Vietnamesisch, Malaiisch und Indonesisch in 15 Sprachen. Basierend auf einem automatisierten Bewertungs-Framework COMET, das auf mehrsprachigen Übersetzungsbewertungsszenarien basiert, übertrifft es insgesamt die Übersetzungsfähigkeiten anderer Modelle ähnlicher Größe auf dem Markt."
   },
@@ -1586,6 +1601,30 @@
   "meta.llama3-8b-instruct-v1:0": {
     "description": "Meta Llama 3 ist ein offenes großes Sprachmodell (LLM), das sich an Entwickler, Forscher und Unternehmen richtet und ihnen hilft, ihre Ideen für generative KI zu entwickeln, zu experimentieren und verantwortungsbewusst zu skalieren. Als Teil eines globalen Innovationssystems ist es besonders geeignet für Umgebungen mit begrenzter Rechenleistung und Ressourcen, für Edge-Geräte und schnellere Trainingszeiten."
   },
+  "meta/Llama-3.2-11B-Vision-Instruct": {
+    "description": "Exzellente Bildinferenzfähigkeiten bei hochauflösenden Bildern, ideal für Anwendungen im Bereich visuelles Verständnis."
+  },
+  "meta/Llama-3.2-90B-Vision-Instruct": {
+    "description": "Fortschrittliche Bildinferenzfähigkeiten für visuelle Verständnisagenten."
+  },
+  "meta/Llama-3.3-70B-Instruct": {
+    "description": "Llama 3.3 ist das fortschrittlichste mehrsprachige Open-Source-Großsprachmodell der Llama-Reihe, das Leistung vergleichbar mit einem 405B-Modell zu sehr niedrigen Kosten bietet. Basierend auf der Transformer-Architektur, verbessert durch überwachtes Feintuning (SFT) und verstärkendes Lernen mit menschlichem Feedback (RLHF) für Nützlichkeit und Sicherheit. Die instruktionsoptimierte Version ist für mehrsprachige Dialoge optimiert und übertrifft viele offene und geschlossene Chatmodelle in verschiedenen Branchenbenchmarks. Wissensstand: Dezember 2023."
+  },
+  "meta/Meta-Llama-3-70B-Instruct": {
+    "description": "Ein leistungsstarkes Modell mit 70 Milliarden Parametern, das hervorragende Leistungen bei Inferenz, Codierung und vielfältigen Sprachaufgaben zeigt."
+  },
+  "meta/Meta-Llama-3-8B-Instruct": {
+    "description": "Ein vielseitiges Modell mit 8 Milliarden Parametern, optimiert für Dialog- und Textgenerierungsaufgaben."
+  },
+  "meta/Meta-Llama-3.1-405B-Instruct": {
+    "description": "Llama 3.1 ist ein instruktionsoptimiertes Textmodell, das für mehrsprachige Dialoganwendungen optimiert wurde und in vielen verfügbaren offenen und geschlossenen Chatmodellen bei gängigen Branchenbenchmarks hervorragende Leistungen zeigt."
+  },
+  "meta/Meta-Llama-3.1-70B-Instruct": {
+    "description": "Llama 3.1 ist ein instruktionsoptimiertes Textmodell, das für mehrsprachige Dialoganwendungen optimiert wurde und in vielen verfügbaren offenen und geschlossenen Chatmodellen bei gängigen Branchenbenchmarks hervorragende Leistungen zeigt."
+  },
+  "meta/Meta-Llama-3.1-8B-Instruct": {
+    "description": "Llama 3.1 ist ein instruktionsoptimiertes Textmodell, das für mehrsprachige Dialoganwendungen optimiert wurde und in vielen verfügbaren offenen und geschlossenen Chatmodellen bei gängigen Branchenbenchmarks hervorragende Leistungen zeigt."
+  },
   "meta/llama-3.1-405b-instruct": {
     "description": "Fortgeschrittenes LLM, das die Generierung synthetischer Daten, Wissensverdichtung und Schlussfolgerungen unterstützt, geeignet für Chatbots, Programmierung und spezifische Aufgaben."
   },
@@ -1610,6 +1649,30 @@
   "meta/llama-3.3-70b-instruct": {
     "description": "Fortschrittliches LLM, das auf Schlussfolgern, Mathematik, Allgemeinwissen und Funktionsaufrufen spezialisiert ist."
   },
+  "microsoft/Phi-3-medium-128k-instruct": {
+    "description": "Dasselbe Phi-3-medium-Modell, jedoch mit größerem Kontextfenster, geeignet für RAG oder wenige Eingabeaufforderungen."
+  },
+  "microsoft/Phi-3-medium-4k-instruct": {
+    "description": "Ein Modell mit 14 Milliarden Parametern, das qualitativ besser als Phi-3-mini ist und sich auf hochwertige, inferenzintensive Daten konzentriert."
+  },
+  "microsoft/Phi-3-mini-128k-instruct": {
+    "description": "Dasselbe Phi-3-mini-Modell, jedoch mit größerem Kontextfenster, geeignet für RAG oder wenige Eingabeaufforderungen."
+  },
+  "microsoft/Phi-3-mini-4k-instruct": {
+    "description": "Das kleinste Mitglied der Phi-3-Familie, optimiert für Qualität und geringe Latenz."
+  },
+  "microsoft/Phi-3-small-128k-instruct": {
+    "description": "Dasselbe Phi-3-small-Modell, jedoch mit größerem Kontextfenster, geeignet für RAG oder wenige Eingabeaufforderungen."
+  },
+  "microsoft/Phi-3-small-8k-instruct": {
+    "description": "Ein Modell mit 7 Milliarden Parametern, das qualitativ besser als Phi-3-mini ist und sich auf hochwertige, inferenzintensive Daten konzentriert."
+  },
+  "microsoft/Phi-3.5-mini-instruct": {
+    "description": "Aktualisierte Version des Phi-3-mini-Modells."
+  },
+  "microsoft/Phi-3.5-vision-instruct": {
+    "description": "Aktualisierte Version des Phi-3-vision-Modells."
+  },
   "microsoft/WizardLM-2-8x22B": {
     "description": "WizardLM 2 ist ein Sprachmodell von Microsoft AI, das in komplexen Dialogen, Mehrsprachigkeit, Inferenz und intelligenten Assistenten besonders gut abschneidet."
   },
@@ -1628,6 +1691,15 @@
   "mistral": {
     "description": "Mistral ist ein 7B-Modell von Mistral AI, das sich für vielfältige Anforderungen an die Sprachverarbeitung eignet."
   },
+  "mistral-ai/Mistral-Large-2411": {
+    "description": "Das Flaggschiffmodell von Mistral, geeignet für komplexe Aufgaben mit großem Inferenzbedarf oder hoher Spezialisierung (Textgenerierung, Codegenerierung, RAG oder Agenten)."
+  },
+  "mistral-ai/Mistral-Nemo": {
+    "description": "Mistral Nemo ist ein hochmodernes Sprachmodell (LLM) mit führenden Fähigkeiten in seiner Größenklasse für Inferenz, Weltwissen und Codierung."
+  },
+  "mistral-ai/mistral-small-2503": {
+    "description": "Mistral Small eignet sich für alle sprachbasierten Aufgaben, die hohe Effizienz und geringe Latenz erfordern."
+  },
   "mistral-large": {
     "description": "Mixtral Large ist das Flaggschiff-Modell von Mistral, das die Fähigkeiten zur Codegenerierung, Mathematik und Schlussfolgerungen kombiniert und ein Kontextfenster von 128k unterstützt."
   },
@@ -1769,6 +1841,9 @@
   "openai/gpt-4o-mini": {
     "description": "GPT-4o mini ist das neueste Modell von OpenAI, das nach GPT-4 Omni veröffentlicht wurde und Text- und Bild-Eingaben unterstützt. Als ihr fortschrittlichstes kleines Modell ist es viel günstiger als andere neueste Modelle und über 60 % günstiger als GPT-3.5 Turbo. Es behält die fortschrittlichste Intelligenz bei und bietet gleichzeitig ein hervorragendes Preis-Leistungs-Verhältnis. GPT-4o mini erzielte 82 % im MMLU-Test und rangiert derzeit in den Chat-Präferenzen über GPT-4."
   },
+  "openai/o1": {
+    "description": "o1 ist OpenAIs neues Inferenzmodell, das Bild- und Texteingaben unterstützt und Text ausgibt. Es eignet sich für komplexe Aufgaben, die umfangreiches Allgemeinwissen erfordern. Das Modell verfügt über einen Kontext von 200K und einen Wissensstand bis Oktober 2023."
+  },
   "openai/o1-mini": {
     "description": "o1-mini ist ein schnelles und kosteneffizientes Inferenzmodell, das für Programmier-, Mathematik- und Wissenschaftsanwendungen entwickelt wurde. Das Modell hat einen Kontext von 128K und einen Wissensstand bis Oktober 2023."
   },
diff --git a/locales/de-DE/setting.json b/locales/de-DE/setting.json
index fc61516916..05c65d658a 100644
--- a/locales/de-DE/setting.json
+++ b/locales/de-DE/setting.json
@@ -259,9 +259,6 @@
     "enableMaxTokens": {
       "title": "Maximale Token pro Antwort aktivieren"
     },
-    "enableReasoningEffort": {
-      "title": "Aktivieren Sie die Anpassung der Schlussfolgerungsintensität"
-    },
     "frequencyPenalty": {
       "desc": "Je höher der Wert, desto vielfältiger und abwechslungsreicher die Wortwahl; je niedriger der Wert, desto einfacher und schlichter die Wortwahl",
       "title": "Wortvielfalt"
@@ -281,15 +278,6 @@
       "desc": "Je höher der Wert, desto eher werden unterschiedliche Ausdrucksweisen bevorzugt, um Wiederholungen zu vermeiden; je niedriger der Wert, desto eher werden wiederholte Konzepte oder Erzählungen verwendet, was zu einer konsistenteren Ausdrucksweise führt",
       "title": "Ausdrucksvielfalt"
     },
-    "reasoningEffort": {
-      "desc": "Je höher der Wert, desto stärker die Schlussfolgerungsfähigkeit, aber dies kann die Antwortzeit und den Tokenverbrauch erhöhen.",
-      "options": {
-        "high": "Hoch",
-        "low": "Niedrig",
-        "medium": "Mittel"
-      },
-      "title": "Schlussfolgerungsintensität"
-    },
     "submit": "Modell-Einstellungen aktualisieren",
     "temperature": {
       "desc": "Je höher der Wert, desto kreativer und einfallsreicher die Antworten; je niedriger der Wert, desto strenger die Antworten",
diff --git a/locales/en-US/chat.json b/locales/en-US/chat.json
index 99902c8839..e8350b4e11 100644
--- a/locales/en-US/chat.json
+++ b/locales/en-US/chat.json
@@ -43,6 +43,9 @@
     "reasoningBudgetToken": {
       "title": "Thinking Consumption Token"
     },
+    "reasoningEffort": {
+      "title": "Reasoning Intensity"
+    },
     "title": "Model Extension Features"
   },
   "history": {
diff --git a/locales/en-US/models.json b/locales/en-US/models.json
index 635ca34d55..b0b0df95c1 100644
--- a/locales/en-US/models.json
+++ b/locales/en-US/models.json
@@ -341,9 +341,6 @@
   "Qwen2.5-Coder-32B-Instruct": {
     "description": "Qwen2.5-Coder-32B-Instruct is a large language model specifically designed for code generation, code understanding, and efficient development scenarios, featuring an industry-leading 32 billion parameters to meet diverse programming needs."
   },
-  "SenseCat-5-1202": {
-    "description": "Based on the latest version V5.5, it shows significant improvements over the previous version in several dimensions, including basic capabilities in Chinese and English, conversation, scientific knowledge, humanities knowledge, writing, mathematical logic, and word count control."
-  },
   "SenseChat": {
     "description": "Basic version model (V4) with a context length of 4K, featuring strong general capabilities."
   },
@@ -356,6 +353,9 @@
   "SenseChat-5": {
     "description": "The latest version model (V5.5) with a context length of 128K shows significant improvements in mathematical reasoning, English conversation, instruction following, and long text comprehension, comparable to GPT-4o."
   },
+  "SenseChat-5-1202": {
+    "description": "Based on version V5.5, this latest release shows significant improvements over the previous version in foundational Chinese and English capabilities, chat, science knowledge, humanities knowledge, writing, mathematical logic, and word count control."
+  },
   "SenseChat-5-Cantonese": {
     "description": "With a context length of 32K, it surpasses GPT-4 in Cantonese conversation comprehension and is competitive with GPT-4 Turbo in knowledge, reasoning, mathematics, and code writing across multiple domains."
   },
@@ -515,6 +515,12 @@
   "ai21-jamba-1.5-mini": {
     "description": "A 52B parameter (12B active) multilingual model, offering a 256K long context window, function calling, structured output, and grounded generation."
   },
+  "ai21-labs/AI21-Jamba-1.5-Large": {
+    "description": "A 398B parameter (94B active) multilingual model providing a 256K long context window, function calling, structured output, and fact-based generation."
+  },
+  "ai21-labs/AI21-Jamba-1.5-Mini": {
+    "description": "A 52B parameter (12B active) multilingual model offering a 256K long context window, function calling, structured output, and fact-based generation."
+  },
   "anthropic.claude-3-5-sonnet-20240620-v1:0": {
     "description": "Claude 3.5 Sonnet raises the industry standard, outperforming competitor models and Claude 3 Opus, excelling in a wide range of evaluations while maintaining the speed and cost of our mid-tier models."
   },
@@ -668,6 +674,12 @@
   "cohere-command-r-plus": {
     "description": "Command R+ is a state-of-the-art RAG-optimized model designed to tackle enterprise-grade workloads."
   },
+  "cohere/Cohere-command-r": {
+    "description": "Command R is a scalable generative model designed for RAG and tool usage, enabling enterprises to achieve production-grade AI."
+  },
+  "cohere/Cohere-command-r-plus": {
+    "description": "Command R+ is a state-of-the-art RAG-optimized model designed to handle enterprise-level workloads."
+  },
   "command": {
     "description": "An instruction-following dialogue model that delivers high quality and reliability in language tasks, with a longer context length compared to our base generation models."
   },
@@ -1028,6 +1040,12 @@
   "gemini-2.5-flash-preview-04-17": {
     "description": "Gemini 2.5 Flash Preview is Google's most cost-effective model, offering a comprehensive set of features."
   },
+  "gemini-2.5-flash-preview-04-17-thinking": {
+    "description": "Gemini 2.5 Flash Preview is Google's most cost-effective model, offering comprehensive capabilities."
+  },
+  "gemini-2.5-flash-preview-05-20": {
+    "description": "Gemini 2.5 Flash Preview is Google's most cost-effective model, offering comprehensive capabilities."
+  },
   "gemini-2.5-pro-exp-03-25": {
     "description": "Gemini 2.5 Pro Experimental is Google's most advanced thinking model, capable of reasoning about complex problems in code, mathematics, and STEM fields, as well as analyzing large datasets, codebases, and documents using long context."
   },
@@ -1262,23 +1280,17 @@
   "grok-2-vision-1212": {
     "description": "This model has improved in accuracy, instruction adherence, and multilingual capabilities."
   },
-  "grok-3-beta": {
-    "description": "A flagship model, proficient in data extraction, programming, and text summarization for enterprise applications, with deep knowledge in fields such as finance, healthcare, law, and science."
+  "grok-3": {
+    "description": "A flagship model skilled in data extraction, programming, and text summarization for enterprise applications, with deep knowledge in finance, healthcare, law, and science."
   },
-  "grok-3-fast-beta": {
-    "description": "A flagship model, proficient in data extraction, programming, and text summarization for enterprise applications, with deep knowledge in fields such as finance, healthcare, law, and science."
+  "grok-3-fast": {
+    "description": "A flagship model skilled in data extraction, programming, and text summarization for enterprise applications, with deep knowledge in finance, healthcare, law, and science."
   },
-  "grok-3-mini-beta": {
-    "description": "A lightweight model that thinks before responding. It operates quickly and intelligently, suitable for logical tasks that do not require deep domain knowledge, while capturing the raw thought process."
+  "grok-3-mini": {
+    "description": "A lightweight model that thinks before responding. It runs fast and intelligently, suitable for logical tasks that do not require deep domain knowledge, and can provide raw thought trajectories."
   },
-  "grok-3-mini-fast-beta": {
-    "description": "A lightweight model that thinks before responding. It operates quickly and intelligently, suitable for logical tasks that do not require deep domain knowledge, while capturing the raw thought process."
-  },
-  "grok-beta": {
-    "description": "Offers performance comparable to Grok 2 but with higher efficiency, speed, and functionality."
-  },
-  "grok-vision-beta": {
-    "description": "The latest image understanding model that can handle a wide range of visual information, including documents, charts, screenshots, and photographs."
+  "grok-3-mini-fast": {
+    "description": "A lightweight model that thinks before responding. It runs fast and intelligently, suitable for logical tasks that do not require deep domain knowledge, and can provide raw thought trajectories."
   },
   "gryphe/mythomax-l2-13b": {
     "description": "MythoMax l2 13B is a language model that combines creativity and intelligence by merging multiple top models."
@@ -1322,6 +1334,9 @@
   "hunyuan-t1-latest": {
     "description": "The industry's first ultra-large-scale Hybrid-Transformer-Mamba inference model, enhancing reasoning capabilities with exceptional decoding speed, further aligning with human preferences."
   },
+  "hunyuan-t1-vision": {
+    "description": "Hunyuan is a multimodal deep thinking model supporting native multimodal chain-of-thought reasoning, excelling in various image reasoning scenarios and significantly outperforming fast-thinking models on science problems."
+  },
   "hunyuan-translation": {
     "description": "Supports translation between Chinese and 15 other languages including English, Japanese, French, Portuguese, Spanish, Turkish, Russian, Arabic, Korean, Italian, German, Vietnamese, Malay, and Indonesian. It is based on a multi-scenario translation evaluation set with automated COMET scoring, demonstrating overall superior translation capabilities compared to similarly scaled models in the market."
   },
@@ -1586,6 +1601,30 @@
   "meta.llama3-8b-instruct-v1:0": {
     "description": "Meta Llama 3 is an open large language model (LLM) aimed at developers, researchers, and enterprises, designed to help them build, experiment, and responsibly scale their generative AI ideas. As part of a foundational system for global community innovation, it is particularly suitable for those with limited computational power and resources, edge devices, and faster training times."
   },
+  "meta/Llama-3.2-11B-Vision-Instruct": {
+    "description": "Exhibits excellent image reasoning capabilities on high-resolution images, suitable for visual understanding applications."
+  },
+  "meta/Llama-3.2-90B-Vision-Instruct": {
+    "description": "Advanced image reasoning capabilities designed for visual understanding agent applications."
+  },
+  "meta/Llama-3.3-70B-Instruct": {
+    "description": "Llama 3.3 is the most advanced multilingual open-source large language model in the Llama series, offering performance comparable to a 405B model at a very low cost. Based on the Transformer architecture, it is enhanced through supervised fine-tuning (SFT) and reinforcement learning with human feedback (RLHF) to improve usefulness and safety. Its instruction-tuned version is optimized for multilingual dialogue and outperforms many open-source and closed chat models on multiple industry benchmarks. Knowledge cutoff date: December 2023."
+  },
+  "meta/Meta-Llama-3-70B-Instruct": {
+    "description": "A powerful 70 billion parameter model excelling in reasoning, coding, and a wide range of language applications."
+  },
+  "meta/Meta-Llama-3-8B-Instruct": {
+    "description": "A versatile 8 billion parameter model optimized for dialogue and text generation tasks."
+  },
+  "meta/Meta-Llama-3.1-405B-Instruct": {
+    "description": "Llama 3.1 instruction-tuned text model optimized for multilingual dialogue use cases, performing excellently on common industry benchmarks among many available open-source and closed chat models."
+  },
+  "meta/Meta-Llama-3.1-70B-Instruct": {
+    "description": "Llama 3.1 instruction-tuned text model optimized for multilingual dialogue use cases, performing excellently on common industry benchmarks among many available open-source and closed chat models."
+  },
+  "meta/Meta-Llama-3.1-8B-Instruct": {
+    "description": "Llama 3.1 instruction-tuned text model optimized for multilingual dialogue use cases, performing excellently on common industry benchmarks among many available open-source and closed chat models."
+  },
   "meta/llama-3.1-405b-instruct": {
     "description": "An advanced LLM supporting synthetic data generation, knowledge distillation, and reasoning, suitable for chatbots, programming, and domain-specific tasks."
   },
@@ -1610,6 +1649,30 @@
   "meta/llama-3.3-70b-instruct": {
     "description": "An advanced LLM skilled in reasoning, mathematics, common sense, and function calling."
   },
+  "microsoft/Phi-3-medium-128k-instruct": {
+    "description": "The same Phi-3-medium model but with a larger context size, suitable for RAG or few-shot prompting."
+  },
+  "microsoft/Phi-3-medium-4k-instruct": {
+    "description": "A 14 billion parameter model with higher quality than Phi-3-mini, focusing on high-quality, reasoning-intensive data."
+  },
+  "microsoft/Phi-3-mini-128k-instruct": {
+    "description": "The same Phi-3-mini model but with a larger context size, suitable for RAG or few-shot prompting."
+  },
+  "microsoft/Phi-3-mini-4k-instruct": {
+    "description": "The smallest member of the Phi-3 family, optimized for quality and low latency."
+  },
+  "microsoft/Phi-3-small-128k-instruct": {
+    "description": "The same Phi-3-small model but with a larger context size, suitable for RAG or few-shot prompting."
+  },
+  "microsoft/Phi-3-small-8k-instruct": {
+    "description": "A 7 billion parameter model with higher quality than Phi-3-mini, focusing on high-quality, reasoning-intensive data."
+  },
+  "microsoft/Phi-3.5-mini-instruct": {
+    "description": "An updated version of the Phi-3-mini model."
+  },
+  "microsoft/Phi-3.5-vision-instruct": {
+    "description": "An updated version of the Phi-3-vision model."
+  },
   "microsoft/WizardLM-2-8x22B": {
     "description": "WizardLM 2 is a language model provided by Microsoft AI, excelling in complex dialogues, multilingual capabilities, reasoning, and intelligent assistant tasks."
   },
@@ -1628,6 +1691,15 @@
   "mistral": {
     "description": "Mistral is a 7B model released by Mistral AI, suitable for diverse language processing needs."
   },
+  "mistral-ai/Mistral-Large-2411": {
+    "description": "Mistral's flagship model, ideal for large-scale reasoning or highly specialized complex tasks such as synthetic text generation, code generation, RAG, or agents."
+  },
+  "mistral-ai/Mistral-Nemo": {
+    "description": "Mistral Nemo is a cutting-edge large language model (LLM) with state-of-the-art reasoning, world knowledge, and coding capabilities in its size category."
+  },
+  "mistral-ai/mistral-small-2503": {
+    "description": "Mistral Small is suitable for any language-based task requiring high efficiency and low latency."
+  },
   "mistral-large": {
     "description": "Mixtral Large is Mistral's flagship model, combining capabilities in code generation, mathematics, and reasoning, supporting a 128k context window."
   },
@@ -1769,6 +1841,9 @@
   "openai/gpt-4o-mini": {
     "description": "GPT-4o mini is the latest model released by OpenAI following GPT-4 Omni, supporting both text and image input while outputting text. As their most advanced small model, it is significantly cheaper than other recent cutting-edge models and over 60% cheaper than GPT-3.5 Turbo. It maintains state-of-the-art intelligence while offering remarkable cost-effectiveness. GPT-4o mini scored 82% on the MMLU test and currently ranks higher than GPT-4 in chat preferences."
   },
+  "openai/o1": {
+    "description": "o1 is OpenAI's new reasoning model that supports multimodal input and outputs text, suitable for complex tasks requiring broad general knowledge. This model features a 200K context window and a knowledge cutoff date of October 2023."
+  },
   "openai/o1-mini": {
     "description": "o1-mini is a fast and cost-effective reasoning model designed for programming, mathematics, and scientific applications. This model features a 128K context and has a knowledge cutoff date of October 2023."
   },
diff --git a/locales/en-US/setting.json b/locales/en-US/setting.json
index 7cd9ad7f74..fd780f5c7d 100644
--- a/locales/en-US/setting.json
+++ b/locales/en-US/setting.json
@@ -259,9 +259,6 @@
     "enableMaxTokens": {
       "title": "Enable Max Tokens Limit"
     },
-    "enableReasoningEffort": {
-      "title": "Enable Reasoning Effort Adjustment"
-    },
     "frequencyPenalty": {
       "desc": "The higher the value, the more diverse and rich the vocabulary; the lower the value, the simpler and more straightforward the language.",
       "title": "Vocabulary Richness"
@@ -281,15 +278,6 @@
       "desc": "The higher the value, the more inclined to use different expressions and avoid concept repetition; the lower the value, the more inclined to use repeated concepts or narratives, resulting in more consistent expression.",
       "title": "Expression Divergence"
     },
-    "reasoningEffort": {
-      "desc": "The higher the value, the stronger the reasoning ability, but it may increase response time and token consumption.",
-      "options": {
-        "high": "High",
-        "low": "Low",
-        "medium": "Medium"
-      },
-      "title": "Reasoning Effort"
-    },
     "submit": "Update Model Settings",
     "temperature": {
       "desc": "The higher the value, the more creative and imaginative the responses; the lower the value, the more rigorous the responses.",
diff --git a/locales/es-ES/chat.json b/locales/es-ES/chat.json
index 2989b3cbc8..c1ef975d04 100644
--- a/locales/es-ES/chat.json
+++ b/locales/es-ES/chat.json
@@ -43,6 +43,9 @@
     "reasoningBudgetToken": {
       "title": "Token de consumo de pensamiento"
     },
+    "reasoningEffort": {
+      "title": "Intensidad de razonamiento"
+    },
     "title": "Funcionalidad de extensión del modelo"
   },
   "history": {
diff --git a/locales/es-ES/models.json b/locales/es-ES/models.json
index e979a0ba7f..d077b526a1 100644
--- a/locales/es-ES/models.json
+++ b/locales/es-ES/models.json
@@ -341,9 +341,6 @@
   "Qwen2.5-Coder-32B-Instruct": {
     "description": "Qwen2.5-Coder-32B-Instruct es un modelo de lenguaje grande diseñado específicamente para la generación de código, comprensión de código y escenarios de desarrollo eficiente, con una escala de 32B parámetros, líder en la industria, capaz de satisfacer diversas necesidades de programación."
   },
-  "SenseCat-5-1202": {
-    "description": "Es la última versión basada en V5.5, que ha mostrado mejoras significativas en varios aspectos en comparación con la versión anterior, incluyendo habilidades básicas en chino e inglés, conversación, conocimientos de ciencias, conocimientos de humanidades, escritura, lógica matemática y control de palabras."
-  },
   "SenseChat": {
     "description": "Modelo de versión básica (V4), longitud de contexto de 4K, con potentes capacidades generales."
   },
@@ -356,6 +353,9 @@
   "SenseChat-5": {
     "description": "Modelo de última versión (V5.5), longitud de contexto de 128K, con capacidades significativamente mejoradas en razonamiento matemático, diálogos en inglés, seguimiento de instrucciones y comprensión de textos largos, comparable a GPT-4o."
   },
+  "SenseChat-5-1202": {
+    "description": "Basado en la versión más reciente V5.5, con mejoras significativas en capacidades básicas en chino e inglés, chat, conocimientos científicos y humanísticos, redacción, lógica matemática y control de longitud de texto."
+  },
   "SenseChat-5-Cantonese": {
     "description": "Longitud de contexto de 32K, supera a GPT-4 en la comprensión de diálogos en cantonés, siendo comparable a GPT-4 Turbo en múltiples áreas como conocimiento, razonamiento, matemáticas y programación."
   },
@@ -515,6 +515,12 @@
   "ai21-jamba-1.5-mini": {
     "description": "Un modelo multilingüe de 52B parámetros (12B activos), que ofrece una ventana de contexto larga de 256K, llamada a funciones, salida estructurada y generación fundamentada."
   },
+  "ai21-labs/AI21-Jamba-1.5-Large": {
+    "description": "Un modelo multilingüe de 398 mil millones de parámetros (94 mil millones activos), que ofrece una ventana de contexto larga de 256K, llamadas a funciones, salida estructurada y generación basada en hechos."
+  },
+  "ai21-labs/AI21-Jamba-1.5-Mini": {
+    "description": "Un modelo multilingüe de 52 mil millones de parámetros (12 mil millones activos), que ofrece una ventana de contexto larga de 256K, llamadas a funciones, salida estructurada y generación basada en hechos."
+  },
   "anthropic.claude-3-5-sonnet-20240620-v1:0": {
     "description": "Claude 3.5 Sonnet eleva el estándar de la industria, superando a modelos competidores y a Claude 3 Opus, destacándose en evaluaciones amplias, mientras mantiene la velocidad y costo de nuestros modelos de nivel medio."
   },
@@ -668,6 +674,12 @@
   "cohere-command-r-plus": {
     "description": "Command R+ es un modelo optimizado para RAG de última generación diseñado para abordar cargas de trabajo de nivel empresarial."
   },
+  "cohere/Cohere-command-r": {
+    "description": "Command R es un modelo generativo escalable diseñado para su uso con RAG y herramientas, que permite a las empresas implementar IA de nivel productivo."
+  },
+  "cohere/Cohere-command-r-plus": {
+    "description": "Command R+ es un modelo optimizado de última generación para RAG, diseñado para manejar cargas de trabajo empresariales."
+  },
   "command": {
     "description": "Un modelo de conversación que sigue instrucciones, ofreciendo alta calidad y fiabilidad en tareas lingüísticas, además de tener una longitud de contexto más larga que nuestros modelos de generación básicos."
   },
@@ -1028,6 +1040,12 @@
   "gemini-2.5-flash-preview-04-17": {
     "description": "Gemini 2.5 Flash Preview es el modelo más rentable de Google, que ofrece una funcionalidad completa."
   },
+  "gemini-2.5-flash-preview-04-17-thinking": {
+    "description": "Gemini 2.5 Flash Preview es el modelo de mejor relación calidad-precio de Google, que ofrece funcionalidades completas."
+  },
+  "gemini-2.5-flash-preview-05-20": {
+    "description": "Gemini 2.5 Flash Preview es el modelo de mejor relación calidad-precio de Google, que ofrece funcionalidades completas."
+  },
   "gemini-2.5-pro-exp-03-25": {
     "description": "Gemini 2.5 Pro Experimental es el modelo de pensamiento más avanzado de Google, capaz de razonar sobre problemas complejos en código, matemáticas y campos STEM, además de utilizar contextos largos para analizar grandes conjuntos de datos, bibliotecas de código y documentos."
   },
@@ -1262,23 +1280,17 @@
   "grok-2-vision-1212": {
     "description": "Este modelo ha mejorado en precisión, cumplimiento de instrucciones y capacidades multilingües."
   },
-  "grok-3-beta": {
-    "description": "Modelo insignia, experto en extracción de datos, programación y resúmenes de texto para aplicaciones empresariales, con un profundo conocimiento en campos como finanzas, salud, derecho y ciencia."
+  "grok-3": {
+    "description": "Modelo insignia, experto en extracción de datos, programación y resumen de texto para aplicaciones empresariales, con profundo conocimiento en finanzas, medicina, derecho y ciencias."
   },
-  "grok-3-fast-beta": {
-    "description": "Modelo insignia, experto en extracción de datos, programación y resúmenes de texto para aplicaciones empresariales, con un profundo conocimiento en campos como finanzas, salud, derecho y ciencia."
+  "grok-3-fast": {
+    "description": "Modelo insignia, experto en extracción de datos, programación y resumen de texto para aplicaciones empresariales, con profundo conocimiento en finanzas, medicina, derecho y ciencias."
   },
-  "grok-3-mini-beta": {
-    "description": "Modelo ligero, que reflexiona antes de la conversación. Rápido e inteligente, adecuado para tareas lógicas que no requieren un conocimiento profundo del dominio, y capaz de capturar la trayectoria de pensamiento original."
+  "grok-3-mini": {
+    "description": "Modelo ligero que piensa antes de responder. Rápido e inteligente, adecuado para tareas lógicas que no requieren conocimientos profundos de dominio y capaz de proporcionar la trayectoria original del pensamiento."
   },
-  "grok-3-mini-fast-beta": {
-    "description": "Modelo ligero, que reflexiona antes de la conversación. Rápido e inteligente, adecuado para tareas lógicas que no requieren un conocimiento profundo del dominio, y capaz de capturar la trayectoria de pensamiento original."
-  },
-  "grok-beta": {
-    "description": "Ofrece un rendimiento comparable al de Grok 2, pero con mayor eficiencia, velocidad y funcionalidad."
-  },
-  "grok-vision-beta": {
-    "description": "El último modelo de comprensión de imágenes, capaz de manejar una amplia variedad de información visual, incluyendo documentos, gráficos, capturas de pantalla y fotos."
+  "grok-3-mini-fast": {
+    "description": "Modelo ligero que piensa antes de responder. Rápido e inteligente, adecuado para tareas lógicas que no requieren conocimientos profundos de dominio y capaz de proporcionar la trayectoria original del pensamiento."
   },
   "gryphe/mythomax-l2-13b": {
     "description": "MythoMax l2 13B es un modelo de lenguaje que combina creatividad e inteligencia, fusionando múltiples modelos de vanguardia."
@@ -1322,6 +1334,9 @@
   "hunyuan-t1-latest": {
     "description": "El primer modelo de inferencia híbrido de gran escala Hybrid-Transformer-Mamba de la industria, que amplía la capacidad de inferencia, ofrece una velocidad de decodificación excepcional y alinea aún más con las preferencias humanas."
   },
+  "hunyuan-t1-vision": {
+    "description": "Modelo de pensamiento profundo multimodal Hunyuan, que soporta cadenas de pensamiento nativas multimodales, sobresale en diversos escenarios de razonamiento con imágenes y mejora significativamente en problemas científicos en comparación con modelos de pensamiento rápido."
+  },
   "hunyuan-translation": {
     "description": "Soporta la traducción entre 15 idiomas, incluyendo chino, inglés, japonés, francés, portugués, español, turco, ruso, árabe, coreano, italiano, alemán, vietnamita, malayo e indonesio, con evaluación automatizada basada en el conjunto de evaluación de traducción en múltiples escenarios y puntuación COMET, superando en general a modelos de tamaño similar en la capacidad de traducción entre idiomas comunes."
   },
@@ -1586,6 +1601,30 @@
   "meta.llama3-8b-instruct-v1:0": {
     "description": "Meta Llama 3 es un modelo de lenguaje de gran tamaño (LLM) abierto dirigido a desarrolladores, investigadores y empresas, diseñado para ayudarles a construir, experimentar y escalar de manera responsable sus ideas de IA generativa. Como parte de un sistema base para la innovación de la comunidad global, es ideal para dispositivos de borde con recursos y capacidades computacionales limitadas, así como para tiempos de entrenamiento más rápidos."
   },
+  "meta/Llama-3.2-11B-Vision-Instruct": {
+    "description": "Destaca en razonamiento de imágenes de alta resolución, ideal para aplicaciones de comprensión visual."
+  },
+  "meta/Llama-3.2-90B-Vision-Instruct": {
+    "description": "Capacidades avanzadas de razonamiento de imágenes para aplicaciones de agentes de comprensión visual."
+  },
+  "meta/Llama-3.3-70B-Instruct": {
+    "description": "Llama 3.3 es el modelo de lenguaje grande multilingüe de código abierto más avanzado de la serie Llama, que ofrece un rendimiento comparable a modelos de 405 mil millones de parámetros a un costo muy bajo. Basado en la arquitectura Transformer, mejorado mediante ajuste fino supervisado (SFT) y aprendizaje por refuerzo con retroalimentación humana (RLHF) para mejorar su utilidad y seguridad. Su versión ajustada por instrucciones está optimizada para diálogos multilingües y supera a muchos modelos de chat abiertos y cerrados en varios puntos de referencia industriales. Fecha de corte de conocimiento: diciembre de 2023."
+  },
+  "meta/Meta-Llama-3-70B-Instruct": {
+    "description": "Un potente modelo de 70 mil millones de parámetros, que destaca en razonamiento, codificación y aplicaciones lingüísticas amplias."
+  },
+  "meta/Meta-Llama-3-8B-Instruct": {
+    "description": "Un modelo versátil de 8 mil millones de parámetros, optimizado para tareas de diálogo y generación de texto."
+  },
+  "meta/Meta-Llama-3.1-405B-Instruct": {
+    "description": "Modelo de texto ajustado por instrucciones Llama 3.1, optimizado para casos de uso de diálogo multilingüe, con un rendimiento destacado en muchos modelos de chat abiertos y cerrados disponibles y en puntos de referencia industriales comunes."
+  },
+  "meta/Meta-Llama-3.1-70B-Instruct": {
+    "description": "Modelo de texto ajustado por instrucciones Llama 3.1, optimizado para casos de uso de diálogo multilingüe, con un rendimiento destacado en muchos modelos de chat abiertos y cerrados disponibles y en puntos de referencia industriales comunes."
+  },
+  "meta/Meta-Llama-3.1-8B-Instruct": {
+    "description": "Modelo de texto ajustado por instrucciones Llama 3.1, optimizado para casos de uso de diálogo multilingüe, con un rendimiento destacado en muchos modelos de chat abiertos y cerrados disponibles y en puntos de referencia industriales comunes."
+  },
   "meta/llama-3.1-405b-instruct": {
     "description": "LLM avanzado, que soporta generación de datos sintéticos, destilación de conocimiento y razonamiento, adecuado para chatbots, programación y tareas de dominio específico."
   },
@@ -1610,6 +1649,30 @@
   "meta/llama-3.3-70b-instruct": {
     "description": "Modelo LLM avanzado, experto en razonamiento, matemáticas, sentido común y llamadas a funciones."
   },
+  "microsoft/Phi-3-medium-128k-instruct": {
+    "description": "El mismo modelo Phi-3-medium, pero con un tamaño de contexto mayor, adecuado para RAG o indicaciones breves."
+  },
+  "microsoft/Phi-3-medium-4k-instruct": {
+    "description": "Un modelo de 14 mil millones de parámetros, con mejor calidad que Phi-3-mini, enfocado en datos de alta calidad y razonamiento intensivo."
+  },
+  "microsoft/Phi-3-mini-128k-instruct": {
+    "description": "El mismo modelo Phi-3-mini, pero con un tamaño de contexto mayor, adecuado para RAG o indicaciones breves."
+  },
+  "microsoft/Phi-3-mini-4k-instruct": {
+    "description": "El miembro más pequeño de la familia Phi-3, optimizado para calidad y baja latencia."
+  },
+  "microsoft/Phi-3-small-128k-instruct": {
+    "description": "El mismo modelo Phi-3-small, pero con un tamaño de contexto mayor, adecuado para RAG o indicaciones breves."
+  },
+  "microsoft/Phi-3-small-8k-instruct": {
+    "description": "Un modelo de 7 mil millones de parámetros, con mejor calidad que Phi-3-mini, enfocado en datos de alta calidad y razonamiento intensivo."
+  },
+  "microsoft/Phi-3.5-mini-instruct": {
+    "description": "Versión actualizada del modelo Phi-3-mini."
+  },
+  "microsoft/Phi-3.5-vision-instruct": {
+    "description": "Versión actualizada del modelo Phi-3-vision."
+  },
   "microsoft/WizardLM-2-8x22B": {
     "description": "WizardLM 2 es un modelo de lenguaje proporcionado por Microsoft AI, que destaca en diálogos complejos, multilingüismo, razonamiento y asistentes inteligentes."
   },
@@ -1628,6 +1691,15 @@
   "mistral": {
     "description": "Mistral es un modelo de 7B lanzado por Mistral AI, adecuado para necesidades de procesamiento de lenguaje variables."
   },
+  "mistral-ai/Mistral-Large-2411": {
+    "description": "El modelo insignia de Mistral, adecuado para tareas complejas que requieren capacidades de razonamiento a gran escala o alta especialización (generación de texto sintético, generación de código, RAG o agentes)."
+  },
+  "mistral-ai/Mistral-Nemo": {
+    "description": "Mistral Nemo es un modelo de lenguaje avanzado (LLM) que ofrece capacidades de razonamiento, conocimiento mundial y codificación líderes en su categoría de tamaño."
+  },
+  "mistral-ai/mistral-small-2503": {
+    "description": "Mistral Small está disponible para cualquier tarea basada en lenguaje que requiera alta eficiencia y baja latencia."
+  },
   "mistral-large": {
     "description": "Mixtral Large es el modelo insignia de Mistral, combinando capacidades de generación de código, matemáticas y razonamiento, soportando una ventana de contexto de 128k."
   },
@@ -1769,6 +1841,9 @@
   "openai/gpt-4o-mini": {
     "description": "GPT-4o mini es el modelo más reciente de OpenAI, lanzado después de GPT-4 Omni, que admite entradas de texto e imagen y genera texto como salida. Como su modelo más avanzado de tamaño pequeño, es mucho más económico que otros modelos de vanguardia recientes y más de un 60% más barato que GPT-3.5 Turbo. Mantiene una inteligencia de vanguardia mientras ofrece una relación calidad-precio notable. GPT-4o mini obtuvo un puntaje del 82% en la prueba MMLU y actualmente se clasifica por encima de GPT-4 en preferencias de chat."
   },
+  "openai/o1": {
+    "description": "o1 es el nuevo modelo de razonamiento de OpenAI, que admite entradas de texto e imagen y produce texto, adecuado para tareas complejas que requieren un conocimiento general amplio. Este modelo cuenta con un contexto de 200K y una fecha de corte de conocimiento en octubre de 2023."
+  },
   "openai/o1-mini": {
     "description": "o1-mini es un modelo de inferencia rápido y rentable diseñado para aplicaciones de programación, matemáticas y ciencias. Este modelo tiene un contexto de 128K y una fecha de corte de conocimiento en octubre de 2023."
   },
diff --git a/locales/es-ES/setting.json b/locales/es-ES/setting.json
index 94272e30ca..65bc94ab86 100644
--- a/locales/es-ES/setting.json
+++ b/locales/es-ES/setting.json
@@ -259,9 +259,6 @@
     "enableMaxTokens": {
       "title": "Activar límite de tokens por respuesta"
     },
-    "enableReasoningEffort": {
-      "title": "Activar ajuste de intensidad de razonamiento"
-    },
     "frequencyPenalty": {
       "desc": "Cuanto mayor sea el valor, más rica y variada será la elección de palabras; cuanto menor sea el valor, más simples y directas serán las palabras.",
       "title": "Riqueza del vocabulario"
@@ -281,15 +278,6 @@
       "desc": "Cuanto mayor sea el valor, más se inclinará hacia diferentes formas de expresión, evitando la repetición de conceptos; cuanto menor sea el valor, más se inclinará hacia el uso de conceptos o narrativas repetidas, expresando mayor consistencia.",
       "title": "Diversidad de expresión"
     },
-    "reasoningEffort": {
-      "desc": "Cuanto mayor sea el valor, más fuerte será la capacidad de razonamiento, pero puede aumentar el tiempo de respuesta y el consumo de tokens.",
-      "options": {
-        "high": "Alto",
-        "low": "Bajo",
-        "medium": "Medio"
-      },
-      "title": "Intensidad de razonamiento"
-    },
     "submit": "Actualizar configuración del modelo",
     "temperature": {
       "desc": "Cuanto mayor sea el valor, más creativas e imaginativas serán las respuestas; cuanto menor sea el valor, más rigurosas serán las respuestas",
diff --git a/locales/fa-IR/chat.json b/locales/fa-IR/chat.json
index d35eba51f5..e622b15569 100644
--- a/locales/fa-IR/chat.json
+++ b/locales/fa-IR/chat.json
@@ -43,6 +43,9 @@
     "reasoningBudgetToken": {
       "title": "توکن مصرف تفکر"
     },
+    "reasoningEffort": {
+      "title": "شدت استدلال"
+    },
     "title": "ویژگی‌های گسترش مدل"
   },
   "history": {
diff --git a/locales/fa-IR/models.json b/locales/fa-IR/models.json
index 0e081a9dcb..4589232775 100644
--- a/locales/fa-IR/models.json
+++ b/locales/fa-IR/models.json
@@ -341,9 +341,6 @@
   "Qwen2.5-Coder-32B-Instruct": {
     "description": "Qwen2.5-Coder-32B-Instruct یک مدل زبان بزرگ است که به طور خاص برای تولید کد، درک کد و سناریوهای توسعه کارآمد طراحی شده است و از مقیاس 32B پارامتر پیشرفته در صنعت بهره می‌برد و می‌تواند نیازهای متنوع برنامه‌نویسی را برآورده کند."
   },
-  "SenseCat-5-1202": {
-    "description": "نسخه جدیدترین بر اساس V5.5 است که در مقایسه با نسخه قبلی در توانایی‌های پایه چینی و انگلیسی، چت، دانش علوم، دانش انسانی، نوشتن، منطق ریاضی و کنترل تعداد کلمات به طور قابل توجهی بهبود یافته است."
-  },
   "SenseChat": {
     "description": "نسخه پایه مدل (V4)، طول متن ۴K، با توانایی‌های عمومی قوی"
   },
@@ -356,6 +353,9 @@
   "SenseChat-5": {
     "description": "جدیدترین نسخه مدل (V5.5)، با طول زمینه 128K، بهبود قابل توجه در زمینه‌های استدلال ریاضی، مکالمه انگلیسی، پیروی از دستورات و درک متون طولانی، قابل مقایسه با GPT-4o"
   },
+  "SenseChat-5-1202": {
+    "description": "نسخه جدید مبتنی بر V5.5 که نسبت به نسخه قبلی در توانایی‌های پایه‌ای زبان‌های چینی و انگلیسی، گفتگو، دانش علوم پایه، دانش علوم انسانی، نوشتار، منطق ریاضی و کنترل تعداد کلمات بهبود قابل توجهی داشته است."
+  },
   "SenseChat-5-Cantonese": {
     "description": "طول متن 32K، در درک مکالمات به زبان کانتونی از GPT-4 پیشی می‌گیرد و در زمینه‌های مختلفی مانند دانش، استدلال، ریاضیات و برنامه‌نویسی با GPT-4 Turbo قابل مقایسه است."
   },
@@ -515,6 +515,12 @@
   "ai21-jamba-1.5-mini": {
     "description": "یک مدل چندزبانه با 52 میلیارد پارامتر (12 میلیارد فعال) که پنجره متنی طولانی 256K، فراخوانی توابع، خروجی ساختاریافته و تولید مبتنی بر واقعیت را ارائه می‌دهد."
   },
+  "ai21-labs/AI21-Jamba-1.5-Large": {
+    "description": "یک مدل چندزبانه با ۳۹۸ میلیارد پارامتر (۹۴ میلیارد فعال) که پنجره زمینه ۲۵۶ هزار توکنی، فراخوانی توابع، خروجی ساختاریافته و تولید مبتنی بر واقعیت را ارائه می‌دهد."
+  },
+  "ai21-labs/AI21-Jamba-1.5-Mini": {
+    "description": "یک مدل چندزبانه با ۵۲ میلیارد پارامتر (۱۲ میلیارد فعال) که پنجره زمینه ۲۵۶ هزار توکنی، فراخوانی توابع، خروجی ساختاریافته و تولید مبتنی بر واقعیت را ارائه می‌دهد."
+  },
   "anthropic.claude-3-5-sonnet-20240620-v1:0": {
     "description": "Claude 3.5 Sonnet استانداردهای صنعت را ارتقا داده است، عملکردی بهتر از مدل‌های رقیب و Claude 3 Opus دارد، در ارزیابی‌های گسترده به خوبی عمل کرده و در عین حال سرعت و هزینه مدل‌های سطح متوسط ما را حفظ می‌کند."
   },
@@ -668,6 +674,12 @@
   "cohere-command-r-plus": {
     "description": "Command R+ یک مدل پیشرفته بهینه‌سازی RAG است که برای مدیریت بارهای کاری در سطح سازمانی طراحی شده است."
   },
+  "cohere/Cohere-command-r": {
+    "description": "Command R یک مدل تولیدی مقیاس‌پذیر است که برای استفاده در RAG و ابزارها طراحی شده است تا به کسب‌وکارها امکان پیاده‌سازی هوش مصنوعی در سطح تولید را بدهد."
+  },
+  "cohere/Cohere-command-r-plus": {
+    "description": "Command R+ یک مدل بهینه‌سازی شده پیشرفته برای RAG است که برای بارهای کاری سازمانی طراحی شده است."
+  },
   "command": {
     "description": "یک مدل گفتگوی پیروی از دستور که در وظایف زبانی کیفیت بالاتر و قابلیت اطمینان بیشتری را ارائه می‌دهد و نسبت به مدل‌های تولید پایه ما دارای طول زمینه بیشتری است."
   },
@@ -1028,6 +1040,12 @@
   "gemini-2.5-flash-preview-04-17": {
     "description": "پیش‌نمایش فلش Gemini 2.5 مدل با بهترین قیمت و کیفیت گوگل است که امکانات جامع و کاملی را ارائه می‌دهد."
   },
+  "gemini-2.5-flash-preview-04-17-thinking": {
+    "description": "Gemini 2.5 Flash Preview مقرون‌به‌صرفه‌ترین مدل گوگل است که امکانات جامع ارائه می‌دهد."
+  },
+  "gemini-2.5-flash-preview-05-20": {
+    "description": "Gemini 2.5 Flash Preview مقرون‌به‌صرفه‌ترین مدل گوگل است که امکانات جامع ارائه می‌دهد."
+  },
   "gemini-2.5-pro-exp-03-25": {
     "description": "Gemini 2.5 Pro Experimental پیشرفته‌ترین مدل تفکر گوگل است که قادر به استدلال در مورد مسائل پیچیده در زمینه‌های کد، ریاضیات و STEM می‌باشد و همچنین می‌تواند با استفاده از زمینه‌های طولانی، مجموعه‌های داده بزرگ، کتابخانه‌های کد و مستندات را تحلیل کند."
   },
@@ -1262,23 +1280,17 @@
   "grok-2-vision-1212": {
     "description": "این مدل در دقت، پیروی از دستورات و توانایی چند زبانه بهبود یافته است."
   },
-  "grok-3-beta": {
-    "description": "مدل پرچمدار، متخصص در استخراج داده، برنامه‌نویسی و خلاصه‌سازی متن برای کاربردهای سازمانی، با دانش عمیق در زمینه‌های مالی، پزشکی، حقوقی و علمی."
+  "grok-3": {
+    "description": "مدل پرچمدار که در استخراج داده، برنامه‌نویسی و خلاصه‌سازی متن برای کاربردهای سازمانی مهارت دارد و دانش عمیقی در حوزه‌های مالی، پزشکی، حقوقی و علمی دارد."
   },
-  "grok-3-fast-beta": {
-    "description": "مدل پرچمدار، متخصص در استخراج داده، برنامه‌نویسی و خلاصه‌سازی متن برای کاربردهای سازمانی، با دانش عمیق در زمینه‌های مالی، پزشکی، حقوقی و علمی."
+  "grok-3-fast": {
+    "description": "مدل پرچمدار که در استخراج داده، برنامه‌نویسی و خلاصه‌سازی متن برای کاربردهای سازمانی مهارت دارد و دانش عمیقی در حوزه‌های مالی، پزشکی، حقوقی و علمی دارد."
   },
-  "grok-3-mini-beta": {
-    "description": "مدل سبک‌وزن، قبل از گفتگو فکر می‌کند. سریع و هوشمند است و برای وظایف منطقی که به دانش عمیق حوزه نیاز ندارند مناسب است و می‌تواند مسیر تفکر اولیه را به دست آورد."
+  "grok-3-mini": {
+    "description": "مدل سبک‌وزن که قبل از پاسخگویی تفکر می‌کند. سریع و هوشمند اجرا می‌شود، مناسب برای وظایف منطقی که نیاز به دانش عمیق حوزه ندارند و می‌تواند مسیر تفکر اصلی را ارائه دهد."
   },
-  "grok-3-mini-fast-beta": {
-    "description": "مدل سبک‌وزن، قبل از گفتگو فکر می‌کند. سریع و هوشمند است و برای وظایف منطقی که به دانش عمیق حوزه نیاز ندارند مناسب است و می‌تواند مسیر تفکر اولیه را به دست آورد."
-  },
-  "grok-beta": {
-    "description": "عملکردی معادل Grok 2 دارد، اما با کارایی، سرعت و قابلیت‌های بالاتر."
-  },
-  "grok-vision-beta": {
-    "description": "جدیدترین مدل درک تصویر که می‌تواند انواع مختلف اطلاعات بصری از جمله اسناد، نمودارها، اسکرین‌شات‌ها و عکس‌ها را پردازش کند."
+  "grok-3-mini-fast": {
+    "description": "مدل سبک‌وزن که قبل از پاسخگویی تفکر می‌کند. سریع و هوشمند اجرا می‌شود، مناسب برای وظایف منطقی که نیاز به دانش عمیق حوزه ندارند و می‌تواند مسیر تفکر اصلی را ارائه دهد."
   },
   "gryphe/mythomax-l2-13b": {
     "description": "MythoMax l2 13B یک مدل زبانی است که خلاقیت و هوش را با ترکیب چندین مدل برتر به هم پیوند می‌دهد."
@@ -1322,6 +1334,9 @@
   "hunyuan-t1-latest": {
     "description": "اولین مدل استدلال هیبریدی-ترنسفورمر-مامبا با مقیاس فوق‌العاده بزرگ در صنعت، که توانایی استدلال را گسترش می‌دهد و سرعت رمزگشایی فوق‌العاده‌ای دارد و به طور بیشتری با ترجیحات انسانی هم‌راستا می‌شود."
   },
+  "hunyuan-t1-vision": {
+    "description": "مدل تفکر عمیق چندرسانه‌ای Hunyuan که از زنجیره تفکر بلند بومی چندرسانه‌ای پشتیبانی می‌کند، در پردازش انواع سناریوهای استدلال تصویری مهارت دارد و در مسائل علمی نسبت به مدل تفکر سریع بهبود قابل توجهی دارد."
+  },
   "hunyuan-translation": {
     "description": "از ۱۵ زبان شامل چینی، انگلیسی، ژاپنی، فرانسوی، پرتغالی، اسپانیایی، ترکی، روسی، عربی، کره‌ای، ایتالیایی، آلمانی، ویتنامی، مالایی و اندونزیایی پشتیبانی می‌کند و به طور خودکار با استفاده از مجموعه ارزیابی ترجمه چند صحنه‌ای، امتیاز COMET را ارزیابی می‌کند. در توانایی ترجمه متقابل در بیش از ده زبان رایج، به طور کلی از مدل‌های هم‌مقیاس در بازار برتر است."
   },
@@ -1586,6 +1601,30 @@
   "meta.llama3-8b-instruct-v1:0": {
     "description": "Meta Llama 3 یک مدل زبان بزرگ باز (LLM) است که برای توسعه‌دهندگان، پژوهشگران و شرکت‌ها طراحی شده است تا به آن‌ها در ساخت، آزمایش و گسترش مسئولانه ایده‌های هوش مصنوعی مولد کمک کند. به عنوان بخشی از سیستم پایه نوآوری جامعه جهانی، این مدل برای دستگاه‌های با توان محاسباتی و منابع محدود، دستگاه‌های لبه و زمان‌های آموزش سریع‌تر بسیار مناسب است."
   },
+  "meta/Llama-3.2-11B-Vision-Instruct": {
+    "description": "توانایی استدلال تصویری برجسته در تصاویر با وضوح بالا، مناسب برای برنامه‌های درک بصری."
+  },
+  "meta/Llama-3.2-90B-Vision-Instruct": {
+    "description": "توانایی استدلال تصویری پیشرفته برای برنامه‌های عامل درک بصری."
+  },
+  "meta/Llama-3.3-70B-Instruct": {
+    "description": "Llama 3.3 پیشرفته‌ترین مدل زبان بزرگ چندزبانه متن‌باز در سری Llama است که عملکردی مشابه مدل ۴۰۵ میلیارد پارامتری را با هزینه بسیار پایین ارائه می‌دهد. مبتنی بر ساختار ترنسفورمر و با بهبودهای نظارت شده (SFT) و یادگیری تقویتی با بازخورد انسانی (RLHF) برای افزایش کارایی و ایمنی. نسخه تنظیم شده برای دستورالعمل بهینه شده برای گفتگوهای چندزبانه است و در معیارهای صنعتی متعدد از بسیاری از مدل‌های چت متن‌باز و بسته بهتر عمل می‌کند. تاریخ قطع دانش: دسامبر ۲۰۲۳."
+  },
+  "meta/Meta-Llama-3-70B-Instruct": {
+    "description": "یک مدل قدرتمند با ۷۰ میلیارد پارامتر که در استدلال، کدنویسی و کاربردهای گسترده زبانی عملکرد برجسته‌ای دارد."
+  },
+  "meta/Meta-Llama-3-8B-Instruct": {
+    "description": "یک مدل چندمنظوره با ۸ میلیارد پارامتر که برای وظایف گفتگو و تولید متن بهینه شده است."
+  },
+  "meta/Meta-Llama-3.1-405B-Instruct": {
+    "description": "مدل متنی تنظیم شده برای دستورالعمل Llama 3.1 که برای موارد استفاده گفتگوهای چندزبانه بهینه شده و در بسیاری از مدل‌های چت متن‌باز و بسته موجود، در معیارهای صنعتی رایج عملکرد برجسته‌ای دارد."
+  },
+  "meta/Meta-Llama-3.1-70B-Instruct": {
+    "description": "مدل متنی تنظیم شده برای دستورالعمل Llama 3.1 که برای موارد استفاده گفتگوهای چندزبانه بهینه شده و در بسیاری از مدل‌های چت متن‌باز و بسته موجود، در معیارهای صنعتی رایج عملکرد برجسته‌ای دارد."
+  },
+  "meta/Meta-Llama-3.1-8B-Instruct": {
+    "description": "مدل متنی تنظیم شده برای دستورالعمل Llama 3.1 که برای موارد استفاده گفتگوهای چندزبانه بهینه شده و در بسیاری از مدل‌های چت متن‌باز و بسته موجود، در معیارهای صنعتی رایج عملکرد برجسته‌ای دارد."
+  },
   "meta/llama-3.1-405b-instruct": {
     "description": "مدل LLM پیشرفته که از تولید داده‌های ترکیبی، تقطیر دانش و استدلال پشتیبانی می‌کند و برای ربات‌های چت، برنامه‌نویسی و وظایف خاص مناسب است."
   },
@@ -1610,6 +1649,30 @@
   "meta/llama-3.3-70b-instruct": {
     "description": "مدل LLM پیشرفته که در استدلال، ریاضیات، دانش عمومی و فراخوانی توابع مهارت دارد."
   },
+  "microsoft/Phi-3-medium-128k-instruct": {
+    "description": "همان مدل Phi-3-medium با اندازه زمینه بزرگ‌تر، مناسب برای RAG یا تعداد کمی از پرامپت‌ها."
+  },
+  "microsoft/Phi-3-medium-4k-instruct": {
+    "description": "مدلی با ۱۴ میلیارد پارامتر که کیفیت آن از Phi-3-mini بالاتر است و تمرکز بر داده‌های با کیفیت و استدلالی دارد."
+  },
+  "microsoft/Phi-3-mini-128k-instruct": {
+    "description": "همان مدل Phi-3-mini با اندازه زمینه بزرگ‌تر، مناسب برای RAG یا تعداد کمی از پرامپت‌ها."
+  },
+  "microsoft/Phi-3-mini-4k-instruct": {
+    "description": "کوچک‌ترین عضو خانواده Phi-3 که برای کیفیت و تأخیر کم بهینه شده است."
+  },
+  "microsoft/Phi-3-small-128k-instruct": {
+    "description": "همان مدل Phi-3-small با اندازه زمینه بزرگ‌تر، مناسب برای RAG یا تعداد کمی از پرامپت‌ها."
+  },
+  "microsoft/Phi-3-small-8k-instruct": {
+    "description": "مدلی با ۷ میلیارد پارامتر که کیفیت آن از Phi-3-mini بالاتر است و تمرکز بر داده‌های با کیفیت و استدلالی دارد."
+  },
+  "microsoft/Phi-3.5-mini-instruct": {
+    "description": "نسخه به‌روزشده مدل Phi-3-mini."
+  },
+  "microsoft/Phi-3.5-vision-instruct": {
+    "description": "نسخه به‌روزشده مدل Phi-3-vision."
+  },
   "microsoft/WizardLM-2-8x22B": {
     "description": "WizardLM 2 یک مدل زبانی است که توسط AI مایکروسافت ارائه شده و در زمینه‌های گفتگوی پیچیده، چند زبانه، استدلال و دستیار هوشمند به ویژه عملکرد خوبی دارد."
   },
@@ -1628,6 +1691,15 @@
   "mistral": {
     "description": "Mistral یک مدل 7B است که توسط Mistral AI منتشر شده و برای نیازهای متنوع پردازش زبان مناسب است."
   },
+  "mistral-ai/Mistral-Large-2411": {
+    "description": "مدل پرچمدار Mistral که برای وظایف پیچیده‌ای که نیاز به توان استدلال در مقیاس بزرگ یا تخصصی بالا دارند (تولید متن ترکیبی، تولید کد، RAG یا عامل‌ها) مناسب است."
+  },
+  "mistral-ai/Mistral-Nemo": {
+    "description": "Mistral Nemo یک مدل زبان پیشرفته (LLM) است که در دسته اندازه خود دارای بهترین توانایی‌های استدلال، دانش جهانی و کدنویسی است."
+  },
+  "mistral-ai/mistral-small-2503": {
+    "description": "Mistral Small برای هر وظیفه مبتنی بر زبان که نیاز به کارایی بالا و تأخیر کم دارد، قابل استفاده است."
+  },
   "mistral-large": {
     "description": "Mixtral Large مدل پرچمدار Mistral است که توانایی تولید کد، ریاضیات و استدلال را ترکیب می‌کند و از پنجره متنی ۱۲۸k پشتیبانی می‌کند."
   },
@@ -1769,6 +1841,9 @@
   "openai/gpt-4o-mini": {
     "description": "GPT-4o mini جدیدترین مدل OpenAI است که پس از GPT-4 Omni عرضه شده و از ورودی‌های تصویری و متنی پشتیبانی می‌کند و خروجی متنی ارائه می‌دهد. به عنوان پیشرفته‌ترین مدل کوچک آن‌ها، این مدل بسیار ارزان‌تر از سایر مدل‌های پیشرفته اخیر است و بیش از ۶۰٪ ارزان‌تر از GPT-3.5 Turbo می‌باشد. این مدل هوشمندی پیشرفته را حفظ کرده و در عین حال از نظر اقتصادی بسیار مقرون به صرفه است. GPT-4o mini در آزمون MMLU امتیاز ۸۲٪ را کسب کرده و در حال حاضر در ترجیحات چت بالاتر از GPT-4 رتبه‌بندی شده است."
   },
+  "openai/o1": {
+    "description": "o1 مدل استدلال جدید OpenAI است که از ورودی‌های تصویری و متنی پشتیبانی می‌کند و خروجی متنی ارائه می‌دهد، مناسب برای وظایف پیچیده‌ای که نیاز به دانش عمومی گسترده دارند. این مدل دارای زمینه ۲۰۰ هزار توکنی و تاریخ قطع دانش در اکتبر ۲۰۲۳ است."
+  },
   "openai/o1-mini": {
     "description": "o1-mini یک مدل استنتاج سریع و مقرون‌به‌صرفه است که برای برنامه‌نویسی، ریاضیات و کاربردهای علمی طراحی شده است. این مدل دارای ۱۲۸ هزار بایت زمینه و تاریخ قطع دانش تا اکتبر ۲۰۲۳ می‌باشد."
   },
diff --git a/locales/fa-IR/setting.json b/locales/fa-IR/setting.json
index 60406c9609..131be75b6c 100644
--- a/locales/fa-IR/setting.json
+++ b/locales/fa-IR/setting.json
@@ -259,9 +259,6 @@
     "enableMaxTokens": {
       "title": "فعال‌سازی محدودیت پاسخ"
     },
-    "enableReasoningEffort": {
-      "title": "فعال‌سازی تنظیم شدت استدلال"
-    },
     "frequencyPenalty": {
       "desc": "هر چه مقدار بزرگتر باشد، واژگان متنوع‌تر و غنی‌تری استفاده می‌شود؛ هر چه مقدار کوچکتر باشد، واژگان ساده‌تر و عادی‌تر خواهند بود.",
       "title": "تنوع واژگان"
@@ -281,15 +278,6 @@
       "desc": "هر چه مقدار بزرگتر باشد، تمایل به استفاده از عبارات مختلف بیشتر می‌شود و از تکرار مفاهیم جلوگیری می‌کند؛ هر چه مقدار کوچکتر باشد، تمایل به استفاده از مفاهیم یا روایت‌های تکراری بیشتر می‌شود و بیان یکدست‌تری خواهد داشت.",
       "title": "گستردگی بیان"
     },
-    "reasoningEffort": {
-      "desc": "هرچه مقدار بیشتر باشد، توانایی استدلال قوی‌تر است، اما ممکن است زمان پاسخ و مصرف توکن را افزایش دهد",
-      "options": {
-        "high": "بالا",
-        "low": "پایین",
-        "medium": "متوسط"
-      },
-      "title": "شدت استدلال"
-    },
     "submit": "به‌روزرسانی تنظیمات مدل",
     "temperature": {
       "desc": "هر چه عدد بزرگتر باشد، پاسخ‌ها خلاقانه‌تر و تخیلی‌تر خواهند بود؛ هر چه عدد کوچکتر باشد، پاسخ‌ها دقیق‌تر خواهند بود",
diff --git a/locales/fr-FR/chat.json b/locales/fr-FR/chat.json
index 3418648be7..07ab2a181b 100644
--- a/locales/fr-FR/chat.json
+++ b/locales/fr-FR/chat.json
@@ -43,6 +43,9 @@
     "reasoningBudgetToken": {
       "title": "Token de consommation de réflexion"
     },
+    "reasoningEffort": {
+      "title": "Intensité du raisonnement"
+    },
     "title": "Fonctionnalités d'extension du modèle"
   },
   "history": {
diff --git a/locales/fr-FR/models.json b/locales/fr-FR/models.json
index 23f5526971..9c91f31fb3 100644
--- a/locales/fr-FR/models.json
+++ b/locales/fr-FR/models.json
@@ -341,9 +341,6 @@
   "Qwen2.5-Coder-32B-Instruct": {
     "description": "Qwen2.5-Coder-32B-Instruct est un grand modèle de langage conçu pour la génération de code, la compréhension de code et les scénarios de développement efficaces, avec une échelle de 32 milliards de paramètres, répondant à des besoins de programmation variés."
   },
-  "SenseCat-5-1202": {
-    "description": "Basé sur la version V5.5, cette version présente des améliorations significatives par rapport à la précédente dans plusieurs dimensions, notamment les compétences de base en chinois et en anglais, la conversation, les connaissances en sciences, les connaissances en lettres, l'écriture, la logique mathématique et le contrôle du nombre de mots."
-  },
   "SenseChat": {
     "description": "Modèle de version de base (V4), longueur de contexte de 4K, avec de puissantes capacités générales."
   },
@@ -356,6 +353,9 @@
   "SenseChat-5": {
     "description": "Modèle de dernière version (V5.5), longueur de contexte de 128K, avec des capacités significativement améliorées dans le raisonnement mathématique, les dialogues en anglais, le suivi d'instructions et la compréhension de longs textes, rivalisant avec GPT-4o."
   },
+  "SenseChat-5-1202": {
+    "description": "Basé sur la version V5.5 la plus récente, avec des améliorations significatives par rapport à la version précédente dans plusieurs dimensions telles que les capacités de base en chinois et en anglais, le dialogue, les connaissances scientifiques, les connaissances littéraires, la rédaction, la logique mathématique et le contrôle du nombre de mots."
+  },
   "SenseChat-5-Cantonese": {
     "description": "Longueur de contexte de 32K, surpassant GPT-4 dans la compréhension des dialogues en cantonais, rivalisant avec GPT-4 Turbo dans plusieurs domaines tels que les connaissances, le raisonnement, les mathématiques et la rédaction de code."
   },
@@ -515,6 +515,12 @@
   "ai21-jamba-1.5-mini": {
     "description": "Un modèle multilingue de 52 milliards de paramètres (12 milliards actifs), offrant une fenêtre de contexte longue de 256K, des appels de fonction, une sortie structurée et une génération ancrée."
   },
+  "ai21-labs/AI21-Jamba-1.5-Large": {
+    "description": "Un modèle multilingue de 398 milliards de paramètres (94 milliards actifs), offrant une fenêtre contextuelle longue de 256K, des appels de fonctions, une sortie structurée et une génération factuelle."
+  },
+  "ai21-labs/AI21-Jamba-1.5-Mini": {
+    "description": "Un modèle multilingue de 52 milliards de paramètres (12 milliards actifs), offrant une fenêtre contextuelle longue de 256K, des appels de fonctions, une sortie structurée et une génération factuelle."
+  },
   "anthropic.claude-3-5-sonnet-20240620-v1:0": {
     "description": "Claude 3.5 Sonnet élève les normes de l'industrie, surpassant les modèles concurrents et Claude 3 Opus, avec d'excellentes performances dans une large gamme d'évaluations, tout en offrant la vitesse et le coût de nos modèles de niveau intermédiaire."
   },
@@ -668,6 +674,12 @@
   "cohere-command-r-plus": {
     "description": "Command R+ est un modèle optimisé RAG de pointe conçu pour traiter des charges de travail de niveau entreprise."
   },
+  "cohere/Cohere-command-r": {
+    "description": "Command R est un modèle génératif évolutif conçu pour l'utilisation avec RAG et les outils, permettant aux entreprises de déployer une IA de niveau production."
+  },
+  "cohere/Cohere-command-r-plus": {
+    "description": "Command R+ est un modèle optimisé RAG de pointe, conçu pour gérer des charges de travail d'entreprise."
+  },
   "command": {
     "description": "Un modèle de dialogue qui suit des instructions, offrant une haute qualité et une fiabilité accrue dans les tâches linguistiques, avec une longueur de contexte plus longue que notre modèle de génération de base."
   },
@@ -1028,6 +1040,12 @@
   "gemini-2.5-flash-preview-04-17": {
     "description": "Gemini 2.5 Flash Preview est le modèle le plus rentable de Google, offrant des fonctionnalités complètes."
   },
+  "gemini-2.5-flash-preview-04-17-thinking": {
+    "description": "Gemini 2.5 Flash Preview est le modèle le plus rentable de Google, offrant des fonctionnalités complètes."
+  },
+  "gemini-2.5-flash-preview-05-20": {
+    "description": "Gemini 2.5 Flash Preview est le modèle le plus rentable de Google, offrant des fonctionnalités complètes."
+  },
   "gemini-2.5-pro-exp-03-25": {
     "description": "Gemini 2.5 Pro Experimental est le modèle de pensée le plus avancé de Google, capable de raisonner sur des problèmes complexes en code, mathématiques et dans les domaines STEM, tout en utilisant un long contexte pour analyser de grands ensembles de données, des bibliothèques de code et des documents."
   },
@@ -1262,23 +1280,17 @@
   "grok-2-vision-1212": {
     "description": "Ce modèle a été amélioré en termes de précision, de respect des instructions et de capacités multilingues."
   },
-  "grok-3-beta": {
-    "description": "Modèle phare, spécialisé dans l'extraction de données, la programmation et le résumé de texte pour des applications d'entreprise, avec une connaissance approfondie des domaines financier, médical, juridique et scientifique."
+  "grok-3": {
+    "description": "Modèle phare, expert en extraction de données, programmation et résumé de texte pour des applications d'entreprise, avec une connaissance approfondie des domaines financier, médical, juridique et scientifique."
   },
-  "grok-3-fast-beta": {
-    "description": "Modèle phare, spécialisé dans l'extraction de données, la programmation et le résumé de texte pour des applications d'entreprise, avec une connaissance approfondie des domaines financier, médical, juridique et scientifique."
+  "grok-3-fast": {
+    "description": "Modèle phare, expert en extraction de données, programmation et résumé de texte pour des applications d'entreprise, avec une connaissance approfondie des domaines financier, médical, juridique et scientifique."
   },
-  "grok-3-mini-beta": {
-    "description": "Modèle léger, qui réfléchit avant de répondre. Rapide et intelligent, il est adapté aux tâches logiques ne nécessitant pas de connaissances approfondies dans un domaine, tout en permettant de capturer les pensées brutes."
+  "grok-3-mini": {
+    "description": "Modèle léger, réfléchit avant de répondre. Rapide et intelligent, adapté aux tâches logiques ne nécessitant pas de connaissances approfondies, avec accès à la trace de pensée originale."
   },
-  "grok-3-mini-fast-beta": {
-    "description": "Modèle léger, qui réfléchit avant de répondre. Rapide et intelligent, il est adapté aux tâches logiques ne nécessitant pas de connaissances approfondies dans un domaine, tout en permettant de capturer les pensées brutes."
-  },
-  "grok-beta": {
-    "description": "Offre des performances comparables à Grok 2, mais avec une efficacité, une vitesse et des fonctionnalités supérieures."
-  },
-  "grok-vision-beta": {
-    "description": "Le dernier modèle de compréhension d'image, capable de traiter une variété d'informations visuelles, y compris des documents, des graphiques, des captures d'écran et des photos."
+  "grok-3-mini-fast": {
+    "description": "Modèle léger, réfléchit avant de répondre. Rapide et intelligent, adapté aux tâches logiques ne nécessitant pas de connaissances approfondies, avec accès à la trace de pensée originale."
   },
   "gryphe/mythomax-l2-13b": {
     "description": "MythoMax l2 13B est un modèle linguistique combinant créativité et intelligence, intégrant plusieurs modèles de pointe."
@@ -1322,6 +1334,9 @@
   "hunyuan-t1-latest": {
     "description": "Le premier modèle d'inférence Hybrid-Transformer-Mamba à grande échelle de l'industrie, qui étend les capacités d'inférence, offre une vitesse de décodage exceptionnelle et aligne davantage les préférences humaines."
   },
+  "hunyuan-t1-vision": {
+    "description": "Modèle de réflexion profonde multimodal Hunyuan, supportant des chaînes de pensée natives multimodales longues, excellent dans divers scénarios d'inférence d'images, avec une amélioration globale par rapport aux modèles de pensée rapide dans les problèmes scientifiques."
+  },
   "hunyuan-translation": {
     "description": "Supporte la traduction entre le chinois et l'anglais, le japonais, le français, le portugais, l'espagnol, le turc, le russe, l'arabe, le coréen, l'italien, l'allemand, le vietnamien, le malais et l'indonésien, soit 15 langues au total, avec une évaluation automatisée basée sur le score COMET à partir d'un ensemble d'évaluation de traduction multi-scénarios, montrant une capacité de traduction globale supérieure à celle des modèles de taille similaire sur le marché."
   },
@@ -1586,6 +1601,30 @@
   "meta.llama3-8b-instruct-v1:0": {
     "description": "Meta Llama 3 est un modèle de langage ouvert (LLM) destiné aux développeurs, chercheurs et entreprises, conçu pour les aider à construire, expérimenter et étendre de manière responsable leurs idées d'IA générative. En tant que partie intégrante d'un système de base pour l'innovation de la communauté mondiale, il est particulièrement adapté aux appareils à capacité de calcul et de ressources limitées, ainsi qu'à des temps d'entraînement plus rapides."
   },
+  "meta/Llama-3.2-11B-Vision-Instruct": {
+    "description": "Excellentes capacités d'inférence d'images haute résolution, adapté aux applications de compréhension visuelle."
+  },
+  "meta/Llama-3.2-90B-Vision-Instruct": {
+    "description": "Capacités avancées d'inférence d'images pour applications d'agents de compréhension visuelle."
+  },
+  "meta/Llama-3.3-70B-Instruct": {
+    "description": "Llama 3.3 est le modèle open source multilingue le plus avancé de la série Llama, offrant des performances comparables à un modèle de 405 milliards de paramètres à très faible coût. Basé sur l'architecture Transformer, il est amélioré par un ajustement supervisé (SFT) et un apprentissage par renforcement avec retour humain (RLHF) pour une meilleure utilité et sécurité. Sa version optimisée pour les instructions est conçue pour les dialogues multilingues et surpasse de nombreux modèles de chat open source et propriétaires sur plusieurs benchmarks industriels. Date de coupure des connaissances : décembre 2023."
+  },
+  "meta/Meta-Llama-3-70B-Instruct": {
+    "description": "Un puissant modèle de 70 milliards de paramètres, excellent en inférence, codage et applications linguistiques étendues."
+  },
+  "meta/Meta-Llama-3-8B-Instruct": {
+    "description": "Un modèle polyvalent de 8 milliards de paramètres, optimisé pour les tâches de dialogue et de génération de texte."
+  },
+  "meta/Meta-Llama-3.1-405B-Instruct": {
+    "description": "Modèle textuel Llama 3.1 ajusté aux instructions, optimisé pour les cas d'usage de dialogue multilingue, performant sur de nombreux benchmarks industriels parmi les modèles de chat open source et propriétaires disponibles."
+  },
+  "meta/Meta-Llama-3.1-70B-Instruct": {
+    "description": "Modèle textuel Llama 3.1 ajusté aux instructions, optimisé pour les cas d'usage de dialogue multilingue, performant sur de nombreux benchmarks industriels parmi les modèles de chat open source et propriétaires disponibles."
+  },
+  "meta/Meta-Llama-3.1-8B-Instruct": {
+    "description": "Modèle textuel Llama 3.1 ajusté aux instructions, optimisé pour les cas d'usage de dialogue multilingue, performant sur de nombreux benchmarks industriels parmi les modèles de chat open source et propriétaires disponibles."
+  },
   "meta/llama-3.1-405b-instruct": {
     "description": "LLM avancé, prenant en charge la génération de données synthétiques, la distillation de connaissances et le raisonnement, adapté aux chatbots, à la programmation et aux tâches spécifiques."
   },
@@ -1610,6 +1649,30 @@
   "meta/llama-3.3-70b-instruct": {
     "description": "LLM avancé, spécialisé dans le raisonnement, les mathématiques, le bon sens et les appels de fonction."
   },
+  "microsoft/Phi-3-medium-128k-instruct": {
+    "description": "Même modèle Phi-3-medium, mais avec une taille de contexte plus grande, adapté au RAG ou aux prompts courts."
+  },
+  "microsoft/Phi-3-medium-4k-instruct": {
+    "description": "Modèle de 14 milliards de paramètres, de meilleure qualité que Phi-3-mini, axé sur des données de haute qualité et à forte intensité d'inférence."
+  },
+  "microsoft/Phi-3-mini-128k-instruct": {
+    "description": "Même modèle Phi-3-mini, mais avec une taille de contexte plus grande, adapté au RAG ou aux prompts courts."
+  },
+  "microsoft/Phi-3-mini-4k-instruct": {
+    "description": "Le plus petit membre de la famille Phi-3, optimisé pour la qualité et la faible latence."
+  },
+  "microsoft/Phi-3-small-128k-instruct": {
+    "description": "Même modèle Phi-3-small, mais avec une taille de contexte plus grande, adapté au RAG ou aux prompts courts."
+  },
+  "microsoft/Phi-3-small-8k-instruct": {
+    "description": "Modèle de 7 milliards de paramètres, de meilleure qualité que Phi-3-mini, axé sur des données de haute qualité et à forte intensité d'inférence."
+  },
+  "microsoft/Phi-3.5-mini-instruct": {
+    "description": "Version mise à jour du modèle Phi-3-mini."
+  },
+  "microsoft/Phi-3.5-vision-instruct": {
+    "description": "Version mise à jour du modèle Phi-3-vision."
+  },
   "microsoft/WizardLM-2-8x22B": {
     "description": "WizardLM 2 est un modèle de langage proposé par Microsoft AI, qui excelle dans les domaines des dialogues complexes, du multilinguisme, du raisonnement et des assistants intelligents."
   },
@@ -1628,6 +1691,15 @@
   "mistral": {
     "description": "Mistral est le modèle 7B lancé par Mistral AI, adapté aux besoins variés de traitement du langage."
   },
+  "mistral-ai/Mistral-Large-2411": {
+    "description": "Le modèle phare de Mistral, adapté aux tâches complexes nécessitant une inférence à grande échelle ou une spécialisation élevée (génération de texte synthétique, génération de code, RAG ou agents)."
+  },
+  "mistral-ai/Mistral-Nemo": {
+    "description": "Mistral Nemo est un modèle de langage de pointe (LLM) offrant les meilleures performances en inférence, connaissances mondiales et capacités de codage dans sa catégorie de taille."
+  },
+  "mistral-ai/mistral-small-2503": {
+    "description": "Mistral Small est adapté à toute tâche linguistique nécessitant haute efficacité et faible latence."
+  },
   "mistral-large": {
     "description": "Mixtral Large est le modèle phare de Mistral, combinant des capacités de génération de code, de mathématiques et de raisonnement, prenant en charge une fenêtre de contexte de 128k."
   },
@@ -1769,6 +1841,9 @@
   "openai/gpt-4o-mini": {
     "description": "GPT-4o mini est le dernier modèle d'OpenAI lancé après GPT-4 Omni, prenant en charge les entrées d'images et de texte et produisant du texte en sortie. En tant que leur modèle compact le plus avancé, il est beaucoup moins cher que d'autres modèles de pointe récents et coûte plus de 60 % de moins que GPT-3.5 Turbo. Il maintient une intelligence de pointe tout en offrant un rapport qualité-prix significatif. GPT-4o mini a obtenu un score de 82 % au test MMLU et se classe actuellement au-dessus de GPT-4 en termes de préférences de chat."
   },
+  "openai/o1": {
+    "description": "o1 est le nouveau modèle d'inférence d'OpenAI, prenant en charge les entrées multimodales (texte et image) et produisant du texte, adapté aux tâches complexes nécessitant des connaissances générales étendues. Ce modèle dispose d'un contexte de 200K et d'une date de coupure des connaissances en octobre 2023."
+  },
   "openai/o1-mini": {
     "description": "o1-mini est un modèle de raisonnement rapide et économique conçu pour les applications de programmation, de mathématiques et de sciences. Ce modèle dispose d'un contexte de 128K et d'une date limite de connaissance en octobre 2023."
   },
diff --git a/locales/fr-FR/setting.json b/locales/fr-FR/setting.json
index 0fd31318d7..a8f1681cb4 100644
--- a/locales/fr-FR/setting.json
+++ b/locales/fr-FR/setting.json
@@ -259,9 +259,6 @@
     "enableMaxTokens": {
       "title": "Activer la limite de tokens par réponse"
     },
-    "enableReasoningEffort": {
-      "title": "Activer l'ajustement de l'intensité de raisonnement"
-    },
     "frequencyPenalty": {
       "desc": "Plus la valeur est élevée, plus le vocabulaire est riche et varié ; plus la valeur est basse, plus le vocabulaire est simple et direct",
       "title": "Richesse du vocabulaire"
@@ -281,15 +278,6 @@
       "desc": "Plus la valeur est élevée, plus il y a tendance à utiliser des expressions différentes, évitant la répétition des concepts ; plus la valeur est basse, plus il y a tendance à utiliser des concepts ou des narrations répétitifs, rendant l'expression plus cohérente",
       "title": "Diversité de l'expression"
     },
-    "reasoningEffort": {
-      "desc": "Plus la valeur est élevée, plus la capacité de raisonnement est forte, mais cela peut augmenter le temps de réponse et la consommation de jetons",
-      "options": {
-        "high": "Élevé",
-        "low": "Bas",
-        "medium": "Moyen"
-      },
-      "title": "Intensité de raisonnement"
-    },
     "submit": "Mettre à jour les paramètres du modèle",
     "temperature": {
       "desc": "Plus la valeur est élevée, plus les réponses sont créatives et imaginatives ; plus la valeur est basse, plus les réponses sont rigoureuses",
diff --git a/locales/it-IT/chat.json b/locales/it-IT/chat.json
index a4a381b170..6d2873a17a 100644
--- a/locales/it-IT/chat.json
+++ b/locales/it-IT/chat.json
@@ -43,6 +43,9 @@
     "reasoningBudgetToken": {
       "title": "Token di consumo del pensiero"
     },
+    "reasoningEffort": {
+      "title": "Intensità del ragionamento"
+    },
     "title": "Funzionalità di estensione del modello"
   },
   "history": {
diff --git a/locales/it-IT/models.json b/locales/it-IT/models.json
index 8489453ff4..33e6ffbebe 100644
--- a/locales/it-IT/models.json
+++ b/locales/it-IT/models.json
@@ -341,9 +341,6 @@
   "Qwen2.5-Coder-32B-Instruct": {
     "description": "Qwen2.5-Coder-32B-Instruct è un grande modello linguistico progettato per la generazione di codice, la comprensione del codice e scenari di sviluppo efficienti, con una scala di 32 miliardi di parametri all'avanguardia nel settore, in grado di soddisfare esigenze di programmazione diversificate."
   },
-  "SenseCat-5-1202": {
-    "description": "È l'ultima versione basata su V5.5, con miglioramenti significativi rispetto alla versione precedente in vari ambiti come le capacità di base in cinese e inglese, chat, conoscenze scientifiche, conoscenze umanistiche, scrittura, logica matematica e controllo del numero di parole."
-  },
   "SenseChat": {
     "description": "Modello di base (V4), lunghezza del contesto di 4K, con potenti capacità generali."
   },
@@ -356,6 +353,9 @@
   "SenseChat-5": {
     "description": "Modello dell'ultima versione (V5.5), lunghezza del contesto di 128K, con capacità significativamente migliorate in ragionamento matematico, conversazioni in inglese, seguire istruzioni e comprensione di testi lunghi, paragonabile a GPT-4o."
   },
+  "SenseChat-5-1202": {
+    "description": "Basato sulla versione V5.5 più recente, mostra miglioramenti significativi rispetto alla versione precedente in capacità di base in cinese e inglese, chat, conoscenze scientifiche e umanistiche, scrittura, logica matematica e controllo della lunghezza del testo."
+  },
   "SenseChat-5-Cantonese": {
     "description": "Lunghezza del contesto di 32K, supera GPT-4 nella comprensione delle conversazioni in cantonese, paragonabile a GPT-4 Turbo in vari ambiti come conoscenza, ragionamento, matematica e scrittura di codice."
   },
@@ -515,6 +515,12 @@
   "ai21-jamba-1.5-mini": {
     "description": "Un modello multilingue con 52 miliardi di parametri (12 miliardi attivi), offre una finestra di contesto lunga 256K, chiamata di funzione, output strutturato e generazione ancorata."
   },
+  "ai21-labs/AI21-Jamba-1.5-Large": {
+    "description": "Un modello multilingue con 398 miliardi di parametri (94 miliardi attivi), offre una finestra contestuale lunga 256K token, chiamate di funzione, output strutturati e generazione basata su fatti."
+  },
+  "ai21-labs/AI21-Jamba-1.5-Mini": {
+    "description": "Un modello multilingue con 52 miliardi di parametri (12 miliardi attivi), offre una finestra contestuale lunga 256K token, chiamate di funzione, output strutturati e generazione basata su fatti."
+  },
   "anthropic.claude-3-5-sonnet-20240620-v1:0": {
     "description": "Claude 3.5 Sonnet ha elevato gli standard del settore, superando i modelli concorrenti e Claude 3 Opus, dimostrando prestazioni eccezionali in una vasta gamma di valutazioni, mantenendo la velocità e i costi dei nostri modelli di livello medio."
   },
@@ -668,6 +674,12 @@
   "cohere-command-r-plus": {
     "description": "Command R+ è un modello ottimizzato per RAG all'avanguardia progettato per affrontare carichi di lavoro di livello aziendale."
   },
+  "cohere/Cohere-command-r": {
+    "description": "Command R è un modello generativo scalabile progettato per l'uso con RAG e strumenti, che consente alle aziende di implementare AI a livello produttivo."
+  },
+  "cohere/Cohere-command-r-plus": {
+    "description": "Command R+ è un modello ottimizzato all'avanguardia per RAG, progettato per gestire carichi di lavoro aziendali."
+  },
   "command": {
     "description": "Un modello di dialogo che segue le istruzioni, con alta qualità e maggiore affidabilità nelle attività linguistiche, e una lunghezza di contesto più lunga rispetto ai nostri modelli generativi di base."
   },
@@ -1028,6 +1040,12 @@
   "gemini-2.5-flash-preview-04-17": {
     "description": "Gemini 2.5 Flash Preview è il modello più conveniente di Google, che offre funzionalità complete."
   },
+  "gemini-2.5-flash-preview-04-17-thinking": {
+    "description": "Gemini 2.5 Flash Preview è il modello Google con il miglior rapporto qualità-prezzo, che offre funzionalità complete."
+  },
+  "gemini-2.5-flash-preview-05-20": {
+    "description": "Gemini 2.5 Flash Preview è il modello Google con il miglior rapporto qualità-prezzo, che offre funzionalità complete."
+  },
   "gemini-2.5-pro-exp-03-25": {
     "description": "Gemini 2.5 Pro Experimental è il modello di pensiero più avanzato di Google, in grado di ragionare su problemi complessi in codice, matematica e nei campi STEM, e di analizzare grandi set di dati, codebase e documenti utilizzando contesti lunghi."
   },
@@ -1262,23 +1280,17 @@
   "grok-2-vision-1212": {
     "description": "Questo modello ha migliorato l'accuratezza, il rispetto delle istruzioni e le capacità multilingue."
   },
-  "grok-3-beta": {
-    "description": "Modello di punta, specializzato in estrazione di dati, programmazione e sintesi di testi per applicazioni aziendali, con una profonda conoscenza nei settori finanziario, medico, legale e scientifico."
+  "grok-3": {
+    "description": "Modello di punta, eccelle in estrazione dati, programmazione e sintesi testuale per applicazioni aziendali, con profonda conoscenza nei settori finanziario, medico, legale e scientifico."
   },
-  "grok-3-fast-beta": {
-    "description": "Modello di punta, specializzato in estrazione di dati, programmazione e sintesi di testi per applicazioni aziendali, con una profonda conoscenza nei settori finanziario, medico, legale e scientifico."
+  "grok-3-fast": {
+    "description": "Modello di punta, eccelle in estrazione dati, programmazione e sintesi testuale per applicazioni aziendali, con profonda conoscenza nei settori finanziario, medico, legale e scientifico."
   },
-  "grok-3-mini-beta": {
-    "description": "Modello leggero, riflette prima di rispondere. Esegue rapidamente e in modo intelligente, adatto a compiti logici che non richiedono conoscenze approfondite del settore e in grado di acquisire il tracciato di pensiero originale."
+  "grok-3-mini": {
+    "description": "Modello leggero che riflette prima di rispondere. Veloce e intelligente, adatto a compiti logici che non richiedono conoscenze di dominio profonde, con tracciamento del processo di pensiero originale."
   },
-  "grok-3-mini-fast-beta": {
-    "description": "Modello leggero, riflette prima di rispondere. Esegue rapidamente e in modo intelligente, adatto a compiti logici che non richiedono conoscenze approfondite del settore e in grado di acquisire il tracciato di pensiero originale."
-  },
-  "grok-beta": {
-    "description": "Offre prestazioni comparabili a Grok 2, ma con maggiore efficienza, velocità e funzionalità."
-  },
-  "grok-vision-beta": {
-    "description": "L'ultimo modello di comprensione delle immagini, in grado di gestire una vasta gamma di informazioni visive, tra cui documenti, grafici, screenshot e fotografie."
+  "grok-3-mini-fast": {
+    "description": "Modello leggero che riflette prima di rispondere. Veloce e intelligente, adatto a compiti logici che non richiedono conoscenze di dominio profonde, con tracciamento del processo di pensiero originale."
   },
   "gryphe/mythomax-l2-13b": {
     "description": "MythoMax l2 13B è un modello linguistico che combina creatività e intelligenza, unendo diversi modelli di punta."
@@ -1322,6 +1334,9 @@
   "hunyuan-t1-latest": {
     "description": "Il primo modello di inferenza ibrido su larga scala Hybrid-Transformer-Mamba del settore, che espande le capacità di inferenza, offre una velocità di decodifica eccezionale e allinea ulteriormente le preferenze umane."
   },
+  "hunyuan-t1-vision": {
+    "description": "Modello di comprensione multimodale profonda Hunyuan, supporta catene di pensiero native multimodali, eccelle in vari scenari di ragionamento visivo e migliora significativamente rispetto ai modelli di pensiero rapido nei problemi scientifici."
+  },
   "hunyuan-translation": {
     "description": "Supporta la traduzione tra cinese e inglese, giapponese, francese, portoghese, spagnolo, turco, russo, arabo, coreano, italiano, tedesco, vietnamita, malese e indonesiano, per un totale di 15 lingue, con valutazione automatica basata su un set di valutazione di traduzione multi-scenario e punteggio COMET, mostrando complessivamente prestazioni superiori rispetto ai modelli di dimensioni simili sul mercato in termini di capacità di traduzione reciproca tra le lingue più comuni."
   },
@@ -1586,6 +1601,30 @@
   "meta.llama3-8b-instruct-v1:0": {
     "description": "Meta Llama 3 è un modello di linguaggio di grandi dimensioni (LLM) open source progettato per sviluppatori, ricercatori e aziende, per aiutarli a costruire, sperimentare e scalare responsabilmente le loro idee di AI generativa. Come parte di un sistema di base per l'innovazione della comunità globale, è particolarmente adatto per dispositivi a bassa potenza e risorse limitate, oltre a garantire tempi di addestramento più rapidi."
   },
+  "meta/Llama-3.2-11B-Vision-Instruct": {
+    "description": "Eccelle nelle capacità di ragionamento su immagini ad alta risoluzione, adatto ad applicazioni di comprensione visiva."
+  },
+  "meta/Llama-3.2-90B-Vision-Instruct": {
+    "description": "Capacità avanzate di ragionamento su immagini per applicazioni di agenti di comprensione visiva."
+  },
+  "meta/Llama-3.3-70B-Instruct": {
+    "description": "Llama 3.3 è il modello linguistico open source multilingue più avanzato della serie Llama, che offre prestazioni paragonabili a un modello da 405 miliardi di parametri a costi estremamente contenuti. Basato su architettura Transformer, migliorato tramite fine-tuning supervisionato (SFT) e apprendimento rinforzato con feedback umano (RLHF) per utilità e sicurezza. La versione ottimizzata per istruzioni è progettata per dialoghi multilingue e supera molti modelli di chat open source e proprietari in diversi benchmark industriali. Data di cut-off della conoscenza: dicembre 2023."
+  },
+  "meta/Meta-Llama-3-70B-Instruct": {
+    "description": "Un potente modello da 70 miliardi di parametri, eccellente in ragionamento, codifica e ampie applicazioni linguistiche."
+  },
+  "meta/Meta-Llama-3-8B-Instruct": {
+    "description": "Un modello versatile da 8 miliardi di parametri, ottimizzato per compiti di dialogo e generazione di testo."
+  },
+  "meta/Meta-Llama-3.1-405B-Instruct": {
+    "description": "Modello testuale Llama 3.1 ottimizzato per istruzioni, progettato per casi d'uso di dialogo multilingue, con prestazioni eccellenti in molti benchmark industriali rispetto a numerosi modelli di chat open source e proprietari."
+  },
+  "meta/Meta-Llama-3.1-70B-Instruct": {
+    "description": "Modello testuale Llama 3.1 ottimizzato per istruzioni, progettato per casi d'uso di dialogo multilingue, con prestazioni eccellenti in molti benchmark industriali rispetto a numerosi modelli di chat open source e proprietari."
+  },
+  "meta/Meta-Llama-3.1-8B-Instruct": {
+    "description": "Modello testuale Llama 3.1 ottimizzato per istruzioni, progettato per casi d'uso di dialogo multilingue, con prestazioni eccellenti in molti benchmark industriali rispetto a numerosi modelli di chat open source e proprietari."
+  },
   "meta/llama-3.1-405b-instruct": {
     "description": "LLM avanzato, supporta la generazione di dati sintetici, la distillazione della conoscenza e il ragionamento, adatto per chatbot, programmazione e compiti specifici."
   },
@@ -1610,6 +1649,30 @@
   "meta/llama-3.3-70b-instruct": {
     "description": "LLM avanzato, specializzato in ragionamento, matematica, conoscenze generali e chiamate di funzione."
   },
+  "microsoft/Phi-3-medium-128k-instruct": {
+    "description": "Stesso modello Phi-3-medium, ma con una dimensione del contesto maggiore, adatto per RAG o pochi prompt."
+  },
+  "microsoft/Phi-3-medium-4k-instruct": {
+    "description": "Un modello da 14 miliardi di parametri, con qualità superiore a Phi-3-mini, focalizzato su dati di alta qualità e intensivi di ragionamento."
+  },
+  "microsoft/Phi-3-mini-128k-instruct": {
+    "description": "Stesso modello Phi-3-mini, ma con una dimensione del contesto maggiore, adatto per RAG o pochi prompt."
+  },
+  "microsoft/Phi-3-mini-4k-instruct": {
+    "description": "Il membro più piccolo della famiglia Phi-3, ottimizzato per qualità e bassa latenza."
+  },
+  "microsoft/Phi-3-small-128k-instruct": {
+    "description": "Stesso modello Phi-3-small, ma con una dimensione del contesto maggiore, adatto per RAG o pochi prompt."
+  },
+  "microsoft/Phi-3-small-8k-instruct": {
+    "description": "Un modello da 7 miliardi di parametri, con qualità superiore a Phi-3-mini, focalizzato su dati di alta qualità e intensivi di ragionamento."
+  },
+  "microsoft/Phi-3.5-mini-instruct": {
+    "description": "Versione aggiornata del modello Phi-3-mini."
+  },
+  "microsoft/Phi-3.5-vision-instruct": {
+    "description": "Versione aggiornata del modello Phi-3-vision."
+  },
   "microsoft/WizardLM-2-8x22B": {
     "description": "WizardLM 2 è un modello linguistico fornito da Microsoft AI, particolarmente efficace in conversazioni complesse, multilingue, ragionamento e assistenti intelligenti."
   },
@@ -1628,6 +1691,15 @@
   "mistral": {
     "description": "Mistral è un modello da 7B lanciato da Mistral AI, adatto per esigenze di elaborazione linguistica variabili."
   },
+  "mistral-ai/Mistral-Large-2411": {
+    "description": "Il modello di punta di Mistral, ideale per compiti complessi che richiedono capacità di ragionamento su larga scala o alta specializzazione (generazione di testo sintetico, generazione di codice, RAG o agenti)."
+  },
+  "mistral-ai/Mistral-Nemo": {
+    "description": "Mistral Nemo è un modello linguistico all'avanguardia (LLM) che offre capacità di ragionamento, conoscenza del mondo e codifica tra le migliori nella sua categoria di dimensioni."
+  },
+  "mistral-ai/mistral-small-2503": {
+    "description": "Mistral Small è adatto a qualsiasi compito basato sul linguaggio che richieda alta efficienza e bassa latenza."
+  },
   "mistral-large": {
     "description": "Mixtral Large è il modello di punta di Mistral, combinando capacità di generazione di codice, matematica e ragionamento, supporta una finestra di contesto di 128k."
   },
@@ -1769,6 +1841,9 @@
   "openai/gpt-4o-mini": {
     "description": "GPT-4o mini è il modello più recente di OpenAI, lanciato dopo GPT-4 Omni, che supporta input visivi e testuali e produce output testuali. Come il loro modello di piccole dimensioni più avanzato, è molto più economico rispetto ad altri modelli all'avanguardia recenti e costa oltre il 60% in meno rispetto a GPT-3.5 Turbo. Mantiene un'intelligenza all'avanguardia, offrendo un notevole rapporto qualità-prezzo. GPT-4o mini ha ottenuto un punteggio dell'82% nel test MMLU e attualmente è classificato più in alto di GPT-4 per preferenze di chat."
   },
+  "openai/o1": {
+    "description": "o1 è il nuovo modello di ragionamento di OpenAI, supporta input di testo e immagini e produce output testuali, adatto a compiti complessi che richiedono una vasta conoscenza generale. Il modello ha un contesto di 200K token e una data di cut-off della conoscenza a ottobre 2023."
+  },
   "openai/o1-mini": {
     "description": "o1-mini è un modello di inferenza rapido ed economico progettato per applicazioni di programmazione, matematica e scienza. Questo modello ha un contesto di 128K e una data di cutoff della conoscenza di ottobre 2023."
   },
diff --git a/locales/it-IT/setting.json b/locales/it-IT/setting.json
index fa200dfc96..a8a0cb31ce 100644
--- a/locales/it-IT/setting.json
+++ b/locales/it-IT/setting.json
@@ -259,9 +259,6 @@
     "enableMaxTokens": {
       "title": "Abilita limite di risposta singola"
     },
-    "enableReasoningEffort": {
-      "title": "Attiva la regolazione dell'intensità del ragionamento"
-    },
     "frequencyPenalty": {
       "desc": "Maggiore è il valore, più ricca e varia sarà la scelta delle parole; minore è il valore, più semplici e dirette saranno le parole",
       "title": "Ricchezza del vocabolario"
@@ -281,15 +278,6 @@
       "desc": "Maggiore è il valore, maggiore sarà la tendenza a esprimere in modi diversi, evitando ripetizioni; minore è il valore, maggiore sarà la tendenza a utilizzare concetti o narrazioni ripetute, rendendo l'espressione più coerente",
       "title": "Divergenza espressiva"
     },
-    "reasoningEffort": {
-      "desc": "Maggiore è il valore, più forte è la capacità di ragionamento, ma potrebbe aumentare il tempo di risposta e il consumo di Token",
-      "options": {
-        "high": "Alto",
-        "low": "Basso",
-        "medium": "Medio"
-      },
-      "title": "Intensità del ragionamento"
-    },
     "submit": "Aggiorna impostazioni modello",
     "temperature": {
       "desc": "Maggiore è il valore, più creativi e fantasiosi saranno le risposte; minore è il valore, più rigorose saranno le risposte",
diff --git a/locales/ja-JP/chat.json b/locales/ja-JP/chat.json
index 9a08589c99..cfd3e57850 100644
--- a/locales/ja-JP/chat.json
+++ b/locales/ja-JP/chat.json
@@ -43,6 +43,9 @@
     "reasoningBudgetToken": {
       "title": "思考消費トークン"
     },
+    "reasoningEffort": {
+      "title": "推論の強度"
+    },
     "title": "モデル拡張機能"
   },
   "history": {
diff --git a/locales/ja-JP/models.json b/locales/ja-JP/models.json
index da4a1af306..f41bbec7af 100644
--- a/locales/ja-JP/models.json
+++ b/locales/ja-JP/models.json
@@ -341,9 +341,6 @@
   "Qwen2.5-Coder-32B-Instruct": {
     "description": "Qwen2.5-Coder-32B-Instructは、コード生成、コード理解、効率的な開発シーンのために設計された大規模言語モデルで、業界をリードする32Bパラメータ規模を採用しており、多様なプログラミングニーズに応えます。"
   },
-  "SenseCat-5-1202": {
-    "description": "V5.5 に基づく最新バージョンであり、前のバージョンに比べて中英語の基礎能力、チャット、理科知識、文科知識、執筆、数理論理、文字数制御などのいくつかの次元でのパフォーマンスが大幅に向上しています。"
-  },
   "SenseChat": {
     "description": "基本バージョンのモデル (V4)、4Kのコンテキスト長で、汎用能力が強力です。"
   },
@@ -356,6 +353,9 @@
   "SenseChat-5": {
     "description": "最新バージョンのモデル (V5.5)、128Kのコンテキスト長で、数学的推論、英語の対話、指示のフォロー、長文理解などの分野での能力が大幅に向上し、GPT-4oに匹敵します。"
   },
+  "SenseChat-5-1202": {
+    "description": "V5.5をベースにした最新バージョンで、前バージョンに比べて中英語の基礎能力、チャット、理系知識、文系知識、ライティング、数理論理、文字数制御など複数の面で顕著に向上しています。"
+  },
   "SenseChat-5-Cantonese": {
     "description": "32Kのコンテキスト長で、広東語の対話理解においてGPT-4を超え、知識、推論、数学、コード作成などの複数の分野でGPT-4 Turboに匹敵します。"
   },
@@ -515,6 +515,12 @@
   "ai21-jamba-1.5-mini": {
     "description": "52Bパラメータ（12Bアクティブ）の多言語モデルで、256Kの長いコンテキストウィンドウ、関数呼び出し、構造化出力、基盤生成を提供します。"
   },
+  "ai21-labs/AI21-Jamba-1.5-Large": {
+    "description": "398Bパラメータ（うち94Bがアクティブ）の多言語モデルで、256Kの長いコンテキストウィンドウ、関数呼び出し、構造化出力、事実に基づく生成を提供します。"
+  },
+  "ai21-labs/AI21-Jamba-1.5-Mini": {
+    "description": "52Bパラメータ（うち12Bがアクティブ）の多言語モデルで、256Kの長いコンテキストウィンドウ、関数呼び出し、構造化出力、事実に基づく生成を提供します。"
+  },
   "anthropic.claude-3-5-sonnet-20240620-v1:0": {
     "description": "Claude 3.5 Sonnetは業界標準を向上させ、競合モデルやClaude 3 Opusを超える性能を持ち、広範な評価で優れたパフォーマンスを示し、私たちの中程度のモデルの速度とコストを兼ね備えています。"
   },
@@ -668,6 +674,12 @@
   "cohere-command-r-plus": {
     "description": "Command R+は、企業グレードのワークロードに対応するために設計された最先端のRAG最適化モデルです。"
   },
+  "cohere/Cohere-command-r": {
+    "description": "Command RはRAGやツール使用に特化した拡張可能な生成モデルで、企業が生産レベルのAIを実現できるよう設計されています。"
+  },
+  "cohere/Cohere-command-r-plus": {
+    "description": "Command R+は最先端のRAG最適化モデルで、企業レベルのワークロードに対応することを目的としています。"
+  },
   "command": {
     "description": "指示に従う対話モデルで、言語タスクにおいて高品質で信頼性が高く、私たちの基本生成モデルよりも長いコンテキスト長を持っています。"
   },
@@ -1028,6 +1040,12 @@
   "gemini-2.5-flash-preview-04-17": {
     "description": "Gemini 2.5 Flash Previewは、Googleのコストパフォーマンスに優れたモデルで、包括的な機能を提供します。"
   },
+  "gemini-2.5-flash-preview-04-17-thinking": {
+    "description": "Gemini 2.5 Flash PreviewはGoogleのコストパフォーマンスに優れたモデルで、包括的な機能を提供します。"
+  },
+  "gemini-2.5-flash-preview-05-20": {
+    "description": "Gemini 2.5 Flash PreviewはGoogleのコストパフォーマンスに優れたモデルで、包括的な機能を提供します。"
+  },
   "gemini-2.5-pro-exp-03-25": {
     "description": "Gemini 2.5 Pro Experimentalは、Googleの最先端の思考モデルであり、コード、数学、STEM分野の複雑な問題に対して推論を行うことができ、長いコンテキストを利用して大規模なデータセット、コードベース、文書を分析します。"
   },
@@ -1262,23 +1280,17 @@
   "grok-2-vision-1212": {
     "description": "このモデルは、精度、指示の遵守、そして多言語能力において改善されています。"
   },
-  "grok-3-beta": {
-    "description": "フラッグシップモデルで、データ抽出、プログラミング、テキスト要約などの企業向けアプリケーションに優れ、金融、医療、法律、科学などの分野において深い知識を持っています。"
+  "grok-3": {
+    "description": "フラッグシップモデルで、データ抽出、プログラミング、テキスト要約などの企業向けアプリケーションに優れ、金融、医療、法律、科学などの分野に深い知識を持ちます。"
   },
-  "grok-3-fast-beta": {
-    "description": "フラッグシップモデルで、データ抽出、プログラミング、テキスト要約などの企業向けアプリケーションに優れ、金融、医療、法律、科学などの分野において深い知識を持っています。"
+  "grok-3-fast": {
+    "description": "フラッグシップモデルで、データ抽出、プログラミング、テキスト要約などの企業向けアプリケーションに優れ、金融、医療、法律、科学などの分野に深い知識を持ちます。"
   },
-  "grok-3-mini-beta": {
-    "description": "軽量モデルで、会話の前に考えます。動作が速く、賢く、深い専門知識を必要としない論理的なタスクに適しており、原始的な思考の軌跡を取得できます。"
+  "grok-3-mini": {
+    "description": "軽量モデルで、会話前に思考します。高速かつスマートに動作し、深い専門知識を必要としない論理タスクに適しており、元の思考過程を取得できます。"
   },
-  "grok-3-mini-fast-beta": {
-    "description": "軽量モデルで、会話の前に考えます。動作が速く、賢く、深い専門知識を必要としない論理的なタスクに適しており、原始的な思考の軌跡を取得できます。"
-  },
-  "grok-beta": {
-    "description": "Grok 2と同等の性能を持ちながら、より高い効率、速度、機能を備えています。"
-  },
-  "grok-vision-beta": {
-    "description": "最新の画像理解モデルで、文書、グラフ、スクリーンショット、写真など、さまざまな視覚情報を処理できます。"
+  "grok-3-mini-fast": {
+    "description": "軽量モデルで、会話前に思考します。高速かつスマートに動作し、深い専門知識を必要としない論理タスクに適しており、元の思考過程を取得できます。"
   },
   "gryphe/mythomax-l2-13b": {
     "description": "MythoMax l2 13Bは複数のトップモデルを統合した創造性と知性を兼ね備えた言語モデルです。"
@@ -1322,6 +1334,9 @@
   "hunyuan-t1-latest": {
     "description": "業界初の超大規模Hybrid-Transformer-Mamba推論モデルであり、推論能力を拡張し、超高速なデコード速度を実現し、人間の好みにさらに整合します。"
   },
+  "hunyuan-t1-vision": {
+    "description": "混元多モーダル理解の深層思考モデルで、多モーダルのネイティブ長思考チェーンをサポートし、さまざまな画像推論シナリオに優れています。理系の難問においては速思考モデルよりも包括的に向上しています。"
+  },
   "hunyuan-translation": {
     "description": "中国語、英語、日本語、フランス語、ポルトガル語、スペイン語、トルコ語、ロシア語、アラビア語、韓国語、イタリア語、ドイツ語、ベトナム語、マレー語、インドネシア語の15言語の相互翻訳をサポートし、多シーン翻訳評価セットに基づく自動評価COMETスコアを使用して、十数の一般的な言語間の翻訳能力が市場の同規模モデルを全体的に上回っています。"
   },
@@ -1586,6 +1601,30 @@
   "meta.llama3-8b-instruct-v1:0": {
     "description": "Meta Llama 3は、開発者、研究者、企業向けのオープンな大規模言語モデル（LLM）であり、生成AIのアイデアを構築、実験、責任を持って拡張するのを支援することを目的としています。世界的なコミュニティの革新の基盤システムの一部として、計算能力とリソースが限られたエッジデバイスや、より迅速なトレーニング時間に非常に適しています。"
   },
+  "meta/Llama-3.2-11B-Vision-Instruct": {
+    "description": "高解像度画像で優れた画像推論能力を発揮し、視覚理解アプリケーションに適しています。"
+  },
+  "meta/Llama-3.2-90B-Vision-Instruct": {
+    "description": "視覚理解エージェントアプリケーション向けの高度な画像推論能力を備えています。"
+  },
+  "meta/Llama-3.3-70B-Instruct": {
+    "description": "Llama 3.3はLlamaシリーズの最先端多言語オープンソース大型言語モデルで、非常に低コストで405Bモデルに匹敵する性能を体験できます。Transformer構造に基づき、教師あり微調整（SFT）と人間のフィードバックによる強化学習（RLHF）で有用性と安全性を向上。指示調整版は多言語対話に最適化され、多くの業界ベンチマークで多くのオープンソースおよびクローズドチャットモデルを上回る性能を示します。知識カットオフは2023年12月です。"
+  },
+  "meta/Meta-Llama-3-70B-Instruct": {
+    "description": "推論、コーディング、幅広い言語アプリケーションで優れた性能を発揮する強力な700億パラメータモデルです。"
+  },
+  "meta/Meta-Llama-3-8B-Instruct": {
+    "description": "対話およびテキスト生成タスクに最適化された多用途の80億パラメータモデルです。"
+  },
+  "meta/Meta-Llama-3.1-405B-Instruct": {
+    "description": "Llama 3.1の指示調整済みテキストモデルで、多言語対話ユースケースに最適化され、多くの利用可能なオープンソースおよびクローズドチャットモデルの中で一般的な業界ベンチマークで優れた性能を発揮します。"
+  },
+  "meta/Meta-Llama-3.1-70B-Instruct": {
+    "description": "Llama 3.1の指示調整済みテキストモデルで、多言語対話ユースケースに最適化され、多くの利用可能なオープンソースおよびクローズドチャットモデルの中で一般的な業界ベンチマークで優れた性能を発揮します。"
+  },
+  "meta/Meta-Llama-3.1-8B-Instruct": {
+    "description": "Llama 3.1の指示調整済みテキストモデルで、多言語対話ユースケースに最適化され、多くの利用可能なオープンソースおよびクローズドチャットモデルの中で一般的な業界ベンチマークで優れた性能を発揮します。"
+  },
   "meta/llama-3.1-405b-instruct": {
     "description": "高度なLLMで、合成データ生成、知識蒸留、推論をサポートし、チャットボット、プログラミング、特定の分野のタスクに適しています。"
   },
@@ -1610,6 +1649,30 @@
   "meta/llama-3.3-70b-instruct": {
     "description": "高度なLLMで、推論、数学、常識、関数呼び出しに優れています。"
   },
+  "microsoft/Phi-3-medium-128k-instruct": {
+    "description": "同じPhi-3-mediumモデルですが、より大きなコンテキストサイズを持ち、RAGや少数ショットに適しています。"
+  },
+  "microsoft/Phi-3-medium-4k-instruct": {
+    "description": "140億パラメータモデルで、Phi-3-miniよりも品質が高く、高品質で推論集約型のデータに重点を置いています。"
+  },
+  "microsoft/Phi-3-mini-128k-instruct": {
+    "description": "同じPhi-3-miniモデルですが、より大きなコンテキストサイズを持ち、RAGや少数ショットに適しています。"
+  },
+  "microsoft/Phi-3-mini-4k-instruct": {
+    "description": "Phi-3ファミリーで最小のメンバーで、品質と低遅延に最適化されています。"
+  },
+  "microsoft/Phi-3-small-128k-instruct": {
+    "description": "同じPhi-3-smallモデルですが、より大きなコンテキストサイズを持ち、RAGや少数ショットに適しています。"
+  },
+  "microsoft/Phi-3-small-8k-instruct": {
+    "description": "70億パラメータモデルで、Phi-3-miniよりも品質が高く、高品質で推論集約型のデータに重点を置いています。"
+  },
+  "microsoft/Phi-3.5-mini-instruct": {
+    "description": "Phi-3-miniモデルのアップデート版です。"
+  },
+  "microsoft/Phi-3.5-vision-instruct": {
+    "description": "Phi-3-visionモデルのアップデート版です。"
+  },
   "microsoft/WizardLM-2-8x22B": {
     "description": "WizardLM 2はMicrosoft AIが提供する言語モデルで、複雑な対話、多言語、推論、インテリジェントアシスタントの分野で特に優れた性能を発揮します。"
   },
@@ -1628,6 +1691,15 @@
   "mistral": {
     "description": "Mistralは、Mistral AIがリリースした7Bモデルであり、多様な言語処理ニーズに適しています。"
   },
+  "mistral-ai/Mistral-Large-2411": {
+    "description": "Mistralのフラッグシップモデルで、大規模な推論能力や高度に専門化された複雑なタスク（合成テキスト生成、コード生成、RAG、エージェント）に適しています。"
+  },
+  "mistral-ai/Mistral-Nemo": {
+    "description": "Mistral Nemoは最先端の言語モデル（LLM）で、そのサイズカテゴリにおいて最先端の推論、世界知識、コーディング能力を備えています。"
+  },
+  "mistral-ai/mistral-small-2503": {
+    "description": "Mistral Smallは高効率かつ低遅延を必要とするあらゆる言語ベースのタスクに利用可能です。"
+  },
   "mistral-large": {
     "description": "Mixtral Largeは、Mistralのフラッグシップモデルであり、コード生成、数学、推論の能力を組み合わせ、128kのコンテキストウィンドウをサポートします。"
   },
@@ -1769,6 +1841,9 @@
   "openai/gpt-4o-mini": {
     "description": "GPT-4o miniはOpenAIがGPT-4 Omniの後に発表した最新モデルで、画像とテキストの入力をサポートし、テキストを出力します。彼らの最先端の小型モデルとして、最近の他の最前線モデルよりもはるかに安価で、GPT-3.5 Turboよりも60%以上安価です。最先端の知能を維持しつつ、顕著なコストパフォーマンスを誇ります。GPT-4o miniはMMLUテストで82%のスコアを獲得し、現在チャットの好みでGPT-4よりも高い評価を得ています。"
   },
+  "openai/o1": {
+    "description": "o1はOpenAIの新しい推論モデルで、画像とテキストの入力をサポートし、テキストを出力します。広範な一般知識を必要とする複雑なタスクに適しています。このモデルは20万トークンのコンテキストと2023年10月の知識カットオフを備えています。"
+  },
   "openai/o1-mini": {
     "description": "o1-miniは、プログラミング、数学、科学のアプリケーションシーンに特化して設計された迅速で経済的な推論モデルです。このモデルは128Kのコンテキストを持ち、2023年10月の知識のカットオフがあります。"
   },
diff --git a/locales/ja-JP/setting.json b/locales/ja-JP/setting.json
index 93bae4b30b..527464d9c9 100644
--- a/locales/ja-JP/setting.json
+++ b/locales/ja-JP/setting.json
@@ -259,9 +259,6 @@
     "enableMaxTokens": {
       "title": "単一応答制限を有効にする"
     },
-    "enableReasoningEffort": {
-      "title": "推論強度調整を有効にする"
-    },
     "frequencyPenalty": {
       "desc": "値が大きいほど、言葉がより豊かで多様になります。値が小さいほど、言葉はより素朴でシンプルになります。",
       "title": "語彙の豊かさ"
@@ -281,15 +278,6 @@
       "desc": "値が大きいほど、異なる表現方法を好み、概念の繰り返しを避けます。値が小さいほど、繰り返しの概念や表現を使用する傾向が強く、一貫性のある表現になります。",
       "title": "表現の多様性"
     },
-    "reasoningEffort": {
-      "desc": "値が大きいほど推論能力が高まりますが、応答時間とトークン消費が増加する可能性があります",
-      "options": {
-        "high": "高",
-        "low": "低",
-        "medium": "中"
-      },
-      "title": "推論強度"
-    },
     "submit": "モデル設定を更新",
     "temperature": {
       "desc": "数値が大きいほど、回答はより創造的で想像力に富む；数値が小さいほど、回答はより厳密になる",
diff --git a/locales/ko-KR/chat.json b/locales/ko-KR/chat.json
index 5746228e22..f7b08820e3 100644
--- a/locales/ko-KR/chat.json
+++ b/locales/ko-KR/chat.json
@@ -43,6 +43,9 @@
     "reasoningBudgetToken": {
       "title": "사고 소모 토큰"
     },
+    "reasoningEffort": {
+      "title": "추론 강도"
+    },
     "title": "모델 확장 기능"
   },
   "history": {
diff --git a/locales/ko-KR/models.json b/locales/ko-KR/models.json
index 56cac94583..86c4ca11a3 100644
--- a/locales/ko-KR/models.json
+++ b/locales/ko-KR/models.json
@@ -341,9 +341,6 @@
   "Qwen2.5-Coder-32B-Instruct": {
     "description": "Qwen2.5-Coder-32B-Instruct는 코드 생성, 코드 이해 및 효율적인 개발 시나리오를 위해 설계된 대형 언어 모델로, 업계 최고의 32B 매개변수 규모를 채택하여 다양한 프로그래밍 요구를 충족합니다."
   },
-  "SenseCat-5-1202": {
-    "description": "V5.5를 기반으로 한 최신 버전으로, 이전 버전보다 중문 및 영문 기본 능력, 채팅, 이과 지식, 인문학 지식, 작문, 수리 논리, 글자 수 조절 등 여러 측면에서 성능이 크게 향상되었습니다."
-  },
   "SenseChat": {
     "description": "기본 버전 모델(V4), 4K 컨텍스트 길이, 일반적인 능력이 강력합니다."
   },
@@ -356,6 +353,9 @@
   "SenseChat-5": {
     "description": "최신 버전 모델(V5.5), 128K 컨텍스트 길이, 수학적 추론, 영어 대화, 지시 따르기 및 긴 텍스트 이해 등 분야에서 능력이 크게 향상되어 GPT-4o와 견줄 수 있습니다."
   },
+  "SenseChat-5-1202": {
+    "description": "V5.5 기반 최신 버전으로, 이전 버전 대비 중영문 기본 능력, 대화, 이과 지식, 문과 지식, 작문, 수리 논리, 글자 수 조절 등 여러 측면에서 현저한 향상을 이루었습니다."
+  },
   "SenseChat-5-Cantonese": {
     "description": "32K 컨텍스트 길이, 광둥어 대화 이해에서 GPT-4를 초월하며, 지식, 추론, 수학 및 코드 작성 등 여러 분야에서 GPT-4 Turbo와 견줄 수 있습니다."
   },
@@ -515,6 +515,12 @@
   "ai21-jamba-1.5-mini": {
     "description": "52B 매개변수(12B 활성)의 다국어 모델로, 256K 긴 컨텍스트 창, 함수 호출, 구조화된 출력 및 기반 생성 기능을 제공합니다."
   },
+  "ai21-labs/AI21-Jamba-1.5-Large": {
+    "description": "398B 매개변수(활성 94B)를 가진 다국어 모델로, 256K 길이의 컨텍스트 창, 함수 호출, 구조화된 출력 및 사실 기반 생성을 제공합니다."
+  },
+  "ai21-labs/AI21-Jamba-1.5-Mini": {
+    "description": "52B 매개변수(활성 12B)를 가진 다국어 모델로, 256K 길이의 컨텍스트 창, 함수 호출, 구조화된 출력 및 사실 기반 생성을 제공합니다."
+  },
   "anthropic.claude-3-5-sonnet-20240620-v1:0": {
     "description": "Claude 3.5 Sonnet는 업계 표준을 향상시켜 경쟁 모델 및 Claude 3 Opus를 초월하며, 광범위한 평가에서 뛰어난 성능을 보이고, 중간 수준 모델의 속도와 비용을 갖추고 있습니다."
   },
@@ -668,6 +674,12 @@
   "cohere-command-r-plus": {
     "description": "Command R+는 기업급 작업을 처리하기 위해 설계된 최첨단 RAG 최적화 모델입니다."
   },
+  "cohere/Cohere-command-r": {
+    "description": "Command R은 RAG 및 도구 사용에 최적화된 확장 가능한 생성 모델로, 기업이 생산 수준의 AI를 구현할 수 있도록 설계되었습니다."
+  },
+  "cohere/Cohere-command-r-plus": {
+    "description": "Command R+는 최첨단 RAG 최적화 모델로, 기업용 워크로드에 대응하도록 설계되었습니다."
+  },
   "command": {
     "description": "지시를 따르는 대화 모델로, 언어 작업에서 높은 품질과 신뢰성을 제공하며, 우리의 기본 생성 모델에 비해 더 긴 컨텍스트 길이를 가지고 있습니다."
   },
@@ -1028,6 +1040,12 @@
   "gemini-2.5-flash-preview-04-17": {
     "description": "Gemini 2.5 Flash Preview는 Google의 가장 가성비 높은 모델로, 포괄적인 기능을 제공합니다."
   },
+  "gemini-2.5-flash-preview-04-17-thinking": {
+    "description": "Gemini 2.5 Flash Preview는 Google의 최고의 가성비 모델로, 포괄적인 기능을 제공합니다."
+  },
+  "gemini-2.5-flash-preview-05-20": {
+    "description": "Gemini 2.5 Flash Preview는 Google의 최고의 가성비 모델로, 포괄적인 기능을 제공합니다."
+  },
   "gemini-2.5-pro-exp-03-25": {
     "description": "Gemini 2.5 Pro Experimental은 Google의 최첨단 사고 모델로, 코드, 수학 및 STEM 분야의 복잡한 문제를 추론할 수 있으며, 긴 문맥을 활용하여 대규모 데이터 세트, 코드베이스 및 문서를 분석할 수 있습니다."
   },
@@ -1262,23 +1280,17 @@
   "grok-2-vision-1212": {
     "description": "이 모델은 정확성, 지시 준수 및 다국어 능력에서 개선되었습니다."
   },
-  "grok-3-beta": {
-    "description": "플래그십 모델로, 데이터 추출, 프로그래밍 및 텍스트 요약 등 기업용 애플리케이션에 강점을 가지고 있으며, 금융, 의료, 법률 및 과학 분야에 대한 깊은 지식을 보유하고 있습니다."
+  "grok-3": {
+    "description": "플래그십 모델로, 데이터 추출, 프로그래밍, 텍스트 요약 등 기업용 애플리케이션에 능하며 금융, 의료, 법률, 과학 분야에 대한 깊은 지식을 보유하고 있습니다."
   },
-  "grok-3-fast-beta": {
-    "description": "플래그십 모델로, 데이터 추출, 프로그래밍 및 텍스트 요약 등 기업용 애플리케이션에 강점을 가지고 있으며, 금융, 의료, 법률 및 과학 분야에 대한 깊은 지식을 보유하고 있습니다."
+  "grok-3-fast": {
+    "description": "플래그십 모델로, 데이터 추출, 프로그래밍, 텍스트 요약 등 기업용 애플리케이션에 능하며 금융, 의료, 법률, 과학 분야에 대한 깊은 지식을 보유하고 있습니다."
   },
-  "grok-3-mini-beta": {
-    "description": "경량 모델로, 대화 전에 먼저 생각합니다. 빠르고 스마트하게 실행되며, 깊은 분야 지식이 필요하지 않은 논리적 작업에 적합하고 원래의 사고 경로를 파악할 수 있습니다."
+  "grok-3-mini": {
+    "description": "경량 모델로, 대화 전에 먼저 사고합니다. 빠르고 지능적으로 작동하며, 깊은 도메인 지식이 필요 없는 논리 작업에 적합하고 원시 사고 경로를 획득할 수 있습니다."
   },
-  "grok-3-mini-fast-beta": {
-    "description": "경량 모델로, 대화 전에 먼저 생각합니다. 빠르고 스마트하게 실행되며, 깊은 분야 지식이 필요하지 않은 논리적 작업에 적합하고 원래의 사고 경로를 파악할 수 있습니다."
-  },
-  "grok-beta": {
-    "description": "Grok 2와 유사한 성능을 가지지만, 더 높은 효율성, 속도 및 기능을 제공합니다."
-  },
-  "grok-vision-beta": {
-    "description": "최신 이미지 이해 모델로, 문서, 차트, 스크린샷 및 사진 등 다양한 시각 정보를 처리할 수 있습니다."
+  "grok-3-mini-fast": {
+    "description": "경량 모델로, 대화 전에 먼저 사고합니다. 빠르고 지능적으로 작동하며, 깊은 도메인 지식이 필요 없는 논리 작업에 적합하고 원시 사고 경로를 획득할 수 있습니다."
   },
   "gryphe/mythomax-l2-13b": {
     "description": "MythoMax l2 13B는 여러 최상위 모델을 통합한 창의성과 지능이 결합된 언어 모델입니다."
@@ -1322,6 +1334,9 @@
   "hunyuan-t1-latest": {
     "description": "업계 최초의 초대형 Hybrid-Transformer-Mamba 추론 모델로, 추론 능력을 확장하고, 뛰어난 디코딩 속도를 자랑하며, 인간의 선호에 더욱 부합합니다."
   },
+  "hunyuan-t1-vision": {
+    "description": "혼원 다중모달 이해 심층 사고 모델로, 다중모달 원천 사고 체인을 지원하며 다양한 이미지 추론 시나리오에 능숙합니다. 이과 문제에서 빠른 사고 모델 대비 전반적인 성능 향상을 보입니다."
+  },
   "hunyuan-translation": {
     "description": "중국어, 영어, 일본어, 프랑스어, 포르투갈어, 스페인어, 터키어, 러시아어, 아랍어, 한국어, 이탈리아어, 독일어, 베트남어, 말레이어, 인도네시아어 등 15개 언어 간의 상호 번역을 지원하며, 다중 시나리오 번역 평가 집합을 기반으로 한 자동화 평가 COMET 점수를 통해, 10여 개의 일반 언어에서의 상호 번역 능력이 시장의 동급 모델보다 전반적으로 우수합니다."
   },
@@ -1586,6 +1601,30 @@
   "meta.llama3-8b-instruct-v1:0": {
     "description": "Meta Llama 3은 개발자, 연구자 및 기업을 위한 오픈 대형 언어 모델(LLM)로, 생성 AI 아이디어를 구축하고 실험하며 책임감 있게 확장하는 데 도움을 주기 위해 설계되었습니다. 전 세계 커뮤니티 혁신의 기초 시스템의 일환으로, 계산 능력과 자원이 제한된 환경, 엣지 장치 및 더 빠른 훈련 시간에 매우 적합합니다."
   },
+  "meta/Llama-3.2-11B-Vision-Instruct": {
+    "description": "고해상도 이미지에서 뛰어난 이미지 추론 능력을 발휘하며, 시각적 이해 애플리케이션에 적합합니다."
+  },
+  "meta/Llama-3.2-90B-Vision-Instruct": {
+    "description": "시각적 이해 에이전트 애플리케이션에 적합한 고급 이미지 추론 능력입니다."
+  },
+  "meta/Llama-3.3-70B-Instruct": {
+    "description": "Llama 3.3은 Llama 시리즈의 최첨단 다국어 오픈소스 대형 언어 모델로, 매우 낮은 비용으로 405B 모델에 필적하는 성능을 경험할 수 있습니다. Transformer 구조를 기반으로 하며, 감독 미세조정(SFT)과 인간 피드백 강화 학습(RLHF)을 통해 유용성과 안전성을 향상시켰습니다. 지침 조정 버전은 다국어 대화에 최적화되어 있으며, 여러 산업 벤치마크에서 다수의 오픈소스 및 폐쇄형 챗 모델을 능가합니다. 지식 기준일은 2023년 12월입니다."
+  },
+  "meta/Meta-Llama-3-70B-Instruct": {
+    "description": "추론, 코딩 및 광범위한 언어 응용 분야에서 뛰어난 성능을 보이는 강력한 700억 매개변수 모델입니다."
+  },
+  "meta/Meta-Llama-3-8B-Instruct": {
+    "description": "대화 및 텍스트 생성 작업에 최적화된 다목적 80억 매개변수 모델입니다."
+  },
+  "meta/Meta-Llama-3.1-405B-Instruct": {
+    "description": "Llama 3.1 지침 조정 텍스트 모델로, 다국어 대화 사례에 최적화되어 있으며, 다수의 오픈소스 및 폐쇄형 챗 모델 중에서 일반 산업 벤치마크에서 우수한 성능을 보입니다."
+  },
+  "meta/Meta-Llama-3.1-70B-Instruct": {
+    "description": "Llama 3.1 지침 조정 텍스트 모델로, 다국어 대화 사례에 최적화되어 있으며, 다수의 오픈소스 및 폐쇄형 챗 모델 중에서 일반 산업 벤치마크에서 우수한 성능을 보입니다."
+  },
+  "meta/Meta-Llama-3.1-8B-Instruct": {
+    "description": "Llama 3.1 지침 조정 텍스트 모델로, 다국어 대화 사례에 최적화되어 있으며, 다수의 오픈소스 및 폐쇄형 챗 모델 중에서 일반 산업 벤치마크에서 우수한 성능을 보입니다."
+  },
   "meta/llama-3.1-405b-instruct": {
     "description": "합성 데이터 생성, 지식 증류 및 추론을 지원하는 고급 LLM으로, 챗봇, 프로그래밍 및 특정 분야 작업에 적합합니다."
   },
@@ -1610,6 +1649,30 @@
   "meta/llama-3.3-70b-instruct": {
     "description": "추론, 수학, 상식 및 함수 호출에 능숙한 고급 LLM입니다."
   },
+  "microsoft/Phi-3-medium-128k-instruct": {
+    "description": "동일한 Phi-3-medium 모델이지만 더 큰 컨텍스트 크기를 제공하여 RAG 또는 소량 프롬프트에 적합합니다."
+  },
+  "microsoft/Phi-3-medium-4k-instruct": {
+    "description": "140억 매개변수 모델로, Phi-3-mini보다 품질이 우수하며 고품질 추론 집약적 데이터에 중점을 둡니다."
+  },
+  "microsoft/Phi-3-mini-128k-instruct": {
+    "description": "동일한 Phi-3-mini 모델이지만 더 큰 컨텍스트 크기를 제공하여 RAG 또는 소량 프롬프트에 적합합니다."
+  },
+  "microsoft/Phi-3-mini-4k-instruct": {
+    "description": "Phi-3 시리즈 중 가장 작은 모델로, 품질과 저지연에 최적화되어 있습니다."
+  },
+  "microsoft/Phi-3-small-128k-instruct": {
+    "description": "동일한 Phi-3-small 모델이지만 더 큰 컨텍스트 크기를 제공하여 RAG 또는 소량 프롬프트에 적합합니다."
+  },
+  "microsoft/Phi-3-small-8k-instruct": {
+    "description": "70억 매개변수 모델로, Phi-3-mini보다 품질이 우수하며 고품질 추론 집약적 데이터에 중점을 둡니다."
+  },
+  "microsoft/Phi-3.5-mini-instruct": {
+    "description": "Phi-3-mini 모델의 업데이트 버전입니다."
+  },
+  "microsoft/Phi-3.5-vision-instruct": {
+    "description": "Phi-3-vision 모델의 업데이트 버전입니다."
+  },
   "microsoft/WizardLM-2-8x22B": {
     "description": "WizardLM 2는 Microsoft AI가 제공하는 언어 모델로, 복잡한 대화, 다국어, 추론 및 스마트 어시스턴트 분야에서 특히 뛰어난 성능을 보입니다."
   },
@@ -1628,6 +1691,15 @@
   "mistral": {
     "description": "Mistral은 Mistral AI에서 출시한 7B 모델로, 변화하는 언어 처리 요구에 적합합니다."
   },
+  "mistral-ai/Mistral-Large-2411": {
+    "description": "Mistral의 플래그십 모델로, 대규모 추론 능력이나 고도로 전문화된 복잡한 작업(합성 텍스트 생성, 코드 생성, RAG 또는 에이전트)에 적합합니다."
+  },
+  "mistral-ai/Mistral-Nemo": {
+    "description": "Mistral Nemo는 최첨단 언어 모델(LLM)로, 해당 크기 범주에서 최상의 추론, 세계 지식 및 코딩 능력을 갖추고 있습니다."
+  },
+  "mistral-ai/mistral-small-2503": {
+    "description": "Mistral Small은 고효율 및 저지연이 필요한 모든 언어 기반 작업에 사용할 수 있습니다."
+  },
   "mistral-large": {
     "description": "Mixtral Large는 Mistral의 플래그십 모델로, 코드 생성, 수학 및 추론 능력을 결합하여 128k 컨텍스트 창을 지원합니다."
   },
@@ -1769,6 +1841,9 @@
   "openai/gpt-4o-mini": {
     "description": "GPT-4o mini는 OpenAI가 GPT-4 Omni 이후에 출시한 최신 모델로, 이미지와 텍스트 입력을 지원하며 텍스트를 출력합니다. 가장 진보된 소형 모델로, 최근의 다른 최첨단 모델보다 훨씬 저렴하며, GPT-3.5 Turbo보다 60% 이상 저렴합니다. 최첨단 지능을 유지하면서도 뛰어난 가성비를 자랑합니다. GPT-4o mini는 MMLU 테스트에서 82%의 점수를 기록했으며, 현재 채팅 선호도에서 GPT-4보다 높은 순위를 차지하고 있습니다."
   },
+  "openai/o1": {
+    "description": "o1은 OpenAI의 새로운 추론 모델로, 이미지와 텍스트 입력을 지원하며 텍스트를 출력합니다. 광범위한 일반 지식이 필요한 복잡한 작업에 적합합니다. 이 모델은 20만 토큰의 컨텍스트와 2023년 10월 기준 지식을 보유하고 있습니다."
+  },
   "openai/o1-mini": {
     "description": "o1-mini는 프로그래밍, 수학 및 과학 응용 프로그램을 위해 설계된 빠르고 경제적인 추론 모델입니다. 이 모델은 128K의 컨텍스트와 2023년 10월의 지식 기준일을 가지고 있습니다."
   },
diff --git a/locales/ko-KR/setting.json b/locales/ko-KR/setting.json
index f13df3f430..c8ae7d718a 100644
--- a/locales/ko-KR/setting.json
+++ b/locales/ko-KR/setting.json
@@ -259,9 +259,6 @@
     "enableMaxTokens": {
       "title": "단일 응답 제한 활성화"
     },
-    "enableReasoningEffort": {
-      "title": "추론 강도 조정 활성화"
-    },
     "frequencyPenalty": {
       "desc": "값이 클수록 단어 선택이 더 다양하고 풍부해지며, 값이 작을수록 단어 선택이 더 간단하고 소박해집니다.",
       "title": "어휘 다양성"
@@ -281,15 +278,6 @@
       "desc": "값이 클수록 다양한 표현 방식으로 기울어져 개념의 반복을 피하고, 값이 작을수록 반복적인 개념이나 서술을 사용하는 경향이 있어 표현이 더 일관됩니다.",
       "title": "표현의 다양성"
     },
-    "reasoningEffort": {
-      "desc": "값이 클수록 추론 능력이 강해지지만, 응답 시간과 토큰 소모가 증가할 수 있습니다.",
-      "options": {
-        "high": "높음",
-        "low": "낮음",
-        "medium": "중간"
-      },
-      "title": "추론 강도"
-    },
     "submit": "모델 설정 업데이트",
     "temperature": {
       "desc": "값이 클수록 답변이 더 창의적이고 상상력이 풍부해지며, 값이 작을수록 답변이 더 엄격해집니다.",
diff --git a/locales/nl-NL/chat.json b/locales/nl-NL/chat.json
index 6e0fc33502..1793f6d078 100644
--- a/locales/nl-NL/chat.json
+++ b/locales/nl-NL/chat.json
@@ -43,6 +43,9 @@
     "reasoningBudgetToken": {
       "title": "Denken verbruik Token"
     },
+    "reasoningEffort": {
+      "title": "Redeneringsinspanning"
+    },
     "title": "Modeluitbreidingsfunctie"
   },
   "history": {
diff --git a/locales/nl-NL/models.json b/locales/nl-NL/models.json
index 5a03165f2e..55534365ea 100644
--- a/locales/nl-NL/models.json
+++ b/locales/nl-NL/models.json
@@ -341,9 +341,6 @@
   "Qwen2.5-Coder-32B-Instruct": {
     "description": "Qwen2.5-Coder-32B-Instruct is een groot taalmodel dat speciaal is ontworpen voor codegeneratie, codebegrip en efficiënte ontwikkelingsscenario's, met een toonaangevende parameteromvang van 32B, dat kan voldoen aan diverse programmeerbehoeften."
   },
-  "SenseCat-5-1202": {
-    "description": "De nieuwste versie gebaseerd op V5.5, met significante verbeteringen ten opzichte van de vorige versie in basisvaardigheden in het Chinees en Engels, chatten, exacte wetenschappen, geesteswetenschappen, schrijven, wiskundige logica, en woordtelling."
-  },
   "SenseChat": {
     "description": "Basisversie van het model (V4), met een contextlengte van 4K, heeft sterke algemene capaciteiten."
   },
@@ -356,6 +353,9 @@
   "SenseChat-5": {
     "description": "De nieuwste versie van het model (V5.5), met een contextlengte van 128K, heeft aanzienlijke verbeteringen in wiskundig redeneren, Engelse conversatie, instructievolging en begrip van lange teksten, en kan zich meten met GPT-4o."
   },
+  "SenseChat-5-1202": {
+    "description": "Gebaseerd op versie V5.5, met significante verbeteringen ten opzichte van de vorige versie in basisvaardigheden in Chinees en Engels, chatten, exacte wetenschappen, geesteswetenschappen, schrijven, wiskundige logica en woordenaantalcontrole."
+  },
   "SenseChat-5-Cantonese": {
     "description": "Met een contextlengte van 32K overtreft het de conversatiebegrip in het Kantonees van GPT-4 en kan het zich in verschillende domeinen zoals kennis, redeneren, wiskunde en coderen meten met GPT-4 Turbo."
   },
@@ -515,6 +515,12 @@
   "ai21-jamba-1.5-mini": {
     "description": "Een meertalig model met 52 miljard parameters (12 miljard actief), biedt een contextvenster van 256K, functieaanroep, gestructureerde output en gegronde generatie."
   },
+  "ai21-labs/AI21-Jamba-1.5-Large": {
+    "description": "Een meertalig model met 398 miljard parameters (waarvan 94 miljard actief), biedt een contextvenster van 256K tokens, functieaanroepen, gestructureerde output en feitelijke generatie."
+  },
+  "ai21-labs/AI21-Jamba-1.5-Mini": {
+    "description": "Een meertalig model met 52 miljard parameters (waarvan 12 miljard actief), biedt een contextvenster van 256K tokens, functieaanroepen, gestructureerde output en feitelijke generatie."
+  },
   "anthropic.claude-3-5-sonnet-20240620-v1:0": {
     "description": "Claude 3.5 Sonnet heeft de industrienormen verbeterd, met prestaties die de concurrentiemodellen en Claude 3 Opus overtreffen, en presteert uitstekend in brede evaluaties, met de snelheid en kosten van ons gemiddelde model."
   },
@@ -668,6 +674,12 @@
   "cohere-command-r-plus": {
     "description": "Command R+ is een state-of-the-art RAG-geoptimaliseerd model ontworpen om enterprise-grade workloads aan te pakken."
   },
+  "cohere/Cohere-command-r": {
+    "description": "Command R is een schaalbaar generatief model ontworpen voor RAG en toolgebruik, waarmee bedrijven productieklaar AI kunnen realiseren."
+  },
+  "cohere/Cohere-command-r-plus": {
+    "description": "Command R+ is een geavanceerd RAG-geoptimaliseerd model, ontworpen voor bedrijfsniveau workloads."
+  },
   "command": {
     "description": "Een instructievolgend dialoogmodel dat hoge kwaliteit en betrouwbaarheid biedt voor taaltaken, met een langere contextlengte dan ons basisgeneratiemodel."
   },
@@ -1028,6 +1040,12 @@
   "gemini-2.5-flash-preview-04-17": {
     "description": "Gemini 2.5 Flash Preview is het meest kosteneffectieve model van Google, dat uitgebreide functionaliteit biedt."
   },
+  "gemini-2.5-flash-preview-04-17-thinking": {
+    "description": "Gemini 2.5 Flash Preview is het meest kosteneffectieve model van Google en biedt uitgebreide functionaliteiten."
+  },
+  "gemini-2.5-flash-preview-05-20": {
+    "description": "Gemini 2.5 Flash Preview is het meest kosteneffectieve model van Google en biedt uitgebreide functionaliteiten."
+  },
   "gemini-2.5-pro-exp-03-25": {
     "description": "Gemini 2.5 Pro Experimental is Google's meest geavanceerde denkmodel, dat in staat is om te redeneren over complexe problemen in code, wiskunde en STEM-gebieden, en bovendien gebruik maakt van lange contexten om grote datasets, codebases en documenten te analyseren."
   },
@@ -1262,23 +1280,17 @@
   "grok-2-vision-1212": {
     "description": "Dit model heeft verbeteringen aangebracht in nauwkeurigheid, instructievolging en meertalige capaciteiten."
   },
-  "grok-3-beta": {
-    "description": "Vlaggenschipmodel, gespecialiseerd in data-extractie, programmeren en tekstsamenvattingen voor zakelijke toepassingen, met diepgaande kennis in de financiële, medische, juridische en wetenschappelijke sectoren."
+  "grok-3": {
+    "description": "Vlaggenschipmodel, gespecialiseerd in data-extractie, programmeren en tekstsamenvatting voor bedrijfsapplicaties, met diepgaande kennis in financiën, gezondheidszorg, recht en wetenschap."
   },
-  "grok-3-fast-beta": {
-    "description": "Vlaggenschipmodel, gespecialiseerd in data-extractie, programmeren en tekstsamenvattingen voor zakelijke toepassingen, met diepgaande kennis in de financiële, medische, juridische en wetenschappelijke sectoren."
+  "grok-3-fast": {
+    "description": "Vlaggenschipmodel, gespecialiseerd in data-extractie, programmeren en tekstsamenvatting voor bedrijfsapplicaties, met diepgaande kennis in financiën, gezondheidszorg, recht en wetenschap."
   },
-  "grok-3-mini-beta": {
-    "description": "Lichtgewicht model dat vooraf nadenkt voordat het een gesprek aangaat. Snel en intelligent, geschikt voor logische taken die geen diepgaande domeinkennis vereisen, en kan de oorspronkelijke denksporen vastleggen."
+  "grok-3-mini": {
+    "description": "Lichtgewicht model dat eerst nadenkt voor het reageren. Snel en intelligent, geschikt voor logische taken zonder diepgaande domeinkennis en kan de oorspronkelijke denkprocessen vastleggen."
   },
-  "grok-3-mini-fast-beta": {
-    "description": "Lichtgewicht model dat vooraf nadenkt voordat het een gesprek aangaat. Snel en intelligent, geschikt voor logische taken die geen diepgaande domeinkennis vereisen, en kan de oorspronkelijke denksporen vastleggen."
-  },
-  "grok-beta": {
-    "description": "Biedt prestaties vergelijkbaar met Grok 2, maar met hogere efficiëntie, snelheid en functionaliteit."
-  },
-  "grok-vision-beta": {
-    "description": "Het nieuwste model voor beeldbegrip, dat een breed scala aan visuele informatie kan verwerken, waaronder documenten, grafieken, screenshots en foto's."
+  "grok-3-mini-fast": {
+    "description": "Lichtgewicht model dat eerst nadenkt voor het reageren. Snel en intelligent, geschikt voor logische taken zonder diepgaande domeinkennis en kan de oorspronkelijke denkprocessen vastleggen."
   },
   "gryphe/mythomax-l2-13b": {
     "description": "MythoMax l2 13B is een taalmodel dat creativiteit en intelligentie combineert door meerdere topmodellen te integreren."
@@ -1322,6 +1334,9 @@
   "hunyuan-t1-latest": {
     "description": "De eerste ultra-grote Hybrid-Transformer-Mamba inferentiemodel in de industrie, dat de inferentiemogelijkheden uitbreidt, met een superieure decodesnelheid en verder afgestemd op menselijke voorkeuren."
   },
+  "hunyuan-t1-vision": {
+    "description": "Hunyuan multimodaal begrip en diepdenkend model, ondersteunt native multimodale lange-denk-ketens, excelleert in diverse beeldredeneerscenario's en verbetert aanzienlijk ten opzichte van snelle denkers bij exacte wetenschappen."
+  },
   "hunyuan-translation": {
     "description": "Ondersteunt vertalingen tussen het Chinees en 15 andere talen, waaronder Engels, Japans, Frans, Portugees, Spaans, Turks, Russisch, Arabisch, Koreaans, Italiaans, Duits, Vietnamees, Maleis en Indonesisch. Gebaseerd op een geautomatiseerde evaluatie van de COMET-score met een meervoudige scenario-vertalingstestset, overtreft het in het algemeen de vertaalcapaciteiten van vergelijkbare modellen op de markt."
   },
@@ -1586,6 +1601,30 @@
   "meta.llama3-8b-instruct-v1:0": {
     "description": "Meta Llama 3 is een open groot taalmodel (LLM) gericht op ontwikkelaars, onderzoekers en bedrijven, ontworpen om hen te helpen bij het bouwen, experimenteren en verantwoordelijk opschalen van hun generatieve AI-ideeën. Als onderdeel van het basis systeem voor wereldwijde gemeenschapsinnovatie is het zeer geschikt voor apparaten met beperkte rekenkracht en middelen, edge-apparaten en snellere trainingstijden."
   },
+  "meta/Llama-3.2-11B-Vision-Instruct": {
+    "description": "Uitstekende beeldredeneercapaciteiten op hoge resolutie afbeeldingen, geschikt voor visuele begripstoepassingen."
+  },
+  "meta/Llama-3.2-90B-Vision-Instruct": {
+    "description": "Geavanceerde beeldredeneercapaciteiten voor visuele begripagenttoepassingen."
+  },
+  "meta/Llama-3.3-70B-Instruct": {
+    "description": "Llama 3.3 is het meest geavanceerde meertalige open-source grote taalmodel in de Llama-serie, biedt prestaties vergelijkbaar met een 405B model tegen zeer lage kosten. Gebaseerd op de Transformer-architectuur en verbeterd via supervised fine-tuning (SFT) en reinforcement learning met menselijke feedback (RLHF) voor bruikbaarheid en veiligheid. De instructie-geoptimaliseerde versie is geoptimaliseerd voor meertalige dialogen en presteert beter dan veel open-source en gesloten chatmodellen op diverse industriële benchmarks. Kennisafkapdatum is december 2023."
+  },
+  "meta/Meta-Llama-3-70B-Instruct": {
+    "description": "Een krachtig model met 70 miljard parameters, uitmuntend in redeneren, coderen en brede taaltoepassingen."
+  },
+  "meta/Meta-Llama-3-8B-Instruct": {
+    "description": "Een veelzijdig model met 8 miljard parameters, geoptimaliseerd voor dialoog- en tekstgeneratietaken."
+  },
+  "meta/Meta-Llama-3.1-405B-Instruct": {
+    "description": "Llama 3.1 tekstmodel met instructie-finetuning, geoptimaliseerd voor meertalige dialoogtoepassingen, presteert uitstekend op veelgebruikte industriële benchmarks vergeleken met beschikbare open-source en gesloten chatmodellen."
+  },
+  "meta/Meta-Llama-3.1-70B-Instruct": {
+    "description": "Llama 3.1 tekstmodel met instructie-finetuning, geoptimaliseerd voor meertalige dialoogtoepassingen, presteert uitstekend op veelgebruikte industriële benchmarks vergeleken met beschikbare open-source en gesloten chatmodellen."
+  },
+  "meta/Meta-Llama-3.1-8B-Instruct": {
+    "description": "Llama 3.1 tekstmodel met instructie-finetuning, geoptimaliseerd voor meertalige dialoogtoepassingen, presteert uitstekend op veelgebruikte industriële benchmarks vergeleken met beschikbare open-source en gesloten chatmodellen."
+  },
   "meta/llama-3.1-405b-instruct": {
     "description": "Geavanceerd LLM, ondersteunt synthetische gegevensgeneratie, kennisdistillatie en redeneren, geschikt voor chatbots, programmeren en specifieke domeintaken."
   },
@@ -1610,6 +1649,30 @@
   "meta/llama-3.3-70b-instruct": {
     "description": "Geavanceerd LLM, gespecialiseerd in redeneren, wiskunde, algemene kennis en functieaanroepen."
   },
+  "microsoft/Phi-3-medium-128k-instruct": {
+    "description": "Hetzelfde Phi-3-medium model, maar met een groter contextvenster, geschikt voor RAG of weinig prompts."
+  },
+  "microsoft/Phi-3-medium-4k-instruct": {
+    "description": "Een model met 14 miljard parameters, kwalitatief beter dan Phi-3-mini, gericht op hoogwaardige, redeneerrijke data."
+  },
+  "microsoft/Phi-3-mini-128k-instruct": {
+    "description": "Hetzelfde Phi-3-mini model, maar met een groter contextvenster, geschikt voor RAG of weinig prompts."
+  },
+  "microsoft/Phi-3-mini-4k-instruct": {
+    "description": "Het kleinste lid van de Phi-3 familie, geoptimaliseerd voor kwaliteit en lage latentie."
+  },
+  "microsoft/Phi-3-small-128k-instruct": {
+    "description": "Hetzelfde Phi-3-small model, maar met een groter contextvenster, geschikt voor RAG of weinig prompts."
+  },
+  "microsoft/Phi-3-small-8k-instruct": {
+    "description": "Een model met 7 miljard parameters, kwalitatief beter dan Phi-3-mini, gericht op hoogwaardige, redeneerrijke data."
+  },
+  "microsoft/Phi-3.5-mini-instruct": {
+    "description": "Een bijgewerkte versie van het Phi-3-mini model."
+  },
+  "microsoft/Phi-3.5-vision-instruct": {
+    "description": "Een bijgewerkte versie van het Phi-3-vision model."
+  },
   "microsoft/WizardLM-2-8x22B": {
     "description": "WizardLM 2 is een taalmodel van Microsoft AI dat uitblinkt in complexe gesprekken, meertaligheid, redenering en intelligente assistenttoepassingen."
   },
@@ -1628,6 +1691,15 @@
   "mistral": {
     "description": "Mistral is het 7B-model van Mistral AI, geschikt voor variabele taalverwerkingsbehoeften."
   },
+  "mistral-ai/Mistral-Large-2411": {
+    "description": "Het vlaggenschipmodel van Mistral, geschikt voor grootschalige redeneertaken of sterk gespecialiseerde complexe taken (zoals synthetische tekstgeneratie, codegeneratie, RAG of agenten)."
+  },
+  "mistral-ai/Mistral-Nemo": {
+    "description": "Mistral Nemo is een geavanceerd taalmodel (LLM) met toonaangevende redeneercapaciteiten, wereldkennis en codeervaardigheden binnen zijn grootteklasse."
+  },
+  "mistral-ai/mistral-small-2503": {
+    "description": "Mistral Small is geschikt voor elke taalgebaseerde taak die hoge efficiëntie en lage latentie vereist."
+  },
   "mistral-large": {
     "description": "Mixtral Large is het vlaggenschipmodel van Mistral, dat de capaciteiten van codegeneratie, wiskunde en inferentie combineert, ondersteunt een contextvenster van 128k."
   },
@@ -1769,6 +1841,9 @@
   "openai/gpt-4o-mini": {
     "description": "GPT-4o mini is het nieuwste model van OpenAI, gelanceerd na GPT-4 Omni, dat tekst- en afbeeldingsinvoer ondersteunt en tekstuitvoer genereert. Als hun meest geavanceerde kleine model is het veel goedkoper dan andere recente toonaangevende modellen en meer dan 60% goedkoper dan GPT-3.5 Turbo. Het behoudt de meest geavanceerde intelligentie met een aanzienlijke prijs-kwaliteitverhouding. GPT-4o mini behaalde 82% op de MMLU-test en staat momenteel hoger in chatvoorkeuren dan GPT-4."
   },
+  "openai/o1": {
+    "description": "o1 is het nieuwe redeneermodel van OpenAI, ondersteunt tekst- en beeldinvoer en genereert tekstuitvoer, geschikt voor complexe taken die brede algemene kennis vereisen. Dit model heeft een context van 200K en een kennisafkapdatum van oktober 2023."
+  },
   "openai/o1-mini": {
     "description": "o1-mini is een snel en kosteneffectief redeneermodel dat is ontworpen voor programmeer-, wiskunde- en wetenschappelijke toepassingen. Dit model heeft een context van 128K en een kennisafkapdatum van oktober 2023."
   },
diff --git a/locales/nl-NL/setting.json b/locales/nl-NL/setting.json
index 51be3df6c5..5b96d6cd73 100644
--- a/locales/nl-NL/setting.json
+++ b/locales/nl-NL/setting.json
@@ -259,9 +259,6 @@
     "enableMaxTokens": {
       "title": "Limiet voor enkele reacties inschakelen"
     },
-    "enableReasoningEffort": {
-      "title": "Inschakelen van redeneringsinspanningsaanpassing"
-    },
     "frequencyPenalty": {
       "desc": "Hoe hoger de waarde, hoe rijker en gevarieerder de woordkeuze; hoe lager de waarde, hoe eenvoudiger en directer de woordkeuze",
       "title": "Woordenschat diversiteit"
@@ -281,15 +278,6 @@
       "desc": "Hoe hoger de waarde, hoe meer de neiging om verschillende uitdrukkingen te gebruiken en herhaling van concepten te vermijden; hoe lager de waarde, hoe meer de neiging om herhalende concepten of verhalen te gebruiken, wat zorgt voor meer consistentie in de uitdrukking",
       "title": "Uitdrukkingsdiversiteit"
     },
-    "reasoningEffort": {
-      "desc": "Hoe hoger de waarde, hoe sterker de redeneringscapaciteit, maar dit kan de responstijd en het tokenverbruik verhogen",
-      "options": {
-        "high": "Hoog",
-        "low": "Laag",
-        "medium": "Gemiddeld"
-      },
-      "title": "Redeneringsinspanningsniveau"
-    },
     "submit": "Modelinstellingen bijwerken",
     "temperature": {
       "desc": "Hoe hoger de waarde, hoe creatiever en fantasierijker het antwoord; hoe lager de waarde, hoe strikter het antwoord.",
diff --git a/locales/pl-PL/chat.json b/locales/pl-PL/chat.json
index e86347ff9b..a315a23da0 100644
--- a/locales/pl-PL/chat.json
+++ b/locales/pl-PL/chat.json
@@ -43,6 +43,9 @@
     "reasoningBudgetToken": {
       "title": "Token zużycia myślenia"
     },
+    "reasoningEffort": {
+      "title": "Intensywność rozumowania"
+    },
     "title": "Funkcje rozszerzenia modelu"
   },
   "history": {
diff --git a/locales/pl-PL/models.json b/locales/pl-PL/models.json
index bb7afced0b..6b2f9a7ab8 100644
--- a/locales/pl-PL/models.json
+++ b/locales/pl-PL/models.json
@@ -341,9 +341,6 @@
   "Qwen2.5-Coder-32B-Instruct": {
     "description": "Qwen2.5-Coder-32B-Instruct to duży model językowy zaprojektowany specjalnie do generowania kodu, rozumienia kodu i efektywnych scenariuszy rozwoju, wykorzystujący wiodącą w branży skalę 32B parametrów, zdolny do zaspokojenia różnorodnych potrzeb programistycznych."
   },
-  "SenseCat-5-1202": {
-    "description": "Jest to najnowsza wersja oparta na V5.5, która w porównaniu do poprzedniej wersji wykazuje znaczną poprawę w kilku wymiarach, takich jak podstawowe umiejętności w języku chińskim i angielskim, czat, wiedza ścisła, wiedza humanistyczna, pisanie, logika matematyczna oraz kontrola liczby słów."
-  },
   "SenseChat": {
     "description": "Podstawowa wersja modelu (V4), długość kontekstu 4K, silne zdolności ogólne."
   },
@@ -356,6 +353,9 @@
   "SenseChat-5": {
     "description": "Najnowsza wersja modelu (V5.5), długość kontekstu 128K, znacznie poprawione zdolności w zakresie rozumowania matematycznego, rozmów w języku angielskim, podążania za instrukcjami oraz rozumienia długich tekstów, dorównująca GPT-4o."
   },
+  "SenseChat-5-1202": {
+    "description": "Oparty na najnowszej wersji V5.5, z wyraźnymi ulepszeniami w podstawowych zdolnościach w języku chińskim i angielskim, czacie, wiedzy ścisłej i humanistycznej, pisaniu, logice matematycznej oraz kontroli liczby słów."
+  },
   "SenseChat-5-Cantonese": {
     "description": "Długość kontekstu 32K, w rozumieniu rozmów w języku kantońskim przewyższa GPT-4, w wielu dziedzinach, takich jak wiedza, rozumowanie, matematyka i programowanie, dorównuje GPT-4 Turbo."
   },
@@ -515,6 +515,12 @@
   "ai21-jamba-1.5-mini": {
     "description": "Model wielojęzyczny z 52 miliardami parametrów (12 miliardów aktywnych), oferujący okno kontekstowe o długości 256K, wywoływanie funkcji, strukturalne wyjście i generację opartą na kontekście."
   },
+  "ai21-labs/AI21-Jamba-1.5-Large": {
+    "description": "Model wielojęzyczny o 398 miliardach parametrów (94 miliardy aktywnych), oferujący okno kontekstowe o długości 256K, wywoływanie funkcji, strukturalne wyjście oraz generowanie oparte na faktach."
+  },
+  "ai21-labs/AI21-Jamba-1.5-Mini": {
+    "description": "Model wielojęzyczny o 52 miliardach parametrów (12 miliardów aktywnych), oferujący okno kontekstowe o długości 256K, wywoływanie funkcji, strukturalne wyjście oraz generowanie oparte na faktach."
+  },
   "anthropic.claude-3-5-sonnet-20240620-v1:0": {
     "description": "Claude 3.5 Sonnet podnosi standardy branżowe, przewyższając modele konkurencji oraz Claude 3 Opus, osiągając doskonałe wyniki w szerokim zakresie ocen, jednocześnie oferując szybkość i koszty na poziomie naszych modeli średniej klasy."
   },
@@ -668,6 +674,12 @@
   "cohere-command-r-plus": {
     "description": "Command R+ to model zoptymalizowany pod kątem RAG, zaprojektowany do obsługi obciążeń roboczych na poziomie przedsiębiorstwa."
   },
+  "cohere/Cohere-command-r": {
+    "description": "Command R to skalowalny model generatywny zaprojektowany do zastosowań RAG i narzędziowych, umożliwiający firmom wdrożenie AI na poziomie produkcyjnym."
+  },
+  "cohere/Cohere-command-r-plus": {
+    "description": "Command R+ to zaawansowany model zoptymalizowany pod kątem RAG, stworzony do obsługi obciążeń na poziomie przedsiębiorstwa."
+  },
   "command": {
     "description": "Model konwersacyjny, który przestrzega instrukcji, oferujący wysoką jakość i niezawodność w zadaniach językowych, a także dłuższą długość kontekstu w porównaniu do naszych podstawowych modeli generacyjnych."
   },
@@ -1028,6 +1040,12 @@
   "gemini-2.5-flash-preview-04-17": {
     "description": "Gemini 2.5 Flash Preview to najbardziej opłacalny model Google, oferujący wszechstronne funkcje."
   },
+  "gemini-2.5-flash-preview-04-17-thinking": {
+    "description": "Gemini 2.5 Flash Preview to najbardziej opłacalny model Google, oferujący wszechstronne funkcje."
+  },
+  "gemini-2.5-flash-preview-05-20": {
+    "description": "Gemini 2.5 Flash Preview to najbardziej opłacalny model Google, oferujący wszechstronne funkcje."
+  },
   "gemini-2.5-pro-exp-03-25": {
     "description": "Gemini 2.5 Pro Experimental to najnowocześniejszy model myślenia Google, zdolny do wnioskowania w zakresie kodu, matematyki i złożonych problemów w dziedzinie STEM, a także do analizy dużych zbiorów danych, repozytoriów kodu i dokumentów, wykorzystując długi kontekst."
   },
@@ -1262,23 +1280,17 @@
   "grok-2-vision-1212": {
     "description": "Model ten poprawił dokładność, przestrzeganie instrukcji oraz zdolności wielojęzyczne."
   },
-  "grok-3-beta": {
-    "description": "Flagowy model, specjalizujący się w ekstrakcji danych, programowaniu i podsumowywaniu tekstów w zastosowaniach korporacyjnych, posiadający głęboką wiedzę w dziedzinach takich jak finanse, medycyna, prawo i nauka."
+  "grok-3": {
+    "description": "Flagowy model, specjalizujący się w ekstrakcji danych, programowaniu i streszczaniu tekstów na poziomie korporacyjnym, z głęboką wiedzą w dziedzinach finansów, medycyny, prawa i nauki."
   },
-  "grok-3-fast-beta": {
-    "description": "Flagowy model, specjalizujący się w ekstrakcji danych, programowaniu i podsumowywaniu tekstów w zastosowaniach korporacyjnych, posiadający głęboką wiedzę w dziedzinach takich jak finanse, medycyna, prawo i nauka."
+  "grok-3-fast": {
+    "description": "Flagowy model, specjalizujący się w ekstrakcji danych, programowaniu i streszczaniu tekstów na poziomie korporacyjnym, z głęboką wiedzą w dziedzinach finansów, medycyny, prawa i nauki."
   },
-  "grok-3-mini-beta": {
-    "description": "Lekki model, który przed rozmową najpierw przemyśli. Działa szybko i inteligentnie, nadaje się do logicznych zadań, które nie wymagają głębokiej wiedzy w danej dziedzinie, i potrafi uchwycić pierwotne ścieżki myślenia."
+  "grok-3-mini": {
+    "description": "Lekki model, który najpierw analizuje przed rozmową. Działa szybko i inteligentnie, odpowiedni do zadań logicznych nie wymagających głębokiej wiedzy dziedzinowej, z możliwością śledzenia pierwotnego toku myślenia."
   },
-  "grok-3-mini-fast-beta": {
-    "description": "Lekki model, który przed rozmową najpierw przemyśli. Działa szybko i inteligentnie, nadaje się do logicznych zadań, które nie wymagają głębokiej wiedzy w danej dziedzinie, i potrafi uchwycić pierwotne ścieżki myślenia."
-  },
-  "grok-beta": {
-    "description": "Oferuje wydajność porównywalną z Grok 2, ale z wyższą efektywnością, prędkością i funkcjonalnością."
-  },
-  "grok-vision-beta": {
-    "description": "Najnowszy model rozumienia obrazów, który potrafi przetwarzać różnorodne informacje wizualne, w tym dokumenty, wykresy, zrzuty ekranu i zdjęcia."
+  "grok-3-mini-fast": {
+    "description": "Lekki model, który najpierw analizuje przed rozmową. Działa szybko i inteligentnie, odpowiedni do zadań logicznych nie wymagających głębokiej wiedzy dziedzinowej, z możliwością śledzenia pierwotnego toku myślenia."
   },
   "gryphe/mythomax-l2-13b": {
     "description": "MythoMax l2 13B to model językowy łączący kreatywność i inteligencję, zintegrowany z wieloma wiodącymi modelami."
@@ -1322,6 +1334,9 @@
   "hunyuan-t1-latest": {
     "description": "Pierwszy na świecie ultra-duży model wnioskowania Hybrid-Transformer-Mamba, rozszerzający zdolności wnioskowania, z niezwykle szybkim dekodowaniem, lepiej dostosowany do ludzkich preferencji."
   },
+  "hunyuan-t1-vision": {
+    "description": "Model głębokiego myślenia multimodalnego Hunyuan, obsługujący natywne łańcuchy myślowe multimodalne, doskonały w różnych scenariuszach wnioskowania obrazowego, z wyraźną przewagą nad modelami szybkiego myślenia w rozwiązywaniu problemów ścisłych."
+  },
   "hunyuan-translation": {
     "description": "Obsługuje tłumaczenie między 15 językami, w tym chińskim, angielskim, japońskim, francuskim, portugalskim, hiszpańskim, tureckim, rosyjskim, arabskim, koreańskim, włoskim, niemieckim, wietnamskim, malajskim i indonezyjskim, opartym na automatycznej ocenie COMET w oparciu o zestaw testowy do tłumaczenia w różnych scenariuszach, wykazując ogólnie lepsze zdolności tłumaczeniowe w porównaniu do modeli o podobnej skali na rynku."
   },
@@ -1586,6 +1601,30 @@
   "meta.llama3-8b-instruct-v1:0": {
     "description": "Meta Llama 3 to otwarty duży model językowy (LLM) skierowany do deweloperów, badaczy i przedsiębiorstw, mający na celu pomoc w budowaniu, eksperymentowaniu i odpowiedzialnym rozwijaniu ich pomysłów na generatywną sztuczną inteligencję. Jako część podstawowego systemu innowacji globalnej społeczności, jest idealny dla urządzeń o ograniczonej mocy obliczeniowej i zasobach, a także dla szybszego czasu szkolenia."
   },
+  "meta/Llama-3.2-11B-Vision-Instruct": {
+    "description": "Wysokiej jakości zdolności wnioskowania obrazowego na obrazach o wysokiej rozdzielczości, idealne do zastosowań związanych z rozumieniem wizualnym."
+  },
+  "meta/Llama-3.2-90B-Vision-Instruct": {
+    "description": "Zaawansowane zdolności wnioskowania obrazowego przeznaczone do zastosowań agentów rozumienia wizualnego."
+  },
+  "meta/Llama-3.3-70B-Instruct": {
+    "description": "Llama 3.3 to najnowocześniejszy wielojęzyczny, otwarty model językowy z serii Llama, oferujący wydajność porównywalną z modelem 405B przy bardzo niskich kosztach. Opiera się na architekturze Transformer i jest ulepszony przez nadzorowane dostrajanie (SFT) oraz uczenie ze wzmocnieniem na podstawie opinii ludzi (RLHF). Wersja dostrojona pod kątem instrukcji jest zoptymalizowana do wielojęzycznych dialogów i przewyższa wiele otwartych i zamkniętych modeli czatu w licznych branżowych benchmarkach. Data odcięcia wiedzy: grudzień 2023."
+  },
+  "meta/Meta-Llama-3-70B-Instruct": {
+    "description": "Potężny model o 70 miliardach parametrów, wyróżniający się wnioskowaniem, kodowaniem i szerokim zastosowaniem językowym."
+  },
+  "meta/Meta-Llama-3-8B-Instruct": {
+    "description": "Wszechstronny model o 8 miliardach parametrów, zoptymalizowany do zadań dialogowych i generowania tekstu."
+  },
+  "meta/Meta-Llama-3.1-405B-Instruct": {
+    "description": "Model tekstowy Llama 3.1 dostrojony pod kątem instrukcji, zoptymalizowany do wielojęzycznych zastosowań dialogowych, osiągający doskonałe wyniki w wielu dostępnych otwartych i zamkniętych modelach czatu na popularnych branżowych benchmarkach."
+  },
+  "meta/Meta-Llama-3.1-70B-Instruct": {
+    "description": "Model tekstowy Llama 3.1 dostrojony pod kątem instrukcji, zoptymalizowany do wielojęzycznych zastosowań dialogowych, osiągający doskonałe wyniki w wielu dostępnych otwartych i zamkniętych modelach czatu na popularnych branżowych benchmarkach."
+  },
+  "meta/Meta-Llama-3.1-8B-Instruct": {
+    "description": "Model tekstowy Llama 3.1 dostrojony pod kątem instrukcji, zoptymalizowany do wielojęzycznych zastosowań dialogowych, osiągający doskonałe wyniki w wielu dostępnych otwartych i zamkniętych modelach czatu na popularnych branżowych benchmarkach."
+  },
   "meta/llama-3.1-405b-instruct": {
     "description": "Zaawansowany LLM, wspierający generowanie danych syntetycznych, destylację wiedzy i wnioskowanie, odpowiedni do chatbotów, programowania i zadań w określonych dziedzinach."
   },
@@ -1610,6 +1649,30 @@
   "meta/llama-3.3-70b-instruct": {
     "description": "Zaawansowany LLM, specjalizujący się w wnioskowaniu, matematyce, zdrowym rozsądku i wywoływaniu funkcji."
   },
+  "microsoft/Phi-3-medium-128k-instruct": {
+    "description": "Ten sam model Phi-3-medium, ale z większym rozmiarem kontekstu, odpowiedni do RAG lub nielicznych podpowiedzi."
+  },
+  "microsoft/Phi-3-medium-4k-instruct": {
+    "description": "Model o 14 miliardach parametrów, lepszej jakości niż Phi-3-mini, skoncentrowany na wysokiej jakości i danych wymagających intensywnego wnioskowania."
+  },
+  "microsoft/Phi-3-mini-128k-instruct": {
+    "description": "Ten sam model Phi-3-mini, ale z większym rozmiarem kontekstu, odpowiedni do RAG lub nielicznych podpowiedzi."
+  },
+  "microsoft/Phi-3-mini-4k-instruct": {
+    "description": "Najmniejszy członek rodziny Phi-3, zoptymalizowany pod kątem jakości i niskich opóźnień."
+  },
+  "microsoft/Phi-3-small-128k-instruct": {
+    "description": "Ten sam model Phi-3-small, ale z większym rozmiarem kontekstu, odpowiedni do RAG lub nielicznych podpowiedzi."
+  },
+  "microsoft/Phi-3-small-8k-instruct": {
+    "description": "Model o 7 miliardach parametrów, lepszej jakości niż Phi-3-mini, skoncentrowany na wysokiej jakości i danych wymagających intensywnego wnioskowania."
+  },
+  "microsoft/Phi-3.5-mini-instruct": {
+    "description": "Zaktualizowana wersja modelu Phi-3-mini."
+  },
+  "microsoft/Phi-3.5-vision-instruct": {
+    "description": "Zaktualizowana wersja modelu Phi-3-vision."
+  },
   "microsoft/WizardLM-2-8x22B": {
     "description": "WizardLM 2 to model językowy oferowany przez Microsoft AI, który wyróżnia się w złożonych rozmowach, wielojęzyczności, wnioskowaniu i jako inteligentny asystent."
   },
@@ -1628,6 +1691,15 @@
   "mistral": {
     "description": "Mistral to model 7B wydany przez Mistral AI, odpowiedni do zmiennych potrzeb przetwarzania języka."
   },
+  "mistral-ai/Mistral-Large-2411": {
+    "description": "Flagowy model Mistral, odpowiedni do zadań wymagających dużej mocy obliczeniowej lub wysoko wyspecjalizowanych, takich jak generowanie tekstu syntetycznego, generowanie kodu, RAG lub agentów."
+  },
+  "mistral-ai/Mistral-Nemo": {
+    "description": "Mistral Nemo to nowoczesny model językowy (LLM) oferujący najlepsze w swojej klasie zdolności wnioskowania, wiedzy o świecie i kodowania."
+  },
+  "mistral-ai/mistral-small-2503": {
+    "description": "Mistral Small jest przeznaczony do wszelkich zadań językowych wymagających wysokiej wydajności i niskich opóźnień."
+  },
   "mistral-large": {
     "description": "Mixtral Large to flagowy model Mistral, łączący zdolności generowania kodu, matematyki i wnioskowania, wspierający kontekst o długości 128k."
   },
@@ -1769,6 +1841,9 @@
   "openai/gpt-4o-mini": {
     "description": "GPT-4o mini to najnowszy model OpenAI, wydany po GPT-4 Omni, obsługujący wejścia tekstowe i wizualne. Jako ich najnowocześniejszy mały model, jest znacznie tańszy od innych niedawnych modeli czołowych i kosztuje o ponad 60% mniej niż GPT-3.5 Turbo. Utrzymuje najnowocześniejszą inteligencję, oferując jednocześnie znaczną wartość za pieniądze. GPT-4o mini uzyskał wynik 82% w teście MMLU i obecnie zajmuje wyższą pozycję w preferencjach czatu niż GPT-4."
   },
+  "openai/o1": {
+    "description": "o1 to nowy model wnioskowania OpenAI, obsługujący wejścia tekstowo-obrazowe i generujący tekst, odpowiedni do złożonych zadań wymagających szerokiej wiedzy ogólnej. Model posiada kontekst o długości 200K oraz datę odcięcia wiedzy na październik 2023."
+  },
   "openai/o1-mini": {
     "description": "o1-mini to szybki i ekonomiczny model wnioskowania zaprojektowany z myślą o programowaniu, matematyce i zastosowaniach naukowych. Model ten ma kontekst 128K i datę graniczną wiedzy z października 2023 roku."
   },
diff --git a/locales/pl-PL/setting.json b/locales/pl-PL/setting.json
index 989dad6528..9a53a9764e 100644
--- a/locales/pl-PL/setting.json
+++ b/locales/pl-PL/setting.json
@@ -259,9 +259,6 @@
     "enableMaxTokens": {
       "title": "Włącz limit jednorazowej odpowiedzi"
     },
-    "enableReasoningEffort": {
-      "title": "Włącz dostosowanie intensywności rozumowania"
-    },
     "frequencyPenalty": {
       "desc": "Im większa wartość, tym bardziej zróżnicowane i bogate słownictwo; im mniejsza wartość, tym prostsze i bardziej bezpośrednie słownictwo",
       "title": "Różnorodność słownictwa"
@@ -281,15 +278,6 @@
       "desc": "Im większa wartość, tym większa tendencja do różnorodnych wyrażeń, unikanie powtórzeń; im mniejsza wartość, tym większa tendencja do używania powtarzających się koncepcji lub narracji, co prowadzi do większej spójności",
       "title": "Różnorodność wyrażeń"
     },
-    "reasoningEffort": {
-      "desc": "Im wyższa wartość, tym silniejsza zdolność rozumowania, ale może to zwiększyć czas odpowiedzi i zużycie tokenów",
-      "options": {
-        "high": "Wysoki",
-        "low": "Niski",
-        "medium": "Średni"
-      },
-      "title": "Intensywność rozumowania"
-    },
     "submit": "Zaktualizuj ustawienia modelu",
     "temperature": {
       "desc": "Im większa wartość, tym bardziej kreatywne i wyobrażeniowe będą odpowiedzi; im mniejsza wartość, tym bardziej rygorystyczne odpowiedzi",
diff --git a/locales/pt-BR/chat.json b/locales/pt-BR/chat.json
index d5385ce193..69f88e4d68 100644
--- a/locales/pt-BR/chat.json
+++ b/locales/pt-BR/chat.json
@@ -43,6 +43,9 @@
     "reasoningBudgetToken": {
       "title": "Token de Consumo de Pensamento"
     },
+    "reasoningEffort": {
+      "title": "Intensidade de Raciocínio"
+    },
     "title": "Funcionalidade de Extensão do Modelo"
   },
   "history": {
diff --git a/locales/pt-BR/models.json b/locales/pt-BR/models.json
index 0c776d7e86..2c9c5c6a80 100644
--- a/locales/pt-BR/models.json
+++ b/locales/pt-BR/models.json
@@ -341,9 +341,6 @@
   "Qwen2.5-Coder-32B-Instruct": {
     "description": "Qwen2.5-Coder-32B-Instruct é um grande modelo de linguagem projetado para geração de código, compreensão de código e cenários de desenvolvimento eficiente, com uma escala de 32 bilhões de parâmetros, atendendo a diversas necessidades de programação."
   },
-  "SenseCat-5-1202": {
-    "description": "Baseado na versão V5.5, a versão mais recente apresenta melhorias significativas em várias dimensões, incluindo habilidades básicas em chinês e inglês, conversação, conhecimento em ciências exatas, conhecimento em ciências humanas, redação, lógica matemática e controle de contagem de palavras."
-  },
   "SenseChat": {
     "description": "Modelo da versão básica (V4), com comprimento de contexto de 4K, com capacidades gerais poderosas."
   },
@@ -356,6 +353,9 @@
   "SenseChat-5": {
     "description": "Modelo da versão mais recente (V5.5), com comprimento de contexto de 128K, com capacidades significativamente aprimoradas em raciocínio matemático, diálogos em inglês, seguimento de instruções e compreensão de textos longos, rivalizando com o GPT-4o."
   },
+  "SenseChat-5-1202": {
+    "description": "Baseado na versão mais recente V5.5, apresenta melhorias significativas em várias dimensões, incluindo habilidades básicas em chinês e inglês, conversação, conhecimento científico, conhecimento humanístico, escrita, lógica matemática e controle de contagem de palavras."
+  },
   "SenseChat-5-Cantonese": {
     "description": "Comprimento de contexto de 32K, superando o GPT-4 na compreensão de diálogos em cantonês, competindo com o GPT-4 Turbo em várias áreas, incluindo conhecimento, raciocínio, matemática e programação."
   },
@@ -515,6 +515,12 @@
   "ai21-jamba-1.5-mini": {
     "description": "Um modelo multilíngue com 52B de parâmetros (12B ativos), oferecendo uma janela de contexto longa de 256K, chamada de função, saída estruturada e geração fundamentada."
   },
+  "ai21-labs/AI21-Jamba-1.5-Large": {
+    "description": "Um modelo multilíngue com 398 bilhões de parâmetros (94 bilhões ativos), oferecendo janela de contexto longa de 256K, chamadas de função, saída estruturada e geração baseada em fatos."
+  },
+  "ai21-labs/AI21-Jamba-1.5-Mini": {
+    "description": "Um modelo multilíngue com 52 bilhões de parâmetros (12 bilhões ativos), oferecendo janela de contexto longa de 256K, chamadas de função, saída estruturada e geração baseada em fatos."
+  },
   "anthropic.claude-3-5-sonnet-20240620-v1:0": {
     "description": "O Claude 3.5 Sonnet eleva o padrão da indústria, superando modelos concorrentes e o Claude 3 Opus, apresentando um desempenho excepcional em avaliações amplas, ao mesmo tempo que mantém a velocidade e o custo de nossos modelos de nível médio."
   },
@@ -668,6 +674,12 @@
   "cohere-command-r-plus": {
     "description": "Command R+ é um modelo otimizado para RAG de última geração, projetado para lidar com cargas de trabalho de nível empresarial."
   },
+  "cohere/Cohere-command-r": {
+    "description": "Command R é um modelo generativo escalável projetado para uso com RAG e ferramentas, permitindo que empresas implementem IA em nível de produção."
+  },
+  "cohere/Cohere-command-r-plus": {
+    "description": "Command R+ é um modelo otimizado de ponta para RAG, projetado para cargas de trabalho empresariais."
+  },
   "command": {
     "description": "Um modelo de diálogo que segue instruções, apresentando alta qualidade e confiabilidade em tarefas linguísticas, além de um comprimento de contexto mais longo em comparação com nosso modelo de geração básico."
   },
@@ -1028,6 +1040,12 @@
   "gemini-2.5-flash-preview-04-17": {
     "description": "O Gemini 2.5 Flash Preview é o modelo mais acessível do Google, oferecendo uma gama completa de funcionalidades."
   },
+  "gemini-2.5-flash-preview-04-17-thinking": {
+    "description": "Gemini 2.5 Flash Preview é o modelo com melhor custo-benefício do Google, oferecendo funcionalidades abrangentes."
+  },
+  "gemini-2.5-flash-preview-05-20": {
+    "description": "Gemini 2.5 Flash Preview é o modelo com melhor custo-benefício do Google, oferecendo funcionalidades abrangentes."
+  },
   "gemini-2.5-pro-exp-03-25": {
     "description": "O Gemini 2.5 Pro Experimental é o modelo de pensamento mais avançado do Google, capaz de raciocinar sobre problemas complexos em código, matemática e áreas STEM, além de analisar grandes conjuntos de dados, repositórios de código e documentos utilizando contextos longos."
   },
@@ -1262,23 +1280,17 @@
   "grok-2-vision-1212": {
     "description": "Este modelo apresenta melhorias em precisão, conformidade com instruções e capacidade multilíngue."
   },
-  "grok-3-beta": {
-    "description": "Modelo de ponta, especializado em extração de dados, programação e resumo de texto para aplicações empresariais, com profundo conhecimento em áreas como finanças, saúde, direito e ciência."
+  "grok-3": {
+    "description": "Modelo de nível flagship, especializado em extração de dados, programação e resumo de texto para aplicações empresariais, com profundo conhecimento em finanças, saúde, direito e ciências."
   },
-  "grok-3-fast-beta": {
-    "description": "Modelo de ponta, especializado em extração de dados, programação e resumo de texto para aplicações empresariais, com profundo conhecimento em áreas como finanças, saúde, direito e ciência."
+  "grok-3-fast": {
+    "description": "Modelo de nível flagship, especializado em extração de dados, programação e resumo de texto para aplicações empresariais, com profundo conhecimento em finanças, saúde, direito e ciências."
   },
-  "grok-3-mini-beta": {
-    "description": "Modelo leve, que reflete antes de conversar. Rápido e inteligente, adequado para tarefas lógicas que não exigem conhecimento profundo de domínio, e capaz de capturar o raciocínio original."
+  "grok-3-mini": {
+    "description": "Modelo leve que pensa antes de responder. Rápido e inteligente, adequado para tarefas lógicas que não exigem conhecimento profundo de domínio, e capaz de fornecer o rastro original do pensamento."
   },
-  "grok-3-mini-fast-beta": {
-    "description": "Modelo leve, que reflete antes de conversar. Rápido e inteligente, adequado para tarefas lógicas que não exigem conhecimento profundo de domínio, e capaz de capturar o raciocínio original."
-  },
-  "grok-beta": {
-    "description": "Apresenta desempenho equivalente ao Grok 2, mas com maior eficiência, velocidade e funcionalidades."
-  },
-  "grok-vision-beta": {
-    "description": "O mais recente modelo de compreensão de imagem, capaz de lidar com uma variedade de informações visuais, incluindo documentos, gráficos, capturas de tela e fotos."
+  "grok-3-mini-fast": {
+    "description": "Modelo leve que pensa antes de responder. Rápido e inteligente, adequado para tarefas lógicas que não exigem conhecimento profundo de domínio, e capaz de fornecer o rastro original do pensamento."
   },
   "gryphe/mythomax-l2-13b": {
     "description": "MythoMax l2 13B é um modelo de linguagem que combina criatividade e inteligência, integrando vários modelos de ponta."
@@ -1322,6 +1334,9 @@
   "hunyuan-t1-latest": {
     "description": "O primeiro modelo de inferência Hybrid-Transformer-Mamba em larga escala da indústria, que expande a capacidade de inferência, possui uma velocidade de decodificação excepcional e alinha-se ainda mais às preferências humanas."
   },
+  "hunyuan-t1-vision": {
+    "description": "Modelo de pensamento profundo multimodal Hunyuan, suporta cadeias de pensamento nativas multimodais de longo alcance, excelente em diversos cenários de raciocínio com imagens, com melhorias significativas em problemas científicos em comparação com modelos de pensamento rápido."
+  },
   "hunyuan-translation": {
     "description": "Suporta tradução entre 15 idiomas, incluindo chinês, inglês, japonês, francês, português, espanhol, turco, russo, árabe, coreano, italiano, alemão, vietnamita, malaio e indonésio, com avaliação automatizada baseada no conjunto de testes de tradução em múltiplos cenários e pontuação COMET, superando modelos de tamanho semelhante no mercado em termos de capacidade de tradução entre idiomas."
   },
@@ -1586,6 +1601,30 @@
   "meta.llama3-8b-instruct-v1:0": {
     "description": "Meta Llama 3 é um modelo de linguagem de grande escala (LLM) aberto voltado para desenvolvedores, pesquisadores e empresas, projetado para ajudá-los a construir, experimentar e expandir suas ideias de IA geradora de forma responsável. Como parte de um sistema de base para inovação da comunidade global, é ideal para dispositivos de borda com capacidade de computação e recursos limitados, além de tempos de treinamento mais rápidos."
   },
+  "meta/Llama-3.2-11B-Vision-Instruct": {
+    "description": "Capacidades avançadas de raciocínio visual em imagens de alta resolução, adequado para aplicações de compreensão visual."
+  },
+  "meta/Llama-3.2-90B-Vision-Instruct": {
+    "description": "Capacidades avançadas de raciocínio visual para aplicações de agentes de compreensão visual."
+  },
+  "meta/Llama-3.3-70B-Instruct": {
+    "description": "Llama 3.3 é o modelo de linguagem grande multilíngue open source mais avançado da série Llama, oferecendo desempenho comparável a modelos de 405B a um custo muito baixo. Baseado na arquitetura Transformer, aprimorado por fine-tuning supervisionado (SFT) e aprendizado por reforço com feedback humano (RLHF) para melhorar utilidade e segurança. A versão ajustada para instruções é otimizada para diálogos multilíngues e supera muitos modelos de chat open source e proprietários em vários benchmarks do setor. Data de corte do conhecimento: dezembro de 2023."
+  },
+  "meta/Meta-Llama-3-70B-Instruct": {
+    "description": "Um poderoso modelo de 70 bilhões de parâmetros, com desempenho excelente em raciocínio, codificação e ampla gama de aplicações linguísticas."
+  },
+  "meta/Meta-Llama-3-8B-Instruct": {
+    "description": "Um modelo versátil de 8 bilhões de parâmetros, otimizado para tarefas de diálogo e geração de texto."
+  },
+  "meta/Meta-Llama-3.1-405B-Instruct": {
+    "description": "Modelo de texto ajustado para instruções Llama 3.1, otimizado para casos de uso de diálogo multilíngue, com desempenho superior em benchmarks comuns do setor entre muitos modelos de chat open source e proprietários disponíveis."
+  },
+  "meta/Meta-Llama-3.1-70B-Instruct": {
+    "description": "Modelo de texto ajustado para instruções Llama 3.1, otimizado para casos de uso de diálogo multilíngue, com desempenho superior em benchmarks comuns do setor entre muitos modelos de chat open source e proprietários disponíveis."
+  },
+  "meta/Meta-Llama-3.1-8B-Instruct": {
+    "description": "Modelo de texto ajustado para instruções Llama 3.1, otimizado para casos de uso de diálogo multilíngue, com desempenho superior em benchmarks comuns do setor entre muitos modelos de chat open source e proprietários disponíveis."
+  },
   "meta/llama-3.1-405b-instruct": {
     "description": "LLM avançado, suporta geração de dados sintéticos, destilação de conhecimento e raciocínio, adequado para chatbots, programação e tarefas de domínio específico."
   },
@@ -1610,6 +1649,30 @@
   "meta/llama-3.3-70b-instruct": {
     "description": "Modelo LLM avançado, especializado em raciocínio, matemática, conhecimento geral e chamadas de função."
   },
+  "microsoft/Phi-3-medium-128k-instruct": {
+    "description": "O mesmo modelo Phi-3-medium, mas com contexto maior, adequado para RAG ou poucos prompts."
+  },
+  "microsoft/Phi-3-medium-4k-instruct": {
+    "description": "Um modelo de 14 bilhões de parâmetros, com qualidade superior ao Phi-3-mini, focado em dados de alta qualidade e raciocínio intensivo."
+  },
+  "microsoft/Phi-3-mini-128k-instruct": {
+    "description": "O mesmo modelo Phi-3-mini, mas com contexto maior, adequado para RAG ou poucos prompts."
+  },
+  "microsoft/Phi-3-mini-4k-instruct": {
+    "description": "O menor membro da família Phi-3, otimizado para qualidade e baixa latência."
+  },
+  "microsoft/Phi-3-small-128k-instruct": {
+    "description": "O mesmo modelo Phi-3-small, mas com contexto maior, adequado para RAG ou poucos prompts."
+  },
+  "microsoft/Phi-3-small-8k-instruct": {
+    "description": "Um modelo de 7 bilhões de parâmetros, com qualidade superior ao Phi-3-mini, focado em dados de alta qualidade e raciocínio intensivo."
+  },
+  "microsoft/Phi-3.5-mini-instruct": {
+    "description": "Versão atualizada do modelo Phi-3-mini."
+  },
+  "microsoft/Phi-3.5-vision-instruct": {
+    "description": "Versão atualizada do modelo Phi-3-vision."
+  },
   "microsoft/WizardLM-2-8x22B": {
     "description": "WizardLM 2 é um modelo de linguagem fornecido pela Microsoft AI, que se destaca em diálogos complexos, multilíngue, raciocínio e assistentes inteligentes."
   },
@@ -1628,6 +1691,15 @@
   "mistral": {
     "description": "Mistral é um modelo de 7B lançado pela Mistral AI, adequado para demandas de processamento de linguagem variáveis."
   },
+  "mistral-ai/Mistral-Large-2411": {
+    "description": "O modelo principal da Mistral, ideal para tarefas complexas que requerem raciocínio em grande escala ou alta especialização (geração de texto sintético, geração de código, RAG ou agentes)."
+  },
+  "mistral-ai/Mistral-Nemo": {
+    "description": "Mistral Nemo é um modelo de linguagem avançado (LLM) que oferece capacidades de raciocínio, conhecimento mundial e codificação líderes em sua categoria de tamanho."
+  },
+  "mistral-ai/mistral-small-2503": {
+    "description": "Mistral Small é adequado para qualquer tarefa baseada em linguagem que exija alta eficiência e baixa latência."
+  },
   "mistral-large": {
     "description": "Mixtral Large é o modelo de destaque da Mistral, combinando capacidades de geração de código, matemática e raciocínio, suportando uma janela de contexto de 128k."
   },
@@ -1769,6 +1841,9 @@
   "openai/gpt-4o-mini": {
     "description": "GPT-4o mini é o mais recente modelo da OpenAI, lançado após o GPT-4 Omni, que suporta entrada de texto e imagem e saída de texto. Como seu modelo compacto mais avançado, é muito mais barato do que outros modelos de ponta recentes e custa mais de 60% menos que o GPT-3.5 Turbo. Ele mantém inteligência de ponta, ao mesmo tempo que oferece uma relação custo-benefício significativa. O GPT-4o mini obteve uma pontuação de 82% no teste MMLU e atualmente está classificado acima do GPT-4 em preferências de chat."
   },
+  "openai/o1": {
+    "description": "o1 é o novo modelo de raciocínio da OpenAI, que suporta entrada de texto e imagem e gera texto, adequado para tarefas complexas que exigem amplo conhecimento geral. Este modelo possui um contexto de 200K e data de corte de conhecimento em outubro de 2023."
+  },
   "openai/o1-mini": {
     "description": "o1-mini é um modelo de raciocínio rápido e econômico, projetado para cenários de programação, matemática e ciências. Este modelo possui um contexto de 128K e uma data limite de conhecimento em outubro de 2023."
   },
diff --git a/locales/pt-BR/setting.json b/locales/pt-BR/setting.json
index b3d7cd8cd1..5a6c1f1832 100644
--- a/locales/pt-BR/setting.json
+++ b/locales/pt-BR/setting.json
@@ -259,9 +259,6 @@
     "enableMaxTokens": {
       "title": "Ativar limite de resposta única"
     },
-    "enableReasoningEffort": {
-      "title": "Ativar ajuste de intensidade de raciocínio"
-    },
     "frequencyPenalty": {
       "desc": "Quanto maior o valor, mais rica e variada será a escolha de palavras; quanto menor o valor, mais simples e direta será a escolha de palavras.",
       "title": "Riqueza do Vocabulário"
@@ -281,15 +278,6 @@
       "desc": "Quanto maior o valor, mais inclinado a diferentes formas de expressão, evitando repetições de conceitos; quanto menor o valor, mais inclinado a usar conceitos ou narrativas repetidas, resultando em uma expressão mais consistente.",
       "title": "Diversidade de Expressão"
     },
-    "reasoningEffort": {
-      "desc": "Quanto maior o valor, mais forte será a capacidade de raciocínio, mas isso pode aumentar o tempo de resposta e o consumo de tokens",
-      "options": {
-        "high": "Alto",
-        "low": "Baixo",
-        "medium": "Médio"
-      },
-      "title": "Intensidade de raciocínio"
-    },
     "submit": "Atualizar configurações do modelo",
     "temperature": {
       "desc": "Quanto maior o valor, mais criativas e imaginativas serão as respostas; quanto menor o valor, mais rigorosas serão as respostas",
diff --git a/locales/ru-RU/chat.json b/locales/ru-RU/chat.json
index b062618490..8c5d6896b8 100644
--- a/locales/ru-RU/chat.json
+++ b/locales/ru-RU/chat.json
@@ -43,6 +43,9 @@
     "reasoningBudgetToken": {
       "title": "Токены на размышления"
     },
+    "reasoningEffort": {
+      "title": "Интенсивность рассуждений"
+    },
     "title": "Расширенные функции модели"
   },
   "history": {
diff --git a/locales/ru-RU/models.json b/locales/ru-RU/models.json
index 35e7be8cc5..351d4158a3 100644
--- a/locales/ru-RU/models.json
+++ b/locales/ru-RU/models.json
@@ -341,9 +341,6 @@
   "Qwen2.5-Coder-32B-Instruct": {
     "description": "Qwen2.5-Coder-32B-Instruct — это крупная языковая модель, специально разработанная для генерации кода, понимания кода и эффективных сценариев разработки, с передовым масштабом параметров 32B, способная удовлетворить разнообразные потребности программирования."
   },
-  "SenseCat-5-1202": {
-    "description": "Это последняя версия на основе V5.5, которая значительно улучшила свои способности в нескольких аспектах по сравнению с предыдущей версией, включая базовые навыки на китайском и английском языках, общение, знания в области естественных наук, гуманитарных наук, написание, математическую логику и контроль количества слов."
-  },
   "SenseChat": {
     "description": "Базовая версия модели (V4), длина контекста 4K, обладает мощными универсальными возможностями."
   },
@@ -356,6 +353,9 @@
   "SenseChat-5": {
     "description": "Последняя версия модели (V5.5), длина контекста 128K, значительно улучшенные способности в математическом рассуждении, английских диалогах, следовании инструкциям и понимании длинных текстов, сопоставимые с GPT-4o."
   },
+  "SenseChat-5-1202": {
+    "description": "Основана на версии V5.5, с заметными улучшениями по нескольким направлениям: базовые навыки на китайском и английском, чат, знания в естественных и гуманитарных науках, письмо, математическая логика, контроль длины текста."
+  },
   "SenseChat-5-Cantonese": {
     "description": "Длина контекста 32K, превосходит GPT-4 в понимании диалогов на кантонском, сопоставим с GPT-4 Turbo в таких областях, как знания, рассуждение, математика и написание кода."
   },
@@ -515,6 +515,12 @@
   "ai21-jamba-1.5-mini": {
     "description": "Многоязычная модель с 52B параметрами (12B активных), предлагающая контекстное окно длиной 256K, вызовы функций, структурированный вывод и основанное на фактах генерирование."
   },
+  "ai21-labs/AI21-Jamba-1.5-Large": {
+    "description": "Многоязычная модель с 398 млрд параметров (94 млрд активных), предоставляющая окно контекста длиной 256K, вызовы функций, структурированный вывод и генерацию на основе фактов."
+  },
+  "ai21-labs/AI21-Jamba-1.5-Mini": {
+    "description": "Многоязычная модель с 52 млрд параметров (12 млрд активных), предоставляющая окно контекста длиной 256K, вызовы функций, структурированный вывод и генерацию на основе фактов."
+  },
   "anthropic.claude-3-5-sonnet-20240620-v1:0": {
     "description": "Claude 3.5 Sonnet устанавливает новые отраслевые стандарты, превосходя модели конкурентов и Claude 3 Opus, демонстрируя отличные результаты в широком спектре оценок, при этом обладая скоростью и стоимостью наших моделей среднего уровня."
   },
@@ -668,6 +674,12 @@
   "cohere-command-r-plus": {
     "description": "Command R+ — это модель, оптимизированная для RAG, предназначенная для решения задач корпоративного уровня."
   },
+  "cohere/Cohere-command-r": {
+    "description": "Command R — масштабируемая генеративная модель, разработанная для использования с RAG и инструментами, позволяющая компаниям внедрять AI промышленного уровня."
+  },
+  "cohere/Cohere-command-r-plus": {
+    "description": "Command R+ — передовая оптимизированная модель для RAG, предназначенная для корпоративных рабочих нагрузок."
+  },
   "command": {
     "description": "Диалоговая модель, следуя инструкциям, которая демонстрирует высокое качество и надежность в языковых задачах, а также имеет более длинную длину контекста по сравнению с нашей базовой генеративной моделью."
   },
@@ -1028,6 +1040,12 @@
   "gemini-2.5-flash-preview-04-17": {
     "description": "Gemini 2.5 Flash Preview — это наиболее выгодная модель от Google, предлагающая широкий спектр возможностей."
   },
+  "gemini-2.5-flash-preview-04-17-thinking": {
+    "description": "Gemini 2.5 Flash Preview — самая экономичная модель Google с полным набором функций."
+  },
+  "gemini-2.5-flash-preview-05-20": {
+    "description": "Gemini 2.5 Flash Preview — самая экономичная модель Google с полным набором функций."
+  },
   "gemini-2.5-pro-exp-03-25": {
     "description": "Gemini 2.5 Pro Experimental — это самая современная модель мышления от Google, способная рассуждать о сложных задачах в области кода, математики и STEM, а также анализировать большие наборы данных, кодовые базы и документы, используя длинный контекст."
   },
@@ -1262,23 +1280,17 @@
   "grok-2-vision-1212": {
     "description": "Модель улучшена в точности, соблюдении инструкций и многоязычных возможностях."
   },
-  "grok-3-beta": {
-    "description": "Флагманская модель, специализирующаяся на извлечении данных, программировании и резюмировании текста для корпоративных приложений, обладающая глубокими знаниями в таких областях, как финансы, медицина, право и наука."
+  "grok-3": {
+    "description": "Флагманская модель, специализирующаяся на извлечении данных, программировании и резюмировании текста для корпоративных приложений, обладающая глубокими знаниями в финансах, медицине, юриспруденции и науке."
   },
-  "grok-3-fast-beta": {
-    "description": "Флагманская модель, специализирующаяся на извлечении данных, программировании и резюмировании текста для корпоративных приложений, обладающая глубокими знаниями в таких областях, как финансы, медицина, право и наука."
+  "grok-3-fast": {
+    "description": "Флагманская модель, специализирующаяся на извлечении данных, программировании и резюмировании текста для корпоративных приложений, обладающая глубокими знаниями в финансах, медицине, юриспруденции и науке."
   },
-  "grok-3-mini-beta": {
-    "description": "Легковесная модель, которая сначала обдумывает перед разговором. Работает быстро и умно, подходит для логических задач, не требующих глубоких знаний в области, и может захватывать оригинальные мыслительные процессы."
+  "grok-3-mini": {
+    "description": "Легковесная модель, которая сначала обдумывает ответ перед разговором. Быстрая и умная, подходит для логических задач без глубоких отраслевых знаний и позволяет проследить исходные размышления."
   },
-  "grok-3-mini-fast-beta": {
-    "description": "Легковесная модель, которая сначала обдумывает перед разговором. Работает быстро и умно, подходит для логических задач, не требующих глубоких знаний в области, и может захватывать оригинальные мыслительные процессы."
-  },
-  "grok-beta": {
-    "description": "Обладает производительностью, сопоставимой с Grok 2, но с большей эффективностью, скоростью и функциональностью."
-  },
-  "grok-vision-beta": {
-    "description": "Новейшая модель понимания изображений, способная обрабатывать разнообразную визуальную информацию, включая документы, графики, скриншоты и фотографии."
+  "grok-3-mini-fast": {
+    "description": "Легковесная модель, которая сначала обдумывает ответ перед разговором. Быстрая и умная, подходит для логических задач без глубоких отраслевых знаний и позволяет проследить исходные размышления."
   },
   "gryphe/mythomax-l2-13b": {
     "description": "MythoMax l2 13B — это языковая модель, объединяющая креативность и интеллект, основанная на нескольких ведущих моделях."
@@ -1322,6 +1334,9 @@
   "hunyuan-t1-latest": {
     "description": "Первый в отрасли сверхмасштабный гибридный трансформер-Mamba для вывода, расширяющий возможности вывода, обладающий высокой скоростью декодирования и лучше соответствующий человеческим предпочтениям."
   },
+  "hunyuan-t1-vision": {
+    "description": "Глубокая мультимодальная модель понимания Hunyuan с нативной цепочкой размышлений для мультимодальных данных, отлично справляется с различными задачами рассуждения на изображениях, значительно превосходя модели быстрого мышления в решении научных задач."
+  },
   "hunyuan-translation": {
     "description": "Поддерживает взаимный перевод на 15 языков, включая китайский, английский, японский, французский, португальский, испанский, турецкий, русский, арабский, корейский, итальянский, немецкий, вьетнамский, малайский и индонезийский, с автоматической оценкой на основе набора тестов для многофункционального перевода COMET, в целом превосходя модели аналогичного масштаба на рынке по способности к взаимному переводу среди более чем десяти распространенных языков."
   },
@@ -1586,6 +1601,30 @@
   "meta.llama3-8b-instruct-v1:0": {
     "description": "Meta Llama 3 — это открытая большая языковая модель (LLM), ориентированная на разработчиков, исследователей и предприятия, предназначенная для помощи в создании, экспериментировании и ответственном масштабировании их идей по генеративному ИИ. В качестве части базовой системы для инноваций глобального сообщества она идеально подходит для устройств с ограниченными вычислительными мощностями и ресурсами, а также для более быстрого времени обучения."
   },
+  "meta/Llama-3.2-11B-Vision-Instruct": {
+    "description": "Отличные способности к рассуждению на основе изображений высокого разрешения, подходит для приложений визуального понимания."
+  },
+  "meta/Llama-3.2-90B-Vision-Instruct": {
+    "description": "Продвинутые возможности рассуждения на основе изображений для приложений визуального понимания и агентов."
+  },
+  "meta/Llama-3.3-70B-Instruct": {
+    "description": "Llama 3.3 — самая передовая многоязычная открытая крупная языковая модель серии Llama, обеспечивающая производительность, сопоставимую с моделью на 405 млрд параметров, при очень низких затратах. Основана на архитектуре Transformer и улучшена с помощью контролируемой донастройки (SFT) и обучения с подкреплением на основе человеческой обратной связи (RLHF) для повышения полезности и безопасности. Версия с инструкциями оптимизирована для многоязычного диалога и превосходит многие открытые и закрытые чат-модели по ряду отраслевых бенчмарков. Дата отсечения знаний — декабрь 2023 года."
+  },
+  "meta/Meta-Llama-3-70B-Instruct": {
+    "description": "Мощная модель с 70 млрд параметров, демонстрирующая выдающиеся способности в рассуждениях, кодировании и широком спектре языковых приложений."
+  },
+  "meta/Meta-Llama-3-8B-Instruct": {
+    "description": "Универсальная модель с 8 млрд параметров, оптимизированная для задач диалога и генерации текста."
+  },
+  "meta/Meta-Llama-3.1-405B-Instruct": {
+    "description": "Текстовая модель Llama 3.1 с донастройкой по инструкциям, оптимизированная для многоязычных диалогов, демонстрирующая высокие результаты на популярных отраслевых бенчмарках среди доступных открытых и закрытых чат-моделей."
+  },
+  "meta/Meta-Llama-3.1-70B-Instruct": {
+    "description": "Текстовая модель Llama 3.1 с донастройкой по инструкциям, оптимизированная для многоязычных диалогов, демонстрирующая высокие результаты на популярных отраслевых бенчмарках среди доступных открытых и закрытых чат-моделей."
+  },
+  "meta/Meta-Llama-3.1-8B-Instruct": {
+    "description": "Текстовая модель Llama 3.1 с донастройкой по инструкциям, оптимизированная для многоязычных диалогов, демонстрирующая высокие результаты на популярных отраслевых бенчмарках среди доступных открытых и закрытых чат-моделей."
+  },
   "meta/llama-3.1-405b-instruct": {
     "description": "Современная LLM, поддерживающая генерацию синтетических данных, дистилляцию знаний и рассуждения, подходит для чат-ботов, программирования и специализированных задач."
   },
@@ -1610,6 +1649,30 @@
   "meta/llama-3.3-70b-instruct": {
     "description": "Современная LLM, специализирующаяся на рассуждениях, математике, здравом смысле и вызовах функций."
   },
+  "microsoft/Phi-3-medium-128k-instruct": {
+    "description": "Та же модель Phi-3-medium, но с увеличенным размером контекста, подходящая для RAG или небольшого количества подсказок."
+  },
+  "microsoft/Phi-3-medium-4k-instruct": {
+    "description": "Модель с 14 млрд параметров, превосходящая Phi-3-mini по качеству, ориентированная на высококачественные, интенсивные по рассуждениям данные."
+  },
+  "microsoft/Phi-3-mini-128k-instruct": {
+    "description": "Та же модель Phi-3-mini, но с увеличенным размером контекста, подходящая для RAG или небольшого количества подсказок."
+  },
+  "microsoft/Phi-3-mini-4k-instruct": {
+    "description": "Самый маленький представитель семейства Phi-3, оптимизированный по качеству и низкой задержке."
+  },
+  "microsoft/Phi-3-small-128k-instruct": {
+    "description": "Та же модель Phi-3-small, но с увеличенным размером контекста, подходящая для RAG или небольшого количества подсказок."
+  },
+  "microsoft/Phi-3-small-8k-instruct": {
+    "description": "Модель с 7 млрд параметров, превосходящая Phi-3-mini по качеству, ориентированная на высококачественные, интенсивные по рассуждениям данные."
+  },
+  "microsoft/Phi-3.5-mini-instruct": {
+    "description": "Обновленная версия модели Phi-3-mini."
+  },
+  "microsoft/Phi-3.5-vision-instruct": {
+    "description": "Обновленная версия модели Phi-3-vision."
+  },
   "microsoft/WizardLM-2-8x22B": {
     "description": "WizardLM 2 — это языковая модель от Microsoft AI, которая особенно хорошо справляется с сложными диалогами, многоязычностью, выводами и интеллектуальными помощниками."
   },
@@ -1628,6 +1691,15 @@
   "mistral": {
     "description": "Mistral — это 7B модель, выпущенная Mistral AI, подходящая для разнообразных языковых задач."
   },
+  "mistral-ai/Mistral-Large-2411": {
+    "description": "Флагманская модель Mistral, предназначенная для задач, требующих масштабных возможностей рассуждения или высокой специализации (синтез текста, генерация кода, RAG или агенты)."
+  },
+  "mistral-ai/Mistral-Nemo": {
+    "description": "Mistral Nemo — передовая языковая модель (LLM), обладающая лучшими в своем классе способностями к рассуждению, мировым знаниям и кодированию."
+  },
+  "mistral-ai/mistral-small-2503": {
+    "description": "Mistral Small подходит для любых языковых задач, требующих высокой эффективности и низкой задержки."
+  },
   "mistral-large": {
     "description": "Mixtral Large — это флагманская модель от Mistral, объединяющая возможности генерации кода, математики и вывода, поддерживающая контекстное окно 128k."
   },
@@ -1769,6 +1841,9 @@
   "openai/gpt-4o-mini": {
     "description": "GPT-4o mini — это последняя модель от OpenAI, выпущенная после GPT-4 Omni, поддерживающая ввод изображений и текста с выводом текста. Как их самый продвинутый компактный модель, она значительно дешевле других недавних передовых моделей и более чем на 60% дешевле GPT-3.5 Turbo. Она сохраняет передовой уровень интеллекта при значительном соотношении цена-качество. GPT-4o mini набрала 82% в тесте MMLU и в настоящее время занимает более высокое место по предпочтениям в чате, чем GPT-4."
   },
+  "openai/o1": {
+    "description": "o1 — новая модель рассуждений от OpenAI, поддерживающая ввод изображений и текста с выводом текста, предназначенная для сложных задач, требующих широких универсальных знаний. Модель обладает контекстом в 200K и датой отсечения знаний — октябрь 2023 года."
+  },
   "openai/o1-mini": {
     "description": "o1-mini — это быстрое и экономичное модель вывода, разработанная для программирования, математики и научных приложений. Модель имеет контекст 128K и срок знания до октября 2023 года."
   },
diff --git a/locales/ru-RU/setting.json b/locales/ru-RU/setting.json
index d77fd06c94..1769602985 100644
--- a/locales/ru-RU/setting.json
+++ b/locales/ru-RU/setting.json
@@ -259,9 +259,6 @@
     "enableMaxTokens": {
       "title": "Включить ограничение максимального количества токенов"
     },
-    "enableReasoningEffort": {
-      "title": "Включить настройку интенсивности вывода"
-    },
     "frequencyPenalty": {
       "desc": "Чем больше значение, тем разнообразнее и богаче словарный запас; чем меньше значение, тем проще и понятнее слова",
       "title": "Разнообразие словарного запаса"
@@ -281,15 +278,6 @@
       "desc": "Чем больше значение, тем больше склонность к различным выражениям, избегая повторения концепций; чем меньше значение, тем больше склонность к использованию повторяющихся концепций или нарративов, выражение становится более последовательным",
       "title": "Разнообразие выражений"
     },
-    "reasoningEffort": {
-      "desc": "Чем больше значение, тем сильнее способность вывода, но это может увеличить время отклика и потребление токенов",
-      "options": {
-        "high": "Высокий",
-        "low": "Низкий",
-        "medium": "Средний"
-      },
-      "title": "Интенсивность вывода"
-    },
     "submit": "Обновить настройки модели",
     "temperature": {
       "desc": "Чем больше значение, тем более креативными и воображаемыми будут ответы; чем меньше значение, тем более строгими будут ответы",
diff --git a/locales/tr-TR/chat.json b/locales/tr-TR/chat.json
index 8af5e7c158..da1ece7658 100644
--- a/locales/tr-TR/chat.json
+++ b/locales/tr-TR/chat.json
@@ -43,6 +43,9 @@
     "reasoningBudgetToken": {
       "title": "Düşünme Tüketim Tokeni"
     },
+    "reasoningEffort": {
+      "title": "Akıl Yürütme Gücü"
+    },
     "title": "Model Genişletme Özellikleri"
   },
   "history": {
diff --git a/locales/tr-TR/models.json b/locales/tr-TR/models.json
index 81e6d19a9a..195230ed47 100644
--- a/locales/tr-TR/models.json
+++ b/locales/tr-TR/models.json
@@ -341,9 +341,6 @@
   "Qwen2.5-Coder-32B-Instruct": {
     "description": "Qwen2.5-Coder-32B-Instruct, kod üretimi, kod anlama ve verimli geliştirme senaryoları için tasarlanmış büyük bir dil modelidir. Sektördeki en ileri 32B parametre ölçeğini kullanarak çeşitli programlama ihtiyaçlarını karşılayabilir."
   },
-  "SenseCat-5-1202": {
-    "description": "V5.5 tabanlı en son sürüm olup, önceki sürüme göre Çince ve İngilizce temel yetenekler, sohbet, fen bilgisi, sosyal bilimler, yazma, matematiksel mantık, kelime sayısı kontrolü gibi birkaç boyutta önemli iyileştirmeler göstermektedir."
-  },
   "SenseChat": {
     "description": "Temel sürüm model (V4), 4K bağlam uzunluğu ile genel yetenekleri güçlüdür."
   },
@@ -356,6 +353,9 @@
   "SenseChat-5": {
     "description": "En son sürüm model (V5.5), 128K bağlam uzunluğu, matematiksel akıl yürütme, İngilizce diyalog, talimat takibi ve uzun metin anlama gibi alanlarda önemli gelişmeler göstermektedir ve GPT-4o ile karşılaştırılabilir."
   },
+  "SenseChat-5-1202": {
+    "description": "V5.5 tabanlı en son sürüm olup, önceki sürüme kıyasla Çince ve İngilizce temel yetenekler, sohbet, fen bilimleri bilgisi, sosyal bilimler bilgisi, yazım, matematiksel mantık ve kelime sayısı kontrolü gibi birçok alanda belirgin gelişmeler sunar."
+  },
   "SenseChat-5-Cantonese": {
     "description": "32K bağlam uzunluğu ile, Kantonca diyalog anlama konusunda GPT-4'ü aşmakta, bilgi, akıl yürütme, matematik ve kod yazma gibi birçok alanda GPT-4 Turbo ile rekabet edebilmektedir."
   },
@@ -515,6 +515,12 @@
   "ai21-jamba-1.5-mini": {
     "description": "52B parametreli (12B aktif) çok dilli bir model, 256K uzun bağlam penceresi, fonksiyon çağrısı, yapılandırılmış çıktı ve temellendirilmiş üretim sunar."
   },
+  "ai21-labs/AI21-Jamba-1.5-Large": {
+    "description": "398 milyar parametreli (94 milyar aktif) çok dilli model, 256K uzun bağlam penceresi, fonksiyon çağrısı, yapılandırılmış çıktı ve gerçeklere dayalı üretim sunar."
+  },
+  "ai21-labs/AI21-Jamba-1.5-Mini": {
+    "description": "52 milyar parametreli (12 milyar aktif) çok dilli model, 256K uzun bağlam penceresi, fonksiyon çağrısı, yapılandırılmış çıktı ve gerçeklere dayalı üretim sunar."
+  },
   "anthropic.claude-3-5-sonnet-20240620-v1:0": {
     "description": "Claude 3.5 Sonnet, endüstri standartlarını yükselterek, rakip modelleri ve Claude 3 Opus'u geride bırakarak geniş bir değerlendirmede mükemmel performans sergilerken, orta seviye modellerimizin hızı ve maliyeti ile birlikte gelir."
   },
@@ -668,6 +674,12 @@
   "cohere-command-r-plus": {
     "description": "Command R+, kurumsal düzeyde iş yüklerini ele almak için tasarlanmış en son RAG optimize edilmiş bir modeldir."
   },
+  "cohere/Cohere-command-r": {
+    "description": "Command R, RAG ve araç kullanımı için ölçeklenebilir bir üretim modeli olup, işletmelerin üretim seviyesinde yapay zeka uygulamalarını gerçekleştirmesine olanak tanır."
+  },
+  "cohere/Cohere-command-r-plus": {
+    "description": "Command R+, işletme düzeyindeki iş yükleri için tasarlanmış, en gelişmiş RAG optimize modelidir."
+  },
   "command": {
     "description": "Dil görevlerinde yüksek kalite ve güvenilirlik sunan, talimatları izleyen bir diyalog modelidir ve temel üretim modelimize göre daha uzun bir bağlam uzunluğuna sahiptir."
   },
@@ -1028,6 +1040,12 @@
   "gemini-2.5-flash-preview-04-17": {
     "description": "Gemini 2.5 Flash Önizleme, Google'ın en iyi fiyat-performans oranına sahip modelidir ve kapsamlı özellikler sunar."
   },
+  "gemini-2.5-flash-preview-04-17-thinking": {
+    "description": "Gemini 2.5 Flash Önizleme, Google'ın en yüksek maliyet-performans modelidir ve kapsamlı özellikler sunar."
+  },
+  "gemini-2.5-flash-preview-05-20": {
+    "description": "Gemini 2.5 Flash Önizleme, Google'ın en yüksek maliyet-performans modelidir ve kapsamlı özellikler sunar."
+  },
   "gemini-2.5-pro-exp-03-25": {
     "description": "Gemini 2.5 Pro Deneysel, Google'ın en gelişmiş düşünce modeli olup, kod, matematik ve STEM alanlarındaki karmaşık sorunları akıl yürütebilmektedir. Ayrıca, uzun bağlamları kullanarak büyük veri setlerini, kod havuzlarını ve belgeleri analiz edebilir."
   },
@@ -1262,23 +1280,17 @@
   "grok-2-vision-1212": {
     "description": "Bu model, doğruluk, talimat takibi ve çok dilli yetenekler açısından geliştirilmiştir."
   },
-  "grok-3-beta": {
-    "description": "Amiral gemisi model, veri çıkarımı, programlama ve metin özeti gibi kurumsal uygulamalarda uzmandır ve finans, sağlık, hukuk ve bilim gibi alanlarda derin bir bilgiye sahiptir."
+  "grok-3": {
+    "description": "Amiral gemisi model olup, veri çıkarımı, programlama ve metin özetleme gibi kurumsal uygulamalarda uzmandır; finans, sağlık, hukuk ve bilim alanlarında derin bilgiye sahiptir."
   },
-  "grok-3-fast-beta": {
-    "description": "Amiral gemisi model, veri çıkarımı, programlama ve metin özeti gibi kurumsal uygulamalarda uzmandır ve finans, sağlık, hukuk ve bilim gibi alanlarda derin bir bilgiye sahiptir."
+  "grok-3-fast": {
+    "description": "Amiral gemisi model olup, veri çıkarımı, programlama ve metin özetleme gibi kurumsal uygulamalarda uzmandır; finans, sağlık, hukuk ve bilim alanlarında derin bilgiye sahiptir."
   },
-  "grok-3-mini-beta": {
-    "description": "Hafif model, konuşmadan önce düşünür. Hızlı ve akıllı çalışır, derin alan bilgisi gerektirmeyen mantıksal görevler için uygundur ve ham düşünce izlerini elde edebilir."
+  "grok-3-mini": {
+    "description": "Hafif model olup, konuşma öncesi düşünür. Hızlı ve akıllı çalışır, derin alan bilgisi gerektirmeyen mantıksal görevler için uygundur ve orijinal düşünce izlerini elde edebilir."
   },
-  "grok-3-mini-fast-beta": {
-    "description": "Hafif model, konuşmadan önce düşünür. Hızlı ve akıllı çalışır, derin alan bilgisi gerektirmeyen mantıksal görevler için uygundur ve ham düşünce izlerini elde edebilir."
-  },
-  "grok-beta": {
-    "description": "Grok 2 ile karşılaştırılabilir performansa sahip, ancak daha yüksek verimlilik, hız ve işlevsellik sunar."
-  },
-  "grok-vision-beta": {
-    "description": "En son görüntü anlama modeli, belgeler, grafikler, ekran görüntüleri ve fotoğraflar gibi çeşitli görsel bilgileri işleyebilir."
+  "grok-3-mini-fast": {
+    "description": "Hafif model olup, konuşma öncesi düşünür. Hızlı ve akıllı çalışır, derin alan bilgisi gerektirmeyen mantıksal görevler için uygundur ve orijinal düşünce izlerini elde edebilir."
   },
   "gryphe/mythomax-l2-13b": {
     "description": "MythoMax l2 13B, birden fazla üst düzey modelin birleşimiyle yaratıcı ve zeka odaklı bir dil modelidir."
@@ -1322,6 +1334,9 @@
   "hunyuan-t1-latest": {
     "description": "Sektördeki ilk ultra büyük ölçekli Hybrid-Transformer-Mamba çıkarım modeli, çıkarım yeteneklerini genişletir, yüksek çözümleme hızı sunar ve insan tercihleri ile daha iyi hizalanır."
   },
+  "hunyuan-t1-vision": {
+    "description": "Hunyuan çok modlu anlayış derin düşünme modeli, çok modlu doğal uzun düşünce zincirini destekler, çeşitli görsel çıkarım senaryolarında uzmandır ve fen bilimleri problemlerinde hızlı düşünme modellerine kıyasla kapsamlı iyileşme sağlar."
+  },
   "hunyuan-translation": {
     "description": "Çince ve İngilizce, Japonca, Fransızca, Portekizce, İspanyolca, Türkçe, Rusça, Arapça, Korece, İtalyanca, Almanca, Vietnamca, Malayca, Endonezyaca dahil olmak üzere 15 dil arasında çeviri desteği sunar. Çoklu senaryo çeviri değerlendirme setine dayalı otomatik değerlendirme COMET puanı ile, ondan fazla yaygın dildeki çeviri yetenekleri, pazarın aynı ölçekli modellerine göre genel olarak daha üstündür."
   },
@@ -1586,6 +1601,30 @@
   "meta.llama3-8b-instruct-v1:0": {
     "description": "Meta Llama 3, geliştiriciler, araştırmacılar ve işletmeler için açık bir büyük dil modelidir (LLM) ve onların üretken AI fikirlerini inşa etmelerine, denemelerine ve sorumlu bir şekilde genişletmelerine yardımcı olmak için tasarlanmıştır. Küresel topluluk yeniliğinin temel sistemlerinden biri olarak, sınırlı hesaplama gücü ve kaynaklara sahip, kenar cihazları ve daha hızlı eğitim süreleri için son derece uygundur."
   },
+  "meta/Llama-3.2-11B-Vision-Instruct": {
+    "description": "Yüksek çözünürlüklü görüntülerde üstün görsel çıkarım yeteneği sunar, görsel anlama uygulamaları için idealdir."
+  },
+  "meta/Llama-3.2-90B-Vision-Instruct": {
+    "description": "Görsel anlama ajan uygulamaları için gelişmiş görüntü çıkarım yetenekleri sağlar."
+  },
+  "meta/Llama-3.3-70B-Instruct": {
+    "description": "Llama 3.3, Llama serisinin en gelişmiş çok dilli açık kaynak büyük dil modeli olup, 405 milyar parametreli modellere kıyasla çok düşük maliyetle yüksek performans sunar. Transformer mimarisi temel alınmış, denetimli ince ayar (SFT) ve insan geri bildirimi ile güçlendirilmiş pekiştirmeli öğrenme (RLHF) ile faydalılık ve güvenlik artırılmıştır. Çok dilli diyaloglar için optimize edilmiş talimat ayarlı versiyonu, birçok endüstri kıyaslamasında açık ve kapalı sohbet modellerinden üstün performans gösterir. Bilgi kesim tarihi 2023 Aralık'tır."
+  },
+  "meta/Meta-Llama-3-70B-Instruct": {
+    "description": "Çıkarım, kodlama ve geniş dil uygulamalarında üstün performans gösteren güçlü 70 milyar parametreli model."
+  },
+  "meta/Meta-Llama-3-8B-Instruct": {
+    "description": "Diyalog ve metin üretimi görevleri için optimize edilmiş çok yönlü 8 milyar parametreli model."
+  },
+  "meta/Meta-Llama-3.1-405B-Instruct": {
+    "description": "Llama 3.1 talimat ayarlı metin modeli, çok dilli diyalog senaryoları için optimize edilmiştir ve birçok açık ve kapalı sohbet modeli arasında yaygın endüstri kıyaslamalarında üstün performans sergiler."
+  },
+  "meta/Meta-Llama-3.1-70B-Instruct": {
+    "description": "Llama 3.1 talimat ayarlı metin modeli, çok dilli diyalog senaryoları için optimize edilmiştir ve birçok açık ve kapalı sohbet modeli arasında yaygın endüstri kıyaslamalarında üstün performans sergiler."
+  },
+  "meta/Meta-Llama-3.1-8B-Instruct": {
+    "description": "Llama 3.1 talimat ayarlı metin modeli, çok dilli diyalog senaryoları için optimize edilmiştir ve birçok açık ve kapalı sohbet modeli arasında yaygın endüstri kıyaslamalarında üstün performans sergiler."
+  },
   "meta/llama-3.1-405b-instruct": {
     "description": "Gelişmiş LLM, sentetik veri üretimi, bilgi damıtma ve akıl yürütmeyi destekler, sohbet botları, programlama ve belirli alan görevleri için uygundur."
   },
@@ -1610,6 +1649,30 @@
   "meta/llama-3.3-70b-instruct": {
     "description": "Akıllı LLM, akıl yürütme, matematik, genel bilgi ve fonksiyon çağrılarında uzmandır."
   },
+  "microsoft/Phi-3-medium-128k-instruct": {
+    "description": "Aynı Phi-3-medium modeli, ancak daha büyük bağlam boyutuna sahip olup RAG veya az sayıda istem için uygundur."
+  },
+  "microsoft/Phi-3-medium-4k-instruct": {
+    "description": "140 milyar parametreli model, Phi-3-mini'den daha yüksek kaliteye sahip olup, yüksek kaliteli ve çıkarım yoğun veriye odaklanır."
+  },
+  "microsoft/Phi-3-mini-128k-instruct": {
+    "description": "Aynı Phi-3-mini modeli, ancak daha büyük bağlam boyutuna sahip olup RAG veya az sayıda istem için uygundur."
+  },
+  "microsoft/Phi-3-mini-4k-instruct": {
+    "description": "Phi-3 ailesinin en küçük üyesi olup, kalite ve düşük gecikme için optimize edilmiştir."
+  },
+  "microsoft/Phi-3-small-128k-instruct": {
+    "description": "Aynı Phi-3-small modeli, ancak daha büyük bağlam boyutuna sahip olup RAG veya az sayıda istem için uygundur."
+  },
+  "microsoft/Phi-3-small-8k-instruct": {
+    "description": "70 milyar parametreli model, Phi-3-mini'den daha yüksek kaliteye sahip olup, yüksek kaliteli ve çıkarım yoğun veriye odaklanır."
+  },
+  "microsoft/Phi-3.5-mini-instruct": {
+    "description": "Phi-3-mini modelinin güncellenmiş versiyonu."
+  },
+  "microsoft/Phi-3.5-vision-instruct": {
+    "description": "Phi-3-vision modelinin güncellenmiş versiyonu."
+  },
   "microsoft/WizardLM-2-8x22B": {
     "description": "WizardLM 2, Microsoft AI tarafından sağlanan bir dil modelidir ve karmaşık diyaloglar, çok dilli destek, akıl yürütme ve akıllı asistan alanlarında özellikle başarılıdır."
   },
@@ -1628,6 +1691,15 @@
   "mistral": {
     "description": "Mistral, Mistral AI tarafından sunulan 7B modelidir, değişken dil işleme ihtiyaçları için uygundur."
   },
+  "mistral-ai/Mistral-Large-2411": {
+    "description": "Mistral'in amiral gemisi modeli olup, büyük ölçekli çıkarım yetenekleri veya yüksek derecede uzmanlaşmış karmaşık görevler (metin sentezi, kod üretimi, RAG veya ajanlar) için uygundur."
+  },
+  "mistral-ai/Mistral-Nemo": {
+    "description": "Mistral Nemo, boyut kategorisinde en gelişmiş çıkarım, dünya bilgisi ve kodlama yeteneklerine sahip ileri düzey bir dil modelidir (LLM)."
+  },
+  "mistral-ai/mistral-small-2503": {
+    "description": "Mistral Small, yüksek verimlilik ve düşük gecikme gerektiren dil tabanlı görevler için uygundur."
+  },
   "mistral-large": {
     "description": "Mixtral Large, Mistral'ın amiral gemisi modelidir, kod üretimi, matematik ve akıl yürütme yeteneklerini birleştirir, 128k bağlam penceresini destekler."
   },
@@ -1769,6 +1841,9 @@
   "openai/gpt-4o-mini": {
     "description": "GPT-4o mini, OpenAI'nin GPT-4 Omni'den sonra sunduğu en son modeldir; görsel ve metin girişi destekler ve metin çıktısı verir. En gelişmiş küçük model olarak, diğer son zamanlardaki öncü modellere göre çok daha ucuzdur ve GPT-3.5 Turbo'dan %60'tan fazla daha ucuzdur. En son teknolojiyi korurken, önemli bir maliyet etkinliği sunar. GPT-4o mini, MMLU testinde %82 puan almış olup, şu anda sohbet tercihleri açısından GPT-4'ün üzerinde bir sıralamaya sahiptir."
   },
+  "openai/o1": {
+    "description": "o1, OpenAI'nin yeni çıkarım modeli olup, metin ve görsel girişleri destekler ve metin çıktısı üretir; geniş kapsamlı genel bilgi gerektiren karmaşık görevler için uygundur. Model, 200K bağlam uzunluğuna ve 2023 Ekim bilgi kesim tarihine sahiptir."
+  },
   "openai/o1-mini": {
     "description": "o1-mini, programlama, matematik ve bilim uygulama senaryoları için tasarlanmış hızlı ve ekonomik bir akıl yürütme modelidir. Bu model, 128K bağlam ve Ekim 2023 bilgi kesim tarihi ile donatılmıştır."
   },
diff --git a/locales/tr-TR/setting.json b/locales/tr-TR/setting.json
index d2c97e1b8c..3b792ea1fc 100644
--- a/locales/tr-TR/setting.json
+++ b/locales/tr-TR/setting.json
@@ -259,9 +259,6 @@
     "enableMaxTokens": {
       "title": "Max Token Sınırlamasını Etkinleştir"
     },
-    "enableReasoningEffort": {
-      "title": "Akıl yürütme yoğunluğunu ayarla"
-    },
     "frequencyPenalty": {
       "desc": "Değer ne kadar büyükse, kelime dağarcığı o kadar zengin ve çeşitli olur; değer ne kadar düşükse, kelimeler o kadar sade ve basit olur.",
       "title": "Kelime Zenginliği"
@@ -281,15 +278,6 @@
       "desc": "Değer ne kadar büyükse, farklı ifade biçimlerine yönelme eğilimi artar, kavram tekrarından kaçınılır; değer ne kadar küçükse, tekrar eden kavramlar veya anlatımlar kullanma eğilimi artar, ifade daha tutarlı olur.",
       "title": "İfade Çeşitliliği"
     },
-    "reasoningEffort": {
-      "desc": "Değer ne kadar yüksekse, akıl yürütme yeteneği o kadar güçlüdür, ancak yanıt süresi ve Token tüketimini artırabilir",
-      "options": {
-        "high": "Yüksek",
-        "low": "Düşük",
-        "medium": "Orta"
-      },
-      "title": "Akıl yürütme yoğunluğu"
-    },
     "submit": "Model ayarlarını güncelle",
     "temperature": {
       "desc": "Değer ne kadar büyükse, cevap o kadar yaratıcı ve hayal gücü dolu olur; değer ne kadar küçükse, cevap o kadar titizdir.",
diff --git a/locales/vi-VN/chat.json b/locales/vi-VN/chat.json
index 5693b3f802..6f44b5b2c8 100644
--- a/locales/vi-VN/chat.json
+++ b/locales/vi-VN/chat.json
@@ -43,6 +43,9 @@
     "reasoningBudgetToken": {
       "title": "Token tiêu tốn cho tư duy"
     },
+    "reasoningEffort": {
+      "title": "Cường độ suy luận"
+    },
     "title": "Chức năng mở rộng mô hình"
   },
   "history": {
diff --git a/locales/vi-VN/models.json b/locales/vi-VN/models.json
index 12e578fad7..047810648d 100644
--- a/locales/vi-VN/models.json
+++ b/locales/vi-VN/models.json
@@ -341,9 +341,6 @@
   "Qwen2.5-Coder-32B-Instruct": {
     "description": "Qwen2.5-Coder-32B-Instruct là một mô hình ngôn ngữ lớn được thiết kế đặc biệt cho việc tạo mã, hiểu mã và các tình huống phát triển hiệu quả, với quy mô 32B tham số hàng đầu trong ngành, có thể đáp ứng nhu cầu lập trình đa dạng."
   },
-  "SenseCat-5-1202": {
-    "description": "Là phiên bản mới nhất dựa trên V5.5, có sự cải thiện đáng kể so với phiên bản trước về khả năng cơ bản tiếng Trung và tiếng Anh, trò chuyện, kiến thức khoa học tự nhiên, kiến thức nhân văn, viết lách, logic toán học, kiểm soát số từ, và nhiều khía cạnh khác."
-  },
   "SenseChat": {
     "description": "Mô hình phiên bản cơ bản (V4), độ dài ngữ cảnh 4K, khả năng tổng quát mạnh mẽ."
   },
@@ -356,6 +353,9 @@
   "SenseChat-5": {
     "description": "Phiên bản mô hình mới nhất (V5.5), độ dài ngữ cảnh 128K, khả năng cải thiện đáng kể trong suy luận toán học, đối thoại tiếng Anh, theo dõi chỉ dẫn và hiểu biết văn bản dài, ngang tầm với GPT-4o."
   },
+  "SenseChat-5-1202": {
+    "description": "Phiên bản mới nhất dựa trên V5.5, cải thiện đáng kể về năng lực cơ bản tiếng Trung và tiếng Anh, trò chuyện, kiến thức khoa học tự nhiên, khoa học xã hội, viết lách, logic toán học và kiểm soát số lượng từ so với phiên bản trước."
+  },
   "SenseChat-5-Cantonese": {
     "description": "Độ dài ngữ cảnh 32K, vượt qua GPT-4 trong hiểu biết đối thoại tiếng Quảng Đông, có thể so sánh với GPT-4 Turbo trong nhiều lĩnh vực như kiến thức, suy luận, toán học và lập trình mã."
   },
@@ -515,6 +515,12 @@
   "ai21-jamba-1.5-mini": {
     "description": "Mô hình đa ngôn ngữ với 52B tham số (12B hoạt động), cung cấp cửa sổ ngữ cảnh dài 256K, gọi hàm, đầu ra có cấu trúc và tạo ra nội dung có căn cứ."
   },
+  "ai21-labs/AI21-Jamba-1.5-Large": {
+    "description": "Một mô hình đa ngôn ngữ với 398 tỷ tham số (94 tỷ tham số hoạt động), cung cấp cửa sổ ngữ cảnh dài 256K, gọi hàm, đầu ra có cấu trúc và sinh dựa trên sự thật."
+  },
+  "ai21-labs/AI21-Jamba-1.5-Mini": {
+    "description": "Một mô hình đa ngôn ngữ với 52 tỷ tham số (12 tỷ tham số hoạt động), cung cấp cửa sổ ngữ cảnh dài 256K, gọi hàm, đầu ra có cấu trúc và sinh dựa trên sự thật."
+  },
   "anthropic.claude-3-5-sonnet-20240620-v1:0": {
     "description": "Claude 3.5 Sonnet nâng cao tiêu chuẩn ngành, hiệu suất vượt trội hơn các mô hình cạnh tranh và Claude 3 Opus, thể hiện xuất sắc trong nhiều đánh giá, đồng thời có tốc độ và chi phí của mô hình tầm trung của chúng tôi."
   },
@@ -668,6 +674,12 @@
   "cohere-command-r-plus": {
     "description": "Command R+ là mô hình tối ưu hóa RAG hiện đại, được thiết kế để xử lý khối lượng công việc cấp doanh nghiệp."
   },
+  "cohere/Cohere-command-r": {
+    "description": "Command R là một mô hình sinh có thể mở rộng, được thiết kế cho việc sử dụng RAG và công cụ, giúp doanh nghiệp triển khai AI cấp sản xuất."
+  },
+  "cohere/Cohere-command-r-plus": {
+    "description": "Command R+ là mô hình tối ưu RAG tiên tiến nhất, được thiết kế để xử lý khối lượng công việc cấp doanh nghiệp."
+  },
   "command": {
     "description": "Một mô hình đối thoại tuân theo chỉ dẫn, thể hiện chất lượng cao và đáng tin cậy trong các nhiệm vụ ngôn ngữ, đồng thời có độ dài ngữ cảnh dài hơn so với mô hình sinh cơ bản của chúng tôi."
   },
@@ -1028,6 +1040,12 @@
   "gemini-2.5-flash-preview-04-17": {
     "description": "Gemini 2.5 Flash Preview là mô hình có giá trị tốt nhất của Google, cung cấp đầy đủ các tính năng."
   },
+  "gemini-2.5-flash-preview-04-17-thinking": {
+    "description": "Gemini 2.5 Flash Preview là mô hình có hiệu suất chi phí tốt nhất của Google, cung cấp các tính năng toàn diện."
+  },
+  "gemini-2.5-flash-preview-05-20": {
+    "description": "Gemini 2.5 Flash Preview là mô hình có hiệu suất chi phí tốt nhất của Google, cung cấp các tính năng toàn diện."
+  },
   "gemini-2.5-pro-exp-03-25": {
     "description": "Gemini 2.5 Pro Experimental là mô hình tư duy tiên tiến nhất của Google, có khả năng suy luận về mã, toán học và các vấn đề phức tạp trong lĩnh vực STEM, đồng thời có thể phân tích các tập dữ liệu lớn, kho mã và tài liệu bằng cách sử dụng ngữ cảnh dài."
   },
@@ -1262,23 +1280,17 @@
   "grok-2-vision-1212": {
     "description": "Mô hình này đã được cải thiện về độ chính xác, khả năng tuân thủ hướng dẫn và khả năng đa ngôn ngữ."
   },
-  "grok-3-beta": {
-    "description": "Mô hình hàng đầu, chuyên về trích xuất dữ liệu, lập trình và tóm tắt văn bản cho các ứng dụng doanh nghiệp, có kiến thức sâu rộng trong các lĩnh vực tài chính, y tế, pháp lý và khoa học."
+  "grok-3": {
+    "description": "Mô hình chủ lực, xuất sắc trong trích xuất dữ liệu, lập trình và tóm tắt văn bản cho các ứng dụng doanh nghiệp, sở hữu kiến thức sâu rộng trong các lĩnh vực tài chính, y tế, pháp lý và khoa học."
   },
-  "grok-3-fast-beta": {
-    "description": "Mô hình hàng đầu, chuyên về trích xuất dữ liệu, lập trình và tóm tắt văn bản cho các ứng dụng doanh nghiệp, có kiến thức sâu rộng trong các lĩnh vực tài chính, y tế, pháp lý và khoa học."
+  "grok-3-fast": {
+    "description": "Mô hình chủ lực, xuất sắc trong trích xuất dữ liệu, lập trình và tóm tắt văn bản cho các ứng dụng doanh nghiệp, sở hữu kiến thức sâu rộng trong các lĩnh vực tài chính, y tế, pháp lý và khoa học."
   },
-  "grok-3-mini-beta": {
-    "description": "Mô hình nhẹ, sẽ suy nghĩ trước khi trò chuyện. Chạy nhanh, thông minh, phù hợp cho các nhiệm vụ logic không cần kiến thức chuyên sâu, và có thể thu thập được các dấu vết tư duy ban đầu."
+  "grok-3-mini": {
+    "description": "Mô hình nhẹ, suy nghĩ trước khi trả lời. Chạy nhanh, thông minh, phù hợp cho các nhiệm vụ logic không đòi hỏi kiến thức chuyên sâu và có thể truy xuất được chuỗi suy nghĩ gốc."
   },
-  "grok-3-mini-fast-beta": {
-    "description": "Mô hình nhẹ, sẽ suy nghĩ trước khi trò chuyện. Chạy nhanh, thông minh, phù hợp cho các nhiệm vụ logic không cần kiến thức chuyên sâu, và có thể thu thập được các dấu vết tư duy ban đầu."
-  },
-  "grok-beta": {
-    "description": "Có hiệu suất tương đương với Grok 2, nhưng hiệu quả, tốc độ và tính năng cao hơn."
-  },
-  "grok-vision-beta": {
-    "description": "Mô hình hiểu hình ảnh mới nhất, có khả năng xử lý nhiều loại thông tin hình ảnh khác nhau, bao gồm tài liệu, biểu đồ, ảnh chụp màn hình và ảnh."
+  "grok-3-mini-fast": {
+    "description": "Mô hình nhẹ, suy nghĩ trước khi trả lời. Chạy nhanh, thông minh, phù hợp cho các nhiệm vụ logic không đòi hỏi kiến thức chuyên sâu và có thể truy xuất được chuỗi suy nghĩ gốc."
   },
   "gryphe/mythomax-l2-13b": {
     "description": "MythoMax l2 13B là mô hình ngôn ngữ kết hợp giữa sáng tạo và trí thông minh, kết hợp nhiều mô hình hàng đầu."
@@ -1322,6 +1334,9 @@
   "hunyuan-t1-latest": {
     "description": "Mô hình suy luận Hybrid-Transformer-Mamba quy mô siêu lớn đầu tiên trong ngành, mở rộng khả năng suy luận, tốc độ giải mã cực nhanh, và tiếp tục điều chỉnh theo sở thích của con người."
   },
+  "hunyuan-t1-vision": {
+    "description": "Mô hình suy nghĩ sâu đa phương thức Hunyuan, hỗ trợ chuỗi suy nghĩ dài nguyên bản đa phương thức, xuất sắc trong các tình huống suy luận hình ảnh đa dạng, cải thiện toàn diện so với mô hình suy nghĩ nhanh trong các bài toán khoa học tự nhiên."
+  },
   "hunyuan-translation": {
     "description": "Hỗ trợ dịch giữa 15 ngôn ngữ bao gồm tiếng Trung, tiếng Anh, tiếng Nhật, tiếng Pháp, tiếng Bồ Đào Nha, tiếng Tây Ban Nha, tiếng Thổ Nhĩ Kỳ, tiếng Nga, tiếng Ả Rập, tiếng Hàn, tiếng Ý, tiếng Đức, tiếng Việt, tiếng Mã Lai và tiếng Indonesia, dựa trên bộ đánh giá dịch tự động hóa COMET, có khả năng dịch giữa các ngôn ngữ phổ biến tốt hơn so với các mô hình cùng quy mô trên thị trường."
   },
@@ -1586,6 +1601,30 @@
   "meta.llama3-8b-instruct-v1:0": {
     "description": "Meta Llama 3 là một mô hình ngôn ngữ lớn (LLM) mở dành cho các nhà phát triển, nhà nghiên cứu và doanh nghiệp, nhằm giúp họ xây dựng, thử nghiệm và mở rộng ý tưởng AI sinh một cách có trách nhiệm. Là một phần của hệ thống cơ sở hạ tầng đổi mới toàn cầu, nó rất phù hợp cho các thiết bị biên và thời gian huấn luyện nhanh hơn với khả năng tính toán và tài nguyên hạn chế."
   },
+  "meta/Llama-3.2-11B-Vision-Instruct": {
+    "description": "Khả năng suy luận hình ảnh xuất sắc trên hình ảnh độ phân giải cao, phù hợp cho các ứng dụng hiểu biết thị giác."
+  },
+  "meta/Llama-3.2-90B-Vision-Instruct": {
+    "description": "Khả năng suy luận hình ảnh nâng cao dành cho các ứng dụng đại lý hiểu biết thị giác."
+  },
+  "meta/Llama-3.3-70B-Instruct": {
+    "description": "Llama 3.3 là mô hình ngôn ngữ lớn đa ngôn ngữ mã nguồn mở tiên tiến nhất trong dòng Llama, mang lại hiệu suất tương đương mô hình 405 tỷ tham số với chi phí rất thấp. Dựa trên kiến trúc Transformer, được cải thiện qua huấn luyện giám sát (SFT) và học tăng cường từ phản hồi con người (RLHF) để nâng cao tính hữu ích và an toàn. Phiên bản tinh chỉnh chỉ dẫn được tối ưu cho đối thoại đa ngôn ngữ, vượt trội trên nhiều chuẩn mực ngành so với nhiều mô hình trò chuyện mã nguồn mở và đóng. Kiến thức cập nhật đến tháng 12 năm 2023."
+  },
+  "meta/Meta-Llama-3-70B-Instruct": {
+    "description": "Một mô hình mạnh mẽ với 70 tỷ tham số, thể hiện xuất sắc trong suy luận, mã hóa và các ứng dụng ngôn ngữ đa dạng."
+  },
+  "meta/Meta-Llama-3-8B-Instruct": {
+    "description": "Một mô hình đa năng với 8 tỷ tham số, được tối ưu cho các nhiệm vụ đối thoại và tạo văn bản."
+  },
+  "meta/Meta-Llama-3.1-405B-Instruct": {
+    "description": "Mô hình văn bản Llama 3.1 được tinh chỉnh chỉ dẫn, tối ưu cho các trường hợp sử dụng đối thoại đa ngôn ngữ, thể hiện xuất sắc trên nhiều chuẩn mực ngành so với nhiều mô hình trò chuyện mã nguồn mở và đóng hiện có."
+  },
+  "meta/Meta-Llama-3.1-70B-Instruct": {
+    "description": "Mô hình văn bản Llama 3.1 được tinh chỉnh chỉ dẫn, tối ưu cho các trường hợp sử dụng đối thoại đa ngôn ngữ, thể hiện xuất sắc trên nhiều chuẩn mực ngành so với nhiều mô hình trò chuyện mã nguồn mở và đóng hiện có."
+  },
+  "meta/Meta-Llama-3.1-8B-Instruct": {
+    "description": "Mô hình văn bản Llama 3.1 được tinh chỉnh chỉ dẫn, tối ưu cho các trường hợp sử dụng đối thoại đa ngôn ngữ, thể hiện xuất sắc trên nhiều chuẩn mực ngành so với nhiều mô hình trò chuyện mã nguồn mở và đóng hiện có."
+  },
   "meta/llama-3.1-405b-instruct": {
     "description": "LLM cao cấp, hỗ trợ tạo dữ liệu tổng hợp, chưng cất kiến thức và suy luận, phù hợp cho chatbot, lập trình và các nhiệm vụ chuyên biệt."
   },
@@ -1610,6 +1649,30 @@
   "meta/llama-3.3-70b-instruct": {
     "description": "Mô hình LLM tiên tiến, xuất sắc trong suy luận, toán học, kiến thức chung và gọi hàm."
   },
+  "microsoft/Phi-3-medium-128k-instruct": {
+    "description": "Cùng mô hình Phi-3-medium nhưng với kích thước ngữ cảnh lớn hơn, phù hợp cho RAG hoặc ít gợi ý."
+  },
+  "microsoft/Phi-3-medium-4k-instruct": {
+    "description": "Mô hình 14 tỷ tham số, chất lượng vượt trội so với Phi-3-mini, tập trung vào dữ liệu suy luận chất lượng cao."
+  },
+  "microsoft/Phi-3-mini-128k-instruct": {
+    "description": "Cùng mô hình Phi-3-mini nhưng với kích thước ngữ cảnh lớn hơn, phù hợp cho RAG hoặc ít gợi ý."
+  },
+  "microsoft/Phi-3-mini-4k-instruct": {
+    "description": "Thành viên nhỏ nhất trong gia đình Phi-3, được tối ưu cho chất lượng và độ trễ thấp."
+  },
+  "microsoft/Phi-3-small-128k-instruct": {
+    "description": "Cùng mô hình Phi-3-small nhưng với kích thước ngữ cảnh lớn hơn, phù hợp cho RAG hoặc ít gợi ý."
+  },
+  "microsoft/Phi-3-small-8k-instruct": {
+    "description": "Mô hình 7 tỷ tham số, chất lượng vượt trội so với Phi-3-mini, tập trung vào dữ liệu suy luận chất lượng cao."
+  },
+  "microsoft/Phi-3.5-mini-instruct": {
+    "description": "Phiên bản cập nhật của mô hình Phi-3-mini."
+  },
+  "microsoft/Phi-3.5-vision-instruct": {
+    "description": "Phiên bản cập nhật của mô hình Phi-3-vision."
+  },
   "microsoft/WizardLM-2-8x22B": {
     "description": "WizardLM 2 là mô hình ngôn ngữ do AI của Microsoft cung cấp, thể hiện xuất sắc trong các lĩnh vực đối thoại phức tạp, đa ngôn ngữ, suy luận và trợ lý thông minh."
   },
@@ -1628,6 +1691,15 @@
   "mistral": {
     "description": "Mistral là mô hình 7B do Mistral AI phát hành, phù hợp cho các nhu cầu xử lý ngôn ngữ đa dạng."
   },
+  "mistral-ai/Mistral-Large-2411": {
+    "description": "Mô hình chủ lực của Mistral, phù hợp cho các nhiệm vụ phức tạp cần khả năng suy luận quy mô lớn hoặc chuyên môn cao (tổng hợp văn bản, tạo mã, RAG hoặc đại lý)."
+  },
+  "mistral-ai/Mistral-Nemo": {
+    "description": "Mistral Nemo là một mô hình ngôn ngữ tiên tiến (LLM), sở hữu khả năng suy luận, kiến thức thế giới và mã hóa hàng đầu trong phân khúc kích thước của nó."
+  },
+  "mistral-ai/mistral-small-2503": {
+    "description": "Mistral Small phù hợp cho bất kỳ nhiệm vụ dựa trên ngôn ngữ nào cần hiệu quả cao và độ trễ thấp."
+  },
   "mistral-large": {
     "description": "Mixtral Large là mô hình hàng đầu của Mistral, kết hợp khả năng sinh mã, toán học và suy luận, hỗ trợ cửa sổ ngữ cảnh 128k."
   },
@@ -1769,6 +1841,9 @@
   "openai/gpt-4o-mini": {
     "description": "GPT-4o mini là mô hình mới nhất của OpenAI, được phát hành sau GPT-4 Omni, hỗ trợ đầu vào hình ảnh và văn bản, và đầu ra văn bản. Là mô hình nhỏ tiên tiến nhất của họ, nó rẻ hơn nhiều so với các mô hình tiên tiến gần đây khác và rẻ hơn hơn 60% so với GPT-3.5 Turbo. Nó giữ lại trí thông minh tiên tiến nhất trong khi có giá trị sử dụng đáng kể. GPT-4o mini đạt 82% điểm trong bài kiểm tra MMLU và hiện đứng đầu về sở thích trò chuyện so với GPT-4."
   },
+  "openai/o1": {
+    "description": "o1 là mô hình suy luận mới của OpenAI, hỗ trợ đầu vào hình ảnh và văn bản, đồng thời xuất ra văn bản, phù hợp cho các nhiệm vụ phức tạp đòi hỏi kiến thức phổ quát rộng rãi. Mô hình này có ngữ cảnh 200K và kiến thức cập nhật đến tháng 10 năm 2023."
+  },
   "openai/o1-mini": {
     "description": "o1-mini là một mô hình suy diễn nhanh chóng và tiết kiệm chi phí, được thiết kế cho các ứng dụng lập trình, toán học và khoa học. Mô hình này có ngữ cảnh 128K và thời điểm cắt kiến thức vào tháng 10 năm 2023."
   },
diff --git a/locales/vi-VN/setting.json b/locales/vi-VN/setting.json
index 29eb1b2ea6..c3b2a86b81 100644
--- a/locales/vi-VN/setting.json
+++ b/locales/vi-VN/setting.json
@@ -259,9 +259,6 @@
     "enableMaxTokens": {
       "title": "Bật giới hạn phản hồi một lần"
     },
-    "enableReasoningEffort": {
-      "title": "Bật điều chỉnh cường độ suy luận"
-    },
     "frequencyPenalty": {
       "desc": "Giá trị càng lớn, từ ngữ càng phong phú đa dạng; giá trị càng thấp, từ ngữ càng đơn giản mộc mạc",
       "title": "Độ phong phú từ vựng"
@@ -281,15 +278,6 @@
       "desc": "Giá trị càng lớn, càng có xu hướng sử dụng các cách diễn đạt khác nhau, tránh lặp lại khái niệm; giá trị càng nhỏ, càng có xu hướng sử dụng các khái niệm hoặc mô tả lặp lại, thể hiện tính nhất quán cao hơn",
       "title": "Độ phân tán trong diễn đạt"
     },
-    "reasoningEffort": {
-      "desc": "Giá trị càng lớn, khả năng suy luận càng mạnh, nhưng có thể làm tăng thời gian phản hồi và tiêu tốn Token",
-      "options": {
-        "high": "Cao",
-        "low": "Thấp",
-        "medium": "Trung bình"
-      },
-      "title": "Cường độ suy luận"
-    },
     "submit": "Cập nhật cài đặt mô hình",
     "temperature": {
       "desc": "Giá trị càng lớn, câu trả lời càng sáng tạo và giàu trí tưởng tượng; giá trị càng nhỏ, câu trả lời càng nghiêm ngặt",
diff --git a/locales/zh-CN/chat.json b/locales/zh-CN/chat.json
index cf1614f884..462162b9de 100644
--- a/locales/zh-CN/chat.json
+++ b/locales/zh-CN/chat.json
@@ -43,6 +43,9 @@
     "reasoningBudgetToken": {
       "title": "思考消耗 Token"
     },
+    "reasoningEffort": {
+      "title": "推理强度"
+    },
     "title": "模型扩展功能"
   },
   "history": {
diff --git a/locales/zh-CN/models.json b/locales/zh-CN/models.json
index 60de0702f8..24551f1199 100644
--- a/locales/zh-CN/models.json
+++ b/locales/zh-CN/models.json
@@ -341,9 +341,6 @@
   "Qwen2.5-Coder-32B-Instruct": {
     "description": "高级 LLM，支持代码生成、推理和修复，涵盖主流编程语言。"
   },
-  "SenseCat-5-1202": {
-    "description": "是基于V5.5的最新版本，较上版本在中英文基础能力，聊天，理科知识， 文科知识，写作，数理逻辑，字数控制 等几个维度的表现有显著提升。"
-  },
   "SenseChat": {
     "description": "基础版本模型 (V4)，4K上下文长度，通用能力强大"
   },
@@ -356,6 +353,9 @@
   "SenseChat-5": {
     "description": "最新版本模型 (V5.5)，128K上下文长度，在数学推理、英文对话、指令跟随以及长文本理解等领域能力显著提升，比肩GPT-4o。"
   },
+  "SenseChat-5-1202": {
+    "description": "是基于V5.5的最新版本，较上版本在中英文基础能力，聊天，理科知识， 文科知识，写作，数理逻辑，字数控制 等几个维度的表现有显著提升。"
+  },
   "SenseChat-5-Cantonese": {
     "description": "专门为适应香港地区的对话习惯、俚语及本地知识而设计，在粤语的对话理解上超越了GPT-4，在知识、推理、数学及代码编写等多个领域均能与GPT-4 Turbo相媲美。"
   },
@@ -515,6 +515,12 @@
   "ai21-jamba-1.5-mini": {
     "description": "一个52B参数（12B活跃）的多语言模型，提供256K长上下文窗口、函数调用、结构化输出和基于事实的生成。"
   },
+  "ai21-labs/AI21-Jamba-1.5-Large": {
+    "description": "一个398B参数（94B活跃）的多语言模型，提供256K长上下文窗口、函数调用、结构化输出和基于事实的生成。"
+  },
+  "ai21-labs/AI21-Jamba-1.5-Mini": {
+    "description": "一个52B参数（12B活跃）的多语言模型，提供256K长上下文窗口、函数调用、结构化输出和基于事实的生成。"
+  },
   "anthropic.claude-3-5-sonnet-20240620-v1:0": {
     "description": "Claude 3.5 Sonnet 提升了行业标准，性能超过竞争对手模型和 Claude 3 Opus，在广泛的评估中表现出色，同时具有我们中等层级模型的速度和成本。"
   },
@@ -621,7 +627,7 @@
     "description": "Claude Opus 4 是 Anthropic 用于处理高度复杂任务的最强大模型。它在性能、智能、流畅性和理解力方面表现卓越。"
   },
   "claude-sonnet-4-20250514": {
-    "description": "Claude 4 Sonnet 可以产生近乎即时的响应或延长的逐步思考，用户可以清晰地看到这些过程。API 用户还可以对模型思考的时间进行细致的控制"
+    "description": "Claude Sonnet 4 可以产生近乎即时的响应或延长的逐步思考，用户可以清晰地看到这些过程。API 用户还可以对模型思考的时间进行细致的控制"
   },
   "codegeex-4": {
     "description": "CodeGeeX-4 是强大的AI编程助手，支持多种编程语言的智能问答与代码补全，提升开发效率。"
@@ -668,6 +674,12 @@
   "cohere-command-r-plus": {
     "description": "Command R+是一个最先进的RAG优化模型，旨在应对企业级工作负载。"
   },
+  "cohere/Cohere-command-r": {
+    "description": "Command R是一个可扩展的生成模型，旨在针对RAG和工具使用，使企业能够实现生产级AI。"
+  },
+  "cohere/Cohere-command-r-plus": {
+    "description": "Command R+是一个最先进的RAG优化模型，旨在应对企业级工作负载。"
+  },
   "command": {
     "description": "一个遵循指令的对话模型，在语言任务中表现出高质量、更可靠，并且相比我们的基础生成模型具有更长的上下文长度。"
   },
@@ -1028,6 +1040,12 @@
   "gemini-2.5-flash-preview-04-17": {
     "description": "Gemini 2.5 Flash Preview 是 Google 性价比最高的模型，提供全面的功能。"
   },
+  "gemini-2.5-flash-preview-04-17-thinking": {
+    "description": "Gemini 2.5 Flash Preview 是 Google 性价比最高的模型，提供全面的功能。"
+  },
+  "gemini-2.5-flash-preview-05-20": {
+    "description": "Gemini 2.5 Flash Preview 是 Google 性价比最高的模型，提供全面的功能。"
+  },
   "gemini-2.5-pro-exp-03-25": {
     "description": "Gemini 2.5 Pro Experimental 是 Google 最先进的思维模型，能够对代码、数学和STEM领域的复杂问题进行推理，以及使用长上下文分析大型数据集、代码库和文档。"
   },
@@ -1262,24 +1280,18 @@
   "grok-2-vision-1212": {
     "description": "该模型在准确性、指令遵循和多语言能力方面有所改进。"
   },
-  "grok-3-beta": {
+  "grok-3": {
     "description": "旗舰级模型，擅长数据提取、编程和文本摘要等企业级应用，拥有金融、医疗、法律和科学等领域的深厚知识。"
   },
-  "grok-3-fast-beta": {
+  "grok-3-fast": {
     "description": "旗舰级模型，擅长数据提取、编程和文本摘要等企业级应用，拥有金融、医疗、法律和科学等领域的深厚知识。"
   },
-  "grok-3-mini-beta": {
+  "grok-3-mini": {
     "description": "轻量级模型，回话前会先思考。运行快速、智能，适用于不需要深层领域知识的逻辑任务，并能获取原始的思维轨迹。"
   },
-  "grok-3-mini-fast-beta": {
+  "grok-3-mini-fast": {
     "description": "轻量级模型，回话前会先思考。运行快速、智能，适用于不需要深层领域知识的逻辑任务，并能获取原始的思维轨迹。"
   },
-  "grok-beta": {
-    "description": "拥有与 Grok 2 相当的性能，但具有更高的效率、速度和功能。"
-  },
-  "grok-vision-beta": {
-    "description": "最新的图像理解模型，可以处理各种各样的视觉信息，包括文档、图表、截图和照片等。"
-  },
   "gryphe/mythomax-l2-13b": {
     "description": "MythoMax l2 13B 是一款合并了多个顶尖模型的创意与智能相结合的语言模型。"
   },
@@ -1322,6 +1334,9 @@
   "hunyuan-t1-latest": {
     "description": "业内首个超大规模 Hybrid-Transformer-Mamba 推理模型，扩展推理能力，超强解码速度，进一步对齐人类偏好。"
   },
+  "hunyuan-t1-vision": {
+    "description": "混元多模态理解深度思考模型，支持多模态原生长思维链，擅长处理各种图片推理场景，在理科难题上相比快思考模型全面提升。"
+  },
   "hunyuan-translation": {
     "description": "支持中文和英语、日语、法语、葡萄牙语、西班牙语、土耳其语、俄语、阿拉伯语、韩语、意大利语、德语、越南语、马来语、印尼语15种语言互译，基于多场景翻译评测集自动化评估COMET评分，在十余种常用语种中外互译能力上整体优于市场同规模模型。"
   },
@@ -1586,6 +1601,30 @@
   "meta.llama3-8b-instruct-v1:0": {
     "description": "Meta Llama 3 是一款面向开发者、研究人员和企业的开放大型语言模型 (LLM)，旨在帮助他们构建、实验并负责任地扩展他们的生成 AI 想法。作为全球社区创新的基础系统的一部分，它非常适合计算能力和资源有限、边缘设备和更快的训练时间。"
   },
+  "meta/Llama-3.2-11B-Vision-Instruct": {
+    "description": "在高分辨率图像上表现出色的图像推理能力，适用于视觉理解应用。"
+  },
+  "meta/Llama-3.2-90B-Vision-Instruct": {
+    "description": "适用于视觉理解代理应用的高级图像推理能力。"
+  },
+  "meta/Llama-3.3-70B-Instruct": {
+    "description": "Llama 3.3 是 Llama 系列最先进的多语言开源大型语言模型，以极低成本体验媲美 405B 模型的性能。基于 Transformer 结构，并通过监督微调（SFT）和人类反馈强化学习（RLHF）提升有用性和安全性。其指令调优版本专为多语言对话优化，在多项行业基准上表现优于众多开源和封闭聊天模型。知识截止日期为 2023 年 12 月"
+  },
+  "meta/Meta-Llama-3-70B-Instruct": {
+    "description": "一个强大的700亿参数模型，在推理、编码和广泛的语言应用方面表现出色。"
+  },
+  "meta/Meta-Llama-3-8B-Instruct": {
+    "description": "一个多功能的80亿参数模型，针对对话和文本生成任务进行了优化。"
+  },
+  "meta/Meta-Llama-3.1-405B-Instruct": {
+    "description": "Llama 3.1指令调优的文本模型，针对多语言对话用例进行了优化，在许多可用的开源和封闭聊天模型中，在常见行业基准上表现优异。"
+  },
+  "meta/Meta-Llama-3.1-70B-Instruct": {
+    "description": "Llama 3.1指令调优的文本模型，针对多语言对话用例进行了优化，在许多可用的开源和封闭聊天模型中，在常见行业基准上表现优异。"
+  },
+  "meta/Meta-Llama-3.1-8B-Instruct": {
+    "description": "Llama 3.1指令调优的文本模型，针对多语言对话用例进行了优化，在许多可用的开源和封闭聊天模型中，在常见行业基准上表现优异。"
+  },
   "meta/llama-3.1-405b-instruct": {
     "description": "高级 LLM，支持合成数据生成、知识蒸馏和推理，适用于聊天机器人、编程和特定领域任务。"
   },
@@ -1610,6 +1649,30 @@
   "meta/llama-3.3-70b-instruct": {
     "description": "先进的 LLM，擅长推理、数学、常识和函数调用。"
   },
+  "microsoft/Phi-3-medium-128k-instruct": {
+    "description": "相同的Phi-3-medium模型，但具有更大的上下文大小，适用于RAG或少量提示。"
+  },
+  "microsoft/Phi-3-medium-4k-instruct": {
+    "description": "一个140亿参数模型，质量优于Phi-3-mini，重点关注高质量、推理密集型数据。"
+  },
+  "microsoft/Phi-3-mini-128k-instruct": {
+    "description": "相同的Phi-3-mini模型，但具有更大的上下文大小，适用于RAG或少量提示。"
+  },
+  "microsoft/Phi-3-mini-4k-instruct": {
+    "description": "Phi-3家族中最小的成员，针对质量和低延迟进行了优化。"
+  },
+  "microsoft/Phi-3-small-128k-instruct": {
+    "description": "相同的Phi-3-small模型，但具有更大的上下文大小，适用于RAG或少量提示。"
+  },
+  "microsoft/Phi-3-small-8k-instruct": {
+    "description": "一个70亿参数模型，质量优于Phi-3-mini，重点关注高质量、推理密集型数据。"
+  },
+  "microsoft/Phi-3.5-mini-instruct": {
+    "description": "Phi-3-mini模型的更新版。"
+  },
+  "microsoft/Phi-3.5-vision-instruct": {
+    "description": "Phi-3-vision模型的更新版。"
+  },
   "microsoft/WizardLM-2-8x22B": {
     "description": "WizardLM 2 是微软AI提供的语言模型，在复杂对话、多语言、推理和智能助手领域表现尤为出色。"
   },
@@ -1628,6 +1691,15 @@
   "mistral": {
     "description": "Mistral 是 Mistral AI 发布的 7B 模型，适合多变的语言处理需求。"
   },
+  "mistral-ai/Mistral-Large-2411": {
+    "description": "Mistral的旗舰模型，适合需要大规模推理能力或高度专业化的复杂任务（合成文本生成、代码生成、RAG或代理）。"
+  },
+  "mistral-ai/Mistral-Nemo": {
+    "description": "Mistral Nemo是一种尖端的语言模型（LLM），在其尺寸类别中拥有最先进的推理、世界知识和编码能力。"
+  },
+  "mistral-ai/mistral-small-2503": {
+    "description": "Mistral Small可用于任何需要高效率和低延迟的基于语言的任务。"
+  },
   "mistral-large": {
     "description": "Mixtral Large 是 Mistral 的旗舰模型，结合代码生成、数学和推理的能力，支持 128k 上下文窗口。"
   },
@@ -1769,6 +1841,9 @@
   "openai/gpt-4o-mini": {
     "description": "GPT-4o mini是OpenAI在GPT-4 Omni之后推出的最新模型，支持图文输入并输出文本。作为他们最先进的小型模型，它比其他近期的前沿模型便宜很多，并且比GPT-3.5 Turbo便宜超过60%。它保持了最先进的智能，同时具有显著的性价比。GPT-4o mini在MMLU测试中获得了 82% 的得分，目前在聊天偏好上排名高于 GPT-4。"
   },
+  "openai/o1": {
+    "description": "o1是OpenAI新的推理模型，支持图文输入并输出文本，适用于需要广泛通用知识的复杂任务。该模型具有200K上下文和2023年10月的知识截止日期。"
+  },
   "openai/o1-mini": {
     "description": "o1-mini是一款针对编程、数学和科学应用场景而设计的快速、经济高效的推理模型。该模型具有128K上下文和2023年10月的知识截止日期。"
   },
diff --git a/locales/zh-CN/setting.json b/locales/zh-CN/setting.json
index 629c28da41..052e95f61c 100644
--- a/locales/zh-CN/setting.json
+++ b/locales/zh-CN/setting.json
@@ -259,9 +259,6 @@
     "enableMaxTokens": {
       "title": "开启单次回复限制"
     },
-    "enableReasoningEffort": {
-      "title": "开启推理强度调整"
-    },
     "frequencyPenalty": {
       "desc": "值越大，用词越丰富多样；值越低，用词更朴实简单",
       "title": "词汇丰富度"
@@ -281,15 +278,6 @@
       "desc": "值越大，越倾向不同的表达方式，避免概念重复；值越小，越倾向使用重复的概念或叙述，表达更具一致性",
       "title": "表述发散度"
     },
-    "reasoningEffort": {
-      "desc": "值越大，推理能力越强，但可能会增加响应时间和 Token 消耗",
-      "options": {
-        "high": "高",
-        "low": "低",
-        "medium": "中"
-      },
-      "title": "推理强度"
-    },
     "submit": "更新模型设置",
     "temperature": {
       "desc": "数值越大，回答越有创意和想象力；数值越小，回答越严谨",
diff --git a/locales/zh-TW/chat.json b/locales/zh-TW/chat.json
index f6a13ff4de..399f2628ff 100644
--- a/locales/zh-TW/chat.json
+++ b/locales/zh-TW/chat.json
@@ -43,6 +43,9 @@
     "reasoningBudgetToken": {
       "title": "思考消耗 Token"
     },
+    "reasoningEffort": {
+      "title": "推理強度"
+    },
     "title": "模型擴展功能"
   },
   "history": {
diff --git a/locales/zh-TW/models.json b/locales/zh-TW/models.json
index 7197cf8bea..e4bebd0b6c 100644
--- a/locales/zh-TW/models.json
+++ b/locales/zh-TW/models.json
@@ -341,9 +341,6 @@
   "Qwen2.5-Coder-32B-Instruct": {
     "description": "Qwen2.5-Coder-32B-Instruct 是一款專為代碼生成、代碼理解和高效開發場景設計的大型語言模型，採用了業界領先的32B參數規模，能夠滿足多樣化的程式需求。"
   },
-  "SenseCat-5-1202": {
-    "description": "是基於V5.5的最新版本，較上版本在中英文基礎能力、聊天、理科知識、文科知識、寫作、數理邏輯、字數控制等幾個維度的表現有顯著提升。"
-  },
   "SenseChat": {
     "description": "基礎版本模型 (V4)，4K上下文長度，通用能力強大"
   },
@@ -356,6 +353,9 @@
   "SenseChat-5": {
     "description": "最新版本模型 (V5.5)，128K上下文長度，在數學推理、英文對話、指令跟隨以及長文本理解等領域能力顯著提升，比肩GPT-4o"
   },
+  "SenseChat-5-1202": {
+    "description": "是基於 V5.5 的最新版本，較上版本在中英文基礎能力、聊天、理科知識、文科知識、寫作、數理邏輯、字數控制等幾個維度的表現有顯著提升。"
+  },
   "SenseChat-5-Cantonese": {
     "description": "32K上下文長度，在粵語的對話理解上超越了GPT-4，在知識、推理、數學及程式編寫等多個領域均能與GPT-4 Turbo相媲美"
   },
@@ -515,6 +515,12 @@
   "ai21-jamba-1.5-mini": {
     "description": "一個52B參數（12B活躍）多語言模型，提供256K長上下文窗口、函數調用、結構化輸出和基於實體的生成。"
   },
+  "ai21-labs/AI21-Jamba-1.5-Large": {
+    "description": "一個 398B 參數（94B 活躍）的多語言模型，提供 256K 長上下文視窗、函數呼叫、結構化輸出和基於事實的生成。"
+  },
+  "ai21-labs/AI21-Jamba-1.5-Mini": {
+    "description": "一個 52B 參數（12B 活躍）的多語言模型，提供 256K 長上下文視窗、函數呼叫、結構化輸出和基於事實的生成。"
+  },
   "anthropic.claude-3-5-sonnet-20240620-v1:0": {
     "description": "Claude 3.5 Sonnet提升了行業標準，性能超過競爭對手模型和Claude 3 Opus，在廣泛的評估中表現出色，同時具有我們中等層級模型的速度和成本。"
   },
@@ -668,6 +674,12 @@
   "cohere-command-r-plus": {
     "description": "Command R+是一個最先進的RAG優化模型，旨在應對企業級工作負載。"
   },
+  "cohere/Cohere-command-r": {
+    "description": "Command R 是一個可擴展的生成模型，旨在針對 RAG 和工具使用，使企業能夠實現生產級 AI。"
+  },
+  "cohere/Cohere-command-r-plus": {
+    "description": "Command R+ 是一個最先進的 RAG 優化模型，旨在應對企業級工作負載。"
+  },
   "command": {
     "description": "一個遵循指令的對話模型，在語言任務中表現出高質量、更可靠，並且相比我們的基礎生成模型具有更長的上下文長度。"
   },
@@ -1028,6 +1040,12 @@
   "gemini-2.5-flash-preview-04-17": {
     "description": "Gemini 2.5 Flash Preview 是 Google 性價比最高的模型，提供全面的功能。"
   },
+  "gemini-2.5-flash-preview-04-17-thinking": {
+    "description": "Gemini 2.5 Flash Preview 是 Google 性價比最高的模型，提供全面的功能。"
+  },
+  "gemini-2.5-flash-preview-05-20": {
+    "description": "Gemini 2.5 Flash Preview 是 Google 性價比最高的模型，提供全面的功能。"
+  },
   "gemini-2.5-pro-exp-03-25": {
     "description": "Gemini 2.5 Pro 實驗版是 Google 最先進的思維模型，能夠對代碼、數學和 STEM 領域的複雜問題進行推理，還能利用長上下文來分析大型數據集、代碼庫和文檔。"
   },
@@ -1262,23 +1280,17 @@
   "grok-2-vision-1212": {
     "description": "該模型在準確性、指令遵循和多語言能力方面有所改進。"
   },
-  "grok-3-beta": {
-    "description": "旗艦級模型，擅長數據提取、程式設計和文本摘要等企業級應用，擁有金融、醫療、法律和科學等領域的深厚知識。"
+  "grok-3": {
+    "description": "旗艦級模型，擅長資料擷取、程式設計和文本摘要等企業級應用，擁有金融、醫療、法律和科學等領域的深厚知識。"
   },
-  "grok-3-fast-beta": {
-    "description": "旗艦級模型，擅長數據提取、程式設計和文本摘要等企業級應用，擁有金融、醫療、法律和科學等領域的深厚知識。"
+  "grok-3-fast": {
+    "description": "旗艦級模型，擅長資料擷取、程式設計和文本摘要等企業級應用，擁有金融、醫療、法律和科學等領域的深厚知識。"
   },
-  "grok-3-mini-beta": {
-    "description": "輕量級模型，會在對話前先思考。運行快速、智能，適用於不需要深層領域知識的邏輯任務，並能獲取原始的思維軌跡。"
+  "grok-3-mini": {
+    "description": "輕量級模型，對話前會先思考。運行快速、智能，適用於不需要深層領域知識的邏輯任務，並能獲取原始的思維軌跡。"
   },
-  "grok-3-mini-fast-beta": {
-    "description": "輕量級模型，會在對話前先思考。運行快速、智能，適用於不需要深層領域知識的邏輯任務，並能獲取原始的思維軌跡。"
-  },
-  "grok-beta": {
-    "description": "擁有與 Grok 2 相當的性能，但具備更高的效率、速度和功能。"
-  },
-  "grok-vision-beta": {
-    "description": "最新的圖像理解模型，可以處理各種各樣的視覺信息，包括文檔、圖表、截圖和照片等。"
+  "grok-3-mini-fast": {
+    "description": "輕量級模型，對話前會先思考。運行快速、智能，適用於不需要深層領域知識的邏輯任務，並能獲取原始的思維軌跡。"
   },
   "gryphe/mythomax-l2-13b": {
     "description": "MythoMax l2 13B 是一款合併了多個頂尖模型的創意與智能相結合的語言模型。"
@@ -1322,6 +1334,9 @@
   "hunyuan-t1-latest": {
     "description": "業界首個超大規模 Hybrid-Transformer-Mamba 推理模型，擴展推理能力，超強解碼速度，進一步對齊人類偏好。"
   },
+  "hunyuan-t1-vision": {
+    "description": "混元多模態理解深度思考模型，支援多模態原生長思維鏈，擅長處理各種圖片推理場景，在理科難題上相比快思考模型全面提升。"
+  },
   "hunyuan-translation": {
     "description": "支持中文和英語、日語、法語、葡萄牙語、西班牙語、土耳其語、俄語、阿拉伯語、韓語、義大利語、德語、越南語、馬來語、印尼語15種語言互譯，基於多場景翻譯評測集自動化評估COMET評分，在十餘種常用語種中外互譯能力上整體優於市場同規模模型。"
   },
@@ -1586,6 +1601,30 @@
   "meta.llama3-8b-instruct-v1:0": {
     "description": "Meta Llama 3 是一款面向開發者、研究人員和企業的開放大型語言模型 (LLM)，旨在幫助他們構建、實驗並負責任地擴展他們的生成 AI 想法。作為全球社區創新的基礎系統的一部分，它非常適合計算能力和資源有限、邊緣設備和更快的訓練時間。"
   },
+  "meta/Llama-3.2-11B-Vision-Instruct": {
+    "description": "在高解析度影像上表現出色的影像推理能力，適用於視覺理解應用。"
+  },
+  "meta/Llama-3.2-90B-Vision-Instruct": {
+    "description": "適用於視覺理解代理應用的高階影像推理能力。"
+  },
+  "meta/Llama-3.3-70B-Instruct": {
+    "description": "Llama 3.3 是 Llama 系列最先進的多語言開源大型語言模型，以極低成本體驗媲美 405B 模型的效能。基於 Transformer 結構，並透過監督微調（SFT）和人類回饋強化學習（RLHF）提升實用性和安全性。其指令調校版本專為多語言對話優化，在多項產業基準上表現優於眾多開源和封閉聊天模型。知識截止日期為 2023 年 12 月。"
+  },
+  "meta/Meta-Llama-3-70B-Instruct": {
+    "description": "一個強大的 700 億參數模型，在推理、編碼和廣泛的語言應用方面表現出色。"
+  },
+  "meta/Meta-Llama-3-8B-Instruct": {
+    "description": "一個多功能的 80 億參數模型，針對對話和文本生成任務進行優化。"
+  },
+  "meta/Meta-Llama-3.1-405B-Instruct": {
+    "description": "Llama 3.1 指令調校的文本模型，針對多語言對話用例進行優化，在許多可用的開源和封閉聊天模型中，在常見產業基準上表現優異。"
+  },
+  "meta/Meta-Llama-3.1-70B-Instruct": {
+    "description": "Llama 3.1 指令調校的文本模型，針對多語言對話用例進行優化，在許多可用的開源和封閉聊天模型中，在常見產業基準上表現優異。"
+  },
+  "meta/Meta-Llama-3.1-8B-Instruct": {
+    "description": "Llama 3.1 指令調校的文本模型，針對多語言對話用例進行優化，在許多可用的開源和封閉聊天模型中，在常見產業基準上表現優異。"
+  },
   "meta/llama-3.1-405b-instruct": {
     "description": "高級 LLM，支持合成數據生成、知識蒸餾和推理，適用於聊天機器人、編程和特定領域任務。"
   },
@@ -1610,6 +1649,30 @@
   "meta/llama-3.3-70b-instruct": {
     "description": "先進的 LLM，擅長推理、數學、常識和函數調用。"
   },
+  "microsoft/Phi-3-medium-128k-instruct": {
+    "description": "相同的 Phi-3-medium 模型，但具有更大的上下文大小，適用於 RAG 或少量提示。"
+  },
+  "microsoft/Phi-3-medium-4k-instruct": {
+    "description": "一個 140 億參數模型，品質優於 Phi-3-mini，重點關注高品質、推理密集型資料。"
+  },
+  "microsoft/Phi-3-mini-128k-instruct": {
+    "description": "相同的 Phi-3-mini 模型，但具有更大的上下文大小，適用於 RAG 或少量提示。"
+  },
+  "microsoft/Phi-3-mini-4k-instruct": {
+    "description": "Phi-3 家族中最小的成員，針對品質和低延遲進行優化。"
+  },
+  "microsoft/Phi-3-small-128k-instruct": {
+    "description": "相同的 Phi-3-small 模型，但具有更大的上下文大小，適用於 RAG 或少量提示。"
+  },
+  "microsoft/Phi-3-small-8k-instruct": {
+    "description": "一個 70 億參數模型，品質優於 Phi-3-mini，重點關注高品質、推理密集型資料。"
+  },
+  "microsoft/Phi-3.5-mini-instruct": {
+    "description": "Phi-3-mini 模型的更新版。"
+  },
+  "microsoft/Phi-3.5-vision-instruct": {
+    "description": "Phi-3-vision 模型的更新版。"
+  },
   "microsoft/WizardLM-2-8x22B": {
     "description": "WizardLM 2 是微軟AI提供的語言模型，在複雜對話、多語言、推理和智能助手領域表現尤為出色。"
   },
@@ -1628,6 +1691,15 @@
   "mistral": {
     "description": "Mistral 是 Mistral AI 發布的 7B 模型，適合多變的語言處理需求。"
   },
+  "mistral-ai/Mistral-Large-2411": {
+    "description": "Mistral 的旗艦模型，適合需要大規模推理能力或高度專業化的複雜任務（合成文本生成、程式碼生成、RAG 或代理）。"
+  },
+  "mistral-ai/Mistral-Nemo": {
+    "description": "Mistral Nemo 是一種尖端的語言模型（LLM），在其尺寸類別中擁有最先進的推理、世界知識和編碼能力。"
+  },
+  "mistral-ai/mistral-small-2503": {
+    "description": "Mistral Small 可用於任何需要高效率和低延遲的基於語言的任務。"
+  },
   "mistral-large": {
     "description": "Mixtral Large 是 Mistral 的旗艦模型，結合代碼生成、數學和推理的能力，支持 128k 上下文窗口。"
   },
@@ -1769,6 +1841,9 @@
   "openai/gpt-4o-mini": {
     "description": "GPT-4o mini是OpenAI在GPT-4 Omni之後推出的最新模型，支持圖文輸入並輸出文本。作為他們最先進的小型模型，它比其他近期的前沿模型便宜很多，並且比GPT-3.5 Turbo便宜超過60%。它保持了最先進的智能，同時具有顯著的性價比。GPT-4o mini在MMLU測試中獲得了82%的得分，目前在聊天偏好上排名高於GPT-4。"
   },
+  "openai/o1": {
+    "description": "o1 是 OpenAI 新的推理模型，支援圖文輸入並輸出文本，適用於需要廣泛通用知識的複雜任務。該模型具有 200K 上下文和 2023 年 10 月的知識截止日期。"
+  },
   "openai/o1-mini": {
     "description": "o1-mini是一款針對程式設計、數學和科學應用場景而設計的快速、經濟高效的推理模型。該模型具有128K上下文和2023年10月的知識截止日期。"
   },
diff --git a/locales/zh-TW/setting.json b/locales/zh-TW/setting.json
index 7eff1f8412..ca994812f8 100644
--- a/locales/zh-TW/setting.json
+++ b/locales/zh-TW/setting.json
@@ -259,9 +259,6 @@
     "enableMaxTokens": {
       "title": "啟用單次回覆限制"
     },
-    "enableReasoningEffort": {
-      "title": "開啟推理強度調整"
-    },
     "frequencyPenalty": {
       "desc": "值越大，用詞越豐富多樣；值越低，用詞更樸實簡單",
       "title": "詞彙豐富度"
@@ -281,15 +278,6 @@
       "desc": "值越大，越傾向不同的表達方式，避免概念重複；值越小，越傾向使用重複的概念或敘述，表達更具一致性",
       "title": "表述發散度"
     },
-    "reasoningEffort": {
-      "desc": "值越大，推理能力越強，但可能會增加回應時間和 Token 消耗",
-      "options": {
-        "high": "高",
-        "low": "低",
-        "medium": "中"
-      },
-      "title": "推理強度"
-    },
     "submit": "更新模型設定",
     "temperature": {
       "desc": "數值越大，回答越有創意和想像力；數值越小，回答越嚴謹",
diff --git a/src/config/aiModels/openai.ts b/src/config/aiModels/openai.ts
index 452fcb84dd..bfe87ae8fe 100644
--- a/src/config/aiModels/openai.ts
+++ b/src/config/aiModels/openai.ts
@@ -27,6 +27,9 @@ export const openaiChatModels: AIChatModelCard[] = [
       output: 40,
     },
     releasedAt: '2025-04-17',
+    settings: {
+      extendParams: ['reasoningEffort'],
+    },
     type: 'chat',
   },
   {
@@ -48,6 +51,9 @@ export const openaiChatModels: AIChatModelCard[] = [
       output: 4.4,
     },
     releasedAt: '2025-04-17',
+    settings: {
+      extendParams: ['reasoningEffort'],
+    },
     type: 'chat',
   },
   {
@@ -124,6 +130,9 @@ export const openaiChatModels: AIChatModelCard[] = [
       output: 4.4,
     },
     releasedAt: '2025-01-31',
+    settings: {
+      extendParams: ['reasoningEffort'],
+    },
     type: 'chat',
   },
   {
@@ -142,6 +151,9 @@ export const openaiChatModels: AIChatModelCard[] = [
       output: 4.4,
     },
     releasedAt: '2024-09-12',
+    settings: {
+      extendParams: ['reasoningEffort'],
+    },
     type: 'chat',
   },
   {
@@ -161,6 +173,9 @@ export const openaiChatModels: AIChatModelCard[] = [
       output: 60,
     },
     releasedAt: '2024-12-17',
+    settings: {
+      extendParams: ['reasoningEffort'],
+    },
     type: 'chat',
   },
   {
@@ -178,6 +193,9 @@ export const openaiChatModels: AIChatModelCard[] = [
       output: 60,
     },
     releasedAt: '2024-09-12',
+    settings: {
+      extendParams: ['reasoningEffort'],
+    },
     type: 'chat',
   },
   {
@@ -478,8 +496,7 @@ export const openaiChatModels: AIChatModelCard[] = [
   },
   {
     contextWindowTokens: 4096,
-    description:
-      'GPT 3.5 Turbo，适用于各种文本生成和理解任务，对指令遵循的优化',
+    description: 'GPT 3.5 Turbo，适用于各种文本生成和理解任务，对指令遵循的优化',
     displayName: 'GPT-3.5 Turbo Instruct',
     id: 'gpt-3.5-turbo-instruct',
     pricing: {
diff --git a/src/config/aiModels/xai.ts b/src/config/aiModels/xai.ts
index 3f72493fa3..4b4f8da68e 100644
--- a/src/config/aiModels/xai.ts
+++ b/src/config/aiModels/xai.ts
@@ -61,6 +61,7 @@ const xaiChatModels: AIChatModelCard[] = [
     },
     releasedAt: '2025-04-03',
     settings: {
+      extendParams: ['reasoningEffort'],
       searchImpl: 'params',
     },
     type: 'chat',
@@ -82,6 +83,7 @@ const xaiChatModels: AIChatModelCard[] = [
     },
     releasedAt: '2025-04-03',
     settings: {
+      extendParams: ['reasoningEffort'],
       searchImpl: 'params',
     },
     type: 'chat',
diff --git a/src/features/AgentSetting/AgentModal/index.tsx b/src/features/AgentSetting/AgentModal/index.tsx
index 8588910e3c..acbf1beaa3 100644
--- a/src/features/AgentSetting/AgentModal/index.tsx
+++ b/src/features/AgentSetting/AgentModal/index.tsx
@@ -1,6 +1,6 @@
 'use client';
 
-import { Form, type FormGroupItemType, Select, SliderWithInput } from '@lobehub/ui';
+import { Form, type FormGroupItemType, SliderWithInput } from '@lobehub/ui';
 import { Switch } from 'antd';
 import isEqual from 'fast-deep-equal';
 import { memo } from 'react';
@@ -74,31 +74,6 @@ const AgentModal = memo(() => {
         name: ['params', 'max_tokens'],
         tag: 'max_tokens',
       },
-      {
-        children: <Switch />,
-        label: t('settingModel.enableReasoningEffort.title'),
-        layout: 'horizontal',
-        minWidth: undefined,
-        name: ['chatConfig', 'enableReasoningEffort'],
-        valuePropName: 'checked',
-      },
-      {
-        children: (
-          <Select
-            defaultValue="medium"
-            options={[
-              { label: t('settingModel.reasoningEffort.options.low'), value: 'low' },
-              { label: t('settingModel.reasoningEffort.options.medium'), value: 'medium' },
-              { label: t('settingModel.reasoningEffort.options.high'), value: 'high' },
-            ]}
-          />
-        ),
-        desc: t('settingModel.reasoningEffort.desc'),
-        hidden: !config.chatConfig.enableReasoningEffort,
-        label: t('settingModel.reasoningEffort.title'),
-        name: ['params', 'reasoning_effort'],
-        tag: 'reasoning_effort',
-      },
     ],
     title: t('settingModel.title'),
   };
diff --git a/src/features/ChatInput/ActionBar/Model/ControlsForm.tsx b/src/features/ChatInput/ActionBar/Model/ControlsForm.tsx
index 55950688a6..3a0104ffc6 100644
--- a/src/features/ChatInput/ActionBar/Model/ControlsForm.tsx
+++ b/src/features/ChatInput/ActionBar/Model/ControlsForm.tsx
@@ -11,6 +11,7 @@ import { agentChatConfigSelectors, agentSelectors } from '@/store/agent/selector
 import { aiModelSelectors, useAiInfraStore } from '@/store/aiInfra';
 
 import ContextCachingSwitch from './ContextCachingSwitch';
+import ReasoningEffortSlider from './ReasoningEffortSlider';
 import ReasoningTokenSlider from './ReasoningTokenSlider';
 
 interface ControlsProps {
@@ -86,6 +87,17 @@ const ControlsForm = memo<ControlsProps>(({ setUpdating }) => {
         paddingBottom: 0,
       },
     },
+    {
+      children: <ReasoningEffortSlider />,
+      desc: 'reasoning_effort',
+      label: t('extendParams.reasoningEffort.title'),
+      layout: 'horizontal',
+      minWidth: undefined,
+      name: 'reasoningEffort',
+      style: {
+        paddingBottom: 0,
+      },
+    },
   ].filter(Boolean) as FormItemProps[];
 
   return (
diff --git a/src/features/ChatInput/ActionBar/Model/ReasoningEffortSlider.tsx b/src/features/ChatInput/ActionBar/Model/ReasoningEffortSlider.tsx
new file mode 100644
index 0000000000..de494fab0b
--- /dev/null
+++ b/src/features/ChatInput/ActionBar/Model/ReasoningEffortSlider.tsx
@@ -0,0 +1,57 @@
+import { Slider } from 'antd';
+import { memo, useCallback } from 'react';
+import { Flexbox } from 'react-layout-kit';
+
+import { useAgentStore } from '@/store/agent';
+import { agentChatConfigSelectors } from '@/store/agent/selectors';
+
+const ReasoningEffortSlider = memo(() => {
+  const [config, updateAgentChatConfig] = useAgentStore((s) => [
+    agentChatConfigSelectors.currentChatConfig(s),
+    s.updateAgentChatConfig,
+  ]);
+
+  const reasoningEffort = config.reasoningEffort || 'medium'; // Default to 'medium' if not set
+
+  const marks = {
+    0: 'low',
+    1: 'medium',
+    2: 'high',
+  };
+
+  const effortValues = ['low', 'medium', 'high'];
+  const indexValue = effortValues.indexOf(reasoningEffort);
+  const currentValue = indexValue === -1 ? 1 : indexValue;
+
+  const updateReasoningEffort = useCallback(
+    (value: number) => {
+      const effort = effortValues[value] as 'low' | 'medium' | 'high';
+      updateAgentChatConfig({ reasoningEffort: effort });
+    },
+    [updateAgentChatConfig],
+  );
+
+  return (
+    <Flexbox
+      align={'center'}
+      gap={12}
+      horizontal
+      paddingInline={'0 20px'}
+      style={{ minWidth: 200, width: '100%' }}
+    >
+      <Flexbox flex={1}>
+        <Slider
+          marks={marks}
+          max={2}
+          min={0}
+          onChange={updateReasoningEffort}
+          step={1}
+          tooltip={{ open: false }}
+          value={currentValue}
+        />
+      </Flexbox>
+    </Flexbox>
+  );
+});
+
+export default ReasoningEffortSlider;
diff --git a/src/locales/default/chat.ts b/src/locales/default/chat.ts
index 1cf47912e2..8f071c02f1 100644
--- a/src/locales/default/chat.ts
+++ b/src/locales/default/chat.ts
@@ -44,6 +44,9 @@ export default {
     reasoningBudgetToken: {
       title: '思考消耗 Token',
     },
+    reasoningEffort: {
+      title: '推理强度',
+    },
     title: '模型扩展功能',
   },
   history: {
diff --git a/src/locales/default/setting.ts b/src/locales/default/setting.ts
index 4f47217671..9b2e7fdc3a 100644
--- a/src/locales/default/setting.ts
+++ b/src/locales/default/setting.ts
@@ -263,9 +263,6 @@ export default {
     enableMaxTokens: {
       title: '开启单次回复限制',
     },
-    enableReasoningEffort: {
-      title: '开启推理强度调整',
-    },
     frequencyPenalty: {
       desc: '值越大，用词越丰富多样；值越低，用词更朴实简单',
       title: '词汇丰富度',
@@ -285,15 +282,6 @@ export default {
       desc: '值越大，越倾向不同的表达方式，避免概念重复；值越小，越倾向使用重复的概念或叙述，表达更具一致性',
       title: '表述发散度',
     },
-    reasoningEffort: {
-      desc: '值越大，推理能力越强，但可能会增加响应时间和 Token 消耗',
-      options: {
-        high: '高',
-        low: '低',
-        medium: '中',
-      },
-      title: '推理强度',
-    },
     submit: '更新模型设置',
     temperature: {
       desc: '数值越大，回答越有创意和想象力；数值越小，回答越严谨',
diff --git a/src/services/chat.ts b/src/services/chat.ts
index a09d6ea04f..452129e06e 100644
--- a/src/services/chat.ts
+++ b/src/services/chat.ts
@@ -238,13 +238,17 @@ class ChatService {
           };
         }
       }
-      
+
       if (
         modelExtendParams!.includes('disableContextCaching') &&
         chatConfig.disableContextCaching
       ) {
         extendParams.enabledContextCaching = false;
       }
+
+      if (modelExtendParams!.includes('reasoningEffort') && chatConfig.reasoningEffort) {
+        extendParams.reasoning_effort = chatConfig.reasoningEffort;
+      }
     }
 
     return this.getChatCompletion(
diff --git a/src/store/chat/slices/aiChat/actions/generateAIChat.ts b/src/store/chat/slices/aiChat/actions/generateAIChat.ts
index 6de0d63fa1..09dabd2239 100644
--- a/src/store/chat/slices/aiChat/actions/generateAIChat.ts
+++ b/src/store/chat/slices/aiChat/actions/generateAIChat.ts
@@ -538,11 +538,6 @@ export const generateAIChat: StateCreator<
       ? agentConfig.params.max_tokens
       : undefined;
 
-    // 5. handle reasoning_effort
-    agentConfig.params.reasoning_effort = chatConfig.enableReasoningEffort
-      ? agentConfig.params.reasoning_effort
-      : undefined;
-
     let isFunctionCall = false;
     let msgTraceId: string | undefined;
     let output = '';
diff --git a/src/types/agent/chatConfig.ts b/src/types/agent/chatConfig.ts
index c5761ed6ab..66fabf283b 100644
--- a/src/types/agent/chatConfig.ts
+++ b/src/types/agent/chatConfig.ts
@@ -25,6 +25,7 @@ export interface LobeAgentChatConfig {
    */
   enableReasoningEffort?: boolean;
   reasoningBudgetToken?: number;
+  reasoningEffort?: 'low' | 'medium' | 'high';
 
   /**
    * 禁用上下文缓存
diff --git a/src/types/aiModel.ts b/src/types/aiModel.ts
index 8a21ae3e29..67890c91ff 100644
--- a/src/types/aiModel.ts
+++ b/src/types/aiModel.ts
@@ -143,7 +143,11 @@ export interface AiModelConfig {
 
 export type ModelSearchImplementType = 'tool' | 'params' | 'internal';
 
-export type ExtendParamsType = 'reasoningBudgetToken' | 'enableReasoning' | 'disableContextCaching';
+export type ExtendParamsType =
+  | 'reasoningBudgetToken'
+  | 'enableReasoning'
+  | 'disableContextCaching'
+  | 'reasoningEffort';
 
 export interface AiModelSettings {
   extendParams?: ExtendParamsType[];