Files
lobe-chat/locales/fa-IR/models.json
T
2025-12-05 01:35:20 +08:00

3633 lines
462 KiB
JSON
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
{
"01-ai/yi-1.5-34b-chat": {
"description": "Zero One Everything، جدیدترین مدل متن باز تنظیم شده با 34 میلیارد پارامتر، که تنظیمات آن از چندین سناریوی گفتگویی پشتیبانی می‌کند و داده‌های آموزشی با کیفیت بالا را برای هم‌راستایی با ترجیحات انسانی فراهم می‌کند."
},
"01-ai/yi-1.5-9b-chat": {
"description": "Zero One Everything، جدیدترین مدل متن باز تنظیم شده با 9 میلیارد پارامتر، که تنظیمات آن از چندین سناریوی گفتگویی پشتیبانی می‌کند و داده‌های آموزشی با کیفیت بالا را برای هم‌راستایی با ترجیحات انسانی فراهم می‌کند."
},
"360/deepseek-r1": {
"description": "مدل DeepSeek-R1 نسخه 360، که در مرحله پس از آموزش به‌طور گسترده‌ای از تکنیک‌های یادگیری تقویتی استفاده کرده و توانایی استدلال مدل را به‌طور قابل توجهی افزایش داده است. در وظایف ریاضی، کدنویسی و استدلال زبان طبیعی، عملکردی مشابه نسخه رسمی OpenAI o1 دارد."
},
"360gpt-pro": {
"description": "360GPT Pro به عنوان یکی از اعضای مهم سری مدل‌های 360 AI، با توانایی پردازش متون به‌صورت کارآمد، نیازهای متنوع در زمینه‌های مختلف کاربردهای زبان طبیعی را برآورده می‌کند و از قابلیت‌هایی مانند درک متون طولانی و مکالمات چندمرحله‌ای پشتیبانی می‌کند."
},
"360gpt-pro-trans": {
"description": "مدل مخصوص ترجمه، به‌طور عمیق بهینه‌سازی شده و دارای عملکرد پیشرفته در ترجمه است."
},
"360gpt-turbo": {
"description": "360GPT Turbo توانایی‌های محاسباتی و مکالمه‌ای قدرتمندی ارائه می‌دهد و دارای کارایی بالایی در درک و تولید معنا است. این یک راه‌حل ایده‌آل برای دستیار هوشمند برای شرکت‌ها و توسعه‌دهندگان است."
},
"360gpt-turbo-responsibility-8k": {
"description": "360GPT Turbo Responsibility 8K بر امنیت معنایی و مسئولیت‌پذیری تأکید دارد و به‌طور ویژه برای سناریوهایی طراحی شده است که نیاز بالایی به امنیت محتوا دارند، تا دقت و پایداری تجربه کاربری را تضمین کند."
},
"360gpt2-o1": {
"description": "360gpt2-o1 از جستجوی درخت برای ساخت زنجیره‌های تفکر استفاده می‌کند و مکانیزم بازتاب را معرفی کرده است و با استفاده از یادگیری تقویتی آموزش دیده است، این مدل توانایی خودبازتابی و اصلاح خطا را دارد."
},
"360gpt2-pro": {
"description": "360GPT2 Pro مدل پیشرفته پردازش زبان طبیعی است که توسط شرکت 360 ارائه شده است. این مدل دارای توانایی‌های برجسته‌ای در تولید و درک متن است و به ویژه در زمینه تولید و خلاقیت عملکرد فوق‌العاده‌ای دارد. همچنین قادر به انجام وظایف پیچیده تبدیل زبان و ایفای نقش می‌باشد."
},
"360zhinao2-o1": {
"description": "مدل 360zhinao2-o1 با استفاده از جستجوی درختی زنجیره تفکر را ایجاد کرده و مکانیزم بازتاب را معرفی کرده است و با استفاده از یادگیری تقویتی آموزش دیده است، این مدل توانایی خودبازتابی و اصلاح خطا را دارد."
},
"4.0Ultra": {
"description": "Spark Ultra قدرتمندترین نسخه از سری مدل‌های بزرگ Spark است که با ارتقاء مسیر جستجوی متصل به شبکه، توانایی درک و خلاصه‌سازی محتوای متنی را بهبود می‌بخشد. این یک راه‌حل جامع برای افزایش بهره‌وری در محیط کار و پاسخگویی دقیق به نیازها است و به عنوان یک محصول هوشمند پیشرو در صنعت شناخته می‌شود."
},
"AnimeSharp": {
"description": "AnimeSharp (که با نام \"4xAnimeSharp\" نیز شناخته می‌شود) یک مدل ابررزولوشن متن‌باز است که توسط Kim2091 بر اساس معماری ESRGAN توسعه یافته است و بر بزرگ‌نمایی و تیزکردن تصاویر با سبک انیمه تمرکز دارد. این مدل در فوریه ۲۰۲۲ از \"4x-TextSharpV1\" تغییر نام داد و در ابتدا برای تصاویر متنی نیز کاربرد داشت اما عملکرد آن به طور قابل توجهی برای محتوای انیمه بهینه شده است."
},
"Baichuan2-Turbo": {
"description": "با استفاده از فناوری تقویت جستجو، مدل بزرگ را به دانش حوزه‌ای و دانش کل وب متصل می‌کند. از آپلود انواع اسناد مانند PDF، Word و همچنین وارد کردن آدرس‌های وب پشتیبانی می‌کند. اطلاعات به‌موقع و جامع دریافت می‌شود و نتایج خروجی دقیق و حرفه‌ای هستند."
},
"Baichuan3-Turbo": {
"description": "بهینه‌سازی شده برای سناریوهای پرتکرار سازمانی، با بهبود قابل توجه و نسبت عملکرد به هزینه بالا. در مقایسه با مدل Baichuan2، تولید محتوا ۲۰٪ بهبود یافته، پاسخ به سوالات ۱۷٪ بهتر شده و توانایی نقش‌آفرینی ۴۰٪ افزایش یافته است. عملکرد کلی بهتر از GPT3.5 است."
},
"Baichuan3-Turbo-128k": {
"description": "دارای پنجره متنی فوق‌العاده طولانی ۱۲۸K، بهینه‌سازی شده برای سناریوهای پرتکرار سازمانی، با بهبود قابل توجه در عملکرد و مقرون به صرفه بودن. در مقایسه با مدل Baichuan2، ۲۰٪ بهبود در تولید محتوا، ۱۷٪ بهبود در پرسش و پاسخ دانش، و ۴۰٪ بهبود در توانایی نقش‌آفرینی. عملکرد کلی بهتر از GPT3.5 است."
},
"Baichuan4": {
"description": "این مدل از نظر توانایی در داخل کشور رتبه اول را دارد و در وظایف چینی مانند دانشنامه، متون طولانی و تولید محتوا از مدل‌های اصلی خارجی پیشی می‌گیرد. همچنین دارای توانایی چندوجهی پیشرو در صنعت است و در چندین معیار ارزیابی معتبر عملکرد برجسته‌ای دارد."
},
"Baichuan4-Air": {
"description": "توانایی مدل در کشور اول است و در وظایف چینی مانند دانشنامه، متن‌های طولانی و تولید خلاقانه از مدل‌های اصلی خارجی پیشی می‌گیرد. همچنین دارای قابلیت‌های چندرسانه‌ای پیشرفته در صنعت است و در چندین معیار ارزیابی معتبر عملکرد عالی دارد."
},
"Baichuan4-Turbo": {
"description": "توانایی مدل در کشور اول است و در وظایف چینی مانند دانشنامه، متن‌های طولانی و تولید خلاقانه از مدل‌های اصلی خارجی پیشی می‌گیرد. همچنین دارای قابلیت‌های چندرسانه‌ای پیشرفته در صنعت است و در چندین معیار ارزیابی معتبر عملکرد عالی دارد."
},
"ByteDance-Seed/Seed-OSS-36B-Instruct": {
"description": "Seed-OSS مجموعه‌ای از مدل‌های زبان بزرگ متن‌باز است که توسط تیم Seed شرکت بایت‌دنس توسعه یافته‌اند و به‌طور خاص برای پردازش متن‌های طولانی، استدلال، عامل‌ها (agent) و قابلیت‌های عمومی طراحی شده‌اند. مدل Seed-OSS-36B-Instruct در این مجموعه، یک مدل تنظیم‌شده با ۳۶ میلیارد پارامتر است که به‌طور بومی از طول متن بسیار طولانی پشتیبانی می‌کند و قادر است حجم عظیمی از اسناد یا کدهای پیچیده را به‌صورت یکجا پردازش کند. این مدل به‌طور ویژه برای استدلال، تولید کد و وظایف عامل (مانند استفاده از ابزارها) بهینه شده و در عین حال تعادل و توانایی عمومی برجسته‌ای را حفظ می‌کند. یکی از ویژگی‌های برجسته این مدل، قابلیت «بودجه تفکر» است که به کاربران اجازه می‌دهد طول استدلال را به‌صورت انعطاف‌پذیر تنظیم کنند و بدین ترتیب کارایی استدلال در کاربردهای عملی به‌طور مؤثری افزایش یابد."
},
"DeepSeek-R1": {
"description": "مدل LLM پیشرفته و کارآمد که در استدلال، ریاضیات و برنامه‌نویسی تخصص دارد."
},
"DeepSeek-R1-Distill-Llama-70B": {
"description": "DeepSeek R1 - مدل بزرگتر و هوشمندتر در مجموعه DeepSeek - به ساختار لاما 70B تقطیر شده است. بر اساس آزمون‌های معیار و ارزیابی‌های انسانی، این مدل نسبت به لاما 70B اصلی هوشمندتر است و به ویژه در وظایفی که نیاز به دقت ریاضی و واقعیات دارند، عملکرد عالی دارد."
},
"DeepSeek-R1-Distill-Qwen-1.5B": {
"description": "مدل تقطیر DeepSeek-R1 مبتنی بر Qwen2.5-Math-1.5B است که با استفاده از یادگیری تقویتی و داده‌های شروع سرد عملکرد استدلال را بهینه‌سازی کرده و مدل‌های متن‌باز را به روز کرده است."
},
"DeepSeek-R1-Distill-Qwen-14B": {
"description": "مدل تقطیر DeepSeek-R1 مبتنی بر Qwen2.5-14B است که با استفاده از یادگیری تقویتی و داده‌های شروع سرد عملکرد استدلال را بهینه‌سازی کرده و مدل‌های متن‌باز را به روز کرده است."
},
"DeepSeek-R1-Distill-Qwen-32B": {
"description": "سری DeepSeek-R1 با استفاده از یادگیری تقویتی و داده‌های شروع سرد عملکرد استدلال را بهینه‌سازی کرده و مدل‌های متن‌باز را به روز کرده و از سطح OpenAI-o1-mini فراتر رفته است."
},
"DeepSeek-R1-Distill-Qwen-7B": {
"description": "مدل تقطیر DeepSeek-R1 مبتنی بر Qwen2.5-Math-7B است که با استفاده از یادگیری تقویتی و داده‌های شروع سرد عملکرد استدلال را بهینه‌سازی کرده و مدل‌های متن‌باز را به روز کرده است."
},
"DeepSeek-V3": {
"description": "DeepSeek-V3 یک مدل MoE است که توسط شرکت DeepSeek توسعه یافته است. نتایج ارزیابی‌های متعدد DeepSeek-V3 از مدل‌های متن باز دیگر مانند Qwen2.5-72B و Llama-3.1-405B فراتر رفته و از نظر عملکرد با مدل‌های بسته جهانی برتر مانند GPT-4o و Claude-3.5-Sonnet برابری می‌کند."
},
"DeepSeek-V3-1": {
"description": "DeepSeek V3.1: مدل استنتاج نسل بعدی که توانایی‌های استدلال پیچیده و تفکر زنجیره‌ای را بهبود می‌بخشد و برای وظایف نیازمند تحلیل عمیق مناسب است."
},
"DeepSeek-V3-Fast": {
"description": "تأمین‌کننده مدل: پلتفرم sophnet. DeepSeek V3 Fast نسخه‌ای با TPS بالا و سرعت بسیار زیاد از نسخه DeepSeek V3 0324 است، بدون کمیت‌سازی، با توانایی‌های کد و ریاضی قوی‌تر و پاسخ‌دهی سریع‌تر!"
},
"DeepSeek-V3.1-Fast": {
"description": "DeepSeek V3.1 Fast نسخه پرسرعت و با TPS بالا از نسخه DeepSeek V3.1 است. حالت استدلال ترکیبی: با تغییر قالب گفتگو، یک مدل می‌تواند همزمان از حالت تفکری و غیرتفکری پشتیبانی کند. فراخوانی هوشمندتر ابزارها: با بهینه‌سازی پس از آموزش، عملکرد مدل در استفاده از ابزارها و وظایف عامل به‌طور چشمگیری بهبود یافته است."
},
"DeepSeek-V3.1-Think": {
"description": "DeepSeek-V3.1 حالت تفکری؛ DeepSeek-V3.1 مدل استدلال ترکیبی جدیدی از DeepSeek است که از دو حالت استدلال تفکری و غیرتفکری پشتیبانی می‌کند و نسبت به DeepSeek-R1-0528 در حالت تفکری کارایی بالاتری دارد. پس از آموزش تکمیلی، استفاده از ابزارهای عامل و عملکرد در وظایف عامل به‌طور قابل توجهی بهبود یافته است."
},
"Doubao-lite-128k": {
"description": "Doubao-lite دارای سرعت پاسخگویی بی‌نظیر و نسبت قیمت به کارایی بهتر است و گزینه‌های انعطاف‌پذیرتری را برای سناریوهای مختلف مشتریان ارائه می‌دهد. از پنجره متنی 128k برای استدلال و تنظیم دقیق پشتیبانی می‌کند."
},
"Doubao-lite-32k": {
"description": "Doubao-lite دارای سرعت پاسخگویی بی‌نظیر و نسبت قیمت به کارایی بهتر است و گزینه‌های انعطاف‌پذیرتری را برای سناریوهای مختلف مشتریان ارائه می‌دهد. از پنجره متنی 32k برای استدلال و تنظیم دقیق پشتیبانی می‌کند."
},
"Doubao-lite-4k": {
"description": "Doubao-lite دارای سرعت پاسخگویی بی‌نظیر و نسبت قیمت به کارایی بهتر است و گزینه‌های انعطاف‌پذیرتری را برای سناریوهای مختلف مشتریان ارائه می‌دهد. از پنجره متنی 4k برای استدلال و تنظیم دقیق پشتیبانی می‌کند."
},
"Doubao-pro-128k": {
"description": "مدل اصلی با بهترین عملکرد، مناسب برای انجام وظایف پیچیده است و در زمینه‌هایی مانند پاسخ به سوالات مرجع، خلاصه‌سازی، خلق محتوا، دسته‌بندی متن و نقش‌آفرینی عملکرد بسیار خوبی دارد. از پنجره متنی 128k برای استدلال و تنظیم دقیق پشتیبانی می‌کند."
},
"Doubao-pro-32k": {
"description": "مدل اصلی با بهترین عملکرد، مناسب برای انجام وظایف پیچیده است و در زمینه‌هایی مانند پاسخ به سوالات مرجع، خلاصه‌سازی، خلق محتوا، دسته‌بندی متن و نقش‌آفرینی عملکرد بسیار خوبی دارد. از پنجره متنی 32k برای استدلال و تنظیم دقیق پشتیبانی می‌کند."
},
"Doubao-pro-4k": {
"description": "مدل اصلی با بهترین عملکرد، مناسب برای انجام وظایف پیچیده است و در زمینه‌هایی مانند پاسخ به سوالات مرجع، خلاصه‌سازی، خلق محتوا، دسته‌بندی متن و نقش‌آفرینی عملکرد بسیار خوبی دارد. از پنجره متنی 4k برای استدلال و تنظیم دقیق پشتیبانی می‌کند."
},
"DreamO": {
"description": "DreamO یک مدل تولید تصویر سفارشی متن‌باز است که توسط شرکت بایت‌دنس و دانشگاه پکن به صورت مشترک توسعه یافته است و هدف آن پشتیبانی از تولید چندوظیفه‌ای تصویر از طریق معماری یکپارچه است. این مدل از روش مدل‌سازی ترکیبی کارآمد استفاده می‌کند و می‌تواند تصاویر بسیار سازگار و سفارشی‌شده‌ای را بر اساس شرایطی مانند هویت، موضوع، سبک و پس‌زمینه که توسط کاربر تعیین می‌شود، تولید کند."
},
"ERNIE-3.5-128K": {
"description": "مدل زبان بزرگ پرچمدار توسعه‌یافته توسط بایدو، که حجم عظیمی از متون چینی و انگلیسی را پوشش می‌دهد و دارای توانایی‌های عمومی قدرتمندی است. این مدل می‌تواند نیازهای اکثر سناریوهای پرسش و پاسخ، تولید محتوا و استفاده از افزونه‌ها را برآورده کند؛ همچنین از اتصال خودکار به افزونه جستجوی بایدو پشتیبانی می‌کند تا به‌روز بودن اطلاعات پرسش و پاسخ را تضمین کند."
},
"ERNIE-3.5-8K": {
"description": "مدل زبان بزرگ پرچمدار توسعه‌یافته توسط بایدو، که حجم عظیمی از متون چینی و انگلیسی را پوشش می‌دهد و دارای توانایی‌های عمومی قدرتمندی است. این مدل می‌تواند نیازهای اکثر سناریوهای پرسش و پاسخ، تولید محتوا و استفاده از افزونه‌ها را برآورده کند؛ همچنین از اتصال خودکار به افزونه جستجوی بایدو پشتیبانی می‌کند تا به‌روز بودن اطلاعات پرسش و پاسخ را تضمین نماید."
},
"ERNIE-3.5-8K-Preview": {
"description": "مدل زبان بزرگ پرچمدار توسعه‌یافته توسط بایدو، که حجم عظیمی از متون چینی و انگلیسی را پوشش می‌دهد و دارای توانایی‌های عمومی قدرتمندی است. این مدل می‌تواند نیازهای اکثر سناریوهای پرسش و پاسخ، تولید محتوا و استفاده از افزونه‌ها را برآورده کند؛ همچنین از اتصال خودکار به افزونه جستجوی بایدو پشتیبانی می‌کند تا به‌روز بودن اطلاعات پرسش و پاسخ را تضمین کند."
},
"ERNIE-4.0-8K-Latest": {
"description": "مدل زبان بزرگ مقیاس پرچمدار توسعه‌یافته توسط بایدو، که نسبت به ERNIE 3.5 ارتقاء کامل در توانایی‌های مدل را به ارمغان آورده است و برای وظایف پیچیده در حوزه‌های مختلف مناسب است؛ از اتصال خودکار به افزونه جستجوی بایدو پشتیبانی می‌کند و به‌روزرسانی اطلاعات پرسش و پاسخ را تضمین می‌نماید."
},
"ERNIE-4.0-8K-Preview": {
"description": "مدل زبان بزرگ مقیاس پرچمدار توسعه‌یافته توسط بایدو، در مقایسه با ERNIE 3.5 ارتقاء کامل توانایی‌های مدل را به ارمغان آورده و برای وظایف پیچیده در حوزه‌های مختلف مناسب است؛ از افزونه جستجوی بایدو پشتیبانی می‌کند تا اطلاعات پرسش و پاسخ به‌روز بماند."
},
"ERNIE-4.0-Turbo-8K-Latest": {
"description": "مدل زبان بزرگ و پیشرفته‌ای که توسط بایدو توسعه یافته است، با عملکرد برجسته در زمینه‌های مختلف و مناسب برای وظایف پیچیده؛ از افزونه جستجوی بایدو به‌طور خودکار پشتیبانی می‌کند تا اطلاعات به‌روز را در پاسخ‌ها تضمین کند. در مقایسه با ERNIE 4.0، عملکرد بهتری دارد."
},
"ERNIE-4.0-Turbo-8K-Preview": {
"description": "مدل زبان بزرگ و پرچمدار با مقیاس فوق‌العاده که توسط بایدو توسعه یافته است، با عملکرد برجسته در زمینه‌های مختلف و مناسب برای وظایف پیچیده؛ پشتیبانی از اتصال خودکار به افزونه جستجوی بایدو برای اطمینان از به‌روز بودن اطلاعات پرسش و پاسخ. در مقایسه با ERNIE 4.0، عملکرد بهتری دارد."
},
"ERNIE-Character-8K": {
"description": "مدل زبان بزرگ عمودی توسعه‌یافته توسط بایدو، مناسب برای صحنه‌های کاربردی مانند NPCهای بازی، مکالمات پشتیبانی مشتری، و نقش‌آفرینی در مکالمات. سبک شخصیت‌ها برجسته‌تر و یکپارچه‌تر است، توانایی پیروی از دستورات قوی‌تر و عملکرد استدلالی بهینه‌تر است."
},
"ERNIE-Lite-Pro-128K": {
"description": "مدل زبان بزرگ سبک‌وزن توسعه‌یافته توسط بایدو، که تعادل بین عملکرد مدل عالی و کارایی استنتاج را حفظ می‌کند. عملکرد آن بهتر از ERNIE Lite است و برای استفاده در کارت‌های شتاب‌دهنده AI با قدرت محاسباتی پایین مناسب است."
},
"ERNIE-Speed-128K": {
"description": "مدل زبان بزرگ با عملکرد بالا که در سال 2024 توسط بایدو توسعه یافته است. این مدل دارای توانایی‌های عمومی برجسته‌ای است و به عنوان یک مدل پایه برای تنظیم دقیق در سناریوهای خاص مناسب است و همچنین از عملکرد استنتاجی بسیار خوبی برخوردار است."
},
"ERNIE-Speed-Pro-128K": {
"description": "مدل زبان بزرگ با عملکرد بالا که در سال 2024 توسط بایدو به‌طور مستقل توسعه یافته است. این مدل دارای توانایی‌های عمومی برجسته‌ای است و عملکرد بهتری نسبت به ERNIE Speed دارد. مناسب برای استفاده به عنوان مدل پایه برای تنظیم دقیق و حل بهتر مسائل در سناریوهای خاص، همچنین دارای عملکرد استنتاجی بسیار عالی است."
},
"FLUX-1.1-pro": {
"description": "FLUX.1.1 Pro"
},
"FLUX.1-Kontext-dev": {
"description": "FLUX.1-Kontext-dev یک مدل تولید و ویرایش تصویر چندرسانه‌ای است که توسط Black Forest Labs توسعه یافته و بر اساس معماری Rectified Flow Transformer ساخته شده است. این مدل با 12 میلیارد پارامتر، بر تولید، بازسازی، تقویت یا ویرایش تصاویر تحت شرایط متنی تمرکز دارد. این مدل ترکیبی از مزایای تولید کنترل‌شده مدل‌های انتشار و قابلیت مدل‌سازی زمینه‌ای ترنسفورمر است و از خروجی تصاویر با کیفیت بالا پشتیبانی می‌کند و در وظایفی مانند ترمیم تصویر، تکمیل تصویر و بازسازی صحنه‌های بصری کاربرد گسترده دارد."
},
"FLUX.1-Kontext-pro": {
"description": "FLUX.1 Kontext [pro]"
},
"FLUX.1-dev": {
"description": "FLUX.1-dev یک مدل زبان چندرسانه‌ای متن‌باز است که توسط Black Forest Labs توسعه یافته و برای وظایف ترکیبی تصویر و متن بهینه شده است. این مدل بر پایه مدل‌های زبان بزرگ پیشرفته مانند Mistral-7B ساخته شده و با استفاده از رمزگذار بصری طراحی‌شده و تنظیم دقیق چندمرحله‌ای دستوری، توانایی پردازش همزمان تصویر و متن و استدلال در وظایف پیچیده را دارد."
},
"Gryphe/MythoMax-L2-13b": {
"description": "MythoMax-L2 (13B) یک مدل نوآورانه است که برای کاربردهای چندرشته‌ای و وظایف پیچیده مناسب است."
},
"HelloMeme": {
"description": "HelloMeme یک ابزار هوش مصنوعی است که می‌تواند بر اساس تصاویر یا حرکاتی که شما ارائه می‌دهید، به طور خودکار میم، گیف یا ویدیوهای کوتاه تولید کند. این ابزار نیازی به دانش نقاشی یا برنامه‌نویسی ندارد و تنها با داشتن تصاویر مرجع، می‌تواند محتوایی زیبا، سرگرم‌کننده و با سبک یکپارچه برای شما بسازد."
},
"HiDream-I1-Full": {
"description": "HiDream-E1-Full یک مدل بزرگ ویرایش تصویر چندرسانه‌ای متن‌باز است که توسط HiDream.ai توسعه یافته است. این مدل بر پایه معماری پیشرفته Diffusion Transformer ساخته شده و با توانایی قوی درک زبان (با LLaMA 3.1-8B-Instruct داخلی) از طریق دستورات زبان طبیعی، تولید تصویر، انتقال سبک، ویرایش موضعی و بازنقاشی محتوا را پشتیبانی می‌کند و دارای قابلیت‌های برجسته در درک و اجرای ترکیب تصویر و متن است."
},
"HunyuanDiT-v1.2-Diffusers-Distilled": {
"description": "hunyuandit-v1.2-distilled یک مدل سبک تولید تصویر از متن است که با استفاده از تکنیک تقطیر بهینه شده و قادر است به سرعت تصاویر با کیفیت بالا تولید کند، به ویژه مناسب محیط‌های با منابع محدود و وظایف تولید در زمان واقعی است."
},
"InstantCharacter": {
"description": "InstantCharacter یک مدل تولید شخصیت شخصی‌سازی شده بدون نیاز به تنظیم دقیق است که توسط تیم هوش مصنوعی Tencent در سال ۲۰۲۵ منتشر شده است. هدف این مدل تولید شخصیت‌های با وفاداری بالا و سازگار در صحنه‌های مختلف است. این مدل تنها با یک تصویر مرجع قادر به مدل‌سازی شخصیت است و می‌تواند آن را به سبک‌ها، حرکات و پس‌زمینه‌های مختلف به طور انعطاف‌پذیر منتقل کند."
},
"InternVL2-8B": {
"description": "InternVL2-8B یک مدل زبان بصری قدرتمند است که از پردازش چند حالتی تصویر و متن پشتیبانی می‌کند و قادر است محتوای تصویر را به دقت شناسایی کرده و توصیف یا پاسخ‌های مرتبط تولید کند."
},
"InternVL2.5-26B": {
"description": "InternVL2.5-26B یک مدل زبان بصری قدرتمند است که از پردازش چند حالتی تصویر و متن پشتیبانی می‌کند و قادر است محتوای تصویر را به دقت شناسایی کرده و توصیف یا پاسخ‌های مرتبط تولید کند."
},
"Kolors": {
"description": "Kolors یک مدل تولید تصویر از متن است که توسط تیم Kolors شرکت Kuaishou توسعه یافته است. این مدل با میلیاردها پارامتر آموزش دیده و در کیفیت بصری، درک معنایی زبان چینی و رندر متن عملکرد برجسته‌ای دارد."
},
"Kwai-Kolors/Kolors": {
"description": "Kolors یک مدل بزرگ تولید تصویر از متن مبتنی بر انتشار نهفته است که توسط تیم Kolors شرکت Kuaishou توسعه یافته است. این مدل با آموزش روی میلیاردها جفت متن-تصویر، در کیفیت بصری، دقت معنایی پیچیده و رندر کاراکترهای چینی و انگلیسی عملکرد برجسته‌ای دارد. این مدل نه تنها از ورودی‌های چینی و انگلیسی پشتیبانی می‌کند بلکه در درک و تولید محتوای خاص زبان چینی نیز بسیار توانمند است."
},
"Kwaipilot/KAT-Dev": {
"description": "KAT-Dev (32B) یک مدل متن‌باز با ۳۲ میلیارد پارامتر است که به‌طور ویژه برای وظایف مهندسی نرم‌افزار طراحی شده است. این مدل در آزمون معیار SWE-Bench Verified به نرخ حل ۶۲.۴٪ دست یافته و در میان تمام مدل‌های متن‌باز با اندازه‌های مختلف، رتبه پنجم را کسب کرده است. این مدل از طریق مراحل مختلفی مانند آموزش میانی، تنظیم دقیق تحت نظارت (SFT) و یادگیری تقویتی (RL) بهینه‌سازی شده و هدف آن ارائه پشتیبانی قدرتمند برای وظایف پیچیده برنامه‌نویسی مانند تکمیل کد، رفع اشکال، و بازبینی کد است."
},
"Llama-3.2-11B-Vision-Instruct": {
"description": "توانایی استدلال تصویری عالی در تصاویر با وضوح بالا، مناسب برای برنامه‌های درک بصری."
},
"Llama-3.2-90B-Vision-Instruct\t": {
"description": "توانایی استدلال تصویری پیشرفته برای برنامه‌های نمایندگی درک بصری."
},
"Meta-Llama-3-3-70B-Instruct": {
"description": "Llama 3.3 70B: مدل ترنسفورمر چندمنظوره که برای مکالمه و وظایف تولید محتوا مناسب است."
},
"Meta-Llama-3.1-405B-Instruct": {
"description": "مدل متنی تنظیم شده لاما 3.1 که برای موارد مکالمه چند زبانه بهینه‌سازی شده و در بسیاری از مدل‌های چت متن باز و بسته موجود، در معیارهای صنعتی رایج عملکرد عالی دارد."
},
"Meta-Llama-3.1-70B-Instruct": {
"description": "مدل متنی تنظیم شده لاما 3.1 که برای موارد مکالمه چند زبانه بهینه‌سازی شده و در بسیاری از مدل‌های چت متن باز و بسته موجود، در معیارهای صنعتی رایج عملکرد عالی دارد."
},
"Meta-Llama-3.1-8B-Instruct": {
"description": "مدل متنی تنظیم شده لاما 3.1 که برای موارد مکالمه چند زبانه بهینه‌سازی شده و در بسیاری از مدل‌های چت متن باز و بسته موجود، در معیارهای صنعتی رایج عملکرد عالی دارد."
},
"Meta-Llama-3.2-1B-Instruct": {
"description": "مدل زبان کوچک پیشرفته و پیشرفته، با قابلیت درک زبان، توانایی استدلال عالی و توانایی تولید متن."
},
"Meta-Llama-3.2-3B-Instruct": {
"description": "مدل زبان کوچک پیشرفته و پیشرفته، با قابلیت درک زبان، توانایی استدلال عالی و توانایی تولید متن."
},
"Meta-Llama-3.3-70B-Instruct": {
"description": "لاما 3.3 پیشرفته‌ترین مدل زبان چند زبانه و متن باز در سری لاما است که با هزینه‌ای بسیار کم، عملکردی مشابه مدل 405B را ارائه می‌دهد. این مدل بر اساس ساختار ترنسفورمر طراحی شده و از طریق تنظیم دقیق نظارتی (SFT) و یادگیری تقویتی با بازخورد انسانی (RLHF) بهبود یافته است تا کارایی و ایمنی آن افزایش یابد. نسخه تنظیم شده آن به طور خاص برای مکالمات چند زبانه بهینه‌سازی شده و در چندین معیار صنعتی، عملکردی بهتر از بسیاری از مدل‌های چت متن باز و بسته دارد. تاریخ قطع دانش آن تا دسامبر 2023 است."
},
"Meta-Llama-4-Maverick-17B-128E-Instruct-FP8": {
"description": "Llama 4 Maverick: مدل بزرگ مبتنی بر معماری Mixture-of-Experts که استراتژی فعال‌سازی کارآمد کارشناسان را برای عملکرد برتر در استنتاج ارائه می‌دهد."
},
"MiniMax-M1": {
"description": "مدل استنتاجی جدید با تحقیق و توسعه داخلی. پیشرو در جهان: زنجیره تفکر ۸۰ هزار مرحله‌ای × ورودی ۱ میلیون، عملکردی هم‌تراز با برترین مدل‌های بین‌المللی"
},
"MiniMax-M2": {
"description": "طراحی‌شده برای کدنویسی کارآمد و جریان کاری عامل‌ها (Agents)"
},
"MiniMax-M2-Stable": {
"description": "طراحی‌شده برای کدنویسی کارآمد و جریان‌های کاری Agent، با توانایی هم‌زمانی بالا و مناسب برای استفاده تجاری."
},
"MiniMax-Text-01": {
"description": "در سری مدل‌های MiniMax-01، ما نوآوری‌های جسورانه‌ای انجام داده‌ایم: برای اولین بار مکانیزم توجه خطی را به طور وسیع پیاده‌سازی کرده‌ایم و معماری سنتی Transformer دیگر تنها گزینه نیست. این مدل دارای 456 میلیارد پارامتر است که در یک بار فعال‌سازی 45.9 میلیارد است. عملکرد کلی این مدل با بهترین مدل‌های خارجی برابری می‌کند و در عین حال می‌تواند به طور مؤثر به متن‌های طولانی جهانی با 4 میلیون توکن رسیدگی کند، که 32 برابر GPT-4o و 20 برابر Claude-3.5-Sonnet است."
},
"MiniMaxAI/MiniMax-M1-80k": {
"description": "MiniMax-M1 یک مدل استنتاج بزرگ با وزن‌های متن‌باز و توجه ترکیبی است که دارای ۴۵۶ میلیارد پارامتر است و هر توکن می‌تواند حدود ۴۵.۹ میلیارد پارامتر را فعال کند. این مدل به طور بومی از زمینه بسیار طولانی ۱ میلیون توکن پشتیبانی می‌کند و با مکانیزم توجه سریع، در وظایف تولید ۱۰۰ هزار توکن نسبت به DeepSeek R1، ۷۵٪ از محاسبات نقطه شناور را صرفه‌جویی می‌کند. همچنین، MiniMax-M1 از معماری MoE (متخصصان ترکیبی) بهره می‌برد و با ترکیب الگوریتم CISPO و طراحی توجه ترکیبی در آموزش تقویتی کارآمد، عملکرد پیشرو در صنعت را در استنتاج ورودی‌های طولانی و سناریوهای واقعی مهندسی نرم‌افزار ارائه می‌دهد."
},
"MiniMaxAI/MiniMax-M2": {
"description": "MiniMax-M2 بهره‌وری را برای عامل‌های هوشمند بازتعریف می‌کند. این یک مدل MoE فشرده، سریع و مقرون‌به‌صرفه است که دارای ۲۳۰ میلیارد پارامتر کلی و ۱۰ میلیارد پارامتر فعال می‌باشد. این مدل برای ارائه عملکردی در سطح بالا در وظایف کدنویسی و عامل‌های هوشمند طراحی شده است، در حالی که هوش عمومی قدرتمندی را نیز حفظ می‌کند. تنها با ۱۰ میلیارد پارامتر فعال، MiniMax-M2 عملکردی هم‌تراز با مدل‌های بسیار بزرگ ارائه می‌دهد و آن را به گزینه‌ای ایده‌آل برای کاربردهای با بهره‌وری بالا تبدیل می‌کند."
},
"Moonshot-Kimi-K2-Instruct": {
"description": "مدل با 1 تریلیون پارامتر کل و 32 میلیارد پارامتر فعال. در میان مدل‌های غیرتفکری، در دانش پیشرفته، ریاضیات و برنامه‌نویسی در سطح برتر قرار دارد و در وظایف عامل عمومی تخصص دارد. به طور ویژه برای وظایف نمایندگی بهینه شده است، نه تنها قادر به پاسخگویی به سوالات بلکه قادر به انجام اقدامات است. بهترین گزینه برای گفتگوهای بداهه، چت عمومی و تجربه‌های نمایندگی است و یک مدل واکنشی بدون نیاز به تفکر طولانی مدت محسوب می‌شود."
},
"NousResearch/Nous-Hermes-2-Mixtral-8x7B-DPO": {
"description": "Nous Hermes 2 - Mixtral 8x7B-DPO (46.7B) یک مدل دستورالعمل با دقت بالا است که برای محاسبات پیچیده مناسب است."
},
"OmniConsistency": {
"description": "OmniConsistency با معرفی مدل‌های بزرگ Diffusion Transformers (DiTs) و داده‌های سبک‌دار جفت‌شده، انسجام سبک و قابلیت تعمیم در وظایف تصویر به تصویر (Image-to-Image) را بهبود می‌بخشد و از افت کیفیت سبک جلوگیری می‌کند."
},
"Phi-3-medium-128k-instruct": {
"description": "همان مدل Phi-3-medium، اما با اندازه بزرگتر زمینه، مناسب برای RAG یا تعداد کمی از دستورات."
},
"Phi-3-medium-4k-instruct": {
"description": "یک مدل با ۱۴ میلیارد پارامتر که کیفیت آن بهتر از Phi-3-mini است و تمرکز آن بر داده‌های با کیفیت بالا و فشرده‌سازی استدلالی است."
},
"Phi-3-mini-128k-instruct": {
"description": "مدل مشابه Phi-3-mini، اما با اندازه بزرگتر زمینه، مناسب برای RAG یا تعداد کمی از دستورات."
},
"Phi-3-mini-4k-instruct": {
"description": "کوچک‌ترین عضو خانواده Phi-3، بهینه‌سازی شده برای کیفیت و تأخیر کم."
},
"Phi-3-small-128k-instruct": {
"description": "همان مدل Phi-3-small، اما با اندازه بزرگتر زمینه، مناسب برای RAG یا تعداد کمی از دستورات."
},
"Phi-3-small-8k-instruct": {
"description": "یک مدل با ۷ میلیارد پارامتر که کیفیت آن بهتر از Phi-3-mini است و تمرکز آن بر داده‌های با کیفیت بالا و فشرده‌سازی استدلالی است."
},
"Phi-3.5-mini-instruct": {
"description": "نسخه به‌روزرسانی‌شده مدل Phi-3-mini."
},
"Phi-3.5-vision-instrust": {
"description": "نسخه به‌روزرسانی‌شده مدل Phi-3-vision."
},
"Pro/Qwen/Qwen2-7B-Instruct": {
"description": "Qwen2-7B-Instruct یک مدل زبانی بزرگ با تنظیم دقیق دستوری در سری Qwen2 است که اندازه پارامتر آن 7B است. این مدل بر اساس معماری Transformer ساخته شده و از تکنیک‌های SwiGLU،偏置 QKV توجه و توجه گروهی استفاده می‌کند. این مدل قادر به پردازش ورودی‌های بزرگ مقیاس است. این مدل در درک زبان، تولید، توانایی چند زبانه، کدنویسی، ریاضی و استدلال در چندین آزمون معیار عملکرد عالی دارد و از اکثر مدل‌های متن باز پیشی گرفته و در برخی وظایف رقابت قابل توجهی با مدل‌های اختصاصی نشان می‌دهد. Qwen2-7B-Instruct در چندین ارزیابی از Qwen1.5-7B-Chat پیشی گرفته و بهبود قابل توجهی در عملکرد نشان داده است."
},
"Pro/Qwen/Qwen2.5-7B-Instruct": {
"description": "Qwen2.5-7B-Instruct یکی از جدیدترین سری مدل‌های زبانی بزرگ منتشر شده توسط Alibaba Cloud است. این مدل 7B در زمینه‌های کدنویسی و ریاضی دارای توانایی‌های بهبود یافته قابل توجهی است. این مدل همچنین از پشتیبانی چند زبانه برخوردار است و بیش از 29 زبان از جمله چینی و انگلیسی را پوشش می‌دهد. این مدل در پیروی از دستورات، درک داده‌های ساختاری و تولید خروجی‌های ساختاری (به ویژه JSON) به طور قابل توجهی بهبود یافته است."
},
"Pro/Qwen/Qwen2.5-Coder-7B-Instruct": {
"description": "Qwen2.5-Coder-7B-Instruct جدیدترین نسخه از سری مدل‌های زبانی بزرگ خاص کد است که توسط Alibaba Cloud منتشر شده است. این مدل بر اساس Qwen2.5 و با آموزش 5.5 تریلیون توکن، توانایی تولید کد، استدلال و اصلاح را به طور قابل توجهی افزایش داده است. این مدل نه تنها توانایی کدنویسی را تقویت کرده بلکه مزایای ریاضی و عمومی را نیز حفظ کرده است. این مدل پایه‌ای جامع‌تر برای کاربردهای عملی مانند عامل‌های کد فراهم می‌کند."
},
"Pro/Qwen/Qwen2.5-VL-7B-Instruct": {
"description": "Qwen2.5-VL عضو جدید سری Qwen است که توانایی قدرتمند درک بصری دارد. این مدل می‌تواند متن، نمودارها و طرح‌بندی‌های درون تصاویر را تحلیل کند و همچنین قادر به درک ویدیوهای بلند و گرفتن رویدادهاست. این مدل می‌تواند استدلال کند، ابزارها را عملیاتی کند، و از چندین فرمت برای تعیین موقعیت اشیا و تولید خروجی ساختاری پشتیبانی می‌کند. همچنین، آن از رزولوشن و نرخ فریم پویا برای درک ویدیو بهینه‌سازی شده است و کارایی کدگذار بصری آن نیز افزایش یافته است."
},
"Pro/THUDM/GLM-4.1V-9B-Thinking": {
"description": "GLM-4.1V-9B-Thinking یک مدل زبان تصویری متن‌باز (VLM) است که به‌طور مشترک توسط Zhizhu AI و آزمایشگاه KEG دانشگاه تسینگ‌هوا منتشر شده است و به‌طور خاص برای پردازش وظایف شناختی چندرسانه‌ای پیچیده طراحی شده است. این مدل بر اساس مدل پایه GLM-4-9B-0414 ساخته شده و با معرفی مکانیزم استدلال «زنجیره تفکر» (Chain-of-Thought) و استفاده از استراتژی یادگیری تقویتی، به‌طور قابل توجهی توانایی استدلال چندرسانه‌ای و پایداری آن را بهبود بخشیده است."
},
"Pro/THUDM/glm-4-9b-chat": {
"description": "GLM-4-9B-Chat نسخه متن باز از مدل‌های پیش‌آموزش شده سری GLM-4 است که توسط AI Zhizhu ارائه شده است. این مدل در زمینه‌های معنایی، ریاضی، استدلال، کد و دانش عملکرد عالی دارد. علاوه بر پشتیبانی از گفتگوی چند دور، GLM-4-9B-Chat همچنین دارای قابلیت‌های پیشرفته‌ای مانند مرور وب، اجرای کد، فراخوانی ابزارهای سفارشی (Function Call) و استدلال متن طولانی است. این مدل از 26 زبان پشتیبانی می‌کند، از جمله چینی، انگلیسی، ژاپنی، کره‌ای و آلمانی. در چندین آزمون معیار، GLM-4-9B-Chat عملکرد عالی نشان داده است، مانند AlignBench-v2، MT-Bench، MMLU و C-Eval. این مدل از حداکثر طول زمینه 128K پشتیبانی می‌کند و برای تحقیقات علمی و کاربردهای تجاری مناسب است."
},
"Pro/deepseek-ai/DeepSeek-R1": {
"description": "DeepSeek-R1 یک مدل استنتاجی مبتنی بر یادگیری تقویتی (RL) است که مشکلات تکرار و خوانایی را در مدل حل می‌کند. قبل از RL، DeepSeek-R1 داده‌های شروع سرد را معرفی کرده و عملکرد استنتاج را بهینه‌سازی کرده است. این مدل در وظایف ریاضی، کد و استنتاج با OpenAI-o1 عملکرد مشابهی دارد و از طریق روش‌های آموزشی به دقت طراحی شده، عملکرد کلی را بهبود می‌بخشد."
},
"Pro/deepseek-ai/DeepSeek-R1-Distill-Qwen-7B": {
"description": "DeepSeek-R1-Distill-Qwen-7B مدلی است که بر اساس Qwen2.5-Math-7B از طریق دستیابی به دانش (Knowledge Distillation) ساخته شده است. این مدل با استفاده از 800,000 نمونه انتخابی تولید شده توسط DeepSeek-R1 آموزش داده شده و توانایی استنتاج ممتازی نشان می‌دهد. این مدل در چندین تست استاندارد عملکرد خوبی داشته است، از جمله دقت 92.8٪ در MATH-500، نرخ موفقیت 55.5٪ در AIME 2024 و نمره 1189 در CodeForces، که نشان‌دهنده توانایی‌های قوی ریاضی و برنامه‌نویسی برای یک مدل با حجم 7B است."
},
"Pro/deepseek-ai/DeepSeek-V3": {
"description": "DeepSeek-V3 یک مدل زبان با 671 میلیارد پارامتر است که از معماری متخصصان ترکیبی (MoE) و توجه چندسر (MLA) استفاده می‌کند و با استراتژی تعادل بار بدون ضرر کمکی بهینه‌سازی کارایی استنتاج و آموزش را انجام می‌دهد. این مدل با پیش‌آموزش بر روی 14.8 تریلیون توکن با کیفیت بالا و انجام تنظیم دقیق نظارتی و یادگیری تقویتی، در عملکرد از سایر مدل‌های متن‌باز پیشی می‌گیرد و به مدل‌های بسته پیشرو نزدیک می‌شود."
},
"Pro/deepseek-ai/DeepSeek-V3.1-Terminus": {
"description": "DeepSeek-V3.1-Terminus نسخه به‌روزرسانی شده مدل V3.1 منتشر شده توسط DeepSeek است که به عنوان یک مدل زبان بزرگ با عامل ترکیبی شناخته می‌شود. این به‌روزرسانی ضمن حفظ قابلیت‌های اصلی مدل، بر رفع مشکلات گزارش شده توسط کاربران و افزایش پایداری تمرکز دارد. این نسخه به طور قابل توجهی انسجام زبانی را بهبود بخشیده و از بروز ترکیب زبان چینی و انگلیسی و کاراکترهای نامتعارف کاسته است. مدل شامل حالت «تفکر» (Thinking Mode) و «غیرتفکر» (Non-thinking Mode) است که کاربران می‌توانند از طریق قالب‌های گفتگو به صورت انعطاف‌پذیر بین آن‌ها جابجا شوند تا با وظایف مختلف سازگار شوند. به عنوان یک بهینه‌سازی مهم، V3.1-Terminus عملکرد عامل کد (Code Agent) و عامل جستجو (Search Agent) را تقویت کرده است تا در فراخوانی ابزارها و اجرای وظایف پیچیده چندمرحله‌ای قابل اعتمادتر باشد."
},
"Pro/deepseek-ai/DeepSeek-V3.2-Exp": {
"description": "DeepSeek-V3.2-Exp نسخه آزمایشی V3.2 است که توسط DeepSeek منتشر شده و به عنوان گامی میانی در مسیر توسعه معماری نسل بعدی طراحی شده است. این نسخه با افزودن مکانیزم توجه پراکنده DeepSeek (DeepSeek Sparse Attention یا DSA) بر پایه V3.1-Terminus، کارایی آموزش و استنتاج در زمینه‌های متنی طولانی را بهبود می‌بخشد. همچنین به‌طور ویژه برای فراخوانی ابزارها، درک اسناد بلند و استدلال چندمرحله‌ای بهینه‌سازی شده است. V3.2-Exp پلی میان تحقیق و تولید است و برای کاربرانی مناسب است که به دنبال بهره‌وری بالاتر در سناریوهایی با بودجه متنی بالا هستند."
},
"Pro/moonshotai/Kimi-K2-Instruct-0905": {
"description": "Kimi K2-Instruct-0905 جدیدترین و قدرتمندترین نسخه Kimi K2 است. این مدل یک مدل زبان برتر با معماری متخصص ترکیبی (MoE) است که دارای ۱ تریلیون پارامتر کل و ۳۲ میلیارد پارامتر فعال می‌باشد. ویژگی‌های اصلی این مدل شامل: هوش کدگذاری عامل بهبود یافته که در آزمون‌های معیار عمومی و وظایف واقعی کدگذاری عامل عملکرد قابل توجهی نشان می‌دهد؛ تجربه کدگذاری فرانت‌اند بهبود یافته که از نظر زیبایی و کاربردی بودن برنامه‌نویسی فرانت‌اند پیشرفت داشته است."
},
"Pro/moonshotai/Kimi-K2-Thinking": {
"description": "Kimi K2 Thinking Turbo نسخه توربوی سری Kimi K2 است که برای سرعت استنتاج و توان عملیاتی بهینه‌سازی شده و در عین حال توانایی استنتاج چندمرحله‌ای و استفاده از ابزارهای K2 Thinking را حفظ می‌کند. این مدل بر پایه معماری متخصصان ترکیبی (MoE) ساخته شده، دارای حدود ۱ تریلیون پارامتر است، به‌صورت بومی از زمینه ۲۵۶ هزار توکن پشتیبانی می‌کند و می‌تواند به‌طور پایدار فراخوانی ابزارهای بزرگ‌مقیاس را انجام دهد. مناسب برای محیط‌های تولیدی با نیاز بالا به تأخیر کم و هم‌زمانی بالا."
},
"QwQ-32B-Preview": {
"description": "QwQ-32B-Preview یک مدل پردازش زبان طبیعی نوآورانه است که قادر به پردازش کارآمد مکالمات پیچیده و درک زمینه است."
},
"Qwen/QVQ-72B-Preview": {
"description": "QVQ-72B-Preview یک مدل تحقیقاتی است که توسط تیم Qwen توسعه یافته و بر روی توانایی‌های استنتاج بصری تمرکز دارد و در درک صحنه‌های پیچیده و حل مسائل ریاضی مرتبط با بصری دارای مزیت‌های منحصر به فردی است."
},
"Qwen/QwQ-32B": {
"description": "QwQ مدل استنتاجی از سری Qwen است. در مقایسه با مدل‌های سنتی بهینه‌سازی دستورالعمل، QwQ دارای توانایی تفکر و استنتاج است و می‌تواند در وظایف پایین‌دستی عملکرد قابل توجهی را به ویژه در حل مسائل دشوار ارائه دهد. QwQ-32B یک مدل استنتاجی متوسط است که می‌تواند در مقایسه با مدل‌های استنتاجی پیشرفته (مانند DeepSeek-R1، o1-mini) عملکرد رقابتی را به دست آورد. این مدل از تکنیک‌هایی مانند RoPE، SwiGLU، RMSNorm و Attention QKV bias استفاده می‌کند و دارای ساختار شبکه 64 لایه و 40 سر توجه Q (در معماری GQA، KV برابر با 8 است) می‌باشد."
},
"Qwen/QwQ-32B-Preview": {
"description": "QwQ-32B-Preview جدیدترین مدل تحقیقاتی تجربی Qwen است که بر بهبود توانایی استدلال AI تمرکز دارد. با کاوش در مکانیزم‌های پیچیده‌ای مانند ترکیب زبان و استدلال بازگشتی، مزایای اصلی شامل توانایی تحلیل استدلال قوی، توانایی ریاضی و برنامه‌نویسی است. در عین حال، مشکلاتی مانند تغییر زبان، حلقه‌های استدلال، ملاحظات ایمنی و تفاوت‌های دیگر در توانایی‌ها وجود دارد."
},
"Qwen/Qwen-Image": {
"description": "Qwen-Image یک مدل پایه تولید تصویر است که توسط تیم Tongyi Qianwen شرکت علی‌بابا توسعه یافته و دارای ۲۰ میلیارد پارامتر می‌باشد. این مدل در رندر متون پیچیده و ویرایش دقیق تصاویر پیشرفت‌های چشمگیری داشته و به‌ویژه در تولید تصاویری با متون چینی و انگلیسی با وفاداری بالا بسیار توانمند است. Qwen-Image نه تنها قادر به پردازش چیدمان‌های چندخطی و متون در سطح پاراگراف است، بلکه در حین تولید تصویر، انسجام تایپوگرافی و هماهنگی با زمینه را نیز حفظ می‌کند. افزون بر توانایی برجسته در رندر متن، این مدل از سبک‌های هنری متنوعی پشتیبانی می‌کند؛ از عکس‌های واقع‌گرایانه گرفته تا زیبایی‌شناسی انیمه، و می‌تواند به‌طور انعطاف‌پذیر با نیازهای مختلف خلاقانه سازگار شود. همچنین، این مدل دارای قابلیت‌های قدرتمند در ویرایش و درک تصویر است و از عملیات پیشرفته‌ای مانند انتقال سبک، افزودن یا حذف اشیاء، تقویت جزئیات، ویرایش متن و حتی کنترل حالت بدن انسان پشتیبانی می‌کند. هدف آن تبدیل شدن به یک مدل پایه هوشمند و جامع برای خلق و پردازش بصری است که زبان، چیدمان و تصویر را در هم می‌آمیزد."
},
"Qwen/Qwen-Image-Edit-2509": {
"description": "Qwen-Image-Edit-2509 جدیدترین نسخه ویرایش تصویر از مدل Qwen-Image است که توسط تیم Tongyi Qianwen شرکت علی‌بابا منتشر شده است. این مدل بر پایه مدل ۲۰ میلیارد پارامتری Qwen-Image توسعه یافته و با آموزش عمیق، توانایی منحصربه‌فرد خود در رندر متن را به حوزه ویرایش تصویر گسترش داده و امکان ویرایش دقیق متون درون تصویر را فراهم کرده است. Qwen-Image-Edit از معماری نوآورانه‌ای بهره می‌برد که تصویر ورودی را به‌طور هم‌زمان به Qwen2.5-VL (برای کنترل معنایی بصری) و VAE Encoder (برای کنترل ظاهر بصری) ارسال می‌کند و بدین ترتیب توانایی ویرایش دوگانه در سطح معنا و ظاهر را فراهم می‌سازد. این بدان معناست که مدل نه تنها از ویرایش‌های ظاهری موضعی مانند افزودن، حذف یا تغییر عناصر پشتیبانی می‌کند، بلکه قادر به انجام ویرایش‌های معنایی پیشرفته‌ای مانند خلق IP، انتقال سبک و حفظ انسجام معنایی نیز می‌باشد. این مدل در چندین آزمون معیار عمومی عملکردی در سطح پیشرفته (SOTA) از خود نشان داده و به یک مدل پایه قدرتمند در زمینه ویرایش تصویر تبدیل شده است."
},
"Qwen/Qwen2-72B-Instruct": {
"description": "Qwen 2 Instruct (72B) دستورالعمل‌های دقیق برای کاربردهای سازمانی ارائه می‌دهد و به درستی به آن‌ها پاسخ می‌دهد."
},
"Qwen/Qwen2-7B-Instruct": {
"description": "Qwen2-72B-Instruct یک مدل زبانی بزرگ با تنظیم دقیق دستوری در سری Qwen2 است که اندازه پارامتر آن 72B است. این مدل بر اساس معماری Transformer ساخته شده و از تکنیک‌های SwiGLU،偏置 QKV توجه و توجه گروهی استفاده می‌کند. این مدل قادر به پردازش ورودی‌های بزرگ مقیاس است. این مدل در درک زبان، تولید، توانایی چند زبانه، کدنویسی، ریاضی و استدلال در چندین آزمون معیار عملکرد عالی دارد و از اکثر مدل‌های متن باز پیشی گرفته و در برخی وظایف رقابت قابل توجهی با مدل‌های اختصاصی نشان می‌دهد."
},
"Qwen/Qwen2-VL-72B-Instruct": {
"description": "Qwen2-VL جدیدترین نسخه از مدل Qwen-VL است که در آزمون‌های معیار درک بصری به پیشرفته‌ترین عملکرد دست یافته است."
},
"Qwen/Qwen2.5-14B-Instruct": {
"description": "Qwen2.5 یک سری جدید از مدل‌های زبانی بزرگ است که با هدف بهینه‌سازی پردازش وظایف دستوری طراحی شده است."
},
"Qwen/Qwen2.5-32B-Instruct": {
"description": "Qwen2.5 یک سری جدید از مدل‌های زبانی بزرگ است که با هدف بهینه‌سازی پردازش وظایف دستوری طراحی شده است."
},
"Qwen/Qwen2.5-72B-Instruct": {
"description": "مدل زبانی بزرگ توسعه یافته توسط تیم علی‌بابا، تونگ‌yi چن‌وِن."
},
"Qwen/Qwen2.5-72B-Instruct-128K": {
"description": "Qwen2.5 یک سری جدید از مدل‌های زبان بزرگ است که دارای توانایی‌های قوی‌تر در درک و تولید می‌باشد."
},
"Qwen/Qwen2.5-72B-Instruct-Turbo": {
"description": "Qwen2.5 یک سری جدید از مدل‌های زبانی بزرگ است که با هدف بهینه‌سازی پردازش وظایف دستوری طراحی شده است."
},
"Qwen/Qwen2.5-7B-Instruct": {
"description": "Qwen2.5 یک سری جدید از مدل‌های زبان بزرگ است که با هدف بهینه‌سازی پردازش وظایف دستوری طراحی شده است."
},
"Qwen/Qwen2.5-7B-Instruct-Turbo": {
"description": "Qwen2.5 یک سری جدید از مدل‌های زبانی بزرگ است که با هدف بهینه‌سازی پردازش وظایف دستوری طراحی شده است."
},
"Qwen/Qwen2.5-Coder-32B-Instruct": {
"description": "Qwen2.5-Coder بر نوشتن کد تمرکز دارد."
},
"Qwen/Qwen2.5-Coder-7B-Instruct": {
"description": "Qwen2.5-Coder-7B-Instruct جدیدترین نسخه از سری مدل‌های زبانی بزرگ خاص کد است که توسط Alibaba Cloud منتشر شده است. این مدل بر اساس Qwen2.5 و با آموزش 5.5 تریلیون توکن، توانایی تولید کد، استدلال و اصلاح را به طور قابل توجهی افزایش داده است. این مدل نه تنها توانایی کدنویسی را تقویت کرده بلکه مزایای ریاضی و عمومی را نیز حفظ کرده است. این مدل پایه‌ای جامع‌تر برای کاربردهای عملی مانند عامل‌های کد فراهم می‌کند."
},
"Qwen/Qwen2.5-VL-32B-Instruct": {
"description": "Qwen2.5-VL-32B-Instruct یک مدل چند حالتی از تیم Thousand Questions است که بخشی از سری Qwen2.5-VL می‌باشد. این مدل علاوه بر توانایی شناسایی اشیاء رایج، قادر به تحلیل متن، نمودار، نمادها، شکل‌ها و طرح‌بندی‌های درون تصاویر است. این مدل به عنوان یک هوش مصنوعی بصری عمل می‌کند، قادر به استدلال و کنترل ابزارها به صورت پویا است و توانایی استفاده از کامپیوتر و موبایل را دارد. علاوه بر این، این مدل می‌تواند اشیاء درون تصویر را با دقت بالا مکان‌یابی کند و برای فاکتورها، جداول و غیره خروجی‌های ساختاریجادی تولید کند. نسبت به نسخه قبلی Qwen2-VL، این نسخه در توانایی‌های ریاضی و حل مسئله از طریق یادگیری تقویتی پیشرفت کرده است و سبک پاسخ‌گویی آن نیز بیشتر با ترجیحات انسان‌ها هماهنگ است."
},
"Qwen/Qwen2.5-VL-72B-Instruct": {
"description": "Qwen2.5-VL مدل زبان و تصویر از سری Qwen2.5 است. این مدل در جنبه‌های مختلف بهبود یافته است: دارای توانایی تحلیل بصری قوی‌تر، قادر به تشخیص اشیاء رایج، تحلیل متن، نمودارها و طرح‌بندی است؛ به عنوان یک عامل بصری می‌تواند استدلال کند و به طور پویا ابزارها را هدایت کند؛ از توانایی درک ویدیوهای طولانی‌تر از یک ساعت و شناسایی رویدادهای کلیدی برخوردار است؛ قادر به مکان‌یابی دقیق اشیاء در تصویر با تولید جعبه‌های مرزی یا نقاط است؛ و توانایی تولید خروجی‌های ساختاریافته، به ویژه برای داده‌های اسکن شده مانند فاکتورها و جداول را دارد."
},
"Qwen/Qwen3-14B": {
"description": "Qwen3 یک مدل بزرگ جدید با توانایی‌های بهبود یافته است که در استدلال، عمومی، نمایندگی و چند زبانی به سطح پیشرفته صنعت دست یافته و از تغییر حالت تفکر پشتیبانی می‌کند."
},
"Qwen/Qwen3-235B-A22B": {
"description": "Qwen3 یک مدل بزرگ جدید با توانایی‌های بهبود یافته است که در استدلال، عمومی، نمایندگی و چند زبانی به سطح پیشرفته صنعت دست یافته و از تغییر حالت تفکر پشتیبانی می‌کند."
},
"Qwen/Qwen3-235B-A22B-Instruct-2507": {
"description": "Qwen3-235B-A22B-Instruct-2507 یک مدل زبان بزرگ ترکیبی (MoE) پرچمدار از سری Qwen3 است که توسط تیم Tongyi Qianwen شرکت علی‌بابا توسعه یافته است. این مدل دارای 235 میلیارد پارامتر کل و 22 میلیارد پارامتر فعال در هر استنتاج است. نسخه به‌روزشده‌ای از حالت غیرتفکری Qwen3-235B-A22B است که تمرکز بر بهبود قابل توجه در پیروی از دستورالعمل‌ها، استدلال منطقی، درک متن، ریاضیات، علوم، برنامه‌نویسی و استفاده از ابزارها دارد. همچنین پوشش دانش چندزبانه و ترجیحات کاربر در وظایف ذهنی و باز را بهبود بخشیده تا متن‌های مفیدتر و با کیفیت بالاتری تولید کند."
},
"Qwen/Qwen3-235B-A22B-Thinking-2507": {
"description": "Qwen3-235B-A22B-Thinking-2507 عضوی از سری مدل‌های بزرگ زبان Qwen3 است که توسط تیم Tongyi Qianwen شرکت علی‌بابا توسعه یافته و بر وظایف استدلال پیچیده و دشوار تمرکز دارد. این مدل بر پایه معماری MoE با 235 میلیارد پارامتر کل ساخته شده و در هر توکن حدود 22 میلیارد پارامتر فعال می‌کند که باعث افزایش کارایی محاسباتی در عین حفظ قدرت عملکرد می‌شود. به عنوان یک مدل اختصاصی \"تفکر\"، در استدلال منطقی، ریاضیات، علوم، برنامه‌نویسی و آزمون‌های علمی که نیازمند تخصص انسانی هستند، عملکرد برجسته‌ای دارد و در میان مدل‌های تفکری متن‌باز در سطح برتر قرار دارد. همچنین توانایی‌های عمومی مانند پیروی از دستورالعمل‌ها، استفاده از ابزار و تولید متن را تقویت کرده و به طور بومی از درک متن‌های طولانی تا 256 هزار توکن پشتیبانی می‌کند که برای سناریوهای نیازمند استدلال عمیق و پردازش اسناد طولانی بسیار مناسب است."
},
"Qwen/Qwen3-30B-A3B": {
"description": "Qwen3 یک مدل بزرگ جدید با توانایی‌های بهبود یافته است که در استدلال، عمومی، نمایندگی و چند زبانی به سطح پیشرفته صنعت دست یافته و از تغییر حالت تفکر پشتیبانی می‌کند."
},
"Qwen/Qwen3-30B-A3B-Instruct-2507": {
"description": "Qwen3-30B-A3B-Instruct-2507 نسخه به‌روزرسانی شده مدل غیرتفکری Qwen3-30B-A3B است. این یک مدل متخصص ترکیبی (MoE) با مجموع ۳۰.۵ میلیارد پارامتر و ۳.۳ میلیارد پارامتر فعال است. این مدل در جنبه‌های مختلف بهبودهای کلیدی داشته است، از جمله افزایش قابل توجه در پیروی از دستورالعمل‌ها، استدلال منطقی، درک متن، ریاضیات، علوم، برنامه‌نویسی و استفاده از ابزارها. همچنین، پیشرفت قابل توجهی در پوشش دانش چندزبانه و تطابق بهتر با ترجیحات کاربران در وظایف ذهنی و باز دارد، که منجر به تولید پاسخ‌های مفیدتر و متون با کیفیت بالاتر می‌شود. علاوه بر این، توانایی درک متن‌های بلند این مدل تا ۲۵۶ هزار توکن افزایش یافته است. این مدل فقط از حالت غیرتفکری پشتیبانی می‌کند و خروجی آن شامل برچسب‌های `<think></think>` نخواهد بود."
},
"Qwen/Qwen3-30B-A3B-Thinking-2507": {
"description": "Qwen3-30B-A3B-Thinking-2507 توسط تیم Tongyi Qianwen شرکت علی‌بابا به‌عنوان جدیدترین مدل «تفکر» از سری Qwen3 منتشر شده است. این مدل که یک مدل ترکیبی از متخصصان (MoE) با مجموع 30.5 میلیارد پارامتر و 3.3 میلیارد پارامتر فعال‌شونده است، بر ارتقای توانایی پردازش وظایف پیچیده تمرکز دارد. این مدل در معیارهای علمی نیازمند تخصص انسانی—از جمله استدلال منطقی، ریاضیات، علوم و برنامه‌نویسی—بهبود قابل‌توجهی در عملکرد نشان داده است. همچنین توانمندی‌های عمومی آن در پیروی از دستورالعمل‌ها، استفاده از ابزارها، تولید متن و همسویی با ترجیح‌های انسانی نیز به‌سرعت تقویت شده‌اند. مدل به‌طور ذاتی از درک بافت‌های طولانی تا 256K پشتیبانی می‌کند و قابل گسترش تا 1,000,000 توکن است. این نسخه به‌طور ویژه برای «حالت تفکر» طراحی شده است تا از طریق استدلال گام‌به‌گام دقیق مسائل بسیار پیچیده را حل کند و قابلیت‌های عامل (Agent) آن نیز درخشان است."
},
"Qwen/Qwen3-32B": {
"description": "Qwen3 یک مدل بزرگ جدید با توانایی‌های بهبود یافته است که در استدلال، عمومی، نمایندگی و چند زبانی به سطح پیشرفته صنعت دست یافته و از تغییر حالت تفکر پشتیبانی می‌کند."
},
"Qwen/Qwen3-8B": {
"description": "Qwen3 یک مدل بزرگ جدید با توانایی‌های بهبود یافته است که در استدلال، عمومی، نمایندگی و چند زبانی به سطح پیشرفته صنعت دست یافته و از تغییر حالت تفکر پشتیبانی می‌کند."
},
"Qwen/Qwen3-Coder-30B-A3B-Instruct": {
"description": "Qwen3-Coder-30B-A3B-Instruct یک مدل کدنویسی از مجموعه Qwen3 است که توسط تیم Tongyi Qianwen شرکت علی‌بابا توسعه یافته است. به‌عنوان یک مدل پالایش‌شده و بهینه‌شده، این مدل در حالی که عملکرد و کارایی بالایی را حفظ می‌کند، بر بهبود توانمندی‌های پردازش کد متمرکز شده است. این مدل در وظایف پیچیده‌ای مانند برنامه‌نویسی عامل‌محور (Agentic Coding)، خودکارسازی عملیات مرورگر و فراخوانی ابزارها، نسبت به مدل‌های متن‌باز مزایای عملکرد چشمگیری از خود نشان می‌دهد. این مدل به‌صورت بومی از زمینه‌های متنی طولانی تا 256K توکن پشتیبانی می‌کند و قابل گسترش تا 1M توکن است، که امکان درک و پردازش در سطح مخازن کد را بهبود می‌بخشد. علاوه بر این، این مدل پشتیبانی قدرتمندی برای کدنویسی عاملی در پلتفرم‌هایی مانند Qwen Code و CLINE فراهم می‌آورد و فرمت ویژه‌ای برای فراخوانی توابع طراحی شده است."
},
"Qwen/Qwen3-Coder-480B-A35B-Instruct": {
"description": "Qwen3-Coder-480B-A35B-Instruct مدلی برای برنامه‌نویسی است که توسط علی‌بابا منتشر شده و تا کنون بیشترین قابلیت‌های عامل‌محور (Agentic) را داراست. این مدل یک مدل ترکیب متخصصان (Mixture of Experts - MoE) با حدود 480 میلیارد پارامتر کل و 35 میلیارد پارامتر فعال است که تعادلی میان کارایی و عملکرد برقرار می‌کند. این مدل به‌صورت بومی از طول زمینه 256K (حدود 260 هزار) توکن پشتیبانی می‌کند و با استفاده از روش‌های برون‌یابی مانند YaRN می‌تواند تا 1,000,000 توکن گسترش یابد، که آن را قادر می‌سازد مخازن کد بزرگ و وظایف پیچیده برنامه‌نویسی را پردازش کند. Qwen3-Coder برای جریان‌های کاری کدنویسی عامل‌محور طراحی شده است؛ نه تنها می‌تواند کد تولید کند، بلکه قادر است به‌صورت خودکار با ابزارها و محیط‌های توسعه تعامل نماید تا مسائل پیچیده برنامه‌نویسی را حل کند. در چندین بنچ‌مارک مربوط به کدنویسی و وظایف عامل، این مدل در میان مدل‌های متن‌باز در سطح برتر قرار گرفته و عملکرد آن با مدل‌های پیشرو مانند Claude Sonnet 4 قابل مقایسه است."
},
"Qwen/Qwen3-Next-80B-A3B-Instruct": {
"description": "Qwen3-Next-80B-A3B-Instruct مدلی پایه نسل بعدی است که توسط تیم Tongyi Qianwen شرکت علی‌بابا منتشر شده است. این مدل بر اساس معماری جدید Qwen3-Next طراحی شده و هدف آن دستیابی به بالاترین کارایی در آموزش و استنتاج است. این مدل از مکانیزم توجه ترکیبی نوآورانه (Gated DeltaNet و Gated Attention)، ساختار متخصص ترکیبی با پراکندگی بالا (MoE) و چندین بهینه‌سازی برای پایداری آموزش بهره می‌برد. به عنوان یک مدل پراکنده با ۸۰ میلیارد پارامتر کل، در زمان استنتاج تنها حدود ۳ میلیارد پارامتر فعال می‌شوند که به طور قابل توجهی هزینه محاسباتی را کاهش می‌دهد و در پردازش وظایف با زمینه طولانی بیش از ۳۲ هزار توکن، توان عملیاتی استنتاج آن بیش از ۱۰ برابر مدل Qwen3-32B است. این مدل نسخه تنظیم شده برای دستورالعمل‌ها است و برای وظایف عمومی طراحی شده و از حالت زنجیره فکری (Thinking) پشتیبانی نمی‌کند. از نظر عملکرد، در برخی بنچمارک‌ها با مدل پرچمدار Tongyi Qianwen یعنی Qwen3-235B برابری می‌کند و به ویژه در وظایف با زمینه بسیار طولانی برتری قابل توجهی دارد."
},
"Qwen/Qwen3-Next-80B-A3B-Thinking": {
"description": "Qwen3-Next-80B-A3B-Thinking مدلی پایه نسل بعدی است که توسط تیم Tongyi Qianwen شرکت علی‌بابا برای وظایف استنتاج پیچیده طراحی شده است. این مدل بر اساس معماری نوآورانه Qwen3-Next ساخته شده که مکانیزم توجه ترکیبی (Gated DeltaNet و Gated Attention) و ساختار متخصص ترکیبی با پراکندگی بالا (MoE) را ادغام می‌کند تا به بالاترین کارایی در آموزش و استنتاج دست یابد. به عنوان یک مدل پراکنده با ۸۰ میلیارد پارامتر کل، در زمان استنتاج تنها حدود ۳ میلیارد پارامتر فعال می‌شوند که هزینه محاسباتی را به طور چشمگیری کاهش می‌دهد و در پردازش وظایف با زمینه طولانی بیش از ۳۲ هزار توکن، توان عملیاتی آن بیش از ۱۰ برابر مدل Qwen3-32B است. این نسخه «Thinking» به طور خاص برای انجام وظایف چندمرحله‌ای دشوار مانند اثبات ریاضی، ترکیب کد، تحلیل منطقی و برنامه‌ریزی بهینه شده و به طور پیش‌فرض فرایند استنتاج را به صورت ساختاریافته و در قالب «زنجیره فکری» ارائه می‌دهد. از نظر عملکرد، این مدل نه تنها از مدل‌های پرهزینه‌تر مانند Qwen3-32B-Thinking پیشی گرفته، بلکه در چندین بنچمارک از Gemini-2.5-Flash-Thinking نیز بهتر عمل می‌کند."
},
"Qwen/Qwen3-Omni-30B-A3B-Captioner": {
"description": "Qwen3-Omni-30B-A3B-Captioner یکی از مدل‌های زبان تصویری (VLM) سری Qwen3 از تیم Tongyi Qianwen شرکت علی‌بابا است. این مدل به‌طور خاص برای تولید توصیف‌های تصویری با کیفیت بالا، دقیق و جزئی طراحی شده است. با بهره‌گیری از معماری متخصصان ترکیبی (MoE) با ۳۰ میلیارد پارامتر کلی، این مدل توانایی درک عمیق محتوای تصویر و تبدیل آن به توصیف‌های متنی روان و طبیعی را دارد. عملکرد برجسته‌ای در زمینه‌هایی مانند درک صحنه، شناسایی اشیاء، استنتاج روابط و ثبت جزئیات تصویری دارد و برای کاربردهایی که نیاز به درک دقیق تصویر و تولید توصیف دارند، بسیار مناسب است."
},
"Qwen/Qwen3-Omni-30B-A3B-Instruct": {
"description": "Qwen3-Omni-30B-A3B-Instruct یکی از جدیدترین مدل‌های سری Qwen3 از تیم Tongyi Qianwen شرکت علی‌بابا است. این مدل با معماری متخصصان ترکیبی (MoE) دارای ۳۰ میلیارد پارامتر کلی و ۳ میلیارد پارامتر فعال است که در عین حفظ عملکرد قدرتمند، هزینه استنتاج را کاهش می‌دهد. این مدل با داده‌های با کیفیت، چندمنبعی و چندزبانه آموزش دیده و توانایی عمومی بالایی دارد. از ورودی‌های چندحالته شامل متن، تصویر، صوت و ویدیو پشتیبانی می‌کند و قادر به درک و تولید محتوای میان‌حالتی است."
},
"Qwen/Qwen3-Omni-30B-A3B-Thinking": {
"description": "Qwen3-Omni-30B-A3B-Thinking بخش اصلی «تفکر» (Thinker) در مدل چندحالته Qwen3-Omni است. این مدل به‌طور خاص برای پردازش ورودی‌های چندحالته شامل متن، صوت، تصویر و ویدیو و انجام استنتاج‌های زنجیره‌ای پیچیده طراحی شده است. به‌عنوان مغز استنتاج، این مدل تمام ورودی‌ها را به فضای بازنمایی مشترک تبدیل می‌کند تا درک عمیق و استنتاج میان‌حالتی را ممکن سازد. با بهره‌گیری از معماری MoE و ۳۰ میلیارد پارامتر کلی و ۳ میلیارد پارامتر فعال، این مدل در عین حفظ توانایی استنتاج قوی، بهره‌وری محاسباتی را نیز بهینه می‌کند."
},
"Qwen/Qwen3-VL-235B-A22B-Instruct": {
"description": "Qwen3-VL-235B-A22B-Instruct یک مدل بزرگ تنظیم‌شده با دستورالعمل از سری Qwen3-VL است که بر پایه معماری متخصصان ترکیبی (MoE) ساخته شده و توانایی برجسته‌ای در درک و تولید چندرسانه‌ای دارد. این مدل به‌صورت بومی از زمینه متنی ۲۵۶ هزار توکن پشتیبانی می‌کند و برای خدمات چندرسانه‌ای در سطح تولید با هم‌زمانی بالا مناسب است."
},
"Qwen/Qwen3-VL-235B-A22B-Thinking": {
"description": "Qwen3-VL-235B-A22B-Thinking نسخه پرچم‌دار تفکر از سری Qwen3-VL است که به‌طور خاص برای استدلال پیچیده چندرسانه‌ای، استدلال در زمینه‌های متنی طولانی و تعامل با عامل‌های هوشمند بهینه‌سازی شده است. این مدل برای سناریوهای سازمانی که نیاز به تفکر عمیق و استدلال بصری دارند، مناسب است."
},
"Qwen/Qwen3-VL-30B-A3B-Instruct": {
"description": "Qwen3-VL-30B-A3B-Instruct نسخه تنظیم‌شده با دستورالعمل از سری Qwen3-VL است که توانایی بالایی در درک و تولید زبان-تصویر دارد. این مدل به‌صورت بومی از زمینه متنی ۲۵۶ هزار توکن پشتیبانی می‌کند و برای گفتگوهای چندرسانه‌ای و تولید محتوا بر اساس تصویر مناسب است."
},
"Qwen/Qwen3-VL-30B-A3B-Thinking": {
"description": "Qwen3-VL-30B-A3B-Thinking نسخه تقویت‌شده برای استدلال (Thinking) از سری Qwen3-VL است که برای وظایف استدلال چندرسانه‌ای، تبدیل تصویر به کد و درک پیچیده بصری بهینه‌سازی شده است. این مدل از زمینه متنی ۲۵۶ هزار توکن پشتیبانی می‌کند و توانایی بالایی در تفکر زنجیره‌ای دارد."
},
"Qwen/Qwen3-VL-32B-Instruct": {
"description": "Qwen3-VL-32B-Instruct یک مدل زبان تصویری از تیم Tongyi Qianwen شرکت علی‌بابا است که در چندین آزمون معیار زبان تصویری به عملکرد SOTA (بهترین در نوع خود) دست یافته است. این مدل از ورودی‌های تصویری با وضوح بالا در سطح میلیون پیکسل پشتیبانی می‌کند و دارای توانایی‌های قدرتمند درک تصویری عمومی، OCR چندزبانه، مکان‌یابی دقیق بصری و گفت‌وگوی تصویری است. به‌عنوان بخشی از سری Qwen3، این مدل می‌تواند وظایف پیچیده چندحالته را پردازش کرده و از قابلیت‌هایی مانند فراخوانی ابزار و ادامه‌نویسی پیشوندی پشتیبانی کند."
},
"Qwen/Qwen3-VL-32B-Thinking": {
"description": "Qwen3-VL-32B-Thinking نسخه‌ای بهینه‌شده از مدل زبان تصویری تیم Tongyi Qianwen شرکت علی‌بابا است که به‌طور خاص برای وظایف استنتاج تصویری پیچیده طراحی شده است. این مدل دارای «حالت تفکر» داخلی است که به آن امکان می‌دهد پیش از پاسخ‌گویی، مراحل میانی استنتاج را به‌صورت دقیق تولید کند و در نتیجه عملکرد آن در وظایف نیازمند منطق چندمرحله‌ای، برنامه‌ریزی و استنتاج پیچیده به‌طور چشمگیری بهبود می‌یابد. این مدل از ورودی‌های تصویری با وضوح بالا در سطح میلیون پیکسل پشتیبانی می‌کند و دارای توانایی‌های قدرتمند درک تصویری عمومی، OCR چندزبانه، مکان‌یابی دقیق بصری و گفت‌وگوی تصویری است و همچنین از قابلیت‌هایی مانند فراخوانی ابزار و ادامه‌نویسی پیشوندی پشتیبانی می‌کند."
},
"Qwen/Qwen3-VL-8B-Instruct": {
"description": "Qwen3-VL-8B-Instruct یکی از مدل‌های زبان-بینایی از سری Qwen3 است که بر پایه Qwen3-8B-Instruct توسعه یافته و با حجم زیادی از داده‌های متنی-تصویری آموزش دیده است. این مدل در درک عمومی بصری، گفت‌وگوهای مبتنی بر تصویر و شناسایی متون چندزبانه در تصاویر مهارت دارد. مناسب برای کاربردهایی مانند پرسش و پاسخ بصری، توصیف تصویر، پیروی از دستورات چندوجهی و فراخوانی ابزارها می‌باشد."
},
"Qwen/Qwen3-VL-8B-Thinking": {
"description": "Qwen3-VL-8B-Thinking نسخه تفکر بصری از سری Qwen3 است که برای انجام وظایف پیچیده و چندمرحله‌ای استدلالی بهینه‌سازی شده است. این مدل به‌طور پیش‌فرض پیش از پاسخ‌دهی، زنجیره‌ای از تفکر مرحله‌به‌مرحله تولید می‌کند تا دقت استدلال را افزایش دهد. مناسب برای سناریوهایی است که نیاز به استدلال عمیق در پرسش و پاسخ بصری، بررسی محتوای تصویر و ارائه تحلیل‌های دقیق دارند."
},
"Qwen2-72B-Instruct": {
"description": "Qwen2 جدیدترین سری مدل‌های Qwen است که از 128k زمینه پشتیبانی می‌کند. در مقایسه با بهترین مدل‌های متن‌باز فعلی، Qwen2-72B در درک زبان طبیعی، دانش، کد، ریاضی و چندزبانگی به طور قابل توجهی از مدل‌های پیشرو فعلی فراتر رفته است."
},
"Qwen2-7B-Instruct": {
"description": "Qwen2 جدیدترین سری مدل‌های Qwen است که می‌تواند از مدل‌های متن‌باز با مقیاس مشابه و حتی بزرگتر فراتر رود. Qwen2 7B در چندین ارزیابی برتری قابل توجهی به دست آورده است، به ویژه در درک کد و زبان چینی."
},
"Qwen2-VL-72B": {
"description": "Qwen2-VL-72B یک مدل زبان بصری قدرتمند است که از پردازش چندرسانه‌ای تصویر و متن پشتیبانی می‌کند و می‌تواند محتوای تصویر را به دقت شناسایی کرده و توصیف یا پاسخ‌های مرتبط تولید کند."
},
"Qwen2.5-14B-Instruct": {
"description": "Qwen2.5-14B-Instruct یک مدل زبان بزرگ با 140 میلیارد پارامتر است که عملکرد عالی دارد و بهینه‌سازی شده برای سناریوهای چینی و چند زبانه، از کاربردهایی مانند پرسش و پاسخ هوشمند و تولید محتوا پشتیبانی می‌کند."
},
"Qwen2.5-32B-Instruct": {
"description": "Qwen2.5-32B-Instruct یک مدل زبان بزرگ با 320 میلیارد پارامتر است که عملکرد متوازن دارد و بهینه‌سازی شده برای سناریوهای چینی و چند زبانه، از کاربردهایی مانند پرسش و پاسخ هوشمند و تولید محتوا پشتیبانی می‌کند."
},
"Qwen2.5-72B-Instruct": {
"description": "Qwen2.5-72B-Instruct از 16k زمینه پشتیبانی می‌کند و قادر به تولید متن‌های طولانی بیش از 8K است. این مدل از تماس‌های تابع و تعامل بدون درز با سیستم‌های خارجی پشتیبانی می‌کند و به طور قابل توجهی انعطاف‌پذیری و گسترش‌پذیری را افزایش می‌دهد. دانش مدل به وضوح افزایش یافته و توانایی‌های کدنویسی و ریاضی به طور چشمگیری بهبود یافته است و از بیش از 29 زبان پشتیبانی می‌کند."
},
"Qwen2.5-7B-Instruct": {
"description": "Qwen2.5-7B-Instruct یک مدل زبان بزرگ با 70 میلیارد پارامتر است که از تماس‌های تابع و تعامل بی‌نقص با سیستم‌های خارجی پشتیبانی می‌کند و به طور قابل توجهی انعطاف‌پذیری و مقیاس‌پذیری را افزایش می‌دهد. این مدل بهینه‌سازی شده برای سناریوهای چینی و چند زبانه، از کاربردهایی مانند پرسش و پاسخ هوشمند و تولید محتوا پشتیبانی می‌کند."
},
"Qwen2.5-Coder-14B-Instruct": {
"description": "Qwen2.5-Coder-14B-Instruct یک مدل دستور برنامه‌نویسی مبتنی بر پیش‌آموزش وسیع است که دارای توانایی‌های قوی در درک و تولید کد است و می‌تواند به طور مؤثر به انواع وظایف برنامه‌نویسی رسیدگی کند، به ویژه برای نوشتن کد هوشمند، تولید اسکریپت‌های خودکار و پاسخ به مسائل برنامه‌نویسی مناسب است."
},
"Qwen2.5-Coder-32B-Instruct": {
"description": "Qwen2.5-Coder-32B-Instruct یک مدل زبان بزرگ است که به طور خاص برای تولید کد، درک کد و سناریوهای توسعه کارآمد طراحی شده است و از مقیاس 32B پارامتر پیشرفته در صنعت بهره می‌برد و می‌تواند نیازهای متنوع برنامه‌نویسی را برآورده کند."
},
"Qwen3-235B": {
"description": "Qwen3-235B-A22B، مدل MoE (متخصص ترکیبی)، حالت «استدلال ترکیبی» را معرفی کرده است که به کاربران امکان می‌دهد به‌طور یکپارچه بین «حالت تفکر» و «حالت غیرتفکر» جابجا شوند. این مدل از درک و استدلال در ۱۱۹ زبان و گویش پشتیبانی می‌کند و دارای قابلیت‌های قدرتمند فراخوانی ابزار است. در آزمون‌های معیار مختلف از جمله توانایی‌های جامع، کد نویسی و ریاضیات، چندزبانه، دانش و استدلال، این مدل می‌تواند با مدل‌های پیشرو بازار مانند DeepSeek R1، OpenAI o1، o3-mini، Grok 3 و Google Gemini 2.5 Pro رقابت کند."
},
"Qwen3-235B-A22B-Instruct-2507-FP8": {
"description": "Qwen3 235B A22B Instruct 2507: مدلی بهینه‌شده برای استدلال پیشرفته و دستورهای مکالمه با معماری کارشناسان ترکیبی که کارایی استنتاج را در پارامترهای بزرگ حفظ می‌کند."
},
"Qwen3-32B": {
"description": "Qwen3-32B، مدل متراکم (Dense Model)، حالت «استدلال ترکیبی» را معرفی کرده است که به کاربران امکان می‌دهد به‌طور یکپارچه بین «حالت تفکر» و «حالت غیرتفکر» جابجا شوند. به دلیل بهبود ساختار مدل، افزایش داده‌های آموزشی و روش‌های مؤثرتر آموزش، عملکرد کلی این مدل با Qwen2.5-72B قابل مقایسه است."
},
"SenseChat": {
"description": "نسخه پایه مدل (V4)، طول متن ۴K، با توانایی‌های عمومی قوی"
},
"SenseChat-128K": {
"description": "نسخه پایه مدل (V4)، با طول زمینه ۱۲۸K، در وظایف درک و تولید متون طولانی عملکرد برجسته‌ای دارد"
},
"SenseChat-32K": {
"description": "مدل نسخه پایه (V4)، طول زمینه 32K، قابل استفاده در انواع سناریوها"
},
"SenseChat-5": {
"description": "جدیدترین نسخه مدل (V5.5)، با طول زمینه 128K، بهبود قابل توجه در زمینه‌های استدلال ریاضی، مکالمه انگلیسی، پیروی از دستورات و درک متون طولانی، قابل مقایسه با GPT-4o"
},
"SenseChat-5-1202": {
"description": "نسخه جدید مبتنی بر V5.5 که نسبت به نسخه قبلی در توانایی‌های پایه‌ای زبان‌های چینی و انگلیسی، گفتگو، دانش علوم پایه، دانش علوم انسانی، نوشتار، منطق ریاضی و کنترل تعداد کلمات بهبود قابل توجهی داشته است."
},
"SenseChat-5-Cantonese": {
"description": "طول متن 32K، در درک مکالمات به زبان کانتونی از GPT-4 پیشی می‌گیرد و در زمینه‌های مختلفی مانند دانش، استدلال، ریاضیات و برنامه‌نویسی با GPT-4 Turbo قابل مقایسه است."
},
"SenseChat-5-beta": {
"description": "برخی از عملکردها بهتر از SenseCat-5-1202 است"
},
"SenseChat-Character": {
"description": "نسخه استاندارد مدل، طول متن ۸۰۰۰ کاراکتر، سرعت پاسخ‌دهی بالا"
},
"SenseChat-Character-Pro": {
"description": "مدل پیشرفته، طول متن 32K، بهبود کامل قابلیت‌ها، پشتیبانی از مکالمه به زبان‌های چینی/انگلیسی"
},
"SenseChat-Turbo": {
"description": "مناسب برای پرسش و پاسخ سریع و تنظیم دقیق مدل"
},
"SenseChat-Turbo-1202": {
"description": "این نسخه جدید مدل سبک است که به بیش از ۹۰٪ توانایی‌های مدل کامل دست یافته و هزینه استنتاج را به طور قابل توجهی کاهش می‌دهد."
},
"SenseChat-Vision": {
"description": "مدل جدیدترین نسخه (V5.5) است که از ورودی چند تصویر پشتیبانی می‌کند و به طور جامع به بهینه‌سازی توانایی‌های پایه مدل پرداخته و در شناسایی ویژگی‌های اشیاء، روابط فضایی، شناسایی رویدادهای حرکتی، درک صحنه، شناسایی احساسات، استدلال منطقی و درک و تولید متن بهبودهای قابل توجهی داشته است."
},
"SenseNova-V6-5-Pro": {
"description": "با به‌روزرسانی جامع داده‌های چندرسانه‌ای، زبانی و استدلالی و بهینه‌سازی استراتژی‌های آموزش، مدل جدید پیشرفت قابل توجهی در استدلال چندرسانه‌ای و توانایی پیروی از دستورالعمل‌های تعمیم‌یافته داشته است. این مدل از پنجره متنی تا ۱۲۸ هزار توکن پشتیبانی می‌کند و در وظایف تخصصی مانند OCR و شناسایی IP گردشگری و فرهنگی عملکرد برجسته‌ای دارد."
},
"SenseNova-V6-5-Turbo": {
"description": "با به‌روزرسانی جامع داده‌های چندرسانه‌ای، زبانی و استدلالی و بهینه‌سازی استراتژی‌های آموزش، مدل جدید پیشرفت قابل توجهی در استدلال چندرسانه‌ای و توانایی پیروی از دستورالعمل‌های تعمیم‌یافته داشته است. این مدل از پنجره متنی تا ۱۲۸ هزار توکن پشتیبانی می‌کند و در وظایف تخصصی مانند OCR و شناسایی IP گردشگری و فرهنگی عملکرد برجسته‌ای دارد."
},
"SenseNova-V6-Pro": {
"description": "تحقق یکپارچگی بومی قابلیت‌های تصویر، متن و ویدیو، عبور از محدودیت‌های سنتی چندمدلی، و کسب دو قهرمانی در ارزیابی‌های OpenCompass و SuperCLUE."
},
"SenseNova-V6-Reasoner": {
"description": "توجه به استدلال عمیق بصری و زبانی، تحقق تفکر کند و استدلال عمیق، ارائه فرآیند کامل زنجیره تفکر."
},
"SenseNova-V6-Turbo": {
"description": "تحقق یکپارچگی بومی قابلیت‌های تصویر، متن و ویدیو، عبور از محدودیت‌های سنتی چندمدلی، پیشی گرفتن در ابعاد اصلی مانند توانایی‌های چندمدلی و زبانی، و در چندین ارزیابی در سطح اول داخلی و خارجی قرار گرفتن."
},
"Skylark2-lite-8k": {
"description": "مدل نسل دوم Skylark، مدل Skylark2-lite دارای سرعت پاسخ‌دهی بالایی است و برای سناریوهایی که نیاز به زمان واقعی بالایی دارند و حساس به هزینه هستند و نیاز به دقت مدلی کمتری دارند مناسب است. طول پنجره متنی این مدل 8k است."
},
"Skylark2-pro-32k": {
"description": "مدل نسل دوم Skylark، مدل Skylark2-pro دارای دقت بالای مدلی است و برای سناریوهای پیچیده‌تر تولید متن مانند تولید متن تخصصی، نوشتن رمان، ترجمه باکیفیت و غیره مناسب است. طول پنجره متنی این مدل 32k است."
},
"Skylark2-pro-4k": {
"description": "مدل نسل دوم Skylark، مدل Skylark2-pro دارای دقت بالای مدلی است و برای سناریوهای پیچیده‌تر تولید متن مانند تولید متن تخصصی، نوشتن رمان، ترجمه باکیفیت و غیره مناسب است. طول پنجره متنی این مدل 4k است."
},
"Skylark2-pro-character-4k": {
"description": "مدل نسل دوم Skylark، مدل Skylark2-pro-character دارای قابلیت‌های برجسته بازی نقش و چت است و می‌تواند به‌طور طبیعی طبق خواسته‌های کاربر مختلف نقش‌ها را ایفا کند. این مدل برای ساخت ربات‌های چت، دستیاران مجازی و خدمات مشتری آنلاین مناسب است و دارای سرعت پاسخ‌دهی بالایی است."
},
"Skylark2-pro-turbo-8k": {
"description": "مدل نسل دوم Skylark، مدل Skylark2-pro-turbo-8k دارای استنتاج سریعتر و هزینه کمتر است و طول پنجره متنی آن 8k است."
},
"THUDM/GLM-4-32B-0414": {
"description": "GLM-4-32B-0414 نسل جدید مدل‌های متن‌باز سری GLM است که دارای 320 میلیارد پارامتر است. عملکرد این مدل می‌تواند با سری GPT OpenAI و سری V3/R1 DeepSeek مقایسه شود."
},
"THUDM/GLM-4-9B-0414": {
"description": "GLM-4-9B-0414 یک مدل کوچک از سری GLM است که دارای 90 میلیارد پارامتر است. این مدل ویژگی‌های فنی سری GLM-4-32B را به ارث می‌برد، اما گزینه‌های استقرار سبک‌تری را ارائه می‌دهد. با وجود اندازه کوچک، GLM-4-9B-0414 در تولید کد، طراحی وب، تولید گرافیک SVG و نوشتن مبتنی بر جستجو عملکرد فوق‌العاده‌ای دارد."
},
"THUDM/GLM-4.1V-9B-Thinking": {
"description": "GLM-4.1V-9B-Thinking یک مدل زبان تصویری متن‌باز (VLM) است که به‌طور مشترک توسط Zhizhu AI و آزمایشگاه KEG دانشگاه تسینگ‌هوا منتشر شده است و به‌طور خاص برای پردازش وظایف شناختی چندرسانه‌ای پیچیده طراحی شده است. این مدل بر اساس مدل پایه GLM-4-9B-0414 ساخته شده و با معرفی مکانیزم استدلال «زنجیره تفکر» (Chain-of-Thought) و استفاده از استراتژی یادگیری تقویتی، به‌طور قابل توجهی توانایی استدلال چندرسانه‌ای و پایداری آن را بهبود بخشیده است."
},
"THUDM/GLM-Z1-32B-0414": {
"description": "GLM-Z1-32B-0414 یک مدل استدلال با توانایی تفکر عمیق است. این مدل بر اساس GLM-4-32B-0414 از طریق راه‌اندازی سرد و یادگیری تقویتی توسعه یافته و در وظایف ریاضی، کدنویسی و منطقی آموزش بیشتری دیده است. نسبت به مدل پایه، GLM-Z1-32B-0414 توانایی‌های ریاضی و حل مسائل پیچیده را به‌طور قابل توجهی افزایش داده است."
},
"THUDM/GLM-Z1-9B-0414": {
"description": "GLM-Z1-9B-0414 یک مدل کوچک از سری GLM است که تنها 90 میلیارد پارامتر دارد، اما در عین حال توانایی‌های شگفت‌انگیزی را در کنار حفظ سنت متن‌باز نشان می‌دهد. با وجود اندازه کوچک، این مدل در استدلال ریاضی و وظایف عمومی عملکرد عالی دارد و عملکرد کلی آن در میان مدل‌های متن‌باز با اندازه مشابه در سطح بالایی قرار دارد."
},
"THUDM/GLM-Z1-Rumination-32B-0414": {
"description": "GLM-Z1-Rumination-32B-0414 یک مدل استدلال عمیق با توانایی تفکر است (که با Deep Research OpenAI مقایسه می‌شود). برخلاف مدل‌های تفکر عمیق معمولی، این مدل از تفکر عمیق طولانی‌مدت برای حل مسائل باز و پیچیده استفاده می‌کند."
},
"THUDM/glm-4-9b-chat": {
"description": "نسخه منبع باز GLM-4 9B، تجربه گفتگوی بهینه‌شده برای برنامه‌های مکالمه را ارائه می‌دهد."
},
"Tongyi-Zhiwen/QwenLong-L1-32B": {
"description": "QwenLong-L1-32B نخستین مدل بزرگ استدلال با زمینه طولانی است که با یادگیری تقویتی آموزش دیده و به طور خاص برای وظایف استدلال متون طولانی بهینه شده است. این مدل با چارچوب یادگیری تقویتی توسعه تدریجی زمینه، انتقال پایدار از زمینه کوتاه به بلند را محقق ساخته است. در هفت آزمون معیار پرسش و پاسخ اسناد طولانی، QwenLong-L1-32B از مدل‌های پیشرو مانند OpenAI-o3-mini و Qwen3-235B-A22B پیشی گرفته و عملکردی مشابه Claude-3.7-Sonnet-Thinking دارد. این مدل در استدلال ریاضی، استدلال منطقی و استدلال چندمرحله‌ای مهارت ویژه‌ای دارد."
},
"Yi-34B-Chat": {
"description": "Yi-1.5-34B با حفظ توانایی‌های زبان عمومی عالی مدل‌های قبلی خود، از طریق آموزش افزایشی 500 میلیارد توکن با کیفیت بالا، به طور قابل توجهی توانایی‌های منطقی ریاضی و کدنویسی را افزایش داده است."
},
"abab5.5-chat": {
"description": "برای سناریوهای بهره‌وری طراحی شده است، از پردازش وظایف پیچیده و تولید متن کارآمد پشتیبانی می‌کند و برای کاربردهای حرفه‌ای مناسب است."
},
"abab5.5s-chat": {
"description": "طراحی شده برای سناریوهای مکالمه با شخصیت‌های چینی، ارائه توانایی تولید مکالمات با کیفیت بالا به زبان چینی، مناسب برای انواع کاربردها."
},
"abab6.5g-chat": {
"description": "طراحی شده برای مکالمات چندزبانه با شخصیت‌های مختلف، پشتیبانی از تولید مکالمات با کیفیت بالا به زبان انگلیسی و سایر زبان‌ها."
},
"abab6.5s-chat": {
"description": "مناسب برای طیف گسترده‌ای از وظایف پردازش زبان طبیعی، از جمله تولید متن، سیستم‌های گفتگو و غیره."
},
"abab6.5t-chat": {
"description": "بهینه‌سازی شده برای سناریوهای مکالمه با شخصیت‌های چینی، ارائه توانایی تولید مکالمات روان و مطابق با عادات بیانی چینی."
},
"accounts/fireworks/models/deepseek-r1": {
"description": "DeepSeek-R1 یک مدل زبان بزرگ پیشرفته است که با یادگیری تقویتی و بهینه‌سازی داده‌های راه‌اندازی سرد، عملکرد استدلال، ریاضیات و برنامه‌نویسی فوق‌العاده‌ای دارد."
},
"accounts/fireworks/models/deepseek-v3": {
"description": "مدل زبان قدرتمند Mixture-of-Experts (MoE) ارائه شده توسط Deepseek، با مجموع پارامترها به میزان 671B و فعال‌سازی 37B پارامتر برای هر نشانه."
},
"accounts/fireworks/models/llama-v3-70b-instruct": {
"description": "مدل Llama 3 70B دستورالعمل، به‌طور ویژه برای مکالمات چندزبانه و درک زبان طبیعی بهینه‌سازی شده است و عملکردی بهتر از اکثر مدل‌های رقیب دارد."
},
"accounts/fireworks/models/llama-v3-8b-instruct": {
"description": "مدل Llama 3 8B دستورالعمل، بهینه‌سازی شده برای مکالمه و وظایف چندزبانه، با عملکرد برجسته و کارآمد."
},
"accounts/fireworks/models/llama-v3-8b-instruct-hf": {
"description": "مدل Llama 3 8B دستورالعمل (نسخه HF)، با نتایج پیاده‌سازی رسمی سازگار است و از سازگاری بالا و قابلیت همکاری بین پلتفرمی برخوردار است."
},
"accounts/fireworks/models/llama-v3p1-405b-instruct": {
"description": "مدل Llama 3.1 405B دستورالعمل، با پارامترهای بسیار بزرگ، مناسب برای وظایف پیچیده و سناریوهای با بار سنگین در پیروی از دستورالعمل‌ها."
},
"accounts/fireworks/models/llama-v3p1-70b-instruct": {
"description": "مدل Llama 3.1 70B دستورالعمل، با توانایی برجسته در درک و تولید زبان طبیعی، انتخابی ایده‌آل برای وظایف مکالمه و تحلیل است."
},
"accounts/fireworks/models/llama-v3p1-8b-instruct": {
"description": "مدل Llama 3.1 8B دستورالعمل، بهینه‌سازی شده برای مکالمات چندزبانه، قادر به پیشی گرفتن از اکثر مدل‌های متن‌باز و بسته در معیارهای صنعتی رایج."
},
"accounts/fireworks/models/llama-v3p2-11b-vision-instruct": {
"description": "مدل استنتاج تصویر با ۱۱ میلیارد پارامتر از Meta که برای دستورالعمل‌ها تنظیم شده است. این مدل برای تشخیص بصری، استنتاج تصویر، توصیف تصویر و پاسخ به سوالات عمومی درباره تصاویر بهینه‌سازی شده است. این مدل قادر به درک داده‌های بصری مانند نمودارها و گراف‌ها است و با تولید توضیحات متنی از جزئیات تصاویر، فاصله بین دیداری و زبانی را پر می‌کند."
},
"accounts/fireworks/models/llama-v3p2-3b-instruct": {
"description": "مدل Llama 3.2 3B دستورالعمل یک مدل چندزبانه سبک است که توسط Meta ارائه شده است. این مدل با هدف بهبود کارایی طراحی شده و در مقایسه با مدل‌های بزرگ‌تر، بهبودهای قابل توجهی در تأخیر و هزینه ارائه می‌دهد. نمونه‌های کاربردی این مدل شامل بازنویسی پرسش‌ها و دستورات و همچنین کمک به نوشتن است."
},
"accounts/fireworks/models/llama-v3p2-90b-vision-instruct": {
"description": "مدل استنتاج تصویر با 90 میلیارد پارامتر از Meta که برای دستورالعمل‌ها تنظیم شده است. این مدل برای تشخیص بصری، استنتاج تصویر، توصیف تصویر و پاسخ به سوالات عمومی در مورد تصاویر بهینه‌سازی شده است. این مدل قادر است داده‌های بصری مانند نمودارها و گراف‌ها را درک کند و با تولید توضیحات متنی از جزئیات تصویر، فاصله بین دیداری و زبانی را پر کند."
},
"accounts/fireworks/models/llama-v3p3-70b-instruct": {
"description": "مدل Llama 3.3 70B Instruct نسخه به‌روزرسانی شده Llama 3.1 70B در دسامبر است. این مدل بر اساس Llama 3.1 70B (منتشر شده در ژوئیه 2024) بهبود یافته و قابلیت‌های فراخوانی ابزار، پشتیبانی از متن چند زبانه، ریاضیات و برنامه‌نویسی را تقویت کرده است. این مدل در استدلال، ریاضیات و پیروی از دستورات به سطح پیشرفته‌ای در صنعت رسیده و می‌تواند عملکردی مشابه با 3.1 405B ارائه دهد، در حالی که از نظر سرعت و هزینه مزایای قابل توجهی دارد."
},
"accounts/fireworks/models/mistral-small-24b-instruct-2501": {
"description": "مدل 24B با پارامترهایی که قابلیت‌های پیشرفته‌ای مشابه مدل‌های بزرگتر را داراست."
},
"accounts/fireworks/models/mixtral-8x22b-instruct": {
"description": "مدل Mixtral MoE 8x22B دستوری، با پارامترهای بزرگ و معماری چندین متخصص، پشتیبانی کامل از پردازش کارآمد وظایف پیچیده."
},
"accounts/fireworks/models/mixtral-8x7b-instruct": {
"description": "مدل Mixtral MoE 8x7B، معماری چندین متخصص برای پیروی و اجرای دستورات به‌صورت کارآمد ارائه می‌دهد."
},
"accounts/fireworks/models/mythomax-l2-13b": {
"description": "مدل MythoMax L2 13B، با استفاده از تکنیک‌های ترکیبی نوآورانه، در روایت داستان و نقش‌آفرینی مهارت دارد."
},
"accounts/fireworks/models/phi-3-vision-128k-instruct": {
"description": "Phi-3-Vision-128K-Instruct یک مدل چندوجهی پیشرفته و سبک است که بر اساس مجموعه داده‌هایی شامل داده‌های مصنوعی و وب‌سایت‌های عمومی فیلتر شده ساخته شده است. این مدل بر داده‌های بسیار باکیفیت و متمرکز بر استدلال، که شامل متن و تصویر هستند، تمرکز دارد. این مدل بخشی از سری مدل‌های Phi-3 است و نسخه چندوجهی آن از طول زمینه 128K (بر حسب توکن) پشتیبانی می‌کند. این مدل از یک فرآیند تقویت دقیق عبور کرده است که ترکیبی از تنظیم دقیق تحت نظارت و بهینه‌سازی مستقیم ترجیحات را شامل می‌شود تا از پیروی دقیق از دستورات و اقدامات امنیتی قوی اطمینان حاصل شود."
},
"accounts/fireworks/models/qwen-qwq-32b-preview": {
"description": "مدل QwQ یک مدل تحقیقاتی تجربی است که توسط تیم Qwen توسعه یافته و بر تقویت توانایی استدلال AI تمرکز دارد."
},
"accounts/fireworks/models/qwen2-vl-72b-instruct": {
"description": "نسخه 72B مدل Qwen-VL نتیجه جدیدترین به‌روزرسانی‌های علی‌بابا است که نمایانگر نوآوری‌های نزدیک به یک سال اخیر است."
},
"accounts/fireworks/models/qwen2p5-72b-instruct": {
"description": "Qwen2.5 مجموعه‌ای از مدل‌های زبانی است که تنها شامل رمزگشاها می‌باشد و توسط تیم Qwen علی‌بابا کلود توسعه یافته است. این مدل‌ها در اندازه‌های مختلف از جمله 0.5B، 1.5B، 3B، 7B، 14B، 32B و 72B ارائه می‌شوند و دارای دو نوع پایه (base) و دستوری (instruct) هستند."
},
"accounts/fireworks/models/qwen2p5-coder-32b-instruct": {
"description": "Qwen2.5 Coder 32B Instruct جدیدترین نسخه از سری مدل‌های زبانی بزرگ خاص کد است که توسط Alibaba Cloud منتشر شده است. این مدل بر اساس Qwen2.5 و با آموزش 5.5 تریلیون توکن، توانایی تولید کد، استدلال و اصلاح را به طور قابل توجهی افزایش داده است. این مدل نه تنها توانایی کدنویسی را تقویت کرده بلکه مزایای ریاضی و عمومی را نیز حفظ کرده است. این مدل پایه‌ای جامع‌تر برای کاربردهای عملی مانند عامل‌های کد فراهم می‌کند."
},
"accounts/yi-01-ai/models/yi-large": {
"description": "مدل Yi-Large، با توانایی برجسته در پردازش چندزبانه، مناسب برای انواع وظایف تولید و درک زبان."
},
"ai21-jamba-1.5-large": {
"description": "یک مدل چندزبانه با 398 میلیارد پارامتر (94 میلیارد فعال) که پنجره متنی طولانی 256 هزار توکن، فراخوانی توابع، خروجی ساختاریافته و تولید مبتنی بر واقعیت را ارائه می‌دهد."
},
"ai21-jamba-1.5-mini": {
"description": "یک مدل چندزبانه با 52 میلیارد پارامتر (12 میلیارد فعال) که پنجره متنی طولانی 256K، فراخوانی توابع، خروجی ساختاریافته و تولید مبتنی بر واقعیت را ارائه می‌دهد."
},
"ai21-labs/AI21-Jamba-1.5-Large": {
"description": "یک مدل چندزبانه با ۳۹۸ میلیارد پارامتر (۹۴ میلیارد فعال) که پنجره زمینه ۲۵۶ هزار توکنی، فراخوانی توابع، خروجی ساختاریافته و تولید مبتنی بر واقعیت را ارائه می‌دهد."
},
"ai21-labs/AI21-Jamba-1.5-Mini": {
"description": "یک مدل چندزبانه با ۵۲ میلیارد پارامتر (۱۲ میلیارد فعال) که پنجره زمینه ۲۵۶ هزار توکنی، فراخوانی توابع، خروجی ساختاریافته و تولید مبتنی بر واقعیت را ارائه می‌دهد."
},
"alibaba/qwen-3-14b": {
"description": "Qwen3 جدیدترین نسل از مدل‌های زبان بزرگ در سری Qwen است که مجموعه‌ای جامع از مدل‌های متراکم و متخصص ترکیبی (MoE) را ارائه می‌دهد. بر اساس آموزش گسترده ساخته شده، Qwen3 پیشرفت‌های چشمگیری در استدلال، پیروی از دستورالعمل‌ها، توانایی‌های نمایندگی و پشتیبانی چندزبانه ارائه می‌دهد."
},
"alibaba/qwen-3-235b": {
"description": "Qwen3 جدیدترین نسل از مدل‌های زبان بزرگ در سری Qwen است که مجموعه‌ای جامع از مدل‌های متراکم و متخصص ترکیبی (MoE) را ارائه می‌دهد. بر اساس آموزش گسترده ساخته شده، Qwen3 پیشرفت‌های چشمگیری در استدلال، پیروی از دستورالعمل‌ها، توانایی‌های نمایندگی و پشتیبانی چندزبانه ارائه می‌دهد."
},
"alibaba/qwen-3-30b": {
"description": "Qwen3 جدیدترین نسل از مدل‌های زبان بزرگ در سری Qwen است که مجموعه‌ای جامع از مدل‌های متراکم و متخصص ترکیبی (MoE) را ارائه می‌دهد. بر اساس آموزش گسترده ساخته شده، Qwen3 پیشرفت‌های چشمگیری در استدلال، پیروی از دستورالعمل‌ها، توانایی‌های نمایندگی و پشتیبانی چندزبانه ارائه می‌دهد."
},
"alibaba/qwen-3-32b": {
"description": "Qwen3 جدیدترین نسل از مدل‌های زبان بزرگ در سری Qwen است که مجموعه‌ای جامع از مدل‌های متراکم و متخصص ترکیبی (MoE) را ارائه می‌دهد. بر اساس آموزش گسترده ساخته شده، Qwen3 پیشرفت‌های چشمگیری در استدلال، پیروی از دستورالعمل‌ها، توانایی‌های نمایندگی و پشتیبانی چندزبانه ارائه می‌دهد."
},
"alibaba/qwen3-coder": {
"description": "Qwen3-Coder-480B-A35B-Instruct مدل کدگذاری با بالاترین توان نمایندگی در Qwen است که در کدنویسی نمایندگی، استفاده از مرورگر نمایندگی و سایر وظایف پایه کدنویسی عملکرد قابل توجهی دارد و نتایجی معادل Claude Sonnet ارائه می‌دهد."
},
"amazon/nova-lite": {
"description": "یک مدل چندرسانه‌ای بسیار کم‌هزینه که سرعت بسیار بالایی در پردازش ورودی‌های تصویر، ویدئو و متن دارد."
},
"amazon/nova-micro": {
"description": "یک مدل فقط متنی که با هزینه بسیار پایین پاسخ‌هایی با کمترین تأخیر ارائه می‌دهد."
},
"amazon/nova-pro": {
"description": "یک مدل چندرسانه‌ای بسیار توانمند با ترکیب بهینه دقت، سرعت و هزینه که برای طیف گسترده‌ای از وظایف مناسب است."
},
"amazon/titan-embed-text-v2": {
"description": "Amazon Titan Text Embeddings V2 یک مدل جاسازی چندزبانه سبک و کارآمد است که از ابعاد 1024، 512 و 256 پشتیبانی می‌کند."
},
"anthropic.claude-3-5-sonnet-20240620-v1:0": {
"description": "Claude 3.5 Sonnet استانداردهای صنعت را ارتقا داده است، عملکردی بهتر از مدل‌های رقیب و Claude 3 Opus دارد، در ارزیابی‌های گسترده به خوبی عمل کرده و در عین حال سرعت و هزینه مدل‌های سطح متوسط ما را حفظ می‌کند."
},
"anthropic.claude-3-5-sonnet-20241022-v2:0": {
"description": "Claude 3.5 Sonnet استانداردهای صنعت را ارتقا داده است، عملکردی بهتر از مدل‌های رقیب و Claude 3 Opus دارد، در ارزیابی‌های گسترده به خوبی عمل کرده و در عین حال سرعت و هزینه مدل‌های سطح متوسط ما را حفظ می‌کند."
},
"anthropic.claude-3-haiku-20240307-v1:0": {
"description": "Claude 3 Haiku سریع‌ترین و فشرده‌ترین مدل Anthropic است که پاسخ‌های تقریباً فوری ارائه می‌دهد. این مدل می‌تواند به سرعت به پرسش‌ها و درخواست‌های ساده پاسخ دهد. مشتریان قادر خواهند بود تجربه‌های هوش مصنوعی یکپارچه‌ای را که تعاملات انسانی را تقلید می‌کند، ایجاد کنند. Claude 3 Haiku می‌تواند تصاویر را پردازش کرده و خروجی متنی ارائه دهد و دارای پنجره متنی 200K است."
},
"anthropic.claude-3-opus-20240229-v1:0": {
"description": "Claude 3 Opus قدرتمندترین مدل هوش مصنوعی Anthropic است که عملکرد پیشرفته‌ای در وظایف بسیار پیچیده دارد. این مدل می‌تواند با درخواست‌های باز و سناریوهای ناآشنا کار کند و دارای روانی و درک شبه‌انسانی برجسته‌ای است. Claude 3 Opus مرزهای جدیدی از امکانات هوش مصنوعی مولد را به نمایش می‌گذارد. Claude 3 Opus می‌تواند تصاویر را پردازش کرده و خروجی متنی ارائه دهد و دارای پنجره متنی 200K است."
},
"anthropic.claude-3-sonnet-20240229-v1:0": {
"description": "Claude 3 Sonnet از Anthropic به تعادلی ایده‌آل بین هوش و سرعت دست یافته است—به‌ویژه برای بارهای کاری سازمانی مناسب است. این مدل با قیمتی کمتر از رقبا، بیشترین بهره‌وری را ارائه می‌دهد و به‌عنوان یک ماشین اصلی قابل اعتماد و با دوام بالا طراحی شده است که برای استقرارهای مقیاس‌پذیر AI مناسب است. Claude 3 Sonnet می‌تواند تصاویر را پردازش کرده و خروجی متنی ارائه دهد و دارای پنجره متنی 200K است."
},
"anthropic.claude-instant-v1": {
"description": "مدلی سریع، اقتصادی و همچنان بسیار توانمند که می‌تواند طیف وسیعی از وظایف از جمله مکالمات روزمره، تحلیل متن، خلاصه‌سازی و پاسخ به سوالات اسناد را انجام دهد."
},
"anthropic.claude-v2": {
"description": "Anthropic مدلی است که در انجام وظایف گسترده‌ای از مکالمات پیچیده و تولید محتوای خلاقانه تا پیروی دقیق از دستورات، توانایی بالایی از خود نشان می‌دهد."
},
"anthropic.claude-v2:1": {
"description": "نسخه به‌روزرسانی شده Claude 2، با دو برابر پنجره متنی و بهبود در قابلیت اطمینان، کاهش توهمات و دقت مبتنی بر شواهد در اسناد طولانی و زمینه‌های RAG."
},
"anthropic/claude-3-haiku": {
"description": "Claude 3 Haiku سریع‌ترین مدل Anthropic تا به امروز است که برای بارهای کاری شرکتی که معمولاً شامل ورودی‌های طولانی است طراحی شده است. Haiku می‌تواند حجم زیادی از اسناد مانند گزارش‌های فصلی، قراردادها یا پرونده‌های حقوقی را به سرعت تحلیل کند و هزینه آن نصف مدل‌های هم‌رده خود است."
},
"anthropic/claude-3-opus": {
"description": "Claude 3 Opus هوشمندترین مدل Anthropic است که در وظایف بسیار پیچیده عملکرد پیشرو در بازار دارد. این مدل می‌تواند با روانی و درک انسانی برجسته، ورودی‌های باز و سناریوهای ناآشنا را مدیریت کند."
},
"anthropic/claude-3.5-haiku": {
"description": "Claude 3.5 Haiku دارای قابلیت‌های پیشرفته در سرعت، دقت کدنویسی و استفاده از ابزارها است. مناسب برای سناریوهایی با نیاز بالا به سرعت و تعامل با ابزارها."
},
"anthropic/claude-3.5-sonnet": {
"description": "Claude 3.5 Sonnet یک مدل سریع و کارآمد از خانواده Sonnet است که عملکرد بهتری در کدنویسی و استدلال ارائه می‌دهد. برخی نسخه‌ها به تدریج با Sonnet 3.7 و مدل‌های مشابه جایگزین خواهند شد."
},
"anthropic/claude-3.7-sonnet": {
"description": "Claude 3.7 Sonnet نسخه ارتقاءیافته‌ای از سری Sonnet است که توانایی‌های استدلال و کدنویسی قوی‌تری دارد و برای وظایف پیچیده در سطح سازمانی مناسب است."
},
"anthropic/claude-haiku-4.5": {
"description": "Claude Haiku 4.5 یک مدل سریع و با عملکرد بالا از Anthropic است که با حفظ دقت بالا، تأخیر بسیار کمی دارد."
},
"anthropic/claude-opus-4": {
"description": "Opus 4 مدل پرچم‌دار Anthropic است که برای وظایف پیچیده و کاربردهای سازمانی طراحی شده است."
},
"anthropic/claude-opus-4.1": {
"description": "Opus 4.1 یک مدل پیشرفته از Anthropic است که برای برنامه‌نویسی، استدلال پیچیده و وظایف مداوم بهینه‌سازی شده است."
},
"anthropic/claude-opus-4.5": {
"description": "Claude Opus 4.5 مدل پرچم‌دار شرکت Anthropic است که هوش برجسته را با عملکرد مقیاس‌پذیر ترکیب می‌کند و برای انجام وظایف پیچیده‌ای که نیازمند پاسخ‌های با بالاترین کیفیت و توانایی استدلال هستند، مناسب است."
},
"anthropic/claude-sonnet-4": {
"description": "Claude Sonnet 4 نسخه‌ای با قابلیت استدلال ترکیبی از Anthropic است که توانایی‌های فکری و غیر فکری را با هم ترکیب می‌کند."
},
"anthropic/claude-sonnet-4.5": {
"description": "Claude Sonnet 4.5 جدیدترین مدل استدلال ترکیبی از Anthropic است که برای استدلال پیچیده و کدنویسی بهینه شده است."
},
"ascend-tribe/pangu-pro-moe": {
"description": "Pangu-Pro-MoE 72B-A16B یک مدل زبان بزرگ پراکنده با 72 میلیارد پارامتر و 16 میلیارد پارامتر فعال است که بر اساس معماری متخصصان ترکیبی گروه‌بندی شده (MoGE) ساخته شده است. در مرحله انتخاب متخصص، متخصصان به گروه‌هایی تقسیم می‌شوند و توکن‌ها در هر گروه به تعداد مساوی متخصصان فعال می‌شوند تا تعادل بار متخصصان حفظ شود، که به طور قابل توجهی کارایی استقرار مدل را در پلتفرم Ascend افزایش می‌دهد."
},
"aya": {
"description": "Aya 23 یک مدل چندزبانه است که توسط Cohere ارائه شده و از 23 زبان پشتیبانی می‌کند و برای برنامه‌های چندزبانه تسهیلات فراهم می‌آورد."
},
"aya:35b": {
"description": "Aya 23 یک مدل چندزبانه است که توسط Cohere ارائه شده و از 23 زبان پشتیبانی می‌کند و استفاده از برنامه‌های چندزبانه را تسهیل می‌نماید."
},
"azure-DeepSeek-R1-0528": {
"description": "ارائه شده توسط مایکروسافت؛ مدل DeepSeek R1 به‌روزرسانی‌های جزئی دریافت کرده است و نسخه فعلی آن DeepSeek-R1-0528 می‌باشد. در آخرین به‌روزرسانی، DeepSeek R1 با افزایش منابع محاسباتی و معرفی مکانیزم بهینه‌سازی الگوریتم در مرحله پس‌آموزش، عمق استنتاج و توانایی پیش‌بینی را به طور قابل توجهی بهبود بخشیده است. این مدل در آزمون‌های معیار مختلفی مانند ریاضیات، برنامه‌نویسی و منطق عمومی عملکرد برجسته‌ای دارد و عملکرد کلی آن به مدل‌های پیشرو مانند O3 و Gemini 2.5 Pro نزدیک شده است."
},
"baichuan-m2-32b": {
"description": "Baichuan M2 32B یک مدل متخصص ترکیبی است که توسط Baichuan Intelligence ارائه شده و دارای توانایی استدلالی قدرتمندی می‌باشد."
},
"baichuan/baichuan2-13b-chat": {
"description": "Baichuan-13B یک مدل زبان بزرگ متن باز و قابل تجاری با 130 میلیارد پارامتر است که در آزمون‌های معتبر چینی و انگلیسی بهترین عملکرد را در اندازه مشابه به دست آورده است."
},
"baidu/ERNIE-4.5-300B-A47B": {
"description": "ERNIE-4.5-300B-A47B یک مدل زبان بزرگ مبتنی بر معماری متخصصان ترکیبی (MoE) است که توسط شرکت بایدو توسعه یافته است. این مدل دارای 300 میلیارد پارامتر کل است، اما در زمان استنتاج تنها 47 میلیارد پارامتر برای هر توکن فعال می‌شود، که ضمن حفظ عملکرد قدرتمند، کارایی محاسباتی را نیز تضمین می‌کند. به عنوان یکی از مدل‌های اصلی سری ERNIE 4.5، این مدل در وظایف درک متن، تولید، استدلال و برنامه‌نویسی عملکرد برجسته‌ای دارد. این مدل از یک روش پیش‌آموزش نوآورانه چندرسانه‌ای ناهمگن MoE استفاده می‌کند که با آموزش مشترک متن و مدیا تصویری، توانایی کلی مدل را بهبود می‌بخشد، به‌ویژه در زمینه پیروی از دستورالعمل‌ها و حافظه دانش جهانی."
},
"baidu/ernie-5.0-thinking-preview": {
"description": "پیش‌نمایش ERNIE 5.0 Thinking مدل چندوجهی نسل جدید Baidu است که در درک چندوجهی، پیروی از دستورات، تولید محتوا، پرسش و پاسخ واقعی و استفاده از ابزارها تخصص دارد."
},
"c4ai-aya-expanse-32b": {
"description": "Aya Expanse یک مدل چندزبانه با عملکرد بالا و 32B است که با هدف به چالش کشیدن عملکرد مدل‌های تک‌زبانه از طریق بهینه‌سازی دستور، آربیتراژ داده‌ها، آموزش ترجیحات و نوآوری در ادغام مدل‌ها طراحی شده است. این مدل از 23 زبان پشتیبانی می‌کند."
},
"c4ai-aya-expanse-8b": {
"description": "Aya Expanse یک مدل چندزبانه با عملکرد بالا و 8B است که با هدف به چالش کشیدن عملکرد مدل‌های تک‌زبانه از طریق بهینه‌سازی دستور، آربیتراژ داده‌ها، آموزش ترجیحات و نوآوری در ادغام مدل‌ها طراحی شده است. این مدل از 23 زبان پشتیبانی می‌کند."
},
"c4ai-aya-vision-32b": {
"description": "Aya Vision یک مدل چندرسانه‌ای پیشرفته است که در چندین معیار کلیدی در زمینه زبان، متن و تصویر عملکرد فوق‌العاده‌ای دارد. این نسخه با 320 میلیارد پارامتر بر روی عملکرد چندزبانه پیشرفته تمرکز دارد."
},
"c4ai-aya-vision-8b": {
"description": "Aya Vision یک مدل چندرسانه‌ای پیشرفته است که در چندین معیار کلیدی در زمینه زبان، متن و تصویر عملکرد فوق‌العاده‌ای دارد. این نسخه با 80 میلیارد پارامتر بر روی تأخیر کم و بهترین عملکرد تمرکز دارد."
},
"charglm-3": {
"description": "CharGLM-3 به‌طور ویژه برای نقش‌آفرینی و همراهی عاطفی طراحی شده است، از حافظه طولانی‌مدت و مکالمات شخصی‌سازی‌شده پشتیبانی می‌کند و کاربردهای گسترده‌ای دارد."
},
"charglm-4": {
"description": "CharGLM-4 به‌طور خاص برای نقش‌آفرینی و همراهی عاطفی طراحی شده است و از حافظه چند دور طولانی و گفتگوی شخصی‌سازی شده پشتیبانی می‌کند و کاربردهای گسترده‌ای دارد."
},
"chatgpt-4o-latest": {
"description": "ChatGPT-4o یک مدل پویا است که به‌صورت زنده به‌روزرسانی می‌شود تا همیشه نسخه‌ی جدید و به‌روز باشد. این مدل ترکیبی از توانایی‌های قوی در درک و تولید زبان است و برای کاربردهای گسترده مانند خدمات مشتری، آموزش و پشتیبانی فنی مناسب است."
},
"claude-2.0": {
"description": "Claude 2 پیشرفت‌های کلیدی را برای کسب‌وکارها ارائه می‌دهد، از جمله زمینه 200K توکن پیشرو در صنعت، کاهش قابل توجه نرخ خطاهای مدل، اعلان‌های سیستمی و یک ویژگی جدید آزمایشی: فراخوانی ابزار."
},
"claude-2.1": {
"description": "Claude 2 پیشرفت‌های کلیدی را برای کسب‌وکارها فراهم می‌کند، از جمله زمینه 200K توکن پیشرو در صنعت، کاهش قابل توجه در نرخ توهم مدل، اعلان‌های سیستمی و یک ویژگی آزمایشی جدید: فراخوانی ابزار."
},
"claude-3-5-haiku-20241022": {
"description": "Claude 3.5 Haiku سریع‌ترین مدل نسل بعدی Anthropic است. در مقایسه با Claude 3 Haiku، Claude 3.5 Haiku در تمام مهارت‌ها بهبود یافته و در بسیاری از آزمون‌های استاندارد هوش، از بزرگ‌ترین مدل نسل قبلی یعنی Claude 3 Opus پیشی گرفته است."
},
"claude-3-5-haiku-latest": {
"description": "Claude 3.5 Haiku پاسخ‌های سریع ارائه می‌دهد و برای وظایف سبک مناسب است."
},
"claude-3-7-sonnet-20250219": {
"description": "Claude 3.7 Sonnet توانایی‌هایی فراتر از Opus ارائه می‌دهد و سرعتی سریع‌تر از Sonnet دارد، در حالی که قیمت آن با Sonnet یکسان است. Sonnet به‌ویژه در برنامه‌نویسی، علم داده، پردازش بصری و وظایف نمایندگی مهارت دارد."
},
"claude-3-7-sonnet-latest": {
"description": "Claude 3.7 Sonnet جدیدترین و قدرتمندترین مدل Anthropic برای پردازش وظایف بسیار پیچیده است. این مدل در عملکرد، هوش، روانی و درک برتری دارد."
},
"claude-3-haiku-20240307": {
"description": "Claude 3 Haiku سریع‌ترین و فشرده‌ترین مدل Anthropic است که برای ارائه پاسخ‌های تقریباً فوری طراحی شده است. این مدل دارای عملکرد سریع و دقیق جهت‌گیری است."
},
"claude-3-opus-20240229": {
"description": "Claude 3 Opus قدرتمندترین مدل Anthropic برای انجام وظایف بسیار پیچیده است. این مدل در عملکرد، هوش، روانی و درک عالی عمل می‌کند."
},
"claude-3-sonnet-20240229": {
"description": "Claude 3 Sonnet تعادلی ایده‌آل بین هوش و سرعت برای بارهای کاری سازمانی فراهم می‌کند. این محصول با قیمتی پایین‌تر حداکثر بهره‌وری را ارائه می‌دهد، قابل اعتماد است و برای استقرار در مقیاس بزرگ مناسب می‌باشد."
},
"claude-haiku-4-5-20251001": {
"description": "Claude Haiku 4.5 سریع‌ترین و هوشمندترین مدل Haiku از Anthropic است که با سرعتی برق‌آسا و توانایی تفکر گسترش‌یافته ارائه می‌شود."
},
"claude-opus-4-1-20250805": {
"description": "Claude Opus 4.1 جدیدترین و قدرتمندترین مدل Anthropic برای انجام وظایف بسیار پیچیده است. این مدل در عملکرد، هوشمندی، روانی و درک توانایی برجسته‌ای دارد."
},
"claude-opus-4-1-20250805-thinking": {
"description": "مدل تفکر Claude Opus 4.1 نسخه پیشرفته‌ای است که می‌تواند فرآیند استدلال خود را نمایش دهد."
},
"claude-opus-4-20250514": {
"description": "Claude Opus 4 قدرتمندترین مدل Anthropic برای پردازش وظایف بسیار پیچیده است. این مدل در زمینه‌های عملکرد، هوش، روانی و درک فوق‌العاده عمل می‌کند."
},
"claude-opus-4-5-20251101": {
"description": "Claude Opus 4.5 مدل پرچم‌دار شرکت Anthropic است که هوش برجسته را با عملکرد مقیاس‌پذیر ترکیب می‌کند و برای انجام وظایف پیچیده‌ای که نیازمند پاسخ‌های با بالاترین کیفیت و توانایی استدلال هستند، مناسب است."
},
"claude-sonnet-4-20250514": {
"description": "Claude Sonnet 4 می‌تواند پاسخ‌های تقریباً فوری یا تفکر گام به گام طولانی‌مدت تولید کند که کاربران می‌توانند این فرآیندها را به وضوح مشاهده کنند."
},
"claude-sonnet-4-20250514-thinking": {
"description": "مدل تفکر Claude Sonnet 4 می‌تواند پاسخ‌های تقریباً فوری یا تفکر گام به گام طولانی‌مدت تولید کند که کاربران می‌توانند این فرآیندها را به وضوح مشاهده کنند."
},
"claude-sonnet-4-5-20250929": {
"description": "کلود سونت ۴.۵ هوشمندترین مدل تا به امروز شرکت Anthropic است."
},
"codegeex-4": {
"description": "CodeGeeX-4 یک دستیار برنامه‌نویسی قدرتمند مبتنی بر هوش مصنوعی است که از پرسش و پاسخ هوشمند و تکمیل کد در زبان‌های برنامه‌نویسی مختلف پشتیبانی می‌کند و بهره‌وری توسعه را افزایش می‌دهد."
},
"codegeex4-all-9b": {
"description": "CodeGeeX4-ALL-9B یک مدل تولید کد چندزبانگی است که از قابلیت‌های جامع شامل تکمیل و تولید کد، مفسر کد، جستجوی وب، تماس با توابع و پرسش و پاسخ کد در سطح مخزن پشتیبانی می‌کند و تمام سناریوهای توسعه نرم‌افزار را پوشش می‌دهد. این مدل یکی از بهترین مدل‌های تولید کد با پارامترهای کمتر از 10B است."
},
"codegemma": {
"description": "CodeGemma یک مدل زبانی سبک برای وظایف مختلف برنامه‌نویسی است که از تکرار سریع و یکپارچه‌سازی پشتیبانی می‌کند."
},
"codegemma:2b": {
"description": "CodeGemma یک مدل زبان سبک برای وظایف مختلف برنامه‌نویسی است که از تکرار سریع و یکپارچه‌سازی پشتیبانی می‌کند."
},
"codellama": {
"description": "Code Llama یک مدل زبانی بزرگ (LLM) است که بر تولید و بحث در مورد کد تمرکز دارد و از زبان‌های برنامه‌نویسی گسترده‌ای پشتیبانی می‌کند و برای محیط‌های توسعه‌دهندگان مناسب است."
},
"codellama/CodeLlama-34b-Instruct-hf": {
"description": "Code Llama یک LLM است که بر تولید و بحث کد تمرکز دارد و از پشتیبانی گسترده زبان‌های برنامه‌نویسی برخوردار است و برای محیط‌های توسعه‌دهنده مناسب است."
},
"codellama:13b": {
"description": "Code Llama یک مدل زبانی بزرگ (LLM) است که بر تولید و بحث در مورد کد تمرکز دارد و از زبان‌های برنامه‌نویسی گسترده‌ای پشتیبانی می‌کند و برای محیط‌های توسعه‌دهندگان مناسب است."
},
"codellama:34b": {
"description": "Code Llama یک مدل زبانی بزرگ (LLM) است که بر تولید و بحث در مورد کد تمرکز دارد و از زبان‌های برنامه‌نویسی گسترده‌ای پشتیبانی می‌کند و برای محیط‌های توسعه‌دهندگان مناسب است."
},
"codellama:70b": {
"description": "Code Llama یک مدل زبانی بزرگ (LLM) است که بر تولید و بحث در مورد کد تمرکز دارد و با پشتیبانی گسترده از زبان‌های برنامه‌نویسی، برای محیط‌های توسعه‌دهندگان مناسب است."
},
"codeqwen": {
"description": "CodeQwen1.5 یک مدل زبان بزرگ است که بر اساس حجم زیادی از داده‌های کد آموزش دیده و به‌طور خاص برای حل وظایف پیچیده برنامه‌نویسی طراحی شده است."
},
"codestral": {
"description": "Codestral اولین مدل کد از Mistral AI است که پشتیبانی عالی برای وظایف تولید کد ارائه می‌دهد."
},
"codestral-latest": {
"description": "Codestral یک مدل پیشرفته تولید کد است که بر تولید کد تمرکز دارد و برای وظایف تکمیل کد و پر کردن میان‌متن بهینه‌سازی شده است."
},
"codex-mini-latest": {
"description": "codex-mini-latest نسخه‌ای تنظیم‌شده از o4-mini است که به‌طور خاص برای Codex CLI طراحی شده است. برای استفاده مستقیم از طریق API، ما توصیه می‌کنیم از gpt-4.1 شروع کنید."
},
"cogito-2.1:671b": {
"description": "Cogito v2.1 671B یک مدل زبان بزرگ متن‌باز آمریکایی با قابلیت استفاده تجاری رایگان است که با عملکردی در سطح مدل‌های برتر، بازدهی بالای استدلال توکن، پشتیبانی از 128k زمینه طولانی و توانایی‌های جامع قوی شناخته می‌شود."
},
"cogview-4": {
"description": "CogView-4 نخستین مدل متن به تصویر متن‌باز Zhizhu است که از تولید حروف چینی پشتیبانی می‌کند. این مدل در درک معنایی، کیفیت تولید تصویر و توانایی تولید متون چینی و انگلیسی به طور جامع بهبود یافته است، از ورودی دوزبانه چینی و انگلیسی با طول دلخواه پشتیبانی می‌کند و قادر است تصاویر با هر وضوحی در محدوده داده شده تولید کند."
},
"cohere-command-r": {
"description": "Command R یک مدل تولیدی قابل گسترش است که برای RAG و استفاده از ابزارها طراحی شده است و به شرکت‌ها امکان می‌دهد تا به هوش مصنوعی در سطح تولید دست یابند."
},
"cohere-command-r-plus": {
"description": "Command R+ یک مدل پیشرفته بهینه‌سازی RAG است که برای مدیریت بارهای کاری در سطح سازمانی طراحی شده است."
},
"cohere/Cohere-command-r": {
"description": "Command R یک مدل تولیدی مقیاس‌پذیر است که برای استفاده در RAG و ابزارها طراحی شده است تا به کسب‌وکارها امکان پیاده‌سازی هوش مصنوعی در سطح تولید را بدهد."
},
"cohere/Cohere-command-r-plus": {
"description": "Command R+ یک مدل بهینه‌سازی شده پیشرفته برای RAG است که برای بارهای کاری سازمانی طراحی شده است."
},
"cohere/command-a": {
"description": "Command A قوی‌ترین مدل Cohere تا به امروز است که در استفاده از ابزارها، نمایندگی، تولید تقویت‌شده با بازیابی (RAG) و موارد چندزبانه عملکرد برجسته‌ای دارد. طول زمینه Command A برابر با 256K است و با تنها دو GPU اجرا می‌شود و نسبت به Command R+ 08-2024، توان عملیاتی 150% افزایش یافته است."
},
"cohere/command-r": {
"description": "Command R یک مدل زبان بزرگ بهینه‌شده برای تعاملات مکالمه‌ای و وظایف با زمینه طولانی است. این مدل در دسته \"قابل مقیاس\" قرار دارد و تعادل بین عملکرد بالا و دقت قوی را برقرار می‌کند تا شرکت‌ها را قادر سازد از مرحله اثبات مفهوم به تولید برسند."
},
"cohere/command-r-plus": {
"description": "Command R+ جدیدترین مدل زبان بزرگ Cohere است که برای تعاملات مکالمه‌ای و وظایف با زمینه طولانی بهینه شده است. هدف آن ارائه عملکرد بسیار برجسته است تا شرکت‌ها بتوانند از مرحله اثبات مفهوم به تولید برسند."
},
"cohere/embed-v4.0": {
"description": "مدلی که امکان دسته‌بندی یا تبدیل متن، تصویر یا محتوای ترکیبی به جاسازی را فراهم می‌کند."
},
"comfyui/flux-dev": {
"description": "FLUX.1 Dev - مدل تولید تصویر از متن با کیفیت بالا، تولید در ۱۰ تا ۵۰ مرحله، مناسب برای خلق آثار هنری و تولید محتوای خلاقانه با کیفیت بالا"
},
"comfyui/flux-kontext-dev": {
"description": "FLUX.1 Kontext-dev - مدل ویرایش تصویر، پشتیبانی از ویرایش تصاویر موجود بر اساس دستورات متنی، شامل ویرایش موضعی و انتقال سبک"
},
"comfyui/flux-krea-dev": {
"description": "FLUX.1 Krea-dev - مدل تولید تصویر از متن با ایمنی تقویت‌شده، توسعه‌یافته با همکاری Krea، دارای فیلترهای ایمنی داخلی"
},
"comfyui/flux-schnell": {
"description": "FLUX.1 Schnell - مدل فوق‌سریع تولید تصویر از متن، تولید تصاویر با کیفیت بالا تنها در ۱ تا ۴ مرحله، مناسب برای کاربردهای بلادرنگ و نمونه‌سازی سریع"
},
"comfyui/stable-diffusion-15": {
"description": "مدل تولید تصویر از متن Stable Diffusion 1.5، با وضوح کلاسیک ۵۱۲x۵۱۲، مناسب برای نمونه‌سازی سریع و آزمایش‌های خلاقانه"
},
"comfyui/stable-diffusion-35": {
"description": "مدل نسل جدید تولید تصویر از متن Stable Diffusion 3.5، در دو نسخه Large و Medium، نیازمند فایل رمزگذار CLIP خارجی، ارائه‌دهنده کیفیت تصویر عالی و تطابق دقیق با دستورات متنی"
},
"comfyui/stable-diffusion-35-inclclip": {
"description": "نسخه Stable Diffusion 3.5 با رمزگذار داخلی CLIP/T5، بدون نیاز به فایل رمزگذار خارجی، مناسب برای مدل‌هایی مانند sd3.5_medium_incl_clips، با مصرف منابع کمتر"
},
"comfyui/stable-diffusion-custom": {
"description": "مدل سفارشی تولید تصویر از متن SD، نام فایل مدل باید custom_sd_lobe.safetensors باشد، در صورت وجود VAE از custom_sd_vae_lobe.safetensors استفاده شود، فایل‌های مدل باید طبق دستورالعمل Comfy در پوشه مناسب قرار گیرند"
},
"comfyui/stable-diffusion-custom-refiner": {
"description": "مدل سفارشی SDXL برای تبدیل تصویر به تصویر، نام فایل مدل باید custom_sd_lobe.safetensors باشد، در صورت وجود VAE از custom_sd_vae_lobe.safetensors استفاده شود، فایل‌های مدل باید طبق دستورالعمل Comfy در پوشه مناسب قرار گیرند"
},
"comfyui/stable-diffusion-refiner": {
"description": "مدل SDXL برای تبدیل تصویر به تصویر، تبدیل تصاویر ورودی به تصاویر با کیفیت بالا، پشتیبانی از انتقال سبک، ترمیم تصویر و تغییرات خلاقانه"
},
"comfyui/stable-diffusion-xl": {
"description": "مدل تولید تصویر از متن SDXL، پشتیبانی از تولید تصویر با وضوح بالا ۱۰۲۴x۱۰۲۴، ارائه کیفیت تصویر بهتر و جزئیات دقیق‌تر"
},
"command": {
"description": "یک مدل گفتگوی پیروی از دستور که در وظایف زبانی کیفیت بالاتر و قابلیت اطمینان بیشتری را ارائه می‌دهد و نسبت به مدل‌های تولید پایه ما دارای طول زمینه بیشتری است."
},
"command-a-03-2025": {
"description": "Command A قوی‌ترین مدل ما تا به امروز است که در استفاده از ابزارها، نمایندگی، تولید تقویت‌شده با جستجو (RAG) و سناریوهای چندزبانه عملکرد فوق‌العاده‌ای دارد. Command A دارای طول زمینه 256K است و تنها به دو واحد GPU نیاز دارد و نسبت به Command R+ 08-2024، توان عملیاتی آن 150% افزایش یافته است."
},
"command-light": {
"description": "یک نسخه کوچک‌تر و سریع‌تر از Command که تقریباً به همان اندازه قوی است اما سریع‌تر عمل می‌کند."
},
"command-light-nightly": {
"description": "برای کاهش فاصله زمانی بین انتشار نسخه‌های اصلی، ما نسخه‌های شبانه مدل Command را معرفی کرده‌ایم. برای سری command-light، این نسخه به نام command-light-nightly شناخته می‌شود. لطفاً توجه داشته باشید که command-light-nightly جدیدترین، آزمایشی‌ترین و (احتمالاً) ناپایدارترین نسخه است. نسخه‌های شبانه به‌طور منظم به‌روزرسانی می‌شوند و بدون اطلاع قبلی منتشر می‌شوند، بنابراین استفاده از آن در محیط‌های تولیدی توصیه نمی‌شود."
},
"command-nightly": {
"description": "برای کاهش فاصله زمانی بین انتشار نسخه‌های اصلی، ما نسخه‌های شبانه مدل Command را معرفی کرده‌ایم. برای سری Command، این نسخه به نام command-cightly شناخته می‌شود. لطفاً توجه داشته باشید که command-nightly جدیدترین، آزمایشی‌ترین و (احتمالاً) ناپایدارترین نسخه است. نسخه‌های شبانه به‌طور منظم به‌روزرسانی می‌شوند و بدون اطلاع قبلی منتشر می‌شوند، بنابراین استفاده از آن در محیط‌های تولیدی توصیه نمی‌شود."
},
"command-r": {
"description": "Command R یک LLM بهینه‌سازی شده برای مکالمات و وظایف با متن طولانی است که به‌ویژه برای تعاملات پویا و مدیریت دانش مناسب است."
},
"command-r-03-2024": {
"description": "Command R یک مدل گفتگوی پیروی از دستور است که در وظایف زبانی کیفیت بالاتری را ارائه می‌دهد و نسبت به مدل‌های قبلی دارای طول زمینه بیشتری است. این مدل می‌تواند در جریان‌های کاری پیچیده مانند تولید کد، تولید تقویت‌شده با جستجو (RAG)، استفاده از ابزارها و نمایندگی استفاده شود."
},
"command-r-08-2024": {
"description": "command-r-08-2024 نسخه به‌روزرسانی شده مدل Command R است که در آگوست 2024 منتشر شد."
},
"command-r-plus": {
"description": "Command R+ یک مدل زبان بزرگ با عملکرد بالا است که برای سناریوهای واقعی کسب‌وکار و کاربردهای پیچیده طراحی شده است."
},
"command-r-plus-04-2024": {
"description": "Command R+ یک مدل گفتگوی پیروی از دستور است که در وظایف زبانی کیفیت بالاتری را ارائه می‌دهد و نسبت به مدل‌های قبلی دارای طول زمینه بیشتری است. این مدل برای جریان‌های کاری پیچیده RAG و استفاده از ابزارهای چند مرحله‌ای مناسب‌ترین است."
},
"command-r-plus-08-2024": {
"description": "Command R+ یک مدل گفتگوی پیرو دستورات است که در وظایف زبانی کیفیت بالاتری را ارائه می‌دهد و نسبت به مدل‌های قبلی دارای طول متن زمینه‌ای بیشتری است. این مدل برای جریان‌های کاری پیچیده RAG و استفاده از ابزارهای چند مرحله‌ای مناسب‌ترین است."
},
"command-r7b-12-2024": {
"description": "command-r7b-12-2024 یک نسخه کوچک و کارآمد به‌روزرسانی شده است که در دسامبر 2024 منتشر شد. این مدل در RAG، استفاده از ابزارها، نمایندگی و سایر وظایفی که نیاز به استدلال پیچیده و پردازش چند مرحله‌ای دارند، عملکرد فوق‌العاده‌ای دارد."
},
"computer-use-preview": {
"description": "مدل computer-use-preview به‌طور اختصاصی برای «ابزارهای استفاده از کامپیوتر» طراحی شده و آموزش دیده است تا وظایف مرتبط با کامپیوتر را درک و اجرا کند."
},
"dall-e-2": {
"description": "مدل نسل دوم DALL·E، پشتیبانی از تولید تصاویر واقعی‌تر و دقیق‌تر، با وضوح 4 برابر نسل اول."
},
"dall-e-3": {
"description": "جدیدترین مدل DALL·E، منتشر شده در نوامبر 2023. پشتیبانی از تولید تصاویر واقعی‌تر و دقیق‌تر، با جزئیات بیشتر."
},
"databricks/dbrx-instruct": {
"description": "DBRX Instruct قابلیت پردازش دستورات با قابلیت اطمینان بالا را فراهم می‌کند و از کاربردهای چندین صنعت پشتیبانی می‌کند."
},
"deepseek-ai/DeepSeek-OCR": {
"description": "DeepSeek-OCR یک مدل زبان تصویری از شرکت DeepSeek AI است که بر شناسایی نویسه نوری (OCR) و «فشرده‌سازی نوری متنی» تمرکز دارد. این مدل با هدف بررسی مرزهای فشرده‌سازی اطلاعات متنی از تصاویر طراحی شده و می‌تواند اسناد را به‌طور مؤثر پردازش کرده و آن‌ها را به قالب‌های متنی ساختاریافته مانند Markdown تبدیل کند. این مدل توانایی شناسایی دقیق محتوای متنی در تصاویر را دارد و برای کاربردهایی مانند دیجیتالی‌سازی اسناد، استخراج متن و پردازش ساختاریافته بسیار مناسب است."
},
"deepseek-ai/DeepSeek-R1": {
"description": "DeepSeek-R1 یک مدل استنتاجی مبتنی بر یادگیری تقویتی (RL) است که به مشکلات تکرار و خوانایی در مدل پرداخته است. قبل از RL، DeepSeek-R1 داده‌های شروع سرد را معرفی کرد و عملکرد استنتاج را بهینه‌تر کرد. این مدل در وظایف ریاضی، کدنویسی و استنتاج با OpenAI-o1 عملکرد مشابهی دارد و با استفاده از روش‌های آموزشی به دقت طراحی شده، کیفیت کلی را بهبود بخشیده است."
},
"deepseek-ai/DeepSeek-R1-0528": {
"description": "DeepSeek R1 با بهره‌گیری از منابع محاسباتی افزوده و مکانیزم‌های بهینه‌سازی الگوریتمی در فرایند پس‌آموزش، عمق توانایی استدلال و استنتاج خود را به طور قابل توجهی افزایش داده است. این مدل در ارزیابی‌های معیار مختلف از جمله ریاضیات، برنامه‌نویسی و منطق عمومی عملکرد برجسته‌ای دارد. عملکرد کلی آن اکنون به مدل‌های پیشرو مانند O3 و Gemini 2.5 Pro نزدیک شده است."
},
"deepseek-ai/DeepSeek-R1-0528-Qwen3-8B": {
"description": "DeepSeek-R1-0528-Qwen3-8B مدلی است که از تقطیر زنجیره فکری مدل DeepSeek-R1-0528 به Qwen3 8B Base به دست آمده است. این مدل در میان مدل‌های متن‌باز به عملکرد پیشرفته (SOTA) دست یافته و در آزمون AIME 2024، 10٪ بهتر از Qwen3 8B عمل کرده و به سطح عملکرد Qwen3-235B-thinking رسیده است. این مدل در استدلال ریاضی، برنامه‌نویسی و منطق عمومی در چندین آزمون معیار عملکرد برجسته‌ای دارد. ساختار آن مشابه Qwen3-8B است اما از پیکربندی توکنایزر DeepSeek-R1-0528 بهره می‌برد."
},
"deepseek-ai/DeepSeek-R1-Distill-Llama-70B": {
"description": "مدل تقطیر DeepSeek-R1 که با استفاده از یادگیری تقویتی و داده‌های شروع سرد عملکرد استدلال را بهینه‌سازی کرده و مدل‌های متن‌باز را به روز کرده است."
},
"deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B": {
"description": "مدل تقطیر DeepSeek-R1 که با استفاده از یادگیری تقویتی و داده‌های شروع سرد عملکرد استدلال را بهینه‌سازی کرده و مدل‌های متن‌باز را به روز کرده است."
},
"deepseek-ai/DeepSeek-R1-Distill-Qwen-14B": {
"description": "مدل تقطیر DeepSeek-R1 که با استفاده از یادگیری تقویتی و داده‌های شروع سرد عملکرد استدلال را بهینه‌سازی کرده و مدل‌های متن‌باز را به روز کرده است."
},
"deepseek-ai/DeepSeek-R1-Distill-Qwen-32B": {
"description": "DeepSeek-R1-Distill-Qwen-32B مدلی است که از تقطیر دانش بر اساس Qwen2.5-32B به دست آمده است. این مدل با استفاده از 800000 نمونه منتخب تولید شده توسط DeepSeek-R1 برای تنظیم دقیق، در زمینه‌های مختلفی از جمله ریاضیات، برنامه‌نویسی و استدلال عملکرد برجسته‌ای را نشان می‌دهد. در چندین آزمون معیار از جمله AIME 2024، MATH-500 و GPQA Diamond نتایج عالی کسب کرده است، به طوری که در MATH-500 به دقت 94.3% دست یافته و توانایی استدلال ریاضی قوی را نشان می‌دهد."
},
"deepseek-ai/DeepSeek-R1-Distill-Qwen-7B": {
"description": "DeepSeek-R1-Distill-Qwen-7B مدلی است که از تقطیر دانش بر اساس Qwen2.5-Math-7B به دست آمده است. این مدل با استفاده از 800000 نمونه منتخب تولید شده توسط DeepSeek-R1 برای تنظیم دقیق، توانایی استدلال عالی را نشان می‌دهد. در چندین آزمون معیار عملکرد برجسته‌ای داشته است، به طوری که در MATH-500 به دقت 92.8% و در AIME 2024 به نرخ قبولی 55.5% دست یافته و در CodeForces امتیاز 1189 را کسب کرده است و به عنوان مدلی با مقیاس 7B توانایی‌های ریاضی و برنامه‌نویسی قوی را نشان می‌دهد."
},
"deepseek-ai/DeepSeek-V2.5": {
"description": "DeepSeek V2.5 ویژگی‌های برجسته نسخه‌های قبلی را گرد هم آورده و توانایی‌های عمومی و کدنویسی را تقویت کرده است."
},
"deepseek-ai/DeepSeek-V3": {
"description": "DeepSeek-V3 یک مدل زبانی ترکیبی از متخصصان (MoE) با 671 میلیارد پارامتر است که از توجه چندسر (MLA) و معماری DeepSeekMoE استفاده می‌کند و با ترکیب استراتژی تعادل بار بدون ضرر کمکی، کارایی استنتاج و آموزش را بهینه می‌کند. با پیش‌آموزش بر روی 14.8 تریلیون توکن با کیفیت بالا و انجام تنظیم دقیق نظارتی و یادگیری تقویتی، DeepSeek-V3 در عملکرد از سایر مدل‌های متن‌باز پیشی می‌گیرد و به مدل‌های بسته پیشرو نزدیک می‌شود."
},
"deepseek-ai/DeepSeek-V3.1": {
"description": "مدل DeepSeek V3.1 دارای معماری استنتاج ترکیبی است که از هر دو حالت تفکر و غیرتفکر پشتیبانی می‌کند."
},
"deepseek-ai/DeepSeek-V3.1-Terminus": {
"description": "DeepSeek-V3.1-Terminus نسخه به‌روزرسانی شده مدل V3.1 منتشر شده توسط DeepSeek است که به عنوان یک مدل زبان بزرگ با عامل ترکیبی شناخته می‌شود. این به‌روزرسانی ضمن حفظ قابلیت‌های اصلی مدل، بر رفع مشکلات گزارش شده توسط کاربران و افزایش پایداری تمرکز دارد. این نسخه به طور قابل توجهی انسجام زبانی را بهبود بخشیده و از بروز ترکیب زبان چینی و انگلیسی و کاراکترهای نامتعارف کاسته است. مدل شامل حالت «تفکر» (Thinking Mode) و «غیرتفکر» (Non-thinking Mode) است که کاربران می‌توانند از طریق قالب‌های گفتگو به صورت انعطاف‌پذیر بین آن‌ها جابجا شوند تا با وظایف مختلف سازگار شوند. به عنوان یک بهینه‌سازی مهم، V3.1-Terminus عملکرد عامل کد (Code Agent) و عامل جستجو (Search Agent) را تقویت کرده است تا در فراخوانی ابزارها و اجرای وظایف پیچیده چندمرحله‌ای قابل اعتمادتر باشد."
},
"deepseek-ai/DeepSeek-V3.2-Exp": {
"description": "DeepSeek-V3.2-Exp نسخه آزمایشی V3.2 است که توسط DeepSeek منتشر شده و به عنوان گامی میانی در مسیر توسعه معماری نسل بعدی طراحی شده است. این نسخه با افزودن مکانیزم توجه پراکنده DeepSeek (DeepSeek Sparse Attention یا DSA) بر پایه V3.1-Terminus، کارایی آموزش و استنتاج در زمینه‌های متنی طولانی را بهبود می‌بخشد. همچنین به‌طور ویژه برای فراخوانی ابزارها، درک اسناد بلند و استدلال چندمرحله‌ای بهینه‌سازی شده است. V3.2-Exp پلی میان تحقیق و تولید است و برای کاربرانی مناسب است که به دنبال بهره‌وری بالاتر در سناریوهایی با بودجه متنی بالا هستند."
},
"deepseek-ai/deepseek-llm-67b-chat": {
"description": "DeepSeek LLM Chat (67B) یک مدل نوآورانه هوش مصنوعی است که توانایی درک عمیق زبان و تعامل را فراهم می‌کند."
},
"deepseek-ai/deepseek-r1": {
"description": "مدل LLM پیشرفته و کارآمد که در استدلال، ریاضیات و برنامه‌نویسی مهارت دارد."
},
"deepseek-ai/deepseek-v3.1": {
"description": "DeepSeek V3.1: مدل استنتاج نسل بعدی که توانایی‌های استنتاج پیچیده و تفکر زنجیره‌ای را بهبود بخشیده و برای وظایفی که نیاز به تحلیل عمیق دارند مناسب است."
},
"deepseek-ai/deepseek-v3.1-terminus": {
"description": "DeepSeek V3.1: نسل جدیدی از مدل‌های استنتاج که توانایی استدلال پیچیده و تفکر زنجیره‌ای را بهبود می‌بخشد، مناسب برای وظایفی که نیاز به تحلیل عمیق دارند."
},
"deepseek-ai/deepseek-vl2": {
"description": "DeepSeek-VL2 یک مدل زبانی بصری مبتنی بر DeepSeekMoE-27B است که از معماری MoE با فعال‌سازی پراکنده استفاده می‌کند و در حالی که تنها 4.5 میلیارد پارامتر فعال است، عملکرد فوق‌العاده‌ای را ارائه می‌دهد. این مدل در چندین وظیفه از جمله پرسش و پاسخ بصری، شناسایی کاراکتر نوری، درک اسناد/جدول‌ها/نمودارها و مکان‌یابی بصری عملکرد عالی دارد."
},
"deepseek-chat": {
"description": "مدل متن‌باز جدیدی که توانایی‌های عمومی و کدنویسی را ترکیب می‌کند. این مدل نه تنها توانایی گفتگوی عمومی مدل Chat و توانایی قدرتمند پردازش کد مدل Coder را حفظ کرده است، بلکه به ترجیحات انسانی نیز بهتر همسو شده است. علاوه بر این، DeepSeek-V2.5 در وظایف نوشتاری، پیروی از دستورات و سایر جنبه‌ها نیز بهبودهای قابل توجهی داشته است."
},
"deepseek-coder-33B-instruct": {
"description": "DeepSeek Coder 33B یک مدل زبان کد است که بر اساس 20 تریلیون داده آموزش دیده است، که 87% آن کد و 13% آن زبان‌های چینی و انگلیسی است. این مدل اندازه پنجره 16K و وظایف پر کردن جا را معرفی می‌کند و قابلیت تکمیل کد و پر کردن قطعات در سطح پروژه را ارائه می‌دهد."
},
"deepseek-coder-v2": {
"description": "DeepSeek Coder V2 یک مدل کد نویسی ترکیبی و متن‌باز است که در وظایف کدنویسی عملکرد عالی دارد و با GPT4-Turbo قابل مقایسه است."
},
"deepseek-coder-v2:236b": {
"description": "DeepSeek Coder V2 یک مدل کد نویسی ترکیبی و متن‌باز است که در وظایف کدنویسی عملکرد بسیار خوبی دارد و با GPT4-Turbo قابل مقایسه است."
},
"deepseek-ocr": {
"description": "DeepSeek-OCR یک مدل زبان تصویری از DeepSeek AI است که بر شناسایی نویسه نوری (OCR) و «فشرده‌سازی نوری متنی» تمرکز دارد. این مدل با هدف بررسی مرزهای فشرده‌سازی اطلاعات متنی از تصاویر طراحی شده و می‌تواند اسناد را به‌طور مؤثر پردازش کرده و به فرمت‌های متنی ساختاریافته مانند Markdown تبدیل کند. این مدل توانایی بالایی در شناسایی دقیق محتوای متنی در تصاویر دارد و برای کاربردهایی مانند دیجیتالی‌سازی اسناد، استخراج متن و پردازش ساختاریافته بسیار مناسب است."
},
"deepseek-r1": {
"description": "DeepSeek-R1 یک مدل استنتاجی مبتنی بر یادگیری تقویتی (RL) است که به مشکلات تکرار و خوانایی در مدل پرداخته است. قبل از RL، DeepSeek-R1 داده‌های شروع سرد را معرفی کرد و عملکرد استنتاج را بهینه‌تر کرد. این مدل در وظایف ریاضی، کدنویسی و استنتاج با OpenAI-o1 عملکرد مشابهی دارد و با استفاده از روش‌های آموزشی به دقت طراحی شده، کیفیت کلی را بهبود بخشیده است."
},
"deepseek-r1-0528": {
"description": "مدل کامل 685 میلیارد پارامتری، منتشر شده در ۲۸ مه ۲۰۲۵. DeepSeek-R1 در مرحله پس‌آموزش به طور گسترده از تکنیک‌های یادگیری تقویتی استفاده کرده است و با داده‌های برچسب‌خورده بسیار کم، توانایی استدلال مدل را به طور قابل توجهی افزایش داده است. این مدل در وظایف ریاضی، کدنویسی و استدلال زبان طبیعی عملکرد و توانایی بالایی دارد."
},
"deepseek-r1-250528": {
"description": "DeepSeek R1 250528، نسخه کامل مدل استنتاجی DeepSeek-R1، مناسب برای وظایف دشوار ریاضی و منطقی."
},
"deepseek-r1-70b-fast-online": {
"description": "DeepSeek R1 70B نسخه سریع است که از جستجوی آنلاین زنده پشتیبانی می‌کند و در عین حفظ عملکرد مدل، سرعت پاسخ‌دهی سریع‌تری را ارائه می‌دهد."
},
"deepseek-r1-70b-online": {
"description": "DeepSeek R1 70B نسخه استاندارد است که از جستجوی آنلاین زنده پشتیبانی می‌کند و برای گفتگوها و وظایف پردازش متنی که به اطلاعات جدید نیاز دارند، مناسب است."
},
"deepseek-r1-distill-llama": {
"description": "deepseek-r1-distill-llama مدلی است که بر اساس Llama از DeepSeek-R1 استخراج شده است."
},
"deepseek-r1-distill-llama-70b": {
"description": "DeepSeek R1 Distill Llama 70B، مدل تقطیر شده‌ای که توانایی استنتاج R1 را با اکوسیستم Llama ترکیب می‌کند."
},
"deepseek-r1-distill-llama-8b": {
"description": "DeepSeek-R1-Distill-Llama-8B، یک مدل زبان بزرگ تقطیر شده بر پایه Llama-3.1-8B با استفاده از خروجی‌های DeepSeek R1."
},
"deepseek-r1-distill-qianfan-70b": {
"description": "DeepSeek R1 Distill Qianfan 70B، مدل تقطیر شده R1 بر پایه Qianfan-70B با بهره‌وری بالا."
},
"deepseek-r1-distill-qianfan-8b": {
"description": "DeepSeek R1 Distill Qianfan 8B، مدل تقطیر شده R1 بر پایه Qianfan-8B، مناسب برای کاربردهای کوچک و متوسط."
},
"deepseek-r1-distill-qianfan-llama-70b": {
"description": "DeepSeek R1 Distill Qianfan Llama 70B، مدل تقطیر شده R1 بر پایه Llama-70B."
},
"deepseek-r1-distill-qwen": {
"description": "deepseek-r1-distill-qwen مدلی است که بر اساس Qwen از DeepSeek-R1 استخراج شده است."
},
"deepseek-r1-distill-qwen-1.5b": {
"description": "DeepSeek R1 Distill Qwen 1.5B، مدل تقطیر شده فوق سبک R1، مناسب برای محیط‌های با منابع بسیار محدود."
},
"deepseek-r1-distill-qwen-14b": {
"description": "DeepSeek R1 Distill Qwen 14B، مدل تقطیر شده R1 با مقیاس متوسط، مناسب برای استقرار در سناریوهای مختلف."
},
"deepseek-r1-distill-qwen-32b": {
"description": "DeepSeek R1 Distill Qwen 32B، مدل تقطیر شده R1 بر پایه Qwen-32B، با تعادل بین عملکرد و هزینه."
},
"deepseek-r1-distill-qwen-7b": {
"description": "DeepSeek R1 Distill Qwen 7B، مدل تقطیر شده سبک R1، مناسب برای محیط‌های لبه‌ای و خصوصی‌سازی سازمانی."
},
"deepseek-r1-fast-online": {
"description": "DeepSeek R1 نسخه سریع کامل است که از جستجوی آنلاین زنده پشتیبانی می‌کند و ترکیبی از توانایی‌های قوی 671B پارامتر و سرعت پاسخ‌دهی سریع‌تر است."
},
"deepseek-r1-online": {
"description": "DeepSeek R1 نسخه کامل است که دارای 671B پارامتر است و از جستجوی آنلاین زنده پشتیبانی می‌کند و دارای توانایی‌های درک و تولید قوی‌تری است."
},
"deepseek-reasoner": {
"description": "حالت تفکر DeepSeek V3.2. قبل از ارائه پاسخ نهایی، مدل ابتدا یک زنجیره فکری را تولید می‌کند تا دقت پاسخ نهایی را افزایش دهد."
},
"deepseek-v2": {
"description": "DeepSeek V2 یک مدل زبانی Mixture-of-Experts کارآمد است که برای پردازش نیازهای اقتصادی و کارآمد مناسب می‌باشد."
},
"deepseek-v2:236b": {
"description": "DeepSeek V2 236B مدل طراحی کد DeepSeek است که توانایی‌های قدرتمندی در تولید کد ارائه می‌دهد."
},
"deepseek-v3": {
"description": "DeepSeek-V3 مدل MoE توسعه یافته توسط شرکت تحقیقاتی فناوری هوش مصنوعی DeepSeek در هانگژو است که در چندین ارزیابی عملکرد برجسته‌ای دارد و در لیست‌های اصلی در صدر مدل‌های متن‌باز قرار دارد. V3 نسبت به مدل V2.5 سرعت تولید را 3 برابر افزایش داده و تجربه کاربری سریع‌تر و روان‌تری را برای کاربران فراهم می‌کند."
},
"deepseek-v3-0324": {
"description": "DeepSeek-V3-0324 یک مدل MoE با ۶۷۱ میلیارد پارامتر است که در زمینه‌های برنامه‌نویسی و توانایی‌های فنی، درک زمینه و پردازش متن‌های طولانی برتری دارد."
},
"deepseek-v3.1": {
"description": "DeepSeek-V3.1 یک مدل استدلال ترکیبی جدید از DeepSeek است که از دو حالت استدلال تفکری و غیرتفکری پشتیبانی می‌کند و نسبت به DeepSeek-R1-0528 در حالت تفکری کارایی بالاتری دارد. پس از آموزش تکمیلی، استفاده از ابزارهای Agent و عملکرد وظایف هوشمند به طور قابل توجهی بهبود یافته است. پشتیبانی از پنجره متنی 128k و طول خروجی تا 64k توکن."
},
"deepseek-v3.1-terminus": {
"description": "DeepSeek-V3.1-Terminus نسخه‌ای بهینه‌سازی‌شده از مدل زبان بزرگ DeepSeek است که به‌طور خاص برای دستگاه‌های نهایی طراحی شده است."
},
"deepseek-v3.1-think-250821": {
"description": "DeepSeek V3.1 Think 250821، مدل تفکر عمیق نسخه Terminus، مناسب برای سناریوهای استنتاج با عملکرد بالا."
},
"deepseek-v3.1:671b": {
"description": "DeepSeek V3.1: مدل استنتاج نسل بعدی که توانایی‌های استنتاج پیچیده و تفکر زنجیره‌ای را بهبود بخشیده و برای وظایفی که نیاز به تحلیل عمیق دارند مناسب است."
},
"deepseek-v3.2-exp": {
"description": "deepseek-v3.2-exp مکانیزم توجه پراکنده را معرفی می‌کند که هدف آن افزایش کارایی آموزش و استنتاج در پردازش متون بلند است و قیمت آن کمتر از deepseek-v3.1 می‌باشد."
},
"deepseek-v3.2-think": {
"description": "DeepSeek V3.2 Think، نسخه کامل مدل تفکر عمیق با توانایی تقویت‌شده در استنتاج زنجیره‌ای طولانی."
},
"deepseek-vl2": {
"description": "DeepSeek VL2، مدل چندوجهی با پشتیبانی از درک تصویر و متن و پرسش و پاسخ بصری دقیق."
},
"deepseek-vl2-small": {
"description": "DeepSeek VL2 Small، نسخه سبک چندوجهی، مناسب برای محیط‌های با منابع محدود و بارگذاری بالا."
},
"deepseek/deepseek-chat": {
"description": "DeepSeek-V3 یک مدل استدلال ترکیبی با عملکرد بالا از تیم DeepSeek است که برای وظایف پیچیده و یکپارچه‌سازی ابزارها مناسب است."
},
"deepseek/deepseek-chat-v3-0324": {
"description": "DeepSeek V3 یک مدل ترکیبی متخصص با 685B پارامتر است و جدیدترین نسخه از سری مدل‌های چت پرچمدار تیم DeepSeek می‌باشد.\n\nاین مدل از [DeepSeek V3](/deepseek/deepseek-chat-v3) به ارث برده و در انواع وظایف عملکرد عالی از خود نشان می‌دهد."
},
"deepseek/deepseek-chat-v3-0324:free": {
"description": "DeepSeek V3 یک مدل ترکیبی متخصص با 685B پارامتر است و جدیدترین نسخه از سری مدل‌های چت پرچمدار تیم DeepSeek می‌باشد.\n\nاین مدل از [DeepSeek V3](/deepseek/deepseek-chat-v3) به ارث برده و در انواع وظایف عملکرد عالی از خود نشان می‌دهد."
},
"deepseek/deepseek-chat-v3.1": {
"description": "DeepSeek-V3.1 مدل استدلال ترکیبی با زمینه طولانی از DeepSeek است که از حالت‌های ترکیبی فکری/غیرفکری و یکپارچه‌سازی ابزارها پشتیبانی می‌کند."
},
"deepseek/deepseek-r1": {
"description": "مدل DeepSeek R1 به‌روزرسانی‌های جزئی دریافت کرده و نسخه فعلی DeepSeek-R1-0528 است. در آخرین به‌روزرسانی، DeepSeek R1 با بهره‌گیری از منابع محاسباتی افزایش‌یافته و مکانیزم‌های بهینه‌سازی الگوریتمی پس از آموزش، عمق و توان استدلال خود را به طور قابل توجهی بهبود بخشیده است. این مدل در ارزیابی‌های معیار مختلف مانند ریاضیات، برنامه‌نویسی و منطق عمومی عملکرد برجسته‌ای دارد و عملکرد کلی آن اکنون به مدل‌های پیشرو مانند O3 و Gemini 2.5 Pro نزدیک شده است."
},
"deepseek/deepseek-r1-0528": {
"description": "DeepSeek R1 0528 نسخه به‌روزشده‌ای از DeepSeek است که بر متن‌باز بودن و عمق استدلال تمرکز دارد."
},
"deepseek/deepseek-r1-0528:free": {
"description": "DeepSeek-R1 با داشتن داده‌های برچسب‌خورده بسیار محدود، توانایی استدلال مدل را به طور چشمگیری افزایش داده است. قبل از ارائه پاسخ نهایی، مدل ابتدا یک زنجیره فکری را تولید می‌کند تا دقت پاسخ نهایی را بهبود بخشد."
},
"deepseek/deepseek-r1-distill-llama-70b": {
"description": "DeepSeek R1 Distill Llama 70B یک مدل زبان بزرگ مبتنی بر Llama3.3 70B است که با استفاده از خروجی‌های تنظیم‌شده DeepSeek R1، به عملکردی رقابتی در سطح مدل‌های پیشرفته بزرگ دست یافته است."
},
"deepseek/deepseek-r1-distill-llama-8b": {
"description": "DeepSeek R1 Distill Llama 8B یک مدل زبان بزرگ تقطیر شده مبتنی بر Llama-3.1-8B-Instruct است که با استفاده از خروجی DeepSeek R1 آموزش دیده است."
},
"deepseek/deepseek-r1-distill-qwen-14b": {
"description": "DeepSeek R1 Distill Qwen 14B یک مدل زبان بزرگ تقطیر شده مبتنی بر Qwen 2.5 14B است که با استفاده از خروجی DeepSeek R1 آموزش دیده است. این مدل در چندین آزمون معیار از o1-mini OpenAI پیشی گرفته و به آخرین دستاوردهای فناوری مدل‌های متراکم (dense models) دست یافته است. نتایج برخی از آزمون‌های معیار به شرح زیر است:\nAIME 2024 pass@1: 69.7\nMATH-500 pass@1: 93.9\nCodeForces Rating: 1481\nاین مدل با تنظیمات خروجی DeepSeek R1، عملکرد رقابتی معادل مدل‌های پیشرفته بزرگتر را نشان می‌دهد."
},
"deepseek/deepseek-r1-distill-qwen-32b": {
"description": "DeepSeek R1 Distill Qwen 32B یک مدل زبان بزرگ تقطیر شده مبتنی بر Qwen 2.5 32B است که با استفاده از خروجی DeepSeek R1 آموزش دیده است. این مدل در چندین آزمون معیار از o1-mini OpenAI پیشی گرفته و به آخرین دستاوردهای فناوری مدل‌های متراکم (dense models) دست یافته است. نتایج برخی از آزمون‌های معیار به شرح زیر است:\nAIME 2024 pass@1: 72.6\nMATH-500 pass@1: 94.3\nCodeForces Rating: 1691\nاین مدل با تنظیمات خروجی DeepSeek R1، عملکرد رقابتی معادل مدل‌های پیشرفته بزرگتر را نشان می‌دهد."
},
"deepseek/deepseek-r1/community": {
"description": "DeepSeek R1 جدیدترین مدل متن باز منتشر شده توسط تیم DeepSeek است که دارای عملکرد استدلال بسیار قوی است و به ویژه در وظایف ریاضی، برنامه‌نویسی و استدلال به سطحی معادل مدل o1 OpenAI رسیده است."
},
"deepseek/deepseek-r1:free": {
"description": "DeepSeek-R1 با وجود داده‌های برچسب‌گذاری شده بسیار کم، توانایی استدلال مدل را به طرز چشمگیری افزایش می‌دهد. قبل از ارائه پاسخ نهایی، مدل ابتدا یک زنجیره تفکر را تولید می‌کند تا دقت پاسخ نهایی را افزایش دهد."
},
"deepseek/deepseek-reasoner": {
"description": "DeepSeek-V3 Thinking (reasoner) مدل آزمایشی استدلال از DeepSeek است که برای وظایف استدلالی با پیچیدگی بالا مناسب است."
},
"deepseek/deepseek-v3": {
"description": "مدل زبان بزرگ سریع و عمومی با توان استدلال بهبود یافته."
},
"deepseek/deepseek-v3.1-base": {
"description": "DeepSeek V3.1 Base نسخه بهبود یافته مدل DeepSeek V3 است."
},
"deepseek/deepseek-v3/community": {
"description": "DeepSeek-V3 در سرعت استدلال به یک پیشرفت عمده نسبت به مدل‌های قبلی دست یافته است. این مدل در بین مدل‌های متن باز رتبه اول را دارد و می‌تواند با پیشرفته‌ترین مدل‌های بسته جهانی رقابت کند. DeepSeek-V3 از معماری توجه چندسر (MLA) و DeepSeekMoE استفاده می‌کند که این معماری‌ها در DeepSeek-V2 به طور کامل تأیید شده‌اند. علاوه بر این، DeepSeek-V3 یک استراتژی کمکی بدون ضرر برای تعادل بار معرفی کرده و اهداف آموزشی پیش‌بینی چند برچسبی را برای بهبود عملکرد تعیین کرده است."
},
"deepseek_r1": {
"description": "DeepSeek-R1 یک مدل استدلالی است که توسط یادگیری تقویتی (RL) هدایت می‌شود و مشکلات تکراری و خوانایی را در مدل حل می‌کند. قبل از RL، DeepSeek-R1 داده‌های راه‌اندازی سرد را معرفی کرد و عملکرد استدلال را به‌طور بیشتری بهینه‌سازی کرد. این مدل در وظایف ریاضی، کدنویسی و استدلال با OpenAI-o1 عملکرد مشابهی دارد و از طریق روش‌های آموزشی طراحی‌شده به‌دقت، عملکرد کلی را بهبود بخشیده است."
},
"deepseek_r1_distill_llama_70b": {
"description": "DeepSeek-R1-Distill-Llama-70B مدلی است که بر اساس Llama-3.3-70B-Instruct از طریق آموزش تقطیر به‌دست آمده است. این مدل بخشی از سری DeepSeek-R1 است و با استفاده از نمونه‌های تولید شده توسط DeepSeek-R1 برای بهینه‌سازی، در چندین حوزه از جمله ریاضی، برنامه‌نویسی و استدلال عملکرد فوق‌العاده‌ای دارد."
},
"deepseek_r1_distill_qwen_14b": {
"description": "DeepSeek-R1-Distill-Qwen-14B مدلی است که بر اساس Qwen2.5-14B از طریق تقطیر دانش به‌دست آمده است. این مدل از 800000 نمونه منتخب تولید شده توسط DeepSeek-R1 برای بهینه‌سازی استفاده می‌کند و توانایی استدلال فوق‌العاده‌ای را نشان می‌دهد."
},
"deepseek_r1_distill_qwen_32b": {
"description": "DeepSeek-R1-Distill-Qwen-32B مدلی است که بر اساس Qwen2.5-32B از طریق تقطیر دانش به‌دست آمده است. این مدل از 800000 نمونه منتخب تولید شده توسط DeepSeek-R1 برای بهینه‌سازی استفاده می‌کند و در چندین حوزه از جمله ریاضی، برنامه‌نویسی و استدلال عملکرد فوق‌العاده‌ای دارد."
},
"doubao-1.5-lite-32k": {
"description": "مدل سبک نسل جدید Doubao-1.5-lite، با سرعت پاسخ‌دهی فوق‌العاده، عملکرد و تأخیر در سطح جهانی را ارائه می‌دهد."
},
"doubao-1.5-pro-256k": {
"description": "Doubao-1.5-pro-256k نسخه ارتقاء یافته Doubao-1.5-Pro است که به طور کلی عملکرد را 10% بهبود می‌بخشد. از استدلال با پنجره زمینه 256k پشتیبانی می‌کند و طول خروجی حداکثر 12k توکن را پشتیبانی می‌کند. عملکرد بالاتر، پنجره بزرگتر و قیمت فوق‌العاده، مناسب برای کاربردهای گسترده‌تر."
},
"doubao-1.5-pro-32k": {
"description": "مدل اصلی نسل جدید Doubao-1.5-pro، با ارتقاء کامل عملکرد، در زمینه‌های دانش، کد، استدلال و غیره عملکرد برجسته‌ای دارد."
},
"doubao-1.5-thinking-pro": {
"description": "مدل تفکر عمیق جدید Doubao-1.5، در زمینه‌های تخصصی مانند ریاضیات، برنامه‌نویسی، استدلال علمی و همچنین در وظایف عمومی مانند نوشتن خلاقانه عملکرد برجسته‌ای دارد و در معیارهای معتبر مانند AIME 2024، Codeforces و GPQA به سطح اول صنعت نزدیک یا در آن قرار دارد. از پنجره زمینه 128k و خروجی 16k پشتیبانی می‌کند."
},
"doubao-1.5-thinking-pro-m": {
"description": "مدل تفکر عمیق جدید Doubao-1.5 (نسخه m دارای قابلیت استدلال چندرسانه‌ای بومی) است که در حوزه‌های تخصصی مانند ریاضیات، برنامه‌نویسی، استدلال علمی و همچنین وظایف عمومی مانند نوشتن خلاقانه عملکرد برجسته‌ای دارد و در معیارهای معتبر AIME 2024، Codeforces، GPQA و غیره به سطح اول صنعت نزدیک یا در آن قرار دارد. از پنجره متنی 128k و خروجی 16k پشتیبانی می‌کند."
},
"doubao-1.5-thinking-vision-pro": {
"description": "مدل جدید تفکر عمیق بصری با توانایی‌های قوی‌تر در درک و استدلال چندرسانه‌ای عمومی، که در 37 مورد از 59 معیار ارزیابی عمومی به عملکرد برتر (SOTA) دست یافته است."
},
"doubao-1.5-ui-tars": {
"description": "Doubao-1.5-UI-TARS یک مدل عامل بومی برای تعامل با رابط‌های گرافیکی کاربری (GUI) است. با توانایی‌های انسانی مانند ادراک، استدلال و اقدام، تعامل بی‌وقفه با GUI را فراهم می‌کند."
},
"doubao-1.5-vision-lite": {
"description": "Doubao-1.5-vision-lite مدل بزرگ چندرسانه‌ای به‌روز شده است که از شناسایی تصاویر با هر وضوح و نسبت ابعاد بسیار طولانی پشتیبانی می‌کند و توانایی‌های استدلال بصری، شناسایی مستندات، درک اطلاعات جزئی و پیروی از دستورات را تقویت می‌کند. از پنجره متن 128k و حداکثر طول خروجی 16k توکن پشتیبانی می‌کند."
},
"doubao-1.5-vision-pro": {
"description": "مدل چندرسانه‌ای بزرگ Doubao-1.5-vision-pro به‌روزرسانی شده که از شناسایی تصاویر با هر وضوح و نسبت ابعاد بسیار طولانی پشتیبانی می‌کند و توانایی‌های استدلال بصری، شناسایی اسناد، درک جزئیات و پیروی از دستورات را تقویت می‌کند."
},
"doubao-1.5-vision-pro-32k": {
"description": "مدل چندرسانه‌ای بزرگ Doubao-1.5-vision-pro به‌روزرسانی شده که از شناسایی تصاویر با هر وضوح و نسبت ابعاد بسیار طولانی پشتیبانی می‌کند و توانایی‌های استدلال بصری، شناسایی اسناد، درک جزئیات و پیروی از دستورات را تقویت می‌کند."
},
"doubao-lite-128k": {
"description": "دارای سرعت پاسخگویی بی‌نظیر و نسبت قیمت به کارایی بهتر است و گزینه‌های انعطاف‌پذیرتری را برای سناریوهای مختلف مشتریان ارائه می‌دهد. از پنجره متنی 128k برای استدلال و تنظیم دقیق پشتیبانی می‌کند."
},
"doubao-lite-32k": {
"description": "دارای سرعت پاسخگویی بی‌نظیر و نسبت قیمت به کارایی بهتر است و گزینه‌های انعطاف‌پذیرتری را برای سناریوهای مختلف مشتریان ارائه می‌دهد. از پنجره متنی 32k برای استدلال و تنظیم دقیق پشتیبانی می‌کند."
},
"doubao-lite-4k": {
"description": "دارای سرعت پاسخگویی بی‌نظیر و نسبت قیمت به کارایی بهتر است و گزینه‌های انعطاف‌پذیرتری را برای سناریوهای مختلف مشتریان ارائه می‌دهد. از پنجره متنی 4k برای استدلال و تنظیم دقیق پشتیبانی می‌کند."
},
"doubao-pro-256k": {
"description": "مدل اصلی با بهترین عملکرد، مناسب برای انجام وظایف پیچیده است و در زمینه‌هایی مانند پاسخ به سوالات مرجع، خلاصه‌سازی، خلق محتوا، دسته‌بندی متن و نقش‌آفرینی عملکرد بسیار خوبی دارد. از پنجره متنی 256k برای استدلال و تنظیم دقیق پشتیبانی می‌کند."
},
"doubao-pro-32k": {
"description": "مدل اصلی با بهترین عملکرد، مناسب برای انجام وظایف پیچیده است و در زمینه‌هایی مانند پاسخ به سوالات مرجع، خلاصه‌سازی، خلق محتوا، دسته‌بندی متن و نقش‌آفرینی عملکرد بسیار خوبی دارد. از پنجره متنی 32k برای استدلال و تنظیم دقیق پشتیبانی می‌کند."
},
"doubao-seed-1.6": {
"description": "مدل تفکر عمیق چندرسانه‌ای جدید Doubao-Seed-1.6 که از سه حالت تفکر auto/thinking/non-thinking پشتیبانی می‌کند. در حالت non-thinking، عملکرد مدل نسبت به Doubao-1.5-pro/250115 به‌طور قابل توجهی بهبود یافته است. از پنجره متنی ۲۵۶ هزار توکنی پشتیبانی می‌کند و طول خروجی تا ۱۶ هزار توکن را امکان‌پذیر می‌سازد."
},
"doubao-seed-1.6-flash": {
"description": "مدل تفکر عمیق چندرسانه‌ای Doubao-Seed-1.6-flash با سرعت استنتاج بسیار بالا، TPOT تنها ۱۰ میلی‌ثانیه است؛ همچنین از درک متن و تصویر پشتیبانی می‌کند، توانایی درک متنی آن از نسل قبلی lite بهتر است و درک تصویری آن با مدل‌های pro رقبا برابری می‌کند. از پنجره متنی ۲۵۶ هزار توکنی پشتیبانی می‌کند و طول خروجی تا ۱۶ هزار توکن را امکان‌پذیر می‌سازد."
},
"doubao-seed-1.6-lite": {
"description": "Doubao-Seed-1.6-lite یک مدل چندرسانه‌ای جدید با قابلیت تفکر عمیق است که از تنظیم سطح تلاش استدلال (reasoning effort) در چهار حالت Minimal، Low، Medium و High پشتیبانی می‌کند. این مدل با بهره‌وری بالا، انتخابی ایده‌آل برای وظایف رایج است و از پنجره متنی تا ۲۵۶ هزار توکن پشتیبانی می‌کند."
},
"doubao-seed-1.6-thinking": {
"description": "مدل Doubao-Seed-1.6-thinking با توانایی تفکر به‌طور قابل توجهی تقویت شده است، نسبت به Doubao-1.5-thinking-pro در مهارت‌های پایه‌ای مانند برنامه‌نویسی، ریاضیات و استدلال منطقی پیشرفت داشته و از درک تصویری پشتیبانی می‌کند. از پنجره متنی ۲۵۶ هزار توکنی پشتیبانی می‌کند و طول خروجی تا ۱۶ هزار توکن را امکان‌پذیر می‌سازد."
},
"doubao-seed-1.6-vision": {
"description": "مدل تفکر عمیق بصری Doubao-Seed-1.6-vision در زمینه‌هایی مانند آموزش، بازبینی تصاویر، بازرسی و امنیت و پرسش و پاسخ جستجوی هوش مصنوعی، توانایی درک و استدلال چندرسانه‌ای عمومی قوی‌تری را نشان می‌دهد. از پنجره متنی ۲۵۶ هزار توکنی پشتیبانی می‌کند و طول خروجی تا ۶۴ هزار توکن قابل افزایش است."
},
"doubao-seed-code": {
"description": "Doubao-Seed-Code برای وظایف برنامه‌نویسی Agentic به‌طور عمیق بهینه‌سازی شده است. از چندرسانه‌ای (متن/تصویر/ویدیو) و زمینه طولانی ۲۵۶ هزار توکن پشتیبانی می‌کند، با API شرکت Anthropic سازگار است و برای برنامه‌نویسی، درک بصری و سناریوهای Agent مناسب است."
},
"doubao-seededit-3-0-i2i-250628": {
"description": "مدل تولید تصویر Doubao توسط تیم Seed شرکت ByteDance توسعه یافته است، از ورودی متن و تصویر پشتیبانی می‌کند و تجربه‌ای با کنترل بالا و کیفیت عالی در تولید تصویر ارائه می‌دهد. امکان ویرایش تصویر با دستور متنی وجود دارد و طول ضلع تصویر تولید شده بین 512 تا 1536 پیکسل است."
},
"doubao-seedream-3-0-t2i-250415": {
"description": "مدل تولید تصویر Seedream 3.0 توسط تیم Seed شرکت ByteDance توسعه یافته است، از ورودی متن و تصویر پشتیبانی می‌کند و تجربه‌ای با کنترل بالا و کیفیت عالی در تولید تصویر ارائه می‌دهد. تصاویر بر اساس متن توصیفی تولید می‌شوند."
},
"doubao-seedream-4-0-250828": {
"description": "مدل تولید تصویر Seedream 4.0 توسط تیم Seed شرکت ByteDance توسعه یافته است، از ورودی متن و تصویر پشتیبانی می‌کند و تجربه‌ای با کنترل بالا و کیفیت عالی در تولید تصویر ارائه می‌دهد. تصاویر بر اساس متن توصیفی تولید می‌شوند."
},
"doubao-vision-lite-32k": {
"description": "مدل Doubao-vision یک مدل چندرسانه‌ای بزرگ است که توسط Doubao ارائه شده و دارای توانایی‌های قوی در درک و استدلال تصاویر و همچنین درک دقیق دستورات است. این مدل در استخراج اطلاعات متنی از تصاویر و وظایف استدلال مبتنی بر تصویر عملکرد قدرتمندی نشان داده و می‌تواند در وظایف پیچیده‌تر و گسترده‌تر پرسش و پاسخ بصری به کار رود."
},
"doubao-vision-pro-32k": {
"description": "مدل Doubao-vision یک مدل چندرسانه‌ای بزرگ است که توسط Doubao ارائه شده و دارای توانایی‌های قوی در درک و استدلال تصاویر و همچنین درک دقیق دستورات است. این مدل در استخراج اطلاعات متنی از تصاویر و وظایف استدلال مبتنی بر تصویر عملکرد قدرتمندی نشان داده و می‌تواند در وظایف پیچیده‌تر و گسترده‌تر پرسش و پاسخ بصری به کار رود."
},
"emohaa": {
"description": "Emohaa یک مدل روان‌شناختی است که دارای توانایی مشاوره حرفه‌ای بوده و به کاربران در درک مسائل احساسی کمک می‌کند."
},
"ernie-4.5-0.3b": {
"description": "ERNIE 4.5 0.3B، مدل سبک متن‌باز، مناسب برای استقرار محلی و سفارشی‌سازی."
},
"ernie-4.5-21b-a3b": {
"description": "ERNIE 4.5 21B A3B، مدل بزرگ متن‌باز با عملکرد قوی در وظایف درک و تولید."
},
"ernie-4.5-300b-a47b": {
"description": "ERNIE 4.5 300B A47B یک مدل بسیار بزرگ متخصص ترکیبی است که توسط Wenxin Baidu ارائه شده و از توانایی استدلالی برجسته‌ای برخوردار است."
},
"ernie-4.5-8k-preview": {
"description": "ERNIE 4.5 8K Preview، مدل پیش‌نمایش با زمینه 8K، برای تجربه و آزمایش قابلیت‌های Wenxin 4.5."
},
"ernie-4.5-turbo-128k": {
"description": "ERNIE 4.5 Turbo 128K، مدل عمومی با عملکرد بالا، پشتیبانی از جستجوی تقویتی و ابزارها، مناسب برای پرسش و پاسخ، کدنویسی و عامل‌های هوشمند."
},
"ernie-4.5-turbo-128k-preview": {
"description": "ERNIE 4.5 Turbo 128K Preview، نسخه پیش‌نمایش با قابلیت‌های مشابه نسخه رسمی، مناسب برای تست و هماهنگی."
},
"ernie-4.5-turbo-32k": {
"description": "ERNIE 4.5 Turbo 32K، نسخه با زمینه متوسط تا بلند، مناسب برای پرسش و پاسخ، جستجوی پایگاه دانش و مکالمات چندمرحله‌ای."
},
"ernie-4.5-turbo-latest": {
"description": "ERNIE 4.5 Turbo آخرین نسخه، با بهینه‌سازی عملکرد کلی، مناسب به‌عنوان مدل اصلی در محیط‌های تولیدی."
},
"ernie-4.5-turbo-vl": {
"description": "ERNIE 4.5 Turbo VL، مدل چندوجهی بالغ، مناسب برای درک و شناسایی تصویر و متن در محیط‌های تولیدی."
},
"ernie-4.5-turbo-vl-32k": {
"description": "ERNIE 4.5 Turbo VL 32K، نسخه چندوجهی با زمینه متوسط تا بلند، مناسب برای درک ترکیبی اسناد بلند و تصاویر."
},
"ernie-4.5-turbo-vl-32k-preview": {
"description": "ERNIE 4.5 Turbo VL 32K Preview، نسخه پیش‌نمایش چندوجهی 32K، مناسب برای ارزیابی توانایی درک بصری با زمینه بلند."
},
"ernie-4.5-turbo-vl-latest": {
"description": "ERNIE 4.5 Turbo VL Latest، آخرین نسخه چندوجهی با درک و استنتاج تصویر و متن بهینه‌شده."
},
"ernie-4.5-turbo-vl-preview": {
"description": "ERNIE 4.5 Turbo VL Preview، مدل پیش‌نمایش چندوجهی، پشتیبانی از درک و تولید تصویر و متن، مناسب برای تجربه پرسش و پاسخ بصری و درک محتوا."
},
"ernie-4.5-vl-28b-a3b": {
"description": "ERNIE 4.5 VL 28B A3B، مدل چندوجهی متن‌باز، پشتیبانی از وظایف درک و استنتاج تصویر و متن."
},
"ernie-5.0-thinking-latest": {
"description": "Ernie 5.0 Thinking، مدل پرچم‌دار چندرسانه‌ای بومی، از مدل‌سازی یکپارچه متن، تصویر، صوت و ویدیو پشتیبانی می‌کند. توانایی‌های جامع آن به‌روزرسانی شده و برای پرسش‌وپاسخ‌های پیچیده، تولید محتوا و سناریوهای هوشمند بسیار مناسب است."
},
"ernie-5.0-thinking-preview": {
"description": "پیش‌نمایش ERNIE 5.0 Thinking، مدل پرچم‌دار چندوجهی بومی، پشتیبانی از مدل‌سازی یکپارچه متن، تصویر، صدا و ویدیو، با ارتقاء جامع توانایی‌ها، مناسب برای پرسش و پاسخ پیچیده، تولید محتوا و عامل‌های هوشمند."
},
"ernie-char-8k": {
"description": "ERNIE Character 8K، مدل مکالمه با شخصیت، مناسب برای ساخت شخصیت‌های IP و گفت‌وگوی همراه بلندمدت."
},
"ernie-char-fiction-8k": {
"description": "ERNIE Character Fiction 8K، مدل شخصیت‌پردازی برای داستان‌نویسی و خلق روایت، مناسب برای تولید داستان‌های بلند."
},
"ernie-char-fiction-8k-preview": {
"description": "ERNIE Character Fiction 8K Preview، نسخه پیش‌نمایش مدل شخصیت و داستان‌پردازی، برای تجربه و آزمایش عملکرد."
},
"ernie-irag-edit": {
"description": "ERNIE iRAG Edit، مدل ویرایش تصویر با قابلیت حذف، بازسازی و تولید نسخه‌های متنوع."
},
"ernie-lite-8k": {
"description": "ERNIE Lite 8K، مدل عمومی سبک، مناسب برای پرسش و پاسخ روزمره و تولید محتوا با هزینه پایین."
},
"ernie-lite-pro-128k": {
"description": "ERNIE Lite Pro 128K، مدل سبک با عملکرد بالا، مناسب برای سناریوهای حساس به تأخیر و هزینه."
},
"ernie-novel-8k": {
"description": "ERNIE Novel 8K، مدل تولید رمان بلند و داستان‌های IP، متخصص در روایت چندشخصیتی و چندخطی."
},
"ernie-speed-128k": {
"description": "ERNIE Speed 128K، مدل بزرگ بدون هزینه ورودی/خروجی، مناسب برای درک متن بلند و آزمایش‌های گسترده."
},
"ernie-speed-8k": {
"description": "ERNIE Speed 8K، مدل رایگان و سریع، مناسب برای مکالمات روزمره و وظایف متنی سبک."
},
"ernie-speed-pro-128k": {
"description": "ERNIE Speed Pro 128K، مدل با کارایی بالا و هزینه مناسب، مناسب برای خدمات آنلاین گسترده و کاربردهای سازمانی."
},
"ernie-tiny-8k": {
"description": "ERNIE Tiny 8K، مدل فوق سبک، مناسب برای پرسش و پاسخ ساده، طبقه‌بندی و استنتاج کم‌هزینه."
},
"ernie-x1-turbo-32k": {
"description": "ERNIE X1 Turbo 32K، مدل تفکر سریع با زمینه بلند 32K، مناسب برای استنتاج پیچیده و مکالمات چندمرحله‌ای."
},
"ernie-x1.1-preview": {
"description": "ERNIE X1.1 Preview، نسخه پیش‌نمایش مدل تفکر ERNIE X1.1، مناسب برای ارزیابی و آزمایش توانایی‌ها."
},
"fal-ai/bytedance/seedream/v4": {
"description": "مدل تولید تصویر Seedream 4.0 توسط تیم Seed شرکت ByteDance توسعه یافته است، از ورودی متن و تصویر پشتیبانی می‌کند و تجربه‌ای با کنترل بالا و کیفیت عالی در تولید تصویر ارائه می‌دهد. تصاویر بر اساس متن توصیفی تولید می‌شوند."
},
"fal-ai/flux-kontext/dev": {
"description": "مدل FLUX.1 متمرکز بر وظایف ویرایش تصویر است و از ورودی متن و تصویر پشتیبانی می‌کند."
},
"fal-ai/flux-pro/kontext": {
"description": "FLUX.1 Kontext [pro] قادر است متن و تصویر مرجع را به عنوان ورودی پردازش کند و ویرایش‌های هدفمند محلی و تغییرات پیچیده در صحنه‌های کلی را به صورت یکپارچه انجام دهد."
},
"fal-ai/flux/krea": {
"description": "Flux Krea [dev] یک مدل تولید تصویر با سلیقه زیبایی‌شناسانه است که هدف آن تولید تصاویر واقعی‌تر و طبیعی‌تر است."
},
"fal-ai/flux/schnell": {
"description": "FLUX.1 [schnell] یک مدل تولید تصویر با 12 میلیارد پارامتر است که بر تولید سریع تصاویر با کیفیت بالا تمرکز دارد."
},
"fal-ai/hunyuan-image/v3": {
"description": "یک مدل قدرتمند بومی تولید تصویر چندوجهی"
},
"fal-ai/imagen4/preview": {
"description": "مدل تولید تصویر با کیفیت بالا ارائه شده توسط گوگل"
},
"fal-ai/nano-banana": {
"description": "Nano Banana جدیدترین، سریع‌ترین و کارآمدترین مدل چندرسانه‌ای بومی گوگل است که به شما امکان می‌دهد از طریق گفتگو تصاویر را تولید و ویرایش کنید."
},
"fal-ai/qwen-image": {
"description": "مدل قدرتمند تولید تصویر خام تیم Qwen با توانایی چشمگیر در تولید متن‌های چینی و سبک‌های بصری متنوع تصاویر."
},
"fal-ai/qwen-image-edit": {
"description": "مدل ویرایش تصویر حرفه‌ای منتشر شده توسط تیم Qwen که از ویرایش معنایی و ظاهری پشتیبانی می‌کند، قادر به ویرایش دقیق متن‌های چینی و انگلیسی، تبدیل سبک، چرخش اشیاء و سایر ویرایش‌های با کیفیت تصویر است."
},
"flux-1-schnell": {
"description": "مدل تولید تصویر از متن با 12 میلیارد پارامتر که توسط Black Forest Labs توسعه یافته است و از تکنولوژی تقطیر انتشار متخاصم نهفته استفاده می‌کند و قادر است در 1 تا 4 مرحله تصاویر با کیفیت بالا تولید کند. این مدل عملکردی مشابه نمونه‌های بسته دارد و تحت مجوز Apache-2.0 برای استفاده شخصی، تحقیقاتی و تجاری منتشر شده است."
},
"flux-dev": {
"description": "FLUX.1 [dev] یک مدل وزن باز و پالایش شده متن‌باز برای کاربردهای غیرتجاری است. این مدل کیفیت تصویر و پیروی از دستورالعمل را نزدیک به نسخه حرفه‌ای FLUX حفظ کرده و در عین حال کارایی اجرایی بالاتری دارد. نسبت به مدل‌های استاندارد با اندازه مشابه، بهره‌وری منابع بهتری دارد."
},
"flux-kontext-max": {
"description": "پیشرفته‌ترین فناوری تولید و ویرایش تصاویر مبتنی بر زمینه — ترکیب متن و تصویر برای دستیابی به نتایجی دقیق و منسجم."
},
"flux-kontext-pro": {
"description": "پیشرفته‌ترین تولید و ویرایش تصاویر زمینه‌ای — ترکیب متن و تصویر برای به‌دست آوردن نتایجی دقیق و منسجم."
},
"flux-merged": {
"description": "مدل FLUX.1-merged ترکیبی از ویژگی‌های عمیق کشف شده در مرحله توسعه \"DEV\" و مزایای اجرای سریع \"Schnell\" است. این اقدام باعث افزایش مرزهای عملکرد مدل و گسترش دامنه کاربردهای آن شده است."
},
"flux-pro": {
"description": "پیشرفته‌ترین مدل تولید تصاویر مبتنی بر هوش مصنوعی برای مصارف تجاری — کیفیت تصویر بی‌نظیر و تنوع خروجی چشمگیر."
},
"flux-pro-1.1": {
"description": "نسخهٔ ارتقاء یافتهٔ مدل تولید تصویر حرفه‌ای مبتنی بر هوش مصنوعی — کیفیت تصویر برجسته و توانایی دقیق در پیروی از پرومپت‌ها را ارائه می‌دهد."
},
"flux-pro-1.1-ultra": {
"description": "تولید تصاویر هوش مصنوعی با رزولوشن فوق‌العاده — پشتیبانی از خروجی ۴ مگاپیکسلی و تولید تصاویر با وضوح بالا در کمتر از ۱۰ ثانیه."
},
"flux-schnell": {
"description": "FLUX.1 [schnell] به عنوان پیشرفته‌ترین مدل متن‌باز با گام‌های کم، نه تنها از رقبا پیشی گرفته بلکه از مدل‌های غیرتقطیر قدرتمندی مانند Midjourney v6.0 و DALL·E 3 (HD) نیز بهتر است. این مدل به طور خاص تنظیم شده تا تنوع کامل خروجی‌های پیش‌آموزش را حفظ کند و نسبت به مدل‌های پیشرفته بازار، بهبودهای قابل توجهی در کیفیت بصری، پیروی از دستورالعمل، تغییر اندازه/نسبت، پردازش فونت و تنوع خروجی ارائه می‌دهد و تجربه تولید تصاویر خلاقانه و متنوع‌تری را برای کاربران فراهم می‌کند."
},
"flux.1-schnell": {
"description": "FLUX.1-schnell، مدل تولید تصویر با عملکرد بالا، مناسب برای تولید سریع تصاویر با سبک‌های متنوع."
},
"gemini-1.0-pro-001": {
"description": "Gemini 1.0 Pro 001 (تنظیم) عملکردی پایدار و قابل تنظیم ارائه می‌دهد و انتخابی ایده‌آل برای راه‌حل‌های وظایف پیچیده است."
},
"gemini-1.0-pro-002": {
"description": "جمینی 1.0 پرو 002 (تنظیم) پشتیبانی چندوجهی عالی ارائه می‌دهد و بر حل مؤثر وظایف پیچیده تمرکز دارد."
},
"gemini-1.0-pro-latest": {
"description": "Gemini 1.0 Pro مدل هوش مصنوعی با عملکرد بالای Google است که برای گسترش وظایف گسترده طراحی شده است."
},
"gemini-1.5-flash-001": {
"description": "جمینی 1.5 فلش 001 یک مدل چندوجهی کارآمد است که از گسترش کاربردهای گسترده پشتیبانی می‌کند."
},
"gemini-1.5-flash-002": {
"description": "جمینی 1.5 فلش 002 یک مدل چندوجهی کارآمد است که از گسترش کاربردهای گسترده پشتیبانی می‌کند."
},
"gemini-1.5-flash-8b": {
"description": "Gemini 1.5 Flash 8B یک مدل چندرسانه‌ای کارآمد است که از گسترش کاربردهای وسیع پشتیبانی می‌کند."
},
"gemini-1.5-flash-8b-exp-0924": {
"description": "Gemini 1.5 Flash 8B 0924 جدیدترین مدل آزمایشی است که در موارد استفاده متنی و چندوجهی بهبود عملکرد قابل توجهی دارد."
},
"gemini-1.5-flash-8b-latest": {
"description": "جیمنی ۱.۵ فلاش ۸ب یک مدل چند حالتی کارآمد است که پشتیبانی از گستره‌ای وسیع از کاربردها را فراهم می‌کند."
},
"gemini-1.5-flash-exp-0827": {
"description": "Gemini 1.5 Flash 0827 دارای توانایی‌های بهینه‌شده پردازش چندرسانه‌ای است و مناسب برای انواع سناریوهای پیچیده است."
},
"gemini-1.5-flash-latest": {
"description": "Gemini 1.5 Flash جدیدترین مدل چندوجهی AI گوگل است که دارای قابلیت پردازش سریع بوده و از ورودی‌های متن، تصویر و ویدئو پشتیبانی می‌کند و برای گسترش کارآمد در وظایف مختلف مناسب است."
},
"gemini-1.5-pro-001": {
"description": "Gemini 1.5 Pro 001 یک راه‌حل هوش مصنوعی چندوجهی قابل گسترش است که از طیف گسترده‌ای از وظایف پیچیده پشتیبانی می‌کند."
},
"gemini-1.5-pro-002": {
"description": "Gemini 1.5 Pro 002 جدیدترین مدل آماده تولید است که خروجی با کیفیت بالاتری ارائه می‌دهد و به ویژه در زمینه‌های ریاضی، متن‌های طولانی و وظایف بصری بهبود قابل توجهی دارد."
},
"gemini-1.5-pro-exp-0801": {
"description": "Gemini 1.5 Pro 0801 توانایی‌های برجسته پردازش چندرسانه‌ای را ارائه می‌دهد و انعطاف‌پذیری بیشتری برای توسعه برنامه‌ها به ارمغان می‌آورد."
},
"gemini-1.5-pro-exp-0827": {
"description": "Gemini 1.5 Pro 0827 با تکنولوژی‌های بهینه‌سازی جدید ترکیب شده و توانایی پردازش داده‌های چندرسانه‌ای را بهینه می‌کند."
},
"gemini-1.5-pro-latest": {
"description": "Gemini 1.5 Pro از حداکثر ۲ میلیون توکن پشتیبانی می‌کند و انتخابی ایده‌آل برای مدل‌های چندوجهی متوسط است که برای پشتیبانی از وظایف پیچیده مناسب می‌باشد."
},
"gemini-2.0-flash": {
"description": "Gemini 2.0 Flash ویژگی‌ها و بهبودهای نسل بعدی را ارائه می‌دهد، از جمله سرعت عالی، استفاده از ابزارهای بومی، تولید چندرسانه‌ای و پنجره متن 1M توکن."
},
"gemini-2.0-flash-001": {
"description": "Gemini 2.0 Flash ویژگی‌ها و بهبودهای نسل بعدی را ارائه می‌دهد، از جمله سرعت عالی، استفاده از ابزارهای بومی، تولید چندرسانه‌ای و پنجره متن 1M توکن."
},
"gemini-2.0-flash-exp": {
"description": "مدل متغیر Gemini 2.0 Flash که برای بهینه‌سازی هزینه و تأخیر کم طراحی شده است."
},
"gemini-2.0-flash-exp-image-generation": {
"description": "مدل آزمایشی Gemini 2.0 Flash، از تولید تصویر پشتیبانی می‌کند"
},
"gemini-2.0-flash-lite": {
"description": "مدل متغیر Gemini 2.0 Flash برای بهینه‌سازی هزینه و تأخیر کم طراحی شده است."
},
"gemini-2.0-flash-lite-001": {
"description": "مدل متغیر Gemini 2.0 Flash برای بهینه‌سازی هزینه و تأخیر کم طراحی شده است."
},
"gemini-2.5-flash": {
"description": "Gemini 2.5 Flash مدل با بهترین نسبت قیمت به کارایی گوگل است که امکانات جامع را ارائه می‌دهد."
},
"gemini-2.5-flash-image": {
"description": "Nano Banana جدیدترین، سریع‌ترین و کارآمدترین مدل چندرسانه‌ای بومی گوگل است که به شما امکان می‌دهد از طریق گفتگو تصاویر را تولید و ویرایش کنید."
},
"gemini-2.5-flash-image-preview": {
"description": "Nano Banana جدیدترین، سریع‌ترین و کارآمدترین مدل چندرسانه‌ای بومی گوگل است که به شما امکان می‌دهد از طریق گفتگو تصاویر را تولید و ویرایش کنید."
},
"gemini-2.5-flash-image-preview:image": {
"description": "Nano Banana جدیدترین، سریع‌ترین و کارآمدترین مدل چندرسانه‌ای بومی گوگل است که به شما امکان می‌دهد از طریق گفتگو تصاویر را تولید و ویرایش کنید."
},
"gemini-2.5-flash-image:image": {
"description": "Nano Banana جدیدترین، سریع‌ترین و کارآمدترین مدل چندرسانه‌ای بومی گوگل است که به شما امکان می‌دهد از طریق گفتگو تصاویر را تولید و ویرایش کنید."
},
"gemini-2.5-flash-lite": {
"description": "Gemini 2.5 Flash-Lite کوچک‌ترین و مقرون‌به‌صرفه‌ترین مدل گوگل است که برای استفاده در مقیاس وسیع طراحی شده است."
},
"gemini-2.5-flash-lite-preview-06-17": {
"description": "Gemini 2.5 Flash-Lite Preview کوچک‌ترین و مقرون‌به‌صرفه‌ترین مدل گوگل است که برای استفاده در مقیاس بزرگ طراحی شده است."
},
"gemini-2.5-flash-lite-preview-09-2025": {
"description": "نسخه پیش‌نمایش (25 سپتامبر 2025) از Gemini 2.5 Flash-Lite"
},
"gemini-2.5-flash-preview-04-17": {
"description": "پیش‌نمایش فلش Gemini 2.5 مدل با بهترین قیمت و کیفیت گوگل است که امکانات جامع و کاملی را ارائه می‌دهد."
},
"gemini-2.5-flash-preview-09-2025": {
"description": "نسخه پیش‌نمایش (25 سپتامبر 2025) از Gemini 2.5 Flash"
},
"gemini-2.5-pro": {
"description": "Gemini 2.5 Pro پیشرفته‌ترین مدل تفکر گوگل است که قادر به استنتاج مسائل پیچیده در حوزه کد، ریاضیات و STEM بوده و با استفاده از زمینه طولانی، تحلیل مجموعه داده‌ها، کدها و مستندات بزرگ را انجام می‌دهد."
},
"gemini-2.5-pro-preview-03-25": {
"description": "پیش‌نمایش Gemini 2.5 Pro مدل پیشرفته تفکر گوگل است که قادر به استدلال در مورد کد، ریاضیات و مسائل پیچیده در زمینه STEM می‌باشد و همچنین می‌تواند با استفاده از تحلیل زمینه‌ای طولانی، مجموعه‌های داده بزرگ، کتابخانه‌های کد و مستندات را بررسی کند."
},
"gemini-2.5-pro-preview-05-06": {
"description": "Gemini 2.5 Pro Preview مدل پیشرفته تفکر گوگل است که قادر به استدلال در مورد کد، ریاضیات و مسائل پیچیده در زمینه STEM می‌باشد و می‌تواند با استفاده از تحلیل زمینه‌ای طولانی، مجموعه‌های داده بزرگ، کتابخانه‌های کد و مستندات را بررسی کند."
},
"gemini-2.5-pro-preview-06-05": {
"description": "Gemini 2.5 Pro Preview پیشرفته‌ترین مدل تفکر گوگل است که قادر به استدلال درباره مسائل پیچیده در حوزه کد، ریاضیات و STEM است و می‌تواند با استفاده از زمینه طولانی، داده‌های بزرگ، مخازن کد و مستندات را تحلیل کند."
},
"gemini-3-pro-image-preview": {
"description": "Gemini 3 Pro Image (Nano Banana Pro) مدل تولید تصویر Google است که از گفت‌وگوی چندوجهی نیز پشتیبانی می‌کند."
},
"gemini-3-pro-image-preview:image": {
"description": "Gemini 3 Pro Image (Nano Banana Pro) مدل تولید تصویر Google است که از گفت‌وگوی چندوجهی نیز پشتیبانی می‌کند."
},
"gemini-3-pro-preview": {
"description": "Gemini 3 Pro بهترین مدل درک چندوجهی در جهان است و قدرتمندترین عامل هوشمند و مدل برنامه‌نویسی زمینه‌ای Google تا به امروز محسوب می‌شود. این مدل جلوه‌های بصری غنی‌تر و تعامل عمیق‌تری را ارائه می‌دهد که همگی بر پایه توانایی‌های پیشرفته استدلال بنا شده‌اند."
},
"gemini-flash-latest": {
"description": "جدیدترین نسخه Gemini Flash"
},
"gemini-flash-lite-latest": {
"description": "جدیدترین نسخه Gemini Flash-Lite"
},
"gemini-pro-latest": {
"description": "جدیدترین نسخه Gemini Pro"
},
"gemma-7b-it": {
"description": "Gemma 7B برای پردازش وظایف کوچک و متوسط مناسب است و از نظر هزینه مؤثر است."
},
"gemma2": {
"description": "Gemma 2 یک مدل کارآمد است که توسط Google ارائه شده و شامل طیف گسترده‌ای از کاربردها از برنامه‌های کوچک تا پردازش داده‌های پیچیده می‌باشد."
},
"gemma2-9b-it": {
"description": "Gemma 2 9B یک مدل بهینه‌سازی شده برای وظایف خاص و ادغام ابزارها است."
},
"gemma2:27b": {
"description": "Gemma 2 یک مدل کارآمد از Google است که طیف گسترده‌ای از کاربردها را از برنامه‌های کوچک تا پردازش داده‌های پیچیده پوشش می‌دهد."
},
"gemma2:2b": {
"description": "Gemma 2 یک مدل کارآمد است که توسط Google ارائه شده و شامل طیف گسترده‌ای از کاربردها از برنامه‌های کوچک تا پردازش داده‌های پیچیده می‌باشد."
},
"generalv3": {
"description": "Spark Pro یک مدل زبان بزرگ با عملکرد بالا است که برای حوزه‌های حرفه‌ای بهینه‌سازی شده است و بر ریاضیات، برنامه‌نویسی، پزشکی، آموزش و سایر حوزه‌ها تمرکز دارد. این مدل از جستجوی آنلاین و افزونه‌های داخلی مانند وضعیت آب‌وهوا و تاریخ پشتیبانی می‌کند. مدل بهینه‌شده آن در پرسش و پاسخ‌های پیچیده، درک زبان و تولید متون سطح بالا عملکرد برجسته و کارآمدی از خود نشان می‌دهد و انتخابی ایده‌آل برای کاربردهای حرفه‌ای است."
},
"generalv3.5": {
"description": "Spark Max جامع‌ترین نسخه است که از جستجوی آنلاین و تعداد زیادی افزونه داخلی پشتیبانی می‌کند. قابلیت‌های هسته‌ای بهینه‌سازی‌شده و تنظیمات نقش‌های سیستمی و عملکرد فراخوانی توابع، آن را در انواع سناریوهای پیچیده بسیار برجسته و کارآمد می‌سازد."
},
"glm-4": {
"description": "GLM-4 نسخه قدیمی پرچمدار است که در ژانویه 2024 منتشر شد و اکنون با نسخه قوی‌تر GLM-4-0520 جایگزین شده است."
},
"glm-4-0520": {
"description": "GLM-4-0520 جدیدترین نسخه مدل است که برای وظایف بسیار پیچیده و متنوع طراحی شده و عملکردی عالی دارد."
},
"glm-4-32b-0414": {
"description": "GLM-4 32B 0414، نسخه عمومی مدل بزرگ سری GLM، پشتیبانی از تولید و درک متن در وظایف چندگانه."
},
"glm-4-9b-chat": {
"description": "GLM-4-9B-Chat عملکرد بالایی در زمینه‌های معناشناسی، ریاضیات، استدلال، کدنویسی و دانش دارد. همچنین از مرور وب، اجرای کد، فراخوانی ابزارهای سفارشی و استدلال متون بلند پشتیبانی می‌کند. این مدل از ۲۶ زبان از جمله ژاپنی، کره‌ای و آلمانی پشتیبانی می‌نماید."
},
"glm-4-air": {
"description": "GLM-4-Air نسخه‌ای با صرفه اقتصادی است که عملکردی نزدیک به GLM-4 دارد و سرعت بالا و قیمت مناسبی را ارائه می‌دهد."
},
"glm-4-air-250414": {
"description": "GLM-4-Air نسخه‌ای با قیمت مناسب است که عملکردی نزدیک به GLM-4 ارائه می‌دهد و سرعت بالا و قیمت مقرون به صرفه‌ای دارد."
},
"glm-4-airx": {
"description": "GLM-4-AirX نسخه‌ای کارآمد از GLM-4-Air ارائه می‌دهد که سرعت استنتاج آن تا ۲.۶ برابر بیشتر است."
},
"glm-4-alltools": {
"description": "GLM-4-AllTools یک مدل چندمنظوره هوشمند است که برای پشتیبانی از برنامه‌ریزی دستورات پیچیده و فراخوانی ابزارها بهینه‌سازی شده است، مانند مرور وب، تفسیر کد و تولید متن، و برای اجرای چندوظیفه‌ای مناسب است."
},
"glm-4-flash": {
"description": "GLM-4-Flash انتخابی ایده‌آل برای انجام وظایف ساده است، سریع‌ترین و رایگان."
},
"glm-4-flash-250414": {
"description": "GLM-4-Flash انتخاب ایده‌آلی برای پردازش وظایف ساده است، سریع‌ترین و رایگان است."
},
"glm-4-flashx": {
"description": "GLM-4-FlashX نسخه بهبود یافته Flash است که سرعت استنتاج فوق‌العاده سریعی دارد."
},
"glm-4-long": {
"description": "GLM-4-Long از ورودی‌های متنی بسیار طولانی پشتیبانی می‌کند و برای وظایف حافظه‌ای و پردازش اسناد بزرگ مناسب است."
},
"glm-4-plus": {
"description": "GLM-4-Plus به عنوان پرچمدار هوشمند پیشرفته، دارای توانایی پردازش متون طولانی و وظایف پیچیده است و عملکرد آن به طور کامل بهبود یافته است."
},
"glm-4.1v-thinking-flash": {
"description": "سری مدل‌های GLM-4.1V-Thinking قوی‌ترین مدل‌های زبان تصویری (VLM) در سطح 10 میلیارد پارامتر شناخته شده تا کنون هستند که وظایف زبان تصویری پیشرفته هم‌رده SOTA را شامل می‌شوند، از جمله درک ویدئو، پرسش و پاسخ تصویری، حل مسائل علمی، شناسایی متن OCR، تفسیر اسناد و نمودارها، عامل‌های رابط کاربری گرافیکی، کدنویسی صفحات وب فرانت‌اند، و گراندینگ. توانایی‌های این مدل‌ها حتی از مدل Qwen2.5-VL-72B با 8 برابر پارامتر بیشتر نیز فراتر رفته است. با استفاده از فناوری پیشرفته یادگیری تقویتی، مدل توانسته است با استدلال زنجیره تفکر دقت و غنای پاسخ‌ها را افزایش دهد و از نظر نتایج نهایی و قابلیت تبیین به طور قابل توجهی از مدل‌های غیرتفکری سنتی پیشی بگیرد."
},
"glm-4.1v-thinking-flashx": {
"description": "سری مدل‌های GLM-4.1V-Thinking قوی‌ترین مدل‌های زبان تصویری (VLM) در سطح 10 میلیارد پارامتر شناخته شده تا کنون هستند که وظایف زبان تصویری پیشرفته هم‌رده SOTA را شامل می‌شوند، از جمله درک ویدئو، پرسش و پاسخ تصویری، حل مسائل علمی، شناسایی متن OCR، تفسیر اسناد و نمودارها، عامل‌های رابط کاربری گرافیکی، کدنویسی صفحات وب فرانت‌اند، و گراندینگ. توانایی‌های این مدل‌ها حتی از مدل Qwen2.5-VL-72B با 8 برابر پارامتر بیشتر نیز فراتر رفته است. با استفاده از فناوری پیشرفته یادگیری تقویتی، مدل توانسته است با استدلال زنجیره تفکر دقت و غنای پاسخ‌ها را افزایش دهد و از نظر نتایج نهایی و قابلیت تبیین به طور قابل توجهی از مدل‌های غیرتفکری سنتی پیشی بگیرد."
},
"glm-4.5": {
"description": "مدل پرچمدار Zhipu که از حالت‌های تفکر متنوع پشتیبانی می‌کند، توانایی‌های جامع آن به سطح SOTA مدل‌های متن‌باز رسیده و طول متن زمینه‌ای تا ۱۲۸ هزار کاراکتر را پشتیبانی می‌کند."
},
"glm-4.5-air": {
"description": "نسخه سبک GLM-4.5 که تعادل بین عملکرد و هزینه را حفظ می‌کند و امکان تغییر انعطاف‌پذیر بین مدل‌های تفکر ترکیبی را فراهم می‌آورد."
},
"glm-4.5-airx": {
"description": "نسخه فوق‌العاده سریع GLM-4.5-Air که پاسخگویی سریع‌تری دارد و برای نیازهای بزرگ و سرعت بالا طراحی شده است."
},
"glm-4.5-flash": {
"description": "نسخه رایگان GLM-4.5 که در وظایفی مانند استنتاج، کدنویسی و عامل‌ها عملکرد خوبی دارد."
},
"glm-4.5-x": {
"description": "نسخه فوق‌العاده سریع GLM-4.5 که در کنار قدرت عملکرد، سرعت تولید تا 100 توکن در ثانیه را ارائه می‌دهد."
},
"glm-4.5v": {
"description": "نسل جدید مدل استنتاج بصری Zhipu مبتنی بر معماری MOE، با مجموع 106B پارامتر و 12B پارامتر فعال، در انواع بنچ‌مارک‌ها به SOTA در میان مدل‌های چندمودال متن‌باز هم‌رده در سطح جهانی دست یافته است و وظایف متداولی مانند درک تصویر، ویدئو، اسناد و تعامل با رابط‌های گرافیکی (GUI) را پوشش می‌دهد."
},
"glm-4.6": {
"description": "جدیدترین مدل پرچمدار Zhipu، GLM-4.6 (۳۵۵ میلیارد پارامتر)، در کدگذاری پیشرفته، پردازش متون بلند، استنتاج و توانایی‌های عامل هوشمند به طور کامل از نسل قبلی پیشی گرفته است، به ویژه در توانایی برنامه‌نویسی که با Claude Sonnet 4 هم‌تراز است و به یکی از برترین مدل‌های کدینگ داخلی تبدیل شده است."
},
"glm-4v": {
"description": "GLM-4V قابلیت‌های قدرتمندی در درک و استدلال تصویری ارائه می‌دهد و از وظایف مختلف بصری پشتیبانی می‌کند."
},
"glm-4v-flash": {
"description": "GLM-4V-Flash بر روی درک کارآمد تصویر واحد تمرکز دارد و برای سناریوهای تحلیل سریع تصویر، مانند تحلیل تصویر در زمان واقعی یا پردازش دسته‌ای تصاویر مناسب است."
},
"glm-4v-plus": {
"description": "GLM-4V-Plus توانایی درک محتوای ویدئویی و تصاویر متعدد را دارد و برای وظایف چندرسانه‌ای مناسب است."
},
"glm-4v-plus-0111": {
"description": "GLM-4V-Plus دارای توانایی درک محتوای ویدئویی و چندین تصویر است و برای وظایف چندرسانه‌ای مناسب است."
},
"glm-z1-air": {
"description": "مدل استدلال: دارای توانایی استدلال قوی و مناسب برای وظایفی که نیاز به استدلال عمیق دارند."
},
"glm-z1-airx": {
"description": "استدلال فوق‌العاده سریع: دارای سرعت استدلال بسیار بالا و عملکرد قوی است."
},
"glm-z1-flash": {
"description": "سری GLM-Z1 دارای توانایی‌های قوی در استدلال پیچیده است و در زمینه‌های استدلال منطقی، ریاضیات و برنامه‌نویسی عملکرد برجسته‌ای دارد."
},
"glm-z1-flashx": {
"description": "سرعت بالا و قیمت پایین: نسخه تقویت‌شده Flash با سرعت استنتاج بسیار سریع‌تر و تضمین همزمانی بالاتر."
},
"glm-zero-preview": {
"description": "GLM-Zero-Preview دارای توانایی‌های پیچیده استدلال است و در زمینه‌های استدلال منطقی، ریاضیات، برنامه‌نویسی و غیره عملکرد عالی دارد."
},
"global.anthropic.claude-opus-4-5-20251101-v1:0": {
"description": "Claude Opus 4.5 مدل پرچم‌دار شرکت Anthropic است که هوش برجسته را با عملکرد مقیاس‌پذیر ترکیب می‌کند و برای انجام وظایف پیچیده‌ای که نیازمند پاسخ‌های با بالاترین کیفیت و توانایی استدلال هستند، مناسب است."
},
"google/gemini-2.0-flash": {
"description": "Gemini 2.0 Flash مدل استدلال با عملکرد بالای Google است که برای وظایف چندوجهی گسترده مناسب است."
},
"google/gemini-2.0-flash-001": {
"description": "Gemini 2.0 Flash ویژگی‌ها و بهبودهای نسل بعدی را ارائه می‌دهد، از جمله سرعت عالی، استفاده از ابزارهای بومی، تولید چندرسانه‌ای و پنجره متن 1M توکن."
},
"google/gemini-2.0-flash-exp:free": {
"description": "Gemini 2.0 Flash Experimental جدیدترین مدل هوش مصنوعی چندرسانه‌ای آزمایشی گوگل است که نسبت به نسخه‌های قبلی خود بهبود کیفیت قابل توجهی دارد، به ویژه در زمینه دانش جهانی، کد و زمینه‌های طولانی."
},
"google/gemini-2.0-flash-lite": {
"description": "Gemini 2.0 Flash Lite ویژگی‌ها و قابلیت‌های نسل بعدی را ارائه می‌دهد، از جمله سرعت عالی، استفاده داخلی از ابزارها، تولید چندرسانه‌ای و پنجره زمینه 1 میلیون توکن."
},
"google/gemini-2.0-flash-lite-001": {
"description": "Gemini 2.0 Flash Lite نسخه سبک خانواده Gemini است که به‌طور پیش‌فرض حالت فکری را غیرفعال کرده تا تأخیر و هزینه را کاهش دهد، اما می‌توان آن را از طریق پارامتر فعال کرد."
},
"google/gemini-2.5-flash": {
"description": "سری Gemini 2.5 Flash (Lite/Pro/Flash) مدل‌های استدلال Google با تأخیر کم تا عملکرد بالا هستند."
},
"google/gemini-2.5-flash-image": {
"description": "Gemini 2.5 Flash Image (Nano Banana) مدل تولید تصویر Google است که از گفت‌وگوی چندوجهی نیز پشتیبانی می‌کند."
},
"google/gemini-2.5-flash-image-free": {
"description": "نسخه رایگان Gemini 2.5 Flash Image که از تولید چندوجهی با سهمیه محدود پشتیبانی می‌کند."
},
"google/gemini-2.5-flash-image-preview": {
"description": "مدل آزمایشی Gemini 2.5 Flash با پشتیبانی از تولید تصویر"
},
"google/gemini-2.5-flash-lite": {
"description": "Gemini 2.5 Flash Lite نسخه سبک Gemini 2.5 است که برای تأخیر و هزینه بهینه شده و برای سناریوهای با حجم بالا مناسب است."
},
"google/gemini-2.5-flash-preview": {
"description": "Gemini 2.5 Flash مدل اصلی پیشرفته گوگل است که به طور خاص برای استدلال پیشرفته، کدنویسی، ریاضیات و وظایف علمی طراحی شده است. این مدل دارای قابلیت «تفکر» داخلی است که به آن اجازه می‌دهد پاسخ‌هایی با دقت بالاتر و پردازش زمینه‌ای دقیق‌تری ارائه دهد.\n\nتوجه: این مدل دارای دو واریانت است: تفکر و غیرتفکر. قیمت‌گذاری خروجی بسته به فعال بودن قابلیت تفکر به طور قابل توجهی متفاوت است. اگر شما واریانت استاندارد (بدون پسوند «:thinking») را انتخاب کنید، مدل به وضوح از تولید توکن‌های تفکر اجتناب خواهد کرد.\n\nبرای استفاده از قابلیت تفکر و دریافت توکن‌های تفکر، شما باید واریانت «:thinking» را انتخاب کنید که منجر به قیمت‌گذاری بالاتر خروجی تفکر خواهد شد.\n\nعلاوه بر این، Gemini 2.5 Flash می‌تواند از طریق پارامتر «حداکثر تعداد توکن‌های استدلال» پیکربندی شود، همانطور که در مستندات توضیح داده شده است (https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning)."
},
"google/gemini-2.5-flash-preview:thinking": {
"description": "Gemini 2.5 Flash مدل اصلی پیشرفته گوگل است که به طور خاص برای استدلال پیشرفته، کدنویسی، ریاضیات و وظایف علمی طراحی شده است. این مدل دارای قابلیت «تفکر» داخلی است که به آن اجازه می‌دهد پاسخ‌هایی با دقت بالاتر و پردازش زمینه‌ای دقیق‌تری ارائه دهد.\n\nتوجه: این مدل دارای دو واریانت است: تفکر و غیرتفکر. قیمت‌گذاری خروجی بسته به فعال بودن قابلیت تفکر به طور قابل توجهی متفاوت است. اگر شما واریانت استاندارد (بدون پسوند «:thinking») را انتخاب کنید، مدل به وضوح از تولید توکن‌های تفکر اجتناب خواهد کرد.\n\nبرای استفاده از قابلیت تفکر و دریافت توکن‌های تفکر، شما باید واریانت «:thinking» را انتخاب کنید که منجر به قیمت‌گذاری بالاتر خروجی تفکر خواهد شد.\n\nعلاوه بر این، Gemini 2.5 Flash می‌تواند از طریق پارامتر «حداکثر تعداد توکن‌های استدلال» پیکربندی شود، همانطور که در مستندات توضیح داده شده است (https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning)."
},
"google/gemini-2.5-pro": {
"description": "Gemini 2.5 Pro مدل پرچم‌دار استدلال Google است که از زمینه طولانی و وظایف پیچیده پشتیبانی می‌کند."
},
"google/gemini-2.5-pro-free": {
"description": "نسخه رایگان Gemini 2.5 Pro که از زمینه طولانی چندوجهی با سهمیه محدود پشتیبانی می‌کند و برای آزمایش و جریان‌های کاری سبک مناسب است."
},
"google/gemini-2.5-pro-preview": {
"description": "Gemini 2.5 Pro Preview پیشرفته‌ترین مدل فکری گوگل است که قادر به استدلال درباره مسائل پیچیده در زمینه کد، ریاضیات و حوزه‌های STEM بوده و همچنین می‌تواند با استفاده از متن‌های طولانی، مجموعه‌های داده بزرگ، کدها و مستندات را تحلیل کند."
},
"google/gemini-3-pro-image-preview": {
"description": "Gemini 3 Pro Image (Nano Banana Pro) مدل تولید تصویر گوگل است که از گفت‌وگوی چندحالته پشتیبانی می‌کند."
},
"google/gemini-3-pro-image-preview-free": {
"description": "نسخه رایگان Gemini 3 Pro Image که از تولید چندوجهی با سهمیه محدود پشتیبانی می‌کند."
},
"google/gemini-3-pro-preview": {
"description": "Gemini 3 Pro نسل بعدی مدل استدلال چندوجهی از سری Gemini است که توانایی درک متن، صدا، تصویر، ویدیو و دیگر ورودی‌ها را دارد و می‌تواند وظایف پیچیده و مخازن کد بزرگ را پردازش کند."
},
"google/gemini-3-pro-preview-free": {
"description": "نسخه پیش‌نمایش رایگان Gemini 3 Pro با همان توانایی‌های درک و استدلال چندوجهی نسخه استاندارد، اما با محدودیت‌های سهمیه و نرخ، مناسب برای تجربه و استفاده کم‌تکرار."
},
"google/gemini-embedding-001": {
"description": "مدل جاسازی پیشرفته با عملکرد برجسته در وظایف زبان انگلیسی، چندزبانه و کد."
},
"google/gemini-flash-1.5": {
"description": "Gemini 1.5 Flash قابلیت پردازش چندوجهی بهینه‌شده را ارائه می‌دهد و برای انواع سناریوهای پیچیده مناسب است."
},
"google/gemini-pro-1.5": {
"description": "Gemini 1.5 Pro با ترکیب آخرین فناوری‌های بهینه‌سازی، توانایی پردازش داده‌های چندحالته را با کارایی بالاتر ارائه می‌دهد."
},
"google/gemma-2-27b": {
"description": "Gemma 2 مدل کارآمدی است که توسط Google ارائه شده و شامل طیف وسیعی از کاربردها از برنامه‌های کوچک تا پردازش داده‌های پیچیده است."
},
"google/gemma-2-27b-it": {
"description": "جمما ۲ ادامه‌دهنده‌ی ایده طراحی سبک و کارآمد است."
},
"google/gemma-2-2b-it": {
"description": "مدل بهینه‌سازی دستورات سبک گوگل"
},
"google/gemma-2-9b": {
"description": "Gemma 2 مدل کارآمدی است که توسط Google ارائه شده و شامل طیف وسیعی از کاربردها از برنامه‌های کوچک تا پردازش داده‌های پیچیده است."
},
"google/gemma-2-9b-it": {
"description": "Gemma 2 یک سری مدل‌های متنی سبک و متن‌باز از Google است."
},
"google/gemma-2-9b-it:free": {
"description": "Gemma 2 یک سری مدل‌های متن سبک و متن‌باز از Google است."
},
"google/gemma-2b-it": {
"description": "Gemma Instruct (2B) توانایی پردازش دستورات پایه را فراهم می‌کند و برای برنامه‌های سبک مناسب است."
},
"google/gemma-3-12b-it": {
"description": "Gemma 3 12B یک مدل زبان متن‌باز از گوگل است که استانداردهای جدیدی در زمینه کارایی و عملکرد ایجاد کرده است."
},
"google/gemma-3-27b-it": {
"description": "Gemma 3 27B یک مدل زبان متن باز از گوگل است که استانداردهای جدیدی را در زمینه کارایی و عملکرد تعیین کرده است."
},
"google/text-embedding-005": {
"description": "مدل جاسازی متن متمرکز بر زبان انگلیسی بهینه شده برای وظایف کد و زبان انگلیسی."
},
"google/text-multilingual-embedding-002": {
"description": "مدل جاسازی متن چندزبانه بهینه شده برای وظایف بین‌زبانی با پشتیبانی از زبان‌های متعدد."
},
"gpt-3.5-turbo": {
"description": "GPT 3.5 توربو، مناسب برای انواع وظایف تولید و درک متن، در حال حاضر به gpt-3.5-turbo-0125 اشاره می‌کند"
},
"gpt-3.5-turbo-0125": {
"description": "GPT 3.5 توربو، مناسب برای انواع وظایف تولید و درک متن، در حال حاضر به gpt-3.5-turbo-0125 اشاره می‌کند"
},
"gpt-3.5-turbo-1106": {
"description": "GPT 3.5 توربو، مناسب برای انواع وظایف تولید و درک متن، در حال حاضر به gpt-3.5-turbo-0125 اشاره می‌کند"
},
"gpt-3.5-turbo-instruct": {
"description": "GPT 3.5 توربو، مناسب برای انواع وظایف تولید و درک متن، در حال حاضر به gpt-3.5-turbo-0125 اشاره می‌کند"
},
"gpt-35-turbo": {
"description": "GPT 3.5 Turbo، مدلی کارآمد از OpenAI، مناسب برای چت و وظایف تولید متن است و از فراخوانی توابع به صورت موازی پشتیبانی می‌کند."
},
"gpt-35-turbo-16k": {
"description": "GPT 3.5 Turbo 16k، مدل تولید متن با ظرفیت بالا، مناسب برای وظایف پیچیده است."
},
"gpt-4": {
"description": "GPT-4 یک پنجره متنی بزرگتر ارائه می‌دهد که قادر به پردازش ورودی‌های متنی طولانی‌تر است و برای سناریوهایی که نیاز به ادغام گسترده اطلاعات و تحلیل داده‌ها دارند، مناسب است."
},
"gpt-4-0125-preview": {
"description": "جدیدترین مدل GPT-4 Turbo دارای قابلیت‌های بصری است. اکنون درخواست‌های بصری می‌توانند از حالت JSON و فراخوانی توابع استفاده کنند. GPT-4 Turbo یک نسخه بهبود یافته است که پشتیبانی مقرون‌به‌صرفه‌ای برای وظایف چندوجهی ارائه می‌دهد. این مدل بین دقت و کارایی تعادل برقرار می‌کند و برای سناریوهای کاربردی که نیاز به تعاملات بلادرنگ دارند، مناسب است."
},
"gpt-4-0613": {
"description": "GPT-4 یک پنجره متنی بزرگتر ارائه می‌دهد که قادر به پردازش ورودی‌های متنی طولانی‌تر است و برای سناریوهایی که نیاز به ادغام گسترده اطلاعات و تحلیل داده‌ها دارند، مناسب است."
},
"gpt-4-1106-preview": {
"description": "جدیدترین مدل GPT-4 Turbo دارای قابلیت‌های بصری است. اکنون درخواست‌های بصری می‌توانند از حالت JSON و فراخوانی توابع استفاده کنند. GPT-4 Turbo یک نسخه بهبود یافته است که پشتیبانی مقرون‌به‌صرفه‌ای برای وظایف چندوجهی ارائه می‌دهد. این مدل بین دقت و کارایی تعادل برقرار می‌کند و برای سناریوهای کاربردی که نیاز به تعاملات بلادرنگ دارند، مناسب است."
},
"gpt-4-32k": {
"description": "GPT-4 یک پنجره متنی بزرگتر ارائه می‌دهد که قادر به پردازش ورودی‌های متنی طولانی‌تر است و برای سناریوهایی که نیاز به ادغام گسترده اطلاعات و تحلیل داده‌ها دارند، مناسب است."
},
"gpt-4-32k-0613": {
"description": "GPT-4 یک پنجره متنی بزرگتر ارائه می‌دهد که قادر به پردازش ورودی‌های متنی طولانی‌تر است و برای سناریوهایی که نیاز به ادغام گسترده اطلاعات و تحلیل داده‌ها دارند، مناسب است."
},
"gpt-4-turbo": {
"description": "جدیدترین مدل GPT-4 Turbo دارای قابلیت‌های بصری است. اکنون درخواست‌های بصری می‌توانند از حالت JSON و فراخوانی توابع استفاده کنند. GPT-4 Turbo نسخه‌ای بهبود یافته است که پشتیبانی مقرون‌به‌صرفه‌ای برای وظایف چندوجهی ارائه می‌دهد. این مدل بین دقت و کارایی تعادل برقرار می‌کند و برای سناریوهای کاربردی که نیاز به تعاملات بلادرنگ دارند، مناسب است."
},
"gpt-4-turbo-2024-04-09": {
"description": "جدیدترین مدل GPT-4 Turbo دارای قابلیت‌های بصری است. اکنون درخواست‌های بصری می‌توانند از حالت JSON و فراخوانی توابع استفاده کنند. GPT-4 Turbo نسخه‌ای بهبود یافته است که پشتیبانی مقرون‌به‌صرفه‌ای برای وظایف چندوجهی ارائه می‌دهد. این مدل تعادلی بین دقت و کارایی برقرار می‌کند و برای سناریوهای کاربردی که نیاز به تعاملات بلادرنگ دارند، مناسب است."
},
"gpt-4-turbo-preview": {
"description": "جدیدترین مدل GPT-4 Turbo دارای قابلیت‌های بصری است. اکنون درخواست‌های بصری می‌توانند از حالت JSON و فراخوانی توابع استفاده کنند. GPT-4 Turbo یک نسخه بهبود یافته است که پشتیبانی مقرون‌به‌صرفه‌ای برای وظایف چندرسانه‌ای ارائه می‌دهد. این مدل بین دقت و کارایی تعادل برقرار می‌کند و برای سناریوهای کاربردی که نیاز به تعاملات بلادرنگ دارند، مناسب است."
},
"gpt-4-vision-preview": {
"description": "جدیدترین مدل GPT-4 Turbo دارای قابلیت‌های بصری است. اکنون درخواست‌های بصری می‌توانند از حالت JSON و فراخوانی توابع استفاده کنند. GPT-4 Turbo نسخه‌ای پیشرفته است که پشتیبانی مقرون‌به‌صرفه‌ای برای وظایف چندوجهی ارائه می‌دهد. این مدل بین دقت و کارایی تعادل برقرار می‌کند و برای سناریوهای کاربردی که نیاز به تعاملات بلادرنگ دارند، مناسب است."
},
"gpt-4.1": {
"description": "GPT-4.1 مدل پرچمدار ما برای وظایف پیچیده است. این مدل برای حل مسائل در زمینه‌های مختلف بسیار مناسب است."
},
"gpt-4.1-mini": {
"description": "GPT-4.1 mini تعادلی بین هوش، سرعت و هزینه ارائه می‌دهد و آن را به مدلی جذاب در بسیاری از موارد استفاده تبدیل می‌کند."
},
"gpt-4.1-nano": {
"description": "GPT-4.1 mini تعادلی بین هوش، سرعت و هزینه ارائه می‌دهد و آن را به مدلی جذاب در بسیاری از موارد استفاده تبدیل می‌کند."
},
"gpt-4.5-preview": {
"description": "GPT-4.5-preview یک مدل عمومی و جدید است که دانش گسترده‌ای از جهان دارد و درک عمیق‌تری از نیت کاربران ارائه می‌دهد؛ در انجام وظایف خلاقانه و برنامه‌ریزی به‌عنوان عامل (agent planning) توانمند است. دانش این مدل تا اکتبر ۲۰۲۳ به‌روز است."
},
"gpt-4o": {
"description": "پیشرفته‌ترین مدل چندوجهی در سری GPT-4 OpenAI که می‌تواند ورودی‌های متنی و تصویری را پردازش کند."
},
"gpt-4o-2024-05-13": {
"description": "ChatGPT-4o یک مدل پویا است که به‌صورت زنده به‌روزرسانی می‌شود تا همیشه نسخه‌ی جدید و به‌روز باشد. این مدل ترکیبی از توانایی‌های قوی در درک و تولید زبان است و برای کاربردهای گسترده مانند خدمات مشتری، آموزش و پشتیبانی فنی مناسب است."
},
"gpt-4o-2024-08-06": {
"description": "ChatGPT-4o یک مدل پویا است که به‌صورت لحظه‌ای به‌روزرسانی می‌شود تا همیشه نسخه‌ی جدید و به‌روز باشد. این مدل ترکیبی از توانایی‌های قوی در درک و تولید زبان است و برای کاربردهای گسترده مانند خدمات مشتری، آموزش و پشتیبانی فنی مناسب است."
},
"gpt-4o-2024-11-20": {
"description": "ChatGPT-4o یک مدل پویا است که به طور مداوم به‌روز رسانی می‌شود تا نسخه فعلی و جدیدی را حفظ کند. این مدل قدرت فهم و تولید زبان را ترکیب کرده و مناسب برای کاربردهای مقیاس بزرگ مانند خدمات مشتری، آموزش و پشتیبانی فنی است."
},
"gpt-4o-audio-preview": {
"description": "مدل پیش‌نمایش صوتی GPT-4o که از ورودی و خروجی صوتی پشتیبانی می‌کند."
},
"gpt-4o-mini": {
"description": "یک راه‌حل هوش مصنوعی مقرون‌به‌صرفه که برای انواع وظایف متنی و تصویری مناسب است."
},
"gpt-4o-mini-audio-preview": {
"description": "مدل GPT-4o mini Audio که از ورودی و خروجی صوتی پشتیبانی می‌کند."
},
"gpt-4o-mini-realtime-preview": {
"description": "نسخه زنده GPT-4o-mini، پشتیبانی از ورودی و خروجی صوتی و متنی به صورت زنده."
},
"gpt-4o-mini-search-preview": {
"description": "نسخه پیش‌نمایش جستجوی GPT-4o mini مدلی است که به طور خاص برای درک و اجرای پرسش‌های جستجوی وب آموزش دیده است و از API تکمیل چت استفاده می‌کند. علاوه بر هزینه توکن‌ها، هر پرسش جستجوی وب بر اساس هر بار فراخوانی ابزار هزینه دریافت می‌کند."
},
"gpt-4o-mini-transcribe": {
"description": "GPT-4o Mini Transcribe یک مدل تبدیل گفتار به متن است که از GPT-4o برای رونویسی صوت استفاده می‌کند. نسبت به مدل اصلی Whisper، نرخ خطای کلمات را کاهش داده و دقت و شناسایی زبان را بهبود بخشیده است. از آن برای دریافت رونویسی دقیق‌تر استفاده کنید."
},
"gpt-4o-mini-tts": {
"description": "GPT-4o mini TTS یک مدل تبدیل متن به گفتار است که بر اساس GPT-4o mini ساخته شده است و با قیمت پایین تری از GPT-4o mini ارائه می‌دهد."
},
"gpt-4o-realtime-preview": {
"description": "نسخه زنده GPT-4o، پشتیبانی از ورودی و خروجی صوتی و متنی به صورت زنده."
},
"gpt-4o-realtime-preview-2024-10-01": {
"description": "نسخه زنده GPT-4o، پشتیبانی از ورودی و خروجی صوتی و متنی به صورت زنده."
},
"gpt-4o-realtime-preview-2025-06-03": {
"description": "نسخه بلادرنگ GPT-4o که از ورودی و خروجی همزمان صوت و متن پشتیبانی می‌کند."
},
"gpt-4o-search-preview": {
"description": "نسخه پیش‌نمایش جستجوی GPT-4o مدلی است که به طور خاص برای درک و اجرای پرسش‌های جستجوی وب آموزش دیده است و از API تکمیل چت استفاده می‌کند. علاوه بر هزینه توکن‌ها، هر پرسش جستجوی وب بر اساس هر بار فراخوانی ابزار هزینه دریافت می‌کند."
},
"gpt-4o-transcribe": {
"description": "GPT-4o Transcribe یک مدل تبدیل گفتار به متن است که از GPT-4o برای رونویسی صوت استفاده می‌کند. نسبت به مدل اصلی Whisper، نرخ خطای کلمات را کاهش داده و دقت و شناسایی زبان را بهبود بخشیده است. از آن برای دریافت رونویسی دقیق‌تر استفاده کنید."
},
"gpt-5": {
"description": "بهترین مدل برای کدگذاری و وظایف نمایندگی در حوزه‌های مختلف. GPT-5 جهشی در دقت، سرعت، استدلال، درک زمینه، تفکر ساختاری و حل مسئله ایجاد کرده است."
},
"gpt-5-chat": {
"description": "نسخه پیش‌نمایش GPT-5 Chat که برای سناریوهای مکالمه‌ای بهینه‌سازی شده است. از ورودی متنی و تصویری پشتیبانی می‌کند و فقط خروجی متنی ارائه می‌دهد. مناسب برای ربات‌های گفتگو و برنامه‌های هوش مصنوعی مکالمه‌محور."
},
"gpt-5-chat-latest": {
"description": "مدل GPT-5 استفاده شده در ChatGPT. ترکیبی از درک و تولید زبان قدرتمند، مناسب برای برنامه‌های تعاملی گفتگو محور."
},
"gpt-5-codex": {
"description": "GPT-5 Codex نسخه‌ای از GPT-5 است که برای وظایف کدنویسی نمایندگی در محیط‌های Codex یا مشابه بهینه شده است."
},
"gpt-5-mini": {
"description": "نسخه‌ای سریع‌تر و اقتصادی‌تر از GPT-5، مناسب برای وظایف با تعریف واضح. در حالی که کیفیت خروجی بالا حفظ می‌شود، پاسخگویی سریع‌تری ارائه می‌دهد."
},
"gpt-5-nano": {
"description": "سریع‌ترین و اقتصادی‌ترین نسخه GPT-5. بسیار مناسب برای کاربردهایی که نیاز به پاسخ سریع و حساسیت به هزینه دارند."
},
"gpt-5-pro": {
"description": "GPT-5 pro با استفاده از محاسبات بیشتر، عمیق‌تر می‌اندیشد و به طور مداوم پاسخ‌های بهتری ارائه می‌دهد."
},
"gpt-5.1": {
"description": "GPT-5.1 — مدل پرچم‌دار بهینه‌سازی‌شده برای وظایف کدنویسی و عامل‌ها، با پشتیبانی از شدت استدلال قابل تنظیم و زمینه‌های طولانی‌تر."
},
"gpt-5.1-chat-latest": {
"description": "GPT-5.1 Chat: نسخه‌ای از GPT-5.1 برای ChatGPT، مناسب برای سناریوهای گفتگو."
},
"gpt-5.1-codex": {
"description": "GPT-5.1 Codex: نسخه‌ای از GPT-5.1 بهینه‌سازی‌شده برای وظایف کدنویسی عامل‌محور، قابل استفاده در API پاسخ‌ها برای جریان‌های کاری پیچیده‌تر در زمینه کد و عامل‌ها."
},
"gpt-5.1-codex-mini": {
"description": "GPT-5.1 Codex mini: نسخه‌ای کوچک‌تر و مقرون‌به‌صرفه‌تر از Codex، بهینه‌سازی‌شده برای وظایف کدنویسی عامل‌محور."
},
"gpt-audio": {
"description": "GPT Audio مدلی عمومی برای چت با ورودی و خروجی صوتی است که از استفاده از ورودی/خروجی صوتی در API تکمیل چت پشتیبانی می‌کند."
},
"gpt-image-1": {
"description": "مدل تولید تصویر چندرسانه‌ای بومی ChatGPT"
},
"gpt-image-1-mini": {
"description": "نسخه‌ای مقرون‌به‌صرفه‌تر از GPT Image 1 که به‌صورت بومی از ورودی‌های متنی و تصویری پشتیبانی می‌کند و خروجی تصویری تولید می‌نماید."
},
"gpt-oss-120b": {
"description": "برای استفاده از این مدل نیاز به درخواست دسترسی می‌باشد. GPT-OSS-120B یک مدل زبان بزرگ متن‌باز از OpenAI است که توانایی بالایی در تولید متن دارد."
},
"gpt-oss-20b": {
"description": "برای استفاده از این مدل نیاز به درخواست دسترسی می‌باشد. GPT-OSS-20B یک مدل زبان میان‌رده متن‌باز از OpenAI است که توانایی تولید متن به‌صورت کارآمد را دارد."
},
"gpt-oss:120b": {
"description": "GPT-OSS 120B یک مدل زبان بزرگ متن‌باز منتشر شده توسط OpenAI است که از فناوری کوانتیزاسیون MXFP4 بهره می‌برد و به عنوان مدل پرچمدار شناخته می‌شود. این مدل نیازمند محیطی با چند GPU یا ایستگاه کاری با عملکرد بالا برای اجرا است و در استدلال پیچیده، تولید کد و پردازش چندزبانه عملکردی برجسته دارد و از فراخوانی توابع پیشرفته و یکپارچه‌سازی ابزارها پشتیبانی می‌کند."
},
"gpt-oss:20b": {
"description": "GPT-OSS 20B مدل زبان بزرگ متن‌باز منتشر شده توسط OpenAI است که از تکنولوژی کوانتیزاسیون MXFP4 بهره می‌برد و برای اجرا روی GPUهای مصرفی پیشرفته یا مک‌های مجهز به Apple Silicon مناسب است. این مدل در تولید گفتگو، کدنویسی و وظایف استنتاج عملکرد برجسته‌ای دارد و از فراخوانی توابع و استفاده از ابزارها پشتیبانی می‌کند."
},
"gpt-realtime": {
"description": "مدل عمومی زمان واقعی که از ورودی و خروجی متنی و صوتی به صورت زنده پشتیبانی می‌کند و همچنین ورودی تصویر را نیز قبول می‌کند."
},
"grok-2-image-1212": {
"description": "جدیدترین مدل تولید تصویر ما قادر است تصاویر زنده و واقعی را بر اساس متن توصیفی تولید کند. این مدل در زمینه تولید تصویر برای بازاریابی، رسانه‌های اجتماعی و سرگرمی عملکرد برجسته‌ای دارد."
},
"grok-2-vision-1212": {
"description": "این مدل در دقت، پیروی از دستورات و توانایی چند زبانه بهبود یافته است."
},
"grok-3": {
"description": "مدل پرچمدار که در استخراج داده، برنامه‌نویسی و خلاصه‌سازی متن برای کاربردهای سازمانی مهارت دارد و دانش عمیقی در حوزه‌های مالی، پزشکی، حقوقی و علمی دارد."
},
"grok-3-mini": {
"description": "مدل سبک‌وزن که قبل از پاسخگویی تفکر می‌کند. سریع و هوشمند اجرا می‌شود، مناسب برای وظایف منطقی که نیاز به دانش عمیق حوزه ندارند و می‌تواند مسیر تفکر اصلی را ارائه دهد."
},
"grok-4": {
"description": "جدیدترین و قدرتمندترین مدل پرچمدار ما که در پردازش زبان طبیعی، محاسبات ریاضی و استدلال عملکردی برجسته دارد — یک انتخاب همه‌کاره بی‌نظیر است."
},
"grok-4-0709": {
"description": "Grok 4 از xAI با توانایی استدلال قدرتمند."
},
"grok-4-1-fast-non-reasoning": {
"description": "مدل پیشرفته چندوجهی که به‌طور ویژه برای بهینه‌سازی فراخوانی ابزارهای نماینده با عملکرد بالا طراحی شده است."
},
"grok-4-1-fast-reasoning": {
"description": "مدل پیشرفته چندوجهی که به‌طور ویژه برای بهینه‌سازی فراخوانی ابزارهای نماینده با عملکرد بالا طراحی شده است."
},
"grok-4-fast-non-reasoning": {
"description": "خوشحالیم که Grok 4 Fast را منتشر می‌کنیم، که جدیدترین پیشرفت ما در زمینه مدل‌های استنتاج با صرفه‌جویی در هزینه است."
},
"grok-4-fast-reasoning": {
"description": "خوشحالیم که Grok 4 Fast را منتشر می‌کنیم، که جدیدترین پیشرفت ما در زمینه مدل‌های استنتاج با صرفه‌جویی در هزینه است."
},
"grok-code-fast-1": {
"description": "ما خوشحالیم که grok-code-fast-1 را معرفی کنیم، مدلی سریع و مقرون‌به‌صرفه برای استنتاج که در کدگذاری نماینده عملکرد برجسته‌ای دارد."
},
"groq/compound": {
"description": "Compound یک سیستم هوش مصنوعی ترکیبی است که توسط چندین مدل متن‌باز موجود در GroqCloud پشتیبانی می‌شود و می‌تواند به‌صورت هوشمند و انتخابی از ابزارها برای پاسخ به پرسش‌های کاربران استفاده کند."
},
"groq/compound-mini": {
"description": "Compound-mini یک سیستم هوش مصنوعی ترکیبی است که توسط مدل‌های متن‌باز موجود در GroqCloud پشتیبانی می‌شود و می‌تواند به‌صورت هوشمند و انتخابی از ابزارها برای پاسخ به پرسش‌های کاربران استفاده کند."
},
"gryphe/mythomax-l2-13b": {
"description": "MythoMax l2 13B یک مدل زبانی است که خلاقیت و هوش را با ترکیب چندین مدل برتر به هم پیوند می‌دهد."
},
"hunyuan-a13b": {
"description": "اولین مدل استدلال ترکیبی Hunyuan، نسخه ارتقا یافته hunyuan-standard-256K با 80 میلیارد پارامتر کل و 13 میلیارد پارامتر فعال است. حالت پیش‌فرض آن حالت تفکر کند است و از طریق پارامتر یا دستور می‌توان بین حالت‌های تفکر سریع و کند جابجا شد؛ روش جابجایی با افزودن /no_think قبل از پرسش انجام می‌شود. توانایی کلی نسبت به نسل قبلی بهبود یافته است، به‌ویژه در ریاضیات، علوم، درک متون بلند و قابلیت‌های عامل."
},
"hunyuan-code": {
"description": "مدل تولید کد جدید Hunyuan، که با استفاده از 200 میلیارد داده کد با کیفیت بالا آموزش داده شده است. این مدل پایه پس از شش ماه آموزش با داده‌های SFT با کیفیت بالا به‌روزرسانی شده است. طول پنجره متن به ۸ هزار کاراکتر افزایش یافته و در شاخص‌های ارزیابی خودکار تولید کد در پنج زبان اصلی در رتبه‌های برتر قرار دارد. در ارزیابی‌های دستی با کیفیت بالا برای ۱۰ معیار مختلف در پنج زبان اصلی، عملکرد این مدل در رده اول قرار دارد."
},
"hunyuan-functioncall": {
"description": "مدل FunctionCall با معماری MOE جدید Hunyuan، آموزش‌دیده با داده‌های باکیفیت FunctionCall، با پنجره متنی تا 32K و پیشرو در چندین شاخص ارزیابی."
},
"hunyuan-large": {
"description": "مدل Hunyuan-large دارای مجموع پارامترها حدود 389B و پارامترهای فعال حدود 52B است، که بزرگترین و بهترین مدل MoE با ساختار Transformer در صنعت به شمار می‌رود."
},
"hunyuan-large-longcontext": {
"description": "متخصص در پردازش وظایف متنی طولانی مانند خلاصه‌سازی اسناد و پرسش و پاسخ اسنادی، همچنین توانایی پردازش وظایف تولید متن عمومی را دارد. در تحلیل و تولید متن‌های طولانی عملکرد فوق‌العاده‌ای دارد و می‌تواند به‌طور مؤثر به نیازهای پیچیده و دقیق پردازش محتوای طولانی پاسخ دهد."
},
"hunyuan-large-vision": {
"description": "این مدل برای سناریوهای درک تصویر و متن مناسب است، یک مدل بزرگ زبان-بینایی مبتنی بر Hunyuan Large است که از ورودی چند تصویر با هر رزولوشن به همراه متن پشتیبانی می‌کند و محتوای متنی تولید می‌کند. تمرکز بر وظایف مرتبط با درک تصویر و متن دارد و در توانایی درک چندزبانه تصویر و متن بهبود قابل توجهی یافته است."
},
"hunyuan-lite": {
"description": "به ساختار MOE ارتقا یافته است، پنجره متنی 256k دارد و در چندین مجموعه ارزیابی در زمینه‌های NLP، کد، ریاضیات و صنایع از بسیاری از مدل‌های متن‌باز پیشی گرفته است."
},
"hunyuan-lite-vision": {
"description": "مدل چندرسانه‌ای 7B جدید Hunyuan، با پنجره زمینه 32K، از گفتگوی چندرسانه‌ای در صحنه‌های چینی و انگلیسی، شناسایی اشیاء در تصاویر، درک جداول اسناد و ریاضیات چندرسانه‌ای پشتیبانی می‌کند و در چندین بعد، معیارهای ارزیابی را نسبت به مدل‌های رقیب 7B بهبود می‌بخشد."
},
"hunyuan-pro": {
"description": "مدل MOE-32K با مقیاس پارامتر تریلیون‌ها. در انواع بنچمارک‌ها به سطح پیشرو مطلق دست یافته است، توانایی پردازش دستورالعمل‌ها و استدلال‌های پیچیده، دارای قابلیت‌های ریاضی پیچیده، پشتیبانی از functioncall، و به‌طور ویژه در حوزه‌های ترجمه چندزبانه، مالی، حقوقی و پزشکی بهینه‌سازی شده است."
},
"hunyuan-role": {
"description": "جدیدترین مدل نقش‌آفرینی HunYuan، مدل نقش‌آفرینی به‌دقت تنظیم‌شده توسط تیم رسمی HunYuan، که بر اساس مدل HunYuan و با استفاده از مجموعه داده‌های صحنه‌های نقش‌آفرینی آموزش بیشتری دیده است و در صحنه‌های نقش‌آفرینی عملکرد بهتری دارد."
},
"hunyuan-standard": {
"description": "استفاده از استراتژی مسیریابی بهینه‌تر، در حالی که مشکلات توازن بار و همگرایی متخصصان را کاهش می‌دهد. در زمینه متون طولانی، شاخص «یافتن سوزن در انبار کاه» به ۹۹.۹٪ می‌رسد. MOE-32K از نظر هزینه و عملکرد نسبتاً بهینه‌تر است و در عین حال که تعادل بین اثر و قیمت را حفظ می‌کند، می‌تواند پردازش ورودی‌های متون طولانی را نیز انجام دهد."
},
"hunyuan-standard-256K": {
"description": "با استفاده از استراتژی مسیریابی بهینه‌تر، در عین حال مشکلات توازن بار و همگرایی کارشناسان را کاهش داده است. در زمینه متون طولانی، شاخص «یافتن سوزن در انبار کاه» به ۹۹.۹٪ رسیده است. MOE-256K در طول و عملکرد پیشرفت بیشتری داشته و به طور قابل توجهی طول ورودی قابل قبول را گسترش داده است."
},
"hunyuan-standard-vision": {
"description": "مدل چندرسانه‌ای جدید Hunyuan، از پاسخگویی به چند زبان پشتیبانی می‌کند و توانایی‌های چینی و انگلیسی را به‌طور متوازن ارائه می‌دهد."
},
"hunyuan-t1-20250321": {
"description": "مدل‌های توانایی‌های علمی و انسانی را به طور کامل ایجاد می‌کند و توانایی بالایی در ضبط اطلاعات متنی طولانی دارد. از استدلال برای پاسخ به مسائل علمی مختلف با درجات سختی متفاوت در ریاضیات/منطق/علم/کد و غیره پشتیبانی می‌کند."
},
"hunyuan-t1-20250403": {
"description": "افزایش توانایی تولید کد در سطح پروژه؛ بهبود کیفیت نوشتار تولید متن؛ ارتقاء توانایی درک موضوعات چندمرحله‌ای، پیروی از دستورات tob و درک واژگان؛ بهینه‌سازی مشکلات خروجی ترکیبی از زبان‌های ساده و سنتی و همچنین ترکیب چینی و انگلیسی."
},
"hunyuan-t1-20250529": {
"description": "بهینه‌سازی تولید متن، نوشتن مقاله، بهبود توانایی‌های کدنویسی فرانت‌اند، ریاضیات، استدلال منطقی و علوم پایه، و ارتقاء توانایی پیروی از دستورالعمل‌ها."
},
"hunyuan-t1-20250711": {
"description": "افزایش قابل توجه در توانایی‌های ریاضی، منطقی و کدنویسی پیچیده، بهینه‌سازی پایداری خروجی مدل و ارتقاء توانایی مدل در پردازش متون طولانی."
},
"hunyuan-t1-latest": {
"description": "توانایی‌های مدل اصلی تفکر کند به‌طور قابل توجهی در زمینه‌های ریاضیات پیشرفته، استدلال پیچیده، کدهای دشوار، پیروی از دستورالعمل‌ها و کیفیت تولید متن بهبود یافته است."
},
"hunyuan-t1-vision-20250619": {
"description": "جدیدترین مدل تفکر عمیق چندرسانه‌ای t1-vision از Hunyuan که از زنجیره تفکر بلند چندرسانه‌ای بومی پشتیبانی می‌کند و نسبت به نسخه پیش‌فرض نسل قبلی به طور کامل بهبود یافته است."
},
"hunyuan-t1-vision-20250916": {
"description": "جدیدترین نسخه مدل بینایی عمیق Hunyuan t1-vision، نسبت به نسخه قبلی در وظایفی مانند پرسش و پاسخ تصویری عمومی، مکان‌یابی بصری، OCR، نمودارها، حل مسائل از روی عکس و خلق آثار از روی تصویر، به‌طور جامع بهبود یافته و توانایی آن در زبان انگلیسی و زبان‌های کم‌کاربرد به‌طور چشمگیری ارتقا یافته است."
},
"hunyuan-turbo": {
"description": "نسخه پیش‌نمایش مدل زبان بزرگ نسل جدید HunYuan که از ساختار مدل متخصص ترکیبی (MoE) جدید استفاده می‌کند. در مقایسه با hunyuan-pro، کارایی استنتاج سریع‌تر و عملکرد بهتری دارد."
},
"hunyuan-turbo-20241223": {
"description": "بهینه‌سازی‌های این نسخه: مقیاس‌دهی دستورات داده، به‌طور قابل توجهی توانایی تعمیم عمومی مدل را افزایش می‌دهد؛ به‌طور قابل توجهی توانایی‌های ریاضی، کدنویسی و استدلال منطقی را بهبود می‌بخشد؛ بهینه‌سازی توانایی‌های درک متن و کلمات مرتبط با آن؛ بهینه‌سازی کیفیت تولید محتوای خلق متن."
},
"hunyuan-turbo-latest": {
"description": "بهینه‌سازی تجربه عمومی، شامل درک NLP، خلق متن، گپ‌زنی، پرسش و پاسخ دانش، ترجمه و حوزه‌های مختلف؛ افزایش انسان‌نمایی، بهینه‌سازی هوش عاطفی مدل؛ افزایش توانایی مدل در روشن‌سازی فعال زمانی که نیت مبهم است؛ افزایش توانایی پردازش مسائل مربوط به تجزیه و تحلیل کلمات؛ افزایش کیفیت و قابلیت تعامل در خلق محتوا؛ بهبود تجربه چند دور."
},
"hunyuan-turbo-vision": {
"description": "مدل بزرگ زبان بصری نسل جدید Hunyuan، با استفاده از ساختار جدید مدل‌های متخصص ترکیبی (MoE)، در توانایی‌های مربوط به درک تصویر و متن، خلق محتوا، پرسش و پاسخ دانش و تحلیل استدلال نسبت به مدل‌های نسل قبلی به‌طور جامع بهبود یافته است."
},
"hunyuan-turbos-20250313": {
"description": "یکسان‌سازی سبک مراحل حل مسائل ریاضی، تقویت پرسش و پاسخ چندمرحله‌ای ریاضی. بهینه‌سازی سبک پاسخ در تولید متن، حذف حس مصنوعی هوش مصنوعی و افزودن زیبایی ادبی."
},
"hunyuan-turbos-20250416": {
"description": "ارتقاء پایه پیش‌آموزش، تقویت توانایی درک و پیروی از دستورات پایه؛ تقویت مهارت‌های علوم پایه مانند ریاضیات، کد نویسی، منطق و علوم؛ بهبود کیفیت نوشتار خلاقانه، درک متن، دقت ترجمه و پاسخ به سوالات دانش؛ تقویت توانایی‌های عامل‌های حوزه‌های مختلف، با تمرکز ویژه بر درک گفتگوی چندمرحله‌ای."
},
"hunyuan-turbos-20250604": {
"description": "ارتقاء پایه پیش‌آموزش، بهبود توانایی‌های نوشتن و درک مطلب، افزایش قابل توجه توانایی‌های کدنویسی و علوم پایه، و بهبود مستمر در پیروی از دستورات پیچیده."
},
"hunyuan-turbos-20250926": {
"description": "ارتقاء کیفیت داده‌های پایه پیش‌آموزش. بهینه‌سازی استراتژی آموزش در مرحله پس‌آموزش، با هدف بهبود مستمر قابلیت‌های عامل، زبان‌های کوچک انگلیسی، پیروی از دستورات، کدنویسی و علوم پایه."
},
"hunyuan-turbos-latest": {
"description": "hunyuan-TurboS آخرین نسخه مدل بزرگ پرچمدار مختلط است که دارای توانایی تفکر قوی‌تر و تجربه بهتری است."
},
"hunyuan-turbos-longtext-128k-20250325": {
"description": "این مدل در پردازش وظایف متنی طولانی مانند خلاصه‌سازی و پرسش و پاسخ مستندات مهارت دارد و همچنین توانایی پردازش وظایف تولید متن عمومی را دارد. در تحلیل و تولید متن‌های طولانی عملکرد فوق‌العاده‌ای دارد و می‌تواند به‌طور مؤثر به نیازهای پیچیده و دقیق پردازش محتوای طولانی پاسخ دهد."
},
"hunyuan-turbos-role-plus": {
"description": "جدیدترین مدل نقش‌آفرینی Hunyuan، مدل نقش‌آفرینی تنظیم‌شده رسمی Hunyuan است که بر اساس مدل Hunyuan و داده‌های سناریوی نقش‌آفرینی آموزش افزایشی دیده است و در سناریوهای نقش‌آفرینی عملکرد پایه بهتری دارد."
},
"hunyuan-turbos-vision": {
"description": "این مدل برای سناریوهای درک تصویر و متن مناسب است و بر اساس جدیدترین مدل turbos از Hunyuan ساخته شده است. این مدل پرچمدار زبان تصویری نسل جدید است که بر وظایف مرتبط با درک تصویر و متن تمرکز دارد، از جمله شناسایی موجودیت‌های مبتنی بر تصویر، پرسش و پاسخ دانش، خلق متن تبلیغاتی و حل مسائل با عکس‌برداری. نسبت به نسل قبلی به طور کامل بهبود یافته است."
},
"hunyuan-turbos-vision-20250619": {
"description": "جدیدترین مدل پرچمدار زبان تصویری turbos-vision از Hunyuan که در وظایف مرتبط با درک تصویر و متن، از جمله شناسایی موجودیت‌های مبتنی بر تصویر، پرسش و پاسخ دانش، خلق متن تبلیغاتی و حل مسائل با عکس‌برداری، نسبت به نسخه پیش‌فرض نسل قبلی به طور کامل بهبود یافته است."
},
"hunyuan-vision": {
"description": "جدیدترین مدل چندوجهی هون‌یوان، پشتیبانی از ورودی تصویر + متن برای تولید محتوای متنی."
},
"image-01": {
"description": "مدل جدید تولید تصویر با نمایش ظریف و پشتیبانی از تولید تصویر از متن و تصویر."
},
"image-01-live": {
"description": "مدل تولید تصویر با نمایش ظریف که از تولید تصویر از متن پشتیبانی می‌کند و امکان تنظیم سبک نقاشی را دارد."
},
"imagen-4.0-fast-generate-001": {
"description": "سری مدل‌های متن‌به‌تصویر Imagen، نسل چهارم، نسخهٔ سریع"
},
"imagen-4.0-generate-001": {
"description": "سری مدل‌های Imagen نسل چهارم برای تولید تصویر از متن"
},
"imagen-4.0-generate-preview-06-06": {
"description": "سری مدل‌های نسل چهارم Imagen برای تولید تصویر از متن"
},
"imagen-4.0-ultra-generate-001": {
"description": "نسخهٔ اولترا از مجموعهٔ مدل‌های متن‌به‌تصویر Imagen نسل چهارم"
},
"imagen-4.0-ultra-generate-preview-06-06": {
"description": "نسخه Ultra از سری مدل‌های نسل چهارم Imagen برای تولید تصویر از متن"
},
"inception/mercury-coder-small": {
"description": "Mercury Coder Small انتخاب ایده‌آل برای تولید، اشکال‌زدایی و بازسازی کد با کمترین تأخیر است."
},
"inclusionAI/Ling-flash-2.0": {
"description": "Ling-flash-2.0 سومین مدل از سری معماری Ling 2.0 است که توسط تیم Bailing شرکت Ant Group منتشر شده است. این مدل یک مدل متخصص ترکیبی (MoE) با ۱۰۰ میلیارد پارامتر کل است که در هر توکن تنها ۶.۱ میلیارد پارامتر فعال می‌شوند (۴.۸ میلیارد غیر بردار کلمه). به عنوان یک مدل با پیکربندی سبک، Ling-flash-2.0 در چندین ارزیابی معتبر عملکردی برابر یا حتی فراتر از مدل‌های متراکم ۴۰ میلیارد پارامتری و مدل‌های MoE بزرگ‌تر نشان داده است. هدف این مدل کشف مسیرهای کارآمد در چارچوب «مدل بزرگ برابر است با پارامتر بزرگ» از طریق طراحی معماری و استراتژی‌های آموزش بهینه است."
},
"inclusionAI/Ling-mini-2.0": {
"description": "Ling-mini-2.0 یک مدل زبان بزرگ کوچک‌حجم و با عملکرد بالا مبتنی بر معماری MoE است. این مدل دارای ۱۶ میلیارد پارامتر کل است اما در هر توکن تنها ۱.۴ میلیارد پارامتر فعال می‌شوند (۷۸۹ میلیون غیر بردار کلمه)، که سرعت تولید بسیار بالایی را فراهم می‌کند. به لطف طراحی کارآمد MoE و داده‌های آموزشی بزرگ و با کیفیت، با وجود فعال بودن تنها ۱.۴ میلیارد پارامتر، Ling-mini-2.0 در وظایف پایین‌دستی عملکردی در سطح مدل‌های متراکم زیر ۱۰ میلیارد و مدل‌های MoE بزرگ‌تر ارائه می‌دهد."
},
"inclusionAI/Ring-flash-2.0": {
"description": "Ring-flash-2.0 مدلی با عملکرد بالا برای تفکر است که بر پایه Ling-flash-2.0-base بهینه‌سازی عمیق شده است. این مدل از معماری متخصص ترکیبی (MoE) با ۱۰۰ میلیارد پارامتر کل بهره می‌برد اما در هر استنتاج تنها ۶.۱ میلیارد پارامتر فعال می‌شوند. این مدل با الگوریتم ابتکاری icepop مشکل ناپایداری مدل‌های بزرگ MoE در آموزش تقویتی (RL) را حل کرده و توانایی استنتاج پیچیده آن در طول آموزش‌های بلندمدت بهبود می‌یابد. Ring-flash-2.0 در مسابقات ریاضی، تولید کد و استدلال منطقی در چندین بنچمارک دشوار پیشرفت قابل توجهی داشته است و عملکرد آن نه تنها از مدل‌های متراکم برتر زیر ۴۰ میلیارد پارامتر فراتر رفته، بلکه با مدل‌های MoE متن‌باز بزرگ‌تر و مدل‌های تفکر با عملکرد بالا و بسته رقابت می‌کند. اگرچه این مدل بر استنتاج پیچیده تمرکز دارد، در وظایف خلاقانه نوشتاری نیز عملکرد خوبی دارد. علاوه بر این، به لطف طراحی معماری کارآمد، Ring-flash-2.0 ضمن ارائه عملکرد قدرتمند، استنتاج سریع را ممکن ساخته و هزینه استقرار مدل‌های تفکر در شرایط بار بالا را به طور قابل توجهی کاهش می‌دهد."
},
"inclusionai/ling-1t": {
"description": "Ling-1T مدل MoE با ظرفیت 1 تریلیون پارامتر از inclusionAI است که برای وظایف استدلالی شدید و زمینه‌های بزرگ بهینه شده است."
},
"inclusionai/ling-flash-2.0": {
"description": "Ling-flash-2.0 مدل MoE از inclusionAI است که برای بهره‌وری و عملکرد استدلالی بهینه شده و برای وظایف متوسط تا بزرگ مناسب است."
},
"inclusionai/ling-mini-2.0": {
"description": "Ling-mini-2.0 نسخه سبک مدل MoE از inclusionAI است که با حفظ توانایی استدلال، هزینه‌ها را به‌طور قابل توجهی کاهش می‌دهد."
},
"inclusionai/ming-flash-omini-preview": {
"description": "Ming-flash-omni Preview مدل چندوجهی از inclusionAI است که از ورودی‌های صوتی، تصویری و ویدیویی پشتیبانی می‌کند و توانایی‌های رندر تصویر و تشخیص صدا را بهینه کرده است."
},
"inclusionai/ring-1t": {
"description": "Ring-1T مدل MoE با ظرفیت تریلیونی از inclusionAI است که برای استدلال در مقیاس بزرگ و وظایف تحقیقاتی مناسب است."
},
"inclusionai/ring-flash-2.0": {
"description": "Ring-flash-2.0 نسخه‌ای از مدل Ring از inclusionAI است که برای سناریوهای با حجم بالا طراحی شده و بر سرعت و بهره‌وری هزینه تأکید دارد."
},
"inclusionai/ring-mini-2.0": {
"description": "Ring-mini-2.0 نسخه سبک و با حجم بالا از مدل MoE inclusionAI است که عمدتاً برای سناریوهای هم‌زمانی بالا استفاده می‌شود."
},
"internlm/internlm2_5-7b-chat": {
"description": "InternLM2.5 راه‌حل‌های گفتگوی هوشمند در چندین سناریو ارائه می‌دهد."
},
"internlm2.5-latest": {
"description": "جدیدترین سری مدل‌های ما با عملکرد استدلال عالی، از طول متن ۱M پشتیبانی می‌کند و توانایی‌های قوی‌تری در پیروی از دستورات و فراخوانی ابزارها دارد."
},
"internlm3-latest": {
"description": "سری جدیدترین مدل‌های ما با عملکرد استدلال برجسته، پیشتاز مدل‌های متن‌باز در همان سطح هستند. به طور پیش‌فرض به جدیدترین مدل‌های سری InternLM3 ما اشاره دارد."
},
"internvl2.5-38b-mpo": {
"description": "InternVL2.5 38B MPO، مدل پیش‌آموزش چندوجهی، پشتیبانی از وظایف پیچیده استنتاج تصویر و متن."
},
"internvl2.5-latest": {
"description": "ما هنوز در حال نگهداری نسخه InternVL2.5 هستیم که دارای عملکرد عالی و پایدار است. به طور پیش‌فرض به جدیدترین مدل‌های سری InternVL2.5 ما اشاره دارد که در حال حاضر به internvl2.5-78b اشاره دارد."
},
"internvl3-14b": {
"description": "InternVL3 14B، مدل چندوجهی با مقیاس متوسط، با تعادل بین عملکرد و هزینه."
},
"internvl3-1b": {
"description": "InternVL3 1B، مدل چندوجهی سبک، مناسب برای استقرار در محیط‌های با منابع محدود."
},
"internvl3-38b": {
"description": "InternVL3 38B، مدل بزرگ چندوجهی متن‌باز، مناسب برای وظایف درک تصویر و متن با دقت بالا."
},
"internvl3-latest": {
"description": "ما جدیدترین مدل بزرگ چندرسانه‌ای خود را منتشر کرده‌ایم که دارای توانایی‌های قوی‌تر در درک متن و تصویر و درک تصاویر در زمان‌های طولانی است و عملکرد آن با مدل‌های برتر بسته به منبع قابل مقایسه است. به طور پیش‌فرض به جدیدترین مدل‌های سری InternVL ما اشاره دارد که در حال حاضر به internvl3-78b اشاره دارد."
},
"irag-1.0": {
"description": "ERNIE iRAG، مدل تولید تقویت‌شده با بازیابی تصویر، پشتیبانی از جستجوی تصویری، بازیابی تصویر و متن و تولید محتوا."
},
"jamba-large": {
"description": "قدرت‌مندترین و پیشرفته‌ترین مدل ما، که به‌طور خاص برای پردازش وظایف پیچیده در سطح سازمانی طراحی شده و دارای عملکرد فوق‌العاده‌ای است."
},
"jamba-mini": {
"description": "مدل کارآمدترین در این سطح، که سرعت و کیفیت را با هم ترکیب می‌کند و دارای ابعاد کوچکتری است."
},
"jina-deepsearch-v1": {
"description": "جستجوی عمیق ترکیبی از جستجوی اینترنتی، خواندن و استدلال است که می‌تواند تحقیقات جامع را انجام دهد. می‌توانید آن را به عنوان یک نماینده در نظر بگیرید که وظایف تحقیق شما را می‌پذیرد - این نماینده جستجوی گسترده‌ای انجام می‌دهد و پس از چندین بار تکرار، پاسخ را ارائه می‌دهد. این فرآیند شامل تحقیق مداوم، استدلال و حل مسئله از زوایای مختلف است. این با مدل‌های بزرگ استاندارد که مستقیماً از داده‌های پیش‌آموزش شده پاسخ تولید می‌کنند و سیستم‌های RAG سنتی که به جستجوی سطحی یک‌باره وابسته‌اند، تفاوت اساسی دارد."
},
"kimi-k2": {
"description": "Kimi-K2 یک مدل پایه با معماری MoE است که توسط Moonshot AI ارائه شده و دارای توانایی‌های بسیار قوی در کدنویسی و عامل است، با 1 تریلیون پارامتر کل و 32 میلیارد پارامتر فعال. در آزمون‌های معیار عملکرد در حوزه‌های دانش عمومی، برنامه‌نویسی، ریاضیات و عامل، مدل K2 عملکردی فراتر از سایر مدل‌های متن‌باز اصلی دارد."
},
"kimi-k2-0711-preview": {
"description": "kimi-k2 یک مدل پایه با معماری MoE است که دارای توانایی‌های بسیار قوی در کدنویسی و عامل‌سازی است، با مجموع یک تریلیون پارامتر و 32 میلیارد پارامتر فعال. در تست‌های معیار عملکرد در حوزه‌های دانش عمومی، برنامه‌نویسی، ریاضیات و عامل‌ها، مدل K2 عملکردی فراتر از سایر مدل‌های متن‌باز اصلی دارد."
},
"kimi-k2-0905-preview": {
"description": "مدل پیش‌نمایش kimi-k2-0905 دارای طول متن ۲۵۶ هزار توکنی است و توانایی‌های قوی‌تری در برنامه‌نویسی عامل‌محور، زیبایی و کاربردی بودن کدهای فرانت‌اند و درک بهتر متن دارد."
},
"kimi-k2-instruct": {
"description": "Kimi K2 Instruct، مدل استنتاج رسمی Kimi، پشتیبانی از زمینه بلند، کدنویسی، پرسش و پاسخ و سناریوهای متنوع."
},
"kimi-k2-thinking": {
"description": "مدل kimi-k2-thinking که توسط شرکت Moonshot ارائه شده، یک مدل تفکر با قابلیت‌های عمومی عامل‌محور و توانایی استدلال است. این مدل در استدلال عمیق مهارت دارد و می‌تواند با استفاده از فراخوانی چندمرحله‌ای ابزارها، در حل انواع مسائل دشوار کمک کند."
},
"kimi-k2-thinking-turbo": {
"description": "نسخه پرسرعت مدل تفکر طولانی K2 با پشتیبانی از زمینه 256k، مناسب برای استدلال عمیق با سرعت خروجی 60 تا 100 توکن در ثانیه."
},
"kimi-k2-turbo-preview": {
"description": "kimi-k2 یک مدل پایه با معماری MoE است که دارای توانمندی‌های بسیار قوی در حوزهٔ برنامه‌نویسی و عامل‌ها (Agent) می‌باشد. مجموع پارامترها 1T و پارامترهای فعال‌شده 32B است. در آزمون‌های بنچمارک در دسته‌های اصلی مانند استدلال دانش عمومی، برنامه‌نویسی، ریاضیات و Agent، عملکرد مدل K2 از سایر مدل‌های متن‌باز مرسوم پیشی گرفته است."
},
"kimi-k2:1t": {
"description": "Kimi K2 یک مدل زبان متخصص ترکیبی بزرگ‌مقیاس (MoE) است که توسط هوش مصنوعی ماه تاریک توسعه یافته است، با مجموع ۱ تریلیون پارامتر و ۳۲ میلیارد پارامتر فعال در هر عبور رو به جلو. این مدل برای توانمندی‌های نمایندگی بهینه شده است، از جمله استفاده پیشرفته از ابزارها، استدلال و ترکیب کد."
},
"kimi-latest": {
"description": "محصول دستیار هوشمند کیمی از جدیدترین مدل بزرگ کیمی استفاده می‌کند و ممکن است شامل ویژگی‌های ناپایدار باشد. از درک تصویر پشتیبانی می‌کند و به‌طور خودکار بر اساس طول متن درخواست، مدل‌های 8k/32k/128k را به‌عنوان مدل محاسبه انتخاب می‌کند."
},
"kuaishou/kat-coder-pro-v1": {
"description": "KAT-Coder-Pro-V1 (رایگان برای مدت محدود) بر درک کد و برنامه‌نویسی خودکار تمرکز دارد و برای وظایف نمایندگی برنامه‌نویسی کارآمد طراحی شده است."
},
"learnlm-1.5-pro-experimental": {
"description": "LearnLM یک مدل زبانی تجربی و خاص برای وظایف است که برای مطابقت با اصول علم یادگیری آموزش دیده است و می‌تواند در سناریوهای آموزشی و یادگیری از دستورات سیستم پیروی کند و به عنوان مربی متخصص عمل کند."
},
"learnlm-2.0-flash-experimental": {
"description": "LearnLM یک مدل زبانی تجربی و خاص برای وظایف است که برای تطابق با اصول علم یادگیری آموزش دیده است و می‌تواند در سناریوهای آموزشی و یادگیری دستورات سیستم را دنبال کند و به عنوان یک مربی متخصص عمل کند."
},
"lite": {
"description": "Spark Lite یک مدل زبان بزرگ سبک است که دارای تأخیر بسیار کم و توانایی پردازش کارآمد می‌باشد. به‌طور کامل رایگان و باز است و از قابلیت جستجوی آنلاین در زمان واقعی پشتیبانی می‌کند. ویژگی پاسخ‌دهی سریع آن باعث می‌شود که در کاربردهای استنتاجی و تنظیم مدل در دستگاه‌های با توان محاسباتی پایین عملکرد برجسته‌ای داشته باشد و تجربه‌ای هوشمند و مقرون‌به‌صرفه برای کاربران فراهم کند. به‌ویژه در زمینه‌های پرسش و پاسخ دانش، تولید محتوا و جستجو عملکرد خوبی دارد."
},
"llama-3.1-70b-versatile": {
"description": "لاما 3.1 70B توانایی استدلال هوش مصنوعی قوی‌تری را ارائه می‌دهد، مناسب برای برنامه‌های پیچیده، پشتیبانی از پردازش‌های محاسباتی فراوان و تضمین کارایی و دقت بالا."
},
"llama-3.1-8b-instant": {
"description": "Llama 3.1 8B یک مدل با کارایی بالا است که توانایی تولید سریع متن را فراهم می‌کند و برای کاربردهایی که به بهره‌وری و صرفه‌جویی در هزینه در مقیاس بزرگ نیاز دارند، بسیار مناسب است."
},
"llama-3.1-instruct": {
"description": "مدل آموزشی لاما 3.1 برای بهینه‌سازی در صحنه‌های گفت‌وگو طراحی شده است و در معیارهای صنعتی معمول، بسیاری از مدل‌های چت منبع باز موجود را در برابر گذاشته است."
},
"llama-3.2-11b-vision-instruct": {
"description": "توانایی استدلال تصویری عالی در تصاویر با وضوح بالا، مناسب برای برنامه‌های درک بصری."
},
"llama-3.2-11b-vision-preview": {
"description": "لاما 3.2 برای انجام وظایفی که شامل داده‌های بصری و متنی هستند طراحی شده است. این مدل در وظایفی مانند توصیف تصویر و پرسش و پاسخ بصری عملکرد بسیار خوبی دارد و فاصله بین تولید زبان و استدلال بصری را پر می‌کند."
},
"llama-3.2-90b-vision-instruct": {
"description": "قابلیت‌های پیشرفته استدلال تصویری برای برنامه‌های نماینده درک بصری."
},
"llama-3.2-90b-vision-preview": {
"description": "لاما 3.2 برای انجام وظایفی که ترکیبی از داده‌های بصری و متنی هستند طراحی شده است. این مدل در وظایفی مانند توصیف تصاویر و پرسش و پاسخ بصری عملکرد بسیار خوبی دارد و فاصله بین تولید زبان و استدلال بصری را پر می‌کند."
},
"llama-3.2-vision-instruct": {
"description": "مدل میکروآموزش Llama 3.2-Vision برای شناسایی بصری، استدلال تصویری، توصیف تصویر و پاسخ به سوالات مربوط به تصویر بهینه‌سازی شده است."
},
"llama-3.3-70b": {
"description": "Llama 3.3 70B: مدلی با اندازه متوسط تا بزرگ از سری Llama که تعادلی میان توانایی استدلال و بازدهی فراهم می‌کند."
},
"llama-3.3-70b-versatile": {
"description": "مدل زبان بزرگ چند زبانه Meta Llama 3.3 (LLM) یک مدل تولیدی پیش‌آموزش دیده و تنظیم‌شده در 70B (ورودی متن/خروجی متن) است. مدل متن خالص Llama 3.3 برای کاربردهای گفتگوی چند زبانه بهینه‌سازی شده و در معیارهای صنعتی معمول در مقایسه با بسیاری از مدل‌های چت متن‌باز و بسته عملکرد بهتری دارد."
},
"llama-3.3-instruct": {
"description": "مدل آموزشی لاما ۳.۳ برای صحنه‌های گفت‌وگو بهینه‌سازی شده است و در معیارهای صنعتی معمول، بسیاری از مدل‌های چت منبع باز موجود را در برمی‌آید."
},
"llama3-70b-8192": {
"description": "متا لاما ۳ ۷۰B توانایی پردازش پیچیدگی بی‌نظیری را ارائه می‌دهد و برای پروژه‌های با نیازهای بالا طراحی شده است."
},
"llama3-8b-8192": {
"description": "متا لاما ۳ ۸B عملکرد استدلالی با کیفیت بالا را ارائه می‌دهد و برای نیازهای کاربردی در چندین سناریو مناسب است."
},
"llama3-groq-70b-8192-tool-use-preview": {
"description": "Llama 3 Groq 70B Tool Use قابلیت فراخوانی ابزارهای قدرتمند را فراهم می‌کند و از پردازش کارهای پیچیده به‌صورت کارآمد پشتیبانی می‌کند."
},
"llama3-groq-8b-8192-tool-use-preview": {
"description": "لاما 3 Groq 8B Tool Use مدلی است که برای استفاده بهینه از ابزارها طراحی شده و از محاسبات سریع و موازی پشتیبانی می‌کند."
},
"llama3.1": {
"description": "Llama 3.1 مدل پیشرو ارائه شده توسط Meta است که از حداکثر 405 میلیارد پارامتر پشتیبانی می‌کند و می‌تواند در زمینه‌های مکالمات پیچیده، ترجمه چندزبانه و تحلیل داده‌ها به کار گرفته شود."
},
"llama3.1-8b": {
"description": "Llama 3.1 8B: نسخه‌ای سبک و با تأخیر پایین از Llama، مناسب برای استنتاج آنلاین سبک و تعاملات بلادرنگ."
},
"llama3.1:405b": {
"description": "Llama 3.1 مدل پیشرو ارائه شده توسط Meta است که از 405 میلیارد پارامتر پشتیبانی می‌کند و می‌تواند در زمینه‌های مکالمات پیچیده، ترجمه چندزبانه و تحلیل داده‌ها به کار گرفته شود."
},
"llama3.1:70b": {
"description": "لاما 3.1 مدل پیشرو ارائه شده توسط متا است که از حداکثر 405 میلیارد پارامتر پشتیبانی می‌کند و می‌تواند در زمینه‌های مکالمات پیچیده، ترجمه چندزبانه و تحلیل داده‌ها به کار گرفته شود."
},
"llava": {
"description": "LLaVA یک مدل چندوجهی است که رمزگذار بصری و Vicuna را برای درک قدرتمند زبان و تصویر ترکیب می‌کند."
},
"llava-v1.5-7b-4096-preview": {
"description": "LLaVA 1.5 7B قابلیت پردازش بصری را با هم ترکیب می‌کند و از طریق ورودی اطلاعات بصری خروجی‌های پیچیده تولید می‌کند."
},
"llava:13b": {
"description": "LLaVA یک مدل چندوجهی است که رمزگذار بصری و Vicuna را برای درک قدرتمند زبان و تصویر ترکیب می‌کند."
},
"llava:34b": {
"description": "LLaVA یک مدل چندوجهی است که رمزگذار بصری و Vicuna را برای درک قدرتمند زبان و تصویر ترکیب می‌کند."
},
"magistral-medium-latest": {
"description": "Magistral Medium 1.2 یک مدل استنتاج پیشرفته است که توسط Mistral AI در سپتامبر ۲۰۲۵ منتشر شده و از قابلیت پشتیبانی بصری برخوردار است."
},
"magistral-small-2509": {
"description": "Magistral Small 1.2 یک مدل استنتاج کوچک متن‌باز است که توسط Mistral AI در سپتامبر ۲۰۲۵ منتشر شده و از قابلیت پشتیبانی بصری برخوردار است."
},
"mathstral": {
"description": "MathΣtral به‌طور ویژه برای تحقیقات علمی و استدلال‌های ریاضی طراحی شده است و توانایی محاسباتی مؤثر و تفسیر نتایج را ارائه می‌دهد."
},
"max-32k": {
"description": "Spark Max 32K با قابلیت پردازش متن با زمینه بزرگ‌تر، توانایی درک و استدلال منطقی قوی‌تری دارد و از ورودی متنی تا 32K توکن پشتیبانی می‌کند. مناسب برای خواندن اسناد طولانی، پرسش و پاسخ با دانش خصوصی و موارد مشابه."
},
"megrez-3b-instruct": {
"description": "Megrez 3B Instruct یک مدل کم‌پارامتر و کارآمد است که توسط Wuwen Xinqiong ارائه شده است."
},
"meituan/longcat-flash-chat": {
"description": "مدل پایه غیرتفکری متن‌باز Meituan که به‌طور ویژه برای تعاملات گفت‌وگویی و وظایف عامل‌ها بهینه‌سازی شده است و در فراخوانی ابزارها و سناریوهای پیچیده چندمرحله‌ای عملکرد برجسته‌ای دارد."
},
"meta-llama-3-70b-instruct": {
"description": "یک مدل قدرتمند با ۷۰ میلیارد پارامتر که در استدلال، کدنویسی و کاربردهای گسترده زبانی عملکرد برجسته‌ای دارد."
},
"meta-llama-3-8b-instruct": {
"description": "یک مدل چندمنظوره با ۸ میلیارد پارامتر که برای وظایف مکالمه و تولید متن بهینه‌سازی شده است."
},
"meta-llama-3.1-405b-instruct": {
"description": "مدل متنی Llama 3.1 که برای تنظیم دستورات بهینه‌سازی شده و برای موارد استفاده مکالمه چندزبانه بهینه شده است. در بسیاری از مدل‌های چت منبع باز و بسته موجود، در معیارهای صنعتی رایج عملکرد برجسته‌ای دارد."
},
"meta-llama-3.1-70b-instruct": {
"description": "مدل متنی Llama 3.1 با تنظیمات دستوری، بهینه‌سازی شده برای موارد استفاده در مکالمات چندزبانه، که در بسیاری از مدل‌های چت منبع باز و بسته موجود، در معیارهای صنعتی رایج عملکرد برجسته‌ای دارد."
},
"meta-llama-3.1-8b-instruct": {
"description": "مدل متنی Llama 3.1 که برای تنظیم دستورالعمل‌ها بهینه‌سازی شده و برای موارد استفاده مکالمه چندزبانه بهینه شده است. در بسیاری از مدل‌های چت منبع باز و بسته موجود، در معیارهای صنعتی رایج عملکرد برجسته‌ای دارد."
},
"meta-llama/Llama-2-13b-chat-hf": {
"description": "LLaMA-2 Chat (13B) توانایی‌های پردازش زبان عالی و تجربه تعاملی بی‌نظیری را ارائه می‌دهد."
},
"meta-llama/Llama-2-70b-hf": {
"description": "LLaMA-2 توانایی‌های پردازش زبان عالی و تجربه تعاملی بی‌نظیری را ارائه می‌دهد."
},
"meta-llama/Llama-3-70b-chat-hf": {
"description": "Llama 3 70B Instruct Reference یک مدل چت قدرتمند است که از نیازهای پیچیده مکالمه پشتیبانی می‌کند."
},
"meta-llama/Llama-3-8b-chat-hf": {
"description": "Llama 3 8B Instruct Reference پشتیبانی چندزبانه ارائه می‌دهد و شامل دانش گسترده‌ای در زمینه‌های مختلف است."
},
"meta-llama/Llama-3.2-11B-Vision-Instruct-Turbo": {
"description": "LLaMA 3.2 برای انجام وظایفی که ترکیبی از داده‌های بصری و متنی هستند طراحی شده است. این مدل در وظایفی مانند توصیف تصویر و پرسش و پاسخ بصری عملکرد بسیار خوبی دارد و فاصله بین تولید زبان و استدلال بصری را پر می‌کند."
},
"meta-llama/Llama-3.2-3B-Instruct-Turbo": {
"description": "LLaMA 3.2 برای انجام وظایفی که ترکیبی از داده‌های بصری و متنی هستند طراحی شده است. این مدل در وظایفی مانند توصیف تصویر و پرسش و پاسخ بصری عملکرد بسیار خوبی دارد و فاصله بین تولید زبان و استدلال بصری را پر می‌کند."
},
"meta-llama/Llama-3.2-90B-Vision-Instruct-Turbo": {
"description": "LLaMA 3.2 برای انجام وظایفی که ترکیبی از داده‌های بصری و متنی هستند طراحی شده است. این مدل در وظایفی مانند توصیف تصویر و پرسش و پاسخ بصری عملکرد بسیار خوبی دارد و فاصله بین تولید زبان و استدلال بصری را پر می‌کند."
},
"meta-llama/Llama-3.3-70B-Instruct-Turbo": {
"description": "مدل بزرگ زبان چند زبانه Meta Llama 3.3 (LLM) یک مدل تولیدی پیش‌آموزش و تنظیم دستوری در 70B (ورودی متن/خروجی متن) است. مدل تنظیم دستوری Llama 3.3 به طور خاص برای موارد استفاده مکالمه چند زبانه بهینه‌سازی شده و در معیارهای صنعتی رایج از بسیاری از مدل‌های چت متن‌باز و بسته موجود بهتر عمل می‌کند."
},
"meta-llama/Llama-Vision-Free": {
"description": "LLaMA 3.2 برای انجام وظایفی که ترکیبی از داده‌های بصری و متنی هستند طراحی شده است. این مدل در وظایفی مانند توصیف تصویر و پرسش و پاسخ بصری عملکرد بسیار خوبی دارد و فاصله بین تولید زبان و استدلال بصری را پر می‌کند."
},
"meta-llama/Meta-Llama-3-70B-Instruct-Lite": {
"description": "Llama 3 70B Instruct Lite مناسب برای محیط‌هایی که به عملکرد بالا و تأخیر کم نیاز دارند."
},
"meta-llama/Meta-Llama-3-70B-Instruct-Turbo": {
"description": "Llama 3 70B Instruct Turbo توانایی‌های برجسته‌ای در درک و تولید زبان ارائه می‌دهد و برای سخت‌ترین وظایف محاسباتی مناسب است."
},
"meta-llama/Meta-Llama-3-8B-Instruct-Lite": {
"description": "Llama 3 8B Instruct Lite برای محیط‌های با منابع محدود مناسب است و عملکرد متعادلی را ارائه می‌دهد."
},
"meta-llama/Meta-Llama-3-8B-Instruct-Turbo": {
"description": "Llama 3 8B Instruct Turbo یک مدل زبان بزرگ با کارایی بالا است که از طیف گسترده‌ای از کاربردها پشتیبانی می‌کند."
},
"meta-llama/Meta-Llama-3.1-405B-Instruct": {
"description": "مدل LLaMA 3.1 405B که برای تنظیمات دستوری بهینه‌سازی شده است، برای سناریوهای مکالمه چندزبانه بهینه شده است."
},
"meta-llama/Meta-Llama-3.1-405B-Instruct-Turbo": {
"description": "مدل Llama 3.1 Turbo با ظرفیت 405B، پشتیبانی از زمینه‌های بسیار بزرگ برای پردازش داده‌های عظیم را فراهم می‌کند و در کاربردهای هوش مصنوعی در مقیاس بسیار بزرگ عملکرد برجسته‌ای دارد."
},
"meta-llama/Meta-Llama-3.1-70B": {
"description": "Llama 3.1 مدل پیشرو ارائه شده توسط Meta است که از حداکثر 405B پارامتر پشتیبانی می‌کند و می‌تواند در زمینه‌های گفتگوهای پیچیده، ترجمه چند زبانه و تحلیل داده‌ها استفاده شود."
},
"meta-llama/Meta-Llama-3.1-70B-Instruct-Turbo": {
"description": "مدل Llama 3.1 70B به‌طور دقیق تنظیم شده است و برای برنامه‌های با بار سنگین مناسب است. با کمیت‌سازی به FP8، توان محاسباتی و دقت بیشتری ارائه می‌دهد و عملکرد برتری را در سناریوهای پیچیده تضمین می‌کند."
},
"meta-llama/Meta-Llama-3.1-8B-Instruct-Turbo": {
"description": "مدل Llama 3.1 8B از کوانتیزاسیون FP8 استفاده می‌کند و از حداکثر 131,072 توکن متنی پشتیبانی می‌کند. این مدل یکی از بهترین‌ها در میان مدل‌های متن‌باز است و برای وظایف پیچیده مناسب بوده و در بسیاری از معیارهای صنعتی عملکرد برتری دارد."
},
"meta-llama/llama-3-70b-instruct": {
"description": "Llama 3 70B Instruct برای بهینه‌سازی در سناریوهای مکالمه با کیفیت بالا طراحی شده و در ارزیابی‌های مختلف انسانی عملکرد برجسته‌ای دارد."
},
"meta-llama/llama-3-8b-instruct": {
"description": "Llama 3 8B Instruct برای بهینه‌سازی سناریوهای مکالمه با کیفیت بالا طراحی شده و عملکردی بهتر از بسیاری از مدل‌های بسته دارد."
},
"meta-llama/llama-3.1-70b-instruct": {
"description": "Llama 3.1 70B Instruct به‌طور ویژه برای مکالمات با کیفیت بالا طراحی شده است و در ارزیابی‌های انسانی عملکرد برجسته‌ای دارد. این مدل به‌ویژه برای سناریوهای تعامل بالا مناسب است."
},
"meta-llama/llama-3.1-8b-instruct": {
"description": "Llama 3.1 8B Instruct جدیدترین نسخه ارائه شده توسط Meta است که برای بهینه‌سازی سناریوهای مکالمه با کیفیت بالا طراحی شده و عملکرد بهتری نسبت به بسیاری از مدل‌های بسته پیشرو دارد."
},
"meta-llama/llama-3.1-8b-instruct:free": {
"description": "LLaMA 3.1 پشتیبانی چندزبانه ارائه می‌دهد و یکی از مدل‌های پیشرو در صنعت تولید محتوا است."
},
"meta-llama/llama-3.2-11b-vision-instruct": {
"description": "LLaMA 3.2 برای انجام وظایفی که ترکیبی از داده‌های بصری و متنی هستند طراحی شده است. این مدل در وظایفی مانند توصیف تصویر و پرسش و پاسخ بصری عملکرد بسیار خوبی دارد و فاصله بین تولید زبان و استدلال بصری را پر می‌کند."
},
"meta-llama/llama-3.2-3b-instruct": {
"description": "meta-llama/llama-3.2-3b-instruct"
},
"meta-llama/llama-3.2-90b-vision-instruct": {
"description": "LLaMA 3.2 برای انجام وظایفی طراحی شده است که داده‌های بصری و متنی را با هم ترکیب می‌کند. این مدل در وظایفی مانند توصیف تصویر و پرسش و پاسخ بصری عملکرد بسیار خوبی دارد و فاصله بین تولید زبان و استدلال بصری را پر می‌کند."
},
"meta-llama/llama-3.3-70b-instruct": {
"description": "Llama 3.3 پیشرفته‌ترین مدل زبان چندزبانه و متن‌باز در سری Llama است که تجربه‌ای با هزینه بسیار پایین مشابه عملکرد مدل 405B را ارائه می‌دهد. این مدل بر اساس ساختار Transformer طراحی شده و از طریق تنظیم دقیق نظارتی (SFT) و یادگیری تقویتی با بازخورد انسانی (RLHF) بهبود کارایی و ایمنی یافته است. نسخه بهینه‌سازی شده آن برای مکالمات چندزبانه طراحی شده و در چندین معیار صنعتی از بسیاری از مدل‌های چت متن‌باز و بسته بهتر عمل می‌کند. تاریخ قطع دانش آن دسامبر 2023 است."
},
"meta-llama/llama-3.3-70b-instruct:free": {
"description": "Llama 3.3 پیشرفته‌ترین مدل زبان چندزبانه و متن‌باز در سری Llama است که تجربه‌ای با هزینه بسیار پایین مشابه عملکرد مدل 405B را ارائه می‌دهد. این مدل بر اساس ساختار Transformer طراحی شده و از طریق تنظیم دقیق نظارتی (SFT) و یادگیری تقویتی با بازخورد انسانی (RLHF) بهبود کارایی و ایمنی یافته است. نسخه بهینه‌سازی شده آن برای مکالمات چندزبانه طراحی شده و در چندین معیار صنعتی از بسیاری از مدل‌های چت متن‌باز و بسته بهتر عمل می‌کند. تاریخ قطع دانش آن دسامبر 2023 است."
},
"meta.llama3-1-405b-instruct-v1:0": {
"description": "Meta Llama 3.1 405B Instruct بزرگترین و قدرتمندترین مدل در میان مدل‌های Llama 3.1 Instruct است. این یک مدل بسیار پیشرفته برای استدلال مکالمه‌ای و تولید داده‌های مصنوعی است و همچنین می‌تواند به عنوان پایه‌ای برای پیش‌تمرین یا تنظیم دقیق مداوم در حوزه‌های خاص استفاده شود. Llama 3.1 مجموعه‌ای از مدل‌های زبان بزرگ چندزبانه (LLMs) است که از پیش آموزش دیده و برای دستورالعمل‌ها تنظیم شده‌اند و شامل اندازه‌های 8B، 70B و 405B (ورودی/خروجی متنی) می‌باشد. مدل‌های متنی تنظیم‌شده بر اساس دستورالعمل‌های Llama 3.1 (8B، 70B، 405B) به‌طور خاص برای موارد استفاده مکالمه چندزبانه بهینه‌سازی شده‌اند و در بسیاری از معیارهای استاندارد صنعتی از مدل‌های چت منبع باز موجود پیشی گرفته‌اند. Llama 3.1 برای استفاده‌های تجاری و تحقیقاتی در زبان‌های مختلف طراحی شده است. مدل‌های متنی تنظیم‌شده بر اساس دستورالعمل‌ها برای چت‌های مشابه دستیار مناسب هستند، در حالی که مدل‌های پیش‌آموزش‌دیده می‌توانند برای انواع وظایف تولید زبان طبیعی سازگار شوند. مدل‌های Llama 3.1 همچنین از خروجی‌های خود برای بهبود سایر مدل‌ها، از جمله تولید داده‌های مصنوعی و پالایش، پشتیبانی می‌کنند. Llama 3.1 یک مدل زبان خودبازگشتی است که از معماری بهینه‌شده ترانسفورمر استفاده می‌کند. نسخه‌های تنظیم‌شده از تنظیم دقیق نظارت‌شده (SFT) و یادگیری تقویتی با بازخورد انسانی (RLHF) برای تطابق با ترجیحات انسانی در مورد کمک‌رسانی و ایمنی استفاده می‌کنند."
},
"meta.llama3-1-70b-instruct-v1:0": {
"description": "نسخه به‌روزرسانی‌شده Meta Llama 3.1 70B Instruct، شامل طول زمینه 128K توسعه‌یافته، چندزبانه بودن و بهبود توانایی استدلال. مدل‌های زبان بزرگ چندزبانه (LLMs) ارائه‌شده توسط Llama 3.1 مجموعه‌ای از مدل‌های تولیدی پیش‌تمرین‌شده و تنظیم‌شده با دستورالعمل هستند که شامل اندازه‌های 8B، 70B و 405B (ورودی/خروجی متنی) می‌باشند. مدل‌های متنی تنظیم‌شده با دستورالعمل Llama 3.1 (8B، 70B، 405B) به‌طور خاص برای موارد استفاده مکالمه چندزبانه بهینه‌سازی شده‌اند و در بسیاری از معیارهای استاندارد صنعتی از مدل‌های چت منبع‌باز موجود پیشی گرفته‌اند. Llama 3.1 برای استفاده‌های تجاری و تحقیقاتی در زبان‌های مختلف طراحی شده است. مدل‌های متنی تنظیم‌شده با دستورالعمل برای چت‌های مشابه دستیار مناسب هستند، در حالی که مدل‌های پیش‌تمرین‌شده می‌توانند برای انواع وظایف تولید زبان طبیعی سازگار شوند. مدل‌های Llama 3.1 همچنین از خروجی‌های خود برای بهبود سایر مدل‌ها، از جمله تولید داده‌های مصنوعی و پالایش، پشتیبانی می‌کنند. Llama 3.1 یک مدل زبان خودبازگشتی است که از معماری بهینه‌شده ترانسفورمر استفاده می‌کند. نسخه تنظیم‌شده از تنظیم دقیق نظارت‌شده (SFT) و یادگیری تقویتی با بازخورد انسانی (RLHF) برای هم‌راستایی با ترجیحات انسانی در مورد کمک‌رسانی و ایمنی استفاده می‌کند."
},
"meta.llama3-1-8b-instruct-v1:0": {
"description": "نسخه به‌روزرسانی شده Meta Llama 3.1 8B Instruct، شامل طول زمینه 128K توسعه‌یافته، چندزبانه بودن و بهبود توانایی استدلال. Llama 3.1 مدل‌های زبانی بزرگ چندزبانه (LLMs) را ارائه می‌دهد که مجموعه‌ای از مدل‌های تولیدی پیش‌تمرین‌شده و تنظیم‌شده با دستورالعمل هستند و شامل اندازه‌های 8B، 70B و 405B (ورودی/خروجی متنی) می‌باشند. مدل‌های متنی تنظیم‌شده با دستورالعمل Llama 3.1 (8B، 70B، 405B) به‌طور خاص برای موارد استفاده مکالمه چندزبانه بهینه‌سازی شده‌اند و در معیارهای صنعتی رایج از بسیاری از مدل‌های چت متن‌باز موجود پیشی گرفته‌اند. Llama 3.1 برای استفاده‌های تجاری و تحقیقاتی در زبان‌های مختلف طراحی شده است. مدل‌های متنی تنظیم‌شده با دستورالعمل برای چت‌های مشابه دستیار مناسب هستند، در حالی که مدل‌های پیش‌تمرین‌شده می‌توانند برای انواع وظایف تولید زبان طبیعی سازگار شوند. مدل‌های Llama 3.1 همچنین از خروجی‌های خود برای بهبود سایر مدل‌ها، از جمله تولید داده‌های مصنوعی و پالایش، پشتیبانی می‌کنند. Llama 3.1 یک مدل زبانی خودبازگشتی است که از معماری بهینه‌شده ترانسفورمر استفاده می‌کند. نسخه تنظیم‌شده از تنظیم دقیق نظارت‌شده (SFT) و یادگیری تقویتی با بازخورد انسانی (RLHF) برای هم‌راستا شدن با ترجیحات انسانی در مورد کمک‌رسانی و ایمنی استفاده می‌کند."
},
"meta.llama3-70b-instruct-v1:0": {
"description": "Meta Llama 3 یک مدل زبان بزرگ (LLM) باز برای توسعه‌دهندگان، پژوهشگران و شرکت‌ها است که به آن‌ها کمک می‌کند تا ایده‌های هوش مصنوعی تولیدی خود را بسازند، آزمایش کنند و به‌طور مسئولانه گسترش دهند. به‌عنوان بخشی از سیستم پایه نوآوری جامعه جهانی، این مدل برای تولید محتوا، هوش مصنوعی مکالمه‌ای، درک زبان، تحقیق و توسعه و کاربردهای شرکتی بسیار مناسب است."
},
"meta.llama3-8b-instruct-v1:0": {
"description": "Meta Llama 3 یک مدل زبان بزرگ باز (LLM) است که برای توسعه‌دهندگان، پژوهشگران و شرکت‌ها طراحی شده است تا به آن‌ها در ساخت، آزمایش و گسترش مسئولانه ایده‌های هوش مصنوعی مولد کمک کند. به عنوان بخشی از سیستم پایه نوآوری جامعه جهانی، این مدل برای دستگاه‌های با توان محاسباتی و منابع محدود، دستگاه‌های لبه و زمان‌های آموزش سریع‌تر بسیار مناسب است."
},
"meta/Llama-3.2-11B-Vision-Instruct": {
"description": "توانایی استدلال تصویری برجسته در تصاویر با وضوح بالا، مناسب برای برنامه‌های درک بصری."
},
"meta/Llama-3.2-90B-Vision-Instruct": {
"description": "توانایی استدلال تصویری پیشرفته برای برنامه‌های عامل درک بصری."
},
"meta/Llama-3.3-70B-Instruct": {
"description": "Llama 3.3 پیشرفته‌ترین مدل زبان بزرگ چندزبانه متن‌باز در سری Llama است که عملکردی مشابه مدل ۴۰۵ میلیارد پارامتری را با هزینه بسیار پایین ارائه می‌دهد. مبتنی بر ساختار ترنسفورمر و با بهبودهای نظارت شده (SFT) و یادگیری تقویتی با بازخورد انسانی (RLHF) برای افزایش کارایی و ایمنی. نسخه تنظیم شده برای دستورالعمل بهینه شده برای گفتگوهای چندزبانه است و در معیارهای صنعتی متعدد از بسیاری از مدل‌های چت متن‌باز و بسته بهتر عمل می‌کند. تاریخ قطع دانش: دسامبر ۲۰۲۳."
},
"meta/Meta-Llama-3-70B-Instruct": {
"description": "یک مدل قدرتمند با ۷۰ میلیارد پارامتر که در استدلال، کدنویسی و کاربردهای گسترده زبانی عملکرد برجسته‌ای دارد."
},
"meta/Meta-Llama-3-8B-Instruct": {
"description": "یک مدل چندمنظوره با ۸ میلیارد پارامتر که برای وظایف گفتگو و تولید متن بهینه شده است."
},
"meta/Meta-Llama-3.1-405B-Instruct": {
"description": "مدل متنی تنظیم شده برای دستورالعمل Llama 3.1 که برای موارد استفاده گفتگوهای چندزبانه بهینه شده و در بسیاری از مدل‌های چت متن‌باز و بسته موجود، در معیارهای صنعتی رایج عملکرد برجسته‌ای دارد."
},
"meta/Meta-Llama-3.1-70B-Instruct": {
"description": "مدل متنی تنظیم شده برای دستورالعمل Llama 3.1 که برای موارد استفاده گفتگوهای چندزبانه بهینه شده و در بسیاری از مدل‌های چت متن‌باز و بسته موجود، در معیارهای صنعتی رایج عملکرد برجسته‌ای دارد."
},
"meta/Meta-Llama-3.1-8B-Instruct": {
"description": "مدل متنی تنظیم شده برای دستورالعمل Llama 3.1 که برای موارد استفاده گفتگوهای چندزبانه بهینه شده و در بسیاری از مدل‌های چت متن‌باز و بسته موجود، در معیارهای صنعتی رایج عملکرد برجسته‌ای دارد."
},
"meta/llama-3-70b": {
"description": "مدل متن‌باز 70 میلیارد پارامتری که توسط Meta برای پیروی از دستورالعمل‌ها به دقت تنظیم شده است. توسط Groq با استفاده از سخت‌افزار واحد پردازش زبان سفارشی (LPU) ارائه می‌شود تا استدلال سریع و کارآمد فراهم کند."
},
"meta/llama-3-8b": {
"description": "مدل متن‌باز 8 میلیارد پارامتری که توسط Meta برای پیروی از دستورالعمل‌ها به دقت تنظیم شده است. توسط Groq با استفاده از سخت‌افزار واحد پردازش زبان سفارشی (LPU) ارائه می‌شود تا استدلال سریع و کارآمد فراهم کند."
},
"meta/llama-3.1-405b-instruct": {
"description": "مدل LLM پیشرفته که از تولید داده‌های ترکیبی، تقطیر دانش و استدلال پشتیبانی می‌کند و برای ربات‌های چت، برنامه‌نویسی و وظایف خاص مناسب است."
},
"meta/llama-3.1-70b": {
"description": "نسخه به‌روزشده Meta Llama 3 70B Instruct با طول زمینه 128K گسترش یافته، چندزبانه و توان استدلال بهبود یافته."
},
"meta/llama-3.1-70b-instruct": {
"description": "توانمندسازی گفتگوهای پیچیده با درک زمینه‌ای عالی، توانایی استدلال و قابلیت تولید متن."
},
"meta/llama-3.1-8b": {
"description": "Llama 3.1 8B از پنجره زمینه 128K پشتیبانی می‌کند که آن را برای رابط‌های گفتگوی بلادرنگ و تحلیل داده ایده‌آل می‌سازد و در عین حال صرفه‌جویی قابل توجهی در هزینه نسبت به مدل‌های بزرگ‌تر ارائه می‌دهد. توسط Groq با استفاده از سخت‌افزار واحد پردازش زبان سفارشی (LPU) ارائه می‌شود تا استدلال سریع و کارآمد فراهم کند."
},
"meta/llama-3.1-8b-instruct": {
"description": "مدل پیشرفته و پیشرفته که دارای درک زبان، توانایی استدلال عالی و قابلیت تولید متن است."
},
"meta/llama-3.2-11b": {
"description": "مدل تولید استدلال تصویری تنظیم شده با دستورالعمل (ورودی متن + تصویر / خروجی متن) که برای شناسایی بصری، استدلال تصویری، تولید عنوان و پاسخ به سوالات عمومی درباره تصاویر بهینه شده است."
},
"meta/llama-3.2-11b-vision-instruct": {
"description": "مدل بینایی-زبان پیشرفته که در استدلال با کیفیت بالا از تصاویر مهارت دارد."
},
"meta/llama-3.2-1b": {
"description": "مدل فقط متنی که از موارد استفاده روی دستگاه مانند بازیابی دانش محلی چندزبانه، خلاصه‌سازی و بازنویسی پشتیبانی می‌کند."
},
"meta/llama-3.2-1b-instruct": {
"description": "مدل زبان کوچک پیشرفته و پیشرفته که دارای درک زبان، توانایی استدلال عالی و قابلیت تولید متن است."
},
"meta/llama-3.2-3b": {
"description": "مدل فقط متنی که به دقت برای پشتیبانی از موارد استفاده روی دستگاه مانند بازیابی دانش محلی چندزبانه، خلاصه‌سازی و بازنویسی تنظیم شده است."
},
"meta/llama-3.2-3b-instruct": {
"description": "مدل زبان کوچک پیشرفته و پیشرفته که دارای درک زبان، توانایی استدلال عالی و قابلیت تولید متن است."
},
"meta/llama-3.2-90b": {
"description": "مدل تولید استدلال تصویری تنظیم شده با دستورالعمل (ورودی متن + تصویر / خروجی متن) که برای شناسایی بصری، استدلال تصویری، تولید عنوان و پاسخ به سوالات عمومی درباره تصاویر بهینه شده است."
},
"meta/llama-3.2-90b-vision-instruct": {
"description": "مدل بینایی-زبان پیشرفته که در استدلال با کیفیت بالا از تصاویر مهارت دارد."
},
"meta/llama-3.3-70b": {
"description": "ترکیب کامل عملکرد و کارایی. این مدل از گفتگوی هوش مصنوعی با عملکرد بالا پشتیبانی می‌کند و برای ایجاد محتوا، برنامه‌های شرکتی و پژوهش طراحی شده است و توانایی‌های پیشرفته درک زبان از جمله خلاصه‌سازی متن، دسته‌بندی، تحلیل احساسات و تولید کد را ارائه می‌دهد."
},
"meta/llama-3.3-70b-instruct": {
"description": "مدل LLM پیشرفته که در استدلال، ریاضیات، دانش عمومی و فراخوانی توابع مهارت دارد."
},
"meta/llama-4-maverick": {
"description": "مجموعه مدل‌های Llama 4 مدل‌های هوش مصنوعی چندرسانه‌ای بومی هستند که از تجربه‌های متنی و چندرسانه‌ای پشتیبانی می‌کنند. این مدل‌ها با استفاده از معماری متخصص ترکیبی عملکرد پیشرو در صنعت در درک متن و تصویر ارائه می‌دهند. Llama 4 Maverick، مدلی با 17 میلیارد پارامتر و 128 متخصص است. توسط DeepInfra ارائه می‌شود."
},
"meta/llama-4-scout": {
"description": "مجموعه مدل‌های Llama 4 مدل‌های هوش مصنوعی چندرسانه‌ای بومی هستند که از تجربه‌های متنی و چندرسانه‌ای پشتیبانی می‌کنند. این مدل‌ها با استفاده از معماری متخصص ترکیبی عملکرد پیشرو در صنعت در درک متن و تصویر ارائه می‌دهند. Llama 4 Scout، مدلی با 17 میلیارد پارامتر و 16 متخصص است. توسط DeepInfra ارائه می‌شود."
},
"microsoft/Phi-3-medium-128k-instruct": {
"description": "همان مدل Phi-3-medium با اندازه زمینه بزرگ‌تر، مناسب برای RAG یا تعداد کمی از پرامپت‌ها."
},
"microsoft/Phi-3-medium-4k-instruct": {
"description": "مدلی با ۱۴ میلیارد پارامتر که کیفیت آن از Phi-3-mini بالاتر است و تمرکز بر داده‌های با کیفیت و استدلالی دارد."
},
"microsoft/Phi-3-mini-128k-instruct": {
"description": "همان مدل Phi-3-mini با اندازه زمینه بزرگ‌تر، مناسب برای RAG یا تعداد کمی از پرامپت‌ها."
},
"microsoft/Phi-3-mini-4k-instruct": {
"description": "کوچک‌ترین عضو خانواده Phi-3 که برای کیفیت و تأخیر کم بهینه شده است."
},
"microsoft/Phi-3-small-128k-instruct": {
"description": "همان مدل Phi-3-small با اندازه زمینه بزرگ‌تر، مناسب برای RAG یا تعداد کمی از پرامپت‌ها."
},
"microsoft/Phi-3-small-8k-instruct": {
"description": "مدلی با ۷ میلیارد پارامتر که کیفیت آن از Phi-3-mini بالاتر است و تمرکز بر داده‌های با کیفیت و استدلالی دارد."
},
"microsoft/Phi-3.5-mini-instruct": {
"description": "نسخه به‌روزشده مدل Phi-3-mini."
},
"microsoft/Phi-3.5-vision-instruct": {
"description": "نسخه به‌روزشده مدل Phi-3-vision."
},
"microsoft/WizardLM-2-8x22B": {
"description": "WizardLM 2 یک مدل زبانی است که توسط AI مایکروسافت ارائه شده و در زمینه‌های گفتگوی پیچیده، چند زبانه، استدلال و دستیار هوشمند به ویژه عملکرد خوبی دارد."
},
"microsoft/wizardlm-2-8x22b": {
"description": "WizardLM-2 8x22B پیشرفته‌ترین مدل Wizard از مایکروسافت AI است که عملکردی بسیار رقابتی از خود نشان می‌دهد."
},
"minicpm-v": {
"description": "MiniCPM-V نسل جدید مدل چندوجهی است که توسط OpenBMB ارائه شده و دارای توانایی‌های برجسته در تشخیص OCR و درک چندوجهی است و از طیف گسترده‌ای از کاربردها پشتیبانی می‌کند."
},
"minimax-m2": {
"description": "MiniMax M2 یک مدل زبانی بزرگ و کارآمد است که به‌طور خاص برای کدنویسی و جریان‌های کاری عامل‌محور طراحی شده است."
},
"minimax/minimax-m2": {
"description": "MiniMax-M2 مدلی با عملکرد عالی در کدنویسی و وظایف نمایندگی است که برای سناریوهای مهندسی متنوع مناسب است."
},
"minimaxai/minimax-m2": {
"description": "MiniMax-M2 یک مدل فشرده، سریع و مقرون‌به‌صرفه از نوع متخصصان ترکیبی (MoE) است که دارای ۲۳۰ میلیارد پارامتر کلی و ۱۰ میلیارد پارامتر فعال می‌باشد. این مدل برای ارائه عملکردی عالی در وظایف کدنویسی و عامل‌های هوشمند طراحی شده و در عین حال هوش عمومی قدرتمندی را حفظ می‌کند. این مدل در ویرایش چندفایلی، چرخه کدنویسی-اجرا-اصلاح، آزمون و تصحیح، و زنجیره ابزارهای پیچیده و طولانی عملکردی برجسته دارد و گزینه‌ای ایده‌آل برای جریان کاری توسعه‌دهندگان محسوب می‌شود."
},
"ministral-3b-latest": {
"description": "Ministral 3B مدل پیشرفته و برتر Mistral در سطح جهانی است."
},
"ministral-8b-latest": {
"description": "Ministral 8B یک مدل لبه‌ای با صرفه اقتصادی بالا از Mistral است."
},
"mistral": {
"description": "Mistral یک مدل 7B است که توسط Mistral AI منتشر شده و برای نیازهای متنوع پردازش زبان مناسب است."
},
"mistral-ai/Mistral-Large-2411": {
"description": "مدل پرچمدار Mistral که برای وظایف پیچیده‌ای که نیاز به توان استدلال در مقیاس بزرگ یا تخصصی بالا دارند (تولید متن ترکیبی، تولید کد، RAG یا عامل‌ها) مناسب است."
},
"mistral-ai/Mistral-Nemo": {
"description": "Mistral Nemo یک مدل زبان پیشرفته (LLM) است که در دسته اندازه خود دارای بهترین توانایی‌های استدلال، دانش جهانی و کدنویسی است."
},
"mistral-ai/mistral-small-2503": {
"description": "Mistral Small برای هر وظیفه مبتنی بر زبان که نیاز به کارایی بالا و تأخیر کم دارد، قابل استفاده است."
},
"mistral-large": {
"description": "Mixtral Large مدل پرچمدار Mistral است که توانایی تولید کد، ریاضیات و استدلال را ترکیب می‌کند و از پنجره متنی ۱۲۸k پشتیبانی می‌کند."
},
"mistral-large-instruct": {
"description": "Mistral-Large-Instruct-2407 یک مدل زبانی بزرگ و پیشرفته (LLM) است که ۱۲۳ میلیارد پارامتر دارد و توانایی استدلال، دانش و برنامه‌نویسی مدرن را در خود جمع آوری کرده است."
},
"mistral-large-latest": {
"description": "Mistral Large یک مدل بزرگ پرچمدار است که در انجام وظایف چندزبانه، استدلال پیچیده و تولید کد مهارت دارد و انتخابی ایده‌آل برای کاربردهای سطح بالا است."
},
"mistral-medium-latest": {
"description": "Mistral Medium 3 با هزینه 8 برابری، عملکرد پیشرفته‌ای را ارائه می‌دهد و به طور اساسی استقرارهای شرکتی را ساده‌تر می‌کند."
},
"mistral-nemo": {
"description": "Mistral Nemo توسط Mistral AI و NVIDIA به‌طور مشترک عرضه شده است و یک مدل ۱۲ میلیاردی با کارایی بالا می‌باشد."
},
"mistral-nemo-instruct": {
"description": "مدل زبانی بزرگ (LLM) میسترال-نیمو-آموزش-۲۴۰۷ نسخه‌ای از میسترال-نیمو-پایه-۲۴۰۷ است که برای اجرای دستورالعمل‌ها آموزش داده شده است."
},
"mistral-small": {
"description": "Mistral Small می‌تواند برای هر وظیفه‌ای که نیاز به کارایی بالا و تأخیر کم دارد، مبتنی بر زبان استفاده شود."
},
"mistral-small-latest": {
"description": "Mistral Small یک گزینه مقرون‌به‌صرفه، سریع و قابل‌اعتماد است که برای موارد استفاده‌ای مانند ترجمه، خلاصه‌سازی و تحلیل احساسات مناسب است."
},
"mistral/codestral": {
"description": "Mistral Codestral 25.01 مدل کدنویسی پیشرفته‌ای است که برای موارد استفاده با تأخیر کم و فرکانس بالا بهینه شده است. این مدل به بیش از 80 زبان برنامه‌نویسی مسلط است و در وظایفی مانند پر کردن میانی (FIM)، اصلاح کد و تولید تست عملکرد برجسته‌ای دارد."
},
"mistral/codestral-embed": {
"description": "مدل جاسازی کد که می‌تواند در پایگاه‌های داده و مخازن کد جاسازی شود تا از دستیارهای کدنویسی پشتیبانی کند."
},
"mistral/devstral-small": {
"description": "Devstral یک مدل زبان بزرگ نمایندگی برای وظایف مهندسی نرم‌افزار است که آن را به انتخابی عالی برای نمایندگان مهندسی نرم‌افزار تبدیل می‌کند."
},
"mistral/magistral-medium": {
"description": "تفکر پیچیده با درک عمیق که استدلال شفاف قابل پیگیری و تأیید را ارائه می‌دهد. این مدل حتی هنگام تغییر زبان در میانه وظیفه، استدلال با وفاداری بالا را در زبان‌های متعدد حفظ می‌کند."
},
"mistral/magistral-small": {
"description": "تفکر پیچیده با درک عمیق که استدلال شفاف قابل پیگیری و تأیید را ارائه می‌دهد. این مدل حتی هنگام تغییر زبان در میانه وظیفه، استدلال با وفاداری بالا را در زبان‌های متعدد حفظ می‌کند."
},
"mistral/ministral-3b": {
"description": "مدلی جمع‌وجور و کارآمد برای وظایف روی دستگاه مانند دستیار هوشمند و تحلیل محلی که عملکرد با تأخیر کم ارائه می‌دهد."
},
"mistral/ministral-8b": {
"description": "مدلی قدرتمندتر با استدلال سریع‌تر و بهینه‌تر از نظر حافظه که برای جریان‌های کاری پیچیده و برنامه‌های لبه‌ای با نیازهای بالا ایده‌آل است."
},
"mistral/mistral-embed": {
"description": "مدل جاسازی متن عمومی برای جستجوی معنایی، تشابه، خوشه‌بندی و جریان‌های کاری RAG."
},
"mistral/mistral-large": {
"description": "Mistral Large انتخاب ایده‌آل برای وظایف پیچیده است که نیازمند توان استدلال بزرگ یا تخصص بالا هستند — مانند تولید متن ترکیبی، تولید کد، RAG یا نمایندگی."
},
"mistral/mistral-small": {
"description": "Mistral Small انتخاب ایده‌آل برای وظایف ساده‌ای است که می‌توانند به صورت دسته‌ای انجام شوند — مانند دسته‌بندی، پشتیبانی مشتری یا تولید متن. این مدل عملکرد عالی را با قیمت مقرون‌به‌صرفه ارائه می‌دهد."
},
"mistral/mixtral-8x22b-instruct": {
"description": "مدل 8x22b Instruct. 8x22b مدل متن‌باز متخصص ترکیبی است که توسط Mistral ارائه می‌شود."
},
"mistral/pixtral-12b": {
"description": "مدل 12 میلیارد پارامتری با توانایی درک تصویر و متن."
},
"mistral/pixtral-large": {
"description": "Pixtral Large دومین مدل خانواده چندرسانه‌ای ما است که سطح پیشرفته‌ای از درک تصویر را نشان می‌دهد. به طور خاص، این مدل قادر به درک اسناد، نمودارها و تصاویر طبیعی است و در عین حال توانایی پیشرو در درک متن مدل Mistral Large 2 را حفظ می‌کند."
},
"mistralai/Mistral-7B-Instruct-v0.1": {
"description": "Mistral (7B) Instruct به دلیل عملکرد بالا شناخته شده است و برای وظایف مختلف زبانی مناسب است."
},
"mistralai/Mistral-7B-Instruct-v0.2": {
"description": "مدل تنظیم دستور Mistral AI"
},
"mistralai/Mistral-7B-Instruct-v0.3": {
"description": "Mistral (7B) Instruct v0.3 توانایی محاسباتی بالا و درک زبان طبیعی را ارائه می‌دهد و برای کاربردهای گسترده مناسب است."
},
"mistralai/Mistral-7B-v0.1": {
"description": "Mistral 7B یک مدل فشرده اما با عملکرد بالا است که در پردازش دسته‌ای و وظایف ساده مانند طبقه‌بندی و تولید متن مهارت دارد و دارای توانایی استدلال خوبی است."
},
"mistralai/Mixtral-8x22B-Instruct-v0.1": {
"description": "Mixtral-8x22B Instruct (141B) یک مدل زبان بسیار بزرگ است که از نیازهای پردازشی بسیار بالا پشتیبانی می‌کند."
},
"mistralai/Mixtral-8x7B-Instruct-v0.1": {
"description": "Mixtral-8x7B Instruct (46.7B) یک چارچوب محاسباتی با ظرفیت بالا ارائه می‌دهد که برای پردازش داده‌های بزرگ مقیاس مناسب است."
},
"mistralai/Mixtral-8x7B-v0.1": {
"description": "Mixtral 8x7B یک مدل متخصص پراکنده است که با استفاده از پارامترهای متعدد سرعت استنتاج را افزایش می‌دهد و برای انجام وظایف چندزبانه و تولید کد مناسب است."
},
"mistralai/mistral-nemo": {
"description": "Mistral Nemo یک مدل با 7.3 میلیارد پارامتر است که از برنامه‌نویسی با عملکرد بالا و پشتیبانی چندزبانه برخوردار است."
},
"mixtral": {
"description": "Mixtral مدل تخصصی Mistral AI است که دارای وزن‌های متن‌باز بوده و در زمینه تولید کد و درک زبان پشتیبانی ارائه می‌دهد."
},
"mixtral-8x7b-32768": {
"description": "Mixtral 8x7B قابلیت محاسبات موازی با تحمل خطای بالا را ارائه می‌دهد و برای وظایف پیچیده مناسب است."
},
"mixtral:8x22b": {
"description": "Mixtral مدل تخصصی Mistral AI است که دارای وزن‌های متن‌باز بوده و در تولید کد و درک زبان پشتیبانی ارائه می‌دهد."
},
"moonshot-v1-128k": {
"description": "Moonshot V1 128K یک مدل با قابلیت پردازش متن طولانی است که برای تولید متون بسیار طولانی مناسب است. این مدل می‌تواند تا 128,000 توکن را پردازش کند و برای کاربردهایی مانند پژوهش، علمی و تولید اسناد بزرگ بسیار مناسب است."
},
"moonshot-v1-128k-vision-preview": {
"description": "مدل بصری Kimi (شامل moonshot-v1-8k-vision-preview/moonshot-v1-32k-vision-preview/moonshot-v1-128k-vision-preview و غیره) قادر به درک محتوای تصویر است، از جمله متن تصویر، رنگ تصویر و شکل اشیاء."
},
"moonshot-v1-32k": {
"description": "Moonshot V1 32K توانایی پردازش متن با طول متوسط را فراهم می‌کند و قادر به پردازش 32,768 توکن است. این مدل به‌ویژه برای تولید اسناد طولانی و مکالمات پیچیده مناسب است و در زمینه‌هایی مانند تولید محتوا، ایجاد گزارش و سیستم‌های مکالمه کاربرد دارد."
},
"moonshot-v1-32k-vision-preview": {
"description": "مدل بصری Kimi (شامل moonshot-v1-8k-vision-preview/moonshot-v1-32k-vision-preview/moonshot-v1-128k-vision-preview و غیره) قادر به درک محتوای تصویر است، از جمله متن تصویر، رنگ تصویر و شکل اشیاء."
},
"moonshot-v1-8k": {
"description": "Moonshot V1 8K به‌طور ویژه برای تولید متن‌های کوتاه طراحی شده است و دارای عملکرد پردازشی کارآمدی است که می‌تواند ۸,۱۹۲ توکن را پردازش کند. این مدل برای مکالمات کوتاه، یادداشت‌برداری سریع و تولید محتوای سریع بسیار مناسب است."
},
"moonshot-v1-8k-vision-preview": {
"description": "مدل بصری Kimi (شامل moonshot-v1-8k-vision-preview/moonshot-v1-32k-vision-preview/moonshot-v1-128k-vision-preview و غیره) قادر به درک محتوای تصویر است، از جمله متن تصویر، رنگ تصویر و شکل اشیاء."
},
"moonshot-v1-auto": {
"description": "Moonshot V1 Auto می‌تواند بر اساس تعداد توکن‌های اشغال شده در متن فعلی، مدل مناسب را انتخاب کند."
},
"moonshotai/Kimi-Dev-72B": {
"description": "Kimi-Dev-72B یک مدل بزرگ کد منبع باز است که با یادگیری تقویتی گسترده بهینه شده است و قادر به تولید پچ‌های پایدار و قابل استفاده مستقیم در تولید می‌باشد. این مدل در SWE-bench Verified امتیاز جدید ۶۰.۴٪ را کسب کرده و رکورد مدل‌های منبع باز را در وظایف مهندسی نرم‌افزار خودکار مانند رفع اشکال و بازبینی کد شکسته است."
},
"moonshotai/Kimi-K2-Instruct-0905": {
"description": "Kimi K2-Instruct-0905 جدیدترین و قدرتمندترین نسخه Kimi K2 است. این مدل یک مدل زبان برتر با معماری متخصص ترکیبی (MoE) است که دارای ۱ تریلیون پارامتر کل و ۳۲ میلیارد پارامتر فعال می‌باشد. ویژگی‌های اصلی این مدل شامل: هوش کدگذاری عامل بهبود یافته که در آزمون‌های معیار عمومی و وظایف واقعی کدگذاری عامل عملکرد قابل توجهی نشان می‌دهد؛ تجربه کدگذاری فرانت‌اند بهبود یافته که از نظر زیبایی و کاربردی بودن برنامه‌نویسی فرانت‌اند پیشرفت داشته است."
},
"moonshotai/Kimi-K2-Thinking": {
"description": "Kimi K2 Thinking جدیدترین و قدرتمندترین مدل تفکر متن‌باز است. این مدل با افزایش چشمگیر عمق استنتاج چندمرحله‌ای و حفظ پایداری در بیش از ۲۰۰ تا ۳۰۰ بار استفاده متوالی از ابزارها، استانداردهای جدیدی را در آزمون Humanity's Last Exam (HLE)، BrowseComp و سایر معیارها تعیین کرده است. همچنین، K2 Thinking در برنامه‌نویسی، ریاضیات، استدلال منطقی و سناریوهای Agent عملکردی برجسته دارد. این مدل بر پایه معماری متخصصان ترکیبی (MoE) ساخته شده، دارای حدود ۱ تریلیون پارامتر است، از پنجره زمینه ۲۵۶ هزار توکن پشتیبانی می‌کند و قابلیت استفاده از ابزارها را دارد."
},
"moonshotai/kimi-k2": {
"description": "Kimi K2 مدل زبان بزرگ متخصص ترکیبی (MoE) با مقیاس بزرگ توسعه یافته توسط Moonshot AI است که دارای 1 تریلیون پارامتر کل و 32 میلیارد پارامتر فعال در هر عبور جلو است. این مدل برای توانایی نمایندگی بهینه شده است، از جمله استفاده پیشرفته از ابزارها، استدلال و ترکیب کد."
},
"moonshotai/kimi-k2-0711": {
"description": "Kimi K2 0711 نسخه Instruct از سری Kimi است که برای کدهای با کیفیت بالا و فراخوانی ابزارها مناسب است."
},
"moonshotai/kimi-k2-0905": {
"description": "Kimi K2 0905 به‌روزرسانی نسخه 0905 از سری Kimi است که زمینه و عملکرد استدلال را گسترش داده و برای سناریوهای کدنویسی بهینه شده است."
},
"moonshotai/kimi-k2-instruct-0905": {
"description": "مدل پیش‌نمایش kimi-k2-0905 دارای طول متن ۲۵۶ هزار توکنی است و توانایی‌های قوی‌تری در برنامه‌نویسی عامل‌محور، زیبایی و کاربردی بودن کدهای فرانت‌اند و درک بهتر متن دارد."
},
"moonshotai/kimi-k2-thinking": {
"description": "Kimi K2 Thinking مدل تفکری بهینه‌شده از Moonshot برای وظایف استدلال عمیق است که توانایی عامل عمومی را داراست."
},
"moonshotai/kimi-k2-thinking-turbo": {
"description": "Kimi K2 Thinking Turbo نسخه پرسرعت Kimi K2 Thinking است که با حفظ توانایی استدلال عمیق، تأخیر پاسخ را به‌طور قابل توجهی کاهش می‌دهد."
},
"morph/morph-v3-fast": {
"description": "Morph مدل هوش مصنوعی تخصصی است که تغییرات کد پیشنهادی مدل‌های پیشرفته مانند Claude یا GPT-4o را به فایل‌های کد موجود شما به سرعت اعمال می‌کند — بیش از 4500 توکن در ثانیه. این مدل به عنوان مرحله نهایی در جریان کاری کدنویسی هوش مصنوعی عمل می‌کند و از ورودی و خروجی 16k توکن پشتیبانی می‌کند."
},
"morph/morph-v3-large": {
"description": "Morph مدل هوش مصنوعی تخصصی است که تغییرات کد پیشنهادی مدل‌های پیشرفته مانند Claude یا GPT-4o را به فایل‌های کد موجود شما با سرعت بیش از 2500 توکن در ثانیه اعمال می‌کند. این مدل به عنوان مرحله نهایی در جریان کاری کدنویسی هوش مصنوعی عمل می‌کند و از ورودی و خروجی 16k توکن پشتیبانی می‌کند."
},
"nousresearch/hermes-2-pro-llama-3-8b": {
"description": "هرمس ۲ پرو لاما ۳ ۸B نسخه ارتقاء یافته Nous Hermes 2 است که شامل جدیدترین مجموعه داده‌های توسعه‌یافته داخلی می‌باشد."
},
"nvidia/Llama-3.1-Nemotron-70B-Instruct-HF": {
"description": "Llama 3.1 Nemotron 70B یک مدل زبانی بزرگ سفارشی شده توسط NVIDIA است که به منظور افزایش کمک به پاسخ‌های تولید شده توسط LLM برای پرسش‌های کاربران طراحی شده است. این مدل در آزمون‌های معیار مانند Arena Hard، AlpacaEval 2 LC و GPT-4-Turbo MT-Bench عملکرد عالی داشته و تا تاریخ 1 اکتبر 2024 در تمامی سه آزمون خودکار هم‌راستایی در رتبه اول قرار دارد. این مدل با استفاده از RLHF (به ویژه REINFORCE)، Llama-3.1-Nemotron-70B-Reward و HelpSteer2-Preference در مدل Llama-3.1-70B-Instruct آموزش دیده است."
},
"nvidia/llama-3.1-nemotron-51b-instruct": {
"description": "مدل زبان منحصر به فرد که دقت و کارایی بی‌نظیری را ارائه می‌دهد."
},
"nvidia/llama-3.1-nemotron-70b-instruct": {
"description": "Llama-3.1-Nemotron-70B یک مدل زبان بزرگ سفارشی از NVIDIA است که به منظور افزایش کمک‌پذیری پاسخ‌های تولید شده توسط LLM طراحی شده است."
},
"o1": {
"description": "متمرکز بر استدلال پیشرفته و حل مسائل پیچیده، از جمله وظایف ریاضی و علمی. بسیار مناسب برای برنامه‌هایی که به درک عمیق زمینه و مدیریت جریان‌های کاری نیاز دارند."
},
"o1-mini": {
"description": "کوچک‌تر و سریع‌تر از o1-preview، با ۸۰٪ هزینه کمتر، عملکرد خوب در تولید کد و عملیات با زمینه‌های کوچک."
},
"o1-preview": {
"description": "متمرکز بر استدلال پیشرفته و حل مسائل پیچیده، از جمله مسائل ریاضی و علمی. بسیار مناسب برای برنامه‌هایی که نیاز به درک عمیقِ زمینه و جریان‌های کاری خودگردان دارند."
},
"o1-pro": {
"description": "مدل‌های سری o1 با آموزش تقویت یادگیری قادرند پیش از پاسخ‌دهی تفکر کنند و وظایف استدلال پیچیده را انجام دهند. مدل o1-pro از منابع محاسباتی بیشتری استفاده می‌کند تا تفکر عمیق‌تری داشته باشد و پاسخ‌های با کیفیت‌تری ارائه دهد."
},
"o3": {
"description": "o3 یک مدل همه‌کاره و قدرتمند است که در چندین حوزه عملکرد عالی دارد. این مدل استاندارد جدیدی برای وظایف ریاضی، علمی، برنامه‌نویسی و استدلال بصری تعیین کرده است. همچنین در نوشتن فنی و پیروی از دستورات نیز مهارت دارد. کاربران می‌توانند از آن برای تحلیل متن، کد و تصاویر و حل مسائل پیچیده چند مرحله‌ای استفاده کنند."
},
"o3-2025-04-16": {
"description": "o3 مدل استدلال جدید OpenAI است که از ورودی تصویر و متن پشتیبانی می‌کند و خروجی متنی ارائه می‌دهد، مناسب برای وظایف پیچیده با دانش عمومی گسترده."
},
"o3-deep-research": {
"description": "o3-deep-research پیشرفته‌ترین مدل تحقیق عمیق ما است که به‌طور خاص برای انجام وظایف تحقیقاتی پیچیده و چندمرحله‌ای طراحی شده است. این مدل می‌تواند از اینترنت جستجو و اطلاعات را ترکیب کند و همچنین از طریق اتصال MCP به داده‌های اختصاصی شما دسترسی پیدا کرده و از آن‌ها بهره‌برداری کند."
},
"o3-mini": {
"description": "o3-mini جدیدترین مدل استنتاج کوچک ماست که هوش بالایی را با هزینه و هدف تأخیر مشابه o1-mini ارائه می‌دهد."
},
"o3-pro": {
"description": "مدل o3-pro با استفاده از محاسبات بیشتر، تفکر عمیق‌تری انجام می‌دهد و همواره پاسخ‌های بهتری ارائه می‌کند. فقط در API پاسخ‌ها قابل استفاده است."
},
"o3-pro-2025-06-10": {
"description": "o3 Pro مدل استدلال جدید OpenAI است که از ورودی تصویر و متن پشتیبانی می‌کند و خروجی متنی ارائه می‌دهد، مناسب برای وظایف پیچیده با دانش عمومی گسترده."
},
"o4-mini": {
"description": "o4-mini جدیدترین مدل کوچک از سری o ما است. این مدل به‌طور خاص برای استدلال سریع و مؤثر بهینه‌سازی شده و در وظایف کدنویسی و بصری عملکرد بسیار بالایی دارد."
},
"o4-mini-2025-04-16": {
"description": "o4-mini مدل استدلال OpenAI است که از ورودی تصویر و متن پشتیبانی می‌کند و خروجی متنی ارائه می‌دهد، مناسب برای وظایف پیچیده با دانش عمومی گسترده. این مدل دارای زمینه متنی 200 هزار توکن است."
},
"o4-mini-deep-research": {
"description": "o4-mini-deep-research مدل تحقیق عمیق سریع‌تر و مقرون‌به‌صرفه‌تر ما است که برای انجام وظایف تحقیقاتی پیچیده و چندمرحله‌ای بسیار مناسب است. این مدل می‌تواند از اینترنت جستجو و اطلاعات را ترکیب کند و همچنین از طریق اتصال MCP به داده‌های اختصاصی شما دسترسی پیدا کرده و از آن‌ها بهره‌برداری کند."
},
"open-codestral-mamba": {
"description": "Codestral Mamba یک مدل زبان Mamba 2 است که بر تولید کد تمرکز دارد و پشتیبانی قدرتمندی برای وظایف پیشرفته کدنویسی و استدلال ارائه می‌دهد."
},
"open-mistral-7b": {
"description": "Mistral 7B یک مدل فشرده اما با عملکرد بالا است که در پردازش دسته‌ای و وظایف ساده مانند طبقه‌بندی و تولید متن مهارت دارد و دارای توانایی استدلال خوبی است."
},
"open-mistral-nemo": {
"description": "Mistral Nemo یک مدل 12 میلیاردی است که با همکاری Nvidia توسعه یافته و عملکرد عالی در استدلال و کدنویسی ارائه می‌دهد و به راحتی قابل ادغام و جایگزینی است."
},
"open-mixtral-8x22b": {
"description": "Mixtral 8x22B یک مدل تخصصی بزرگتر است که بر روی وظایف پیچیده تمرکز دارد و توانایی استدلال عالی و توان عملیاتی بالاتری را ارائه می‌دهد."
},
"open-mixtral-8x7b": {
"description": "Mixtral 8x7B یک مدل متخصص پراکنده است که با استفاده از پارامترهای متعدد سرعت استنتاج را افزایش می‌دهد و برای پردازش وظایف چندزبانه و تولید کد مناسب است."
},
"openai/gpt-3.5-turbo": {
"description": "توانمندترین و مقرون‌به‌صرفه‌ترین مدل در سری GPT-3.5 از OpenAI که برای اهداف مکالمه بهینه شده است، اما در وظایف تکمیل سنتی نیز عملکرد خوبی دارد."
},
"openai/gpt-3.5-turbo-instruct": {
"description": "توانایی مشابه مدل‌های دوره GPT-3. با نقاط انتهایی تکمیل سنتی سازگار است، نه نقاط انتهایی تکمیل مکالمه."
},
"openai/gpt-4-turbo": {
"description": "gpt-4-turbo از OpenAI دانش عمومی گسترده و تخصص حوزه‌ای دارد که آن را قادر می‌سازد دستورالعمل‌های پیچیده زبان طبیعی را دنبال کرده و مسائل دشوار را با دقت حل کند. تاریخ قطع دانش آن آوریل 2023 است و پنجره زمینه آن 128,000 توکن است."
},
"openai/gpt-4.1": {
"description": "سری GPT-4.1 زمینه متنی گسترده‌تر و توانایی‌های مهندسی و استدلال قوی‌تری را ارائه می‌دهد."
},
"openai/gpt-4.1-mini": {
"description": "GPT-4.1 Mini با تأخیر کمتر و صرفه‌جویی بیشتر، برای کاربردهای با زمینه متنی متوسط مناسب است."
},
"openai/gpt-4.1-nano": {
"description": "GPT-4.1 Nano گزینه‌ای با هزینه و تأخیر بسیار پایین است که برای مکالمات کوتاه و پرتکرار یا سناریوهای طبقه‌بندی مناسب است."
},
"openai/gpt-4o": {
"description": "سری GPT-4o مدل Omni شرکت OpenAI است که از ورودی متن + تصویر و خروجی متنی پشتیبانی می‌کند."
},
"openai/gpt-4o-mini": {
"description": "GPT-4o-mini نسخه کوچک و سریع GPT-4o است که برای سناریوهای ترکیبی متن و تصویر با تأخیر پایین مناسب است."
},
"openai/gpt-5": {
"description": "GPT-5 مدل قدرتمند OpenAI است که برای طیف گسترده‌ای از وظایف تولیدی و پژوهشی مناسب است."
},
"openai/gpt-5-chat": {
"description": "GPT-5 Chat زیرمدلی از GPT-5 است که برای سناریوهای گفت‌وگو بهینه‌سازی شده و با کاهش تأخیر، تجربه تعاملی بهتری ارائه می‌دهد."
},
"openai/gpt-5-codex": {
"description": "GPT-5-Codex نسخه‌ای از GPT-5 است که برای سناریوهای برنامه‌نویسی بهینه شده و برای جریان‌های کاری کدنویسی در مقیاس بزرگ مناسب است."
},
"openai/gpt-5-mini": {
"description": "GPT-5 Mini نسخه‌ای فشرده از خانواده GPT-5 است که برای سناریوهای با تأخیر و هزینه پایین مناسب است."
},
"openai/gpt-5-nano": {
"description": "GPT-5 Nano نسخه فوق‌کوچک این خانواده است که برای کاربردهایی با نیاز بسیار بالا به کاهش هزینه و تأخیر طراحی شده است."
},
"openai/gpt-5-pro": {
"description": "GPT-5 Pro مدل پرچم‌دار OpenAI است که قابلیت‌های پیشرفته‌ای در استدلال، تولید کد و ویژگی‌های سطح سازمانی ارائه می‌دهد و از مسیریابی در زمان تست و سیاست‌های امنیتی دقیق‌تر پشتیبانی می‌کند."
},
"openai/gpt-5.1": {
"description": "GPT-5.1 جدیدترین مدل پرچم‌دار سری GPT-5 است که در استدلال عمومی، پیروی از دستورالعمل‌ها و طبیعی بودن مکالمه نسبت به GPT-5 بهبود چشمگیری دارد و برای وظایف متنوع مناسب است."
},
"openai/gpt-5.1-chat": {
"description": "GPT-5.1 Chat عضو سبک‌تر خانواده GPT-5.1 است که برای گفت‌وگوهای با تأخیر پایین بهینه شده و در عین حال توانایی استدلال و اجرای دستورالعمل را حفظ کرده است."
},
"openai/gpt-5.1-codex": {
"description": "GPT-5.1-Codex نسخه‌ای از GPT-5.1 است که برای مهندسی نرم‌افزار و جریان‌های کاری کدنویسی بهینه شده و برای بازسازی‌های بزرگ، اشکال‌زدایی پیچیده و کدنویسی خودکار طولانی‌مدت مناسب است."
},
"openai/gpt-5.1-codex-mini": {
"description": "GPT-5.1-Codex-Mini نسخه کوچک و سریع GPT-5.1-Codex است که برای سناریوهای کدنویسی حساس به تأخیر و هزینه مناسب‌تر است."
},
"openai/gpt-oss-120b": {
"description": "مدل زبان بزرگ عمومی بسیار توانمند با توان استدلال قوی و قابل کنترل."
},
"openai/gpt-oss-20b": {
"description": "مدل زبان جمع‌وجور با وزن‌های متن‌باز که برای تأخیر کم و محیط‌های محدود منابع بهینه شده است، شامل استقرار محلی و لبه."
},
"openai/o1": {
"description": "o1 از OpenAI مدل استدلال پرچمدار است که برای مسائل پیچیده نیازمند تفکر عمیق طراحی شده است. این مدل توان استدلال قوی و دقت بالاتری برای وظایف چندمرحله‌ای پیچیده ارائه می‌دهد."
},
"openai/o1-mini": {
"description": "o1-mini یک مدل استنتاج سریع و مقرون‌به‌صرفه است که برای برنامه‌نویسی، ریاضیات و کاربردهای علمی طراحی شده است. این مدل دارای ۱۲۸ هزار بایت زمینه و تاریخ قطع دانش تا اکتبر ۲۰۲۳ می‌باشد."
},
"openai/o1-preview": {
"description": "o1 مدل جدید استنتاج OpenAI است که برای وظایف پیچیده‌ای که به دانش عمومی گسترده نیاز دارند، مناسب است. این مدل دارای 128K زمینه و تاریخ قطع دانش تا اکتبر 2023 است."
},
"openai/o3": {
"description": "o3 از OpenAI قدرتمندترین مدل استدلال است که سطوح پیشرفته جدیدی در کدنویسی، ریاضیات، علوم و درک بصری ایجاد کرده است. این مدل در پرسش‌های پیچیده که نیازمند تحلیل چندجانبه هستند مهارت دارد و در تحلیل تصاویر، نمودارها و گراف‌ها برتری خاصی دارد."
},
"openai/o3-mini": {
"description": "o3-mini جدیدترین مدل استدلال کوچک OpenAI است که هوشمندی بالایی را با همان اهداف هزینه و تأخیر o1-mini ارائه می‌دهد."
},
"openai/o3-mini-high": {
"description": "نسخه o3-mini با سطح استدلال بالا، هوش بالایی را در همان هزینه و هدف تأخیر o1-mini ارائه می‌دهد."
},
"openai/o4-mini": {
"description": "OpenAI o4-mini مدل استدلالی کوچک و کارآمد OpenAI است که برای سناریوهای با تأخیر پایین مناسب است."
},
"openai/o4-mini-high": {
"description": "نسخه با سطح استدلال بالا o4-mini، که به‌طور خاص برای استدلال سریع و مؤثر بهینه‌سازی شده و در وظایف کدنویسی و بصری عملکرد بسیار بالایی دارد."
},
"openai/text-embedding-3-large": {
"description": "توانمندترین مدل جاسازی OpenAI برای وظایف انگلیسی و غیرانگلیسی."
},
"openai/text-embedding-3-small": {
"description": "نسخه بهبود یافته و با عملکرد بالاتر مدل جاسازی ada از OpenAI."
},
"openai/text-embedding-ada-002": {
"description": "مدل جاسازی متن سنتی OpenAI."
},
"openrouter/auto": {
"description": "با توجه به طول متن، موضوع و پیچیدگی، درخواست شما به Llama 3 70B Instruct، Claude 3.5 Sonnet (تنظیم خودکار) یا GPT-4o ارسال خواهد شد."
},
"perplexity/sonar": {
"description": "محصول سبک Perplexity با قابلیت جستجوی مبتنی بر زمینه، سریع‌تر و ارزان‌تر از Sonar Pro."
},
"perplexity/sonar-pro": {
"description": "محصول پرچمدار Perplexity با قابلیت جستجوی مبتنی بر زمینه که از پرسش‌های پیشرفته و عملیات پیگیری پشتیبانی می‌کند."
},
"perplexity/sonar-reasoning": {
"description": "مدلی متمرکز بر استدلال که زنجیره تفکر (CoT) را در پاسخ‌ها ارائه می‌دهد و توضیحات مفصل با جستجوی مبتنی بر زمینه فراهم می‌کند."
},
"perplexity/sonar-reasoning-pro": {
"description": "مدل پیشرفته متمرکز بر استدلال که زنجیره تفکر (CoT) را در پاسخ‌ها ارائه می‌دهد و توضیحات جامع با قابلیت جستجوی پیشرفته و چندین پرس‌وجوی جستجو برای هر درخواست فراهم می‌کند."
},
"phi3": {
"description": "Phi-3 یک مدل سبک و باز از مایکروسافت است که برای یکپارچه‌سازی کارآمد و استدلال دانش در مقیاس بزرگ مناسب است."
},
"phi3:14b": {
"description": "Phi-3 یک مدل سبک و باز از مایکروسافت است که برای یکپارچه‌سازی کارآمد و استدلال دانش در مقیاس بزرگ طراحی شده است."
},
"pixtral-12b-2409": {
"description": "مدل Pixtral در وظایفی مانند نمودار و درک تصویر، پرسش و پاسخ اسناد، استدلال چندوجهی و پیروی از دستورات، توانایی‌های قدرتمندی از خود نشان می‌دهد. این مدل قادر است تصاویر را با وضوح طبیعی و نسبت ابعاد دریافت کند و همچنین می‌تواند هر تعداد تصویری را در یک پنجره متنی طولانی تا ۱۲۸ هزار توکن پردازش کند."
},
"pixtral-large-latest": {
"description": "Pixtral Large یک مدل چندرسانه‌ای متن‌باز با ۱۲۴۰ میلیارد پارامتر است که بر اساس Mistral Large 2 ساخته شده است. این دومین مدل در خانواده چندرسانه‌ای ماست که توانایی‌های پیشرفته‌ای در درک تصویر را به نمایش می‌گذارد."
},
"pro-128k": {
"description": "Spark Pro 128K با قابلیت پردازش متن بسیار بزرگ، قادر به پردازش تا 128K اطلاعات متنی است. این ویژگی به‌ویژه برای تحلیل کامل و پردازش ارتباطات منطقی طولانی‌مدت در محتوای متنی طولانی مناسب است و می‌تواند در ارتباطات متنی پیچیده، پشتیبانی از منطق روان و یکپارچه و ارجاعات متنوع را فراهم کند."
},
"pro-deepseek-r1": {
"description": "مدل اختصاصی برای خدمات سازمانی، شامل پشتیبانی از سرویس‌های هم‌زمان."
},
"pro-deepseek-v3": {
"description": "مدل اختصاصی برای خدمات سازمانی، شامل پشتیبانی از سرویس‌های هم‌زمان."
},
"qianfan-70b": {
"description": "Qianfan 70B، یک مدل چینی با پارامترهای بزرگ، مناسب برای تولید محتوای با کیفیت بالا و وظایف استدلال پیچیده است."
},
"qianfan-8b": {
"description": "Qianfan 8B، یک مدل عمومی متوسط، مناسب برای تولید متن و پاسخ‌گویی با توازن بین هزینه و کارایی."
},
"qianfan-agent-intent-32k": {
"description": "Qianfan Agent Intent 32K، مدلی برای شناسایی نیت و سازمان‌دهی عامل‌ها، پشتیبانی از سناریوهای با زمینه طولانی."
},
"qianfan-agent-lite-8k": {
"description": "Qianfan Agent Lite 8K، مدل سبک‌وزن عامل، مناسب برای گفتگوهای چندمرحله‌ای کم‌هزینه و سازمان‌دهی کسب‌وکار."
},
"qianfan-agent-speed-32k": {
"description": "Qianfan Agent Speed 32K، مدل عامل با کنترل جریان بالا، مناسب برای کاربردهای عامل در مقیاس بزرگ و چندوظیفه‌ای."
},
"qianfan-agent-speed-8k": {
"description": "Qianfan Agent Speed 8K، مدل عامل با توان پاسخ‌گویی سریع و هم‌زمانی بالا، مناسب برای گفتگوهای کوتاه و متوسط."
},
"qianfan-check-vl": {
"description": "Qianfan Check VL، مدل بررسی و تشخیص محتوای چندرسانه‌ای، پشتیبانی از تطابق و شناسایی تصویر و متن."
},
"qianfan-composition": {
"description": "Qianfan Composition، مدل تولید محتوای چندرسانه‌ای، پشتیبانی از درک و تولید ترکیبی تصویر و متن."
},
"qianfan-engcard-vl": {
"description": "Qianfan EngCard VL، مدل شناسایی چندرسانه‌ای با تمرکز بر سناریوهای انگلیسی."
},
"qianfan-lightning-128b-a19b": {
"description": "Qianfan Lightning 128B A19B، مدل عمومی چینی با عملکرد بالا، مناسب برای پرسش و پاسخ پیچیده و استدلال در مقیاس بزرگ."
},
"qianfan-llama-vl-8b": {
"description": "Qianfan Llama VL 8B، مدل چندرسانه‌ای مبتنی بر Llama، مناسب برای وظایف عمومی درک تصویر و متن."
},
"qianfan-multipicocr": {
"description": "Qianfan MultiPicOCR، مدل OCR چندتصویری، پشتیبانی از شناسایی و تشخیص متن در چندین تصویر."
},
"qianfan-qi-vl": {
"description": "Qianfan QI VL، مدل پرسش و پاسخ چندرسانه‌ای، پشتیبانی از جستجو و پاسخ دقیق در سناریوهای پیچیده تصویر و متن."
},
"qianfan-singlepicocr": {
"description": "Qianfan SinglePicOCR، مدل OCR تک‌تصویری، پشتیبانی از شناسایی دقیق کاراکترها."
},
"qianfan-vl-70b": {
"description": "Qianfan VL 70B، مدل زبان تصویری با پارامترهای بزرگ، مناسب برای درک پیچیده تصویر و متن."
},
"qianfan-vl-8b": {
"description": "Qianfan VL 8B، مدل سبک زبان تصویری، مناسب برای پرسش و پاسخ روزمره و تحلیل تصویر و متن."
},
"qvq-72b-preview": {
"description": "مدل QVQ یک مدل تحقیقاتی تجربی است که توسط تیم Qwen توسعه یافته و بر بهبود توانایی استدلال بصری، به‌ویژه در زمینه استدلال ریاضی تمرکز دارد."
},
"qvq-max": {
"description": "مدل استدلال بینایی QVQ Tongyi Qianwen که از ورودی‌های بینایی و خروجی زنجیره فکری پشتیبانی می‌کند و در ریاضیات، برنامه‌نویسی، تحلیل بینایی، خلاقیت و وظایف عمومی توانایی‌های قوی‌تری نشان می‌دهد."
},
"qvq-plus": {
"description": "مدل استدلال بصری. پشتیبانی از ورودی‌های بصری و خروجی زنجیره تفکر، نسخه پلاس پس از مدل qvq-max، که نسبت به مدل qvq-max سرعت استدلال بالاتر و تعادل بهتری بین عملکرد و هزینه دارد."
},
"qwen-3-32b": {
"description": "Qwen 3 32B: مدل سری Qwen با عملکرد عالی در وظایف چندزبانه و برنامه‌نویسی، مناسب برای استفاده در مقیاس متوسط تولیدی."
},
"qwen-coder-plus": {
"description": "مدل کد نویسی Tongyi Qianwen."
},
"qwen-coder-turbo": {
"description": "مدل کد نویسی Tongyi Qianwen."
},
"qwen-coder-turbo-latest": {
"description": "مدل کدنویسی تونگی چیان‌ون."
},
"qwen-flash": {
"description": "مدل‌های سری «通义千问» با سریع‌ترین پاسخ‌دهی و هزینه‌ای بسیار پایین، مناسب برای وظایف ساده."
},
"qwen-image": {
"description": "Qwen-Image یک مدل عمومی تولید تصویر است که از سبک‌های هنری متنوعی پشتیبانی می‌کند و به‌ویژه در رندر متن‌های پیچیده تبحر دارد، به‌خصوص رندر متن‌های چینی و انگلیسی. این مدل از چینش چندخطی، تولید متن در سطح پاراگراف و بازنمایی جزئیات ریز پشتیبانی می‌کند و قادر است طراحی‌های پیچیده ترکیبی متن و تصویر را تحقق بخشد."
},
"qwen-image-edit": {
"description": "Qwen Image Edit یک مدل تصویر به تصویر است که از ویرایش و اصلاح تصویر بر اساس تصویر ورودی و راهنمای متنی پشتیبانی می‌کند و قادر است بر اساس نیازهای کاربر، تصویر اصلی را به دقت تنظیم و به صورت خلاقانه تغییر دهد."
},
"qwen-long": {
"description": "مدل زبانی بسیار بزرگ Tongyi Qianwen که از متن‌های طولانی و همچنین قابلیت مکالمه در چندین سناریو مانند اسناد طولانی و چندین سند پشتیبانی می‌کند."
},
"qwen-math-plus": {
"description": "مدل ریاضی Tongyi Qianwen که به طور خاص برای حل مسائل ریاضی طراحی شده است."
},
"qwen-math-plus-latest": {
"description": "مدل ریاضی Qwen یک مدل زبانی است که به طور خاص برای حل مسائل ریاضی طراحی شده است."
},
"qwen-math-turbo": {
"description": "مدل ریاضی Tongyi Qianwen که به طور خاص برای حل مسائل ریاضی طراحی شده است."
},
"qwen-math-turbo-latest": {
"description": "مدل ریاضی Qwen Math Turbo یک مدل زبانی است که به طور خاص برای حل مسائل ریاضی طراحی شده است."
},
"qwen-max": {
"description": "مدل زبان بسیار بزرگ و با ظرفیت Qwen با توانایی پشتیبانی از ورودی زبان‌های مختلف مانند چینی و انگلیسی، در حال حاضر مدل API پشت نسخه محصول Qwen 2.5 است."
},
"qwen-omni-turbo": {
"description": "مدل‌های سری Qwen-Omni از ورودی‌های چندرسانه‌ای مختلف از جمله ویدئو، صدا، تصویر و متن پشتیبانی می‌کنند و خروجی صوتی و متنی ارائه می‌دهند."
},
"qwen-plus": {
"description": "مدل زبان بسیار بزرگ Qwen در نسخه تقویت شده، از ورودی زبان‌های مختلف مانند چینی و انگلیسی پشتیبانی می‌کند."
},
"qwen-turbo": {
"description": "نسخهٔ Turbo مدل «通义千问» از این پس به‌روزرسانی نخواهد شد؛ پیشنهاد می‌شود آن را با «通义千问 Flash» جایگزین کنید. 通义千问 یک مدل زبانی فوق‌العاده بزرگ است که از ورودی‌هایی به زبان‌های چینی، انگلیسی و دیگر زبان‌ها پشتیبانی می‌کند."
},
"qwen-vl-chat-v1": {
"description": "مدل Qwen-VL از روش‌های تعاملی انعطاف‌پذیر پشتیبانی می‌کند، از جمله قابلیت‌های چندتصویری، پرسش و پاسخ چندمرحله‌ای و خلاقیت."
},
"qwen-vl-max": {
"description": "مدل بزرگ زبان-بینایی فوق‌العاده بزرگ Tongyi Qianwen. نسبت به نسخه تقویت‌شده، توانایی استدلال بینایی و پیروی از دستورات را مجدداً ارتقاء داده و سطح بالاتری از ادراک و شناخت بینایی را ارائه می‌دهد."
},
"qwen-vl-max-latest": {
"description": "مدل زبان بصری فوق‌العاده بزرگ Qwen-VL. در مقایسه با نسخه تقویت‌شده، توانایی استدلال بصری و پیروی از دستورات را دوباره بهبود می‌بخشد و سطح بالاتری از ادراک و شناخت بصری را ارائه می‌دهد."
},
"qwen-vl-ocr": {
"description": "مدل اختصاصی استخراج متن Tongyi Qianwen OCR که بر استخراج متن از تصاویر اسناد، جداول، سوالات و دست‌نوشته‌ها تمرکز دارد. این مدل قادر به شناسایی چندین زبان است که شامل چینی، انگلیسی، فرانسوی، ژاپنی، کره‌ای، آلمانی، روسی، ایتالیایی، ویتنامی و عربی می‌باشد."
},
"qwen-vl-plus": {
"description": "نسخه تقویت‌شده مدل بزرگ زبان-بینایی Tongyi Qianwen. توانایی شناسایی جزئیات و تشخیص متن را به طور چشمگیری افزایش داده و از تصاویر با رزولوشن بیش از یک میلیون پیکسل و نسبت ابعاد دلخواه پشتیبانی می‌کند."
},
"qwen-vl-plus-latest": {
"description": "نسخه تقویت‌شده مدل زبان تصویری بزرگ تونگی چیان‌ون. بهبود قابل توجه در توانایی تشخیص جزئیات و شناسایی متن، پشتیبانی از وضوح بیش از یک میلیون پیکسل و تصاویر با هر نسبت طول به عرض."
},
"qwen-vl-v1": {
"description": "مدل زبان Qwen-7B با اضافه کردن مدل تصویر و وضوح ورودی تصویر 448، به عنوان یک مدل پیش‌آموزش‌شده، اولیه‌سازی شده است."
},
"qwen/qwen-2-7b-instruct": {
"description": "Qwen2 یک سری جدید از مدل‌های زبان بزرگ Qwen است. Qwen2 7B یک مدل مبتنی بر ترنسفورمر است که در درک زبان، قابلیت‌های چند زبانه، برنامه‌نویسی، ریاضی و استدلال عملکرد عالی دارد."
},
"qwen/qwen-2-7b-instruct:free": {
"description": "Qwen2 یک سری جدید از مدل‌های زبان بزرگ است که دارای توانایی‌های درک و تولید قوی‌تری می‌باشد."
},
"qwen/qwen-2-vl-72b-instruct": {
"description": "Qwen2-VL جدیدترین نسخه از مدل Qwen-VL است که در آزمون‌های معیار درک بصری به عملکرد پیشرفته‌ای دست یافته است، از جمله MathVista، DocVQA، RealWorldQA و MTVQA. Qwen2-VL قادر به درک ویدیوهای بیش از 20 دقیقه است و برای پرسش و پاسخ، گفتگو و تولید محتوا مبتنی بر ویدیو با کیفیت بالا استفاده می‌شود. این مدل همچنین دارای قابلیت‌های پیچیده استدلال و تصمیم‌گیری است و می‌تواند با دستگاه‌های موبایل، ربات‌ها و غیره ادغام شود و بر اساس محیط بصری و دستورات متنی به طور خودکار عمل کند. علاوه بر انگلیسی و چینی، Qwen2-VL اکنون از درک متن‌های مختلف زبان در تصاویر نیز پشتیبانی می‌کند، از جمله بیشتر زبان‌های اروپایی، ژاپنی، کره‌ای، عربی و ویتنامی."
},
"qwen/qwen-2.5-72b-instruct": {
"description": "Qwen2.5-72B-Instruct یکی از جدیدترین سری مدل‌های زبان بزرگ منتشر شده توسط Alibaba Cloud است. این مدل 72B در زمینه‌های کدنویسی و ریاضی دارای قابلیت‌های بهبود یافته قابل توجهی است. این مدل همچنین از چندین زبان پشتیبانی می‌کند و بیش از 29 زبان از جمله چینی و انگلیسی را پوشش می‌دهد. این مدل در پیروی از دستورات، درک داده‌های ساختاری و تولید خروجی‌های ساختاری (به ویژه JSON) بهبودهای قابل توجهی داشته است."
},
"qwen/qwen2.5-32b-instruct": {
"description": "Qwen2.5-32B-Instruct یکی از جدیدترین سری مدل‌های زبان بزرگ منتشر شده توسط Alibaba Cloud است. این مدل 32B در زمینه‌های کدنویسی و ریاضی دارای قابلیت‌های بهبود یافته قابل توجهی است. این مدل از چندین زبان پشتیبانی می‌کند و بیش از 29 زبان از جمله چینی و انگلیسی را پوشش می‌دهد. این مدل در پیروی از دستورات، درک داده‌های ساختاری و تولید خروجی‌های ساختاری (به ویژه JSON) بهبودهای قابل توجهی داشته است."
},
"qwen/qwen2.5-7b-instruct": {
"description": "مدل LLM برای زبان‌های چینی و انگلیسی که در زمینه‌های زبان، برنامه‌نویسی، ریاضیات و استدلال تخصص دارد."
},
"qwen/qwen2.5-coder-32b-instruct": {
"description": "مدل LLM پیشرفته که از تولید کد، استدلال و اصلاح پشتیبانی می‌کند و شامل زبان‌های برنامه‌نویسی اصلی است."
},
"qwen/qwen2.5-coder-7b-instruct": {
"description": "مدل کد قدرتمند و متوسط که از طول زمینه 32K پشتیبانی می‌کند و در برنامه‌نویسی چند زبانه مهارت دارد."
},
"qwen/qwen3-14b": {
"description": "Qwen3-14B نسخه 14 میلیاردی از سری Qwen است که برای استدلال و گفت‌وگوهای معمولی مناسب است."
},
"qwen/qwen3-14b:free": {
"description": "Qwen3-14B یک مدل زبان علّی با ۱۴.۸ میلیارد پارامتر در سری Qwen3 است که به طور خاص برای استدلال پیچیده و مکالمات کارآمد طراحی شده است. این مدل از جابجایی بی‌وقفه بین حالت «تفکر» برای وظایف ریاضی، برنامه‌نویسی و استدلال منطقی و حالت «غیرتفکری» برای مکالمات عمومی پشتیبانی می‌کند. این مدل به طور خاص برای پیروی از دستورات، استفاده از ابزارهای نمایندگی، نوشتن خلاق و انجام وظایف چند زبانه در بیش از ۱۰۰ زبان و گویش مختلف تنظیم شده است. این مدل به طور بومی از ۳۲K توکن زمینه پشتیبانی می‌کند و می‌تواند با استفاده از گسترش مبتنی بر YaRN به ۱۳۱K توکن گسترش یابد."
},
"qwen/qwen3-235b-a22b": {
"description": "Qwen3-235B-A22B یک مدل متخصص ترکیبی (MoE) با ۲۳۵B پارامتر است که توسط Qwen توسعه یافته و در هر بار انتقال رو به جلو ۲۲B پارامتر فعال می‌شود. این مدل از جابجایی بی‌وقفه بین حالت «تفکر» برای استدلال پیچیده، ریاضیات و وظایف کدنویسی و حالت «غیرتفکری» برای کارایی مکالمات عمومی پشتیبانی می‌کند. این مدل توانایی‌های استدلال قوی، پشتیبانی چند زبانه (بیش از ۱۰۰ زبان و گویش)، پیروی از دستورات پیشرفته و توانایی فراخوانی ابزارهای نمایندگی را نشان می‌دهد. این مدل به طور بومی از پنجره زمینه ۳۲K توکن پشتیبانی می‌کند و می‌تواند با استفاده از گسترش مبتنی بر YaRN به ۱۳۱K توکن گسترش یابد."
},
"qwen/qwen3-235b-a22b-2507": {
"description": "Qwen3-235B-A22B-Instruct نسخه Instruct از سری Qwen3 است که برای دستورالعمل‌های چندزبانه و زمینه‌های طولانی بهینه شده است."
},
"qwen/qwen3-235b-a22b-thinking-2507": {
"description": "Qwen3-235B-A22B-Thinking نسخه Thinking از Qwen3 است که برای وظایف پیچیده ریاضی و استدلالی تقویت شده است."
},
"qwen/qwen3-235b-a22b:free": {
"description": "Qwen3-235B-A22B یک مدل متخصص ترکیبی (MoE) با ۲۳۵B پارامتر است که توسط Qwen توسعه یافته و در هر بار انتقال رو به جلو ۲۲B پارامتر فعال می‌شود. این مدل از جابجایی بی‌وقفه بین حالت «تفکر» برای استدلال پیچیده، ریاضیات و وظایف کدنویسی و حالت «غیرتفکری» برای کارایی مکالمات عمومی پشتیبانی می‌کند. این مدل توانایی‌های استدلال قوی، پشتیبانی چند زبانه (بیش از ۱۰۰ زبان و گویش)، پیروی از دستورات پیشرفته و توانایی فراخوانی ابزارهای نمایندگی را نشان می‌دهد. این مدل به طور بومی از پنجره زمینه ۳۲K توکن پشتیبانی می‌کند و می‌تواند با استفاده از گسترش مبتنی بر YaRN به ۱۳۱K توکن گسترش یابد."
},
"qwen/qwen3-30b-a3b": {
"description": "Qwen3 نسل جدیدی از سری مدل‌های زبان بزرگ Qwen است که دارای معماری ترکیبی فشرده و متخصص (MoE) می‌باشد و در زمینه استدلال، پشتیبانی چند زبانه و وظایف پیشرفته نمایشی عالی دارد. توانایی منحصر به فرد آن در جابجایی بی‌وقفه بین حالت‌های تفکر برای استدلال پیچیده و حالت‌های غیرتفکری برای مکالمات کارآمد، عملکرد چندمنظوره و با کیفیت بالا را تضمین می‌کند.\n\nQwen3 به طور قابل توجهی از مدل‌های قبلی مانند QwQ و Qwen2.5 برتر است و توانایی‌های فوق‌العاده‌ای در ریاضیات، کدنویسی، استدلال عمومی، نوشتن خلاق و مکالمات تعاملی ارائه می‌دهد. واریانت Qwen3-30B-A3B شامل ۳۰.۵ میلیارد پارامتر (۳.۳ میلیارد پارامتر فعال)، ۴۸ لایه، ۱۲۸ متخصص (که هر کدام ۸ مورد را فعال می‌کنند) است و از زمینه ۱۳۱K توکن پشتیبانی می‌کند (با استفاده از YaRN) و استاندارد جدیدی برای مدل‌های متن‌باز تعیین می‌کند."
},
"qwen/qwen3-30b-a3b:free": {
"description": "Qwen3 نسل جدیدی از سری مدل‌های زبان بزرگ Qwen است که دارای معماری ترکیبی فشرده و متخصص (MoE) می‌باشد و در زمینه استدلال، پشتیبانی چند زبانه و وظایف پیشرفته نمایشی عالی دارد. توانایی منحصر به فرد آن در جابجایی بی‌وقفه بین حالت‌های تفکر برای استدلال پیچیده و حالت‌های غیرتفکری برای مکالمات کارآمد، عملکرد چندمنظوره و با کیفیت بالا را تضمین می‌کند.\n\nQwen3 به طور قابل توجهی از مدل‌های قبلی مانند QwQ و Qwen2.5 برتر است و توانایی‌های فوق‌العاده‌ای در ریاضیات، کدنویسی، استدلال عمومی، نوشتن خلاق و مکالمات تعاملی ارائه می‌دهد. واریانت Qwen3-30B-A3B شامل ۳۰.۵ میلیارد پارامتر (۳.۳ میلیارد پارامتر فعال)، ۴۸ لایه، ۱۲۸ متخصص (که هر کدام ۸ مورد را فعال می‌کنند) است و از زمینه ۱۳۱K توکن پشتیبانی می‌کند (با استفاده از YaRN) و استاندارد جدیدی برای مدل‌های متن‌باز تعیین می‌کند."
},
"qwen/qwen3-32b": {
"description": "Qwen3-32B یک مدل زبان علّی با ۳۲.۸ میلیارد پارامتر در سری Qwen3 است که به طور خاص برای استدلال پیچیده و مکالمات کارآمد بهینه‌سازی شده است. این مدل از جابجایی بی‌وقفه بین حالت «تفکر» برای وظایف ریاضی، کدنویسی و استدلال منطقی و حالت «غیرتفکری» برای مکالمات سریع و عمومی پشتیبانی می‌کند. این مدل در پیروی از دستورات، استفاده از ابزارهای نمایندگی، نوشتن خلاق و انجام وظایف چند زبانه در بیش از ۱۰۰ زبان و گویش مختلف عملکرد قوی دارد. این مدل به طور بومی از ۳۲K توکن زمینه پشتیبانی می‌کند و می‌تواند با استفاده از گسترش مبتنی بر YaRN به ۱۳۱K توکن گسترش یابد."
},
"qwen/qwen3-32b:free": {
"description": "Qwen3-32B یک مدل زبان علّی با ۳۲.۸ میلیارد پارامتر در سری Qwen3 است که به طور خاص برای استدلال پیچیده و مکالمات کارآمد بهینه‌سازی شده است. این مدل از جابجایی بی‌وقفه بین حالت «تفکر» برای وظایف ریاضی، کدنویسی و استدلال منطقی و حالت «غیرتفکری» برای مکالمات سریع و عمومی پشتیبانی می‌کند. این مدل در پیروی از دستورات، استفاده از ابزارهای نمایندگی، نوشتن خلاق و انجام وظایف چند زبانه در بیش از ۱۰۰ زبان و گویش مختلف عملکرد قوی دارد. این مدل به طور بومی از ۳۲K توکن زمینه پشتیبانی می‌کند و می‌تواند با استفاده از گسترش مبتنی بر YaRN به ۱۳۱K توکن گسترش یابد."
},
"qwen/qwen3-8b:free": {
"description": "Qwen3-8B یک مدل زبان علّی با ۸.۲ میلیارد پارامتر در سری Qwen3 است که به طور خاص برای وظایف استدلال فشرده و مکالمات کارآمد طراحی شده است. این مدل از جابجایی بی‌وقفه بین حالت «تفکر» برای ریاضیات، کدنویسی و استدلال منطقی و حالت «غیرتفکری» برای مکالمات عمومی پشتیبانی می‌کند. این مدل به طور خاص برای پیروی از دستورات، ادغام نمایندگی، نوشتن خلاق و استفاده چند زبانه در بیش از ۱۰۰ زبان و گویش مختلف تنظیم شده است. این مدل به طور بومی از پنجره زمینه ۳۲K توکن پشتیبانی می‌کند و می‌تواند از طریق YaRN به ۱۳۱K توکن گسترش یابد."
},
"qwen/qwen3-coder": {
"description": "Qwen3-Coder خانواده تولیدکننده کد از Qwen3 است که در درک و تولید کد در اسناد طولانی تخصص دارد."
},
"qwen/qwen3-coder-plus": {
"description": "Qwen3-Coder-Plus مدل کدنویسی بهینه‌شده ویژه از سری Qwen است که از فراخوانی ابزارهای پیچیده و مکالمات بلندمدت پشتیبانی می‌کند."
},
"qwen/qwen3-max": {
"description": "Qwen3 Max مدل استدلالی سطح بالا از سری Qwen3 است که برای استدلال چندزبانه و یکپارچه‌سازی ابزارها مناسب است."
},
"qwen/qwen3-max-preview": {
"description": "Qwen3 Max (پیش‌نمایش) نسخه Max از سری Qwen است که برای استدلال پیشرفته و یکپارچه‌سازی ابزارها طراحی شده است."
},
"qwen/qwen3-vl-plus": {
"description": "Qwen3 VL-Plus نسخه تقویت‌شده بصری از Qwen3 است که توانایی استدلال چندحالته و پردازش ویدیو را بهبود داده است."
},
"qwen2": {
"description": "Qwen2 مدل زبان بزرگ نسل جدید علی‌بابا است که با عملکرد عالی از نیازهای متنوع کاربردی پشتیبانی می‌کند."
},
"qwen2.5": {
"description": "Qwen2.5 نسل جدید مدل زبانی مقیاس بزرگ Alibaba است که با عملکرد عالی از نیازهای متنوع کاربردی پشتیبانی می‌کند."
},
"qwen2.5-14b-instruct": {
"description": "مدل 14B مقیاس Qwen 2.5 که به صورت منبع باز ارائه شده است."
},
"qwen2.5-14b-instruct-1m": {
"description": "مدل 72B مقیاس Qwen2.5 که به صورت متن‌باز ارائه شده است."
},
"qwen2.5-32b-instruct": {
"description": "مدل 32B مقیاس Qwen 2.5 که به صورت منبع باز ارائه شده است."
},
"qwen2.5-72b-instruct": {
"description": "مدل 72B مقیاس بازمتن Qwen 2.5 برای استفاده عمومی."
},
"qwen2.5-7b-instruct": {
"description": "Qwen2.5 7B Instruct، مدل دستورالعمل متن‌باز و بالغ، مناسب برای گفتگو و تولید در سناریوهای مختلف."
},
"qwen2.5-coder-1.5b-instruct": {
"description": "نسخه متن‌باز مدل کد Qwen."
},
"qwen2.5-coder-14b-instruct": {
"description": "نسخه متن‌باز مدل کد نویسی Tongyi Qianwen."
},
"qwen2.5-coder-32b-instruct": {
"description": "نسخه متن باز مدل کد Qwen."
},
"qwen2.5-coder-7b-instruct": {
"description": "نسخه متن‌باز مدل کدنویسی تونگی چیان‌ون."
},
"qwen2.5-coder-instruct": {
"description": "Qwen2.5-Coder جدیدترین مدل زبانی بزرگ مخصوص کد نویسی از سری Qwen (که قبلاً با نام CodeQwen شناخته می‌شد) است."
},
"qwen2.5-instruct": {
"description": "Qwen2.5 جدیدترین سری مدل‌های زبانی بزرگ Qwen است. برای Qwen2.5، ما چندین مدل زبانی پایه و مدل‌های زبانی با تنظیم دستورالعمل‌های میکرو منتشر کرده‌ایم که تعداد پارامتر آن‌ها از 500 میلیون تا 7.2 میلیارد متفاوت است."
},
"qwen2.5-math-1.5b-instruct": {
"description": "مدل Qwen-Math دارای قابلیت‌های قوی حل مسئله ریاضی است."
},
"qwen2.5-math-72b-instruct": {
"description": "مدل Qwen-Math دارای توانایی قوی در حل مسائل ریاضی است."
},
"qwen2.5-math-7b-instruct": {
"description": "مدل Qwen-Math دارای توانایی قوی در حل مسائل ریاضی است."
},
"qwen2.5-omni-7b": {
"description": "مدل‌های سری Qwen-Omni از ورودی‌های چندگانه شامل ویدیو، صدا، تصویر و متن پشتیبانی می‌کنند و خروجی‌هایی به صورت صدا و متن ارائه می‌دهند."
},
"qwen2.5-vl-32b-instruct": {
"description": "Qwen2.5 VL 32B Instruct، مدل چندرسانه‌ای متن‌باز، مناسب برای استقرار خصوصی و کاربردهای متنوع."
},
"qwen2.5-vl-72b-instruct": {
"description": "پیروی از دستورات، ریاضیات، حل مسائل، بهبود کلی کد، بهبود توانایی شناسایی همه چیز، پشتیبانی از فرمت‌های مختلف برای شناسایی دقیق عناصر بصری، پشتیبانی از درک فایل‌های ویدیویی طولانی (حداکثر 10 دقیقه) و شناسایی لحظات رویداد در سطح ثانیه، توانایی درک زمان و سرعت، بر اساس توانایی تجزیه و تحلیل و شناسایی، پشتیبانی از کنترل عامل‌های OS یا Mobile، توانایی استخراج اطلاعات کلیدی و خروجی به فرمت Json قوی، این نسخه 72B است و قوی‌ترین نسخه در این سری است."
},
"qwen2.5-vl-7b-instruct": {
"description": "Qwen2.5 VL 7B Instruct، مدل سبک چندرسانه‌ای، توازن بین هزینه استقرار و توان شناسایی."
},
"qwen2.5-vl-instruct": {
"description": "Qwen2.5-VL نسخه جدید مدل زبانی و بصری از خانواده مدل‌های Qwen است."
},
"qwen2.5:0.5b": {
"description": "Qwen2.5 نسل جدید مدل زبانی مقیاس بزرگ Alibaba است که با عملکرد عالی از نیازهای متنوع کاربردی پشتیبانی می‌کند."
},
"qwen2.5:1.5b": {
"description": "Qwen2.5 نسل جدید مدل زبانی مقیاس بزرگ Alibaba است که با عملکرد عالی از نیازهای متنوع کاربردی پشتیبانی می‌کند."
},
"qwen2.5:72b": {
"description": "Qwen2.5 نسل جدید مدل زبانی مقیاس بزرگ Alibaba است که با عملکرد عالی از نیازهای متنوع کاربردی پشتیبانی می‌کند."
},
"qwen2:0.5b": {
"description": "Qwen2 مدل زبان بزرگ نسل جدید علی‌بابا است که با عملکرد عالی از نیازهای متنوع کاربردی پشتیبانی می‌کند."
},
"qwen2:1.5b": {
"description": "Qwen2 مدل زبان بزرگ نسل جدید علی‌بابا است که با عملکرد عالی از نیازهای متنوع کاربردی پشتیبانی می‌کند."
},
"qwen2:72b": {
"description": "Qwen2 مدل زبان بزرگ نسل جدید علی‌بابا است که با عملکرد عالی از نیازهای متنوع کاربردی پشتیبانی می‌کند."
},
"qwen3": {
"description": "Qwen3 مدل زبان نسل جدید علی‌بابا است که با عملکرد عالی، نیازهای متنوع کاربردی را پشتیبانی می‌کند."
},
"qwen3-0.6b": {
"description": "Qwen3 0.6B، مدل سطح ابتدایی، مناسب برای استدلال ساده و محیط‌های با منابع بسیار محدود."
},
"qwen3-1.7b": {
"description": "Qwen3 1.7B، مدل فوق‌سبک، مناسب برای استقرار در لبه و دستگاه‌های نهایی."
},
"qwen3-14b": {
"description": "Qwen3 14B، مدل متوسط، مناسب برای پرسش و پاسخ چندزبانه و تولید متن."
},
"qwen3-235b-a22b": {
"description": "Qwen3 235B A22B، مدل بزرگ عمومی، مناسب برای وظایف پیچیده گوناگون."
},
"qwen3-235b-a22b-instruct-2507": {
"description": "Qwen3 235B A22B Instruct 2507، مدل دستورالعمل پرچم‌دار عمومی، مناسب برای تولید و استدلال در وظایف مختلف."
},
"qwen3-235b-a22b-thinking-2507": {
"description": "Qwen3 235B A22B Thinking 2507، مدل تفکر در مقیاس بسیار بزرگ، مناسب برای استدلال‌های دشوار."
},
"qwen3-30b-a3b": {
"description": "Qwen3 30B A3B، مدل عمومی متوسط تا بزرگ، توازن بین هزینه و کارایی."
},
"qwen3-30b-a3b-instruct-2507": {
"description": "Qwen3 30B A3B Instruct 2507، مدل دستورالعمل متوسط تا بزرگ، مناسب برای تولید با کیفیت و پرسش و پاسخ."
},
"qwen3-30b-a3b-thinking-2507": {
"description": "Qwen3 30B A3B Thinking 2507، مدل تفکر متوسط تا بزرگ، توازن بین دقت و هزینه."
},
"qwen3-32b": {
"description": "Qwen3 32B، مناسب برای وظایف عمومی که نیاز به درک قوی‌تری دارند."
},
"qwen3-4b": {
"description": "Qwen3 4B، مناسب برای کاربردهای کوچک تا متوسط و سناریوهای استدلال محلی."
},
"qwen3-8b": {
"description": "Qwen3 8B، مدل سبک، با استقرار انعطاف‌پذیر، مناسب برای کاربردهای با هم‌زمانی بالا."
},
"qwen3-coder-30b-a3b-instruct": {
"description": "نسخه متن‌باز مدل کدنویسی Qwen. مدل جدید qwen3-coder-30b-a3b-instruct بر پایه Qwen3 ساخته شده و دارای توانایی‌های قدرتمند در نقش عامل کدنویس (Coding Agent) است. این مدل در فراخوانی ابزارها و تعامل با محیط مهارت دارد و ضمن حفظ توانایی‌های عمومی، قابلیت برنامه‌نویسی خودکار و تولید کد پیشرفته را ارائه می‌دهد."
},
"qwen3-coder-480b-a35b-instruct": {
"description": "Qwen3 Coder 480B A35B Instruct، مدل پرچم‌دار کدنویسی، پشتیبانی از برنامه‌نویسی چندزبانه و درک کد پیچیده."
},
"qwen3-coder-flash": {
"description": "مدل کد نویسی Tongyi Qianwen. جدیدترین مدل‌های سری Qwen3-Coder بر پایه Qwen3 ساخته شده‌اند و دارای توانایی‌های قدرتمند Coding Agent هستند، در فراخوانی ابزارها و تعامل با محیط مهارت دارند، قادر به برنامه‌نویسی خودکار هستند و در کنار توانایی‌های کدنویسی برجسته، قابلیت‌های عمومی نیز دارند."
},
"qwen3-coder-plus": {
"description": "مدل کد نویسی Tongyi Qianwen. جدیدترین مدل‌های سری Qwen3-Coder بر پایه Qwen3 ساخته شده‌اند و دارای توانایی‌های قدرتمند Coding Agent هستند، در فراخوانی ابزارها و تعامل با محیط مهارت دارند، قادر به برنامه‌نویسی خودکار هستند و در کنار توانایی‌های کدنویسی برجسته، قابلیت‌های عمومی نیز دارند."
},
"qwen3-coder:480b": {
"description": "مدل با عملکرد بالا و زمینه طولانی طراحی شده توسط علی‌بابا برای وظایف نمایندگی و کدنویسی."
},
"qwen3-max": {
"description": "مدل سری Qwen3-Max از Tongyi Qianwen 3 که نسبت به سری 2.5 به طور کلی توانایی‌های عمومی بهبود یافته‌ای دارد؛ شامل درک متن دو زبانه چینی و انگلیسی، پیروی از دستورالعمل‌های پیچیده، توانایی انجام وظایف باز و ذهنی، پشتیبانی چندزبانه و فراخوانی ابزارها که همه به طور قابل توجهی تقویت شده‌اند؛ خطاهای دانش مدل نیز کاهش یافته است. جدیدترین مدل Qwen3-Max نسبت به نسخه پیش‌نمایش Qwen3-Max در زمینه برنامه‌نویسی هوشمند و فراخوانی ابزارها به‌روزرسانی‌های ویژه‌ای داشته است. نسخه رسمی منتشر شده به سطح SOTA حوزه رسیده و برای نیازهای پیچیده‌تر هوش مصنوعی تطبیق یافته است."
},
"qwen3-max-preview": {
"description": "بهترین مدل در سری Qwen، مناسب برای وظایف پیچیده و چندمرحله‌ای. نسخه پیش‌نمایش اکنون از قابلیت تفکر پشتیبانی می‌کند."
},
"qwen3-next-80b-a3b-instruct": {
"description": "مدل متن‌باز نسل جدید بدون حالت تفکر مبتنی بر Qwen3، که نسبت به نسخه قبلی (Tongyi Qianwen 3-235B-A22B-Instruct-2507) در درک متن‌های چینی بهتر است، توانایی استدلال منطقی بهبود یافته و عملکرد بهتری در وظایف تولید متن دارد."
},
"qwen3-next-80b-a3b-thinking": {
"description": "Qwen3 Next 80B A3B Thinking، نسخه پرچم‌دار مدل استدلال برای وظایف پیچیده."
},
"qwen3-omni-flash": {
"description": "مدل Qwen-Omni قادر است ورودی‌هایی از انواع مختلف مانند متن، تصویر، صدا و ویدیو را دریافت کرده و پاسخ‌هایی به صورت متن یا گفتار تولید کند. این مدل از صداهای شبه‌انسانی متنوع، چندزبانگی و گویش‌های مختلف پشتیبانی می‌کند و در کاربردهایی مانند تولید محتوا، تشخیص بصری و دستیار صوتی قابل استفاده است."
},
"qwen3-vl-235b-a22b-instruct": {
"description": "Qwen3 VL 235B A22B Instruct، مدل چندرسانه‌ای پرچم‌دار، مناسب برای درک و تولید در سناریوهای با نیاز بالا."
},
"qwen3-vl-235b-a22b-thinking": {
"description": "Qwen3 VL 235B A22B Thinking، نسخه تفکر پرچم‌دار، برای استدلال و برنامه‌ریزی چندرسانه‌ای پیچیده."
},
"qwen3-vl-30b-a3b-instruct": {
"description": "Qwen3 VL 30B A3B Instruct، مدل بزرگ چندرسانه‌ای، توازن بین دقت و عملکرد استدلال."
},
"qwen3-vl-30b-a3b-thinking": {
"description": "Qwen3 VL 30B A3B Thinking، نسخه تفکر برای وظایف پیچیده چندرسانه‌ای."
},
"qwen3-vl-32b-instruct": {
"description": "Qwen3 VL 32B Instruct، مدل دستورالعمل چندرسانه‌ای، مناسب برای پرسش و پاسخ تصویری با کیفیت و تولید محتوا."
},
"qwen3-vl-32b-thinking": {
"description": "Qwen3 VL 32B Thinking، نسخه تفکر چندرسانه‌ای، تقویت‌شده برای استدلال پیچیده و تحلیل زنجیره‌ای طولانی."
},
"qwen3-vl-8b-instruct": {
"description": "Qwen3 VL 8B Instruct، مدل سبک چندرسانه‌ای، مناسب برای پرسش و پاسخ تصویری روزمره و یکپارچه‌سازی در برنامه‌ها."
},
"qwen3-vl-8b-thinking": {
"description": "Qwen3 VL 8B Thinking، مدل زنجیره تفکر چندرسانه‌ای، مناسب برای استدلال دقیق بر اساس اطلاعات تصویری."
},
"qwen3-vl-flash": {
"description": "Qwen3 VL Flash نسخه‌ای سبک و با سرعت بالای استدلال است که برای سناریوهای حساس به تأخیر یا درخواست‌های حجیم مناسب می‌باشد."
},
"qwen3-vl-plus": {
"description": "Tongyi Qianwen VL مدلی برای تولید متن با قابلیت درک بصری (تصویر) است که نه تنها می‌تواند OCR (تشخیص متن در تصویر) انجام دهد، بلکه قادر به خلاصه‌سازی و استنتاج بیشتر نیز هست، مانند استخراج ویژگی‌ها از عکس محصولات یا حل مسائل بر اساس تصاویر تمرین."
},
"qwq": {
"description": "QwQ یک مدل تحقیقاتی تجربی است که بر بهبود توانایی استدلال AI تمرکز دارد."
},
"qwq-32b": {
"description": "مدل استنتاج QwQ مبتنی بر مدل Qwen2.5-32B است که از طریق یادگیری تقویتی به طور قابل توجهی توانایی استنتاج مدل را افزایش داده است. شاخص‌های اصلی مدل مانند کد ریاضی (AIME 24/25، LiveCodeBench) و برخی از شاخص‌های عمومی (IFEval، LiveBench و غیره) به سطح DeepSeek-R1 نسخه کامل رسیده‌اند و تمامی شاخص‌ها به طور قابل توجهی از DeepSeek-R1-Distill-Qwen-32B که نیز مبتنی بر Qwen2.5-32B است، پیشی گرفته‌اند."
},
"qwq-32b-preview": {
"description": "مدل QwQ یک مدل تحقیقاتی تجربی است که توسط تیم Qwen توسعه یافته و بر تقویت توانایی استدلال AI تمرکز دارد."
},
"qwq-plus": {
"description": "مدل استدلال QwQ مبتنی بر مدل Qwen2.5 است که با یادگیری تقویتی توانایی استدلال مدل را به طور قابل توجهی افزایش داده است. شاخص‌های اصلی مدل در ریاضیات و کد نویسی (AIME 24/25، LiveCodeBench) و برخی شاخص‌های عمومی (IFEval، LiveBench و غیره) به سطح نسخه کامل DeepSeek-R1 رسیده‌اند."
},
"qwq_32b": {
"description": "مدل استدلالی با اندازه متوسط از سری Qwen. نسبت به مدل‌های معمولی تنظیم‌شده بر اساس دستورات، QwQ که دارای توانایی‌های تفکر و استدلال است، در وظایف پایین‌دستی، به‌ویژه در حل مسائل دشوار، می‌تواند عملکرد را به‌طور قابل توجهی افزایش دهد."
},
"r1-1776": {
"description": "R1-1776 نسخه‌ای از مدل DeepSeek R1 است که پس از آموزش مجدد، اطلاعات واقعی بدون سانسور و بدون تعصب را ارائه می‌دهد."
},
"solar-mini": {
"description": "Solar Mini یک LLM فشرده است که عملکردی بهتر از GPT-3.5 دارد و دارای توانایی‌های چند زبانه قوی است و از انگلیسی و کره‌ای پشتیبانی می‌کند و راه‌حل‌های کارآمد و کوچکی را ارائه می‌دهد."
},
"solar-mini-ja": {
"description": "Solar Mini (Ja) توانایی‌های Solar Mini را گسترش می‌دهد و بر روی زبان ژاپنی تمرکز دارد و در استفاده از انگلیسی و کره‌ای نیز کارایی و عملکرد عالی را حفظ می‌کند."
},
"solar-pro": {
"description": "Solar Pro یک مدل هوش مصنوعی پیشرفته از Upstage است که بر توانایی پیروی از دستورات با استفاده از یک GPU تمرکز دارد و امتیاز IFEval بالای 80 را کسب کرده است. در حال حاضر از زبان انگلیسی پشتیبانی می‌کند و نسخه رسمی آن برای نوامبر 2024 برنامه‌ریزی شده است که پشتیبانی از زبان‌های بیشتر و طول زمینه را گسترش خواهد داد."
},
"sonar": {
"description": "محصول جستجوی سبک بر اساس زمینه جستجو که سریع‌تر و ارزان‌تر از Sonar Pro است."
},
"sonar-deep-research": {
"description": "تحقیق عمیق، تحقیقاتی جامع و تخصصی را انجام می‌دهد و آن را به گزارش‌های قابل دسترسی و قابل استفاده تبدیل می‌کند."
},
"sonar-pro": {
"description": "محصول جستجوی پیشرفته که از جستجوی زمینه پشتیبانی می‌کند و قابلیت‌های پیشرفته‌ای برای پرسش و پیگیری دارد."
},
"sonar-reasoning": {
"description": "محصول جدید API که توسط مدل استدلال DeepSeek پشتیبانی می‌شود."
},
"sonar-reasoning-pro": {
"description": "محصول جدید API که توسط مدل استدلال DeepSeek پشتیبانی می‌شود."
},
"spark-x": {
"description": "معرفی قابلیت‌های X1.5: (۱) افزودن تنظیم پویا برای حالت تفکر، قابل کنترل از طریق فیلد thinking؛ (۲) افزایش طول زمینه: ورودی و خروجی هرکدام ۶۴ هزار توکن؛ (۳) پشتیبانی از قابلیت FunctionCall."
},
"stable-diffusion-3-medium": {
"description": "جدیدترین مدل بزرگ تولید تصویر از متن که توسط Stability AI ارائه شده است. این نسخه با حفظ مزایای نسل‌های قبلی، بهبودهای قابل توجهی در کیفیت تصویر، درک متن و تنوع سبک‌ها دارد و قادر است دستورات پیچیده زبان طبیعی را دقیق‌تر تفسیر کرده و تصاویر دقیق‌تر و متنوع‌تری تولید کند."
},
"stable-diffusion-3.5-large": {
"description": "stable-diffusion-3.5-large یک مدل مولد تصویر از متن مبتنی بر ترنسفورمر انتشار چندرسانه‌ای (MMDiT) با 800 میلیون پارامتر است که کیفیت تصویر عالی و تطابق بالا با دستورات متنی دارد، قادر به تولید تصاویر با وضوح بالا تا 1 میلیون پیکسل است و می‌تواند به طور کارآمد روی سخت‌افزارهای مصرفی معمول اجرا شود."
},
"stable-diffusion-3.5-large-turbo": {
"description": "stable-diffusion-3.5-large-turbo مدلی است که بر پایه stable-diffusion-3.5-large ساخته شده و با استفاده از تکنولوژی تقطیر انتشار متخاصم (ADD) سرعت بالاتری دارد."
},
"stable-diffusion-v1.5": {
"description": "stable-diffusion-v1.5 با وزن‌های نقطه بررسی stable-diffusion-v1.2 آغاز شده و با 595 هزار مرحله تنظیم دقیق روی مجموعه \"laion-aesthetics v2 5+\" با وضوح 512x512 انجام شده است. این مدل 10٪ کاهش شرط‌بندی متنی دارد تا نمونه‌برداری هدایت‌شده بدون طبقه‌بندی‌کننده را بهبود بخشد."
},
"stable-diffusion-xl": {
"description": "stable-diffusion-xl نسبت به نسخه v1.5 بهبودهای قابل توجهی داشته و با مدل‌های متن‌باز پیشرفته مانند midjourney قابل مقایسه است. بهبودها شامل: شبکه اصلی unet بزرگ‌تر که سه برابر نسخه قبلی است؛ افزودن ماژول پالایش برای بهبود کیفیت تصاویر تولید شده؛ و تکنیک‌های آموزش بهینه‌تر."
},
"stable-diffusion-xl-base-1.0": {
"description": "مدل بزرگ تولید تصویر از متن که توسط Stability AI توسعه یافته و متن‌باز است و در تولید تصاویر خلاقانه در صنعت پیشرو است. دارای توانایی درک دقیق دستورات و پشتیبانی از تعریف معکوس Prompt برای تولید دقیق محتوا است."
},
"step-1-128k": {
"description": "تعادل بین عملکرد و هزینه، مناسب برای سناریوهای عمومی."
},
"step-1-256k": {
"description": "دارای توانایی پردازش متن طولانی، به‌ویژه مناسب برای تحلیل اسناد بلند."
},
"step-1-32k": {
"description": "پشتیبانی از مکالمات با طول متوسط، مناسب برای انواع مختلف کاربردها."
},
"step-1-8k": {
"description": "مدل کوچک، مناسب برای وظایف سبک."
},
"step-1-flash": {
"description": "مدل پرسرعت، مناسب برای مکالمات در لحظه."
},
"step-1.5v-mini": {
"description": "این مدل دارای توانایی‌های قوی در درک ویدیو است."
},
"step-1o-turbo-vision": {
"description": "این مدل دارای توانایی‌های قوی در درک تصویر است و در زمینه‌های ریاضی و کدنویسی از 1o قوی‌تر است. این مدل کوچکتر از 1o است و سرعت خروجی بیشتری دارد."
},
"step-1o-vision-32k": {
"description": "این مدل دارای توانایی‌های قوی در درک تصویر است. در مقایسه با مدل‌های سری step-1v، عملکرد بصری بهتری دارد."
},
"step-1v-32k": {
"description": "پشتیبانی از ورودی بصری، تقویت تجربه تعامل چندحالته."
},
"step-1v-8k": {
"description": "مدل بصری کوچک، مناسب برای وظایف پایه‌ای تصویر و متن."
},
"step-1x-edit": {
"description": "این مدل بر وظایف ویرایش تصویر تمرکز دارد و قادر است بر اساس تصویر و توصیف متنی ارائه شده توسط کاربر، تصویر را اصلاح و بهبود بخشد. از فرمت‌های ورودی مختلف از جمله توصیف متنی و تصاویر نمونه پشتیبانی می‌کند. مدل قادر به درک نیت کاربر و تولید نتایج ویرایش تصویر مطابق با خواسته‌ها است."
},
"step-1x-medium": {
"description": "این مدل دارای توانایی قوی در تولید تصویر است و از توصیف متنی به عنوان ورودی پشتیبانی می‌کند. پشتیبانی بومی از زبان چینی دارد و می‌تواند توصیف‌های متنی چینی را بهتر درک و پردازش کند و معنای دقیق‌تر را به ویژگی‌های تصویری تبدیل کند تا تولید تصویر دقیق‌تری داشته باشد. مدل قادر است تصاویر با وضوح و کیفیت بالا تولید کند و توانایی انتقال سبک نیز دارد."
},
"step-2-16k": {
"description": "پشتیبانی از تعاملات متنی گسترده، مناسب برای سناریوهای مکالمه پیچیده."
},
"step-2-16k-exp": {
"description": "نسخه آزمایشی مدل step-2 که شامل جدیدترین ویژگی‌ها است و به‌طور مداوم به‌روزرسانی می‌شود. استفاده در محیط‌های تولیدی رسمی توصیه نمی‌شود."
},
"step-2-mini": {
"description": "مدل بزرگ فوق‌العاده سریع مبتنی بر معماری توجه MFA که به‌طور خودجوش توسعه یافته است، با هزینه بسیار کم به نتایجی مشابه با مرحله ۱ دست می‌یابد و در عین حال توانایی پردازش بالاتر و زمان پاسخ سریع‌تری را حفظ می‌کند. این مدل قادر به انجام وظایف عمومی است و در توانایی‌های کدنویسی تخصص دارد."
},
"step-2x-large": {
"description": "مدل نسل جدید Step Star برای تولید تصویر است که بر تولید تصویر بر اساس توصیف متنی کاربر تمرکز دارد و تصاویر با کیفیت بالا تولید می‌کند. مدل جدید تصاویر با بافت واقعی‌تر و توانایی تولید متن‌های چینی و انگلیسی قوی‌تر دارد."
},
"step-3": {
"description": "این مدل از توانایی‌های قوی در ادراک بصری و استدلال پیچیده برخوردار است. می‌تواند به‌دقت مفاهیم پیچیده میان‌رشته‌ای را درک کند، تحلیل‌های تقاطعی اطلاعات ریاضی و بصری را انجام دهد و به انواع مسائل تحلیل بصری در زندگی روزمره پاسخ دهد."
},
"step-r1-v-mini": {
"description": "این مدل یک مدل استدلال بزرگ با توانایی‌های قوی در درک تصویر است که می‌تواند اطلاعات تصویری و متنی را پردازش کند و پس از تفکر عمیق، متن تولید کند. این مدل در زمینه استدلال بصری عملکرد برجسته‌ای دارد و همچنین دارای توانایی‌های ریاضی، کدنویسی و استدلال متنی در سطح اول است. طول متن زمینه‌ای 100k است."
},
"stepfun-ai/step3": {
"description": "Step3 یک مدل استنتاج چندمودالی پیشرفته است که توسط شرکت StepFun منتشر شده است. این مدل بر پایهٔ معماری مخلوط متخصصان (MoE) با مجموع 321 میلیارد پارامتر و 38 میلیارد پارامتر فعال ساخته شده است. طراحی آن انتها‌به‌انتها است و هدفش کمینه‌سازی هزینهٔ رمزگشایی در حالی‌ست که در استدلال بینایی-زبانی عملکردی در سطح برتر ارائه می‌دهد. از طریق طراحی هم‌افزا مبتنی بر توجه چند-ماتریسی تجزیه‌شده (MFA) و جداسازی توجه و FFN (AFD)، Step3 قادر است کارایی برجسته‌ای را هم روی شتاب‌دهنده‌های رده‌پرچم‌دار و هم روی شتاب‌دهنده‌های سطح پایین حفظ کند. در مرحلهٔ پیش‌آموزش، Step3 بیش از 20T توکن متنی و 4T توکن ترکیبی تصویر-متن را پردازش کرده و بیش از ده زبان را پوشش داده است. این مدل در بنچ‌مارک‌های متعددی از جمله ریاضیات، کدنویسی و چندمودال در میان مدل‌های متن‌باز در جایگاه پیشرو قرار گرفته است."
},
"taichu_llm": {
"description": "Taichu 2.0 بر اساس حجم زیادی از داده‌های با کیفیت بالا آموزش دیده است و دارای توانایی‌های قوی‌تری در درک متن، تولید محتوا، پرسش و پاسخ در مکالمه و غیره می‌باشد."
},
"taichu_o1": {
"description": "taichu_o1 نسل جدید مدل‌های استدلال بزرگ است که از طریق تعامل چندرسانه‌ای و یادگیری تقویتی زنجیره‌های تفکر شبیه به انسان را ایجاد می‌کند و از تصمیم‌گیری‌های پیچیده پشتیبانی می‌کند و در عین حفظ خروجی با دقت بالا، مسیرهای تفکر قابل مدلسازی را نشان می‌دهد و برای تحلیل استراتژی و تفکر عمیق مناسب است."
},
"taichu_vl": {
"description": "توانایی‌های درک تصویر، انتقال دانش، و استدلال منطقی را ترکیب کرده و در زمینه پرسش و پاسخ تصویری و متنی عملکرد برجسته‌ای دارد."
},
"tencent/Hunyuan-A13B-Instruct": {
"description": "Hunyuan-A13B-Instruct با ۸۰ میلیارد پارامتر، با فعال‌سازی ۱۳ میلیارد پارامتر قادر به رقابت با مدل‌های بزرگ‌تر است و از استدلال ترکیبی «تفکر سریع/تفکر کند» پشتیبانی می‌کند؛ درک متون بلند به صورت پایدار؛ توانایی عامل با تأیید BFCL-v3 و τ-Bench پیشرو است؛ با ترکیب GQA و چندین فرمت کوانتیزه‌سازی، استدلال کارآمد را محقق می‌سازد."
},
"tencent/Hunyuan-MT-7B": {
"description": "مدل ترجمه Hunyuan (Hunyuan Translation Model) شامل دو بخش است: مدل ترجمه Hunyuan-MT-7B و مدل ترکیبی Hunyuan-MT-Chimera. Hunyuan-MT-7B یک مدل ترجمه سبک‌وزن با ۷ میلیارد پارامتر است که برای ترجمه متن مبدأ به زبان مقصد طراحی شده است. این مدل از ترجمه بین ۳۳ زبان و ۵ زبان اقلیت چینی پشتیبانی می‌کند. در رقابت بین‌المللی ترجمه ماشینی WMT25، این مدل در ۳۰ مورد از ۳۱ زبان شرکت‌کننده رتبه اول را کسب کرد و توانایی ترجمه برجسته‌ای از خود نشان داد. تیم Hunyuan شرکت Tencent یک الگوی آموزشی کامل از پیش‌آموزش تا تنظیم نظارتی، تقویت ترجمه و تقویت ترکیبی ارائه کرده است که باعث شده این مدل در میان مدل‌های هم‌رده از نظر اندازه، عملکردی پیشرو داشته باشد. این مدل از بهره‌وری محاسباتی بالا و قابلیت استقرار آسان برخوردار است و برای کاربردهای متنوع مناسب است."
},
"text-embedding-3-large": {
"description": "قدرت‌مندترین مدل وکتور سازی، مناسب برای وظایف انگلیسی و غیرانگلیسی."
},
"text-embedding-3-small": {
"description": "مدل جدید و کارآمد Embedding، مناسب برای جستجوی دانش، کاربردهای RAG و سایر سناریوها."
},
"thudm/glm-4-32b": {
"description": "GLM-4-32B-0414 یک مدل زبان با وزن‌های باز 32B دو زبانه (چینی و انگلیسی) است که برای تولید کد، فراخوانی توابع و وظایف نمایندگی بهینه‌سازی شده است. این مدل بر روی 15T داده‌های با کیفیت بالا و داده‌های استدلال مجدد پیش‌آموزش شده و با هم‌راستایی ترجیحات انسانی، نمونه‌برداری رد و یادگیری تقویتی بهبود یافته است. این مدل در استدلال پیچیده، تولید آثار و وظایف خروجی ساختاری عملکرد عالی از خود نشان می‌دهد و در چندین آزمون معیار به عملکردی معادل با GPT-4o و DeepSeek-V3-0324 دست یافته است."
},
"thudm/glm-4-32b:free": {
"description": "GLM-4-32B-0414 یک مدل زبان با وزن‌های باز 32B دو زبانه (چینی و انگلیسی) است که برای تولید کد، فراخوانی توابع و وظایف نمایندگی بهینه‌سازی شده است. این مدل بر روی 15T داده‌های با کیفیت بالا و داده‌های استدلال مجدد پیش‌آموزش شده و با هم‌راستایی ترجیحات انسانی، نمونه‌برداری رد و یادگیری تقویتی بهبود یافته است. این مدل در استدلال پیچیده، تولید آثار و وظایف خروجی ساختاری عملکرد عالی از خود نشان می‌دهد و در چندین آزمون معیار به عملکردی معادل با GPT-4o و DeepSeek-V3-0324 دست یافته است."
},
"thudm/glm-4-9b-chat": {
"description": "نسخه متن باز جدیدترین نسل مدل‌های پیش‌آموزش GLM-4 منتشر شده توسط Zhizhu AI."
},
"thudm/glm-z1-32b": {
"description": "GLM-Z1-32B-0414 یک واریانت تقویت‌شده استدلال GLM-4-32B است که به طور خاص برای حل مسائل عمیق ریاضی، منطقی و کد محور طراحی شده است. این مدل از یادگیری تقویتی گسترش‌یافته (وظیفه‌محور و مبتنی بر ترجیحات جفتی عمومی) برای بهبود عملکرد در وظایف پیچیده چند مرحله‌ای استفاده می‌کند. نسبت به مدل پایه GLM-4-32B، Z1 به طور قابل توجهی توانایی‌های استدلال ساختاری و حوزه‌های رسمی را افزایش می‌دهد.\n\nاین مدل از طریق مهندسی نشانه‌گذاری، مراحل «تفکر» را تحمیل می‌کند و برای خروجی‌های طولانی، انسجام بهبودیافته‌ای را فراهم می‌کند. این مدل برای جریان‌های کاری نمایندگی بهینه‌سازی شده و از زمینه‌های طولانی (از طریق YaRN)، فراخوانی ابزار JSON و پیکربندی نمونه‌برداری دقیق برای استدلال پایدار پشتیبانی می‌کند. این مدل برای مواردی که نیاز به تفکر عمیق، استدلال چند مرحله‌ای یا استنتاج رسمی دارند، بسیار مناسب است."
},
"thudm/glm-z1-rumination-32b": {
"description": "THUDM: GLM Z1 Rumination 32B یک مدل عمیق استدلال با ۳۲B پارامتر در سری GLM-4-Z1 است که برای وظایف پیچیده و باز که نیاز به تفکر طولانی دارند بهینه‌سازی شده است. این مدل بر اساس glm-4-32b-0414 ساخته شده و مراحل تقویت یادگیری اضافی و استراتژی‌های هم‌راستایی چند مرحله‌ای را اضافه کرده است و توانایی «تفکر» را که به شبیه‌سازی پردازش شناختی گسترش یافته طراحی شده است، معرفی می‌کند. این شامل استدلال تکراری، تحلیل چندپرش و جریان‌های کاری تقویت‌شده با ابزارهایی مانند جستجو، بازیابی و ترکیب آگاهانه است.\n\nاین مدل در نوشتن تحقیقاتی، تحلیل مقایسه‌ای و پرسش و پاسخ پیچیده عملکرد عالی دارد. این مدل از فراخوانی توابع برای جستجو و ناوبری (جستجو، کلیک، باز کردن، اتمام) پشتیبانی می‌کند و می‌تواند در لوله‌های نمایندگی استفاده شود. رفتار تفکری توسط کنترل چند دوری با پاداش‌های مبتنی بر قوانین و مکانیزم تصمیم‌گیری تأخیری شکل می‌گیرد و به عنوان مرجع از چارچوب‌های عمیق تحقیقاتی مانند انباشت هم‌راستایی داخلی OpenAI استفاده می‌شود. این واریانت برای صحنه‌هایی که نیاز به عمق به جای سرعت دارند مناسب است."
},
"tngtech/deepseek-r1t-chimera:free": {
"description": "DeepSeek-R1T-Chimera با ترکیب DeepSeek-R1 و DeepSeek-V3 (۰۳۲۴) ایجاد شده است و توانایی استدلال R1 و بهبود کارایی توکن V3 را ترکیب می‌کند. این مدل بر اساس معماری DeepSeek-MoE Transformer ساخته شده و برای وظایف تولید متن عمومی بهینه‌سازی شده است.\n\nاین مدل وزن‌های پیش‌آموزش دو مدل منبع را ترکیب می‌کند تا عملکرد استدلال، کارایی و پیروی از دستورات را متعادل کند. این مدل تحت مجوز MIT منتشر شده و برای استفاده‌های تحقیقاتی و تجاری طراحی شده است."
},
"togethercomputer/StripedHyena-Nous-7B": {
"description": "StripedHyena Nous (7B) با استفاده از استراتژی‌ها و معماری مدل کارآمد، توان محاسباتی بهبودیافته‌ای را ارائه می‌دهد."
},
"tts-1": {
"description": "جدیدترین مدل تبدیل متن به گفتار، بهینه‌سازی شده برای سرعت در سناریوهای زنده."
},
"tts-1-hd": {
"description": "جدیدترین مدل تبدیل متن به گفتار، بهینه‌سازی شده برای کیفیت."
},
"upstage/SOLAR-10.7B-Instruct-v1.0": {
"description": "Upstage SOLAR Instruct v1 (11B) مناسب برای وظایف دقیق دستوری، ارائه‌دهنده توانایی‌های برجسته در پردازش زبان."
},
"us.anthropic.claude-3-5-sonnet-20241022-v2:0": {
"description": "Claude 3.5 Sonnet استانداردهای صنعتی را ارتقا داده و عملکردی فراتر از مدل‌های رقیب و Claude 3 Opus دارد و در ارزیابی‌های گسترده‌ای عملکرد عالی از خود نشان می‌دهد، در حالی که سرعت و هزینه مدل‌های سطح متوسط ما را نیز داراست."
},
"us.anthropic.claude-3-7-sonnet-20250219-v1:0": {
"description": "Claude 3.7 sonnet سریع‌ترین مدل نسل بعدی Anthropic است. در مقایسه با Claude 3 Haiku، Claude 3.7 Sonnet در تمام مهارت‌ها بهبود یافته و در بسیاری از آزمون‌های استاندارد هوش از بزرگ‌ترین مدل نسل قبلی، Claude 3 Opus، پیشی گرفته است."
},
"us.anthropic.claude-haiku-4-5-20251001-v1:0": {
"description": "Claude Haiku 4.5 سریع‌ترین و هوشمندترین مدل Haiku از شرکت Anthropic است که دارای سرعتی برق‌آسا و توانایی تفکر توسعه‌یافته می‌باشد."
},
"us.anthropic.claude-sonnet-4-5-20250929-v1:0": {
"description": "Claude Sonnet 4.5 هوشمندترین مدلی است که تاکنون توسط Anthropic ارائه شده است."
},
"v0-1.0-md": {
"description": "مدل v0-1.0-md نسخه قدیمی مدلی است که از طریق API نسخه v0 ارائه می‌شود"
},
"v0-1.5-lg": {
"description": "مدل v0-1.5-lg برای وظایف پیشرفته تفکر یا استدلال مناسب است"
},
"v0-1.5-md": {
"description": "مدل v0-1.5-md برای وظایف روزمره و تولید رابط کاربری (UI) مناسب است"
},
"vercel/v0-1.0-md": {
"description": "دسترسی به مدل پشت v0 برای تولید، رفع اشکال و بهینه‌سازی برنامه‌های وب مدرن با استدلال چارچوب خاص و دانش به‌روز."
},
"vercel/v0-1.5-md": {
"description": "دسترسی به مدل پشت v0 برای تولید، رفع اشکال و بهینه‌سازی برنامه‌های وب مدرن با استدلال چارچوب خاص و دانش به‌روز."
},
"volcengine/doubao-seed-code": {
"description": "Doubao-Seed-Code مدل بزرگ بهینه‌شده برای برنامه‌نویسی عاملی (Agentic Programming) از Volcengine است که در معیارهای مختلف برنامه‌نویسی و عامل‌ها عملکرد برجسته‌ای دارد و از زمینه ۲۵۶ هزار توکن پشتیبانی می‌کند."
},
"wan2.2-t2i-flash": {
"description": "نسخه سریع Wanxiang 2.2، جدیدترین مدل فعلی. در خلاقیت، پایداری و واقع‌گرایی به طور کامل ارتقا یافته، سرعت تولید بالا و نسبت قیمت به کیفیت عالی دارد."
},
"wan2.2-t2i-plus": {
"description": "نسخه حرفه‌ای Wanxiang 2.2، جدیدترین مدل فعلی. در خلاقیت، پایداری و واقع‌گرایی به طور کامل ارتقا یافته و جزئیات تولید شده غنی‌تر است."
},
"wanx-v1": {
"description": "مدل پایه تولید تصویر از متن. معادل مدل عمومی 1.0 در وب‌سایت رسمی Tongyi Wanxiang."
},
"wanx2.0-t2i-turbo": {
"description": "متخصص در پرتره‌های با بافت، سرعت متوسط و هزینه پایین. معادل مدل سریع 2.0 در وب‌سایت رسمی Tongyi Wanxiang."
},
"wanx2.1-t2i-plus": {
"description": "نسخه ارتقا یافته کامل. جزئیات تصاویر تولید شده غنی‌تر و سرعت کمی کندتر است. معادل مدل حرفه‌ای 2.1 در وب‌سایت رسمی Tongyi Wanxiang."
},
"wanx2.1-t2i-turbo": {
"description": "نسخه ارتقا یافته کامل. سرعت تولید بالا، عملکرد جامع و نسبت قیمت به کیفیت عالی. معادل مدل سریع 2.1 در وب‌سایت رسمی Tongyi Wanxiang."
},
"whisper-1": {
"description": "مدل شناسایی گفتار عمومی که از شناسایی گفتار چندزبانه، ترجمه گفتار و شناسایی زبان پشتیبانی می‌کند."
},
"wizardlm2": {
"description": "WizardLM 2 یک مدل زبانی ارائه شده توسط هوش مصنوعی مایکروسافت است که در مکالمات پیچیده، چندزبانه، استدلال و دستیارهای هوشمند عملکرد برجسته‌ای دارد."
},
"wizardlm2:8x22b": {
"description": "WizardLM 2 یک مدل زبانی ارائه شده توسط مایکروسافت AI است که در زمینه‌های مکالمات پیچیده، چندزبانه، استدلال و دستیارهای هوشمند عملکرد برجسته‌ای دارد."
},
"x-ai/grok-4": {
"description": "Grok 4 مدل پرچم‌دار استدلالی xAI است که توانایی‌های قدرتمند در استدلال و چندحالته ارائه می‌دهد."
},
"x-ai/grok-4-fast": {
"description": "Grok 4 Fast مدل با توان عملیاتی بالا و هزینه پایین از xAI است (با پشتیبانی از پنجره زمینه ۲ میلیون توکن) که برای سناریوهای با نیاز به هم‌زمانی بالا و زمینه طولانی مناسب است."
},
"x-ai/grok-4-fast-non-reasoning": {
"description": "Grok 4 Fast (بدون استدلال) مدل چندحالته با توان عملیاتی بالا و هزینه پایین از xAI است (با پشتیبانی از پنجره زمینه ۲ میلیون توکن) که برای سناریوهایی مناسب است که به استدلال درون‌مدلی نیاز ندارند اما به تأخیر و هزینه حساس هستند. این مدل در کنار نسخه reasoning از Grok 4 Fast قرار دارد و می‌توان از طریق پارامتر reasoning enable در API، قابلیت استدلال را در صورت نیاز فعال کرد. ورودی‌ها و خروجی‌ها ممکن است توسط xAI یا OpenRouter برای بهبود مدل‌های آینده استفاده شوند."
},
"x-ai/grok-4.1-fast": {
"description": "Grok 4.1 Fast مدل با توان عملیاتی بالا و هزینه پایین از xAI است (با پشتیبانی از پنجره زمینه ۲ میلیون توکن) که برای سناریوهای با نیاز به هم‌زمانی بالا و زمینه طولانی مناسب است."
},
"x-ai/grok-4.1-fast-non-reasoning": {
"description": "Grok 4.1 Fast (بدون استدلال) مدل چندحالته با توان عملیاتی بالا و هزینه پایین از xAI است (با پشتیبانی از پنجره زمینه ۲ میلیون توکن) که برای سناریوهایی مناسب است که به استدلال درون‌مدلی نیاز ندارند اما به تأخیر و هزینه حساس هستند. این مدل در کنار نسخه reasoning از Grok 4.1 Fast قرار دارد و می‌توان از طریق پارامتر reasoning enable در API، قابلیت استدلال را در صورت نیاز فعال کرد. ورودی‌ها و خروجی‌ها ممکن است توسط xAI یا OpenRouter برای بهبود مدل‌های آینده استفاده شوند."
},
"x-ai/grok-code-fast-1": {
"description": "Grok Code Fast 1 مدل سریع کدنویسی از xAI است که خروجی‌هایی با خوانایی بالا و سازگار با مهندسی ارائه می‌دهد."
},
"xai/grok-2": {
"description": "Grok 2 مدل زبان پیشرفته با توان استدلال پیشرفته است. این مدل در مکالمه، کدنویسی و استدلال توانایی‌های پیشرفته دارد و در رتبه‌بندی LMSYS بالاتر از Claude 3.5 Sonnet و GPT-4-Turbo قرار دارد."
},
"xai/grok-2-vision": {
"description": "مدل بصری Grok 2 در وظایف مبتنی بر دید عملکرد برجسته‌ای دارد و در استدلال ریاضی بصری (MathVista) و پرسش و پاسخ مبتنی بر سند (DocVQA) عملکرد پیشرفته ارائه می‌دهد. این مدل قادر به پردازش انواع اطلاعات بصری از جمله اسناد، نمودارها، جداول، اسکرین‌شات‌ها و عکس‌ها است."
},
"xai/grok-3": {
"description": "مدل پرچمدار xAI که در موارد استفاده شرکتی مانند استخراج داده، کدنویسی و خلاصه‌سازی متن عملکرد برجسته‌ای دارد. دارای دانش عمیق حوزه در مالی، مراقبت‌های بهداشتی، حقوقی و علوم است."
},
"xai/grok-3-fast": {
"description": "مدل پرچمدار xAI که در موارد استفاده شرکتی مانند استخراج داده، کدنویسی و خلاصه‌سازی متن عملکرد برجسته‌ای دارد. نسخه سریع‌تر مدل روی زیرساخت سریع‌تر ارائه می‌شود و زمان پاسخ بسیار کوتاه‌تری دارد. افزایش سرعت با هزینه بالاتر به ازای هر توکن خروجی همراه است."
},
"xai/grok-3-mini": {
"description": "مدل سبک وزن xAI که قبل از پاسخ دادن تفکر می‌کند. برای وظایف ساده یا مبتنی بر منطق که نیاز به دانش عمیق حوزه ندارند بسیار مناسب است. مسیر تفکر خام قابل دسترسی است."
},
"xai/grok-3-mini-fast": {
"description": "مدل سبک وزن xAI که قبل از پاسخ دادن تفکر می‌کند. برای وظایف ساده یا مبتنی بر منطق که نیاز به دانش عمیق حوزه ندارند بسیار مناسب است. مسیر تفکر خام قابل دسترسی است. نسخه سریع‌تر مدل روی زیرساخت سریع‌تر ارائه می‌شود و زمان پاسخ بسیار کوتاه‌تری دارد. افزایش سرعت با هزینه بالاتر به ازای هر توکن خروجی همراه است."
},
"xai/grok-4": {
"description": "جدیدترین و بزرگ‌ترین مدل پرچمدار xAI که عملکرد بی‌نظیری در زبان طبیعی، ریاضیات و استدلال ارائه می‌دهد — انتخابی کامل و همه‌کاره."
},
"yi-large": {
"description": "مدل جدید با میلیاردها پارامتر، ارائه‌دهنده توانایی‌های فوق‌العاده در پاسخ‌گویی و تولید متن."
},
"yi-large-fc": {
"description": "بر اساس مدل yi-large، قابلیت استفاده از ابزارها را پشتیبانی و تقویت کرده است و برای انواع سناریوهای کسب‌وکاری که نیاز به ساخت agent یا workflow دارند، مناسب است."
},
"yi-large-preview": {
"description": "نسخه اولیه، توصیه می‌شود از yi-large (نسخه جدید) استفاده کنید."
},
"yi-large-rag": {
"description": "خدمات پیشرفته مبتنی بر مدل فوق‌العاده yi-large، که با ترکیب فناوری‌های جستجو و تولید، پاسخ‌های دقیقی ارائه می‌دهد و خدمات جستجوی اطلاعات در سراسر وب به صورت لحظه‌ای فراهم می‌کند."
},
"yi-large-turbo": {
"description": "عملکرد عالی با صرفه‌جویی بالا. بهینه‌سازی دقت بالا با توجه به تعادل بین عملکرد، سرعت استنتاج و هزینه."
},
"yi-lightning": {
"description": "جدیدترین مدل با عملکرد بالا که ضمن تضمین خروجی با کیفیت بالا، سرعت استنتاج را به طور قابل توجهی افزایش می‌دهد."
},
"yi-lightning-lite": {
"description": "نسخه سبک، استفاده از yi-lightning توصیه می‌شود."
},
"yi-medium": {
"description": "ارتقاء مدل با اندازه متوسط، با توانایی‌های متعادل و مقرون‌به‌صرفه. بهینه‌سازی عمیق در توانایی پیروی از دستورات."
},
"yi-medium-200k": {
"description": "پنجره متنی بسیار طولانی ۲۰۰ هزار کلمه‌ای، با قابلیت درک و تولید متون طولانی و پیچیده."
},
"yi-spark": {
"description": "کوچک و قدرتمند، مدلی سبک و فوق‌العاده سریع. قابلیت‌های تقویت‌شده برای محاسبات ریاضی و نوشتن کد ارائه می‌دهد."
},
"yi-vision": {
"description": "مدل وظایف پیچیده بینایی، ارائه دهنده قابلیت‌های درک و تحلیل تصویر با عملکرد بالا."
},
"yi-vision-v2": {
"description": "مدل‌های پیچیده بصری که قابلیت‌های درک و تحلیل با عملکرد بالا را بر اساس چندین تصویر ارائه می‌دهند."
},
"z-ai/glm-4.5": {
"description": "GLM 4.5 مدل پرچم‌دار Z.AI است که از حالت‌های استدلال ترکیبی پشتیبانی می‌کند و برای وظایف مهندسی و زمینه‌های طولانی بهینه شده است."
},
"z-ai/glm-4.5-air": {
"description": "GLM 4.5 Air نسخه سبک‌تر GLM 4.5 است که برای سناریوهای حساس به هزینه طراحی شده و همچنان توانایی استدلال قوی را حفظ کرده است."
},
"z-ai/glm-4.6": {
"description": "GLM 4.6 مدل پرچم‌دار Z.AI است که طول زمینه و توانایی‌های کدنویسی را گسترش داده است."
},
"zai-glm-4.6": {
"description": "عملکرد عالی در وظایف برنامه‌نویسی و استدلال، پشتیبانی از حالت جریانی و فراخوانی ابزار، مناسب برای کدنویسی Agentic و سناریوهای استدلال پیچیده."
},
"zai-org/GLM-4.5": {
"description": "GLM-4.5 یک مدل پایه طراحی شده برای کاربردهای عامل هوشمند است که از معماری Mixture-of-Experts استفاده می‌کند. این مدل در زمینه‌های فراخوانی ابزار، مرور وب، مهندسی نرم‌افزار و برنامه‌نویسی فرانت‌اند بهینه‌سازی عمیق شده و از ادغام بی‌وقفه با عامل‌های کد مانند Claude Code و Roo Code پشتیبانی می‌کند. GLM-4.5 از حالت استدلال ترکیبی بهره می‌برد و می‌تواند در سناریوهای استدلال پیچیده و استفاده روزمره به خوبی عمل کند."
},
"zai-org/GLM-4.5-Air": {
"description": "GLM-4.5-Air یک مدل پایه طراحی شده برای کاربردهای عامل هوشمند است که از معماری Mixture-of-Experts استفاده می‌کند. این مدل در زمینه‌های فراخوانی ابزار، مرور وب، مهندسی نرم‌افزار و برنامه‌نویسی فرانت‌اند بهینه‌سازی عمیق شده و از ادغام بی‌وقفه با عامل‌های کد مانند Claude Code و Roo Code پشتیبانی می‌کند. GLM-4.5 از حالت استدلال ترکیبی بهره می‌برد و می‌تواند در سناریوهای استدلال پیچیده و استفاده روزمره به خوبی عمل کند."
},
"zai-org/GLM-4.5V": {
"description": "GLM-4.5V نسل جدیدی از مدل‌های زبان-بینایی (VLM) است که توسط Zhipu AI (智谱 AI) منتشر شده. این مدل بر پایهٔ مدل متنی پرچم‌دار GLM-4.5-Air ساخته شده که دارای 106 میلیارد پارامتر کل و 12 میلیارد پارامتر فعال‌سازی است؛ از معماری متخصصان ترکیبی (MoE) بهره می‌برد و هدفش ارائهٔ عملکرد برجسته با هزینهٔ استدلال کمتر است. از منظر فناوری، GLM-4.5V راهبرد GLM-4.1V-Thinking را ادامه می‌دهد و نوآوری‌هایی مانند کدگذاری موقعیت چرخشی سه‌بعدی (3D-RoPE) را معرفی کرده که به‌طور چشمگیری درک و استدلال نسبت‌های فضایی سه‌بعدی را تقویت می‌کند. با بهینه‌سازی در مراحل پیش‌آموزش، ریزتنظیم نظارتی و یادگیری تقویتی، این مدل قادر به پردازش انواع محتواهای بصری از جمله تصویر، ویدیو و اسناد بلند شده و در 41 معیار چندوجهی عمومی به سطح برتر مدل‌های متن‌باز هم‌رده دست یافته است. علاوه بر این، یک سوئیچ «حالت تفکر» به مدل افزوده شده که به کاربران اجازه می‌دهد بین پاسخ‌دهی سریع و استدلال عمیق به‌صورت انعطاف‌پذیر انتخاب کنند تا تعادل بین کارایی و کیفیت برقرار شود."
},
"zai-org/GLM-4.6": {
"description": "در مقایسه با GLM-4.5، GLM-4.6 چندین بهبود کلیدی را به همراه دارد. پنجره متنی آن از 128K به 200K توکن افزایش یافته است که امکان پردازش وظایف پیچیده‌تر عامل را فراهم می‌کند. مدل در آزمون‌های معیار کد امتیاز بالاتری کسب کرده و در برنامه‌هایی مانند Claude Code، Cline، Roo Code و Kilo Code عملکرد واقعی بهتری نشان داده است، از جمله بهبود در تولید صفحات فرانت‌اند با جلوه‌های بصری دقیق. GLM-4.6 در عملکرد استنتاج پیشرفت قابل توجهی داشته و از استفاده از ابزارها در حین استنتاج پشتیبانی می‌کند که منجر به توانمندی جامع‌تر شده است. این مدل در استفاده از ابزارها و عامل‌های مبتنی بر جستجو قوی‌تر است و می‌تواند به طور مؤثرتری در چارچوب‌های عامل ادغام شود. در زمینه نگارش، این مدل سبک و خوانایی بهتری دارد که با ترجیحات انسانی همخوانی دارد و در سناریوهای نقش‌آفرینی طبیعی‌تر عمل می‌کند."
},
"zai/glm-4.5": {
"description": "مجموعه مدل‌های GLM-4.5 مدل‌های پایه طراحی شده برای نمایندگان هوشمند هستند. مدل پرچمدار GLM-4.5 با 355 میلیارد پارامتر کل (32 میلیارد فعال) یکپارچه‌سازی استدلال، کدنویسی و توانایی‌های نمایندگی را برای حل نیازهای پیچیده برنامه‌ها ارائه می‌دهد. به عنوان یک سیستم استدلال ترکیبی، دو حالت عملیاتی دارد."
},
"zai/glm-4.5-air": {
"description": "GLM-4.5 و GLM-4.5-Air مدل‌های پرچمدار جدید ما هستند که به عنوان مدل‌های پایه برای برنامه‌های نمایندگی طراحی شده‌اند. هر دو از معماری متخصص ترکیبی (MoE) بهره می‌برند. GLM-4.5 دارای 355 میلیارد پارامتر کل و 32 میلیارد پارامتر فعال در هر عبور جلو است، در حالی که GLM-4.5-Air طراحی ساده‌تری دارد با 106 میلیارد پارامتر کل و 12 میلیارد پارامتر فعال."
},
"zai/glm-4.5v": {
"description": "GLM-4.5V بر پایه مدل پایه GLM-4.5-Air ساخته شده است، فناوری اثبات شده GLM-4.1V-Thinking را به ارث برده و در عین حال با معماری قدرتمند MoE با 106 میلیارد پارامتر به طور مؤثر مقیاس‌پذیر شده است."
},
"zenmux/auto": {
"description": "ویژگی مسیریابی خودکار ZenMux بر اساس محتوای درخواست شما، بهترین مدل موجود از نظر عملکرد و هزینه را از میان مدل‌های پشتیبانی‌شده انتخاب می‌کند."
}
}