mirror of
https://github.com/lobehub/lobe-chat.git
synced 2026-06-14 03:30:19 +00:00
3633 lines
462 KiB
JSON
3633 lines
462 KiB
JSON
{
|
||
"01-ai/yi-1.5-34b-chat": {
|
||
"description": "Zero One Everything، جدیدترین مدل متن باز تنظیم شده با 34 میلیارد پارامتر، که تنظیمات آن از چندین سناریوی گفتگویی پشتیبانی میکند و دادههای آموزشی با کیفیت بالا را برای همراستایی با ترجیحات انسانی فراهم میکند."
|
||
},
|
||
"01-ai/yi-1.5-9b-chat": {
|
||
"description": "Zero One Everything، جدیدترین مدل متن باز تنظیم شده با 9 میلیارد پارامتر، که تنظیمات آن از چندین سناریوی گفتگویی پشتیبانی میکند و دادههای آموزشی با کیفیت بالا را برای همراستایی با ترجیحات انسانی فراهم میکند."
|
||
},
|
||
"360/deepseek-r1": {
|
||
"description": "مدل DeepSeek-R1 نسخه 360، که در مرحله پس از آموزش بهطور گستردهای از تکنیکهای یادگیری تقویتی استفاده کرده و توانایی استدلال مدل را بهطور قابل توجهی افزایش داده است. در وظایف ریاضی، کدنویسی و استدلال زبان طبیعی، عملکردی مشابه نسخه رسمی OpenAI o1 دارد."
|
||
},
|
||
"360gpt-pro": {
|
||
"description": "360GPT Pro به عنوان یکی از اعضای مهم سری مدلهای 360 AI، با توانایی پردازش متون بهصورت کارآمد، نیازهای متنوع در زمینههای مختلف کاربردهای زبان طبیعی را برآورده میکند و از قابلیتهایی مانند درک متون طولانی و مکالمات چندمرحلهای پشتیبانی میکند."
|
||
},
|
||
"360gpt-pro-trans": {
|
||
"description": "مدل مخصوص ترجمه، بهطور عمیق بهینهسازی شده و دارای عملکرد پیشرفته در ترجمه است."
|
||
},
|
||
"360gpt-turbo": {
|
||
"description": "360GPT Turbo تواناییهای محاسباتی و مکالمهای قدرتمندی ارائه میدهد و دارای کارایی بالایی در درک و تولید معنا است. این یک راهحل ایدهآل برای دستیار هوشمند برای شرکتها و توسعهدهندگان است."
|
||
},
|
||
"360gpt-turbo-responsibility-8k": {
|
||
"description": "360GPT Turbo Responsibility 8K بر امنیت معنایی و مسئولیتپذیری تأکید دارد و بهطور ویژه برای سناریوهایی طراحی شده است که نیاز بالایی به امنیت محتوا دارند، تا دقت و پایداری تجربه کاربری را تضمین کند."
|
||
},
|
||
"360gpt2-o1": {
|
||
"description": "360gpt2-o1 از جستجوی درخت برای ساخت زنجیرههای تفکر استفاده میکند و مکانیزم بازتاب را معرفی کرده است و با استفاده از یادگیری تقویتی آموزش دیده است، این مدل توانایی خودبازتابی و اصلاح خطا را دارد."
|
||
},
|
||
"360gpt2-pro": {
|
||
"description": "360GPT2 Pro مدل پیشرفته پردازش زبان طبیعی است که توسط شرکت 360 ارائه شده است. این مدل دارای تواناییهای برجستهای در تولید و درک متن است و به ویژه در زمینه تولید و خلاقیت عملکرد فوقالعادهای دارد. همچنین قادر به انجام وظایف پیچیده تبدیل زبان و ایفای نقش میباشد."
|
||
},
|
||
"360zhinao2-o1": {
|
||
"description": "مدل 360zhinao2-o1 با استفاده از جستجوی درختی زنجیره تفکر را ایجاد کرده و مکانیزم بازتاب را معرفی کرده است و با استفاده از یادگیری تقویتی آموزش دیده است، این مدل توانایی خودبازتابی و اصلاح خطا را دارد."
|
||
},
|
||
"4.0Ultra": {
|
||
"description": "Spark Ultra قدرتمندترین نسخه از سری مدلهای بزرگ Spark است که با ارتقاء مسیر جستجوی متصل به شبکه، توانایی درک و خلاصهسازی محتوای متنی را بهبود میبخشد. این یک راهحل جامع برای افزایش بهرهوری در محیط کار و پاسخگویی دقیق به نیازها است و به عنوان یک محصول هوشمند پیشرو در صنعت شناخته میشود."
|
||
},
|
||
"AnimeSharp": {
|
||
"description": "AnimeSharp (که با نام \"4x‑AnimeSharp\" نیز شناخته میشود) یک مدل ابررزولوشن متنباز است که توسط Kim2091 بر اساس معماری ESRGAN توسعه یافته است و بر بزرگنمایی و تیزکردن تصاویر با سبک انیمه تمرکز دارد. این مدل در فوریه ۲۰۲۲ از \"4x-TextSharpV1\" تغییر نام داد و در ابتدا برای تصاویر متنی نیز کاربرد داشت اما عملکرد آن به طور قابل توجهی برای محتوای انیمه بهینه شده است."
|
||
},
|
||
"Baichuan2-Turbo": {
|
||
"description": "با استفاده از فناوری تقویت جستجو، مدل بزرگ را به دانش حوزهای و دانش کل وب متصل میکند. از آپلود انواع اسناد مانند PDF، Word و همچنین وارد کردن آدرسهای وب پشتیبانی میکند. اطلاعات بهموقع و جامع دریافت میشود و نتایج خروجی دقیق و حرفهای هستند."
|
||
},
|
||
"Baichuan3-Turbo": {
|
||
"description": "بهینهسازی شده برای سناریوهای پرتکرار سازمانی، با بهبود قابل توجه و نسبت عملکرد به هزینه بالا. در مقایسه با مدل Baichuan2، تولید محتوا ۲۰٪ بهبود یافته، پاسخ به سوالات ۱۷٪ بهتر شده و توانایی نقشآفرینی ۴۰٪ افزایش یافته است. عملکرد کلی بهتر از GPT3.5 است."
|
||
},
|
||
"Baichuan3-Turbo-128k": {
|
||
"description": "دارای پنجره متنی فوقالعاده طولانی ۱۲۸K، بهینهسازی شده برای سناریوهای پرتکرار سازمانی، با بهبود قابل توجه در عملکرد و مقرون به صرفه بودن. در مقایسه با مدل Baichuan2، ۲۰٪ بهبود در تولید محتوا، ۱۷٪ بهبود در پرسش و پاسخ دانش، و ۴۰٪ بهبود در توانایی نقشآفرینی. عملکرد کلی بهتر از GPT3.5 است."
|
||
},
|
||
"Baichuan4": {
|
||
"description": "این مدل از نظر توانایی در داخل کشور رتبه اول را دارد و در وظایف چینی مانند دانشنامه، متون طولانی و تولید محتوا از مدلهای اصلی خارجی پیشی میگیرد. همچنین دارای توانایی چندوجهی پیشرو در صنعت است و در چندین معیار ارزیابی معتبر عملکرد برجستهای دارد."
|
||
},
|
||
"Baichuan4-Air": {
|
||
"description": "توانایی مدل در کشور اول است و در وظایف چینی مانند دانشنامه، متنهای طولانی و تولید خلاقانه از مدلهای اصلی خارجی پیشی میگیرد. همچنین دارای قابلیتهای چندرسانهای پیشرفته در صنعت است و در چندین معیار ارزیابی معتبر عملکرد عالی دارد."
|
||
},
|
||
"Baichuan4-Turbo": {
|
||
"description": "توانایی مدل در کشور اول است و در وظایف چینی مانند دانشنامه، متنهای طولانی و تولید خلاقانه از مدلهای اصلی خارجی پیشی میگیرد. همچنین دارای قابلیتهای چندرسانهای پیشرفته در صنعت است و در چندین معیار ارزیابی معتبر عملکرد عالی دارد."
|
||
},
|
||
"ByteDance-Seed/Seed-OSS-36B-Instruct": {
|
||
"description": "Seed-OSS مجموعهای از مدلهای زبان بزرگ متنباز است که توسط تیم Seed شرکت بایتدنس توسعه یافتهاند و بهطور خاص برای پردازش متنهای طولانی، استدلال، عاملها (agent) و قابلیتهای عمومی طراحی شدهاند. مدل Seed-OSS-36B-Instruct در این مجموعه، یک مدل تنظیمشده با ۳۶ میلیارد پارامتر است که بهطور بومی از طول متن بسیار طولانی پشتیبانی میکند و قادر است حجم عظیمی از اسناد یا کدهای پیچیده را بهصورت یکجا پردازش کند. این مدل بهطور ویژه برای استدلال، تولید کد و وظایف عامل (مانند استفاده از ابزارها) بهینه شده و در عین حال تعادل و توانایی عمومی برجستهای را حفظ میکند. یکی از ویژگیهای برجسته این مدل، قابلیت «بودجه تفکر» است که به کاربران اجازه میدهد طول استدلال را بهصورت انعطافپذیر تنظیم کنند و بدین ترتیب کارایی استدلال در کاربردهای عملی بهطور مؤثری افزایش یابد."
|
||
},
|
||
"DeepSeek-R1": {
|
||
"description": "مدل LLM پیشرفته و کارآمد که در استدلال، ریاضیات و برنامهنویسی تخصص دارد."
|
||
},
|
||
"DeepSeek-R1-Distill-Llama-70B": {
|
||
"description": "DeepSeek R1 - مدل بزرگتر و هوشمندتر در مجموعه DeepSeek - به ساختار لاما 70B تقطیر شده است. بر اساس آزمونهای معیار و ارزیابیهای انسانی، این مدل نسبت به لاما 70B اصلی هوشمندتر است و به ویژه در وظایفی که نیاز به دقت ریاضی و واقعیات دارند، عملکرد عالی دارد."
|
||
},
|
||
"DeepSeek-R1-Distill-Qwen-1.5B": {
|
||
"description": "مدل تقطیر DeepSeek-R1 مبتنی بر Qwen2.5-Math-1.5B است که با استفاده از یادگیری تقویتی و دادههای شروع سرد عملکرد استدلال را بهینهسازی کرده و مدلهای متنباز را به روز کرده است."
|
||
},
|
||
"DeepSeek-R1-Distill-Qwen-14B": {
|
||
"description": "مدل تقطیر DeepSeek-R1 مبتنی بر Qwen2.5-14B است که با استفاده از یادگیری تقویتی و دادههای شروع سرد عملکرد استدلال را بهینهسازی کرده و مدلهای متنباز را به روز کرده است."
|
||
},
|
||
"DeepSeek-R1-Distill-Qwen-32B": {
|
||
"description": "سری DeepSeek-R1 با استفاده از یادگیری تقویتی و دادههای شروع سرد عملکرد استدلال را بهینهسازی کرده و مدلهای متنباز را به روز کرده و از سطح OpenAI-o1-mini فراتر رفته است."
|
||
},
|
||
"DeepSeek-R1-Distill-Qwen-7B": {
|
||
"description": "مدل تقطیر DeepSeek-R1 مبتنی بر Qwen2.5-Math-7B است که با استفاده از یادگیری تقویتی و دادههای شروع سرد عملکرد استدلال را بهینهسازی کرده و مدلهای متنباز را به روز کرده است."
|
||
},
|
||
"DeepSeek-V3": {
|
||
"description": "DeepSeek-V3 یک مدل MoE است که توسط شرکت DeepSeek توسعه یافته است. نتایج ارزیابیهای متعدد DeepSeek-V3 از مدلهای متن باز دیگر مانند Qwen2.5-72B و Llama-3.1-405B فراتر رفته و از نظر عملکرد با مدلهای بسته جهانی برتر مانند GPT-4o و Claude-3.5-Sonnet برابری میکند."
|
||
},
|
||
"DeepSeek-V3-1": {
|
||
"description": "DeepSeek V3.1: مدل استنتاج نسل بعدی که تواناییهای استدلال پیچیده و تفکر زنجیرهای را بهبود میبخشد و برای وظایف نیازمند تحلیل عمیق مناسب است."
|
||
},
|
||
"DeepSeek-V3-Fast": {
|
||
"description": "تأمینکننده مدل: پلتفرم sophnet. DeepSeek V3 Fast نسخهای با TPS بالا و سرعت بسیار زیاد از نسخه DeepSeek V3 0324 است، بدون کمیتسازی، با تواناییهای کد و ریاضی قویتر و پاسخدهی سریعتر!"
|
||
},
|
||
"DeepSeek-V3.1-Fast": {
|
||
"description": "DeepSeek V3.1 Fast نسخه پرسرعت و با TPS بالا از نسخه DeepSeek V3.1 است. حالت استدلال ترکیبی: با تغییر قالب گفتگو، یک مدل میتواند همزمان از حالت تفکری و غیرتفکری پشتیبانی کند. فراخوانی هوشمندتر ابزارها: با بهینهسازی پس از آموزش، عملکرد مدل در استفاده از ابزارها و وظایف عامل بهطور چشمگیری بهبود یافته است."
|
||
},
|
||
"DeepSeek-V3.1-Think": {
|
||
"description": "DeepSeek-V3.1 حالت تفکری؛ DeepSeek-V3.1 مدل استدلال ترکیبی جدیدی از DeepSeek است که از دو حالت استدلال تفکری و غیرتفکری پشتیبانی میکند و نسبت به DeepSeek-R1-0528 در حالت تفکری کارایی بالاتری دارد. پس از آموزش تکمیلی، استفاده از ابزارهای عامل و عملکرد در وظایف عامل بهطور قابل توجهی بهبود یافته است."
|
||
},
|
||
"Doubao-lite-128k": {
|
||
"description": "Doubao-lite دارای سرعت پاسخگویی بینظیر و نسبت قیمت به کارایی بهتر است و گزینههای انعطافپذیرتری را برای سناریوهای مختلف مشتریان ارائه میدهد. از پنجره متنی 128k برای استدلال و تنظیم دقیق پشتیبانی میکند."
|
||
},
|
||
"Doubao-lite-32k": {
|
||
"description": "Doubao-lite دارای سرعت پاسخگویی بینظیر و نسبت قیمت به کارایی بهتر است و گزینههای انعطافپذیرتری را برای سناریوهای مختلف مشتریان ارائه میدهد. از پنجره متنی 32k برای استدلال و تنظیم دقیق پشتیبانی میکند."
|
||
},
|
||
"Doubao-lite-4k": {
|
||
"description": "Doubao-lite دارای سرعت پاسخگویی بینظیر و نسبت قیمت به کارایی بهتر است و گزینههای انعطافپذیرتری را برای سناریوهای مختلف مشتریان ارائه میدهد. از پنجره متنی 4k برای استدلال و تنظیم دقیق پشتیبانی میکند."
|
||
},
|
||
"Doubao-pro-128k": {
|
||
"description": "مدل اصلی با بهترین عملکرد، مناسب برای انجام وظایف پیچیده است و در زمینههایی مانند پاسخ به سوالات مرجع، خلاصهسازی، خلق محتوا، دستهبندی متن و نقشآفرینی عملکرد بسیار خوبی دارد. از پنجره متنی 128k برای استدلال و تنظیم دقیق پشتیبانی میکند."
|
||
},
|
||
"Doubao-pro-32k": {
|
||
"description": "مدل اصلی با بهترین عملکرد، مناسب برای انجام وظایف پیچیده است و در زمینههایی مانند پاسخ به سوالات مرجع، خلاصهسازی، خلق محتوا، دستهبندی متن و نقشآفرینی عملکرد بسیار خوبی دارد. از پنجره متنی 32k برای استدلال و تنظیم دقیق پشتیبانی میکند."
|
||
},
|
||
"Doubao-pro-4k": {
|
||
"description": "مدل اصلی با بهترین عملکرد، مناسب برای انجام وظایف پیچیده است و در زمینههایی مانند پاسخ به سوالات مرجع، خلاصهسازی، خلق محتوا، دستهبندی متن و نقشآفرینی عملکرد بسیار خوبی دارد. از پنجره متنی 4k برای استدلال و تنظیم دقیق پشتیبانی میکند."
|
||
},
|
||
"DreamO": {
|
||
"description": "DreamO یک مدل تولید تصویر سفارشی متنباز است که توسط شرکت بایتدنس و دانشگاه پکن به صورت مشترک توسعه یافته است و هدف آن پشتیبانی از تولید چندوظیفهای تصویر از طریق معماری یکپارچه است. این مدل از روش مدلسازی ترکیبی کارآمد استفاده میکند و میتواند تصاویر بسیار سازگار و سفارشیشدهای را بر اساس شرایطی مانند هویت، موضوع، سبک و پسزمینه که توسط کاربر تعیین میشود، تولید کند."
|
||
},
|
||
"ERNIE-3.5-128K": {
|
||
"description": "مدل زبان بزرگ پرچمدار توسعهیافته توسط بایدو، که حجم عظیمی از متون چینی و انگلیسی را پوشش میدهد و دارای تواناییهای عمومی قدرتمندی است. این مدل میتواند نیازهای اکثر سناریوهای پرسش و پاسخ، تولید محتوا و استفاده از افزونهها را برآورده کند؛ همچنین از اتصال خودکار به افزونه جستجوی بایدو پشتیبانی میکند تا بهروز بودن اطلاعات پرسش و پاسخ را تضمین کند."
|
||
},
|
||
"ERNIE-3.5-8K": {
|
||
"description": "مدل زبان بزرگ پرچمدار توسعهیافته توسط بایدو، که حجم عظیمی از متون چینی و انگلیسی را پوشش میدهد و دارای تواناییهای عمومی قدرتمندی است. این مدل میتواند نیازهای اکثر سناریوهای پرسش و پاسخ، تولید محتوا و استفاده از افزونهها را برآورده کند؛ همچنین از اتصال خودکار به افزونه جستجوی بایدو پشتیبانی میکند تا بهروز بودن اطلاعات پرسش و پاسخ را تضمین نماید."
|
||
},
|
||
"ERNIE-3.5-8K-Preview": {
|
||
"description": "مدل زبان بزرگ پرچمدار توسعهیافته توسط بایدو، که حجم عظیمی از متون چینی و انگلیسی را پوشش میدهد و دارای تواناییهای عمومی قدرتمندی است. این مدل میتواند نیازهای اکثر سناریوهای پرسش و پاسخ، تولید محتوا و استفاده از افزونهها را برآورده کند؛ همچنین از اتصال خودکار به افزونه جستجوی بایدو پشتیبانی میکند تا بهروز بودن اطلاعات پرسش و پاسخ را تضمین کند."
|
||
},
|
||
"ERNIE-4.0-8K-Latest": {
|
||
"description": "مدل زبان بزرگ مقیاس پرچمدار توسعهیافته توسط بایدو، که نسبت به ERNIE 3.5 ارتقاء کامل در تواناییهای مدل را به ارمغان آورده است و برای وظایف پیچیده در حوزههای مختلف مناسب است؛ از اتصال خودکار به افزونه جستجوی بایدو پشتیبانی میکند و بهروزرسانی اطلاعات پرسش و پاسخ را تضمین مینماید."
|
||
},
|
||
"ERNIE-4.0-8K-Preview": {
|
||
"description": "مدل زبان بزرگ مقیاس پرچمدار توسعهیافته توسط بایدو، در مقایسه با ERNIE 3.5 ارتقاء کامل تواناییهای مدل را به ارمغان آورده و برای وظایف پیچیده در حوزههای مختلف مناسب است؛ از افزونه جستجوی بایدو پشتیبانی میکند تا اطلاعات پرسش و پاسخ بهروز بماند."
|
||
},
|
||
"ERNIE-4.0-Turbo-8K-Latest": {
|
||
"description": "مدل زبان بزرگ و پیشرفتهای که توسط بایدو توسعه یافته است، با عملکرد برجسته در زمینههای مختلف و مناسب برای وظایف پیچیده؛ از افزونه جستجوی بایدو بهطور خودکار پشتیبانی میکند تا اطلاعات بهروز را در پاسخها تضمین کند. در مقایسه با ERNIE 4.0، عملکرد بهتری دارد."
|
||
},
|
||
"ERNIE-4.0-Turbo-8K-Preview": {
|
||
"description": "مدل زبان بزرگ و پرچمدار با مقیاس فوقالعاده که توسط بایدو توسعه یافته است، با عملکرد برجسته در زمینههای مختلف و مناسب برای وظایف پیچیده؛ پشتیبانی از اتصال خودکار به افزونه جستجوی بایدو برای اطمینان از بهروز بودن اطلاعات پرسش و پاسخ. در مقایسه با ERNIE 4.0، عملکرد بهتری دارد."
|
||
},
|
||
"ERNIE-Character-8K": {
|
||
"description": "مدل زبان بزرگ عمودی توسعهیافته توسط بایدو، مناسب برای صحنههای کاربردی مانند NPCهای بازی، مکالمات پشتیبانی مشتری، و نقشآفرینی در مکالمات. سبک شخصیتها برجستهتر و یکپارچهتر است، توانایی پیروی از دستورات قویتر و عملکرد استدلالی بهینهتر است."
|
||
},
|
||
"ERNIE-Lite-Pro-128K": {
|
||
"description": "مدل زبان بزرگ سبکوزن توسعهیافته توسط بایدو، که تعادل بین عملکرد مدل عالی و کارایی استنتاج را حفظ میکند. عملکرد آن بهتر از ERNIE Lite است و برای استفاده در کارتهای شتابدهنده AI با قدرت محاسباتی پایین مناسب است."
|
||
},
|
||
"ERNIE-Speed-128K": {
|
||
"description": "مدل زبان بزرگ با عملکرد بالا که در سال 2024 توسط بایدو توسعه یافته است. این مدل دارای تواناییهای عمومی برجستهای است و به عنوان یک مدل پایه برای تنظیم دقیق در سناریوهای خاص مناسب است و همچنین از عملکرد استنتاجی بسیار خوبی برخوردار است."
|
||
},
|
||
"ERNIE-Speed-Pro-128K": {
|
||
"description": "مدل زبان بزرگ با عملکرد بالا که در سال 2024 توسط بایدو بهطور مستقل توسعه یافته است. این مدل دارای تواناییهای عمومی برجستهای است و عملکرد بهتری نسبت به ERNIE Speed دارد. مناسب برای استفاده به عنوان مدل پایه برای تنظیم دقیق و حل بهتر مسائل در سناریوهای خاص، همچنین دارای عملکرد استنتاجی بسیار عالی است."
|
||
},
|
||
"FLUX-1.1-pro": {
|
||
"description": "FLUX.1.1 Pro"
|
||
},
|
||
"FLUX.1-Kontext-dev": {
|
||
"description": "FLUX.1-Kontext-dev یک مدل تولید و ویرایش تصویر چندرسانهای است که توسط Black Forest Labs توسعه یافته و بر اساس معماری Rectified Flow Transformer ساخته شده است. این مدل با 12 میلیارد پارامتر، بر تولید، بازسازی، تقویت یا ویرایش تصاویر تحت شرایط متنی تمرکز دارد. این مدل ترکیبی از مزایای تولید کنترلشده مدلهای انتشار و قابلیت مدلسازی زمینهای ترنسفورمر است و از خروجی تصاویر با کیفیت بالا پشتیبانی میکند و در وظایفی مانند ترمیم تصویر، تکمیل تصویر و بازسازی صحنههای بصری کاربرد گسترده دارد."
|
||
},
|
||
"FLUX.1-Kontext-pro": {
|
||
"description": "FLUX.1 Kontext [pro]"
|
||
},
|
||
"FLUX.1-dev": {
|
||
"description": "FLUX.1-dev یک مدل زبان چندرسانهای متنباز است که توسط Black Forest Labs توسعه یافته و برای وظایف ترکیبی تصویر و متن بهینه شده است. این مدل بر پایه مدلهای زبان بزرگ پیشرفته مانند Mistral-7B ساخته شده و با استفاده از رمزگذار بصری طراحیشده و تنظیم دقیق چندمرحلهای دستوری، توانایی پردازش همزمان تصویر و متن و استدلال در وظایف پیچیده را دارد."
|
||
},
|
||
"Gryphe/MythoMax-L2-13b": {
|
||
"description": "MythoMax-L2 (13B) یک مدل نوآورانه است که برای کاربردهای چندرشتهای و وظایف پیچیده مناسب است."
|
||
},
|
||
"HelloMeme": {
|
||
"description": "HelloMeme یک ابزار هوش مصنوعی است که میتواند بر اساس تصاویر یا حرکاتی که شما ارائه میدهید، به طور خودکار میم، گیف یا ویدیوهای کوتاه تولید کند. این ابزار نیازی به دانش نقاشی یا برنامهنویسی ندارد و تنها با داشتن تصاویر مرجع، میتواند محتوایی زیبا، سرگرمکننده و با سبک یکپارچه برای شما بسازد."
|
||
},
|
||
"HiDream-I1-Full": {
|
||
"description": "HiDream-E1-Full یک مدل بزرگ ویرایش تصویر چندرسانهای متنباز است که توسط HiDream.ai توسعه یافته است. این مدل بر پایه معماری پیشرفته Diffusion Transformer ساخته شده و با توانایی قوی درک زبان (با LLaMA 3.1-8B-Instruct داخلی) از طریق دستورات زبان طبیعی، تولید تصویر، انتقال سبک، ویرایش موضعی و بازنقاشی محتوا را پشتیبانی میکند و دارای قابلیتهای برجسته در درک و اجرای ترکیب تصویر و متن است."
|
||
},
|
||
"HunyuanDiT-v1.2-Diffusers-Distilled": {
|
||
"description": "hunyuandit-v1.2-distilled یک مدل سبک تولید تصویر از متن است که با استفاده از تکنیک تقطیر بهینه شده و قادر است به سرعت تصاویر با کیفیت بالا تولید کند، به ویژه مناسب محیطهای با منابع محدود و وظایف تولید در زمان واقعی است."
|
||
},
|
||
"InstantCharacter": {
|
||
"description": "InstantCharacter یک مدل تولید شخصیت شخصیسازی شده بدون نیاز به تنظیم دقیق است که توسط تیم هوش مصنوعی Tencent در سال ۲۰۲۵ منتشر شده است. هدف این مدل تولید شخصیتهای با وفاداری بالا و سازگار در صحنههای مختلف است. این مدل تنها با یک تصویر مرجع قادر به مدلسازی شخصیت است و میتواند آن را به سبکها، حرکات و پسزمینههای مختلف به طور انعطافپذیر منتقل کند."
|
||
},
|
||
"InternVL2-8B": {
|
||
"description": "InternVL2-8B یک مدل زبان بصری قدرتمند است که از پردازش چند حالتی تصویر و متن پشتیبانی میکند و قادر است محتوای تصویر را به دقت شناسایی کرده و توصیف یا پاسخهای مرتبط تولید کند."
|
||
},
|
||
"InternVL2.5-26B": {
|
||
"description": "InternVL2.5-26B یک مدل زبان بصری قدرتمند است که از پردازش چند حالتی تصویر و متن پشتیبانی میکند و قادر است محتوای تصویر را به دقت شناسایی کرده و توصیف یا پاسخهای مرتبط تولید کند."
|
||
},
|
||
"Kolors": {
|
||
"description": "Kolors یک مدل تولید تصویر از متن است که توسط تیم Kolors شرکت Kuaishou توسعه یافته است. این مدل با میلیاردها پارامتر آموزش دیده و در کیفیت بصری، درک معنایی زبان چینی و رندر متن عملکرد برجستهای دارد."
|
||
},
|
||
"Kwai-Kolors/Kolors": {
|
||
"description": "Kolors یک مدل بزرگ تولید تصویر از متن مبتنی بر انتشار نهفته است که توسط تیم Kolors شرکت Kuaishou توسعه یافته است. این مدل با آموزش روی میلیاردها جفت متن-تصویر، در کیفیت بصری، دقت معنایی پیچیده و رندر کاراکترهای چینی و انگلیسی عملکرد برجستهای دارد. این مدل نه تنها از ورودیهای چینی و انگلیسی پشتیبانی میکند بلکه در درک و تولید محتوای خاص زبان چینی نیز بسیار توانمند است."
|
||
},
|
||
"Kwaipilot/KAT-Dev": {
|
||
"description": "KAT-Dev (32B) یک مدل متنباز با ۳۲ میلیارد پارامتر است که بهطور ویژه برای وظایف مهندسی نرمافزار طراحی شده است. این مدل در آزمون معیار SWE-Bench Verified به نرخ حل ۶۲.۴٪ دست یافته و در میان تمام مدلهای متنباز با اندازههای مختلف، رتبه پنجم را کسب کرده است. این مدل از طریق مراحل مختلفی مانند آموزش میانی، تنظیم دقیق تحت نظارت (SFT) و یادگیری تقویتی (RL) بهینهسازی شده و هدف آن ارائه پشتیبانی قدرتمند برای وظایف پیچیده برنامهنویسی مانند تکمیل کد، رفع اشکال، و بازبینی کد است."
|
||
},
|
||
"Llama-3.2-11B-Vision-Instruct": {
|
||
"description": "توانایی استدلال تصویری عالی در تصاویر با وضوح بالا، مناسب برای برنامههای درک بصری."
|
||
},
|
||
"Llama-3.2-90B-Vision-Instruct\t": {
|
||
"description": "توانایی استدلال تصویری پیشرفته برای برنامههای نمایندگی درک بصری."
|
||
},
|
||
"Meta-Llama-3-3-70B-Instruct": {
|
||
"description": "Llama 3.3 70B: مدل ترنسفورمر چندمنظوره که برای مکالمه و وظایف تولید محتوا مناسب است."
|
||
},
|
||
"Meta-Llama-3.1-405B-Instruct": {
|
||
"description": "مدل متنی تنظیم شده لاما 3.1 که برای موارد مکالمه چند زبانه بهینهسازی شده و در بسیاری از مدلهای چت متن باز و بسته موجود، در معیارهای صنعتی رایج عملکرد عالی دارد."
|
||
},
|
||
"Meta-Llama-3.1-70B-Instruct": {
|
||
"description": "مدل متنی تنظیم شده لاما 3.1 که برای موارد مکالمه چند زبانه بهینهسازی شده و در بسیاری از مدلهای چت متن باز و بسته موجود، در معیارهای صنعتی رایج عملکرد عالی دارد."
|
||
},
|
||
"Meta-Llama-3.1-8B-Instruct": {
|
||
"description": "مدل متنی تنظیم شده لاما 3.1 که برای موارد مکالمه چند زبانه بهینهسازی شده و در بسیاری از مدلهای چت متن باز و بسته موجود، در معیارهای صنعتی رایج عملکرد عالی دارد."
|
||
},
|
||
"Meta-Llama-3.2-1B-Instruct": {
|
||
"description": "مدل زبان کوچک پیشرفته و پیشرفته، با قابلیت درک زبان، توانایی استدلال عالی و توانایی تولید متن."
|
||
},
|
||
"Meta-Llama-3.2-3B-Instruct": {
|
||
"description": "مدل زبان کوچک پیشرفته و پیشرفته، با قابلیت درک زبان، توانایی استدلال عالی و توانایی تولید متن."
|
||
},
|
||
"Meta-Llama-3.3-70B-Instruct": {
|
||
"description": "لاما 3.3 پیشرفتهترین مدل زبان چند زبانه و متن باز در سری لاما است که با هزینهای بسیار کم، عملکردی مشابه مدل 405B را ارائه میدهد. این مدل بر اساس ساختار ترنسفورمر طراحی شده و از طریق تنظیم دقیق نظارتی (SFT) و یادگیری تقویتی با بازخورد انسانی (RLHF) بهبود یافته است تا کارایی و ایمنی آن افزایش یابد. نسخه تنظیم شده آن به طور خاص برای مکالمات چند زبانه بهینهسازی شده و در چندین معیار صنعتی، عملکردی بهتر از بسیاری از مدلهای چت متن باز و بسته دارد. تاریخ قطع دانش آن تا دسامبر 2023 است."
|
||
},
|
||
"Meta-Llama-4-Maverick-17B-128E-Instruct-FP8": {
|
||
"description": "Llama 4 Maverick: مدل بزرگ مبتنی بر معماری Mixture-of-Experts که استراتژی فعالسازی کارآمد کارشناسان را برای عملکرد برتر در استنتاج ارائه میدهد."
|
||
},
|
||
"MiniMax-M1": {
|
||
"description": "مدل استنتاجی جدید با تحقیق و توسعه داخلی. پیشرو در جهان: زنجیره تفکر ۸۰ هزار مرحلهای × ورودی ۱ میلیون، عملکردی همتراز با برترین مدلهای بینالمللی"
|
||
},
|
||
"MiniMax-M2": {
|
||
"description": "طراحیشده برای کدنویسی کارآمد و جریان کاری عاملها (Agents)"
|
||
},
|
||
"MiniMax-M2-Stable": {
|
||
"description": "طراحیشده برای کدنویسی کارآمد و جریانهای کاری Agent، با توانایی همزمانی بالا و مناسب برای استفاده تجاری."
|
||
},
|
||
"MiniMax-Text-01": {
|
||
"description": "در سری مدلهای MiniMax-01، ما نوآوریهای جسورانهای انجام دادهایم: برای اولین بار مکانیزم توجه خطی را به طور وسیع پیادهسازی کردهایم و معماری سنتی Transformer دیگر تنها گزینه نیست. این مدل دارای 456 میلیارد پارامتر است که در یک بار فعالسازی 45.9 میلیارد است. عملکرد کلی این مدل با بهترین مدلهای خارجی برابری میکند و در عین حال میتواند به طور مؤثر به متنهای طولانی جهانی با 4 میلیون توکن رسیدگی کند، که 32 برابر GPT-4o و 20 برابر Claude-3.5-Sonnet است."
|
||
},
|
||
"MiniMaxAI/MiniMax-M1-80k": {
|
||
"description": "MiniMax-M1 یک مدل استنتاج بزرگ با وزنهای متنباز و توجه ترکیبی است که دارای ۴۵۶ میلیارد پارامتر است و هر توکن میتواند حدود ۴۵.۹ میلیارد پارامتر را فعال کند. این مدل به طور بومی از زمینه بسیار طولانی ۱ میلیون توکن پشتیبانی میکند و با مکانیزم توجه سریع، در وظایف تولید ۱۰۰ هزار توکن نسبت به DeepSeek R1، ۷۵٪ از محاسبات نقطه شناور را صرفهجویی میکند. همچنین، MiniMax-M1 از معماری MoE (متخصصان ترکیبی) بهره میبرد و با ترکیب الگوریتم CISPO و طراحی توجه ترکیبی در آموزش تقویتی کارآمد، عملکرد پیشرو در صنعت را در استنتاج ورودیهای طولانی و سناریوهای واقعی مهندسی نرمافزار ارائه میدهد."
|
||
},
|
||
"MiniMaxAI/MiniMax-M2": {
|
||
"description": "MiniMax-M2 بهرهوری را برای عاملهای هوشمند بازتعریف میکند. این یک مدل MoE فشرده، سریع و مقرونبهصرفه است که دارای ۲۳۰ میلیارد پارامتر کلی و ۱۰ میلیارد پارامتر فعال میباشد. این مدل برای ارائه عملکردی در سطح بالا در وظایف کدنویسی و عاملهای هوشمند طراحی شده است، در حالی که هوش عمومی قدرتمندی را نیز حفظ میکند. تنها با ۱۰ میلیارد پارامتر فعال، MiniMax-M2 عملکردی همتراز با مدلهای بسیار بزرگ ارائه میدهد و آن را به گزینهای ایدهآل برای کاربردهای با بهرهوری بالا تبدیل میکند."
|
||
},
|
||
"Moonshot-Kimi-K2-Instruct": {
|
||
"description": "مدل با 1 تریلیون پارامتر کل و 32 میلیارد پارامتر فعال. در میان مدلهای غیرتفکری، در دانش پیشرفته، ریاضیات و برنامهنویسی در سطح برتر قرار دارد و در وظایف عامل عمومی تخصص دارد. به طور ویژه برای وظایف نمایندگی بهینه شده است، نه تنها قادر به پاسخگویی به سوالات بلکه قادر به انجام اقدامات است. بهترین گزینه برای گفتگوهای بداهه، چت عمومی و تجربههای نمایندگی است و یک مدل واکنشی بدون نیاز به تفکر طولانی مدت محسوب میشود."
|
||
},
|
||
"NousResearch/Nous-Hermes-2-Mixtral-8x7B-DPO": {
|
||
"description": "Nous Hermes 2 - Mixtral 8x7B-DPO (46.7B) یک مدل دستورالعمل با دقت بالا است که برای محاسبات پیچیده مناسب است."
|
||
},
|
||
"OmniConsistency": {
|
||
"description": "OmniConsistency با معرفی مدلهای بزرگ Diffusion Transformers (DiTs) و دادههای سبکدار جفتشده، انسجام سبک و قابلیت تعمیم در وظایف تصویر به تصویر (Image-to-Image) را بهبود میبخشد و از افت کیفیت سبک جلوگیری میکند."
|
||
},
|
||
"Phi-3-medium-128k-instruct": {
|
||
"description": "همان مدل Phi-3-medium، اما با اندازه بزرگتر زمینه، مناسب برای RAG یا تعداد کمی از دستورات."
|
||
},
|
||
"Phi-3-medium-4k-instruct": {
|
||
"description": "یک مدل با ۱۴ میلیارد پارامتر که کیفیت آن بهتر از Phi-3-mini است و تمرکز آن بر دادههای با کیفیت بالا و فشردهسازی استدلالی است."
|
||
},
|
||
"Phi-3-mini-128k-instruct": {
|
||
"description": "مدل مشابه Phi-3-mini، اما با اندازه بزرگتر زمینه، مناسب برای RAG یا تعداد کمی از دستورات."
|
||
},
|
||
"Phi-3-mini-4k-instruct": {
|
||
"description": "کوچکترین عضو خانواده Phi-3، بهینهسازی شده برای کیفیت و تأخیر کم."
|
||
},
|
||
"Phi-3-small-128k-instruct": {
|
||
"description": "همان مدل Phi-3-small، اما با اندازه بزرگتر زمینه، مناسب برای RAG یا تعداد کمی از دستورات."
|
||
},
|
||
"Phi-3-small-8k-instruct": {
|
||
"description": "یک مدل با ۷ میلیارد پارامتر که کیفیت آن بهتر از Phi-3-mini است و تمرکز آن بر دادههای با کیفیت بالا و فشردهسازی استدلالی است."
|
||
},
|
||
"Phi-3.5-mini-instruct": {
|
||
"description": "نسخه بهروزرسانیشده مدل Phi-3-mini."
|
||
},
|
||
"Phi-3.5-vision-instrust": {
|
||
"description": "نسخه بهروزرسانیشده مدل Phi-3-vision."
|
||
},
|
||
"Pro/Qwen/Qwen2-7B-Instruct": {
|
||
"description": "Qwen2-7B-Instruct یک مدل زبانی بزرگ با تنظیم دقیق دستوری در سری Qwen2 است که اندازه پارامتر آن 7B است. این مدل بر اساس معماری Transformer ساخته شده و از تکنیکهای SwiGLU،偏置 QKV توجه و توجه گروهی استفاده میکند. این مدل قادر به پردازش ورودیهای بزرگ مقیاس است. این مدل در درک زبان، تولید، توانایی چند زبانه، کدنویسی، ریاضی و استدلال در چندین آزمون معیار عملکرد عالی دارد و از اکثر مدلهای متن باز پیشی گرفته و در برخی وظایف رقابت قابل توجهی با مدلهای اختصاصی نشان میدهد. Qwen2-7B-Instruct در چندین ارزیابی از Qwen1.5-7B-Chat پیشی گرفته و بهبود قابل توجهی در عملکرد نشان داده است."
|
||
},
|
||
"Pro/Qwen/Qwen2.5-7B-Instruct": {
|
||
"description": "Qwen2.5-7B-Instruct یکی از جدیدترین سری مدلهای زبانی بزرگ منتشر شده توسط Alibaba Cloud است. این مدل 7B در زمینههای کدنویسی و ریاضی دارای تواناییهای بهبود یافته قابل توجهی است. این مدل همچنین از پشتیبانی چند زبانه برخوردار است و بیش از 29 زبان از جمله چینی و انگلیسی را پوشش میدهد. این مدل در پیروی از دستورات، درک دادههای ساختاری و تولید خروجیهای ساختاری (به ویژه JSON) به طور قابل توجهی بهبود یافته است."
|
||
},
|
||
"Pro/Qwen/Qwen2.5-Coder-7B-Instruct": {
|
||
"description": "Qwen2.5-Coder-7B-Instruct جدیدترین نسخه از سری مدلهای زبانی بزرگ خاص کد است که توسط Alibaba Cloud منتشر شده است. این مدل بر اساس Qwen2.5 و با آموزش 5.5 تریلیون توکن، توانایی تولید کد، استدلال و اصلاح را به طور قابل توجهی افزایش داده است. این مدل نه تنها توانایی کدنویسی را تقویت کرده بلکه مزایای ریاضی و عمومی را نیز حفظ کرده است. این مدل پایهای جامعتر برای کاربردهای عملی مانند عاملهای کد فراهم میکند."
|
||
},
|
||
"Pro/Qwen/Qwen2.5-VL-7B-Instruct": {
|
||
"description": "Qwen2.5-VL عضو جدید سری Qwen است که توانایی قدرتمند درک بصری دارد. این مدل میتواند متن، نمودارها و طرحبندیهای درون تصاویر را تحلیل کند و همچنین قادر به درک ویدیوهای بلند و گرفتن رویدادهاست. این مدل میتواند استدلال کند، ابزارها را عملیاتی کند، و از چندین فرمت برای تعیین موقعیت اشیا و تولید خروجی ساختاری پشتیبانی میکند. همچنین، آن از رزولوشن و نرخ فریم پویا برای درک ویدیو بهینهسازی شده است و کارایی کدگذار بصری آن نیز افزایش یافته است."
|
||
},
|
||
"Pro/THUDM/GLM-4.1V-9B-Thinking": {
|
||
"description": "GLM-4.1V-9B-Thinking یک مدل زبان تصویری متنباز (VLM) است که بهطور مشترک توسط Zhizhu AI و آزمایشگاه KEG دانشگاه تسینگهوا منتشر شده است و بهطور خاص برای پردازش وظایف شناختی چندرسانهای پیچیده طراحی شده است. این مدل بر اساس مدل پایه GLM-4-9B-0414 ساخته شده و با معرفی مکانیزم استدلال «زنجیره تفکر» (Chain-of-Thought) و استفاده از استراتژی یادگیری تقویتی، بهطور قابل توجهی توانایی استدلال چندرسانهای و پایداری آن را بهبود بخشیده است."
|
||
},
|
||
"Pro/THUDM/glm-4-9b-chat": {
|
||
"description": "GLM-4-9B-Chat نسخه متن باز از مدلهای پیشآموزش شده سری GLM-4 است که توسط AI Zhizhu ارائه شده است. این مدل در زمینههای معنایی، ریاضی، استدلال، کد و دانش عملکرد عالی دارد. علاوه بر پشتیبانی از گفتگوی چند دور، GLM-4-9B-Chat همچنین دارای قابلیتهای پیشرفتهای مانند مرور وب، اجرای کد، فراخوانی ابزارهای سفارشی (Function Call) و استدلال متن طولانی است. این مدل از 26 زبان پشتیبانی میکند، از جمله چینی، انگلیسی، ژاپنی، کرهای و آلمانی. در چندین آزمون معیار، GLM-4-9B-Chat عملکرد عالی نشان داده است، مانند AlignBench-v2، MT-Bench، MMLU و C-Eval. این مدل از حداکثر طول زمینه 128K پشتیبانی میکند و برای تحقیقات علمی و کاربردهای تجاری مناسب است."
|
||
},
|
||
"Pro/deepseek-ai/DeepSeek-R1": {
|
||
"description": "DeepSeek-R1 یک مدل استنتاجی مبتنی بر یادگیری تقویتی (RL) است که مشکلات تکرار و خوانایی را در مدل حل میکند. قبل از RL، DeepSeek-R1 دادههای شروع سرد را معرفی کرده و عملکرد استنتاج را بهینهسازی کرده است. این مدل در وظایف ریاضی، کد و استنتاج با OpenAI-o1 عملکرد مشابهی دارد و از طریق روشهای آموزشی به دقت طراحی شده، عملکرد کلی را بهبود میبخشد."
|
||
},
|
||
"Pro/deepseek-ai/DeepSeek-R1-Distill-Qwen-7B": {
|
||
"description": "DeepSeek-R1-Distill-Qwen-7B مدلی است که بر اساس Qwen2.5-Math-7B از طریق دستیابی به دانش (Knowledge Distillation) ساخته شده است. این مدل با استفاده از 800,000 نمونه انتخابی تولید شده توسط DeepSeek-R1 آموزش داده شده و توانایی استنتاج ممتازی نشان میدهد. این مدل در چندین تست استاندارد عملکرد خوبی داشته است، از جمله دقت 92.8٪ در MATH-500، نرخ موفقیت 55.5٪ در AIME 2024 و نمره 1189 در CodeForces، که نشاندهنده تواناییهای قوی ریاضی و برنامهنویسی برای یک مدل با حجم 7B است."
|
||
},
|
||
"Pro/deepseek-ai/DeepSeek-V3": {
|
||
"description": "DeepSeek-V3 یک مدل زبان با 671 میلیارد پارامتر است که از معماری متخصصان ترکیبی (MoE) و توجه چندسر (MLA) استفاده میکند و با استراتژی تعادل بار بدون ضرر کمکی بهینهسازی کارایی استنتاج و آموزش را انجام میدهد. این مدل با پیشآموزش بر روی 14.8 تریلیون توکن با کیفیت بالا و انجام تنظیم دقیق نظارتی و یادگیری تقویتی، در عملکرد از سایر مدلهای متنباز پیشی میگیرد و به مدلهای بسته پیشرو نزدیک میشود."
|
||
},
|
||
"Pro/deepseek-ai/DeepSeek-V3.1-Terminus": {
|
||
"description": "DeepSeek-V3.1-Terminus نسخه بهروزرسانی شده مدل V3.1 منتشر شده توسط DeepSeek است که به عنوان یک مدل زبان بزرگ با عامل ترکیبی شناخته میشود. این بهروزرسانی ضمن حفظ قابلیتهای اصلی مدل، بر رفع مشکلات گزارش شده توسط کاربران و افزایش پایداری تمرکز دارد. این نسخه به طور قابل توجهی انسجام زبانی را بهبود بخشیده و از بروز ترکیب زبان چینی و انگلیسی و کاراکترهای نامتعارف کاسته است. مدل شامل حالت «تفکر» (Thinking Mode) و «غیرتفکر» (Non-thinking Mode) است که کاربران میتوانند از طریق قالبهای گفتگو به صورت انعطافپذیر بین آنها جابجا شوند تا با وظایف مختلف سازگار شوند. به عنوان یک بهینهسازی مهم، V3.1-Terminus عملکرد عامل کد (Code Agent) و عامل جستجو (Search Agent) را تقویت کرده است تا در فراخوانی ابزارها و اجرای وظایف پیچیده چندمرحلهای قابل اعتمادتر باشد."
|
||
},
|
||
"Pro/deepseek-ai/DeepSeek-V3.2-Exp": {
|
||
"description": "DeepSeek-V3.2-Exp نسخه آزمایشی V3.2 است که توسط DeepSeek منتشر شده و به عنوان گامی میانی در مسیر توسعه معماری نسل بعدی طراحی شده است. این نسخه با افزودن مکانیزم توجه پراکنده DeepSeek (DeepSeek Sparse Attention یا DSA) بر پایه V3.1-Terminus، کارایی آموزش و استنتاج در زمینههای متنی طولانی را بهبود میبخشد. همچنین بهطور ویژه برای فراخوانی ابزارها، درک اسناد بلند و استدلال چندمرحلهای بهینهسازی شده است. V3.2-Exp پلی میان تحقیق و تولید است و برای کاربرانی مناسب است که به دنبال بهرهوری بالاتر در سناریوهایی با بودجه متنی بالا هستند."
|
||
},
|
||
"Pro/moonshotai/Kimi-K2-Instruct-0905": {
|
||
"description": "Kimi K2-Instruct-0905 جدیدترین و قدرتمندترین نسخه Kimi K2 است. این مدل یک مدل زبان برتر با معماری متخصص ترکیبی (MoE) است که دارای ۱ تریلیون پارامتر کل و ۳۲ میلیارد پارامتر فعال میباشد. ویژگیهای اصلی این مدل شامل: هوش کدگذاری عامل بهبود یافته که در آزمونهای معیار عمومی و وظایف واقعی کدگذاری عامل عملکرد قابل توجهی نشان میدهد؛ تجربه کدگذاری فرانتاند بهبود یافته که از نظر زیبایی و کاربردی بودن برنامهنویسی فرانتاند پیشرفت داشته است."
|
||
},
|
||
"Pro/moonshotai/Kimi-K2-Thinking": {
|
||
"description": "Kimi K2 Thinking Turbo نسخه توربوی سری Kimi K2 است که برای سرعت استنتاج و توان عملیاتی بهینهسازی شده و در عین حال توانایی استنتاج چندمرحلهای و استفاده از ابزارهای K2 Thinking را حفظ میکند. این مدل بر پایه معماری متخصصان ترکیبی (MoE) ساخته شده، دارای حدود ۱ تریلیون پارامتر است، بهصورت بومی از زمینه ۲۵۶ هزار توکن پشتیبانی میکند و میتواند بهطور پایدار فراخوانی ابزارهای بزرگمقیاس را انجام دهد. مناسب برای محیطهای تولیدی با نیاز بالا به تأخیر کم و همزمانی بالا."
|
||
},
|
||
"QwQ-32B-Preview": {
|
||
"description": "QwQ-32B-Preview یک مدل پردازش زبان طبیعی نوآورانه است که قادر به پردازش کارآمد مکالمات پیچیده و درک زمینه است."
|
||
},
|
||
"Qwen/QVQ-72B-Preview": {
|
||
"description": "QVQ-72B-Preview یک مدل تحقیقاتی است که توسط تیم Qwen توسعه یافته و بر روی تواناییهای استنتاج بصری تمرکز دارد و در درک صحنههای پیچیده و حل مسائل ریاضی مرتبط با بصری دارای مزیتهای منحصر به فردی است."
|
||
},
|
||
"Qwen/QwQ-32B": {
|
||
"description": "QwQ مدل استنتاجی از سری Qwen است. در مقایسه با مدلهای سنتی بهینهسازی دستورالعمل، QwQ دارای توانایی تفکر و استنتاج است و میتواند در وظایف پاییندستی عملکرد قابل توجهی را به ویژه در حل مسائل دشوار ارائه دهد. QwQ-32B یک مدل استنتاجی متوسط است که میتواند در مقایسه با مدلهای استنتاجی پیشرفته (مانند DeepSeek-R1، o1-mini) عملکرد رقابتی را به دست آورد. این مدل از تکنیکهایی مانند RoPE، SwiGLU، RMSNorm و Attention QKV bias استفاده میکند و دارای ساختار شبکه 64 لایه و 40 سر توجه Q (در معماری GQA، KV برابر با 8 است) میباشد."
|
||
},
|
||
"Qwen/QwQ-32B-Preview": {
|
||
"description": "QwQ-32B-Preview جدیدترین مدل تحقیقاتی تجربی Qwen است که بر بهبود توانایی استدلال AI تمرکز دارد. با کاوش در مکانیزمهای پیچیدهای مانند ترکیب زبان و استدلال بازگشتی، مزایای اصلی شامل توانایی تحلیل استدلال قوی، توانایی ریاضی و برنامهنویسی است. در عین حال، مشکلاتی مانند تغییر زبان، حلقههای استدلال، ملاحظات ایمنی و تفاوتهای دیگر در تواناییها وجود دارد."
|
||
},
|
||
"Qwen/Qwen-Image": {
|
||
"description": "Qwen-Image یک مدل پایه تولید تصویر است که توسط تیم Tongyi Qianwen شرکت علیبابا توسعه یافته و دارای ۲۰ میلیارد پارامتر میباشد. این مدل در رندر متون پیچیده و ویرایش دقیق تصاویر پیشرفتهای چشمگیری داشته و بهویژه در تولید تصاویری با متون چینی و انگلیسی با وفاداری بالا بسیار توانمند است. Qwen-Image نه تنها قادر به پردازش چیدمانهای چندخطی و متون در سطح پاراگراف است، بلکه در حین تولید تصویر، انسجام تایپوگرافی و هماهنگی با زمینه را نیز حفظ میکند. افزون بر توانایی برجسته در رندر متن، این مدل از سبکهای هنری متنوعی پشتیبانی میکند؛ از عکسهای واقعگرایانه گرفته تا زیباییشناسی انیمه، و میتواند بهطور انعطافپذیر با نیازهای مختلف خلاقانه سازگار شود. همچنین، این مدل دارای قابلیتهای قدرتمند در ویرایش و درک تصویر است و از عملیات پیشرفتهای مانند انتقال سبک، افزودن یا حذف اشیاء، تقویت جزئیات، ویرایش متن و حتی کنترل حالت بدن انسان پشتیبانی میکند. هدف آن تبدیل شدن به یک مدل پایه هوشمند و جامع برای خلق و پردازش بصری است که زبان، چیدمان و تصویر را در هم میآمیزد."
|
||
},
|
||
"Qwen/Qwen-Image-Edit-2509": {
|
||
"description": "Qwen-Image-Edit-2509 جدیدترین نسخه ویرایش تصویر از مدل Qwen-Image است که توسط تیم Tongyi Qianwen شرکت علیبابا منتشر شده است. این مدل بر پایه مدل ۲۰ میلیارد پارامتری Qwen-Image توسعه یافته و با آموزش عمیق، توانایی منحصربهفرد خود در رندر متن را به حوزه ویرایش تصویر گسترش داده و امکان ویرایش دقیق متون درون تصویر را فراهم کرده است. Qwen-Image-Edit از معماری نوآورانهای بهره میبرد که تصویر ورودی را بهطور همزمان به Qwen2.5-VL (برای کنترل معنایی بصری) و VAE Encoder (برای کنترل ظاهر بصری) ارسال میکند و بدین ترتیب توانایی ویرایش دوگانه در سطح معنا و ظاهر را فراهم میسازد. این بدان معناست که مدل نه تنها از ویرایشهای ظاهری موضعی مانند افزودن، حذف یا تغییر عناصر پشتیبانی میکند، بلکه قادر به انجام ویرایشهای معنایی پیشرفتهای مانند خلق IP، انتقال سبک و حفظ انسجام معنایی نیز میباشد. این مدل در چندین آزمون معیار عمومی عملکردی در سطح پیشرفته (SOTA) از خود نشان داده و به یک مدل پایه قدرتمند در زمینه ویرایش تصویر تبدیل شده است."
|
||
},
|
||
"Qwen/Qwen2-72B-Instruct": {
|
||
"description": "Qwen 2 Instruct (72B) دستورالعملهای دقیق برای کاربردهای سازمانی ارائه میدهد و به درستی به آنها پاسخ میدهد."
|
||
},
|
||
"Qwen/Qwen2-7B-Instruct": {
|
||
"description": "Qwen2-72B-Instruct یک مدل زبانی بزرگ با تنظیم دقیق دستوری در سری Qwen2 است که اندازه پارامتر آن 72B است. این مدل بر اساس معماری Transformer ساخته شده و از تکنیکهای SwiGLU،偏置 QKV توجه و توجه گروهی استفاده میکند. این مدل قادر به پردازش ورودیهای بزرگ مقیاس است. این مدل در درک زبان، تولید، توانایی چند زبانه، کدنویسی، ریاضی و استدلال در چندین آزمون معیار عملکرد عالی دارد و از اکثر مدلهای متن باز پیشی گرفته و در برخی وظایف رقابت قابل توجهی با مدلهای اختصاصی نشان میدهد."
|
||
},
|
||
"Qwen/Qwen2-VL-72B-Instruct": {
|
||
"description": "Qwen2-VL جدیدترین نسخه از مدل Qwen-VL است که در آزمونهای معیار درک بصری به پیشرفتهترین عملکرد دست یافته است."
|
||
},
|
||
"Qwen/Qwen2.5-14B-Instruct": {
|
||
"description": "Qwen2.5 یک سری جدید از مدلهای زبانی بزرگ است که با هدف بهینهسازی پردازش وظایف دستوری طراحی شده است."
|
||
},
|
||
"Qwen/Qwen2.5-32B-Instruct": {
|
||
"description": "Qwen2.5 یک سری جدید از مدلهای زبانی بزرگ است که با هدف بهینهسازی پردازش وظایف دستوری طراحی شده است."
|
||
},
|
||
"Qwen/Qwen2.5-72B-Instruct": {
|
||
"description": "مدل زبانی بزرگ توسعه یافته توسط تیم علیبابا، تونگyi چنوِن."
|
||
},
|
||
"Qwen/Qwen2.5-72B-Instruct-128K": {
|
||
"description": "Qwen2.5 یک سری جدید از مدلهای زبان بزرگ است که دارای تواناییهای قویتر در درک و تولید میباشد."
|
||
},
|
||
"Qwen/Qwen2.5-72B-Instruct-Turbo": {
|
||
"description": "Qwen2.5 یک سری جدید از مدلهای زبانی بزرگ است که با هدف بهینهسازی پردازش وظایف دستوری طراحی شده است."
|
||
},
|
||
"Qwen/Qwen2.5-7B-Instruct": {
|
||
"description": "Qwen2.5 یک سری جدید از مدلهای زبان بزرگ است که با هدف بهینهسازی پردازش وظایف دستوری طراحی شده است."
|
||
},
|
||
"Qwen/Qwen2.5-7B-Instruct-Turbo": {
|
||
"description": "Qwen2.5 یک سری جدید از مدلهای زبانی بزرگ است که با هدف بهینهسازی پردازش وظایف دستوری طراحی شده است."
|
||
},
|
||
"Qwen/Qwen2.5-Coder-32B-Instruct": {
|
||
"description": "Qwen2.5-Coder بر نوشتن کد تمرکز دارد."
|
||
},
|
||
"Qwen/Qwen2.5-Coder-7B-Instruct": {
|
||
"description": "Qwen2.5-Coder-7B-Instruct جدیدترین نسخه از سری مدلهای زبانی بزرگ خاص کد است که توسط Alibaba Cloud منتشر شده است. این مدل بر اساس Qwen2.5 و با آموزش 5.5 تریلیون توکن، توانایی تولید کد، استدلال و اصلاح را به طور قابل توجهی افزایش داده است. این مدل نه تنها توانایی کدنویسی را تقویت کرده بلکه مزایای ریاضی و عمومی را نیز حفظ کرده است. این مدل پایهای جامعتر برای کاربردهای عملی مانند عاملهای کد فراهم میکند."
|
||
},
|
||
"Qwen/Qwen2.5-VL-32B-Instruct": {
|
||
"description": "Qwen2.5-VL-32B-Instruct یک مدل چند حالتی از تیم Thousand Questions است که بخشی از سری Qwen2.5-VL میباشد. این مدل علاوه بر توانایی شناسایی اشیاء رایج، قادر به تحلیل متن، نمودار، نمادها، شکلها و طرحبندیهای درون تصاویر است. این مدل به عنوان یک هوش مصنوعی بصری عمل میکند، قادر به استدلال و کنترل ابزارها به صورت پویا است و توانایی استفاده از کامپیوتر و موبایل را دارد. علاوه بر این، این مدل میتواند اشیاء درون تصویر را با دقت بالا مکانیابی کند و برای فاکتورها، جداول و غیره خروجیهای ساختاریجادی تولید کند. نسبت به نسخه قبلی Qwen2-VL، این نسخه در تواناییهای ریاضی و حل مسئله از طریق یادگیری تقویتی پیشرفت کرده است و سبک پاسخگویی آن نیز بیشتر با ترجیحات انسانها هماهنگ است."
|
||
},
|
||
"Qwen/Qwen2.5-VL-72B-Instruct": {
|
||
"description": "Qwen2.5-VL مدل زبان و تصویر از سری Qwen2.5 است. این مدل در جنبههای مختلف بهبود یافته است: دارای توانایی تحلیل بصری قویتر، قادر به تشخیص اشیاء رایج، تحلیل متن، نمودارها و طرحبندی است؛ به عنوان یک عامل بصری میتواند استدلال کند و به طور پویا ابزارها را هدایت کند؛ از توانایی درک ویدیوهای طولانیتر از یک ساعت و شناسایی رویدادهای کلیدی برخوردار است؛ قادر به مکانیابی دقیق اشیاء در تصویر با تولید جعبههای مرزی یا نقاط است؛ و توانایی تولید خروجیهای ساختاریافته، به ویژه برای دادههای اسکن شده مانند فاکتورها و جداول را دارد."
|
||
},
|
||
"Qwen/Qwen3-14B": {
|
||
"description": "Qwen3 یک مدل بزرگ جدید با تواناییهای بهبود یافته است که در استدلال، عمومی، نمایندگی و چند زبانی به سطح پیشرفته صنعت دست یافته و از تغییر حالت تفکر پشتیبانی میکند."
|
||
},
|
||
"Qwen/Qwen3-235B-A22B": {
|
||
"description": "Qwen3 یک مدل بزرگ جدید با تواناییهای بهبود یافته است که در استدلال، عمومی، نمایندگی و چند زبانی به سطح پیشرفته صنعت دست یافته و از تغییر حالت تفکر پشتیبانی میکند."
|
||
},
|
||
"Qwen/Qwen3-235B-A22B-Instruct-2507": {
|
||
"description": "Qwen3-235B-A22B-Instruct-2507 یک مدل زبان بزرگ ترکیبی (MoE) پرچمدار از سری Qwen3 است که توسط تیم Tongyi Qianwen شرکت علیبابا توسعه یافته است. این مدل دارای 235 میلیارد پارامتر کل و 22 میلیارد پارامتر فعال در هر استنتاج است. نسخه بهروزشدهای از حالت غیرتفکری Qwen3-235B-A22B است که تمرکز بر بهبود قابل توجه در پیروی از دستورالعملها، استدلال منطقی، درک متن، ریاضیات، علوم، برنامهنویسی و استفاده از ابزارها دارد. همچنین پوشش دانش چندزبانه و ترجیحات کاربر در وظایف ذهنی و باز را بهبود بخشیده تا متنهای مفیدتر و با کیفیت بالاتری تولید کند."
|
||
},
|
||
"Qwen/Qwen3-235B-A22B-Thinking-2507": {
|
||
"description": "Qwen3-235B-A22B-Thinking-2507 عضوی از سری مدلهای بزرگ زبان Qwen3 است که توسط تیم Tongyi Qianwen شرکت علیبابا توسعه یافته و بر وظایف استدلال پیچیده و دشوار تمرکز دارد. این مدل بر پایه معماری MoE با 235 میلیارد پارامتر کل ساخته شده و در هر توکن حدود 22 میلیارد پارامتر فعال میکند که باعث افزایش کارایی محاسباتی در عین حفظ قدرت عملکرد میشود. به عنوان یک مدل اختصاصی \"تفکر\"، در استدلال منطقی، ریاضیات، علوم، برنامهنویسی و آزمونهای علمی که نیازمند تخصص انسانی هستند، عملکرد برجستهای دارد و در میان مدلهای تفکری متنباز در سطح برتر قرار دارد. همچنین تواناییهای عمومی مانند پیروی از دستورالعملها، استفاده از ابزار و تولید متن را تقویت کرده و به طور بومی از درک متنهای طولانی تا 256 هزار توکن پشتیبانی میکند که برای سناریوهای نیازمند استدلال عمیق و پردازش اسناد طولانی بسیار مناسب است."
|
||
},
|
||
"Qwen/Qwen3-30B-A3B": {
|
||
"description": "Qwen3 یک مدل بزرگ جدید با تواناییهای بهبود یافته است که در استدلال، عمومی، نمایندگی و چند زبانی به سطح پیشرفته صنعت دست یافته و از تغییر حالت تفکر پشتیبانی میکند."
|
||
},
|
||
"Qwen/Qwen3-30B-A3B-Instruct-2507": {
|
||
"description": "Qwen3-30B-A3B-Instruct-2507 نسخه بهروزرسانی شده مدل غیرتفکری Qwen3-30B-A3B است. این یک مدل متخصص ترکیبی (MoE) با مجموع ۳۰.۵ میلیارد پارامتر و ۳.۳ میلیارد پارامتر فعال است. این مدل در جنبههای مختلف بهبودهای کلیدی داشته است، از جمله افزایش قابل توجه در پیروی از دستورالعملها، استدلال منطقی، درک متن، ریاضیات، علوم، برنامهنویسی و استفاده از ابزارها. همچنین، پیشرفت قابل توجهی در پوشش دانش چندزبانه و تطابق بهتر با ترجیحات کاربران در وظایف ذهنی و باز دارد، که منجر به تولید پاسخهای مفیدتر و متون با کیفیت بالاتر میشود. علاوه بر این، توانایی درک متنهای بلند این مدل تا ۲۵۶ هزار توکن افزایش یافته است. این مدل فقط از حالت غیرتفکری پشتیبانی میکند و خروجی آن شامل برچسبهای `<think></think>` نخواهد بود."
|
||
},
|
||
"Qwen/Qwen3-30B-A3B-Thinking-2507": {
|
||
"description": "Qwen3-30B-A3B-Thinking-2507 توسط تیم Tongyi Qianwen شرکت علیبابا بهعنوان جدیدترین مدل «تفکر» از سری Qwen3 منتشر شده است. این مدل که یک مدل ترکیبی از متخصصان (MoE) با مجموع 30.5 میلیارد پارامتر و 3.3 میلیارد پارامتر فعالشونده است، بر ارتقای توانایی پردازش وظایف پیچیده تمرکز دارد. این مدل در معیارهای علمی نیازمند تخصص انسانی—از جمله استدلال منطقی، ریاضیات، علوم و برنامهنویسی—بهبود قابلتوجهی در عملکرد نشان داده است. همچنین توانمندیهای عمومی آن در پیروی از دستورالعملها، استفاده از ابزارها، تولید متن و همسویی با ترجیحهای انسانی نیز بهسرعت تقویت شدهاند. مدل بهطور ذاتی از درک بافتهای طولانی تا 256K پشتیبانی میکند و قابل گسترش تا 1,000,000 توکن است. این نسخه بهطور ویژه برای «حالت تفکر» طراحی شده است تا از طریق استدلال گامبهگام دقیق مسائل بسیار پیچیده را حل کند و قابلیتهای عامل (Agent) آن نیز درخشان است."
|
||
},
|
||
"Qwen/Qwen3-32B": {
|
||
"description": "Qwen3 یک مدل بزرگ جدید با تواناییهای بهبود یافته است که در استدلال، عمومی، نمایندگی و چند زبانی به سطح پیشرفته صنعت دست یافته و از تغییر حالت تفکر پشتیبانی میکند."
|
||
},
|
||
"Qwen/Qwen3-8B": {
|
||
"description": "Qwen3 یک مدل بزرگ جدید با تواناییهای بهبود یافته است که در استدلال، عمومی، نمایندگی و چند زبانی به سطح پیشرفته صنعت دست یافته و از تغییر حالت تفکر پشتیبانی میکند."
|
||
},
|
||
"Qwen/Qwen3-Coder-30B-A3B-Instruct": {
|
||
"description": "Qwen3-Coder-30B-A3B-Instruct یک مدل کدنویسی از مجموعه Qwen3 است که توسط تیم Tongyi Qianwen شرکت علیبابا توسعه یافته است. بهعنوان یک مدل پالایششده و بهینهشده، این مدل در حالی که عملکرد و کارایی بالایی را حفظ میکند، بر بهبود توانمندیهای پردازش کد متمرکز شده است. این مدل در وظایف پیچیدهای مانند برنامهنویسی عاملمحور (Agentic Coding)، خودکارسازی عملیات مرورگر و فراخوانی ابزارها، نسبت به مدلهای متنباز مزایای عملکرد چشمگیری از خود نشان میدهد. این مدل بهصورت بومی از زمینههای متنی طولانی تا 256K توکن پشتیبانی میکند و قابل گسترش تا 1M توکن است، که امکان درک و پردازش در سطح مخازن کد را بهبود میبخشد. علاوه بر این، این مدل پشتیبانی قدرتمندی برای کدنویسی عاملی در پلتفرمهایی مانند Qwen Code و CLINE فراهم میآورد و فرمت ویژهای برای فراخوانی توابع طراحی شده است."
|
||
},
|
||
"Qwen/Qwen3-Coder-480B-A35B-Instruct": {
|
||
"description": "Qwen3-Coder-480B-A35B-Instruct مدلی برای برنامهنویسی است که توسط علیبابا منتشر شده و تا کنون بیشترین قابلیتهای عاملمحور (Agentic) را داراست. این مدل یک مدل ترکیب متخصصان (Mixture of Experts - MoE) با حدود 480 میلیارد پارامتر کل و 35 میلیارد پارامتر فعال است که تعادلی میان کارایی و عملکرد برقرار میکند. این مدل بهصورت بومی از طول زمینه 256K (حدود 260 هزار) توکن پشتیبانی میکند و با استفاده از روشهای برونیابی مانند YaRN میتواند تا 1,000,000 توکن گسترش یابد، که آن را قادر میسازد مخازن کد بزرگ و وظایف پیچیده برنامهنویسی را پردازش کند. Qwen3-Coder برای جریانهای کاری کدنویسی عاملمحور طراحی شده است؛ نه تنها میتواند کد تولید کند، بلکه قادر است بهصورت خودکار با ابزارها و محیطهای توسعه تعامل نماید تا مسائل پیچیده برنامهنویسی را حل کند. در چندین بنچمارک مربوط به کدنویسی و وظایف عامل، این مدل در میان مدلهای متنباز در سطح برتر قرار گرفته و عملکرد آن با مدلهای پیشرو مانند Claude Sonnet 4 قابل مقایسه است."
|
||
},
|
||
"Qwen/Qwen3-Next-80B-A3B-Instruct": {
|
||
"description": "Qwen3-Next-80B-A3B-Instruct مدلی پایه نسل بعدی است که توسط تیم Tongyi Qianwen شرکت علیبابا منتشر شده است. این مدل بر اساس معماری جدید Qwen3-Next طراحی شده و هدف آن دستیابی به بالاترین کارایی در آموزش و استنتاج است. این مدل از مکانیزم توجه ترکیبی نوآورانه (Gated DeltaNet و Gated Attention)، ساختار متخصص ترکیبی با پراکندگی بالا (MoE) و چندین بهینهسازی برای پایداری آموزش بهره میبرد. به عنوان یک مدل پراکنده با ۸۰ میلیارد پارامتر کل، در زمان استنتاج تنها حدود ۳ میلیارد پارامتر فعال میشوند که به طور قابل توجهی هزینه محاسباتی را کاهش میدهد و در پردازش وظایف با زمینه طولانی بیش از ۳۲ هزار توکن، توان عملیاتی استنتاج آن بیش از ۱۰ برابر مدل Qwen3-32B است. این مدل نسخه تنظیم شده برای دستورالعملها است و برای وظایف عمومی طراحی شده و از حالت زنجیره فکری (Thinking) پشتیبانی نمیکند. از نظر عملکرد، در برخی بنچمارکها با مدل پرچمدار Tongyi Qianwen یعنی Qwen3-235B برابری میکند و به ویژه در وظایف با زمینه بسیار طولانی برتری قابل توجهی دارد."
|
||
},
|
||
"Qwen/Qwen3-Next-80B-A3B-Thinking": {
|
||
"description": "Qwen3-Next-80B-A3B-Thinking مدلی پایه نسل بعدی است که توسط تیم Tongyi Qianwen شرکت علیبابا برای وظایف استنتاج پیچیده طراحی شده است. این مدل بر اساس معماری نوآورانه Qwen3-Next ساخته شده که مکانیزم توجه ترکیبی (Gated DeltaNet و Gated Attention) و ساختار متخصص ترکیبی با پراکندگی بالا (MoE) را ادغام میکند تا به بالاترین کارایی در آموزش و استنتاج دست یابد. به عنوان یک مدل پراکنده با ۸۰ میلیارد پارامتر کل، در زمان استنتاج تنها حدود ۳ میلیارد پارامتر فعال میشوند که هزینه محاسباتی را به طور چشمگیری کاهش میدهد و در پردازش وظایف با زمینه طولانی بیش از ۳۲ هزار توکن، توان عملیاتی آن بیش از ۱۰ برابر مدل Qwen3-32B است. این نسخه «Thinking» به طور خاص برای انجام وظایف چندمرحلهای دشوار مانند اثبات ریاضی، ترکیب کد، تحلیل منطقی و برنامهریزی بهینه شده و به طور پیشفرض فرایند استنتاج را به صورت ساختاریافته و در قالب «زنجیره فکری» ارائه میدهد. از نظر عملکرد، این مدل نه تنها از مدلهای پرهزینهتر مانند Qwen3-32B-Thinking پیشی گرفته، بلکه در چندین بنچمارک از Gemini-2.5-Flash-Thinking نیز بهتر عمل میکند."
|
||
},
|
||
"Qwen/Qwen3-Omni-30B-A3B-Captioner": {
|
||
"description": "Qwen3-Omni-30B-A3B-Captioner یکی از مدلهای زبان تصویری (VLM) سری Qwen3 از تیم Tongyi Qianwen شرکت علیبابا است. این مدل بهطور خاص برای تولید توصیفهای تصویری با کیفیت بالا، دقیق و جزئی طراحی شده است. با بهرهگیری از معماری متخصصان ترکیبی (MoE) با ۳۰ میلیارد پارامتر کلی، این مدل توانایی درک عمیق محتوای تصویر و تبدیل آن به توصیفهای متنی روان و طبیعی را دارد. عملکرد برجستهای در زمینههایی مانند درک صحنه، شناسایی اشیاء، استنتاج روابط و ثبت جزئیات تصویری دارد و برای کاربردهایی که نیاز به درک دقیق تصویر و تولید توصیف دارند، بسیار مناسب است."
|
||
},
|
||
"Qwen/Qwen3-Omni-30B-A3B-Instruct": {
|
||
"description": "Qwen3-Omni-30B-A3B-Instruct یکی از جدیدترین مدلهای سری Qwen3 از تیم Tongyi Qianwen شرکت علیبابا است. این مدل با معماری متخصصان ترکیبی (MoE) دارای ۳۰ میلیارد پارامتر کلی و ۳ میلیارد پارامتر فعال است که در عین حفظ عملکرد قدرتمند، هزینه استنتاج را کاهش میدهد. این مدل با دادههای با کیفیت، چندمنبعی و چندزبانه آموزش دیده و توانایی عمومی بالایی دارد. از ورودیهای چندحالته شامل متن، تصویر، صوت و ویدیو پشتیبانی میکند و قادر به درک و تولید محتوای میانحالتی است."
|
||
},
|
||
"Qwen/Qwen3-Omni-30B-A3B-Thinking": {
|
||
"description": "Qwen3-Omni-30B-A3B-Thinking بخش اصلی «تفکر» (Thinker) در مدل چندحالته Qwen3-Omni است. این مدل بهطور خاص برای پردازش ورودیهای چندحالته شامل متن، صوت، تصویر و ویدیو و انجام استنتاجهای زنجیرهای پیچیده طراحی شده است. بهعنوان مغز استنتاج، این مدل تمام ورودیها را به فضای بازنمایی مشترک تبدیل میکند تا درک عمیق و استنتاج میانحالتی را ممکن سازد. با بهرهگیری از معماری MoE و ۳۰ میلیارد پارامتر کلی و ۳ میلیارد پارامتر فعال، این مدل در عین حفظ توانایی استنتاج قوی، بهرهوری محاسباتی را نیز بهینه میکند."
|
||
},
|
||
"Qwen/Qwen3-VL-235B-A22B-Instruct": {
|
||
"description": "Qwen3-VL-235B-A22B-Instruct یک مدل بزرگ تنظیمشده با دستورالعمل از سری Qwen3-VL است که بر پایه معماری متخصصان ترکیبی (MoE) ساخته شده و توانایی برجستهای در درک و تولید چندرسانهای دارد. این مدل بهصورت بومی از زمینه متنی ۲۵۶ هزار توکن پشتیبانی میکند و برای خدمات چندرسانهای در سطح تولید با همزمانی بالا مناسب است."
|
||
},
|
||
"Qwen/Qwen3-VL-235B-A22B-Thinking": {
|
||
"description": "Qwen3-VL-235B-A22B-Thinking نسخه پرچمدار تفکر از سری Qwen3-VL است که بهطور خاص برای استدلال پیچیده چندرسانهای، استدلال در زمینههای متنی طولانی و تعامل با عاملهای هوشمند بهینهسازی شده است. این مدل برای سناریوهای سازمانی که نیاز به تفکر عمیق و استدلال بصری دارند، مناسب است."
|
||
},
|
||
"Qwen/Qwen3-VL-30B-A3B-Instruct": {
|
||
"description": "Qwen3-VL-30B-A3B-Instruct نسخه تنظیمشده با دستورالعمل از سری Qwen3-VL است که توانایی بالایی در درک و تولید زبان-تصویر دارد. این مدل بهصورت بومی از زمینه متنی ۲۵۶ هزار توکن پشتیبانی میکند و برای گفتگوهای چندرسانهای و تولید محتوا بر اساس تصویر مناسب است."
|
||
},
|
||
"Qwen/Qwen3-VL-30B-A3B-Thinking": {
|
||
"description": "Qwen3-VL-30B-A3B-Thinking نسخه تقویتشده برای استدلال (Thinking) از سری Qwen3-VL است که برای وظایف استدلال چندرسانهای، تبدیل تصویر به کد و درک پیچیده بصری بهینهسازی شده است. این مدل از زمینه متنی ۲۵۶ هزار توکن پشتیبانی میکند و توانایی بالایی در تفکر زنجیرهای دارد."
|
||
},
|
||
"Qwen/Qwen3-VL-32B-Instruct": {
|
||
"description": "Qwen3-VL-32B-Instruct یک مدل زبان تصویری از تیم Tongyi Qianwen شرکت علیبابا است که در چندین آزمون معیار زبان تصویری به عملکرد SOTA (بهترین در نوع خود) دست یافته است. این مدل از ورودیهای تصویری با وضوح بالا در سطح میلیون پیکسل پشتیبانی میکند و دارای تواناییهای قدرتمند درک تصویری عمومی، OCR چندزبانه، مکانیابی دقیق بصری و گفتوگوی تصویری است. بهعنوان بخشی از سری Qwen3، این مدل میتواند وظایف پیچیده چندحالته را پردازش کرده و از قابلیتهایی مانند فراخوانی ابزار و ادامهنویسی پیشوندی پشتیبانی کند."
|
||
},
|
||
"Qwen/Qwen3-VL-32B-Thinking": {
|
||
"description": "Qwen3-VL-32B-Thinking نسخهای بهینهشده از مدل زبان تصویری تیم Tongyi Qianwen شرکت علیبابا است که بهطور خاص برای وظایف استنتاج تصویری پیچیده طراحی شده است. این مدل دارای «حالت تفکر» داخلی است که به آن امکان میدهد پیش از پاسخگویی، مراحل میانی استنتاج را بهصورت دقیق تولید کند و در نتیجه عملکرد آن در وظایف نیازمند منطق چندمرحلهای، برنامهریزی و استنتاج پیچیده بهطور چشمگیری بهبود مییابد. این مدل از ورودیهای تصویری با وضوح بالا در سطح میلیون پیکسل پشتیبانی میکند و دارای تواناییهای قدرتمند درک تصویری عمومی، OCR چندزبانه، مکانیابی دقیق بصری و گفتوگوی تصویری است و همچنین از قابلیتهایی مانند فراخوانی ابزار و ادامهنویسی پیشوندی پشتیبانی میکند."
|
||
},
|
||
"Qwen/Qwen3-VL-8B-Instruct": {
|
||
"description": "Qwen3-VL-8B-Instruct یکی از مدلهای زبان-بینایی از سری Qwen3 است که بر پایه Qwen3-8B-Instruct توسعه یافته و با حجم زیادی از دادههای متنی-تصویری آموزش دیده است. این مدل در درک عمومی بصری، گفتوگوهای مبتنی بر تصویر و شناسایی متون چندزبانه در تصاویر مهارت دارد. مناسب برای کاربردهایی مانند پرسش و پاسخ بصری، توصیف تصویر، پیروی از دستورات چندوجهی و فراخوانی ابزارها میباشد."
|
||
},
|
||
"Qwen/Qwen3-VL-8B-Thinking": {
|
||
"description": "Qwen3-VL-8B-Thinking نسخه تفکر بصری از سری Qwen3 است که برای انجام وظایف پیچیده و چندمرحلهای استدلالی بهینهسازی شده است. این مدل بهطور پیشفرض پیش از پاسخدهی، زنجیرهای از تفکر مرحلهبهمرحله تولید میکند تا دقت استدلال را افزایش دهد. مناسب برای سناریوهایی است که نیاز به استدلال عمیق در پرسش و پاسخ بصری، بررسی محتوای تصویر و ارائه تحلیلهای دقیق دارند."
|
||
},
|
||
"Qwen2-72B-Instruct": {
|
||
"description": "Qwen2 جدیدترین سری مدلهای Qwen است که از 128k زمینه پشتیبانی میکند. در مقایسه با بهترین مدلهای متنباز فعلی، Qwen2-72B در درک زبان طبیعی، دانش، کد، ریاضی و چندزبانگی به طور قابل توجهی از مدلهای پیشرو فعلی فراتر رفته است."
|
||
},
|
||
"Qwen2-7B-Instruct": {
|
||
"description": "Qwen2 جدیدترین سری مدلهای Qwen است که میتواند از مدلهای متنباز با مقیاس مشابه و حتی بزرگتر فراتر رود. Qwen2 7B در چندین ارزیابی برتری قابل توجهی به دست آورده است، به ویژه در درک کد و زبان چینی."
|
||
},
|
||
"Qwen2-VL-72B": {
|
||
"description": "Qwen2-VL-72B یک مدل زبان بصری قدرتمند است که از پردازش چندرسانهای تصویر و متن پشتیبانی میکند و میتواند محتوای تصویر را به دقت شناسایی کرده و توصیف یا پاسخهای مرتبط تولید کند."
|
||
},
|
||
"Qwen2.5-14B-Instruct": {
|
||
"description": "Qwen2.5-14B-Instruct یک مدل زبان بزرگ با 140 میلیارد پارامتر است که عملکرد عالی دارد و بهینهسازی شده برای سناریوهای چینی و چند زبانه، از کاربردهایی مانند پرسش و پاسخ هوشمند و تولید محتوا پشتیبانی میکند."
|
||
},
|
||
"Qwen2.5-32B-Instruct": {
|
||
"description": "Qwen2.5-32B-Instruct یک مدل زبان بزرگ با 320 میلیارد پارامتر است که عملکرد متوازن دارد و بهینهسازی شده برای سناریوهای چینی و چند زبانه، از کاربردهایی مانند پرسش و پاسخ هوشمند و تولید محتوا پشتیبانی میکند."
|
||
},
|
||
"Qwen2.5-72B-Instruct": {
|
||
"description": "Qwen2.5-72B-Instruct از 16k زمینه پشتیبانی میکند و قادر به تولید متنهای طولانی بیش از 8K است. این مدل از تماسهای تابع و تعامل بدون درز با سیستمهای خارجی پشتیبانی میکند و به طور قابل توجهی انعطافپذیری و گسترشپذیری را افزایش میدهد. دانش مدل به وضوح افزایش یافته و تواناییهای کدنویسی و ریاضی به طور چشمگیری بهبود یافته است و از بیش از 29 زبان پشتیبانی میکند."
|
||
},
|
||
"Qwen2.5-7B-Instruct": {
|
||
"description": "Qwen2.5-7B-Instruct یک مدل زبان بزرگ با 70 میلیارد پارامتر است که از تماسهای تابع و تعامل بینقص با سیستمهای خارجی پشتیبانی میکند و به طور قابل توجهی انعطافپذیری و مقیاسپذیری را افزایش میدهد. این مدل بهینهسازی شده برای سناریوهای چینی و چند زبانه، از کاربردهایی مانند پرسش و پاسخ هوشمند و تولید محتوا پشتیبانی میکند."
|
||
},
|
||
"Qwen2.5-Coder-14B-Instruct": {
|
||
"description": "Qwen2.5-Coder-14B-Instruct یک مدل دستور برنامهنویسی مبتنی بر پیشآموزش وسیع است که دارای تواناییهای قوی در درک و تولید کد است و میتواند به طور مؤثر به انواع وظایف برنامهنویسی رسیدگی کند، به ویژه برای نوشتن کد هوشمند، تولید اسکریپتهای خودکار و پاسخ به مسائل برنامهنویسی مناسب است."
|
||
},
|
||
"Qwen2.5-Coder-32B-Instruct": {
|
||
"description": "Qwen2.5-Coder-32B-Instruct یک مدل زبان بزرگ است که به طور خاص برای تولید کد، درک کد و سناریوهای توسعه کارآمد طراحی شده است و از مقیاس 32B پارامتر پیشرفته در صنعت بهره میبرد و میتواند نیازهای متنوع برنامهنویسی را برآورده کند."
|
||
},
|
||
"Qwen3-235B": {
|
||
"description": "Qwen3-235B-A22B، مدل MoE (متخصص ترکیبی)، حالت «استدلال ترکیبی» را معرفی کرده است که به کاربران امکان میدهد بهطور یکپارچه بین «حالت تفکر» و «حالت غیرتفکر» جابجا شوند. این مدل از درک و استدلال در ۱۱۹ زبان و گویش پشتیبانی میکند و دارای قابلیتهای قدرتمند فراخوانی ابزار است. در آزمونهای معیار مختلف از جمله تواناییهای جامع، کد نویسی و ریاضیات، چندزبانه، دانش و استدلال، این مدل میتواند با مدلهای پیشرو بازار مانند DeepSeek R1، OpenAI o1، o3-mini، Grok 3 و Google Gemini 2.5 Pro رقابت کند."
|
||
},
|
||
"Qwen3-235B-A22B-Instruct-2507-FP8": {
|
||
"description": "Qwen3 235B A22B Instruct 2507: مدلی بهینهشده برای استدلال پیشرفته و دستورهای مکالمه با معماری کارشناسان ترکیبی که کارایی استنتاج را در پارامترهای بزرگ حفظ میکند."
|
||
},
|
||
"Qwen3-32B": {
|
||
"description": "Qwen3-32B، مدل متراکم (Dense Model)، حالت «استدلال ترکیبی» را معرفی کرده است که به کاربران امکان میدهد بهطور یکپارچه بین «حالت تفکر» و «حالت غیرتفکر» جابجا شوند. به دلیل بهبود ساختار مدل، افزایش دادههای آموزشی و روشهای مؤثرتر آموزش، عملکرد کلی این مدل با Qwen2.5-72B قابل مقایسه است."
|
||
},
|
||
"SenseChat": {
|
||
"description": "نسخه پایه مدل (V4)، طول متن ۴K، با تواناییهای عمومی قوی"
|
||
},
|
||
"SenseChat-128K": {
|
||
"description": "نسخه پایه مدل (V4)، با طول زمینه ۱۲۸K، در وظایف درک و تولید متون طولانی عملکرد برجستهای دارد"
|
||
},
|
||
"SenseChat-32K": {
|
||
"description": "مدل نسخه پایه (V4)، طول زمینه 32K، قابل استفاده در انواع سناریوها"
|
||
},
|
||
"SenseChat-5": {
|
||
"description": "جدیدترین نسخه مدل (V5.5)، با طول زمینه 128K، بهبود قابل توجه در زمینههای استدلال ریاضی، مکالمه انگلیسی، پیروی از دستورات و درک متون طولانی، قابل مقایسه با GPT-4o"
|
||
},
|
||
"SenseChat-5-1202": {
|
||
"description": "نسخه جدید مبتنی بر V5.5 که نسبت به نسخه قبلی در تواناییهای پایهای زبانهای چینی و انگلیسی، گفتگو، دانش علوم پایه، دانش علوم انسانی، نوشتار، منطق ریاضی و کنترل تعداد کلمات بهبود قابل توجهی داشته است."
|
||
},
|
||
"SenseChat-5-Cantonese": {
|
||
"description": "طول متن 32K، در درک مکالمات به زبان کانتونی از GPT-4 پیشی میگیرد و در زمینههای مختلفی مانند دانش، استدلال، ریاضیات و برنامهنویسی با GPT-4 Turbo قابل مقایسه است."
|
||
},
|
||
"SenseChat-5-beta": {
|
||
"description": "برخی از عملکردها بهتر از SenseCat-5-1202 است"
|
||
},
|
||
"SenseChat-Character": {
|
||
"description": "نسخه استاندارد مدل، طول متن ۸۰۰۰ کاراکتر، سرعت پاسخدهی بالا"
|
||
},
|
||
"SenseChat-Character-Pro": {
|
||
"description": "مدل پیشرفته، طول متن 32K، بهبود کامل قابلیتها، پشتیبانی از مکالمه به زبانهای چینی/انگلیسی"
|
||
},
|
||
"SenseChat-Turbo": {
|
||
"description": "مناسب برای پرسش و پاسخ سریع و تنظیم دقیق مدل"
|
||
},
|
||
"SenseChat-Turbo-1202": {
|
||
"description": "این نسخه جدید مدل سبک است که به بیش از ۹۰٪ تواناییهای مدل کامل دست یافته و هزینه استنتاج را به طور قابل توجهی کاهش میدهد."
|
||
},
|
||
"SenseChat-Vision": {
|
||
"description": "مدل جدیدترین نسخه (V5.5) است که از ورودی چند تصویر پشتیبانی میکند و به طور جامع به بهینهسازی تواناییهای پایه مدل پرداخته و در شناسایی ویژگیهای اشیاء، روابط فضایی، شناسایی رویدادهای حرکتی، درک صحنه، شناسایی احساسات، استدلال منطقی و درک و تولید متن بهبودهای قابل توجهی داشته است."
|
||
},
|
||
"SenseNova-V6-5-Pro": {
|
||
"description": "با بهروزرسانی جامع دادههای چندرسانهای، زبانی و استدلالی و بهینهسازی استراتژیهای آموزش، مدل جدید پیشرفت قابل توجهی در استدلال چندرسانهای و توانایی پیروی از دستورالعملهای تعمیمیافته داشته است. این مدل از پنجره متنی تا ۱۲۸ هزار توکن پشتیبانی میکند و در وظایف تخصصی مانند OCR و شناسایی IP گردشگری و فرهنگی عملکرد برجستهای دارد."
|
||
},
|
||
"SenseNova-V6-5-Turbo": {
|
||
"description": "با بهروزرسانی جامع دادههای چندرسانهای، زبانی و استدلالی و بهینهسازی استراتژیهای آموزش، مدل جدید پیشرفت قابل توجهی در استدلال چندرسانهای و توانایی پیروی از دستورالعملهای تعمیمیافته داشته است. این مدل از پنجره متنی تا ۱۲۸ هزار توکن پشتیبانی میکند و در وظایف تخصصی مانند OCR و شناسایی IP گردشگری و فرهنگی عملکرد برجستهای دارد."
|
||
},
|
||
"SenseNova-V6-Pro": {
|
||
"description": "تحقق یکپارچگی بومی قابلیتهای تصویر، متن و ویدیو، عبور از محدودیتهای سنتی چندمدلی، و کسب دو قهرمانی در ارزیابیهای OpenCompass و SuperCLUE."
|
||
},
|
||
"SenseNova-V6-Reasoner": {
|
||
"description": "توجه به استدلال عمیق بصری و زبانی، تحقق تفکر کند و استدلال عمیق، ارائه فرآیند کامل زنجیره تفکر."
|
||
},
|
||
"SenseNova-V6-Turbo": {
|
||
"description": "تحقق یکپارچگی بومی قابلیتهای تصویر، متن و ویدیو، عبور از محدودیتهای سنتی چندمدلی، پیشی گرفتن در ابعاد اصلی مانند تواناییهای چندمدلی و زبانی، و در چندین ارزیابی در سطح اول داخلی و خارجی قرار گرفتن."
|
||
},
|
||
"Skylark2-lite-8k": {
|
||
"description": "مدل نسل دوم Skylark، مدل Skylark2-lite دارای سرعت پاسخدهی بالایی است و برای سناریوهایی که نیاز به زمان واقعی بالایی دارند و حساس به هزینه هستند و نیاز به دقت مدلی کمتری دارند مناسب است. طول پنجره متنی این مدل 8k است."
|
||
},
|
||
"Skylark2-pro-32k": {
|
||
"description": "مدل نسل دوم Skylark، مدل Skylark2-pro دارای دقت بالای مدلی است و برای سناریوهای پیچیدهتر تولید متن مانند تولید متن تخصصی، نوشتن رمان، ترجمه باکیفیت و غیره مناسب است. طول پنجره متنی این مدل 32k است."
|
||
},
|
||
"Skylark2-pro-4k": {
|
||
"description": "مدل نسل دوم Skylark، مدل Skylark2-pro دارای دقت بالای مدلی است و برای سناریوهای پیچیدهتر تولید متن مانند تولید متن تخصصی، نوشتن رمان، ترجمه باکیفیت و غیره مناسب است. طول پنجره متنی این مدل 4k است."
|
||
},
|
||
"Skylark2-pro-character-4k": {
|
||
"description": "مدل نسل دوم Skylark، مدل Skylark2-pro-character دارای قابلیتهای برجسته بازی نقش و چت است و میتواند بهطور طبیعی طبق خواستههای کاربر مختلف نقشها را ایفا کند. این مدل برای ساخت رباتهای چت، دستیاران مجازی و خدمات مشتری آنلاین مناسب است و دارای سرعت پاسخدهی بالایی است."
|
||
},
|
||
"Skylark2-pro-turbo-8k": {
|
||
"description": "مدل نسل دوم Skylark، مدل Skylark2-pro-turbo-8k دارای استنتاج سریعتر و هزینه کمتر است و طول پنجره متنی آن 8k است."
|
||
},
|
||
"THUDM/GLM-4-32B-0414": {
|
||
"description": "GLM-4-32B-0414 نسل جدید مدلهای متنباز سری GLM است که دارای 320 میلیارد پارامتر است. عملکرد این مدل میتواند با سری GPT OpenAI و سری V3/R1 DeepSeek مقایسه شود."
|
||
},
|
||
"THUDM/GLM-4-9B-0414": {
|
||
"description": "GLM-4-9B-0414 یک مدل کوچک از سری GLM است که دارای 90 میلیارد پارامتر است. این مدل ویژگیهای فنی سری GLM-4-32B را به ارث میبرد، اما گزینههای استقرار سبکتری را ارائه میدهد. با وجود اندازه کوچک، GLM-4-9B-0414 در تولید کد، طراحی وب، تولید گرافیک SVG و نوشتن مبتنی بر جستجو عملکرد فوقالعادهای دارد."
|
||
},
|
||
"THUDM/GLM-4.1V-9B-Thinking": {
|
||
"description": "GLM-4.1V-9B-Thinking یک مدل زبان تصویری متنباز (VLM) است که بهطور مشترک توسط Zhizhu AI و آزمایشگاه KEG دانشگاه تسینگهوا منتشر شده است و بهطور خاص برای پردازش وظایف شناختی چندرسانهای پیچیده طراحی شده است. این مدل بر اساس مدل پایه GLM-4-9B-0414 ساخته شده و با معرفی مکانیزم استدلال «زنجیره تفکر» (Chain-of-Thought) و استفاده از استراتژی یادگیری تقویتی، بهطور قابل توجهی توانایی استدلال چندرسانهای و پایداری آن را بهبود بخشیده است."
|
||
},
|
||
"THUDM/GLM-Z1-32B-0414": {
|
||
"description": "GLM-Z1-32B-0414 یک مدل استدلال با توانایی تفکر عمیق است. این مدل بر اساس GLM-4-32B-0414 از طریق راهاندازی سرد و یادگیری تقویتی توسعه یافته و در وظایف ریاضی، کدنویسی و منطقی آموزش بیشتری دیده است. نسبت به مدل پایه، GLM-Z1-32B-0414 تواناییهای ریاضی و حل مسائل پیچیده را بهطور قابل توجهی افزایش داده است."
|
||
},
|
||
"THUDM/GLM-Z1-9B-0414": {
|
||
"description": "GLM-Z1-9B-0414 یک مدل کوچک از سری GLM است که تنها 90 میلیارد پارامتر دارد، اما در عین حال تواناییهای شگفتانگیزی را در کنار حفظ سنت متنباز نشان میدهد. با وجود اندازه کوچک، این مدل در استدلال ریاضی و وظایف عمومی عملکرد عالی دارد و عملکرد کلی آن در میان مدلهای متنباز با اندازه مشابه در سطح بالایی قرار دارد."
|
||
},
|
||
"THUDM/GLM-Z1-Rumination-32B-0414": {
|
||
"description": "GLM-Z1-Rumination-32B-0414 یک مدل استدلال عمیق با توانایی تفکر است (که با Deep Research OpenAI مقایسه میشود). برخلاف مدلهای تفکر عمیق معمولی، این مدل از تفکر عمیق طولانیمدت برای حل مسائل باز و پیچیده استفاده میکند."
|
||
},
|
||
"THUDM/glm-4-9b-chat": {
|
||
"description": "نسخه منبع باز GLM-4 9B، تجربه گفتگوی بهینهشده برای برنامههای مکالمه را ارائه میدهد."
|
||
},
|
||
"Tongyi-Zhiwen/QwenLong-L1-32B": {
|
||
"description": "QwenLong-L1-32B نخستین مدل بزرگ استدلال با زمینه طولانی است که با یادگیری تقویتی آموزش دیده و به طور خاص برای وظایف استدلال متون طولانی بهینه شده است. این مدل با چارچوب یادگیری تقویتی توسعه تدریجی زمینه، انتقال پایدار از زمینه کوتاه به بلند را محقق ساخته است. در هفت آزمون معیار پرسش و پاسخ اسناد طولانی، QwenLong-L1-32B از مدلهای پیشرو مانند OpenAI-o3-mini و Qwen3-235B-A22B پیشی گرفته و عملکردی مشابه Claude-3.7-Sonnet-Thinking دارد. این مدل در استدلال ریاضی، استدلال منطقی و استدلال چندمرحلهای مهارت ویژهای دارد."
|
||
},
|
||
"Yi-34B-Chat": {
|
||
"description": "Yi-1.5-34B با حفظ تواناییهای زبان عمومی عالی مدلهای قبلی خود، از طریق آموزش افزایشی 500 میلیارد توکن با کیفیت بالا، به طور قابل توجهی تواناییهای منطقی ریاضی و کدنویسی را افزایش داده است."
|
||
},
|
||
"abab5.5-chat": {
|
||
"description": "برای سناریوهای بهرهوری طراحی شده است، از پردازش وظایف پیچیده و تولید متن کارآمد پشتیبانی میکند و برای کاربردهای حرفهای مناسب است."
|
||
},
|
||
"abab5.5s-chat": {
|
||
"description": "طراحی شده برای سناریوهای مکالمه با شخصیتهای چینی، ارائه توانایی تولید مکالمات با کیفیت بالا به زبان چینی، مناسب برای انواع کاربردها."
|
||
},
|
||
"abab6.5g-chat": {
|
||
"description": "طراحی شده برای مکالمات چندزبانه با شخصیتهای مختلف، پشتیبانی از تولید مکالمات با کیفیت بالا به زبان انگلیسی و سایر زبانها."
|
||
},
|
||
"abab6.5s-chat": {
|
||
"description": "مناسب برای طیف گستردهای از وظایف پردازش زبان طبیعی، از جمله تولید متن، سیستمهای گفتگو و غیره."
|
||
},
|
||
"abab6.5t-chat": {
|
||
"description": "بهینهسازی شده برای سناریوهای مکالمه با شخصیتهای چینی، ارائه توانایی تولید مکالمات روان و مطابق با عادات بیانی چینی."
|
||
},
|
||
"accounts/fireworks/models/deepseek-r1": {
|
||
"description": "DeepSeek-R1 یک مدل زبان بزرگ پیشرفته است که با یادگیری تقویتی و بهینهسازی دادههای راهاندازی سرد، عملکرد استدلال، ریاضیات و برنامهنویسی فوقالعادهای دارد."
|
||
},
|
||
"accounts/fireworks/models/deepseek-v3": {
|
||
"description": "مدل زبان قدرتمند Mixture-of-Experts (MoE) ارائه شده توسط Deepseek، با مجموع پارامترها به میزان 671B و فعالسازی 37B پارامتر برای هر نشانه."
|
||
},
|
||
"accounts/fireworks/models/llama-v3-70b-instruct": {
|
||
"description": "مدل Llama 3 70B دستورالعمل، بهطور ویژه برای مکالمات چندزبانه و درک زبان طبیعی بهینهسازی شده است و عملکردی بهتر از اکثر مدلهای رقیب دارد."
|
||
},
|
||
"accounts/fireworks/models/llama-v3-8b-instruct": {
|
||
"description": "مدل Llama 3 8B دستورالعمل، بهینهسازی شده برای مکالمه و وظایف چندزبانه، با عملکرد برجسته و کارآمد."
|
||
},
|
||
"accounts/fireworks/models/llama-v3-8b-instruct-hf": {
|
||
"description": "مدل Llama 3 8B دستورالعمل (نسخه HF)، با نتایج پیادهسازی رسمی سازگار است و از سازگاری بالا و قابلیت همکاری بین پلتفرمی برخوردار است."
|
||
},
|
||
"accounts/fireworks/models/llama-v3p1-405b-instruct": {
|
||
"description": "مدل Llama 3.1 405B دستورالعمل، با پارامترهای بسیار بزرگ، مناسب برای وظایف پیچیده و سناریوهای با بار سنگین در پیروی از دستورالعملها."
|
||
},
|
||
"accounts/fireworks/models/llama-v3p1-70b-instruct": {
|
||
"description": "مدل Llama 3.1 70B دستورالعمل، با توانایی برجسته در درک و تولید زبان طبیعی، انتخابی ایدهآل برای وظایف مکالمه و تحلیل است."
|
||
},
|
||
"accounts/fireworks/models/llama-v3p1-8b-instruct": {
|
||
"description": "مدل Llama 3.1 8B دستورالعمل، بهینهسازی شده برای مکالمات چندزبانه، قادر به پیشی گرفتن از اکثر مدلهای متنباز و بسته در معیارهای صنعتی رایج."
|
||
},
|
||
"accounts/fireworks/models/llama-v3p2-11b-vision-instruct": {
|
||
"description": "مدل استنتاج تصویر با ۱۱ میلیارد پارامتر از Meta که برای دستورالعملها تنظیم شده است. این مدل برای تشخیص بصری، استنتاج تصویر، توصیف تصویر و پاسخ به سوالات عمومی درباره تصاویر بهینهسازی شده است. این مدل قادر به درک دادههای بصری مانند نمودارها و گرافها است و با تولید توضیحات متنی از جزئیات تصاویر، فاصله بین دیداری و زبانی را پر میکند."
|
||
},
|
||
"accounts/fireworks/models/llama-v3p2-3b-instruct": {
|
||
"description": "مدل Llama 3.2 3B دستورالعمل یک مدل چندزبانه سبک است که توسط Meta ارائه شده است. این مدل با هدف بهبود کارایی طراحی شده و در مقایسه با مدلهای بزرگتر، بهبودهای قابل توجهی در تأخیر و هزینه ارائه میدهد. نمونههای کاربردی این مدل شامل بازنویسی پرسشها و دستورات و همچنین کمک به نوشتن است."
|
||
},
|
||
"accounts/fireworks/models/llama-v3p2-90b-vision-instruct": {
|
||
"description": "مدل استنتاج تصویر با 90 میلیارد پارامتر از Meta که برای دستورالعملها تنظیم شده است. این مدل برای تشخیص بصری، استنتاج تصویر، توصیف تصویر و پاسخ به سوالات عمومی در مورد تصاویر بهینهسازی شده است. این مدل قادر است دادههای بصری مانند نمودارها و گرافها را درک کند و با تولید توضیحات متنی از جزئیات تصویر، فاصله بین دیداری و زبانی را پر کند."
|
||
},
|
||
"accounts/fireworks/models/llama-v3p3-70b-instruct": {
|
||
"description": "مدل Llama 3.3 70B Instruct نسخه بهروزرسانی شده Llama 3.1 70B در دسامبر است. این مدل بر اساس Llama 3.1 70B (منتشر شده در ژوئیه 2024) بهبود یافته و قابلیتهای فراخوانی ابزار، پشتیبانی از متن چند زبانه، ریاضیات و برنامهنویسی را تقویت کرده است. این مدل در استدلال، ریاضیات و پیروی از دستورات به سطح پیشرفتهای در صنعت رسیده و میتواند عملکردی مشابه با 3.1 405B ارائه دهد، در حالی که از نظر سرعت و هزینه مزایای قابل توجهی دارد."
|
||
},
|
||
"accounts/fireworks/models/mistral-small-24b-instruct-2501": {
|
||
"description": "مدل 24B با پارامترهایی که قابلیتهای پیشرفتهای مشابه مدلهای بزرگتر را داراست."
|
||
},
|
||
"accounts/fireworks/models/mixtral-8x22b-instruct": {
|
||
"description": "مدل Mixtral MoE 8x22B دستوری، با پارامترهای بزرگ و معماری چندین متخصص، پشتیبانی کامل از پردازش کارآمد وظایف پیچیده."
|
||
},
|
||
"accounts/fireworks/models/mixtral-8x7b-instruct": {
|
||
"description": "مدل Mixtral MoE 8x7B، معماری چندین متخصص برای پیروی و اجرای دستورات بهصورت کارآمد ارائه میدهد."
|
||
},
|
||
"accounts/fireworks/models/mythomax-l2-13b": {
|
||
"description": "مدل MythoMax L2 13B، با استفاده از تکنیکهای ترکیبی نوآورانه، در روایت داستان و نقشآفرینی مهارت دارد."
|
||
},
|
||
"accounts/fireworks/models/phi-3-vision-128k-instruct": {
|
||
"description": "Phi-3-Vision-128K-Instruct یک مدل چندوجهی پیشرفته و سبک است که بر اساس مجموعه دادههایی شامل دادههای مصنوعی و وبسایتهای عمومی فیلتر شده ساخته شده است. این مدل بر دادههای بسیار باکیفیت و متمرکز بر استدلال، که شامل متن و تصویر هستند، تمرکز دارد. این مدل بخشی از سری مدلهای Phi-3 است و نسخه چندوجهی آن از طول زمینه 128K (بر حسب توکن) پشتیبانی میکند. این مدل از یک فرآیند تقویت دقیق عبور کرده است که ترکیبی از تنظیم دقیق تحت نظارت و بهینهسازی مستقیم ترجیحات را شامل میشود تا از پیروی دقیق از دستورات و اقدامات امنیتی قوی اطمینان حاصل شود."
|
||
},
|
||
"accounts/fireworks/models/qwen-qwq-32b-preview": {
|
||
"description": "مدل QwQ یک مدل تحقیقاتی تجربی است که توسط تیم Qwen توسعه یافته و بر تقویت توانایی استدلال AI تمرکز دارد."
|
||
},
|
||
"accounts/fireworks/models/qwen2-vl-72b-instruct": {
|
||
"description": "نسخه 72B مدل Qwen-VL نتیجه جدیدترین بهروزرسانیهای علیبابا است که نمایانگر نوآوریهای نزدیک به یک سال اخیر است."
|
||
},
|
||
"accounts/fireworks/models/qwen2p5-72b-instruct": {
|
||
"description": "Qwen2.5 مجموعهای از مدلهای زبانی است که تنها شامل رمزگشاها میباشد و توسط تیم Qwen علیبابا کلود توسعه یافته است. این مدلها در اندازههای مختلف از جمله 0.5B، 1.5B، 3B، 7B، 14B، 32B و 72B ارائه میشوند و دارای دو نوع پایه (base) و دستوری (instruct) هستند."
|
||
},
|
||
"accounts/fireworks/models/qwen2p5-coder-32b-instruct": {
|
||
"description": "Qwen2.5 Coder 32B Instruct جدیدترین نسخه از سری مدلهای زبانی بزرگ خاص کد است که توسط Alibaba Cloud منتشر شده است. این مدل بر اساس Qwen2.5 و با آموزش 5.5 تریلیون توکن، توانایی تولید کد، استدلال و اصلاح را به طور قابل توجهی افزایش داده است. این مدل نه تنها توانایی کدنویسی را تقویت کرده بلکه مزایای ریاضی و عمومی را نیز حفظ کرده است. این مدل پایهای جامعتر برای کاربردهای عملی مانند عاملهای کد فراهم میکند."
|
||
},
|
||
"accounts/yi-01-ai/models/yi-large": {
|
||
"description": "مدل Yi-Large، با توانایی برجسته در پردازش چندزبانه، مناسب برای انواع وظایف تولید و درک زبان."
|
||
},
|
||
"ai21-jamba-1.5-large": {
|
||
"description": "یک مدل چندزبانه با 398 میلیارد پارامتر (94 میلیارد فعال) که پنجره متنی طولانی 256 هزار توکن، فراخوانی توابع، خروجی ساختاریافته و تولید مبتنی بر واقعیت را ارائه میدهد."
|
||
},
|
||
"ai21-jamba-1.5-mini": {
|
||
"description": "یک مدل چندزبانه با 52 میلیارد پارامتر (12 میلیارد فعال) که پنجره متنی طولانی 256K، فراخوانی توابع، خروجی ساختاریافته و تولید مبتنی بر واقعیت را ارائه میدهد."
|
||
},
|
||
"ai21-labs/AI21-Jamba-1.5-Large": {
|
||
"description": "یک مدل چندزبانه با ۳۹۸ میلیارد پارامتر (۹۴ میلیارد فعال) که پنجره زمینه ۲۵۶ هزار توکنی، فراخوانی توابع، خروجی ساختاریافته و تولید مبتنی بر واقعیت را ارائه میدهد."
|
||
},
|
||
"ai21-labs/AI21-Jamba-1.5-Mini": {
|
||
"description": "یک مدل چندزبانه با ۵۲ میلیارد پارامتر (۱۲ میلیارد فعال) که پنجره زمینه ۲۵۶ هزار توکنی، فراخوانی توابع، خروجی ساختاریافته و تولید مبتنی بر واقعیت را ارائه میدهد."
|
||
},
|
||
"alibaba/qwen-3-14b": {
|
||
"description": "Qwen3 جدیدترین نسل از مدلهای زبان بزرگ در سری Qwen است که مجموعهای جامع از مدلهای متراکم و متخصص ترکیبی (MoE) را ارائه میدهد. بر اساس آموزش گسترده ساخته شده، Qwen3 پیشرفتهای چشمگیری در استدلال، پیروی از دستورالعملها، تواناییهای نمایندگی و پشتیبانی چندزبانه ارائه میدهد."
|
||
},
|
||
"alibaba/qwen-3-235b": {
|
||
"description": "Qwen3 جدیدترین نسل از مدلهای زبان بزرگ در سری Qwen است که مجموعهای جامع از مدلهای متراکم و متخصص ترکیبی (MoE) را ارائه میدهد. بر اساس آموزش گسترده ساخته شده، Qwen3 پیشرفتهای چشمگیری در استدلال، پیروی از دستورالعملها، تواناییهای نمایندگی و پشتیبانی چندزبانه ارائه میدهد."
|
||
},
|
||
"alibaba/qwen-3-30b": {
|
||
"description": "Qwen3 جدیدترین نسل از مدلهای زبان بزرگ در سری Qwen است که مجموعهای جامع از مدلهای متراکم و متخصص ترکیبی (MoE) را ارائه میدهد. بر اساس آموزش گسترده ساخته شده، Qwen3 پیشرفتهای چشمگیری در استدلال، پیروی از دستورالعملها، تواناییهای نمایندگی و پشتیبانی چندزبانه ارائه میدهد."
|
||
},
|
||
"alibaba/qwen-3-32b": {
|
||
"description": "Qwen3 جدیدترین نسل از مدلهای زبان بزرگ در سری Qwen است که مجموعهای جامع از مدلهای متراکم و متخصص ترکیبی (MoE) را ارائه میدهد. بر اساس آموزش گسترده ساخته شده، Qwen3 پیشرفتهای چشمگیری در استدلال، پیروی از دستورالعملها، تواناییهای نمایندگی و پشتیبانی چندزبانه ارائه میدهد."
|
||
},
|
||
"alibaba/qwen3-coder": {
|
||
"description": "Qwen3-Coder-480B-A35B-Instruct مدل کدگذاری با بالاترین توان نمایندگی در Qwen است که در کدنویسی نمایندگی، استفاده از مرورگر نمایندگی و سایر وظایف پایه کدنویسی عملکرد قابل توجهی دارد و نتایجی معادل Claude Sonnet ارائه میدهد."
|
||
},
|
||
"amazon/nova-lite": {
|
||
"description": "یک مدل چندرسانهای بسیار کمهزینه که سرعت بسیار بالایی در پردازش ورودیهای تصویر، ویدئو و متن دارد."
|
||
},
|
||
"amazon/nova-micro": {
|
||
"description": "یک مدل فقط متنی که با هزینه بسیار پایین پاسخهایی با کمترین تأخیر ارائه میدهد."
|
||
},
|
||
"amazon/nova-pro": {
|
||
"description": "یک مدل چندرسانهای بسیار توانمند با ترکیب بهینه دقت، سرعت و هزینه که برای طیف گستردهای از وظایف مناسب است."
|
||
},
|
||
"amazon/titan-embed-text-v2": {
|
||
"description": "Amazon Titan Text Embeddings V2 یک مدل جاسازی چندزبانه سبک و کارآمد است که از ابعاد 1024، 512 و 256 پشتیبانی میکند."
|
||
},
|
||
"anthropic.claude-3-5-sonnet-20240620-v1:0": {
|
||
"description": "Claude 3.5 Sonnet استانداردهای صنعت را ارتقا داده است، عملکردی بهتر از مدلهای رقیب و Claude 3 Opus دارد، در ارزیابیهای گسترده به خوبی عمل کرده و در عین حال سرعت و هزینه مدلهای سطح متوسط ما را حفظ میکند."
|
||
},
|
||
"anthropic.claude-3-5-sonnet-20241022-v2:0": {
|
||
"description": "Claude 3.5 Sonnet استانداردهای صنعت را ارتقا داده است، عملکردی بهتر از مدلهای رقیب و Claude 3 Opus دارد، در ارزیابیهای گسترده به خوبی عمل کرده و در عین حال سرعت و هزینه مدلهای سطح متوسط ما را حفظ میکند."
|
||
},
|
||
"anthropic.claude-3-haiku-20240307-v1:0": {
|
||
"description": "Claude 3 Haiku سریعترین و فشردهترین مدل Anthropic است که پاسخهای تقریباً فوری ارائه میدهد. این مدل میتواند به سرعت به پرسشها و درخواستهای ساده پاسخ دهد. مشتریان قادر خواهند بود تجربههای هوش مصنوعی یکپارچهای را که تعاملات انسانی را تقلید میکند، ایجاد کنند. Claude 3 Haiku میتواند تصاویر را پردازش کرده و خروجی متنی ارائه دهد و دارای پنجره متنی 200K است."
|
||
},
|
||
"anthropic.claude-3-opus-20240229-v1:0": {
|
||
"description": "Claude 3 Opus قدرتمندترین مدل هوش مصنوعی Anthropic است که عملکرد پیشرفتهای در وظایف بسیار پیچیده دارد. این مدل میتواند با درخواستهای باز و سناریوهای ناآشنا کار کند و دارای روانی و درک شبهانسانی برجستهای است. Claude 3 Opus مرزهای جدیدی از امکانات هوش مصنوعی مولد را به نمایش میگذارد. Claude 3 Opus میتواند تصاویر را پردازش کرده و خروجی متنی ارائه دهد و دارای پنجره متنی 200K است."
|
||
},
|
||
"anthropic.claude-3-sonnet-20240229-v1:0": {
|
||
"description": "Claude 3 Sonnet از Anthropic به تعادلی ایدهآل بین هوش و سرعت دست یافته است—بهویژه برای بارهای کاری سازمانی مناسب است. این مدل با قیمتی کمتر از رقبا، بیشترین بهرهوری را ارائه میدهد و بهعنوان یک ماشین اصلی قابل اعتماد و با دوام بالا طراحی شده است که برای استقرارهای مقیاسپذیر AI مناسب است. Claude 3 Sonnet میتواند تصاویر را پردازش کرده و خروجی متنی ارائه دهد و دارای پنجره متنی 200K است."
|
||
},
|
||
"anthropic.claude-instant-v1": {
|
||
"description": "مدلی سریع، اقتصادی و همچنان بسیار توانمند که میتواند طیف وسیعی از وظایف از جمله مکالمات روزمره، تحلیل متن، خلاصهسازی و پاسخ به سوالات اسناد را انجام دهد."
|
||
},
|
||
"anthropic.claude-v2": {
|
||
"description": "Anthropic مدلی است که در انجام وظایف گستردهای از مکالمات پیچیده و تولید محتوای خلاقانه تا پیروی دقیق از دستورات، توانایی بالایی از خود نشان میدهد."
|
||
},
|
||
"anthropic.claude-v2:1": {
|
||
"description": "نسخه بهروزرسانی شده Claude 2، با دو برابر پنجره متنی و بهبود در قابلیت اطمینان، کاهش توهمات و دقت مبتنی بر شواهد در اسناد طولانی و زمینههای RAG."
|
||
},
|
||
"anthropic/claude-3-haiku": {
|
||
"description": "Claude 3 Haiku سریعترین مدل Anthropic تا به امروز است که برای بارهای کاری شرکتی که معمولاً شامل ورودیهای طولانی است طراحی شده است. Haiku میتواند حجم زیادی از اسناد مانند گزارشهای فصلی، قراردادها یا پروندههای حقوقی را به سرعت تحلیل کند و هزینه آن نصف مدلهای همرده خود است."
|
||
},
|
||
"anthropic/claude-3-opus": {
|
||
"description": "Claude 3 Opus هوشمندترین مدل Anthropic است که در وظایف بسیار پیچیده عملکرد پیشرو در بازار دارد. این مدل میتواند با روانی و درک انسانی برجسته، ورودیهای باز و سناریوهای ناآشنا را مدیریت کند."
|
||
},
|
||
"anthropic/claude-3.5-haiku": {
|
||
"description": "Claude 3.5 Haiku دارای قابلیتهای پیشرفته در سرعت، دقت کدنویسی و استفاده از ابزارها است. مناسب برای سناریوهایی با نیاز بالا به سرعت و تعامل با ابزارها."
|
||
},
|
||
"anthropic/claude-3.5-sonnet": {
|
||
"description": "Claude 3.5 Sonnet یک مدل سریع و کارآمد از خانواده Sonnet است که عملکرد بهتری در کدنویسی و استدلال ارائه میدهد. برخی نسخهها به تدریج با Sonnet 3.7 و مدلهای مشابه جایگزین خواهند شد."
|
||
},
|
||
"anthropic/claude-3.7-sonnet": {
|
||
"description": "Claude 3.7 Sonnet نسخه ارتقاءیافتهای از سری Sonnet است که تواناییهای استدلال و کدنویسی قویتری دارد و برای وظایف پیچیده در سطح سازمانی مناسب است."
|
||
},
|
||
"anthropic/claude-haiku-4.5": {
|
||
"description": "Claude Haiku 4.5 یک مدل سریع و با عملکرد بالا از Anthropic است که با حفظ دقت بالا، تأخیر بسیار کمی دارد."
|
||
},
|
||
"anthropic/claude-opus-4": {
|
||
"description": "Opus 4 مدل پرچمدار Anthropic است که برای وظایف پیچیده و کاربردهای سازمانی طراحی شده است."
|
||
},
|
||
"anthropic/claude-opus-4.1": {
|
||
"description": "Opus 4.1 یک مدل پیشرفته از Anthropic است که برای برنامهنویسی، استدلال پیچیده و وظایف مداوم بهینهسازی شده است."
|
||
},
|
||
"anthropic/claude-opus-4.5": {
|
||
"description": "Claude Opus 4.5 مدل پرچمدار شرکت Anthropic است که هوش برجسته را با عملکرد مقیاسپذیر ترکیب میکند و برای انجام وظایف پیچیدهای که نیازمند پاسخهای با بالاترین کیفیت و توانایی استدلال هستند، مناسب است."
|
||
},
|
||
"anthropic/claude-sonnet-4": {
|
||
"description": "Claude Sonnet 4 نسخهای با قابلیت استدلال ترکیبی از Anthropic است که تواناییهای فکری و غیر فکری را با هم ترکیب میکند."
|
||
},
|
||
"anthropic/claude-sonnet-4.5": {
|
||
"description": "Claude Sonnet 4.5 جدیدترین مدل استدلال ترکیبی از Anthropic است که برای استدلال پیچیده و کدنویسی بهینه شده است."
|
||
},
|
||
"ascend-tribe/pangu-pro-moe": {
|
||
"description": "Pangu-Pro-MoE 72B-A16B یک مدل زبان بزرگ پراکنده با 72 میلیارد پارامتر و 16 میلیارد پارامتر فعال است که بر اساس معماری متخصصان ترکیبی گروهبندی شده (MoGE) ساخته شده است. در مرحله انتخاب متخصص، متخصصان به گروههایی تقسیم میشوند و توکنها در هر گروه به تعداد مساوی متخصصان فعال میشوند تا تعادل بار متخصصان حفظ شود، که به طور قابل توجهی کارایی استقرار مدل را در پلتفرم Ascend افزایش میدهد."
|
||
},
|
||
"aya": {
|
||
"description": "Aya 23 یک مدل چندزبانه است که توسط Cohere ارائه شده و از 23 زبان پشتیبانی میکند و برای برنامههای چندزبانه تسهیلات فراهم میآورد."
|
||
},
|
||
"aya:35b": {
|
||
"description": "Aya 23 یک مدل چندزبانه است که توسط Cohere ارائه شده و از 23 زبان پشتیبانی میکند و استفاده از برنامههای چندزبانه را تسهیل مینماید."
|
||
},
|
||
"azure-DeepSeek-R1-0528": {
|
||
"description": "ارائه شده توسط مایکروسافت؛ مدل DeepSeek R1 بهروزرسانیهای جزئی دریافت کرده است و نسخه فعلی آن DeepSeek-R1-0528 میباشد. در آخرین بهروزرسانی، DeepSeek R1 با افزایش منابع محاسباتی و معرفی مکانیزم بهینهسازی الگوریتم در مرحله پسآموزش، عمق استنتاج و توانایی پیشبینی را به طور قابل توجهی بهبود بخشیده است. این مدل در آزمونهای معیار مختلفی مانند ریاضیات، برنامهنویسی و منطق عمومی عملکرد برجستهای دارد و عملکرد کلی آن به مدلهای پیشرو مانند O3 و Gemini 2.5 Pro نزدیک شده است."
|
||
},
|
||
"baichuan-m2-32b": {
|
||
"description": "Baichuan M2 32B یک مدل متخصص ترکیبی است که توسط Baichuan Intelligence ارائه شده و دارای توانایی استدلالی قدرتمندی میباشد."
|
||
},
|
||
"baichuan/baichuan2-13b-chat": {
|
||
"description": "Baichuan-13B یک مدل زبان بزرگ متن باز و قابل تجاری با 130 میلیارد پارامتر است که در آزمونهای معتبر چینی و انگلیسی بهترین عملکرد را در اندازه مشابه به دست آورده است."
|
||
},
|
||
"baidu/ERNIE-4.5-300B-A47B": {
|
||
"description": "ERNIE-4.5-300B-A47B یک مدل زبان بزرگ مبتنی بر معماری متخصصان ترکیبی (MoE) است که توسط شرکت بایدو توسعه یافته است. این مدل دارای 300 میلیارد پارامتر کل است، اما در زمان استنتاج تنها 47 میلیارد پارامتر برای هر توکن فعال میشود، که ضمن حفظ عملکرد قدرتمند، کارایی محاسباتی را نیز تضمین میکند. به عنوان یکی از مدلهای اصلی سری ERNIE 4.5، این مدل در وظایف درک متن، تولید، استدلال و برنامهنویسی عملکرد برجستهای دارد. این مدل از یک روش پیشآموزش نوآورانه چندرسانهای ناهمگن MoE استفاده میکند که با آموزش مشترک متن و مدیا تصویری، توانایی کلی مدل را بهبود میبخشد، بهویژه در زمینه پیروی از دستورالعملها و حافظه دانش جهانی."
|
||
},
|
||
"baidu/ernie-5.0-thinking-preview": {
|
||
"description": "پیشنمایش ERNIE 5.0 Thinking مدل چندوجهی نسل جدید Baidu است که در درک چندوجهی، پیروی از دستورات، تولید محتوا، پرسش و پاسخ واقعی و استفاده از ابزارها تخصص دارد."
|
||
},
|
||
"c4ai-aya-expanse-32b": {
|
||
"description": "Aya Expanse یک مدل چندزبانه با عملکرد بالا و 32B است که با هدف به چالش کشیدن عملکرد مدلهای تکزبانه از طریق بهینهسازی دستور، آربیتراژ دادهها، آموزش ترجیحات و نوآوری در ادغام مدلها طراحی شده است. این مدل از 23 زبان پشتیبانی میکند."
|
||
},
|
||
"c4ai-aya-expanse-8b": {
|
||
"description": "Aya Expanse یک مدل چندزبانه با عملکرد بالا و 8B است که با هدف به چالش کشیدن عملکرد مدلهای تکزبانه از طریق بهینهسازی دستور، آربیتراژ دادهها، آموزش ترجیحات و نوآوری در ادغام مدلها طراحی شده است. این مدل از 23 زبان پشتیبانی میکند."
|
||
},
|
||
"c4ai-aya-vision-32b": {
|
||
"description": "Aya Vision یک مدل چندرسانهای پیشرفته است که در چندین معیار کلیدی در زمینه زبان، متن و تصویر عملکرد فوقالعادهای دارد. این نسخه با 320 میلیارد پارامتر بر روی عملکرد چندزبانه پیشرفته تمرکز دارد."
|
||
},
|
||
"c4ai-aya-vision-8b": {
|
||
"description": "Aya Vision یک مدل چندرسانهای پیشرفته است که در چندین معیار کلیدی در زمینه زبان، متن و تصویر عملکرد فوقالعادهای دارد. این نسخه با 80 میلیارد پارامتر بر روی تأخیر کم و بهترین عملکرد تمرکز دارد."
|
||
},
|
||
"charglm-3": {
|
||
"description": "CharGLM-3 بهطور ویژه برای نقشآفرینی و همراهی عاطفی طراحی شده است، از حافظه طولانیمدت و مکالمات شخصیسازیشده پشتیبانی میکند و کاربردهای گستردهای دارد."
|
||
},
|
||
"charglm-4": {
|
||
"description": "CharGLM-4 بهطور خاص برای نقشآفرینی و همراهی عاطفی طراحی شده است و از حافظه چند دور طولانی و گفتگوی شخصیسازی شده پشتیبانی میکند و کاربردهای گستردهای دارد."
|
||
},
|
||
"chatgpt-4o-latest": {
|
||
"description": "ChatGPT-4o یک مدل پویا است که بهصورت زنده بهروزرسانی میشود تا همیشه نسخهی جدید و بهروز باشد. این مدل ترکیبی از تواناییهای قوی در درک و تولید زبان است و برای کاربردهای گسترده مانند خدمات مشتری، آموزش و پشتیبانی فنی مناسب است."
|
||
},
|
||
"claude-2.0": {
|
||
"description": "Claude 2 پیشرفتهای کلیدی را برای کسبوکارها ارائه میدهد، از جمله زمینه 200K توکن پیشرو در صنعت، کاهش قابل توجه نرخ خطاهای مدل، اعلانهای سیستمی و یک ویژگی جدید آزمایشی: فراخوانی ابزار."
|
||
},
|
||
"claude-2.1": {
|
||
"description": "Claude 2 پیشرفتهای کلیدی را برای کسبوکارها فراهم میکند، از جمله زمینه 200K توکن پیشرو در صنعت، کاهش قابل توجه در نرخ توهم مدل، اعلانهای سیستمی و یک ویژگی آزمایشی جدید: فراخوانی ابزار."
|
||
},
|
||
"claude-3-5-haiku-20241022": {
|
||
"description": "Claude 3.5 Haiku سریعترین مدل نسل بعدی Anthropic است. در مقایسه با Claude 3 Haiku، Claude 3.5 Haiku در تمام مهارتها بهبود یافته و در بسیاری از آزمونهای استاندارد هوش، از بزرگترین مدل نسل قبلی یعنی Claude 3 Opus پیشی گرفته است."
|
||
},
|
||
"claude-3-5-haiku-latest": {
|
||
"description": "Claude 3.5 Haiku پاسخهای سریع ارائه میدهد و برای وظایف سبک مناسب است."
|
||
},
|
||
"claude-3-7-sonnet-20250219": {
|
||
"description": "Claude 3.7 Sonnet تواناییهایی فراتر از Opus ارائه میدهد و سرعتی سریعتر از Sonnet دارد، در حالی که قیمت آن با Sonnet یکسان است. Sonnet بهویژه در برنامهنویسی، علم داده، پردازش بصری و وظایف نمایندگی مهارت دارد."
|
||
},
|
||
"claude-3-7-sonnet-latest": {
|
||
"description": "Claude 3.7 Sonnet جدیدترین و قدرتمندترین مدل Anthropic برای پردازش وظایف بسیار پیچیده است. این مدل در عملکرد، هوش، روانی و درک برتری دارد."
|
||
},
|
||
"claude-3-haiku-20240307": {
|
||
"description": "Claude 3 Haiku سریعترین و فشردهترین مدل Anthropic است که برای ارائه پاسخهای تقریباً فوری طراحی شده است. این مدل دارای عملکرد سریع و دقیق جهتگیری است."
|
||
},
|
||
"claude-3-opus-20240229": {
|
||
"description": "Claude 3 Opus قدرتمندترین مدل Anthropic برای انجام وظایف بسیار پیچیده است. این مدل در عملکرد، هوش، روانی و درک عالی عمل میکند."
|
||
},
|
||
"claude-3-sonnet-20240229": {
|
||
"description": "Claude 3 Sonnet تعادلی ایدهآل بین هوش و سرعت برای بارهای کاری سازمانی فراهم میکند. این محصول با قیمتی پایینتر حداکثر بهرهوری را ارائه میدهد، قابل اعتماد است و برای استقرار در مقیاس بزرگ مناسب میباشد."
|
||
},
|
||
"claude-haiku-4-5-20251001": {
|
||
"description": "Claude Haiku 4.5 سریعترین و هوشمندترین مدل Haiku از Anthropic است که با سرعتی برقآسا و توانایی تفکر گسترشیافته ارائه میشود."
|
||
},
|
||
"claude-opus-4-1-20250805": {
|
||
"description": "Claude Opus 4.1 جدیدترین و قدرتمندترین مدل Anthropic برای انجام وظایف بسیار پیچیده است. این مدل در عملکرد، هوشمندی، روانی و درک توانایی برجستهای دارد."
|
||
},
|
||
"claude-opus-4-1-20250805-thinking": {
|
||
"description": "مدل تفکر Claude Opus 4.1 نسخه پیشرفتهای است که میتواند فرآیند استدلال خود را نمایش دهد."
|
||
},
|
||
"claude-opus-4-20250514": {
|
||
"description": "Claude Opus 4 قدرتمندترین مدل Anthropic برای پردازش وظایف بسیار پیچیده است. این مدل در زمینههای عملکرد، هوش، روانی و درک فوقالعاده عمل میکند."
|
||
},
|
||
"claude-opus-4-5-20251101": {
|
||
"description": "Claude Opus 4.5 مدل پرچمدار شرکت Anthropic است که هوش برجسته را با عملکرد مقیاسپذیر ترکیب میکند و برای انجام وظایف پیچیدهای که نیازمند پاسخهای با بالاترین کیفیت و توانایی استدلال هستند، مناسب است."
|
||
},
|
||
"claude-sonnet-4-20250514": {
|
||
"description": "Claude Sonnet 4 میتواند پاسخهای تقریباً فوری یا تفکر گام به گام طولانیمدت تولید کند که کاربران میتوانند این فرآیندها را به وضوح مشاهده کنند."
|
||
},
|
||
"claude-sonnet-4-20250514-thinking": {
|
||
"description": "مدل تفکر Claude Sonnet 4 میتواند پاسخهای تقریباً فوری یا تفکر گام به گام طولانیمدت تولید کند که کاربران میتوانند این فرآیندها را به وضوح مشاهده کنند."
|
||
},
|
||
"claude-sonnet-4-5-20250929": {
|
||
"description": "کلود سونت ۴.۵ هوشمندترین مدل تا به امروز شرکت Anthropic است."
|
||
},
|
||
"codegeex-4": {
|
||
"description": "CodeGeeX-4 یک دستیار برنامهنویسی قدرتمند مبتنی بر هوش مصنوعی است که از پرسش و پاسخ هوشمند و تکمیل کد در زبانهای برنامهنویسی مختلف پشتیبانی میکند و بهرهوری توسعه را افزایش میدهد."
|
||
},
|
||
"codegeex4-all-9b": {
|
||
"description": "CodeGeeX4-ALL-9B یک مدل تولید کد چندزبانگی است که از قابلیتهای جامع شامل تکمیل و تولید کد، مفسر کد، جستجوی وب، تماس با توابع و پرسش و پاسخ کد در سطح مخزن پشتیبانی میکند و تمام سناریوهای توسعه نرمافزار را پوشش میدهد. این مدل یکی از بهترین مدلهای تولید کد با پارامترهای کمتر از 10B است."
|
||
},
|
||
"codegemma": {
|
||
"description": "CodeGemma یک مدل زبانی سبک برای وظایف مختلف برنامهنویسی است که از تکرار سریع و یکپارچهسازی پشتیبانی میکند."
|
||
},
|
||
"codegemma:2b": {
|
||
"description": "CodeGemma یک مدل زبان سبک برای وظایف مختلف برنامهنویسی است که از تکرار سریع و یکپارچهسازی پشتیبانی میکند."
|
||
},
|
||
"codellama": {
|
||
"description": "Code Llama یک مدل زبانی بزرگ (LLM) است که بر تولید و بحث در مورد کد تمرکز دارد و از زبانهای برنامهنویسی گستردهای پشتیبانی میکند و برای محیطهای توسعهدهندگان مناسب است."
|
||
},
|
||
"codellama/CodeLlama-34b-Instruct-hf": {
|
||
"description": "Code Llama یک LLM است که بر تولید و بحث کد تمرکز دارد و از پشتیبانی گسترده زبانهای برنامهنویسی برخوردار است و برای محیطهای توسعهدهنده مناسب است."
|
||
},
|
||
"codellama:13b": {
|
||
"description": "Code Llama یک مدل زبانی بزرگ (LLM) است که بر تولید و بحث در مورد کد تمرکز دارد و از زبانهای برنامهنویسی گستردهای پشتیبانی میکند و برای محیطهای توسعهدهندگان مناسب است."
|
||
},
|
||
"codellama:34b": {
|
||
"description": "Code Llama یک مدل زبانی بزرگ (LLM) است که بر تولید و بحث در مورد کد تمرکز دارد و از زبانهای برنامهنویسی گستردهای پشتیبانی میکند و برای محیطهای توسعهدهندگان مناسب است."
|
||
},
|
||
"codellama:70b": {
|
||
"description": "Code Llama یک مدل زبانی بزرگ (LLM) است که بر تولید و بحث در مورد کد تمرکز دارد و با پشتیبانی گسترده از زبانهای برنامهنویسی، برای محیطهای توسعهدهندگان مناسب است."
|
||
},
|
||
"codeqwen": {
|
||
"description": "CodeQwen1.5 یک مدل زبان بزرگ است که بر اساس حجم زیادی از دادههای کد آموزش دیده و بهطور خاص برای حل وظایف پیچیده برنامهنویسی طراحی شده است."
|
||
},
|
||
"codestral": {
|
||
"description": "Codestral اولین مدل کد از Mistral AI است که پشتیبانی عالی برای وظایف تولید کد ارائه میدهد."
|
||
},
|
||
"codestral-latest": {
|
||
"description": "Codestral یک مدل پیشرفته تولید کد است که بر تولید کد تمرکز دارد و برای وظایف تکمیل کد و پر کردن میانمتن بهینهسازی شده است."
|
||
},
|
||
"codex-mini-latest": {
|
||
"description": "codex-mini-latest نسخهای تنظیمشده از o4-mini است که بهطور خاص برای Codex CLI طراحی شده است. برای استفاده مستقیم از طریق API، ما توصیه میکنیم از gpt-4.1 شروع کنید."
|
||
},
|
||
"cogito-2.1:671b": {
|
||
"description": "Cogito v2.1 671B یک مدل زبان بزرگ متنباز آمریکایی با قابلیت استفاده تجاری رایگان است که با عملکردی در سطح مدلهای برتر، بازدهی بالای استدلال توکن، پشتیبانی از 128k زمینه طولانی و تواناییهای جامع قوی شناخته میشود."
|
||
},
|
||
"cogview-4": {
|
||
"description": "CogView-4 نخستین مدل متن به تصویر متنباز Zhizhu است که از تولید حروف چینی پشتیبانی میکند. این مدل در درک معنایی، کیفیت تولید تصویر و توانایی تولید متون چینی و انگلیسی به طور جامع بهبود یافته است، از ورودی دوزبانه چینی و انگلیسی با طول دلخواه پشتیبانی میکند و قادر است تصاویر با هر وضوحی در محدوده داده شده تولید کند."
|
||
},
|
||
"cohere-command-r": {
|
||
"description": "Command R یک مدل تولیدی قابل گسترش است که برای RAG و استفاده از ابزارها طراحی شده است و به شرکتها امکان میدهد تا به هوش مصنوعی در سطح تولید دست یابند."
|
||
},
|
||
"cohere-command-r-plus": {
|
||
"description": "Command R+ یک مدل پیشرفته بهینهسازی RAG است که برای مدیریت بارهای کاری در سطح سازمانی طراحی شده است."
|
||
},
|
||
"cohere/Cohere-command-r": {
|
||
"description": "Command R یک مدل تولیدی مقیاسپذیر است که برای استفاده در RAG و ابزارها طراحی شده است تا به کسبوکارها امکان پیادهسازی هوش مصنوعی در سطح تولید را بدهد."
|
||
},
|
||
"cohere/Cohere-command-r-plus": {
|
||
"description": "Command R+ یک مدل بهینهسازی شده پیشرفته برای RAG است که برای بارهای کاری سازمانی طراحی شده است."
|
||
},
|
||
"cohere/command-a": {
|
||
"description": "Command A قویترین مدل Cohere تا به امروز است که در استفاده از ابزارها، نمایندگی، تولید تقویتشده با بازیابی (RAG) و موارد چندزبانه عملکرد برجستهای دارد. طول زمینه Command A برابر با 256K است و با تنها دو GPU اجرا میشود و نسبت به Command R+ 08-2024، توان عملیاتی 150% افزایش یافته است."
|
||
},
|
||
"cohere/command-r": {
|
||
"description": "Command R یک مدل زبان بزرگ بهینهشده برای تعاملات مکالمهای و وظایف با زمینه طولانی است. این مدل در دسته \"قابل مقیاس\" قرار دارد و تعادل بین عملکرد بالا و دقت قوی را برقرار میکند تا شرکتها را قادر سازد از مرحله اثبات مفهوم به تولید برسند."
|
||
},
|
||
"cohere/command-r-plus": {
|
||
"description": "Command R+ جدیدترین مدل زبان بزرگ Cohere است که برای تعاملات مکالمهای و وظایف با زمینه طولانی بهینه شده است. هدف آن ارائه عملکرد بسیار برجسته است تا شرکتها بتوانند از مرحله اثبات مفهوم به تولید برسند."
|
||
},
|
||
"cohere/embed-v4.0": {
|
||
"description": "مدلی که امکان دستهبندی یا تبدیل متن، تصویر یا محتوای ترکیبی به جاسازی را فراهم میکند."
|
||
},
|
||
"comfyui/flux-dev": {
|
||
"description": "FLUX.1 Dev - مدل تولید تصویر از متن با کیفیت بالا، تولید در ۱۰ تا ۵۰ مرحله، مناسب برای خلق آثار هنری و تولید محتوای خلاقانه با کیفیت بالا"
|
||
},
|
||
"comfyui/flux-kontext-dev": {
|
||
"description": "FLUX.1 Kontext-dev - مدل ویرایش تصویر، پشتیبانی از ویرایش تصاویر موجود بر اساس دستورات متنی، شامل ویرایش موضعی و انتقال سبک"
|
||
},
|
||
"comfyui/flux-krea-dev": {
|
||
"description": "FLUX.1 Krea-dev - مدل تولید تصویر از متن با ایمنی تقویتشده، توسعهیافته با همکاری Krea، دارای فیلترهای ایمنی داخلی"
|
||
},
|
||
"comfyui/flux-schnell": {
|
||
"description": "FLUX.1 Schnell - مدل فوقسریع تولید تصویر از متن، تولید تصاویر با کیفیت بالا تنها در ۱ تا ۴ مرحله، مناسب برای کاربردهای بلادرنگ و نمونهسازی سریع"
|
||
},
|
||
"comfyui/stable-diffusion-15": {
|
||
"description": "مدل تولید تصویر از متن Stable Diffusion 1.5، با وضوح کلاسیک ۵۱۲x۵۱۲، مناسب برای نمونهسازی سریع و آزمایشهای خلاقانه"
|
||
},
|
||
"comfyui/stable-diffusion-35": {
|
||
"description": "مدل نسل جدید تولید تصویر از متن Stable Diffusion 3.5، در دو نسخه Large و Medium، نیازمند فایل رمزگذار CLIP خارجی، ارائهدهنده کیفیت تصویر عالی و تطابق دقیق با دستورات متنی"
|
||
},
|
||
"comfyui/stable-diffusion-35-inclclip": {
|
||
"description": "نسخه Stable Diffusion 3.5 با رمزگذار داخلی CLIP/T5، بدون نیاز به فایل رمزگذار خارجی، مناسب برای مدلهایی مانند sd3.5_medium_incl_clips، با مصرف منابع کمتر"
|
||
},
|
||
"comfyui/stable-diffusion-custom": {
|
||
"description": "مدل سفارشی تولید تصویر از متن SD، نام فایل مدل باید custom_sd_lobe.safetensors باشد، در صورت وجود VAE از custom_sd_vae_lobe.safetensors استفاده شود، فایلهای مدل باید طبق دستورالعمل Comfy در پوشه مناسب قرار گیرند"
|
||
},
|
||
"comfyui/stable-diffusion-custom-refiner": {
|
||
"description": "مدل سفارشی SDXL برای تبدیل تصویر به تصویر، نام فایل مدل باید custom_sd_lobe.safetensors باشد، در صورت وجود VAE از custom_sd_vae_lobe.safetensors استفاده شود، فایلهای مدل باید طبق دستورالعمل Comfy در پوشه مناسب قرار گیرند"
|
||
},
|
||
"comfyui/stable-diffusion-refiner": {
|
||
"description": "مدل SDXL برای تبدیل تصویر به تصویر، تبدیل تصاویر ورودی به تصاویر با کیفیت بالا، پشتیبانی از انتقال سبک، ترمیم تصویر و تغییرات خلاقانه"
|
||
},
|
||
"comfyui/stable-diffusion-xl": {
|
||
"description": "مدل تولید تصویر از متن SDXL، پشتیبانی از تولید تصویر با وضوح بالا ۱۰۲۴x۱۰۲۴، ارائه کیفیت تصویر بهتر و جزئیات دقیقتر"
|
||
},
|
||
"command": {
|
||
"description": "یک مدل گفتگوی پیروی از دستور که در وظایف زبانی کیفیت بالاتر و قابلیت اطمینان بیشتری را ارائه میدهد و نسبت به مدلهای تولید پایه ما دارای طول زمینه بیشتری است."
|
||
},
|
||
"command-a-03-2025": {
|
||
"description": "Command A قویترین مدل ما تا به امروز است که در استفاده از ابزارها، نمایندگی، تولید تقویتشده با جستجو (RAG) و سناریوهای چندزبانه عملکرد فوقالعادهای دارد. Command A دارای طول زمینه 256K است و تنها به دو واحد GPU نیاز دارد و نسبت به Command R+ 08-2024، توان عملیاتی آن 150% افزایش یافته است."
|
||
},
|
||
"command-light": {
|
||
"description": "یک نسخه کوچکتر و سریعتر از Command که تقریباً به همان اندازه قوی است اما سریعتر عمل میکند."
|
||
},
|
||
"command-light-nightly": {
|
||
"description": "برای کاهش فاصله زمانی بین انتشار نسخههای اصلی، ما نسخههای شبانه مدل Command را معرفی کردهایم. برای سری command-light، این نسخه به نام command-light-nightly شناخته میشود. لطفاً توجه داشته باشید که command-light-nightly جدیدترین، آزمایشیترین و (احتمالاً) ناپایدارترین نسخه است. نسخههای شبانه بهطور منظم بهروزرسانی میشوند و بدون اطلاع قبلی منتشر میشوند، بنابراین استفاده از آن در محیطهای تولیدی توصیه نمیشود."
|
||
},
|
||
"command-nightly": {
|
||
"description": "برای کاهش فاصله زمانی بین انتشار نسخههای اصلی، ما نسخههای شبانه مدل Command را معرفی کردهایم. برای سری Command، این نسخه به نام command-cightly شناخته میشود. لطفاً توجه داشته باشید که command-nightly جدیدترین، آزمایشیترین و (احتمالاً) ناپایدارترین نسخه است. نسخههای شبانه بهطور منظم بهروزرسانی میشوند و بدون اطلاع قبلی منتشر میشوند، بنابراین استفاده از آن در محیطهای تولیدی توصیه نمیشود."
|
||
},
|
||
"command-r": {
|
||
"description": "Command R یک LLM بهینهسازی شده برای مکالمات و وظایف با متن طولانی است که بهویژه برای تعاملات پویا و مدیریت دانش مناسب است."
|
||
},
|
||
"command-r-03-2024": {
|
||
"description": "Command R یک مدل گفتگوی پیروی از دستور است که در وظایف زبانی کیفیت بالاتری را ارائه میدهد و نسبت به مدلهای قبلی دارای طول زمینه بیشتری است. این مدل میتواند در جریانهای کاری پیچیده مانند تولید کد، تولید تقویتشده با جستجو (RAG)، استفاده از ابزارها و نمایندگی استفاده شود."
|
||
},
|
||
"command-r-08-2024": {
|
||
"description": "command-r-08-2024 نسخه بهروزرسانی شده مدل Command R است که در آگوست 2024 منتشر شد."
|
||
},
|
||
"command-r-plus": {
|
||
"description": "Command R+ یک مدل زبان بزرگ با عملکرد بالا است که برای سناریوهای واقعی کسبوکار و کاربردهای پیچیده طراحی شده است."
|
||
},
|
||
"command-r-plus-04-2024": {
|
||
"description": "Command R+ یک مدل گفتگوی پیروی از دستور است که در وظایف زبانی کیفیت بالاتری را ارائه میدهد و نسبت به مدلهای قبلی دارای طول زمینه بیشتری است. این مدل برای جریانهای کاری پیچیده RAG و استفاده از ابزارهای چند مرحلهای مناسبترین است."
|
||
},
|
||
"command-r-plus-08-2024": {
|
||
"description": "Command R+ یک مدل گفتگوی پیرو دستورات است که در وظایف زبانی کیفیت بالاتری را ارائه میدهد و نسبت به مدلهای قبلی دارای طول متن زمینهای بیشتری است. این مدل برای جریانهای کاری پیچیده RAG و استفاده از ابزارهای چند مرحلهای مناسبترین است."
|
||
},
|
||
"command-r7b-12-2024": {
|
||
"description": "command-r7b-12-2024 یک نسخه کوچک و کارآمد بهروزرسانی شده است که در دسامبر 2024 منتشر شد. این مدل در RAG، استفاده از ابزارها، نمایندگی و سایر وظایفی که نیاز به استدلال پیچیده و پردازش چند مرحلهای دارند، عملکرد فوقالعادهای دارد."
|
||
},
|
||
"computer-use-preview": {
|
||
"description": "مدل computer-use-preview بهطور اختصاصی برای «ابزارهای استفاده از کامپیوتر» طراحی شده و آموزش دیده است تا وظایف مرتبط با کامپیوتر را درک و اجرا کند."
|
||
},
|
||
"dall-e-2": {
|
||
"description": "مدل نسل دوم DALL·E، پشتیبانی از تولید تصاویر واقعیتر و دقیقتر، با وضوح 4 برابر نسل اول."
|
||
},
|
||
"dall-e-3": {
|
||
"description": "جدیدترین مدل DALL·E، منتشر شده در نوامبر 2023. پشتیبانی از تولید تصاویر واقعیتر و دقیقتر، با جزئیات بیشتر."
|
||
},
|
||
"databricks/dbrx-instruct": {
|
||
"description": "DBRX Instruct قابلیت پردازش دستورات با قابلیت اطمینان بالا را فراهم میکند و از کاربردهای چندین صنعت پشتیبانی میکند."
|
||
},
|
||
"deepseek-ai/DeepSeek-OCR": {
|
||
"description": "DeepSeek-OCR یک مدل زبان تصویری از شرکت DeepSeek AI است که بر شناسایی نویسه نوری (OCR) و «فشردهسازی نوری متنی» تمرکز دارد. این مدل با هدف بررسی مرزهای فشردهسازی اطلاعات متنی از تصاویر طراحی شده و میتواند اسناد را بهطور مؤثر پردازش کرده و آنها را به قالبهای متنی ساختاریافته مانند Markdown تبدیل کند. این مدل توانایی شناسایی دقیق محتوای متنی در تصاویر را دارد و برای کاربردهایی مانند دیجیتالیسازی اسناد، استخراج متن و پردازش ساختاریافته بسیار مناسب است."
|
||
},
|
||
"deepseek-ai/DeepSeek-R1": {
|
||
"description": "DeepSeek-R1 یک مدل استنتاجی مبتنی بر یادگیری تقویتی (RL) است که به مشکلات تکرار و خوانایی در مدل پرداخته است. قبل از RL، DeepSeek-R1 دادههای شروع سرد را معرفی کرد و عملکرد استنتاج را بهینهتر کرد. این مدل در وظایف ریاضی، کدنویسی و استنتاج با OpenAI-o1 عملکرد مشابهی دارد و با استفاده از روشهای آموزشی به دقت طراحی شده، کیفیت کلی را بهبود بخشیده است."
|
||
},
|
||
"deepseek-ai/DeepSeek-R1-0528": {
|
||
"description": "DeepSeek R1 با بهرهگیری از منابع محاسباتی افزوده و مکانیزمهای بهینهسازی الگوریتمی در فرایند پسآموزش، عمق توانایی استدلال و استنتاج خود را به طور قابل توجهی افزایش داده است. این مدل در ارزیابیهای معیار مختلف از جمله ریاضیات، برنامهنویسی و منطق عمومی عملکرد برجستهای دارد. عملکرد کلی آن اکنون به مدلهای پیشرو مانند O3 و Gemini 2.5 Pro نزدیک شده است."
|
||
},
|
||
"deepseek-ai/DeepSeek-R1-0528-Qwen3-8B": {
|
||
"description": "DeepSeek-R1-0528-Qwen3-8B مدلی است که از تقطیر زنجیره فکری مدل DeepSeek-R1-0528 به Qwen3 8B Base به دست آمده است. این مدل در میان مدلهای متنباز به عملکرد پیشرفته (SOTA) دست یافته و در آزمون AIME 2024، 10٪ بهتر از Qwen3 8B عمل کرده و به سطح عملکرد Qwen3-235B-thinking رسیده است. این مدل در استدلال ریاضی، برنامهنویسی و منطق عمومی در چندین آزمون معیار عملکرد برجستهای دارد. ساختار آن مشابه Qwen3-8B است اما از پیکربندی توکنایزر DeepSeek-R1-0528 بهره میبرد."
|
||
},
|
||
"deepseek-ai/DeepSeek-R1-Distill-Llama-70B": {
|
||
"description": "مدل تقطیر DeepSeek-R1 که با استفاده از یادگیری تقویتی و دادههای شروع سرد عملکرد استدلال را بهینهسازی کرده و مدلهای متنباز را به روز کرده است."
|
||
},
|
||
"deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B": {
|
||
"description": "مدل تقطیر DeepSeek-R1 که با استفاده از یادگیری تقویتی و دادههای شروع سرد عملکرد استدلال را بهینهسازی کرده و مدلهای متنباز را به روز کرده است."
|
||
},
|
||
"deepseek-ai/DeepSeek-R1-Distill-Qwen-14B": {
|
||
"description": "مدل تقطیر DeepSeek-R1 که با استفاده از یادگیری تقویتی و دادههای شروع سرد عملکرد استدلال را بهینهسازی کرده و مدلهای متنباز را به روز کرده است."
|
||
},
|
||
"deepseek-ai/DeepSeek-R1-Distill-Qwen-32B": {
|
||
"description": "DeepSeek-R1-Distill-Qwen-32B مدلی است که از تقطیر دانش بر اساس Qwen2.5-32B به دست آمده است. این مدل با استفاده از 800000 نمونه منتخب تولید شده توسط DeepSeek-R1 برای تنظیم دقیق، در زمینههای مختلفی از جمله ریاضیات، برنامهنویسی و استدلال عملکرد برجستهای را نشان میدهد. در چندین آزمون معیار از جمله AIME 2024، MATH-500 و GPQA Diamond نتایج عالی کسب کرده است، به طوری که در MATH-500 به دقت 94.3% دست یافته و توانایی استدلال ریاضی قوی را نشان میدهد."
|
||
},
|
||
"deepseek-ai/DeepSeek-R1-Distill-Qwen-7B": {
|
||
"description": "DeepSeek-R1-Distill-Qwen-7B مدلی است که از تقطیر دانش بر اساس Qwen2.5-Math-7B به دست آمده است. این مدل با استفاده از 800000 نمونه منتخب تولید شده توسط DeepSeek-R1 برای تنظیم دقیق، توانایی استدلال عالی را نشان میدهد. در چندین آزمون معیار عملکرد برجستهای داشته است، به طوری که در MATH-500 به دقت 92.8% و در AIME 2024 به نرخ قبولی 55.5% دست یافته و در CodeForces امتیاز 1189 را کسب کرده است و به عنوان مدلی با مقیاس 7B تواناییهای ریاضی و برنامهنویسی قوی را نشان میدهد."
|
||
},
|
||
"deepseek-ai/DeepSeek-V2.5": {
|
||
"description": "DeepSeek V2.5 ویژگیهای برجسته نسخههای قبلی را گرد هم آورده و تواناییهای عمومی و کدنویسی را تقویت کرده است."
|
||
},
|
||
"deepseek-ai/DeepSeek-V3": {
|
||
"description": "DeepSeek-V3 یک مدل زبانی ترکیبی از متخصصان (MoE) با 671 میلیارد پارامتر است که از توجه چندسر (MLA) و معماری DeepSeekMoE استفاده میکند و با ترکیب استراتژی تعادل بار بدون ضرر کمکی، کارایی استنتاج و آموزش را بهینه میکند. با پیشآموزش بر روی 14.8 تریلیون توکن با کیفیت بالا و انجام تنظیم دقیق نظارتی و یادگیری تقویتی، DeepSeek-V3 در عملکرد از سایر مدلهای متنباز پیشی میگیرد و به مدلهای بسته پیشرو نزدیک میشود."
|
||
},
|
||
"deepseek-ai/DeepSeek-V3.1": {
|
||
"description": "مدل DeepSeek V3.1 دارای معماری استنتاج ترکیبی است که از هر دو حالت تفکر و غیرتفکر پشتیبانی میکند."
|
||
},
|
||
"deepseek-ai/DeepSeek-V3.1-Terminus": {
|
||
"description": "DeepSeek-V3.1-Terminus نسخه بهروزرسانی شده مدل V3.1 منتشر شده توسط DeepSeek است که به عنوان یک مدل زبان بزرگ با عامل ترکیبی شناخته میشود. این بهروزرسانی ضمن حفظ قابلیتهای اصلی مدل، بر رفع مشکلات گزارش شده توسط کاربران و افزایش پایداری تمرکز دارد. این نسخه به طور قابل توجهی انسجام زبانی را بهبود بخشیده و از بروز ترکیب زبان چینی و انگلیسی و کاراکترهای نامتعارف کاسته است. مدل شامل حالت «تفکر» (Thinking Mode) و «غیرتفکر» (Non-thinking Mode) است که کاربران میتوانند از طریق قالبهای گفتگو به صورت انعطافپذیر بین آنها جابجا شوند تا با وظایف مختلف سازگار شوند. به عنوان یک بهینهسازی مهم، V3.1-Terminus عملکرد عامل کد (Code Agent) و عامل جستجو (Search Agent) را تقویت کرده است تا در فراخوانی ابزارها و اجرای وظایف پیچیده چندمرحلهای قابل اعتمادتر باشد."
|
||
},
|
||
"deepseek-ai/DeepSeek-V3.2-Exp": {
|
||
"description": "DeepSeek-V3.2-Exp نسخه آزمایشی V3.2 است که توسط DeepSeek منتشر شده و به عنوان گامی میانی در مسیر توسعه معماری نسل بعدی طراحی شده است. این نسخه با افزودن مکانیزم توجه پراکنده DeepSeek (DeepSeek Sparse Attention یا DSA) بر پایه V3.1-Terminus، کارایی آموزش و استنتاج در زمینههای متنی طولانی را بهبود میبخشد. همچنین بهطور ویژه برای فراخوانی ابزارها، درک اسناد بلند و استدلال چندمرحلهای بهینهسازی شده است. V3.2-Exp پلی میان تحقیق و تولید است و برای کاربرانی مناسب است که به دنبال بهرهوری بالاتر در سناریوهایی با بودجه متنی بالا هستند."
|
||
},
|
||
"deepseek-ai/deepseek-llm-67b-chat": {
|
||
"description": "DeepSeek LLM Chat (67B) یک مدل نوآورانه هوش مصنوعی است که توانایی درک عمیق زبان و تعامل را فراهم میکند."
|
||
},
|
||
"deepseek-ai/deepseek-r1": {
|
||
"description": "مدل LLM پیشرفته و کارآمد که در استدلال، ریاضیات و برنامهنویسی مهارت دارد."
|
||
},
|
||
"deepseek-ai/deepseek-v3.1": {
|
||
"description": "DeepSeek V3.1: مدل استنتاج نسل بعدی که تواناییهای استنتاج پیچیده و تفکر زنجیرهای را بهبود بخشیده و برای وظایفی که نیاز به تحلیل عمیق دارند مناسب است."
|
||
},
|
||
"deepseek-ai/deepseek-v3.1-terminus": {
|
||
"description": "DeepSeek V3.1: نسل جدیدی از مدلهای استنتاج که توانایی استدلال پیچیده و تفکر زنجیرهای را بهبود میبخشد، مناسب برای وظایفی که نیاز به تحلیل عمیق دارند."
|
||
},
|
||
"deepseek-ai/deepseek-vl2": {
|
||
"description": "DeepSeek-VL2 یک مدل زبانی بصری مبتنی بر DeepSeekMoE-27B است که از معماری MoE با فعالسازی پراکنده استفاده میکند و در حالی که تنها 4.5 میلیارد پارامتر فعال است، عملکرد فوقالعادهای را ارائه میدهد. این مدل در چندین وظیفه از جمله پرسش و پاسخ بصری، شناسایی کاراکتر نوری، درک اسناد/جدولها/نمودارها و مکانیابی بصری عملکرد عالی دارد."
|
||
},
|
||
"deepseek-chat": {
|
||
"description": "مدل متنباز جدیدی که تواناییهای عمومی و کدنویسی را ترکیب میکند. این مدل نه تنها توانایی گفتگوی عمومی مدل Chat و توانایی قدرتمند پردازش کد مدل Coder را حفظ کرده است، بلکه به ترجیحات انسانی نیز بهتر همسو شده است. علاوه بر این، DeepSeek-V2.5 در وظایف نوشتاری، پیروی از دستورات و سایر جنبهها نیز بهبودهای قابل توجهی داشته است."
|
||
},
|
||
"deepseek-coder-33B-instruct": {
|
||
"description": "DeepSeek Coder 33B یک مدل زبان کد است که بر اساس 20 تریلیون داده آموزش دیده است، که 87% آن کد و 13% آن زبانهای چینی و انگلیسی است. این مدل اندازه پنجره 16K و وظایف پر کردن جا را معرفی میکند و قابلیت تکمیل کد و پر کردن قطعات در سطح پروژه را ارائه میدهد."
|
||
},
|
||
"deepseek-coder-v2": {
|
||
"description": "DeepSeek Coder V2 یک مدل کد نویسی ترکیبی و متنباز است که در وظایف کدنویسی عملکرد عالی دارد و با GPT4-Turbo قابل مقایسه است."
|
||
},
|
||
"deepseek-coder-v2:236b": {
|
||
"description": "DeepSeek Coder V2 یک مدل کد نویسی ترکیبی و متنباز است که در وظایف کدنویسی عملکرد بسیار خوبی دارد و با GPT4-Turbo قابل مقایسه است."
|
||
},
|
||
"deepseek-ocr": {
|
||
"description": "DeepSeek-OCR یک مدل زبان تصویری از DeepSeek AI است که بر شناسایی نویسه نوری (OCR) و «فشردهسازی نوری متنی» تمرکز دارد. این مدل با هدف بررسی مرزهای فشردهسازی اطلاعات متنی از تصاویر طراحی شده و میتواند اسناد را بهطور مؤثر پردازش کرده و به فرمتهای متنی ساختاریافته مانند Markdown تبدیل کند. این مدل توانایی بالایی در شناسایی دقیق محتوای متنی در تصاویر دارد و برای کاربردهایی مانند دیجیتالیسازی اسناد، استخراج متن و پردازش ساختاریافته بسیار مناسب است."
|
||
},
|
||
"deepseek-r1": {
|
||
"description": "DeepSeek-R1 یک مدل استنتاجی مبتنی بر یادگیری تقویتی (RL) است که به مشکلات تکرار و خوانایی در مدل پرداخته است. قبل از RL، DeepSeek-R1 دادههای شروع سرد را معرفی کرد و عملکرد استنتاج را بهینهتر کرد. این مدل در وظایف ریاضی، کدنویسی و استنتاج با OpenAI-o1 عملکرد مشابهی دارد و با استفاده از روشهای آموزشی به دقت طراحی شده، کیفیت کلی را بهبود بخشیده است."
|
||
},
|
||
"deepseek-r1-0528": {
|
||
"description": "مدل کامل 685 میلیارد پارامتری، منتشر شده در ۲۸ مه ۲۰۲۵. DeepSeek-R1 در مرحله پسآموزش به طور گسترده از تکنیکهای یادگیری تقویتی استفاده کرده است و با دادههای برچسبخورده بسیار کم، توانایی استدلال مدل را به طور قابل توجهی افزایش داده است. این مدل در وظایف ریاضی، کدنویسی و استدلال زبان طبیعی عملکرد و توانایی بالایی دارد."
|
||
},
|
||
"deepseek-r1-250528": {
|
||
"description": "DeepSeek R1 250528، نسخه کامل مدل استنتاجی DeepSeek-R1، مناسب برای وظایف دشوار ریاضی و منطقی."
|
||
},
|
||
"deepseek-r1-70b-fast-online": {
|
||
"description": "DeepSeek R1 70B نسخه سریع است که از جستجوی آنلاین زنده پشتیبانی میکند و در عین حفظ عملکرد مدل، سرعت پاسخدهی سریعتری را ارائه میدهد."
|
||
},
|
||
"deepseek-r1-70b-online": {
|
||
"description": "DeepSeek R1 70B نسخه استاندارد است که از جستجوی آنلاین زنده پشتیبانی میکند و برای گفتگوها و وظایف پردازش متنی که به اطلاعات جدید نیاز دارند، مناسب است."
|
||
},
|
||
"deepseek-r1-distill-llama": {
|
||
"description": "deepseek-r1-distill-llama مدلی است که بر اساس Llama از DeepSeek-R1 استخراج شده است."
|
||
},
|
||
"deepseek-r1-distill-llama-70b": {
|
||
"description": "DeepSeek R1 Distill Llama 70B، مدل تقطیر شدهای که توانایی استنتاج R1 را با اکوسیستم Llama ترکیب میکند."
|
||
},
|
||
"deepseek-r1-distill-llama-8b": {
|
||
"description": "DeepSeek-R1-Distill-Llama-8B، یک مدل زبان بزرگ تقطیر شده بر پایه Llama-3.1-8B با استفاده از خروجیهای DeepSeek R1."
|
||
},
|
||
"deepseek-r1-distill-qianfan-70b": {
|
||
"description": "DeepSeek R1 Distill Qianfan 70B، مدل تقطیر شده R1 بر پایه Qianfan-70B با بهرهوری بالا."
|
||
},
|
||
"deepseek-r1-distill-qianfan-8b": {
|
||
"description": "DeepSeek R1 Distill Qianfan 8B، مدل تقطیر شده R1 بر پایه Qianfan-8B، مناسب برای کاربردهای کوچک و متوسط."
|
||
},
|
||
"deepseek-r1-distill-qianfan-llama-70b": {
|
||
"description": "DeepSeek R1 Distill Qianfan Llama 70B، مدل تقطیر شده R1 بر پایه Llama-70B."
|
||
},
|
||
"deepseek-r1-distill-qwen": {
|
||
"description": "deepseek-r1-distill-qwen مدلی است که بر اساس Qwen از DeepSeek-R1 استخراج شده است."
|
||
},
|
||
"deepseek-r1-distill-qwen-1.5b": {
|
||
"description": "DeepSeek R1 Distill Qwen 1.5B، مدل تقطیر شده فوق سبک R1، مناسب برای محیطهای با منابع بسیار محدود."
|
||
},
|
||
"deepseek-r1-distill-qwen-14b": {
|
||
"description": "DeepSeek R1 Distill Qwen 14B، مدل تقطیر شده R1 با مقیاس متوسط، مناسب برای استقرار در سناریوهای مختلف."
|
||
},
|
||
"deepseek-r1-distill-qwen-32b": {
|
||
"description": "DeepSeek R1 Distill Qwen 32B، مدل تقطیر شده R1 بر پایه Qwen-32B، با تعادل بین عملکرد و هزینه."
|
||
},
|
||
"deepseek-r1-distill-qwen-7b": {
|
||
"description": "DeepSeek R1 Distill Qwen 7B، مدل تقطیر شده سبک R1، مناسب برای محیطهای لبهای و خصوصیسازی سازمانی."
|
||
},
|
||
"deepseek-r1-fast-online": {
|
||
"description": "DeepSeek R1 نسخه سریع کامل است که از جستجوی آنلاین زنده پشتیبانی میکند و ترکیبی از تواناییهای قوی 671B پارامتر و سرعت پاسخدهی سریعتر است."
|
||
},
|
||
"deepseek-r1-online": {
|
||
"description": "DeepSeek R1 نسخه کامل است که دارای 671B پارامتر است و از جستجوی آنلاین زنده پشتیبانی میکند و دارای تواناییهای درک و تولید قویتری است."
|
||
},
|
||
"deepseek-reasoner": {
|
||
"description": "حالت تفکر DeepSeek V3.2. قبل از ارائه پاسخ نهایی، مدل ابتدا یک زنجیره فکری را تولید میکند تا دقت پاسخ نهایی را افزایش دهد."
|
||
},
|
||
"deepseek-v2": {
|
||
"description": "DeepSeek V2 یک مدل زبانی Mixture-of-Experts کارآمد است که برای پردازش نیازهای اقتصادی و کارآمد مناسب میباشد."
|
||
},
|
||
"deepseek-v2:236b": {
|
||
"description": "DeepSeek V2 236B مدل طراحی کد DeepSeek است که تواناییهای قدرتمندی در تولید کد ارائه میدهد."
|
||
},
|
||
"deepseek-v3": {
|
||
"description": "DeepSeek-V3 مدل MoE توسعه یافته توسط شرکت تحقیقاتی فناوری هوش مصنوعی DeepSeek در هانگژو است که در چندین ارزیابی عملکرد برجستهای دارد و در لیستهای اصلی در صدر مدلهای متنباز قرار دارد. V3 نسبت به مدل V2.5 سرعت تولید را 3 برابر افزایش داده و تجربه کاربری سریعتر و روانتری را برای کاربران فراهم میکند."
|
||
},
|
||
"deepseek-v3-0324": {
|
||
"description": "DeepSeek-V3-0324 یک مدل MoE با ۶۷۱ میلیارد پارامتر است که در زمینههای برنامهنویسی و تواناییهای فنی، درک زمینه و پردازش متنهای طولانی برتری دارد."
|
||
},
|
||
"deepseek-v3.1": {
|
||
"description": "DeepSeek-V3.1 یک مدل استدلال ترکیبی جدید از DeepSeek است که از دو حالت استدلال تفکری و غیرتفکری پشتیبانی میکند و نسبت به DeepSeek-R1-0528 در حالت تفکری کارایی بالاتری دارد. پس از آموزش تکمیلی، استفاده از ابزارهای Agent و عملکرد وظایف هوشمند به طور قابل توجهی بهبود یافته است. پشتیبانی از پنجره متنی 128k و طول خروجی تا 64k توکن."
|
||
},
|
||
"deepseek-v3.1-terminus": {
|
||
"description": "DeepSeek-V3.1-Terminus نسخهای بهینهسازیشده از مدل زبان بزرگ DeepSeek است که بهطور خاص برای دستگاههای نهایی طراحی شده است."
|
||
},
|
||
"deepseek-v3.1-think-250821": {
|
||
"description": "DeepSeek V3.1 Think 250821، مدل تفکر عمیق نسخه Terminus، مناسب برای سناریوهای استنتاج با عملکرد بالا."
|
||
},
|
||
"deepseek-v3.1:671b": {
|
||
"description": "DeepSeek V3.1: مدل استنتاج نسل بعدی که تواناییهای استنتاج پیچیده و تفکر زنجیرهای را بهبود بخشیده و برای وظایفی که نیاز به تحلیل عمیق دارند مناسب است."
|
||
},
|
||
"deepseek-v3.2-exp": {
|
||
"description": "deepseek-v3.2-exp مکانیزم توجه پراکنده را معرفی میکند که هدف آن افزایش کارایی آموزش و استنتاج در پردازش متون بلند است و قیمت آن کمتر از deepseek-v3.1 میباشد."
|
||
},
|
||
"deepseek-v3.2-think": {
|
||
"description": "DeepSeek V3.2 Think، نسخه کامل مدل تفکر عمیق با توانایی تقویتشده در استنتاج زنجیرهای طولانی."
|
||
},
|
||
"deepseek-vl2": {
|
||
"description": "DeepSeek VL2، مدل چندوجهی با پشتیبانی از درک تصویر و متن و پرسش و پاسخ بصری دقیق."
|
||
},
|
||
"deepseek-vl2-small": {
|
||
"description": "DeepSeek VL2 Small، نسخه سبک چندوجهی، مناسب برای محیطهای با منابع محدود و بارگذاری بالا."
|
||
},
|
||
"deepseek/deepseek-chat": {
|
||
"description": "DeepSeek-V3 یک مدل استدلال ترکیبی با عملکرد بالا از تیم DeepSeek است که برای وظایف پیچیده و یکپارچهسازی ابزارها مناسب است."
|
||
},
|
||
"deepseek/deepseek-chat-v3-0324": {
|
||
"description": "DeepSeek V3 یک مدل ترکیبی متخصص با 685B پارامتر است و جدیدترین نسخه از سری مدلهای چت پرچمدار تیم DeepSeek میباشد.\n\nاین مدل از [DeepSeek V3](/deepseek/deepseek-chat-v3) به ارث برده و در انواع وظایف عملکرد عالی از خود نشان میدهد."
|
||
},
|
||
"deepseek/deepseek-chat-v3-0324:free": {
|
||
"description": "DeepSeek V3 یک مدل ترکیبی متخصص با 685B پارامتر است و جدیدترین نسخه از سری مدلهای چت پرچمدار تیم DeepSeek میباشد.\n\nاین مدل از [DeepSeek V3](/deepseek/deepseek-chat-v3) به ارث برده و در انواع وظایف عملکرد عالی از خود نشان میدهد."
|
||
},
|
||
"deepseek/deepseek-chat-v3.1": {
|
||
"description": "DeepSeek-V3.1 مدل استدلال ترکیبی با زمینه طولانی از DeepSeek است که از حالتهای ترکیبی فکری/غیرفکری و یکپارچهسازی ابزارها پشتیبانی میکند."
|
||
},
|
||
"deepseek/deepseek-r1": {
|
||
"description": "مدل DeepSeek R1 بهروزرسانیهای جزئی دریافت کرده و نسخه فعلی DeepSeek-R1-0528 است. در آخرین بهروزرسانی، DeepSeek R1 با بهرهگیری از منابع محاسباتی افزایشیافته و مکانیزمهای بهینهسازی الگوریتمی پس از آموزش، عمق و توان استدلال خود را به طور قابل توجهی بهبود بخشیده است. این مدل در ارزیابیهای معیار مختلف مانند ریاضیات، برنامهنویسی و منطق عمومی عملکرد برجستهای دارد و عملکرد کلی آن اکنون به مدلهای پیشرو مانند O3 و Gemini 2.5 Pro نزدیک شده است."
|
||
},
|
||
"deepseek/deepseek-r1-0528": {
|
||
"description": "DeepSeek R1 0528 نسخه بهروزشدهای از DeepSeek است که بر متنباز بودن و عمق استدلال تمرکز دارد."
|
||
},
|
||
"deepseek/deepseek-r1-0528:free": {
|
||
"description": "DeepSeek-R1 با داشتن دادههای برچسبخورده بسیار محدود، توانایی استدلال مدل را به طور چشمگیری افزایش داده است. قبل از ارائه پاسخ نهایی، مدل ابتدا یک زنجیره فکری را تولید میکند تا دقت پاسخ نهایی را بهبود بخشد."
|
||
},
|
||
"deepseek/deepseek-r1-distill-llama-70b": {
|
||
"description": "DeepSeek R1 Distill Llama 70B یک مدل زبان بزرگ مبتنی بر Llama3.3 70B است که با استفاده از خروجیهای تنظیمشده DeepSeek R1، به عملکردی رقابتی در سطح مدلهای پیشرفته بزرگ دست یافته است."
|
||
},
|
||
"deepseek/deepseek-r1-distill-llama-8b": {
|
||
"description": "DeepSeek R1 Distill Llama 8B یک مدل زبان بزرگ تقطیر شده مبتنی بر Llama-3.1-8B-Instruct است که با استفاده از خروجی DeepSeek R1 آموزش دیده است."
|
||
},
|
||
"deepseek/deepseek-r1-distill-qwen-14b": {
|
||
"description": "DeepSeek R1 Distill Qwen 14B یک مدل زبان بزرگ تقطیر شده مبتنی بر Qwen 2.5 14B است که با استفاده از خروجی DeepSeek R1 آموزش دیده است. این مدل در چندین آزمون معیار از o1-mini OpenAI پیشی گرفته و به آخرین دستاوردهای فناوری مدلهای متراکم (dense models) دست یافته است. نتایج برخی از آزمونهای معیار به شرح زیر است:\nAIME 2024 pass@1: 69.7\nMATH-500 pass@1: 93.9\nCodeForces Rating: 1481\nاین مدل با تنظیمات خروجی DeepSeek R1، عملکرد رقابتی معادل مدلهای پیشرفته بزرگتر را نشان میدهد."
|
||
},
|
||
"deepseek/deepseek-r1-distill-qwen-32b": {
|
||
"description": "DeepSeek R1 Distill Qwen 32B یک مدل زبان بزرگ تقطیر شده مبتنی بر Qwen 2.5 32B است که با استفاده از خروجی DeepSeek R1 آموزش دیده است. این مدل در چندین آزمون معیار از o1-mini OpenAI پیشی گرفته و به آخرین دستاوردهای فناوری مدلهای متراکم (dense models) دست یافته است. نتایج برخی از آزمونهای معیار به شرح زیر است:\nAIME 2024 pass@1: 72.6\nMATH-500 pass@1: 94.3\nCodeForces Rating: 1691\nاین مدل با تنظیمات خروجی DeepSeek R1، عملکرد رقابتی معادل مدلهای پیشرفته بزرگتر را نشان میدهد."
|
||
},
|
||
"deepseek/deepseek-r1/community": {
|
||
"description": "DeepSeek R1 جدیدترین مدل متن باز منتشر شده توسط تیم DeepSeek است که دارای عملکرد استدلال بسیار قوی است و به ویژه در وظایف ریاضی، برنامهنویسی و استدلال به سطحی معادل مدل o1 OpenAI رسیده است."
|
||
},
|
||
"deepseek/deepseek-r1:free": {
|
||
"description": "DeepSeek-R1 با وجود دادههای برچسبگذاری شده بسیار کم، توانایی استدلال مدل را به طرز چشمگیری افزایش میدهد. قبل از ارائه پاسخ نهایی، مدل ابتدا یک زنجیره تفکر را تولید میکند تا دقت پاسخ نهایی را افزایش دهد."
|
||
},
|
||
"deepseek/deepseek-reasoner": {
|
||
"description": "DeepSeek-V3 Thinking (reasoner) مدل آزمایشی استدلال از DeepSeek است که برای وظایف استدلالی با پیچیدگی بالا مناسب است."
|
||
},
|
||
"deepseek/deepseek-v3": {
|
||
"description": "مدل زبان بزرگ سریع و عمومی با توان استدلال بهبود یافته."
|
||
},
|
||
"deepseek/deepseek-v3.1-base": {
|
||
"description": "DeepSeek V3.1 Base نسخه بهبود یافته مدل DeepSeek V3 است."
|
||
},
|
||
"deepseek/deepseek-v3/community": {
|
||
"description": "DeepSeek-V3 در سرعت استدلال به یک پیشرفت عمده نسبت به مدلهای قبلی دست یافته است. این مدل در بین مدلهای متن باز رتبه اول را دارد و میتواند با پیشرفتهترین مدلهای بسته جهانی رقابت کند. DeepSeek-V3 از معماری توجه چندسر (MLA) و DeepSeekMoE استفاده میکند که این معماریها در DeepSeek-V2 به طور کامل تأیید شدهاند. علاوه بر این، DeepSeek-V3 یک استراتژی کمکی بدون ضرر برای تعادل بار معرفی کرده و اهداف آموزشی پیشبینی چند برچسبی را برای بهبود عملکرد تعیین کرده است."
|
||
},
|
||
"deepseek_r1": {
|
||
"description": "DeepSeek-R1 یک مدل استدلالی است که توسط یادگیری تقویتی (RL) هدایت میشود و مشکلات تکراری و خوانایی را در مدل حل میکند. قبل از RL، DeepSeek-R1 دادههای راهاندازی سرد را معرفی کرد و عملکرد استدلال را بهطور بیشتری بهینهسازی کرد. این مدل در وظایف ریاضی، کدنویسی و استدلال با OpenAI-o1 عملکرد مشابهی دارد و از طریق روشهای آموزشی طراحیشده بهدقت، عملکرد کلی را بهبود بخشیده است."
|
||
},
|
||
"deepseek_r1_distill_llama_70b": {
|
||
"description": "DeepSeek-R1-Distill-Llama-70B مدلی است که بر اساس Llama-3.3-70B-Instruct از طریق آموزش تقطیر بهدست آمده است. این مدل بخشی از سری DeepSeek-R1 است و با استفاده از نمونههای تولید شده توسط DeepSeek-R1 برای بهینهسازی، در چندین حوزه از جمله ریاضی، برنامهنویسی و استدلال عملکرد فوقالعادهای دارد."
|
||
},
|
||
"deepseek_r1_distill_qwen_14b": {
|
||
"description": "DeepSeek-R1-Distill-Qwen-14B مدلی است که بر اساس Qwen2.5-14B از طریق تقطیر دانش بهدست آمده است. این مدل از 800000 نمونه منتخب تولید شده توسط DeepSeek-R1 برای بهینهسازی استفاده میکند و توانایی استدلال فوقالعادهای را نشان میدهد."
|
||
},
|
||
"deepseek_r1_distill_qwen_32b": {
|
||
"description": "DeepSeek-R1-Distill-Qwen-32B مدلی است که بر اساس Qwen2.5-32B از طریق تقطیر دانش بهدست آمده است. این مدل از 800000 نمونه منتخب تولید شده توسط DeepSeek-R1 برای بهینهسازی استفاده میکند و در چندین حوزه از جمله ریاضی، برنامهنویسی و استدلال عملکرد فوقالعادهای دارد."
|
||
},
|
||
"doubao-1.5-lite-32k": {
|
||
"description": "مدل سبک نسل جدید Doubao-1.5-lite، با سرعت پاسخدهی فوقالعاده، عملکرد و تأخیر در سطح جهانی را ارائه میدهد."
|
||
},
|
||
"doubao-1.5-pro-256k": {
|
||
"description": "Doubao-1.5-pro-256k نسخه ارتقاء یافته Doubao-1.5-Pro است که به طور کلی عملکرد را 10% بهبود میبخشد. از استدلال با پنجره زمینه 256k پشتیبانی میکند و طول خروجی حداکثر 12k توکن را پشتیبانی میکند. عملکرد بالاتر، پنجره بزرگتر و قیمت فوقالعاده، مناسب برای کاربردهای گستردهتر."
|
||
},
|
||
"doubao-1.5-pro-32k": {
|
||
"description": "مدل اصلی نسل جدید Doubao-1.5-pro، با ارتقاء کامل عملکرد، در زمینههای دانش، کد، استدلال و غیره عملکرد برجستهای دارد."
|
||
},
|
||
"doubao-1.5-thinking-pro": {
|
||
"description": "مدل تفکر عمیق جدید Doubao-1.5، در زمینههای تخصصی مانند ریاضیات، برنامهنویسی، استدلال علمی و همچنین در وظایف عمومی مانند نوشتن خلاقانه عملکرد برجستهای دارد و در معیارهای معتبر مانند AIME 2024، Codeforces و GPQA به سطح اول صنعت نزدیک یا در آن قرار دارد. از پنجره زمینه 128k و خروجی 16k پشتیبانی میکند."
|
||
},
|
||
"doubao-1.5-thinking-pro-m": {
|
||
"description": "مدل تفکر عمیق جدید Doubao-1.5 (نسخه m دارای قابلیت استدلال چندرسانهای بومی) است که در حوزههای تخصصی مانند ریاضیات، برنامهنویسی، استدلال علمی و همچنین وظایف عمومی مانند نوشتن خلاقانه عملکرد برجستهای دارد و در معیارهای معتبر AIME 2024، Codeforces، GPQA و غیره به سطح اول صنعت نزدیک یا در آن قرار دارد. از پنجره متنی 128k و خروجی 16k پشتیبانی میکند."
|
||
},
|
||
"doubao-1.5-thinking-vision-pro": {
|
||
"description": "مدل جدید تفکر عمیق بصری با تواناییهای قویتر در درک و استدلال چندرسانهای عمومی، که در 37 مورد از 59 معیار ارزیابی عمومی به عملکرد برتر (SOTA) دست یافته است."
|
||
},
|
||
"doubao-1.5-ui-tars": {
|
||
"description": "Doubao-1.5-UI-TARS یک مدل عامل بومی برای تعامل با رابطهای گرافیکی کاربری (GUI) است. با تواناییهای انسانی مانند ادراک، استدلال و اقدام، تعامل بیوقفه با GUI را فراهم میکند."
|
||
},
|
||
"doubao-1.5-vision-lite": {
|
||
"description": "Doubao-1.5-vision-lite مدل بزرگ چندرسانهای بهروز شده است که از شناسایی تصاویر با هر وضوح و نسبت ابعاد بسیار طولانی پشتیبانی میکند و تواناییهای استدلال بصری، شناسایی مستندات، درک اطلاعات جزئی و پیروی از دستورات را تقویت میکند. از پنجره متن 128k و حداکثر طول خروجی 16k توکن پشتیبانی میکند."
|
||
},
|
||
"doubao-1.5-vision-pro": {
|
||
"description": "مدل چندرسانهای بزرگ Doubao-1.5-vision-pro بهروزرسانی شده که از شناسایی تصاویر با هر وضوح و نسبت ابعاد بسیار طولانی پشتیبانی میکند و تواناییهای استدلال بصری، شناسایی اسناد، درک جزئیات و پیروی از دستورات را تقویت میکند."
|
||
},
|
||
"doubao-1.5-vision-pro-32k": {
|
||
"description": "مدل چندرسانهای بزرگ Doubao-1.5-vision-pro بهروزرسانی شده که از شناسایی تصاویر با هر وضوح و نسبت ابعاد بسیار طولانی پشتیبانی میکند و تواناییهای استدلال بصری، شناسایی اسناد، درک جزئیات و پیروی از دستورات را تقویت میکند."
|
||
},
|
||
"doubao-lite-128k": {
|
||
"description": "دارای سرعت پاسخگویی بینظیر و نسبت قیمت به کارایی بهتر است و گزینههای انعطافپذیرتری را برای سناریوهای مختلف مشتریان ارائه میدهد. از پنجره متنی 128k برای استدلال و تنظیم دقیق پشتیبانی میکند."
|
||
},
|
||
"doubao-lite-32k": {
|
||
"description": "دارای سرعت پاسخگویی بینظیر و نسبت قیمت به کارایی بهتر است و گزینههای انعطافپذیرتری را برای سناریوهای مختلف مشتریان ارائه میدهد. از پنجره متنی 32k برای استدلال و تنظیم دقیق پشتیبانی میکند."
|
||
},
|
||
"doubao-lite-4k": {
|
||
"description": "دارای سرعت پاسخگویی بینظیر و نسبت قیمت به کارایی بهتر است و گزینههای انعطافپذیرتری را برای سناریوهای مختلف مشتریان ارائه میدهد. از پنجره متنی 4k برای استدلال و تنظیم دقیق پشتیبانی میکند."
|
||
},
|
||
"doubao-pro-256k": {
|
||
"description": "مدل اصلی با بهترین عملکرد، مناسب برای انجام وظایف پیچیده است و در زمینههایی مانند پاسخ به سوالات مرجع، خلاصهسازی، خلق محتوا، دستهبندی متن و نقشآفرینی عملکرد بسیار خوبی دارد. از پنجره متنی 256k برای استدلال و تنظیم دقیق پشتیبانی میکند."
|
||
},
|
||
"doubao-pro-32k": {
|
||
"description": "مدل اصلی با بهترین عملکرد، مناسب برای انجام وظایف پیچیده است و در زمینههایی مانند پاسخ به سوالات مرجع، خلاصهسازی، خلق محتوا، دستهبندی متن و نقشآفرینی عملکرد بسیار خوبی دارد. از پنجره متنی 32k برای استدلال و تنظیم دقیق پشتیبانی میکند."
|
||
},
|
||
"doubao-seed-1.6": {
|
||
"description": "مدل تفکر عمیق چندرسانهای جدید Doubao-Seed-1.6 که از سه حالت تفکر auto/thinking/non-thinking پشتیبانی میکند. در حالت non-thinking، عملکرد مدل نسبت به Doubao-1.5-pro/250115 بهطور قابل توجهی بهبود یافته است. از پنجره متنی ۲۵۶ هزار توکنی پشتیبانی میکند و طول خروجی تا ۱۶ هزار توکن را امکانپذیر میسازد."
|
||
},
|
||
"doubao-seed-1.6-flash": {
|
||
"description": "مدل تفکر عمیق چندرسانهای Doubao-Seed-1.6-flash با سرعت استنتاج بسیار بالا، TPOT تنها ۱۰ میلیثانیه است؛ همچنین از درک متن و تصویر پشتیبانی میکند، توانایی درک متنی آن از نسل قبلی lite بهتر است و درک تصویری آن با مدلهای pro رقبا برابری میکند. از پنجره متنی ۲۵۶ هزار توکنی پشتیبانی میکند و طول خروجی تا ۱۶ هزار توکن را امکانپذیر میسازد."
|
||
},
|
||
"doubao-seed-1.6-lite": {
|
||
"description": "Doubao-Seed-1.6-lite یک مدل چندرسانهای جدید با قابلیت تفکر عمیق است که از تنظیم سطح تلاش استدلال (reasoning effort) در چهار حالت Minimal، Low، Medium و High پشتیبانی میکند. این مدل با بهرهوری بالا، انتخابی ایدهآل برای وظایف رایج است و از پنجره متنی تا ۲۵۶ هزار توکن پشتیبانی میکند."
|
||
},
|
||
"doubao-seed-1.6-thinking": {
|
||
"description": "مدل Doubao-Seed-1.6-thinking با توانایی تفکر بهطور قابل توجهی تقویت شده است، نسبت به Doubao-1.5-thinking-pro در مهارتهای پایهای مانند برنامهنویسی، ریاضیات و استدلال منطقی پیشرفت داشته و از درک تصویری پشتیبانی میکند. از پنجره متنی ۲۵۶ هزار توکنی پشتیبانی میکند و طول خروجی تا ۱۶ هزار توکن را امکانپذیر میسازد."
|
||
},
|
||
"doubao-seed-1.6-vision": {
|
||
"description": "مدل تفکر عمیق بصری Doubao-Seed-1.6-vision در زمینههایی مانند آموزش، بازبینی تصاویر، بازرسی و امنیت و پرسش و پاسخ جستجوی هوش مصنوعی، توانایی درک و استدلال چندرسانهای عمومی قویتری را نشان میدهد. از پنجره متنی ۲۵۶ هزار توکنی پشتیبانی میکند و طول خروجی تا ۶۴ هزار توکن قابل افزایش است."
|
||
},
|
||
"doubao-seed-code": {
|
||
"description": "Doubao-Seed-Code برای وظایف برنامهنویسی Agentic بهطور عمیق بهینهسازی شده است. از چندرسانهای (متن/تصویر/ویدیو) و زمینه طولانی ۲۵۶ هزار توکن پشتیبانی میکند، با API شرکت Anthropic سازگار است و برای برنامهنویسی، درک بصری و سناریوهای Agent مناسب است."
|
||
},
|
||
"doubao-seededit-3-0-i2i-250628": {
|
||
"description": "مدل تولید تصویر Doubao توسط تیم Seed شرکت ByteDance توسعه یافته است، از ورودی متن و تصویر پشتیبانی میکند و تجربهای با کنترل بالا و کیفیت عالی در تولید تصویر ارائه میدهد. امکان ویرایش تصویر با دستور متنی وجود دارد و طول ضلع تصویر تولید شده بین 512 تا 1536 پیکسل است."
|
||
},
|
||
"doubao-seedream-3-0-t2i-250415": {
|
||
"description": "مدل تولید تصویر Seedream 3.0 توسط تیم Seed شرکت ByteDance توسعه یافته است، از ورودی متن و تصویر پشتیبانی میکند و تجربهای با کنترل بالا و کیفیت عالی در تولید تصویر ارائه میدهد. تصاویر بر اساس متن توصیفی تولید میشوند."
|
||
},
|
||
"doubao-seedream-4-0-250828": {
|
||
"description": "مدل تولید تصویر Seedream 4.0 توسط تیم Seed شرکت ByteDance توسعه یافته است، از ورودی متن و تصویر پشتیبانی میکند و تجربهای با کنترل بالا و کیفیت عالی در تولید تصویر ارائه میدهد. تصاویر بر اساس متن توصیفی تولید میشوند."
|
||
},
|
||
"doubao-vision-lite-32k": {
|
||
"description": "مدل Doubao-vision یک مدل چندرسانهای بزرگ است که توسط Doubao ارائه شده و دارای تواناییهای قوی در درک و استدلال تصاویر و همچنین درک دقیق دستورات است. این مدل در استخراج اطلاعات متنی از تصاویر و وظایف استدلال مبتنی بر تصویر عملکرد قدرتمندی نشان داده و میتواند در وظایف پیچیدهتر و گستردهتر پرسش و پاسخ بصری به کار رود."
|
||
},
|
||
"doubao-vision-pro-32k": {
|
||
"description": "مدل Doubao-vision یک مدل چندرسانهای بزرگ است که توسط Doubao ارائه شده و دارای تواناییهای قوی در درک و استدلال تصاویر و همچنین درک دقیق دستورات است. این مدل در استخراج اطلاعات متنی از تصاویر و وظایف استدلال مبتنی بر تصویر عملکرد قدرتمندی نشان داده و میتواند در وظایف پیچیدهتر و گستردهتر پرسش و پاسخ بصری به کار رود."
|
||
},
|
||
"emohaa": {
|
||
"description": "Emohaa یک مدل روانشناختی است که دارای توانایی مشاوره حرفهای بوده و به کاربران در درک مسائل احساسی کمک میکند."
|
||
},
|
||
"ernie-4.5-0.3b": {
|
||
"description": "ERNIE 4.5 0.3B، مدل سبک متنباز، مناسب برای استقرار محلی و سفارشیسازی."
|
||
},
|
||
"ernie-4.5-21b-a3b": {
|
||
"description": "ERNIE 4.5 21B A3B، مدل بزرگ متنباز با عملکرد قوی در وظایف درک و تولید."
|
||
},
|
||
"ernie-4.5-300b-a47b": {
|
||
"description": "ERNIE 4.5 300B A47B یک مدل بسیار بزرگ متخصص ترکیبی است که توسط Wenxin Baidu ارائه شده و از توانایی استدلالی برجستهای برخوردار است."
|
||
},
|
||
"ernie-4.5-8k-preview": {
|
||
"description": "ERNIE 4.5 8K Preview، مدل پیشنمایش با زمینه 8K، برای تجربه و آزمایش قابلیتهای Wenxin 4.5."
|
||
},
|
||
"ernie-4.5-turbo-128k": {
|
||
"description": "ERNIE 4.5 Turbo 128K، مدل عمومی با عملکرد بالا، پشتیبانی از جستجوی تقویتی و ابزارها، مناسب برای پرسش و پاسخ، کدنویسی و عاملهای هوشمند."
|
||
},
|
||
"ernie-4.5-turbo-128k-preview": {
|
||
"description": "ERNIE 4.5 Turbo 128K Preview، نسخه پیشنمایش با قابلیتهای مشابه نسخه رسمی، مناسب برای تست و هماهنگی."
|
||
},
|
||
"ernie-4.5-turbo-32k": {
|
||
"description": "ERNIE 4.5 Turbo 32K، نسخه با زمینه متوسط تا بلند، مناسب برای پرسش و پاسخ، جستجوی پایگاه دانش و مکالمات چندمرحلهای."
|
||
},
|
||
"ernie-4.5-turbo-latest": {
|
||
"description": "ERNIE 4.5 Turbo آخرین نسخه، با بهینهسازی عملکرد کلی، مناسب بهعنوان مدل اصلی در محیطهای تولیدی."
|
||
},
|
||
"ernie-4.5-turbo-vl": {
|
||
"description": "ERNIE 4.5 Turbo VL، مدل چندوجهی بالغ، مناسب برای درک و شناسایی تصویر و متن در محیطهای تولیدی."
|
||
},
|
||
"ernie-4.5-turbo-vl-32k": {
|
||
"description": "ERNIE 4.5 Turbo VL 32K، نسخه چندوجهی با زمینه متوسط تا بلند، مناسب برای درک ترکیبی اسناد بلند و تصاویر."
|
||
},
|
||
"ernie-4.5-turbo-vl-32k-preview": {
|
||
"description": "ERNIE 4.5 Turbo VL 32K Preview، نسخه پیشنمایش چندوجهی 32K، مناسب برای ارزیابی توانایی درک بصری با زمینه بلند."
|
||
},
|
||
"ernie-4.5-turbo-vl-latest": {
|
||
"description": "ERNIE 4.5 Turbo VL Latest، آخرین نسخه چندوجهی با درک و استنتاج تصویر و متن بهینهشده."
|
||
},
|
||
"ernie-4.5-turbo-vl-preview": {
|
||
"description": "ERNIE 4.5 Turbo VL Preview، مدل پیشنمایش چندوجهی، پشتیبانی از درک و تولید تصویر و متن، مناسب برای تجربه پرسش و پاسخ بصری و درک محتوا."
|
||
},
|
||
"ernie-4.5-vl-28b-a3b": {
|
||
"description": "ERNIE 4.5 VL 28B A3B، مدل چندوجهی متنباز، پشتیبانی از وظایف درک و استنتاج تصویر و متن."
|
||
},
|
||
"ernie-5.0-thinking-latest": {
|
||
"description": "Ernie 5.0 Thinking، مدل پرچمدار چندرسانهای بومی، از مدلسازی یکپارچه متن، تصویر، صوت و ویدیو پشتیبانی میکند. تواناییهای جامع آن بهروزرسانی شده و برای پرسشوپاسخهای پیچیده، تولید محتوا و سناریوهای هوشمند بسیار مناسب است."
|
||
},
|
||
"ernie-5.0-thinking-preview": {
|
||
"description": "پیشنمایش ERNIE 5.0 Thinking، مدل پرچمدار چندوجهی بومی، پشتیبانی از مدلسازی یکپارچه متن، تصویر، صدا و ویدیو، با ارتقاء جامع تواناییها، مناسب برای پرسش و پاسخ پیچیده، تولید محتوا و عاملهای هوشمند."
|
||
},
|
||
"ernie-char-8k": {
|
||
"description": "ERNIE Character 8K، مدل مکالمه با شخصیت، مناسب برای ساخت شخصیتهای IP و گفتوگوی همراه بلندمدت."
|
||
},
|
||
"ernie-char-fiction-8k": {
|
||
"description": "ERNIE Character Fiction 8K، مدل شخصیتپردازی برای داستاننویسی و خلق روایت، مناسب برای تولید داستانهای بلند."
|
||
},
|
||
"ernie-char-fiction-8k-preview": {
|
||
"description": "ERNIE Character Fiction 8K Preview، نسخه پیشنمایش مدل شخصیت و داستانپردازی، برای تجربه و آزمایش عملکرد."
|
||
},
|
||
"ernie-irag-edit": {
|
||
"description": "ERNIE iRAG Edit، مدل ویرایش تصویر با قابلیت حذف، بازسازی و تولید نسخههای متنوع."
|
||
},
|
||
"ernie-lite-8k": {
|
||
"description": "ERNIE Lite 8K، مدل عمومی سبک، مناسب برای پرسش و پاسخ روزمره و تولید محتوا با هزینه پایین."
|
||
},
|
||
"ernie-lite-pro-128k": {
|
||
"description": "ERNIE Lite Pro 128K، مدل سبک با عملکرد بالا، مناسب برای سناریوهای حساس به تأخیر و هزینه."
|
||
},
|
||
"ernie-novel-8k": {
|
||
"description": "ERNIE Novel 8K، مدل تولید رمان بلند و داستانهای IP، متخصص در روایت چندشخصیتی و چندخطی."
|
||
},
|
||
"ernie-speed-128k": {
|
||
"description": "ERNIE Speed 128K، مدل بزرگ بدون هزینه ورودی/خروجی، مناسب برای درک متن بلند و آزمایشهای گسترده."
|
||
},
|
||
"ernie-speed-8k": {
|
||
"description": "ERNIE Speed 8K، مدل رایگان و سریع، مناسب برای مکالمات روزمره و وظایف متنی سبک."
|
||
},
|
||
"ernie-speed-pro-128k": {
|
||
"description": "ERNIE Speed Pro 128K، مدل با کارایی بالا و هزینه مناسب، مناسب برای خدمات آنلاین گسترده و کاربردهای سازمانی."
|
||
},
|
||
"ernie-tiny-8k": {
|
||
"description": "ERNIE Tiny 8K، مدل فوق سبک، مناسب برای پرسش و پاسخ ساده، طبقهبندی و استنتاج کمهزینه."
|
||
},
|
||
"ernie-x1-turbo-32k": {
|
||
"description": "ERNIE X1 Turbo 32K، مدل تفکر سریع با زمینه بلند 32K، مناسب برای استنتاج پیچیده و مکالمات چندمرحلهای."
|
||
},
|
||
"ernie-x1.1-preview": {
|
||
"description": "ERNIE X1.1 Preview، نسخه پیشنمایش مدل تفکر ERNIE X1.1، مناسب برای ارزیابی و آزمایش تواناییها."
|
||
},
|
||
"fal-ai/bytedance/seedream/v4": {
|
||
"description": "مدل تولید تصویر Seedream 4.0 توسط تیم Seed شرکت ByteDance توسعه یافته است، از ورودی متن و تصویر پشتیبانی میکند و تجربهای با کنترل بالا و کیفیت عالی در تولید تصویر ارائه میدهد. تصاویر بر اساس متن توصیفی تولید میشوند."
|
||
},
|
||
"fal-ai/flux-kontext/dev": {
|
||
"description": "مدل FLUX.1 متمرکز بر وظایف ویرایش تصویر است و از ورودی متن و تصویر پشتیبانی میکند."
|
||
},
|
||
"fal-ai/flux-pro/kontext": {
|
||
"description": "FLUX.1 Kontext [pro] قادر است متن و تصویر مرجع را به عنوان ورودی پردازش کند و ویرایشهای هدفمند محلی و تغییرات پیچیده در صحنههای کلی را به صورت یکپارچه انجام دهد."
|
||
},
|
||
"fal-ai/flux/krea": {
|
||
"description": "Flux Krea [dev] یک مدل تولید تصویر با سلیقه زیباییشناسانه است که هدف آن تولید تصاویر واقعیتر و طبیعیتر است."
|
||
},
|
||
"fal-ai/flux/schnell": {
|
||
"description": "FLUX.1 [schnell] یک مدل تولید تصویر با 12 میلیارد پارامتر است که بر تولید سریع تصاویر با کیفیت بالا تمرکز دارد."
|
||
},
|
||
"fal-ai/hunyuan-image/v3": {
|
||
"description": "یک مدل قدرتمند بومی تولید تصویر چندوجهی"
|
||
},
|
||
"fal-ai/imagen4/preview": {
|
||
"description": "مدل تولید تصویر با کیفیت بالا ارائه شده توسط گوگل"
|
||
},
|
||
"fal-ai/nano-banana": {
|
||
"description": "Nano Banana جدیدترین، سریعترین و کارآمدترین مدل چندرسانهای بومی گوگل است که به شما امکان میدهد از طریق گفتگو تصاویر را تولید و ویرایش کنید."
|
||
},
|
||
"fal-ai/qwen-image": {
|
||
"description": "مدل قدرتمند تولید تصویر خام تیم Qwen با توانایی چشمگیر در تولید متنهای چینی و سبکهای بصری متنوع تصاویر."
|
||
},
|
||
"fal-ai/qwen-image-edit": {
|
||
"description": "مدل ویرایش تصویر حرفهای منتشر شده توسط تیم Qwen که از ویرایش معنایی و ظاهری پشتیبانی میکند، قادر به ویرایش دقیق متنهای چینی و انگلیسی، تبدیل سبک، چرخش اشیاء و سایر ویرایشهای با کیفیت تصویر است."
|
||
},
|
||
"flux-1-schnell": {
|
||
"description": "مدل تولید تصویر از متن با 12 میلیارد پارامتر که توسط Black Forest Labs توسعه یافته است و از تکنولوژی تقطیر انتشار متخاصم نهفته استفاده میکند و قادر است در 1 تا 4 مرحله تصاویر با کیفیت بالا تولید کند. این مدل عملکردی مشابه نمونههای بسته دارد و تحت مجوز Apache-2.0 برای استفاده شخصی، تحقیقاتی و تجاری منتشر شده است."
|
||
},
|
||
"flux-dev": {
|
||
"description": "FLUX.1 [dev] یک مدل وزن باز و پالایش شده متنباز برای کاربردهای غیرتجاری است. این مدل کیفیت تصویر و پیروی از دستورالعمل را نزدیک به نسخه حرفهای FLUX حفظ کرده و در عین حال کارایی اجرایی بالاتری دارد. نسبت به مدلهای استاندارد با اندازه مشابه، بهرهوری منابع بهتری دارد."
|
||
},
|
||
"flux-kontext-max": {
|
||
"description": "پیشرفتهترین فناوری تولید و ویرایش تصاویر مبتنی بر زمینه — ترکیب متن و تصویر برای دستیابی به نتایجی دقیق و منسجم."
|
||
},
|
||
"flux-kontext-pro": {
|
||
"description": "پیشرفتهترین تولید و ویرایش تصاویر زمینهای — ترکیب متن و تصویر برای بهدست آوردن نتایجی دقیق و منسجم."
|
||
},
|
||
"flux-merged": {
|
||
"description": "مدل FLUX.1-merged ترکیبی از ویژگیهای عمیق کشف شده در مرحله توسعه \"DEV\" و مزایای اجرای سریع \"Schnell\" است. این اقدام باعث افزایش مرزهای عملکرد مدل و گسترش دامنه کاربردهای آن شده است."
|
||
},
|
||
"flux-pro": {
|
||
"description": "پیشرفتهترین مدل تولید تصاویر مبتنی بر هوش مصنوعی برای مصارف تجاری — کیفیت تصویر بینظیر و تنوع خروجی چشمگیر."
|
||
},
|
||
"flux-pro-1.1": {
|
||
"description": "نسخهٔ ارتقاء یافتهٔ مدل تولید تصویر حرفهای مبتنی بر هوش مصنوعی — کیفیت تصویر برجسته و توانایی دقیق در پیروی از پرومپتها را ارائه میدهد."
|
||
},
|
||
"flux-pro-1.1-ultra": {
|
||
"description": "تولید تصاویر هوش مصنوعی با رزولوشن فوقالعاده — پشتیبانی از خروجی ۴ مگاپیکسلی و تولید تصاویر با وضوح بالا در کمتر از ۱۰ ثانیه."
|
||
},
|
||
"flux-schnell": {
|
||
"description": "FLUX.1 [schnell] به عنوان پیشرفتهترین مدل متنباز با گامهای کم، نه تنها از رقبا پیشی گرفته بلکه از مدلهای غیرتقطیر قدرتمندی مانند Midjourney v6.0 و DALL·E 3 (HD) نیز بهتر است. این مدل به طور خاص تنظیم شده تا تنوع کامل خروجیهای پیشآموزش را حفظ کند و نسبت به مدلهای پیشرفته بازار، بهبودهای قابل توجهی در کیفیت بصری، پیروی از دستورالعمل، تغییر اندازه/نسبت، پردازش فونت و تنوع خروجی ارائه میدهد و تجربه تولید تصاویر خلاقانه و متنوعتری را برای کاربران فراهم میکند."
|
||
},
|
||
"flux.1-schnell": {
|
||
"description": "FLUX.1-schnell، مدل تولید تصویر با عملکرد بالا، مناسب برای تولید سریع تصاویر با سبکهای متنوع."
|
||
},
|
||
"gemini-1.0-pro-001": {
|
||
"description": "Gemini 1.0 Pro 001 (تنظیم) عملکردی پایدار و قابل تنظیم ارائه میدهد و انتخابی ایدهآل برای راهحلهای وظایف پیچیده است."
|
||
},
|
||
"gemini-1.0-pro-002": {
|
||
"description": "جمینی 1.0 پرو 002 (تنظیم) پشتیبانی چندوجهی عالی ارائه میدهد و بر حل مؤثر وظایف پیچیده تمرکز دارد."
|
||
},
|
||
"gemini-1.0-pro-latest": {
|
||
"description": "Gemini 1.0 Pro مدل هوش مصنوعی با عملکرد بالای Google است که برای گسترش وظایف گسترده طراحی شده است."
|
||
},
|
||
"gemini-1.5-flash-001": {
|
||
"description": "جمینی 1.5 فلش 001 یک مدل چندوجهی کارآمد است که از گسترش کاربردهای گسترده پشتیبانی میکند."
|
||
},
|
||
"gemini-1.5-flash-002": {
|
||
"description": "جمینی 1.5 فلش 002 یک مدل چندوجهی کارآمد است که از گسترش کاربردهای گسترده پشتیبانی میکند."
|
||
},
|
||
"gemini-1.5-flash-8b": {
|
||
"description": "Gemini 1.5 Flash 8B یک مدل چندرسانهای کارآمد است که از گسترش کاربردهای وسیع پشتیبانی میکند."
|
||
},
|
||
"gemini-1.5-flash-8b-exp-0924": {
|
||
"description": "Gemini 1.5 Flash 8B 0924 جدیدترین مدل آزمایشی است که در موارد استفاده متنی و چندوجهی بهبود عملکرد قابل توجهی دارد."
|
||
},
|
||
"gemini-1.5-flash-8b-latest": {
|
||
"description": "جیمنی ۱.۵ فلاش ۸ب یک مدل چند حالتی کارآمد است که پشتیبانی از گسترهای وسیع از کاربردها را فراهم میکند."
|
||
},
|
||
"gemini-1.5-flash-exp-0827": {
|
||
"description": "Gemini 1.5 Flash 0827 دارای تواناییهای بهینهشده پردازش چندرسانهای است و مناسب برای انواع سناریوهای پیچیده است."
|
||
},
|
||
"gemini-1.5-flash-latest": {
|
||
"description": "Gemini 1.5 Flash جدیدترین مدل چندوجهی AI گوگل است که دارای قابلیت پردازش سریع بوده و از ورودیهای متن، تصویر و ویدئو پشتیبانی میکند و برای گسترش کارآمد در وظایف مختلف مناسب است."
|
||
},
|
||
"gemini-1.5-pro-001": {
|
||
"description": "Gemini 1.5 Pro 001 یک راهحل هوش مصنوعی چندوجهی قابل گسترش است که از طیف گستردهای از وظایف پیچیده پشتیبانی میکند."
|
||
},
|
||
"gemini-1.5-pro-002": {
|
||
"description": "Gemini 1.5 Pro 002 جدیدترین مدل آماده تولید است که خروجی با کیفیت بالاتری ارائه میدهد و به ویژه در زمینههای ریاضی، متنهای طولانی و وظایف بصری بهبود قابل توجهی دارد."
|
||
},
|
||
"gemini-1.5-pro-exp-0801": {
|
||
"description": "Gemini 1.5 Pro 0801 تواناییهای برجسته پردازش چندرسانهای را ارائه میدهد و انعطافپذیری بیشتری برای توسعه برنامهها به ارمغان میآورد."
|
||
},
|
||
"gemini-1.5-pro-exp-0827": {
|
||
"description": "Gemini 1.5 Pro 0827 با تکنولوژیهای بهینهسازی جدید ترکیب شده و توانایی پردازش دادههای چندرسانهای را بهینه میکند."
|
||
},
|
||
"gemini-1.5-pro-latest": {
|
||
"description": "Gemini 1.5 Pro از حداکثر ۲ میلیون توکن پشتیبانی میکند و انتخابی ایدهآل برای مدلهای چندوجهی متوسط است که برای پشتیبانی از وظایف پیچیده مناسب میباشد."
|
||
},
|
||
"gemini-2.0-flash": {
|
||
"description": "Gemini 2.0 Flash ویژگیها و بهبودهای نسل بعدی را ارائه میدهد، از جمله سرعت عالی، استفاده از ابزارهای بومی، تولید چندرسانهای و پنجره متن 1M توکن."
|
||
},
|
||
"gemini-2.0-flash-001": {
|
||
"description": "Gemini 2.0 Flash ویژگیها و بهبودهای نسل بعدی را ارائه میدهد، از جمله سرعت عالی، استفاده از ابزارهای بومی، تولید چندرسانهای و پنجره متن 1M توکن."
|
||
},
|
||
"gemini-2.0-flash-exp": {
|
||
"description": "مدل متغیر Gemini 2.0 Flash که برای بهینهسازی هزینه و تأخیر کم طراحی شده است."
|
||
},
|
||
"gemini-2.0-flash-exp-image-generation": {
|
||
"description": "مدل آزمایشی Gemini 2.0 Flash، از تولید تصویر پشتیبانی میکند"
|
||
},
|
||
"gemini-2.0-flash-lite": {
|
||
"description": "مدل متغیر Gemini 2.0 Flash برای بهینهسازی هزینه و تأخیر کم طراحی شده است."
|
||
},
|
||
"gemini-2.0-flash-lite-001": {
|
||
"description": "مدل متغیر Gemini 2.0 Flash برای بهینهسازی هزینه و تأخیر کم طراحی شده است."
|
||
},
|
||
"gemini-2.5-flash": {
|
||
"description": "Gemini 2.5 Flash مدل با بهترین نسبت قیمت به کارایی گوگل است که امکانات جامع را ارائه میدهد."
|
||
},
|
||
"gemini-2.5-flash-image": {
|
||
"description": "Nano Banana جدیدترین، سریعترین و کارآمدترین مدل چندرسانهای بومی گوگل است که به شما امکان میدهد از طریق گفتگو تصاویر را تولید و ویرایش کنید."
|
||
},
|
||
"gemini-2.5-flash-image-preview": {
|
||
"description": "Nano Banana جدیدترین، سریعترین و کارآمدترین مدل چندرسانهای بومی گوگل است که به شما امکان میدهد از طریق گفتگو تصاویر را تولید و ویرایش کنید."
|
||
},
|
||
"gemini-2.5-flash-image-preview:image": {
|
||
"description": "Nano Banana جدیدترین، سریعترین و کارآمدترین مدل چندرسانهای بومی گوگل است که به شما امکان میدهد از طریق گفتگو تصاویر را تولید و ویرایش کنید."
|
||
},
|
||
"gemini-2.5-flash-image:image": {
|
||
"description": "Nano Banana جدیدترین، سریعترین و کارآمدترین مدل چندرسانهای بومی گوگل است که به شما امکان میدهد از طریق گفتگو تصاویر را تولید و ویرایش کنید."
|
||
},
|
||
"gemini-2.5-flash-lite": {
|
||
"description": "Gemini 2.5 Flash-Lite کوچکترین و مقرونبهصرفهترین مدل گوگل است که برای استفاده در مقیاس وسیع طراحی شده است."
|
||
},
|
||
"gemini-2.5-flash-lite-preview-06-17": {
|
||
"description": "Gemini 2.5 Flash-Lite Preview کوچکترین و مقرونبهصرفهترین مدل گوگل است که برای استفاده در مقیاس بزرگ طراحی شده است."
|
||
},
|
||
"gemini-2.5-flash-lite-preview-09-2025": {
|
||
"description": "نسخه پیشنمایش (25 سپتامبر 2025) از Gemini 2.5 Flash-Lite"
|
||
},
|
||
"gemini-2.5-flash-preview-04-17": {
|
||
"description": "پیشنمایش فلش Gemini 2.5 مدل با بهترین قیمت و کیفیت گوگل است که امکانات جامع و کاملی را ارائه میدهد."
|
||
},
|
||
"gemini-2.5-flash-preview-09-2025": {
|
||
"description": "نسخه پیشنمایش (25 سپتامبر 2025) از Gemini 2.5 Flash"
|
||
},
|
||
"gemini-2.5-pro": {
|
||
"description": "Gemini 2.5 Pro پیشرفتهترین مدل تفکر گوگل است که قادر به استنتاج مسائل پیچیده در حوزه کد، ریاضیات و STEM بوده و با استفاده از زمینه طولانی، تحلیل مجموعه دادهها، کدها و مستندات بزرگ را انجام میدهد."
|
||
},
|
||
"gemini-2.5-pro-preview-03-25": {
|
||
"description": "پیشنمایش Gemini 2.5 Pro مدل پیشرفته تفکر گوگل است که قادر به استدلال در مورد کد، ریاضیات و مسائل پیچیده در زمینه STEM میباشد و همچنین میتواند با استفاده از تحلیل زمینهای طولانی، مجموعههای داده بزرگ، کتابخانههای کد و مستندات را بررسی کند."
|
||
},
|
||
"gemini-2.5-pro-preview-05-06": {
|
||
"description": "Gemini 2.5 Pro Preview مدل پیشرفته تفکر گوگل است که قادر به استدلال در مورد کد، ریاضیات و مسائل پیچیده در زمینه STEM میباشد و میتواند با استفاده از تحلیل زمینهای طولانی، مجموعههای داده بزرگ، کتابخانههای کد و مستندات را بررسی کند."
|
||
},
|
||
"gemini-2.5-pro-preview-06-05": {
|
||
"description": "Gemini 2.5 Pro Preview پیشرفتهترین مدل تفکر گوگل است که قادر به استدلال درباره مسائل پیچیده در حوزه کد، ریاضیات و STEM است و میتواند با استفاده از زمینه طولانی، دادههای بزرگ، مخازن کد و مستندات را تحلیل کند."
|
||
},
|
||
"gemini-3-pro-image-preview": {
|
||
"description": "Gemini 3 Pro Image (Nano Banana Pro) مدل تولید تصویر Google است که از گفتوگوی چندوجهی نیز پشتیبانی میکند."
|
||
},
|
||
"gemini-3-pro-image-preview:image": {
|
||
"description": "Gemini 3 Pro Image (Nano Banana Pro) مدل تولید تصویر Google است که از گفتوگوی چندوجهی نیز پشتیبانی میکند."
|
||
},
|
||
"gemini-3-pro-preview": {
|
||
"description": "Gemini 3 Pro بهترین مدل درک چندوجهی در جهان است و قدرتمندترین عامل هوشمند و مدل برنامهنویسی زمینهای Google تا به امروز محسوب میشود. این مدل جلوههای بصری غنیتر و تعامل عمیقتری را ارائه میدهد که همگی بر پایه تواناییهای پیشرفته استدلال بنا شدهاند."
|
||
},
|
||
"gemini-flash-latest": {
|
||
"description": "جدیدترین نسخه Gemini Flash"
|
||
},
|
||
"gemini-flash-lite-latest": {
|
||
"description": "جدیدترین نسخه Gemini Flash-Lite"
|
||
},
|
||
"gemini-pro-latest": {
|
||
"description": "جدیدترین نسخه Gemini Pro"
|
||
},
|
||
"gemma-7b-it": {
|
||
"description": "Gemma 7B برای پردازش وظایف کوچک و متوسط مناسب است و از نظر هزینه مؤثر است."
|
||
},
|
||
"gemma2": {
|
||
"description": "Gemma 2 یک مدل کارآمد است که توسط Google ارائه شده و شامل طیف گستردهای از کاربردها از برنامههای کوچک تا پردازش دادههای پیچیده میباشد."
|
||
},
|
||
"gemma2-9b-it": {
|
||
"description": "Gemma 2 9B یک مدل بهینهسازی شده برای وظایف خاص و ادغام ابزارها است."
|
||
},
|
||
"gemma2:27b": {
|
||
"description": "Gemma 2 یک مدل کارآمد از Google است که طیف گستردهای از کاربردها را از برنامههای کوچک تا پردازش دادههای پیچیده پوشش میدهد."
|
||
},
|
||
"gemma2:2b": {
|
||
"description": "Gemma 2 یک مدل کارآمد است که توسط Google ارائه شده و شامل طیف گستردهای از کاربردها از برنامههای کوچک تا پردازش دادههای پیچیده میباشد."
|
||
},
|
||
"generalv3": {
|
||
"description": "Spark Pro یک مدل زبان بزرگ با عملکرد بالا است که برای حوزههای حرفهای بهینهسازی شده است و بر ریاضیات، برنامهنویسی، پزشکی، آموزش و سایر حوزهها تمرکز دارد. این مدل از جستجوی آنلاین و افزونههای داخلی مانند وضعیت آبوهوا و تاریخ پشتیبانی میکند. مدل بهینهشده آن در پرسش و پاسخهای پیچیده، درک زبان و تولید متون سطح بالا عملکرد برجسته و کارآمدی از خود نشان میدهد و انتخابی ایدهآل برای کاربردهای حرفهای است."
|
||
},
|
||
"generalv3.5": {
|
||
"description": "Spark Max جامعترین نسخه است که از جستجوی آنلاین و تعداد زیادی افزونه داخلی پشتیبانی میکند. قابلیتهای هستهای بهینهسازیشده و تنظیمات نقشهای سیستمی و عملکرد فراخوانی توابع، آن را در انواع سناریوهای پیچیده بسیار برجسته و کارآمد میسازد."
|
||
},
|
||
"glm-4": {
|
||
"description": "GLM-4 نسخه قدیمی پرچمدار است که در ژانویه 2024 منتشر شد و اکنون با نسخه قویتر GLM-4-0520 جایگزین شده است."
|
||
},
|
||
"glm-4-0520": {
|
||
"description": "GLM-4-0520 جدیدترین نسخه مدل است که برای وظایف بسیار پیچیده و متنوع طراحی شده و عملکردی عالی دارد."
|
||
},
|
||
"glm-4-32b-0414": {
|
||
"description": "GLM-4 32B 0414، نسخه عمومی مدل بزرگ سری GLM، پشتیبانی از تولید و درک متن در وظایف چندگانه."
|
||
},
|
||
"glm-4-9b-chat": {
|
||
"description": "GLM-4-9B-Chat عملکرد بالایی در زمینههای معناشناسی، ریاضیات، استدلال، کدنویسی و دانش دارد. همچنین از مرور وب، اجرای کد، فراخوانی ابزارهای سفارشی و استدلال متون بلند پشتیبانی میکند. این مدل از ۲۶ زبان از جمله ژاپنی، کرهای و آلمانی پشتیبانی مینماید."
|
||
},
|
||
"glm-4-air": {
|
||
"description": "GLM-4-Air نسخهای با صرفه اقتصادی است که عملکردی نزدیک به GLM-4 دارد و سرعت بالا و قیمت مناسبی را ارائه میدهد."
|
||
},
|
||
"glm-4-air-250414": {
|
||
"description": "GLM-4-Air نسخهای با قیمت مناسب است که عملکردی نزدیک به GLM-4 ارائه میدهد و سرعت بالا و قیمت مقرون به صرفهای دارد."
|
||
},
|
||
"glm-4-airx": {
|
||
"description": "GLM-4-AirX نسخهای کارآمد از GLM-4-Air ارائه میدهد که سرعت استنتاج آن تا ۲.۶ برابر بیشتر است."
|
||
},
|
||
"glm-4-alltools": {
|
||
"description": "GLM-4-AllTools یک مدل چندمنظوره هوشمند است که برای پشتیبانی از برنامهریزی دستورات پیچیده و فراخوانی ابزارها بهینهسازی شده است، مانند مرور وب، تفسیر کد و تولید متن، و برای اجرای چندوظیفهای مناسب است."
|
||
},
|
||
"glm-4-flash": {
|
||
"description": "GLM-4-Flash انتخابی ایدهآل برای انجام وظایف ساده است، سریعترین و رایگان."
|
||
},
|
||
"glm-4-flash-250414": {
|
||
"description": "GLM-4-Flash انتخاب ایدهآلی برای پردازش وظایف ساده است، سریعترین و رایگان است."
|
||
},
|
||
"glm-4-flashx": {
|
||
"description": "GLM-4-FlashX نسخه بهبود یافته Flash است که سرعت استنتاج فوقالعاده سریعی دارد."
|
||
},
|
||
"glm-4-long": {
|
||
"description": "GLM-4-Long از ورودیهای متنی بسیار طولانی پشتیبانی میکند و برای وظایف حافظهای و پردازش اسناد بزرگ مناسب است."
|
||
},
|
||
"glm-4-plus": {
|
||
"description": "GLM-4-Plus به عنوان پرچمدار هوشمند پیشرفته، دارای توانایی پردازش متون طولانی و وظایف پیچیده است و عملکرد آن به طور کامل بهبود یافته است."
|
||
},
|
||
"glm-4.1v-thinking-flash": {
|
||
"description": "سری مدلهای GLM-4.1V-Thinking قویترین مدلهای زبان تصویری (VLM) در سطح 10 میلیارد پارامتر شناخته شده تا کنون هستند که وظایف زبان تصویری پیشرفته همرده SOTA را شامل میشوند، از جمله درک ویدئو، پرسش و پاسخ تصویری، حل مسائل علمی، شناسایی متن OCR، تفسیر اسناد و نمودارها، عاملهای رابط کاربری گرافیکی، کدنویسی صفحات وب فرانتاند، و گراندینگ. تواناییهای این مدلها حتی از مدل Qwen2.5-VL-72B با 8 برابر پارامتر بیشتر نیز فراتر رفته است. با استفاده از فناوری پیشرفته یادگیری تقویتی، مدل توانسته است با استدلال زنجیره تفکر دقت و غنای پاسخها را افزایش دهد و از نظر نتایج نهایی و قابلیت تبیین به طور قابل توجهی از مدلهای غیرتفکری سنتی پیشی بگیرد."
|
||
},
|
||
"glm-4.1v-thinking-flashx": {
|
||
"description": "سری مدلهای GLM-4.1V-Thinking قویترین مدلهای زبان تصویری (VLM) در سطح 10 میلیارد پارامتر شناخته شده تا کنون هستند که وظایف زبان تصویری پیشرفته همرده SOTA را شامل میشوند، از جمله درک ویدئو، پرسش و پاسخ تصویری، حل مسائل علمی، شناسایی متن OCR، تفسیر اسناد و نمودارها، عاملهای رابط کاربری گرافیکی، کدنویسی صفحات وب فرانتاند، و گراندینگ. تواناییهای این مدلها حتی از مدل Qwen2.5-VL-72B با 8 برابر پارامتر بیشتر نیز فراتر رفته است. با استفاده از فناوری پیشرفته یادگیری تقویتی، مدل توانسته است با استدلال زنجیره تفکر دقت و غنای پاسخها را افزایش دهد و از نظر نتایج نهایی و قابلیت تبیین به طور قابل توجهی از مدلهای غیرتفکری سنتی پیشی بگیرد."
|
||
},
|
||
"glm-4.5": {
|
||
"description": "مدل پرچمدار Zhipu که از حالتهای تفکر متنوع پشتیبانی میکند، تواناییهای جامع آن به سطح SOTA مدلهای متنباز رسیده و طول متن زمینهای تا ۱۲۸ هزار کاراکتر را پشتیبانی میکند."
|
||
},
|
||
"glm-4.5-air": {
|
||
"description": "نسخه سبک GLM-4.5 که تعادل بین عملکرد و هزینه را حفظ میکند و امکان تغییر انعطافپذیر بین مدلهای تفکر ترکیبی را فراهم میآورد."
|
||
},
|
||
"glm-4.5-airx": {
|
||
"description": "نسخه فوقالعاده سریع GLM-4.5-Air که پاسخگویی سریعتری دارد و برای نیازهای بزرگ و سرعت بالا طراحی شده است."
|
||
},
|
||
"glm-4.5-flash": {
|
||
"description": "نسخه رایگان GLM-4.5 که در وظایفی مانند استنتاج، کدنویسی و عاملها عملکرد خوبی دارد."
|
||
},
|
||
"glm-4.5-x": {
|
||
"description": "نسخه فوقالعاده سریع GLM-4.5 که در کنار قدرت عملکرد، سرعت تولید تا 100 توکن در ثانیه را ارائه میدهد."
|
||
},
|
||
"glm-4.5v": {
|
||
"description": "نسل جدید مدل استنتاج بصری Zhipu مبتنی بر معماری MOE، با مجموع 106B پارامتر و 12B پارامتر فعال، در انواع بنچمارکها به SOTA در میان مدلهای چندمودال متنباز همرده در سطح جهانی دست یافته است و وظایف متداولی مانند درک تصویر، ویدئو، اسناد و تعامل با رابطهای گرافیکی (GUI) را پوشش میدهد."
|
||
},
|
||
"glm-4.6": {
|
||
"description": "جدیدترین مدل پرچمدار Zhipu، GLM-4.6 (۳۵۵ میلیارد پارامتر)، در کدگذاری پیشرفته، پردازش متون بلند، استنتاج و تواناییهای عامل هوشمند به طور کامل از نسل قبلی پیشی گرفته است، به ویژه در توانایی برنامهنویسی که با Claude Sonnet 4 همتراز است و به یکی از برترین مدلهای کدینگ داخلی تبدیل شده است."
|
||
},
|
||
"glm-4v": {
|
||
"description": "GLM-4V قابلیتهای قدرتمندی در درک و استدلال تصویری ارائه میدهد و از وظایف مختلف بصری پشتیبانی میکند."
|
||
},
|
||
"glm-4v-flash": {
|
||
"description": "GLM-4V-Flash بر روی درک کارآمد تصویر واحد تمرکز دارد و برای سناریوهای تحلیل سریع تصویر، مانند تحلیل تصویر در زمان واقعی یا پردازش دستهای تصاویر مناسب است."
|
||
},
|
||
"glm-4v-plus": {
|
||
"description": "GLM-4V-Plus توانایی درک محتوای ویدئویی و تصاویر متعدد را دارد و برای وظایف چندرسانهای مناسب است."
|
||
},
|
||
"glm-4v-plus-0111": {
|
||
"description": "GLM-4V-Plus دارای توانایی درک محتوای ویدئویی و چندین تصویر است و برای وظایف چندرسانهای مناسب است."
|
||
},
|
||
"glm-z1-air": {
|
||
"description": "مدل استدلال: دارای توانایی استدلال قوی و مناسب برای وظایفی که نیاز به استدلال عمیق دارند."
|
||
},
|
||
"glm-z1-airx": {
|
||
"description": "استدلال فوقالعاده سریع: دارای سرعت استدلال بسیار بالا و عملکرد قوی است."
|
||
},
|
||
"glm-z1-flash": {
|
||
"description": "سری GLM-Z1 دارای تواناییهای قوی در استدلال پیچیده است و در زمینههای استدلال منطقی، ریاضیات و برنامهنویسی عملکرد برجستهای دارد."
|
||
},
|
||
"glm-z1-flashx": {
|
||
"description": "سرعت بالا و قیمت پایین: نسخه تقویتشده Flash با سرعت استنتاج بسیار سریعتر و تضمین همزمانی بالاتر."
|
||
},
|
||
"glm-zero-preview": {
|
||
"description": "GLM-Zero-Preview دارای تواناییهای پیچیده استدلال است و در زمینههای استدلال منطقی، ریاضیات، برنامهنویسی و غیره عملکرد عالی دارد."
|
||
},
|
||
"global.anthropic.claude-opus-4-5-20251101-v1:0": {
|
||
"description": "Claude Opus 4.5 مدل پرچمدار شرکت Anthropic است که هوش برجسته را با عملکرد مقیاسپذیر ترکیب میکند و برای انجام وظایف پیچیدهای که نیازمند پاسخهای با بالاترین کیفیت و توانایی استدلال هستند، مناسب است."
|
||
},
|
||
"google/gemini-2.0-flash": {
|
||
"description": "Gemini 2.0 Flash مدل استدلال با عملکرد بالای Google است که برای وظایف چندوجهی گسترده مناسب است."
|
||
},
|
||
"google/gemini-2.0-flash-001": {
|
||
"description": "Gemini 2.0 Flash ویژگیها و بهبودهای نسل بعدی را ارائه میدهد، از جمله سرعت عالی، استفاده از ابزارهای بومی، تولید چندرسانهای و پنجره متن 1M توکن."
|
||
},
|
||
"google/gemini-2.0-flash-exp:free": {
|
||
"description": "Gemini 2.0 Flash Experimental جدیدترین مدل هوش مصنوعی چندرسانهای آزمایشی گوگل است که نسبت به نسخههای قبلی خود بهبود کیفیت قابل توجهی دارد، به ویژه در زمینه دانش جهانی، کد و زمینههای طولانی."
|
||
},
|
||
"google/gemini-2.0-flash-lite": {
|
||
"description": "Gemini 2.0 Flash Lite ویژگیها و قابلیتهای نسل بعدی را ارائه میدهد، از جمله سرعت عالی، استفاده داخلی از ابزارها، تولید چندرسانهای و پنجره زمینه 1 میلیون توکن."
|
||
},
|
||
"google/gemini-2.0-flash-lite-001": {
|
||
"description": "Gemini 2.0 Flash Lite نسخه سبک خانواده Gemini است که بهطور پیشفرض حالت فکری را غیرفعال کرده تا تأخیر و هزینه را کاهش دهد، اما میتوان آن را از طریق پارامتر فعال کرد."
|
||
},
|
||
"google/gemini-2.5-flash": {
|
||
"description": "سری Gemini 2.5 Flash (Lite/Pro/Flash) مدلهای استدلال Google با تأخیر کم تا عملکرد بالا هستند."
|
||
},
|
||
"google/gemini-2.5-flash-image": {
|
||
"description": "Gemini 2.5 Flash Image (Nano Banana) مدل تولید تصویر Google است که از گفتوگوی چندوجهی نیز پشتیبانی میکند."
|
||
},
|
||
"google/gemini-2.5-flash-image-free": {
|
||
"description": "نسخه رایگان Gemini 2.5 Flash Image که از تولید چندوجهی با سهمیه محدود پشتیبانی میکند."
|
||
},
|
||
"google/gemini-2.5-flash-image-preview": {
|
||
"description": "مدل آزمایشی Gemini 2.5 Flash با پشتیبانی از تولید تصویر"
|
||
},
|
||
"google/gemini-2.5-flash-lite": {
|
||
"description": "Gemini 2.5 Flash Lite نسخه سبک Gemini 2.5 است که برای تأخیر و هزینه بهینه شده و برای سناریوهای با حجم بالا مناسب است."
|
||
},
|
||
"google/gemini-2.5-flash-preview": {
|
||
"description": "Gemini 2.5 Flash مدل اصلی پیشرفته گوگل است که به طور خاص برای استدلال پیشرفته، کدنویسی، ریاضیات و وظایف علمی طراحی شده است. این مدل دارای قابلیت «تفکر» داخلی است که به آن اجازه میدهد پاسخهایی با دقت بالاتر و پردازش زمینهای دقیقتری ارائه دهد.\n\nتوجه: این مدل دارای دو واریانت است: تفکر و غیرتفکر. قیمتگذاری خروجی بسته به فعال بودن قابلیت تفکر به طور قابل توجهی متفاوت است. اگر شما واریانت استاندارد (بدون پسوند «:thinking») را انتخاب کنید، مدل به وضوح از تولید توکنهای تفکر اجتناب خواهد کرد.\n\nبرای استفاده از قابلیت تفکر و دریافت توکنهای تفکر، شما باید واریانت «:thinking» را انتخاب کنید که منجر به قیمتگذاری بالاتر خروجی تفکر خواهد شد.\n\nعلاوه بر این، Gemini 2.5 Flash میتواند از طریق پارامتر «حداکثر تعداد توکنهای استدلال» پیکربندی شود، همانطور که در مستندات توضیح داده شده است (https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning)."
|
||
},
|
||
"google/gemini-2.5-flash-preview:thinking": {
|
||
"description": "Gemini 2.5 Flash مدل اصلی پیشرفته گوگل است که به طور خاص برای استدلال پیشرفته، کدنویسی، ریاضیات و وظایف علمی طراحی شده است. این مدل دارای قابلیت «تفکر» داخلی است که به آن اجازه میدهد پاسخهایی با دقت بالاتر و پردازش زمینهای دقیقتری ارائه دهد.\n\nتوجه: این مدل دارای دو واریانت است: تفکر و غیرتفکر. قیمتگذاری خروجی بسته به فعال بودن قابلیت تفکر به طور قابل توجهی متفاوت است. اگر شما واریانت استاندارد (بدون پسوند «:thinking») را انتخاب کنید، مدل به وضوح از تولید توکنهای تفکر اجتناب خواهد کرد.\n\nبرای استفاده از قابلیت تفکر و دریافت توکنهای تفکر، شما باید واریانت «:thinking» را انتخاب کنید که منجر به قیمتگذاری بالاتر خروجی تفکر خواهد شد.\n\nعلاوه بر این، Gemini 2.5 Flash میتواند از طریق پارامتر «حداکثر تعداد توکنهای استدلال» پیکربندی شود، همانطور که در مستندات توضیح داده شده است (https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning)."
|
||
},
|
||
"google/gemini-2.5-pro": {
|
||
"description": "Gemini 2.5 Pro مدل پرچمدار استدلال Google است که از زمینه طولانی و وظایف پیچیده پشتیبانی میکند."
|
||
},
|
||
"google/gemini-2.5-pro-free": {
|
||
"description": "نسخه رایگان Gemini 2.5 Pro که از زمینه طولانی چندوجهی با سهمیه محدود پشتیبانی میکند و برای آزمایش و جریانهای کاری سبک مناسب است."
|
||
},
|
||
"google/gemini-2.5-pro-preview": {
|
||
"description": "Gemini 2.5 Pro Preview پیشرفتهترین مدل فکری گوگل است که قادر به استدلال درباره مسائل پیچیده در زمینه کد، ریاضیات و حوزههای STEM بوده و همچنین میتواند با استفاده از متنهای طولانی، مجموعههای داده بزرگ، کدها و مستندات را تحلیل کند."
|
||
},
|
||
"google/gemini-3-pro-image-preview": {
|
||
"description": "Gemini 3 Pro Image (Nano Banana Pro) مدل تولید تصویر گوگل است که از گفتوگوی چندحالته پشتیبانی میکند."
|
||
},
|
||
"google/gemini-3-pro-image-preview-free": {
|
||
"description": "نسخه رایگان Gemini 3 Pro Image که از تولید چندوجهی با سهمیه محدود پشتیبانی میکند."
|
||
},
|
||
"google/gemini-3-pro-preview": {
|
||
"description": "Gemini 3 Pro نسل بعدی مدل استدلال چندوجهی از سری Gemini است که توانایی درک متن، صدا، تصویر، ویدیو و دیگر ورودیها را دارد و میتواند وظایف پیچیده و مخازن کد بزرگ را پردازش کند."
|
||
},
|
||
"google/gemini-3-pro-preview-free": {
|
||
"description": "نسخه پیشنمایش رایگان Gemini 3 Pro با همان تواناییهای درک و استدلال چندوجهی نسخه استاندارد، اما با محدودیتهای سهمیه و نرخ، مناسب برای تجربه و استفاده کمتکرار."
|
||
},
|
||
"google/gemini-embedding-001": {
|
||
"description": "مدل جاسازی پیشرفته با عملکرد برجسته در وظایف زبان انگلیسی، چندزبانه و کد."
|
||
},
|
||
"google/gemini-flash-1.5": {
|
||
"description": "Gemini 1.5 Flash قابلیت پردازش چندوجهی بهینهشده را ارائه میدهد و برای انواع سناریوهای پیچیده مناسب است."
|
||
},
|
||
"google/gemini-pro-1.5": {
|
||
"description": "Gemini 1.5 Pro با ترکیب آخرین فناوریهای بهینهسازی، توانایی پردازش دادههای چندحالته را با کارایی بالاتر ارائه میدهد."
|
||
},
|
||
"google/gemma-2-27b": {
|
||
"description": "Gemma 2 مدل کارآمدی است که توسط Google ارائه شده و شامل طیف وسیعی از کاربردها از برنامههای کوچک تا پردازش دادههای پیچیده است."
|
||
},
|
||
"google/gemma-2-27b-it": {
|
||
"description": "جمما ۲ ادامهدهندهی ایده طراحی سبک و کارآمد است."
|
||
},
|
||
"google/gemma-2-2b-it": {
|
||
"description": "مدل بهینهسازی دستورات سبک گوگل"
|
||
},
|
||
"google/gemma-2-9b": {
|
||
"description": "Gemma 2 مدل کارآمدی است که توسط Google ارائه شده و شامل طیف وسیعی از کاربردها از برنامههای کوچک تا پردازش دادههای پیچیده است."
|
||
},
|
||
"google/gemma-2-9b-it": {
|
||
"description": "Gemma 2 یک سری مدلهای متنی سبک و متنباز از Google است."
|
||
},
|
||
"google/gemma-2-9b-it:free": {
|
||
"description": "Gemma 2 یک سری مدلهای متن سبک و متنباز از Google است."
|
||
},
|
||
"google/gemma-2b-it": {
|
||
"description": "Gemma Instruct (2B) توانایی پردازش دستورات پایه را فراهم میکند و برای برنامههای سبک مناسب است."
|
||
},
|
||
"google/gemma-3-12b-it": {
|
||
"description": "Gemma 3 12B یک مدل زبان متنباز از گوگل است که استانداردهای جدیدی در زمینه کارایی و عملکرد ایجاد کرده است."
|
||
},
|
||
"google/gemma-3-27b-it": {
|
||
"description": "Gemma 3 27B یک مدل زبان متن باز از گوگل است که استانداردهای جدیدی را در زمینه کارایی و عملکرد تعیین کرده است."
|
||
},
|
||
"google/text-embedding-005": {
|
||
"description": "مدل جاسازی متن متمرکز بر زبان انگلیسی بهینه شده برای وظایف کد و زبان انگلیسی."
|
||
},
|
||
"google/text-multilingual-embedding-002": {
|
||
"description": "مدل جاسازی متن چندزبانه بهینه شده برای وظایف بینزبانی با پشتیبانی از زبانهای متعدد."
|
||
},
|
||
"gpt-3.5-turbo": {
|
||
"description": "GPT 3.5 توربو، مناسب برای انواع وظایف تولید و درک متن، در حال حاضر به gpt-3.5-turbo-0125 اشاره میکند"
|
||
},
|
||
"gpt-3.5-turbo-0125": {
|
||
"description": "GPT 3.5 توربو، مناسب برای انواع وظایف تولید و درک متن، در حال حاضر به gpt-3.5-turbo-0125 اشاره میکند"
|
||
},
|
||
"gpt-3.5-turbo-1106": {
|
||
"description": "GPT 3.5 توربو، مناسب برای انواع وظایف تولید و درک متن، در حال حاضر به gpt-3.5-turbo-0125 اشاره میکند"
|
||
},
|
||
"gpt-3.5-turbo-instruct": {
|
||
"description": "GPT 3.5 توربو، مناسب برای انواع وظایف تولید و درک متن، در حال حاضر به gpt-3.5-turbo-0125 اشاره میکند"
|
||
},
|
||
"gpt-35-turbo": {
|
||
"description": "GPT 3.5 Turbo، مدلی کارآمد از OpenAI، مناسب برای چت و وظایف تولید متن است و از فراخوانی توابع به صورت موازی پشتیبانی میکند."
|
||
},
|
||
"gpt-35-turbo-16k": {
|
||
"description": "GPT 3.5 Turbo 16k، مدل تولید متن با ظرفیت بالا، مناسب برای وظایف پیچیده است."
|
||
},
|
||
"gpt-4": {
|
||
"description": "GPT-4 یک پنجره متنی بزرگتر ارائه میدهد که قادر به پردازش ورودیهای متنی طولانیتر است و برای سناریوهایی که نیاز به ادغام گسترده اطلاعات و تحلیل دادهها دارند، مناسب است."
|
||
},
|
||
"gpt-4-0125-preview": {
|
||
"description": "جدیدترین مدل GPT-4 Turbo دارای قابلیتهای بصری است. اکنون درخواستهای بصری میتوانند از حالت JSON و فراخوانی توابع استفاده کنند. GPT-4 Turbo یک نسخه بهبود یافته است که پشتیبانی مقرونبهصرفهای برای وظایف چندوجهی ارائه میدهد. این مدل بین دقت و کارایی تعادل برقرار میکند و برای سناریوهای کاربردی که نیاز به تعاملات بلادرنگ دارند، مناسب است."
|
||
},
|
||
"gpt-4-0613": {
|
||
"description": "GPT-4 یک پنجره متنی بزرگتر ارائه میدهد که قادر به پردازش ورودیهای متنی طولانیتر است و برای سناریوهایی که نیاز به ادغام گسترده اطلاعات و تحلیل دادهها دارند، مناسب است."
|
||
},
|
||
"gpt-4-1106-preview": {
|
||
"description": "جدیدترین مدل GPT-4 Turbo دارای قابلیتهای بصری است. اکنون درخواستهای بصری میتوانند از حالت JSON و فراخوانی توابع استفاده کنند. GPT-4 Turbo یک نسخه بهبود یافته است که پشتیبانی مقرونبهصرفهای برای وظایف چندوجهی ارائه میدهد. این مدل بین دقت و کارایی تعادل برقرار میکند و برای سناریوهای کاربردی که نیاز به تعاملات بلادرنگ دارند، مناسب است."
|
||
},
|
||
"gpt-4-32k": {
|
||
"description": "GPT-4 یک پنجره متنی بزرگتر ارائه میدهد که قادر به پردازش ورودیهای متنی طولانیتر است و برای سناریوهایی که نیاز به ادغام گسترده اطلاعات و تحلیل دادهها دارند، مناسب است."
|
||
},
|
||
"gpt-4-32k-0613": {
|
||
"description": "GPT-4 یک پنجره متنی بزرگتر ارائه میدهد که قادر به پردازش ورودیهای متنی طولانیتر است و برای سناریوهایی که نیاز به ادغام گسترده اطلاعات و تحلیل دادهها دارند، مناسب است."
|
||
},
|
||
"gpt-4-turbo": {
|
||
"description": "جدیدترین مدل GPT-4 Turbo دارای قابلیتهای بصری است. اکنون درخواستهای بصری میتوانند از حالت JSON و فراخوانی توابع استفاده کنند. GPT-4 Turbo نسخهای بهبود یافته است که پشتیبانی مقرونبهصرفهای برای وظایف چندوجهی ارائه میدهد. این مدل بین دقت و کارایی تعادل برقرار میکند و برای سناریوهای کاربردی که نیاز به تعاملات بلادرنگ دارند، مناسب است."
|
||
},
|
||
"gpt-4-turbo-2024-04-09": {
|
||
"description": "جدیدترین مدل GPT-4 Turbo دارای قابلیتهای بصری است. اکنون درخواستهای بصری میتوانند از حالت JSON و فراخوانی توابع استفاده کنند. GPT-4 Turbo نسخهای بهبود یافته است که پشتیبانی مقرونبهصرفهای برای وظایف چندوجهی ارائه میدهد. این مدل تعادلی بین دقت و کارایی برقرار میکند و برای سناریوهای کاربردی که نیاز به تعاملات بلادرنگ دارند، مناسب است."
|
||
},
|
||
"gpt-4-turbo-preview": {
|
||
"description": "جدیدترین مدل GPT-4 Turbo دارای قابلیتهای بصری است. اکنون درخواستهای بصری میتوانند از حالت JSON و فراخوانی توابع استفاده کنند. GPT-4 Turbo یک نسخه بهبود یافته است که پشتیبانی مقرونبهصرفهای برای وظایف چندرسانهای ارائه میدهد. این مدل بین دقت و کارایی تعادل برقرار میکند و برای سناریوهای کاربردی که نیاز به تعاملات بلادرنگ دارند، مناسب است."
|
||
},
|
||
"gpt-4-vision-preview": {
|
||
"description": "جدیدترین مدل GPT-4 Turbo دارای قابلیتهای بصری است. اکنون درخواستهای بصری میتوانند از حالت JSON و فراخوانی توابع استفاده کنند. GPT-4 Turbo نسخهای پیشرفته است که پشتیبانی مقرونبهصرفهای برای وظایف چندوجهی ارائه میدهد. این مدل بین دقت و کارایی تعادل برقرار میکند و برای سناریوهای کاربردی که نیاز به تعاملات بلادرنگ دارند، مناسب است."
|
||
},
|
||
"gpt-4.1": {
|
||
"description": "GPT-4.1 مدل پرچمدار ما برای وظایف پیچیده است. این مدل برای حل مسائل در زمینههای مختلف بسیار مناسب است."
|
||
},
|
||
"gpt-4.1-mini": {
|
||
"description": "GPT-4.1 mini تعادلی بین هوش، سرعت و هزینه ارائه میدهد و آن را به مدلی جذاب در بسیاری از موارد استفاده تبدیل میکند."
|
||
},
|
||
"gpt-4.1-nano": {
|
||
"description": "GPT-4.1 mini تعادلی بین هوش، سرعت و هزینه ارائه میدهد و آن را به مدلی جذاب در بسیاری از موارد استفاده تبدیل میکند."
|
||
},
|
||
"gpt-4.5-preview": {
|
||
"description": "GPT-4.5-preview یک مدل عمومی و جدید است که دانش گستردهای از جهان دارد و درک عمیقتری از نیت کاربران ارائه میدهد؛ در انجام وظایف خلاقانه و برنامهریزی بهعنوان عامل (agent planning) توانمند است. دانش این مدل تا اکتبر ۲۰۲۳ بهروز است."
|
||
},
|
||
"gpt-4o": {
|
||
"description": "پیشرفتهترین مدل چندوجهی در سری GPT-4 OpenAI که میتواند ورودیهای متنی و تصویری را پردازش کند."
|
||
},
|
||
"gpt-4o-2024-05-13": {
|
||
"description": "ChatGPT-4o یک مدل پویا است که بهصورت زنده بهروزرسانی میشود تا همیشه نسخهی جدید و بهروز باشد. این مدل ترکیبی از تواناییهای قوی در درک و تولید زبان است و برای کاربردهای گسترده مانند خدمات مشتری، آموزش و پشتیبانی فنی مناسب است."
|
||
},
|
||
"gpt-4o-2024-08-06": {
|
||
"description": "ChatGPT-4o یک مدل پویا است که بهصورت لحظهای بهروزرسانی میشود تا همیشه نسخهی جدید و بهروز باشد. این مدل ترکیبی از تواناییهای قوی در درک و تولید زبان است و برای کاربردهای گسترده مانند خدمات مشتری، آموزش و پشتیبانی فنی مناسب است."
|
||
},
|
||
"gpt-4o-2024-11-20": {
|
||
"description": "ChatGPT-4o یک مدل پویا است که به طور مداوم بهروز رسانی میشود تا نسخه فعلی و جدیدی را حفظ کند. این مدل قدرت فهم و تولید زبان را ترکیب کرده و مناسب برای کاربردهای مقیاس بزرگ مانند خدمات مشتری، آموزش و پشتیبانی فنی است."
|
||
},
|
||
"gpt-4o-audio-preview": {
|
||
"description": "مدل پیشنمایش صوتی GPT-4o که از ورودی و خروجی صوتی پشتیبانی میکند."
|
||
},
|
||
"gpt-4o-mini": {
|
||
"description": "یک راهحل هوش مصنوعی مقرونبهصرفه که برای انواع وظایف متنی و تصویری مناسب است."
|
||
},
|
||
"gpt-4o-mini-audio-preview": {
|
||
"description": "مدل GPT-4o mini Audio که از ورودی و خروجی صوتی پشتیبانی میکند."
|
||
},
|
||
"gpt-4o-mini-realtime-preview": {
|
||
"description": "نسخه زنده GPT-4o-mini، پشتیبانی از ورودی و خروجی صوتی و متنی به صورت زنده."
|
||
},
|
||
"gpt-4o-mini-search-preview": {
|
||
"description": "نسخه پیشنمایش جستجوی GPT-4o mini مدلی است که به طور خاص برای درک و اجرای پرسشهای جستجوی وب آموزش دیده است و از API تکمیل چت استفاده میکند. علاوه بر هزینه توکنها، هر پرسش جستجوی وب بر اساس هر بار فراخوانی ابزار هزینه دریافت میکند."
|
||
},
|
||
"gpt-4o-mini-transcribe": {
|
||
"description": "GPT-4o Mini Transcribe یک مدل تبدیل گفتار به متن است که از GPT-4o برای رونویسی صوت استفاده میکند. نسبت به مدل اصلی Whisper، نرخ خطای کلمات را کاهش داده و دقت و شناسایی زبان را بهبود بخشیده است. از آن برای دریافت رونویسی دقیقتر استفاده کنید."
|
||
},
|
||
"gpt-4o-mini-tts": {
|
||
"description": "GPT-4o mini TTS یک مدل تبدیل متن به گفتار است که بر اساس GPT-4o mini ساخته شده است و با قیمت پایین تری از GPT-4o mini ارائه میدهد."
|
||
},
|
||
"gpt-4o-realtime-preview": {
|
||
"description": "نسخه زنده GPT-4o، پشتیبانی از ورودی و خروجی صوتی و متنی به صورت زنده."
|
||
},
|
||
"gpt-4o-realtime-preview-2024-10-01": {
|
||
"description": "نسخه زنده GPT-4o، پشتیبانی از ورودی و خروجی صوتی و متنی به صورت زنده."
|
||
},
|
||
"gpt-4o-realtime-preview-2025-06-03": {
|
||
"description": "نسخه بلادرنگ GPT-4o که از ورودی و خروجی همزمان صوت و متن پشتیبانی میکند."
|
||
},
|
||
"gpt-4o-search-preview": {
|
||
"description": "نسخه پیشنمایش جستجوی GPT-4o مدلی است که به طور خاص برای درک و اجرای پرسشهای جستجوی وب آموزش دیده است و از API تکمیل چت استفاده میکند. علاوه بر هزینه توکنها، هر پرسش جستجوی وب بر اساس هر بار فراخوانی ابزار هزینه دریافت میکند."
|
||
},
|
||
"gpt-4o-transcribe": {
|
||
"description": "GPT-4o Transcribe یک مدل تبدیل گفتار به متن است که از GPT-4o برای رونویسی صوت استفاده میکند. نسبت به مدل اصلی Whisper، نرخ خطای کلمات را کاهش داده و دقت و شناسایی زبان را بهبود بخشیده است. از آن برای دریافت رونویسی دقیقتر استفاده کنید."
|
||
},
|
||
"gpt-5": {
|
||
"description": "بهترین مدل برای کدگذاری و وظایف نمایندگی در حوزههای مختلف. GPT-5 جهشی در دقت، سرعت، استدلال، درک زمینه، تفکر ساختاری و حل مسئله ایجاد کرده است."
|
||
},
|
||
"gpt-5-chat": {
|
||
"description": "نسخه پیشنمایش GPT-5 Chat که برای سناریوهای مکالمهای بهینهسازی شده است. از ورودی متنی و تصویری پشتیبانی میکند و فقط خروجی متنی ارائه میدهد. مناسب برای رباتهای گفتگو و برنامههای هوش مصنوعی مکالمهمحور."
|
||
},
|
||
"gpt-5-chat-latest": {
|
||
"description": "مدل GPT-5 استفاده شده در ChatGPT. ترکیبی از درک و تولید زبان قدرتمند، مناسب برای برنامههای تعاملی گفتگو محور."
|
||
},
|
||
"gpt-5-codex": {
|
||
"description": "GPT-5 Codex نسخهای از GPT-5 است که برای وظایف کدنویسی نمایندگی در محیطهای Codex یا مشابه بهینه شده است."
|
||
},
|
||
"gpt-5-mini": {
|
||
"description": "نسخهای سریعتر و اقتصادیتر از GPT-5، مناسب برای وظایف با تعریف واضح. در حالی که کیفیت خروجی بالا حفظ میشود، پاسخگویی سریعتری ارائه میدهد."
|
||
},
|
||
"gpt-5-nano": {
|
||
"description": "سریعترین و اقتصادیترین نسخه GPT-5. بسیار مناسب برای کاربردهایی که نیاز به پاسخ سریع و حساسیت به هزینه دارند."
|
||
},
|
||
"gpt-5-pro": {
|
||
"description": "GPT-5 pro با استفاده از محاسبات بیشتر، عمیقتر میاندیشد و به طور مداوم پاسخهای بهتری ارائه میدهد."
|
||
},
|
||
"gpt-5.1": {
|
||
"description": "GPT-5.1 — مدل پرچمدار بهینهسازیشده برای وظایف کدنویسی و عاملها، با پشتیبانی از شدت استدلال قابل تنظیم و زمینههای طولانیتر."
|
||
},
|
||
"gpt-5.1-chat-latest": {
|
||
"description": "GPT-5.1 Chat: نسخهای از GPT-5.1 برای ChatGPT، مناسب برای سناریوهای گفتگو."
|
||
},
|
||
"gpt-5.1-codex": {
|
||
"description": "GPT-5.1 Codex: نسخهای از GPT-5.1 بهینهسازیشده برای وظایف کدنویسی عاملمحور، قابل استفاده در API پاسخها برای جریانهای کاری پیچیدهتر در زمینه کد و عاملها."
|
||
},
|
||
"gpt-5.1-codex-mini": {
|
||
"description": "GPT-5.1 Codex mini: نسخهای کوچکتر و مقرونبهصرفهتر از Codex، بهینهسازیشده برای وظایف کدنویسی عاملمحور."
|
||
},
|
||
"gpt-audio": {
|
||
"description": "GPT Audio مدلی عمومی برای چت با ورودی و خروجی صوتی است که از استفاده از ورودی/خروجی صوتی در API تکمیل چت پشتیبانی میکند."
|
||
},
|
||
"gpt-image-1": {
|
||
"description": "مدل تولید تصویر چندرسانهای بومی ChatGPT"
|
||
},
|
||
"gpt-image-1-mini": {
|
||
"description": "نسخهای مقرونبهصرفهتر از GPT Image 1 که بهصورت بومی از ورودیهای متنی و تصویری پشتیبانی میکند و خروجی تصویری تولید مینماید."
|
||
},
|
||
"gpt-oss-120b": {
|
||
"description": "برای استفاده از این مدل نیاز به درخواست دسترسی میباشد. GPT-OSS-120B یک مدل زبان بزرگ متنباز از OpenAI است که توانایی بالایی در تولید متن دارد."
|
||
},
|
||
"gpt-oss-20b": {
|
||
"description": "برای استفاده از این مدل نیاز به درخواست دسترسی میباشد. GPT-OSS-20B یک مدل زبان میانرده متنباز از OpenAI است که توانایی تولید متن بهصورت کارآمد را دارد."
|
||
},
|
||
"gpt-oss:120b": {
|
||
"description": "GPT-OSS 120B یک مدل زبان بزرگ متنباز منتشر شده توسط OpenAI است که از فناوری کوانتیزاسیون MXFP4 بهره میبرد و به عنوان مدل پرچمدار شناخته میشود. این مدل نیازمند محیطی با چند GPU یا ایستگاه کاری با عملکرد بالا برای اجرا است و در استدلال پیچیده، تولید کد و پردازش چندزبانه عملکردی برجسته دارد و از فراخوانی توابع پیشرفته و یکپارچهسازی ابزارها پشتیبانی میکند."
|
||
},
|
||
"gpt-oss:20b": {
|
||
"description": "GPT-OSS 20B مدل زبان بزرگ متنباز منتشر شده توسط OpenAI است که از تکنولوژی کوانتیزاسیون MXFP4 بهره میبرد و برای اجرا روی GPUهای مصرفی پیشرفته یا مکهای مجهز به Apple Silicon مناسب است. این مدل در تولید گفتگو، کدنویسی و وظایف استنتاج عملکرد برجستهای دارد و از فراخوانی توابع و استفاده از ابزارها پشتیبانی میکند."
|
||
},
|
||
"gpt-realtime": {
|
||
"description": "مدل عمومی زمان واقعی که از ورودی و خروجی متنی و صوتی به صورت زنده پشتیبانی میکند و همچنین ورودی تصویر را نیز قبول میکند."
|
||
},
|
||
"grok-2-image-1212": {
|
||
"description": "جدیدترین مدل تولید تصویر ما قادر است تصاویر زنده و واقعی را بر اساس متن توصیفی تولید کند. این مدل در زمینه تولید تصویر برای بازاریابی، رسانههای اجتماعی و سرگرمی عملکرد برجستهای دارد."
|
||
},
|
||
"grok-2-vision-1212": {
|
||
"description": "این مدل در دقت، پیروی از دستورات و توانایی چند زبانه بهبود یافته است."
|
||
},
|
||
"grok-3": {
|
||
"description": "مدل پرچمدار که در استخراج داده، برنامهنویسی و خلاصهسازی متن برای کاربردهای سازمانی مهارت دارد و دانش عمیقی در حوزههای مالی، پزشکی، حقوقی و علمی دارد."
|
||
},
|
||
"grok-3-mini": {
|
||
"description": "مدل سبکوزن که قبل از پاسخگویی تفکر میکند. سریع و هوشمند اجرا میشود، مناسب برای وظایف منطقی که نیاز به دانش عمیق حوزه ندارند و میتواند مسیر تفکر اصلی را ارائه دهد."
|
||
},
|
||
"grok-4": {
|
||
"description": "جدیدترین و قدرتمندترین مدل پرچمدار ما که در پردازش زبان طبیعی، محاسبات ریاضی و استدلال عملکردی برجسته دارد — یک انتخاب همهکاره بینظیر است."
|
||
},
|
||
"grok-4-0709": {
|
||
"description": "Grok 4 از xAI با توانایی استدلال قدرتمند."
|
||
},
|
||
"grok-4-1-fast-non-reasoning": {
|
||
"description": "مدل پیشرفته چندوجهی که بهطور ویژه برای بهینهسازی فراخوانی ابزارهای نماینده با عملکرد بالا طراحی شده است."
|
||
},
|
||
"grok-4-1-fast-reasoning": {
|
||
"description": "مدل پیشرفته چندوجهی که بهطور ویژه برای بهینهسازی فراخوانی ابزارهای نماینده با عملکرد بالا طراحی شده است."
|
||
},
|
||
"grok-4-fast-non-reasoning": {
|
||
"description": "خوشحالیم که Grok 4 Fast را منتشر میکنیم، که جدیدترین پیشرفت ما در زمینه مدلهای استنتاج با صرفهجویی در هزینه است."
|
||
},
|
||
"grok-4-fast-reasoning": {
|
||
"description": "خوشحالیم که Grok 4 Fast را منتشر میکنیم، که جدیدترین پیشرفت ما در زمینه مدلهای استنتاج با صرفهجویی در هزینه است."
|
||
},
|
||
"grok-code-fast-1": {
|
||
"description": "ما خوشحالیم که grok-code-fast-1 را معرفی کنیم، مدلی سریع و مقرونبهصرفه برای استنتاج که در کدگذاری نماینده عملکرد برجستهای دارد."
|
||
},
|
||
"groq/compound": {
|
||
"description": "Compound یک سیستم هوش مصنوعی ترکیبی است که توسط چندین مدل متنباز موجود در GroqCloud پشتیبانی میشود و میتواند بهصورت هوشمند و انتخابی از ابزارها برای پاسخ به پرسشهای کاربران استفاده کند."
|
||
},
|
||
"groq/compound-mini": {
|
||
"description": "Compound-mini یک سیستم هوش مصنوعی ترکیبی است که توسط مدلهای متنباز موجود در GroqCloud پشتیبانی میشود و میتواند بهصورت هوشمند و انتخابی از ابزارها برای پاسخ به پرسشهای کاربران استفاده کند."
|
||
},
|
||
"gryphe/mythomax-l2-13b": {
|
||
"description": "MythoMax l2 13B یک مدل زبانی است که خلاقیت و هوش را با ترکیب چندین مدل برتر به هم پیوند میدهد."
|
||
},
|
||
"hunyuan-a13b": {
|
||
"description": "اولین مدل استدلال ترکیبی Hunyuan، نسخه ارتقا یافته hunyuan-standard-256K با 80 میلیارد پارامتر کل و 13 میلیارد پارامتر فعال است. حالت پیشفرض آن حالت تفکر کند است و از طریق پارامتر یا دستور میتوان بین حالتهای تفکر سریع و کند جابجا شد؛ روش جابجایی با افزودن /no_think قبل از پرسش انجام میشود. توانایی کلی نسبت به نسل قبلی بهبود یافته است، بهویژه در ریاضیات، علوم، درک متون بلند و قابلیتهای عامل."
|
||
},
|
||
"hunyuan-code": {
|
||
"description": "مدل تولید کد جدید Hunyuan، که با استفاده از 200 میلیارد داده کد با کیفیت بالا آموزش داده شده است. این مدل پایه پس از شش ماه آموزش با دادههای SFT با کیفیت بالا بهروزرسانی شده است. طول پنجره متن به ۸ هزار کاراکتر افزایش یافته و در شاخصهای ارزیابی خودکار تولید کد در پنج زبان اصلی در رتبههای برتر قرار دارد. در ارزیابیهای دستی با کیفیت بالا برای ۱۰ معیار مختلف در پنج زبان اصلی، عملکرد این مدل در رده اول قرار دارد."
|
||
},
|
||
"hunyuan-functioncall": {
|
||
"description": "مدل FunctionCall با معماری MOE جدید Hunyuan، آموزشدیده با دادههای باکیفیت FunctionCall، با پنجره متنی تا 32K و پیشرو در چندین شاخص ارزیابی."
|
||
},
|
||
"hunyuan-large": {
|
||
"description": "مدل Hunyuan-large دارای مجموع پارامترها حدود 389B و پارامترهای فعال حدود 52B است، که بزرگترین و بهترین مدل MoE با ساختار Transformer در صنعت به شمار میرود."
|
||
},
|
||
"hunyuan-large-longcontext": {
|
||
"description": "متخصص در پردازش وظایف متنی طولانی مانند خلاصهسازی اسناد و پرسش و پاسخ اسنادی، همچنین توانایی پردازش وظایف تولید متن عمومی را دارد. در تحلیل و تولید متنهای طولانی عملکرد فوقالعادهای دارد و میتواند بهطور مؤثر به نیازهای پیچیده و دقیق پردازش محتوای طولانی پاسخ دهد."
|
||
},
|
||
"hunyuan-large-vision": {
|
||
"description": "این مدل برای سناریوهای درک تصویر و متن مناسب است، یک مدل بزرگ زبان-بینایی مبتنی بر Hunyuan Large است که از ورودی چند تصویر با هر رزولوشن به همراه متن پشتیبانی میکند و محتوای متنی تولید میکند. تمرکز بر وظایف مرتبط با درک تصویر و متن دارد و در توانایی درک چندزبانه تصویر و متن بهبود قابل توجهی یافته است."
|
||
},
|
||
"hunyuan-lite": {
|
||
"description": "به ساختار MOE ارتقا یافته است، پنجره متنی 256k دارد و در چندین مجموعه ارزیابی در زمینههای NLP، کد، ریاضیات و صنایع از بسیاری از مدلهای متنباز پیشی گرفته است."
|
||
},
|
||
"hunyuan-lite-vision": {
|
||
"description": "مدل چندرسانهای 7B جدید Hunyuan، با پنجره زمینه 32K، از گفتگوی چندرسانهای در صحنههای چینی و انگلیسی، شناسایی اشیاء در تصاویر، درک جداول اسناد و ریاضیات چندرسانهای پشتیبانی میکند و در چندین بعد، معیارهای ارزیابی را نسبت به مدلهای رقیب 7B بهبود میبخشد."
|
||
},
|
||
"hunyuan-pro": {
|
||
"description": "مدل MOE-32K با مقیاس پارامتر تریلیونها. در انواع بنچمارکها به سطح پیشرو مطلق دست یافته است، توانایی پردازش دستورالعملها و استدلالهای پیچیده، دارای قابلیتهای ریاضی پیچیده، پشتیبانی از functioncall، و بهطور ویژه در حوزههای ترجمه چندزبانه، مالی، حقوقی و پزشکی بهینهسازی شده است."
|
||
},
|
||
"hunyuan-role": {
|
||
"description": "جدیدترین مدل نقشآفرینی HunYuan، مدل نقشآفرینی بهدقت تنظیمشده توسط تیم رسمی HunYuan، که بر اساس مدل HunYuan و با استفاده از مجموعه دادههای صحنههای نقشآفرینی آموزش بیشتری دیده است و در صحنههای نقشآفرینی عملکرد بهتری دارد."
|
||
},
|
||
"hunyuan-standard": {
|
||
"description": "استفاده از استراتژی مسیریابی بهینهتر، در حالی که مشکلات توازن بار و همگرایی متخصصان را کاهش میدهد. در زمینه متون طولانی، شاخص «یافتن سوزن در انبار کاه» به ۹۹.۹٪ میرسد. MOE-32K از نظر هزینه و عملکرد نسبتاً بهینهتر است و در عین حال که تعادل بین اثر و قیمت را حفظ میکند، میتواند پردازش ورودیهای متون طولانی را نیز انجام دهد."
|
||
},
|
||
"hunyuan-standard-256K": {
|
||
"description": "با استفاده از استراتژی مسیریابی بهینهتر، در عین حال مشکلات توازن بار و همگرایی کارشناسان را کاهش داده است. در زمینه متون طولانی، شاخص «یافتن سوزن در انبار کاه» به ۹۹.۹٪ رسیده است. MOE-256K در طول و عملکرد پیشرفت بیشتری داشته و به طور قابل توجهی طول ورودی قابل قبول را گسترش داده است."
|
||
},
|
||
"hunyuan-standard-vision": {
|
||
"description": "مدل چندرسانهای جدید Hunyuan، از پاسخگویی به چند زبان پشتیبانی میکند و تواناییهای چینی و انگلیسی را بهطور متوازن ارائه میدهد."
|
||
},
|
||
"hunyuan-t1-20250321": {
|
||
"description": "مدلهای تواناییهای علمی و انسانی را به طور کامل ایجاد میکند و توانایی بالایی در ضبط اطلاعات متنی طولانی دارد. از استدلال برای پاسخ به مسائل علمی مختلف با درجات سختی متفاوت در ریاضیات/منطق/علم/کد و غیره پشتیبانی میکند."
|
||
},
|
||
"hunyuan-t1-20250403": {
|
||
"description": "افزایش توانایی تولید کد در سطح پروژه؛ بهبود کیفیت نوشتار تولید متن؛ ارتقاء توانایی درک موضوعات چندمرحلهای، پیروی از دستورات tob و درک واژگان؛ بهینهسازی مشکلات خروجی ترکیبی از زبانهای ساده و سنتی و همچنین ترکیب چینی و انگلیسی."
|
||
},
|
||
"hunyuan-t1-20250529": {
|
||
"description": "بهینهسازی تولید متن، نوشتن مقاله، بهبود تواناییهای کدنویسی فرانتاند، ریاضیات، استدلال منطقی و علوم پایه، و ارتقاء توانایی پیروی از دستورالعملها."
|
||
},
|
||
"hunyuan-t1-20250711": {
|
||
"description": "افزایش قابل توجه در تواناییهای ریاضی، منطقی و کدنویسی پیچیده، بهینهسازی پایداری خروجی مدل و ارتقاء توانایی مدل در پردازش متون طولانی."
|
||
},
|
||
"hunyuan-t1-latest": {
|
||
"description": "تواناییهای مدل اصلی تفکر کند بهطور قابل توجهی در زمینههای ریاضیات پیشرفته، استدلال پیچیده، کدهای دشوار، پیروی از دستورالعملها و کیفیت تولید متن بهبود یافته است."
|
||
},
|
||
"hunyuan-t1-vision-20250619": {
|
||
"description": "جدیدترین مدل تفکر عمیق چندرسانهای t1-vision از Hunyuan که از زنجیره تفکر بلند چندرسانهای بومی پشتیبانی میکند و نسبت به نسخه پیشفرض نسل قبلی به طور کامل بهبود یافته است."
|
||
},
|
||
"hunyuan-t1-vision-20250916": {
|
||
"description": "جدیدترین نسخه مدل بینایی عمیق Hunyuan t1-vision، نسبت به نسخه قبلی در وظایفی مانند پرسش و پاسخ تصویری عمومی، مکانیابی بصری، OCR، نمودارها، حل مسائل از روی عکس و خلق آثار از روی تصویر، بهطور جامع بهبود یافته و توانایی آن در زبان انگلیسی و زبانهای کمکاربرد بهطور چشمگیری ارتقا یافته است."
|
||
},
|
||
"hunyuan-turbo": {
|
||
"description": "نسخه پیشنمایش مدل زبان بزرگ نسل جدید HunYuan که از ساختار مدل متخصص ترکیبی (MoE) جدید استفاده میکند. در مقایسه با hunyuan-pro، کارایی استنتاج سریعتر و عملکرد بهتری دارد."
|
||
},
|
||
"hunyuan-turbo-20241223": {
|
||
"description": "بهینهسازیهای این نسخه: مقیاسدهی دستورات داده، بهطور قابل توجهی توانایی تعمیم عمومی مدل را افزایش میدهد؛ بهطور قابل توجهی تواناییهای ریاضی، کدنویسی و استدلال منطقی را بهبود میبخشد؛ بهینهسازی تواناییهای درک متن و کلمات مرتبط با آن؛ بهینهسازی کیفیت تولید محتوای خلق متن."
|
||
},
|
||
"hunyuan-turbo-latest": {
|
||
"description": "بهینهسازی تجربه عمومی، شامل درک NLP، خلق متن، گپزنی، پرسش و پاسخ دانش، ترجمه و حوزههای مختلف؛ افزایش انساننمایی، بهینهسازی هوش عاطفی مدل؛ افزایش توانایی مدل در روشنسازی فعال زمانی که نیت مبهم است؛ افزایش توانایی پردازش مسائل مربوط به تجزیه و تحلیل کلمات؛ افزایش کیفیت و قابلیت تعامل در خلق محتوا؛ بهبود تجربه چند دور."
|
||
},
|
||
"hunyuan-turbo-vision": {
|
||
"description": "مدل بزرگ زبان بصری نسل جدید Hunyuan، با استفاده از ساختار جدید مدلهای متخصص ترکیبی (MoE)، در تواناییهای مربوط به درک تصویر و متن، خلق محتوا، پرسش و پاسخ دانش و تحلیل استدلال نسبت به مدلهای نسل قبلی بهطور جامع بهبود یافته است."
|
||
},
|
||
"hunyuan-turbos-20250313": {
|
||
"description": "یکسانسازی سبک مراحل حل مسائل ریاضی، تقویت پرسش و پاسخ چندمرحلهای ریاضی. بهینهسازی سبک پاسخ در تولید متن، حذف حس مصنوعی هوش مصنوعی و افزودن زیبایی ادبی."
|
||
},
|
||
"hunyuan-turbos-20250416": {
|
||
"description": "ارتقاء پایه پیشآموزش، تقویت توانایی درک و پیروی از دستورات پایه؛ تقویت مهارتهای علوم پایه مانند ریاضیات، کد نویسی، منطق و علوم؛ بهبود کیفیت نوشتار خلاقانه، درک متن، دقت ترجمه و پاسخ به سوالات دانش؛ تقویت تواناییهای عاملهای حوزههای مختلف، با تمرکز ویژه بر درک گفتگوی چندمرحلهای."
|
||
},
|
||
"hunyuan-turbos-20250604": {
|
||
"description": "ارتقاء پایه پیشآموزش، بهبود تواناییهای نوشتن و درک مطلب، افزایش قابل توجه تواناییهای کدنویسی و علوم پایه، و بهبود مستمر در پیروی از دستورات پیچیده."
|
||
},
|
||
"hunyuan-turbos-20250926": {
|
||
"description": "ارتقاء کیفیت دادههای پایه پیشآموزش. بهینهسازی استراتژی آموزش در مرحله پسآموزش، با هدف بهبود مستمر قابلیتهای عامل، زبانهای کوچک انگلیسی، پیروی از دستورات، کدنویسی و علوم پایه."
|
||
},
|
||
"hunyuan-turbos-latest": {
|
||
"description": "hunyuan-TurboS آخرین نسخه مدل بزرگ پرچمدار مختلط است که دارای توانایی تفکر قویتر و تجربه بهتری است."
|
||
},
|
||
"hunyuan-turbos-longtext-128k-20250325": {
|
||
"description": "این مدل در پردازش وظایف متنی طولانی مانند خلاصهسازی و پرسش و پاسخ مستندات مهارت دارد و همچنین توانایی پردازش وظایف تولید متن عمومی را دارد. در تحلیل و تولید متنهای طولانی عملکرد فوقالعادهای دارد و میتواند بهطور مؤثر به نیازهای پیچیده و دقیق پردازش محتوای طولانی پاسخ دهد."
|
||
},
|
||
"hunyuan-turbos-role-plus": {
|
||
"description": "جدیدترین مدل نقشآفرینی Hunyuan، مدل نقشآفرینی تنظیمشده رسمی Hunyuan است که بر اساس مدل Hunyuan و دادههای سناریوی نقشآفرینی آموزش افزایشی دیده است و در سناریوهای نقشآفرینی عملکرد پایه بهتری دارد."
|
||
},
|
||
"hunyuan-turbos-vision": {
|
||
"description": "این مدل برای سناریوهای درک تصویر و متن مناسب است و بر اساس جدیدترین مدل turbos از Hunyuan ساخته شده است. این مدل پرچمدار زبان تصویری نسل جدید است که بر وظایف مرتبط با درک تصویر و متن تمرکز دارد، از جمله شناسایی موجودیتهای مبتنی بر تصویر، پرسش و پاسخ دانش، خلق متن تبلیغاتی و حل مسائل با عکسبرداری. نسبت به نسل قبلی به طور کامل بهبود یافته است."
|
||
},
|
||
"hunyuan-turbos-vision-20250619": {
|
||
"description": "جدیدترین مدل پرچمدار زبان تصویری turbos-vision از Hunyuan که در وظایف مرتبط با درک تصویر و متن، از جمله شناسایی موجودیتهای مبتنی بر تصویر، پرسش و پاسخ دانش، خلق متن تبلیغاتی و حل مسائل با عکسبرداری، نسبت به نسخه پیشفرض نسل قبلی به طور کامل بهبود یافته است."
|
||
},
|
||
"hunyuan-vision": {
|
||
"description": "جدیدترین مدل چندوجهی هونیوان، پشتیبانی از ورودی تصویر + متن برای تولید محتوای متنی."
|
||
},
|
||
"image-01": {
|
||
"description": "مدل جدید تولید تصویر با نمایش ظریف و پشتیبانی از تولید تصویر از متن و تصویر."
|
||
},
|
||
"image-01-live": {
|
||
"description": "مدل تولید تصویر با نمایش ظریف که از تولید تصویر از متن پشتیبانی میکند و امکان تنظیم سبک نقاشی را دارد."
|
||
},
|
||
"imagen-4.0-fast-generate-001": {
|
||
"description": "سری مدلهای متنبهتصویر Imagen، نسل چهارم، نسخهٔ سریع"
|
||
},
|
||
"imagen-4.0-generate-001": {
|
||
"description": "سری مدلهای Imagen نسل چهارم برای تولید تصویر از متن"
|
||
},
|
||
"imagen-4.0-generate-preview-06-06": {
|
||
"description": "سری مدلهای نسل چهارم Imagen برای تولید تصویر از متن"
|
||
},
|
||
"imagen-4.0-ultra-generate-001": {
|
||
"description": "نسخهٔ اولترا از مجموعهٔ مدلهای متنبهتصویر Imagen نسل چهارم"
|
||
},
|
||
"imagen-4.0-ultra-generate-preview-06-06": {
|
||
"description": "نسخه Ultra از سری مدلهای نسل چهارم Imagen برای تولید تصویر از متن"
|
||
},
|
||
"inception/mercury-coder-small": {
|
||
"description": "Mercury Coder Small انتخاب ایدهآل برای تولید، اشکالزدایی و بازسازی کد با کمترین تأخیر است."
|
||
},
|
||
"inclusionAI/Ling-flash-2.0": {
|
||
"description": "Ling-flash-2.0 سومین مدل از سری معماری Ling 2.0 است که توسط تیم Bailing شرکت Ant Group منتشر شده است. این مدل یک مدل متخصص ترکیبی (MoE) با ۱۰۰ میلیارد پارامتر کل است که در هر توکن تنها ۶.۱ میلیارد پارامتر فعال میشوند (۴.۸ میلیارد غیر بردار کلمه). به عنوان یک مدل با پیکربندی سبک، Ling-flash-2.0 در چندین ارزیابی معتبر عملکردی برابر یا حتی فراتر از مدلهای متراکم ۴۰ میلیارد پارامتری و مدلهای MoE بزرگتر نشان داده است. هدف این مدل کشف مسیرهای کارآمد در چارچوب «مدل بزرگ برابر است با پارامتر بزرگ» از طریق طراحی معماری و استراتژیهای آموزش بهینه است."
|
||
},
|
||
"inclusionAI/Ling-mini-2.0": {
|
||
"description": "Ling-mini-2.0 یک مدل زبان بزرگ کوچکحجم و با عملکرد بالا مبتنی بر معماری MoE است. این مدل دارای ۱۶ میلیارد پارامتر کل است اما در هر توکن تنها ۱.۴ میلیارد پارامتر فعال میشوند (۷۸۹ میلیون غیر بردار کلمه)، که سرعت تولید بسیار بالایی را فراهم میکند. به لطف طراحی کارآمد MoE و دادههای آموزشی بزرگ و با کیفیت، با وجود فعال بودن تنها ۱.۴ میلیارد پارامتر، Ling-mini-2.0 در وظایف پاییندستی عملکردی در سطح مدلهای متراکم زیر ۱۰ میلیارد و مدلهای MoE بزرگتر ارائه میدهد."
|
||
},
|
||
"inclusionAI/Ring-flash-2.0": {
|
||
"description": "Ring-flash-2.0 مدلی با عملکرد بالا برای تفکر است که بر پایه Ling-flash-2.0-base بهینهسازی عمیق شده است. این مدل از معماری متخصص ترکیبی (MoE) با ۱۰۰ میلیارد پارامتر کل بهره میبرد اما در هر استنتاج تنها ۶.۱ میلیارد پارامتر فعال میشوند. این مدل با الگوریتم ابتکاری icepop مشکل ناپایداری مدلهای بزرگ MoE در آموزش تقویتی (RL) را حل کرده و توانایی استنتاج پیچیده آن در طول آموزشهای بلندمدت بهبود مییابد. Ring-flash-2.0 در مسابقات ریاضی، تولید کد و استدلال منطقی در چندین بنچمارک دشوار پیشرفت قابل توجهی داشته است و عملکرد آن نه تنها از مدلهای متراکم برتر زیر ۴۰ میلیارد پارامتر فراتر رفته، بلکه با مدلهای MoE متنباز بزرگتر و مدلهای تفکر با عملکرد بالا و بسته رقابت میکند. اگرچه این مدل بر استنتاج پیچیده تمرکز دارد، در وظایف خلاقانه نوشتاری نیز عملکرد خوبی دارد. علاوه بر این، به لطف طراحی معماری کارآمد، Ring-flash-2.0 ضمن ارائه عملکرد قدرتمند، استنتاج سریع را ممکن ساخته و هزینه استقرار مدلهای تفکر در شرایط بار بالا را به طور قابل توجهی کاهش میدهد."
|
||
},
|
||
"inclusionai/ling-1t": {
|
||
"description": "Ling-1T مدل MoE با ظرفیت 1 تریلیون پارامتر از inclusionAI است که برای وظایف استدلالی شدید و زمینههای بزرگ بهینه شده است."
|
||
},
|
||
"inclusionai/ling-flash-2.0": {
|
||
"description": "Ling-flash-2.0 مدل MoE از inclusionAI است که برای بهرهوری و عملکرد استدلالی بهینه شده و برای وظایف متوسط تا بزرگ مناسب است."
|
||
},
|
||
"inclusionai/ling-mini-2.0": {
|
||
"description": "Ling-mini-2.0 نسخه سبک مدل MoE از inclusionAI است که با حفظ توانایی استدلال، هزینهها را بهطور قابل توجهی کاهش میدهد."
|
||
},
|
||
"inclusionai/ming-flash-omini-preview": {
|
||
"description": "Ming-flash-omni Preview مدل چندوجهی از inclusionAI است که از ورودیهای صوتی، تصویری و ویدیویی پشتیبانی میکند و تواناییهای رندر تصویر و تشخیص صدا را بهینه کرده است."
|
||
},
|
||
"inclusionai/ring-1t": {
|
||
"description": "Ring-1T مدل MoE با ظرفیت تریلیونی از inclusionAI است که برای استدلال در مقیاس بزرگ و وظایف تحقیقاتی مناسب است."
|
||
},
|
||
"inclusionai/ring-flash-2.0": {
|
||
"description": "Ring-flash-2.0 نسخهای از مدل Ring از inclusionAI است که برای سناریوهای با حجم بالا طراحی شده و بر سرعت و بهرهوری هزینه تأکید دارد."
|
||
},
|
||
"inclusionai/ring-mini-2.0": {
|
||
"description": "Ring-mini-2.0 نسخه سبک و با حجم بالا از مدل MoE inclusionAI است که عمدتاً برای سناریوهای همزمانی بالا استفاده میشود."
|
||
},
|
||
"internlm/internlm2_5-7b-chat": {
|
||
"description": "InternLM2.5 راهحلهای گفتگوی هوشمند در چندین سناریو ارائه میدهد."
|
||
},
|
||
"internlm2.5-latest": {
|
||
"description": "جدیدترین سری مدلهای ما با عملکرد استدلال عالی، از طول متن ۱M پشتیبانی میکند و تواناییهای قویتری در پیروی از دستورات و فراخوانی ابزارها دارد."
|
||
},
|
||
"internlm3-latest": {
|
||
"description": "سری جدیدترین مدلهای ما با عملکرد استدلال برجسته، پیشتاز مدلهای متنباز در همان سطح هستند. به طور پیشفرض به جدیدترین مدلهای سری InternLM3 ما اشاره دارد."
|
||
},
|
||
"internvl2.5-38b-mpo": {
|
||
"description": "InternVL2.5 38B MPO، مدل پیشآموزش چندوجهی، پشتیبانی از وظایف پیچیده استنتاج تصویر و متن."
|
||
},
|
||
"internvl2.5-latest": {
|
||
"description": "ما هنوز در حال نگهداری نسخه InternVL2.5 هستیم که دارای عملکرد عالی و پایدار است. به طور پیشفرض به جدیدترین مدلهای سری InternVL2.5 ما اشاره دارد که در حال حاضر به internvl2.5-78b اشاره دارد."
|
||
},
|
||
"internvl3-14b": {
|
||
"description": "InternVL3 14B، مدل چندوجهی با مقیاس متوسط، با تعادل بین عملکرد و هزینه."
|
||
},
|
||
"internvl3-1b": {
|
||
"description": "InternVL3 1B، مدل چندوجهی سبک، مناسب برای استقرار در محیطهای با منابع محدود."
|
||
},
|
||
"internvl3-38b": {
|
||
"description": "InternVL3 38B، مدل بزرگ چندوجهی متنباز، مناسب برای وظایف درک تصویر و متن با دقت بالا."
|
||
},
|
||
"internvl3-latest": {
|
||
"description": "ما جدیدترین مدل بزرگ چندرسانهای خود را منتشر کردهایم که دارای تواناییهای قویتر در درک متن و تصویر و درک تصاویر در زمانهای طولانی است و عملکرد آن با مدلهای برتر بسته به منبع قابل مقایسه است. به طور پیشفرض به جدیدترین مدلهای سری InternVL ما اشاره دارد که در حال حاضر به internvl3-78b اشاره دارد."
|
||
},
|
||
"irag-1.0": {
|
||
"description": "ERNIE iRAG، مدل تولید تقویتشده با بازیابی تصویر، پشتیبانی از جستجوی تصویری، بازیابی تصویر و متن و تولید محتوا."
|
||
},
|
||
"jamba-large": {
|
||
"description": "قدرتمندترین و پیشرفتهترین مدل ما، که بهطور خاص برای پردازش وظایف پیچیده در سطح سازمانی طراحی شده و دارای عملکرد فوقالعادهای است."
|
||
},
|
||
"jamba-mini": {
|
||
"description": "مدل کارآمدترین در این سطح، که سرعت و کیفیت را با هم ترکیب میکند و دارای ابعاد کوچکتری است."
|
||
},
|
||
"jina-deepsearch-v1": {
|
||
"description": "جستجوی عمیق ترکیبی از جستجوی اینترنتی، خواندن و استدلال است که میتواند تحقیقات جامع را انجام دهد. میتوانید آن را به عنوان یک نماینده در نظر بگیرید که وظایف تحقیق شما را میپذیرد - این نماینده جستجوی گستردهای انجام میدهد و پس از چندین بار تکرار، پاسخ را ارائه میدهد. این فرآیند شامل تحقیق مداوم، استدلال و حل مسئله از زوایای مختلف است. این با مدلهای بزرگ استاندارد که مستقیماً از دادههای پیشآموزش شده پاسخ تولید میکنند و سیستمهای RAG سنتی که به جستجوی سطحی یکباره وابستهاند، تفاوت اساسی دارد."
|
||
},
|
||
"kimi-k2": {
|
||
"description": "Kimi-K2 یک مدل پایه با معماری MoE است که توسط Moonshot AI ارائه شده و دارای تواناییهای بسیار قوی در کدنویسی و عامل است، با 1 تریلیون پارامتر کل و 32 میلیارد پارامتر فعال. در آزمونهای معیار عملکرد در حوزههای دانش عمومی، برنامهنویسی، ریاضیات و عامل، مدل K2 عملکردی فراتر از سایر مدلهای متنباز اصلی دارد."
|
||
},
|
||
"kimi-k2-0711-preview": {
|
||
"description": "kimi-k2 یک مدل پایه با معماری MoE است که دارای تواناییهای بسیار قوی در کدنویسی و عاملسازی است، با مجموع یک تریلیون پارامتر و 32 میلیارد پارامتر فعال. در تستهای معیار عملکرد در حوزههای دانش عمومی، برنامهنویسی، ریاضیات و عاملها، مدل K2 عملکردی فراتر از سایر مدلهای متنباز اصلی دارد."
|
||
},
|
||
"kimi-k2-0905-preview": {
|
||
"description": "مدل پیشنمایش kimi-k2-0905 دارای طول متن ۲۵۶ هزار توکنی است و تواناییهای قویتری در برنامهنویسی عاملمحور، زیبایی و کاربردی بودن کدهای فرانتاند و درک بهتر متن دارد."
|
||
},
|
||
"kimi-k2-instruct": {
|
||
"description": "Kimi K2 Instruct، مدل استنتاج رسمی Kimi، پشتیبانی از زمینه بلند، کدنویسی، پرسش و پاسخ و سناریوهای متنوع."
|
||
},
|
||
"kimi-k2-thinking": {
|
||
"description": "مدل kimi-k2-thinking که توسط شرکت Moonshot ارائه شده، یک مدل تفکر با قابلیتهای عمومی عاملمحور و توانایی استدلال است. این مدل در استدلال عمیق مهارت دارد و میتواند با استفاده از فراخوانی چندمرحلهای ابزارها، در حل انواع مسائل دشوار کمک کند."
|
||
},
|
||
"kimi-k2-thinking-turbo": {
|
||
"description": "نسخه پرسرعت مدل تفکر طولانی K2 با پشتیبانی از زمینه 256k، مناسب برای استدلال عمیق با سرعت خروجی 60 تا 100 توکن در ثانیه."
|
||
},
|
||
"kimi-k2-turbo-preview": {
|
||
"description": "kimi-k2 یک مدل پایه با معماری MoE است که دارای توانمندیهای بسیار قوی در حوزهٔ برنامهنویسی و عاملها (Agent) میباشد. مجموع پارامترها 1T و پارامترهای فعالشده 32B است. در آزمونهای بنچمارک در دستههای اصلی مانند استدلال دانش عمومی، برنامهنویسی، ریاضیات و Agent، عملکرد مدل K2 از سایر مدلهای متنباز مرسوم پیشی گرفته است."
|
||
},
|
||
"kimi-k2:1t": {
|
||
"description": "Kimi K2 یک مدل زبان متخصص ترکیبی بزرگمقیاس (MoE) است که توسط هوش مصنوعی ماه تاریک توسعه یافته است، با مجموع ۱ تریلیون پارامتر و ۳۲ میلیارد پارامتر فعال در هر عبور رو به جلو. این مدل برای توانمندیهای نمایندگی بهینه شده است، از جمله استفاده پیشرفته از ابزارها، استدلال و ترکیب کد."
|
||
},
|
||
"kimi-latest": {
|
||
"description": "محصول دستیار هوشمند کیمی از جدیدترین مدل بزرگ کیمی استفاده میکند و ممکن است شامل ویژگیهای ناپایدار باشد. از درک تصویر پشتیبانی میکند و بهطور خودکار بر اساس طول متن درخواست، مدلهای 8k/32k/128k را بهعنوان مدل محاسبه انتخاب میکند."
|
||
},
|
||
"kuaishou/kat-coder-pro-v1": {
|
||
"description": "KAT-Coder-Pro-V1 (رایگان برای مدت محدود) بر درک کد و برنامهنویسی خودکار تمرکز دارد و برای وظایف نمایندگی برنامهنویسی کارآمد طراحی شده است."
|
||
},
|
||
"learnlm-1.5-pro-experimental": {
|
||
"description": "LearnLM یک مدل زبانی تجربی و خاص برای وظایف است که برای مطابقت با اصول علم یادگیری آموزش دیده است و میتواند در سناریوهای آموزشی و یادگیری از دستورات سیستم پیروی کند و به عنوان مربی متخصص عمل کند."
|
||
},
|
||
"learnlm-2.0-flash-experimental": {
|
||
"description": "LearnLM یک مدل زبانی تجربی و خاص برای وظایف است که برای تطابق با اصول علم یادگیری آموزش دیده است و میتواند در سناریوهای آموزشی و یادگیری دستورات سیستم را دنبال کند و به عنوان یک مربی متخصص عمل کند."
|
||
},
|
||
"lite": {
|
||
"description": "Spark Lite یک مدل زبان بزرگ سبک است که دارای تأخیر بسیار کم و توانایی پردازش کارآمد میباشد. بهطور کامل رایگان و باز است و از قابلیت جستجوی آنلاین در زمان واقعی پشتیبانی میکند. ویژگی پاسخدهی سریع آن باعث میشود که در کاربردهای استنتاجی و تنظیم مدل در دستگاههای با توان محاسباتی پایین عملکرد برجستهای داشته باشد و تجربهای هوشمند و مقرونبهصرفه برای کاربران فراهم کند. بهویژه در زمینههای پرسش و پاسخ دانش، تولید محتوا و جستجو عملکرد خوبی دارد."
|
||
},
|
||
"llama-3.1-70b-versatile": {
|
||
"description": "لاما 3.1 70B توانایی استدلال هوش مصنوعی قویتری را ارائه میدهد، مناسب برای برنامههای پیچیده، پشتیبانی از پردازشهای محاسباتی فراوان و تضمین کارایی و دقت بالا."
|
||
},
|
||
"llama-3.1-8b-instant": {
|
||
"description": "Llama 3.1 8B یک مدل با کارایی بالا است که توانایی تولید سریع متن را فراهم میکند و برای کاربردهایی که به بهرهوری و صرفهجویی در هزینه در مقیاس بزرگ نیاز دارند، بسیار مناسب است."
|
||
},
|
||
"llama-3.1-instruct": {
|
||
"description": "مدل آموزشی لاما 3.1 برای بهینهسازی در صحنههای گفتوگو طراحی شده است و در معیارهای صنعتی معمول، بسیاری از مدلهای چت منبع باز موجود را در برابر گذاشته است."
|
||
},
|
||
"llama-3.2-11b-vision-instruct": {
|
||
"description": "توانایی استدلال تصویری عالی در تصاویر با وضوح بالا، مناسب برای برنامههای درک بصری."
|
||
},
|
||
"llama-3.2-11b-vision-preview": {
|
||
"description": "لاما 3.2 برای انجام وظایفی که شامل دادههای بصری و متنی هستند طراحی شده است. این مدل در وظایفی مانند توصیف تصویر و پرسش و پاسخ بصری عملکرد بسیار خوبی دارد و فاصله بین تولید زبان و استدلال بصری را پر میکند."
|
||
},
|
||
"llama-3.2-90b-vision-instruct": {
|
||
"description": "قابلیتهای پیشرفته استدلال تصویری برای برنامههای نماینده درک بصری."
|
||
},
|
||
"llama-3.2-90b-vision-preview": {
|
||
"description": "لاما 3.2 برای انجام وظایفی که ترکیبی از دادههای بصری و متنی هستند طراحی شده است. این مدل در وظایفی مانند توصیف تصاویر و پرسش و پاسخ بصری عملکرد بسیار خوبی دارد و فاصله بین تولید زبان و استدلال بصری را پر میکند."
|
||
},
|
||
"llama-3.2-vision-instruct": {
|
||
"description": "مدل میکروآموزش Llama 3.2-Vision برای شناسایی بصری، استدلال تصویری، توصیف تصویر و پاسخ به سوالات مربوط به تصویر بهینهسازی شده است."
|
||
},
|
||
"llama-3.3-70b": {
|
||
"description": "Llama 3.3 70B: مدلی با اندازه متوسط تا بزرگ از سری Llama که تعادلی میان توانایی استدلال و بازدهی فراهم میکند."
|
||
},
|
||
"llama-3.3-70b-versatile": {
|
||
"description": "مدل زبان بزرگ چند زبانه Meta Llama 3.3 (LLM) یک مدل تولیدی پیشآموزش دیده و تنظیمشده در 70B (ورودی متن/خروجی متن) است. مدل متن خالص Llama 3.3 برای کاربردهای گفتگوی چند زبانه بهینهسازی شده و در معیارهای صنعتی معمول در مقایسه با بسیاری از مدلهای چت متنباز و بسته عملکرد بهتری دارد."
|
||
},
|
||
"llama-3.3-instruct": {
|
||
"description": "مدل آموزشی لاما ۳.۳ برای صحنههای گفتوگو بهینهسازی شده است و در معیارهای صنعتی معمول، بسیاری از مدلهای چت منبع باز موجود را در برمیآید."
|
||
},
|
||
"llama3-70b-8192": {
|
||
"description": "متا لاما ۳ ۷۰B توانایی پردازش پیچیدگی بینظیری را ارائه میدهد و برای پروژههای با نیازهای بالا طراحی شده است."
|
||
},
|
||
"llama3-8b-8192": {
|
||
"description": "متا لاما ۳ ۸B عملکرد استدلالی با کیفیت بالا را ارائه میدهد و برای نیازهای کاربردی در چندین سناریو مناسب است."
|
||
},
|
||
"llama3-groq-70b-8192-tool-use-preview": {
|
||
"description": "Llama 3 Groq 70B Tool Use قابلیت فراخوانی ابزارهای قدرتمند را فراهم میکند و از پردازش کارهای پیچیده بهصورت کارآمد پشتیبانی میکند."
|
||
},
|
||
"llama3-groq-8b-8192-tool-use-preview": {
|
||
"description": "لاما 3 Groq 8B Tool Use مدلی است که برای استفاده بهینه از ابزارها طراحی شده و از محاسبات سریع و موازی پشتیبانی میکند."
|
||
},
|
||
"llama3.1": {
|
||
"description": "Llama 3.1 مدل پیشرو ارائه شده توسط Meta است که از حداکثر 405 میلیارد پارامتر پشتیبانی میکند و میتواند در زمینههای مکالمات پیچیده، ترجمه چندزبانه و تحلیل دادهها به کار گرفته شود."
|
||
},
|
||
"llama3.1-8b": {
|
||
"description": "Llama 3.1 8B: نسخهای سبک و با تأخیر پایین از Llama، مناسب برای استنتاج آنلاین سبک و تعاملات بلادرنگ."
|
||
},
|
||
"llama3.1:405b": {
|
||
"description": "Llama 3.1 مدل پیشرو ارائه شده توسط Meta است که از 405 میلیارد پارامتر پشتیبانی میکند و میتواند در زمینههای مکالمات پیچیده، ترجمه چندزبانه و تحلیل دادهها به کار گرفته شود."
|
||
},
|
||
"llama3.1:70b": {
|
||
"description": "لاما 3.1 مدل پیشرو ارائه شده توسط متا است که از حداکثر 405 میلیارد پارامتر پشتیبانی میکند و میتواند در زمینههای مکالمات پیچیده، ترجمه چندزبانه و تحلیل دادهها به کار گرفته شود."
|
||
},
|
||
"llava": {
|
||
"description": "LLaVA یک مدل چندوجهی است که رمزگذار بصری و Vicuna را برای درک قدرتمند زبان و تصویر ترکیب میکند."
|
||
},
|
||
"llava-v1.5-7b-4096-preview": {
|
||
"description": "LLaVA 1.5 7B قابلیت پردازش بصری را با هم ترکیب میکند و از طریق ورودی اطلاعات بصری خروجیهای پیچیده تولید میکند."
|
||
},
|
||
"llava:13b": {
|
||
"description": "LLaVA یک مدل چندوجهی است که رمزگذار بصری و Vicuna را برای درک قدرتمند زبان و تصویر ترکیب میکند."
|
||
},
|
||
"llava:34b": {
|
||
"description": "LLaVA یک مدل چندوجهی است که رمزگذار بصری و Vicuna را برای درک قدرتمند زبان و تصویر ترکیب میکند."
|
||
},
|
||
"magistral-medium-latest": {
|
||
"description": "Magistral Medium 1.2 یک مدل استنتاج پیشرفته است که توسط Mistral AI در سپتامبر ۲۰۲۵ منتشر شده و از قابلیت پشتیبانی بصری برخوردار است."
|
||
},
|
||
"magistral-small-2509": {
|
||
"description": "Magistral Small 1.2 یک مدل استنتاج کوچک متنباز است که توسط Mistral AI در سپتامبر ۲۰۲۵ منتشر شده و از قابلیت پشتیبانی بصری برخوردار است."
|
||
},
|
||
"mathstral": {
|
||
"description": "MathΣtral بهطور ویژه برای تحقیقات علمی و استدلالهای ریاضی طراحی شده است و توانایی محاسباتی مؤثر و تفسیر نتایج را ارائه میدهد."
|
||
},
|
||
"max-32k": {
|
||
"description": "Spark Max 32K با قابلیت پردازش متن با زمینه بزرگتر، توانایی درک و استدلال منطقی قویتری دارد و از ورودی متنی تا 32K توکن پشتیبانی میکند. مناسب برای خواندن اسناد طولانی، پرسش و پاسخ با دانش خصوصی و موارد مشابه."
|
||
},
|
||
"megrez-3b-instruct": {
|
||
"description": "Megrez 3B Instruct یک مدل کمپارامتر و کارآمد است که توسط Wuwen Xinqiong ارائه شده است."
|
||
},
|
||
"meituan/longcat-flash-chat": {
|
||
"description": "مدل پایه غیرتفکری متنباز Meituan که بهطور ویژه برای تعاملات گفتوگویی و وظایف عاملها بهینهسازی شده است و در فراخوانی ابزارها و سناریوهای پیچیده چندمرحلهای عملکرد برجستهای دارد."
|
||
},
|
||
"meta-llama-3-70b-instruct": {
|
||
"description": "یک مدل قدرتمند با ۷۰ میلیارد پارامتر که در استدلال، کدنویسی و کاربردهای گسترده زبانی عملکرد برجستهای دارد."
|
||
},
|
||
"meta-llama-3-8b-instruct": {
|
||
"description": "یک مدل چندمنظوره با ۸ میلیارد پارامتر که برای وظایف مکالمه و تولید متن بهینهسازی شده است."
|
||
},
|
||
"meta-llama-3.1-405b-instruct": {
|
||
"description": "مدل متنی Llama 3.1 که برای تنظیم دستورات بهینهسازی شده و برای موارد استفاده مکالمه چندزبانه بهینه شده است. در بسیاری از مدلهای چت منبع باز و بسته موجود، در معیارهای صنعتی رایج عملکرد برجستهای دارد."
|
||
},
|
||
"meta-llama-3.1-70b-instruct": {
|
||
"description": "مدل متنی Llama 3.1 با تنظیمات دستوری، بهینهسازی شده برای موارد استفاده در مکالمات چندزبانه، که در بسیاری از مدلهای چت منبع باز و بسته موجود، در معیارهای صنعتی رایج عملکرد برجستهای دارد."
|
||
},
|
||
"meta-llama-3.1-8b-instruct": {
|
||
"description": "مدل متنی Llama 3.1 که برای تنظیم دستورالعملها بهینهسازی شده و برای موارد استفاده مکالمه چندزبانه بهینه شده است. در بسیاری از مدلهای چت منبع باز و بسته موجود، در معیارهای صنعتی رایج عملکرد برجستهای دارد."
|
||
},
|
||
"meta-llama/Llama-2-13b-chat-hf": {
|
||
"description": "LLaMA-2 Chat (13B) تواناییهای پردازش زبان عالی و تجربه تعاملی بینظیری را ارائه میدهد."
|
||
},
|
||
"meta-llama/Llama-2-70b-hf": {
|
||
"description": "LLaMA-2 تواناییهای پردازش زبان عالی و تجربه تعاملی بینظیری را ارائه میدهد."
|
||
},
|
||
"meta-llama/Llama-3-70b-chat-hf": {
|
||
"description": "Llama 3 70B Instruct Reference یک مدل چت قدرتمند است که از نیازهای پیچیده مکالمه پشتیبانی میکند."
|
||
},
|
||
"meta-llama/Llama-3-8b-chat-hf": {
|
||
"description": "Llama 3 8B Instruct Reference پشتیبانی چندزبانه ارائه میدهد و شامل دانش گستردهای در زمینههای مختلف است."
|
||
},
|
||
"meta-llama/Llama-3.2-11B-Vision-Instruct-Turbo": {
|
||
"description": "LLaMA 3.2 برای انجام وظایفی که ترکیبی از دادههای بصری و متنی هستند طراحی شده است. این مدل در وظایفی مانند توصیف تصویر و پرسش و پاسخ بصری عملکرد بسیار خوبی دارد و فاصله بین تولید زبان و استدلال بصری را پر میکند."
|
||
},
|
||
"meta-llama/Llama-3.2-3B-Instruct-Turbo": {
|
||
"description": "LLaMA 3.2 برای انجام وظایفی که ترکیبی از دادههای بصری و متنی هستند طراحی شده است. این مدل در وظایفی مانند توصیف تصویر و پرسش و پاسخ بصری عملکرد بسیار خوبی دارد و فاصله بین تولید زبان و استدلال بصری را پر میکند."
|
||
},
|
||
"meta-llama/Llama-3.2-90B-Vision-Instruct-Turbo": {
|
||
"description": "LLaMA 3.2 برای انجام وظایفی که ترکیبی از دادههای بصری و متنی هستند طراحی شده است. این مدل در وظایفی مانند توصیف تصویر و پرسش و پاسخ بصری عملکرد بسیار خوبی دارد و فاصله بین تولید زبان و استدلال بصری را پر میکند."
|
||
},
|
||
"meta-llama/Llama-3.3-70B-Instruct-Turbo": {
|
||
"description": "مدل بزرگ زبان چند زبانه Meta Llama 3.3 (LLM) یک مدل تولیدی پیشآموزش و تنظیم دستوری در 70B (ورودی متن/خروجی متن) است. مدل تنظیم دستوری Llama 3.3 به طور خاص برای موارد استفاده مکالمه چند زبانه بهینهسازی شده و در معیارهای صنعتی رایج از بسیاری از مدلهای چت متنباز و بسته موجود بهتر عمل میکند."
|
||
},
|
||
"meta-llama/Llama-Vision-Free": {
|
||
"description": "LLaMA 3.2 برای انجام وظایفی که ترکیبی از دادههای بصری و متنی هستند طراحی شده است. این مدل در وظایفی مانند توصیف تصویر و پرسش و پاسخ بصری عملکرد بسیار خوبی دارد و فاصله بین تولید زبان و استدلال بصری را پر میکند."
|
||
},
|
||
"meta-llama/Meta-Llama-3-70B-Instruct-Lite": {
|
||
"description": "Llama 3 70B Instruct Lite مناسب برای محیطهایی که به عملکرد بالا و تأخیر کم نیاز دارند."
|
||
},
|
||
"meta-llama/Meta-Llama-3-70B-Instruct-Turbo": {
|
||
"description": "Llama 3 70B Instruct Turbo تواناییهای برجستهای در درک و تولید زبان ارائه میدهد و برای سختترین وظایف محاسباتی مناسب است."
|
||
},
|
||
"meta-llama/Meta-Llama-3-8B-Instruct-Lite": {
|
||
"description": "Llama 3 8B Instruct Lite برای محیطهای با منابع محدود مناسب است و عملکرد متعادلی را ارائه میدهد."
|
||
},
|
||
"meta-llama/Meta-Llama-3-8B-Instruct-Turbo": {
|
||
"description": "Llama 3 8B Instruct Turbo یک مدل زبان بزرگ با کارایی بالا است که از طیف گستردهای از کاربردها پشتیبانی میکند."
|
||
},
|
||
"meta-llama/Meta-Llama-3.1-405B-Instruct": {
|
||
"description": "مدل LLaMA 3.1 405B که برای تنظیمات دستوری بهینهسازی شده است، برای سناریوهای مکالمه چندزبانه بهینه شده است."
|
||
},
|
||
"meta-llama/Meta-Llama-3.1-405B-Instruct-Turbo": {
|
||
"description": "مدل Llama 3.1 Turbo با ظرفیت 405B، پشتیبانی از زمینههای بسیار بزرگ برای پردازش دادههای عظیم را فراهم میکند و در کاربردهای هوش مصنوعی در مقیاس بسیار بزرگ عملکرد برجستهای دارد."
|
||
},
|
||
"meta-llama/Meta-Llama-3.1-70B": {
|
||
"description": "Llama 3.1 مدل پیشرو ارائه شده توسط Meta است که از حداکثر 405B پارامتر پشتیبانی میکند و میتواند در زمینههای گفتگوهای پیچیده، ترجمه چند زبانه و تحلیل دادهها استفاده شود."
|
||
},
|
||
"meta-llama/Meta-Llama-3.1-70B-Instruct-Turbo": {
|
||
"description": "مدل Llama 3.1 70B بهطور دقیق تنظیم شده است و برای برنامههای با بار سنگین مناسب است. با کمیتسازی به FP8، توان محاسباتی و دقت بیشتری ارائه میدهد و عملکرد برتری را در سناریوهای پیچیده تضمین میکند."
|
||
},
|
||
"meta-llama/Meta-Llama-3.1-8B-Instruct-Turbo": {
|
||
"description": "مدل Llama 3.1 8B از کوانتیزاسیون FP8 استفاده میکند و از حداکثر 131,072 توکن متنی پشتیبانی میکند. این مدل یکی از بهترینها در میان مدلهای متنباز است و برای وظایف پیچیده مناسب بوده و در بسیاری از معیارهای صنعتی عملکرد برتری دارد."
|
||
},
|
||
"meta-llama/llama-3-70b-instruct": {
|
||
"description": "Llama 3 70B Instruct برای بهینهسازی در سناریوهای مکالمه با کیفیت بالا طراحی شده و در ارزیابیهای مختلف انسانی عملکرد برجستهای دارد."
|
||
},
|
||
"meta-llama/llama-3-8b-instruct": {
|
||
"description": "Llama 3 8B Instruct برای بهینهسازی سناریوهای مکالمه با کیفیت بالا طراحی شده و عملکردی بهتر از بسیاری از مدلهای بسته دارد."
|
||
},
|
||
"meta-llama/llama-3.1-70b-instruct": {
|
||
"description": "Llama 3.1 70B Instruct بهطور ویژه برای مکالمات با کیفیت بالا طراحی شده است و در ارزیابیهای انسانی عملکرد برجستهای دارد. این مدل بهویژه برای سناریوهای تعامل بالا مناسب است."
|
||
},
|
||
"meta-llama/llama-3.1-8b-instruct": {
|
||
"description": "Llama 3.1 8B Instruct جدیدترین نسخه ارائه شده توسط Meta است که برای بهینهسازی سناریوهای مکالمه با کیفیت بالا طراحی شده و عملکرد بهتری نسبت به بسیاری از مدلهای بسته پیشرو دارد."
|
||
},
|
||
"meta-llama/llama-3.1-8b-instruct:free": {
|
||
"description": "LLaMA 3.1 پشتیبانی چندزبانه ارائه میدهد و یکی از مدلهای پیشرو در صنعت تولید محتوا است."
|
||
},
|
||
"meta-llama/llama-3.2-11b-vision-instruct": {
|
||
"description": "LLaMA 3.2 برای انجام وظایفی که ترکیبی از دادههای بصری و متنی هستند طراحی شده است. این مدل در وظایفی مانند توصیف تصویر و پرسش و پاسخ بصری عملکرد بسیار خوبی دارد و فاصله بین تولید زبان و استدلال بصری را پر میکند."
|
||
},
|
||
"meta-llama/llama-3.2-3b-instruct": {
|
||
"description": "meta-llama/llama-3.2-3b-instruct"
|
||
},
|
||
"meta-llama/llama-3.2-90b-vision-instruct": {
|
||
"description": "LLaMA 3.2 برای انجام وظایفی طراحی شده است که دادههای بصری و متنی را با هم ترکیب میکند. این مدل در وظایفی مانند توصیف تصویر و پرسش و پاسخ بصری عملکرد بسیار خوبی دارد و فاصله بین تولید زبان و استدلال بصری را پر میکند."
|
||
},
|
||
"meta-llama/llama-3.3-70b-instruct": {
|
||
"description": "Llama 3.3 پیشرفتهترین مدل زبان چندزبانه و متنباز در سری Llama است که تجربهای با هزینه بسیار پایین مشابه عملکرد مدل 405B را ارائه میدهد. این مدل بر اساس ساختار Transformer طراحی شده و از طریق تنظیم دقیق نظارتی (SFT) و یادگیری تقویتی با بازخورد انسانی (RLHF) بهبود کارایی و ایمنی یافته است. نسخه بهینهسازی شده آن برای مکالمات چندزبانه طراحی شده و در چندین معیار صنعتی از بسیاری از مدلهای چت متنباز و بسته بهتر عمل میکند. تاریخ قطع دانش آن دسامبر 2023 است."
|
||
},
|
||
"meta-llama/llama-3.3-70b-instruct:free": {
|
||
"description": "Llama 3.3 پیشرفتهترین مدل زبان چندزبانه و متنباز در سری Llama است که تجربهای با هزینه بسیار پایین مشابه عملکرد مدل 405B را ارائه میدهد. این مدل بر اساس ساختار Transformer طراحی شده و از طریق تنظیم دقیق نظارتی (SFT) و یادگیری تقویتی با بازخورد انسانی (RLHF) بهبود کارایی و ایمنی یافته است. نسخه بهینهسازی شده آن برای مکالمات چندزبانه طراحی شده و در چندین معیار صنعتی از بسیاری از مدلهای چت متنباز و بسته بهتر عمل میکند. تاریخ قطع دانش آن دسامبر 2023 است."
|
||
},
|
||
"meta.llama3-1-405b-instruct-v1:0": {
|
||
"description": "Meta Llama 3.1 405B Instruct بزرگترین و قدرتمندترین مدل در میان مدلهای Llama 3.1 Instruct است. این یک مدل بسیار پیشرفته برای استدلال مکالمهای و تولید دادههای مصنوعی است و همچنین میتواند به عنوان پایهای برای پیشتمرین یا تنظیم دقیق مداوم در حوزههای خاص استفاده شود. Llama 3.1 مجموعهای از مدلهای زبان بزرگ چندزبانه (LLMs) است که از پیش آموزش دیده و برای دستورالعملها تنظیم شدهاند و شامل اندازههای 8B، 70B و 405B (ورودی/خروجی متنی) میباشد. مدلهای متنی تنظیمشده بر اساس دستورالعملهای Llama 3.1 (8B، 70B، 405B) بهطور خاص برای موارد استفاده مکالمه چندزبانه بهینهسازی شدهاند و در بسیاری از معیارهای استاندارد صنعتی از مدلهای چت منبع باز موجود پیشی گرفتهاند. Llama 3.1 برای استفادههای تجاری و تحقیقاتی در زبانهای مختلف طراحی شده است. مدلهای متنی تنظیمشده بر اساس دستورالعملها برای چتهای مشابه دستیار مناسب هستند، در حالی که مدلهای پیشآموزشدیده میتوانند برای انواع وظایف تولید زبان طبیعی سازگار شوند. مدلهای Llama 3.1 همچنین از خروجیهای خود برای بهبود سایر مدلها، از جمله تولید دادههای مصنوعی و پالایش، پشتیبانی میکنند. Llama 3.1 یک مدل زبان خودبازگشتی است که از معماری بهینهشده ترانسفورمر استفاده میکند. نسخههای تنظیمشده از تنظیم دقیق نظارتشده (SFT) و یادگیری تقویتی با بازخورد انسانی (RLHF) برای تطابق با ترجیحات انسانی در مورد کمکرسانی و ایمنی استفاده میکنند."
|
||
},
|
||
"meta.llama3-1-70b-instruct-v1:0": {
|
||
"description": "نسخه بهروزرسانیشده Meta Llama 3.1 70B Instruct، شامل طول زمینه 128K توسعهیافته، چندزبانه بودن و بهبود توانایی استدلال. مدلهای زبان بزرگ چندزبانه (LLMs) ارائهشده توسط Llama 3.1 مجموعهای از مدلهای تولیدی پیشتمرینشده و تنظیمشده با دستورالعمل هستند که شامل اندازههای 8B، 70B و 405B (ورودی/خروجی متنی) میباشند. مدلهای متنی تنظیمشده با دستورالعمل Llama 3.1 (8B، 70B، 405B) بهطور خاص برای موارد استفاده مکالمه چندزبانه بهینهسازی شدهاند و در بسیاری از معیارهای استاندارد صنعتی از مدلهای چت منبعباز موجود پیشی گرفتهاند. Llama 3.1 برای استفادههای تجاری و تحقیقاتی در زبانهای مختلف طراحی شده است. مدلهای متنی تنظیمشده با دستورالعمل برای چتهای مشابه دستیار مناسب هستند، در حالی که مدلهای پیشتمرینشده میتوانند برای انواع وظایف تولید زبان طبیعی سازگار شوند. مدلهای Llama 3.1 همچنین از خروجیهای خود برای بهبود سایر مدلها، از جمله تولید دادههای مصنوعی و پالایش، پشتیبانی میکنند. Llama 3.1 یک مدل زبان خودبازگشتی است که از معماری بهینهشده ترانسفورمر استفاده میکند. نسخه تنظیمشده از تنظیم دقیق نظارتشده (SFT) و یادگیری تقویتی با بازخورد انسانی (RLHF) برای همراستایی با ترجیحات انسانی در مورد کمکرسانی و ایمنی استفاده میکند."
|
||
},
|
||
"meta.llama3-1-8b-instruct-v1:0": {
|
||
"description": "نسخه بهروزرسانی شده Meta Llama 3.1 8B Instruct، شامل طول زمینه 128K توسعهیافته، چندزبانه بودن و بهبود توانایی استدلال. Llama 3.1 مدلهای زبانی بزرگ چندزبانه (LLMs) را ارائه میدهد که مجموعهای از مدلهای تولیدی پیشتمرینشده و تنظیمشده با دستورالعمل هستند و شامل اندازههای 8B، 70B و 405B (ورودی/خروجی متنی) میباشند. مدلهای متنی تنظیمشده با دستورالعمل Llama 3.1 (8B، 70B، 405B) بهطور خاص برای موارد استفاده مکالمه چندزبانه بهینهسازی شدهاند و در معیارهای صنعتی رایج از بسیاری از مدلهای چت متنباز موجود پیشی گرفتهاند. Llama 3.1 برای استفادههای تجاری و تحقیقاتی در زبانهای مختلف طراحی شده است. مدلهای متنی تنظیمشده با دستورالعمل برای چتهای مشابه دستیار مناسب هستند، در حالی که مدلهای پیشتمرینشده میتوانند برای انواع وظایف تولید زبان طبیعی سازگار شوند. مدلهای Llama 3.1 همچنین از خروجیهای خود برای بهبود سایر مدلها، از جمله تولید دادههای مصنوعی و پالایش، پشتیبانی میکنند. Llama 3.1 یک مدل زبانی خودبازگشتی است که از معماری بهینهشده ترانسفورمر استفاده میکند. نسخه تنظیمشده از تنظیم دقیق نظارتشده (SFT) و یادگیری تقویتی با بازخورد انسانی (RLHF) برای همراستا شدن با ترجیحات انسانی در مورد کمکرسانی و ایمنی استفاده میکند."
|
||
},
|
||
"meta.llama3-70b-instruct-v1:0": {
|
||
"description": "Meta Llama 3 یک مدل زبان بزرگ (LLM) باز برای توسعهدهندگان، پژوهشگران و شرکتها است که به آنها کمک میکند تا ایدههای هوش مصنوعی تولیدی خود را بسازند، آزمایش کنند و بهطور مسئولانه گسترش دهند. بهعنوان بخشی از سیستم پایه نوآوری جامعه جهانی، این مدل برای تولید محتوا، هوش مصنوعی مکالمهای، درک زبان، تحقیق و توسعه و کاربردهای شرکتی بسیار مناسب است."
|
||
},
|
||
"meta.llama3-8b-instruct-v1:0": {
|
||
"description": "Meta Llama 3 یک مدل زبان بزرگ باز (LLM) است که برای توسعهدهندگان، پژوهشگران و شرکتها طراحی شده است تا به آنها در ساخت، آزمایش و گسترش مسئولانه ایدههای هوش مصنوعی مولد کمک کند. به عنوان بخشی از سیستم پایه نوآوری جامعه جهانی، این مدل برای دستگاههای با توان محاسباتی و منابع محدود، دستگاههای لبه و زمانهای آموزش سریعتر بسیار مناسب است."
|
||
},
|
||
"meta/Llama-3.2-11B-Vision-Instruct": {
|
||
"description": "توانایی استدلال تصویری برجسته در تصاویر با وضوح بالا، مناسب برای برنامههای درک بصری."
|
||
},
|
||
"meta/Llama-3.2-90B-Vision-Instruct": {
|
||
"description": "توانایی استدلال تصویری پیشرفته برای برنامههای عامل درک بصری."
|
||
},
|
||
"meta/Llama-3.3-70B-Instruct": {
|
||
"description": "Llama 3.3 پیشرفتهترین مدل زبان بزرگ چندزبانه متنباز در سری Llama است که عملکردی مشابه مدل ۴۰۵ میلیارد پارامتری را با هزینه بسیار پایین ارائه میدهد. مبتنی بر ساختار ترنسفورمر و با بهبودهای نظارت شده (SFT) و یادگیری تقویتی با بازخورد انسانی (RLHF) برای افزایش کارایی و ایمنی. نسخه تنظیم شده برای دستورالعمل بهینه شده برای گفتگوهای چندزبانه است و در معیارهای صنعتی متعدد از بسیاری از مدلهای چت متنباز و بسته بهتر عمل میکند. تاریخ قطع دانش: دسامبر ۲۰۲۳."
|
||
},
|
||
"meta/Meta-Llama-3-70B-Instruct": {
|
||
"description": "یک مدل قدرتمند با ۷۰ میلیارد پارامتر که در استدلال، کدنویسی و کاربردهای گسترده زبانی عملکرد برجستهای دارد."
|
||
},
|
||
"meta/Meta-Llama-3-8B-Instruct": {
|
||
"description": "یک مدل چندمنظوره با ۸ میلیارد پارامتر که برای وظایف گفتگو و تولید متن بهینه شده است."
|
||
},
|
||
"meta/Meta-Llama-3.1-405B-Instruct": {
|
||
"description": "مدل متنی تنظیم شده برای دستورالعمل Llama 3.1 که برای موارد استفاده گفتگوهای چندزبانه بهینه شده و در بسیاری از مدلهای چت متنباز و بسته موجود، در معیارهای صنعتی رایج عملکرد برجستهای دارد."
|
||
},
|
||
"meta/Meta-Llama-3.1-70B-Instruct": {
|
||
"description": "مدل متنی تنظیم شده برای دستورالعمل Llama 3.1 که برای موارد استفاده گفتگوهای چندزبانه بهینه شده و در بسیاری از مدلهای چت متنباز و بسته موجود، در معیارهای صنعتی رایج عملکرد برجستهای دارد."
|
||
},
|
||
"meta/Meta-Llama-3.1-8B-Instruct": {
|
||
"description": "مدل متنی تنظیم شده برای دستورالعمل Llama 3.1 که برای موارد استفاده گفتگوهای چندزبانه بهینه شده و در بسیاری از مدلهای چت متنباز و بسته موجود، در معیارهای صنعتی رایج عملکرد برجستهای دارد."
|
||
},
|
||
"meta/llama-3-70b": {
|
||
"description": "مدل متنباز 70 میلیارد پارامتری که توسط Meta برای پیروی از دستورالعملها به دقت تنظیم شده است. توسط Groq با استفاده از سختافزار واحد پردازش زبان سفارشی (LPU) ارائه میشود تا استدلال سریع و کارآمد فراهم کند."
|
||
},
|
||
"meta/llama-3-8b": {
|
||
"description": "مدل متنباز 8 میلیارد پارامتری که توسط Meta برای پیروی از دستورالعملها به دقت تنظیم شده است. توسط Groq با استفاده از سختافزار واحد پردازش زبان سفارشی (LPU) ارائه میشود تا استدلال سریع و کارآمد فراهم کند."
|
||
},
|
||
"meta/llama-3.1-405b-instruct": {
|
||
"description": "مدل LLM پیشرفته که از تولید دادههای ترکیبی، تقطیر دانش و استدلال پشتیبانی میکند و برای رباتهای چت، برنامهنویسی و وظایف خاص مناسب است."
|
||
},
|
||
"meta/llama-3.1-70b": {
|
||
"description": "نسخه بهروزشده Meta Llama 3 70B Instruct با طول زمینه 128K گسترش یافته، چندزبانه و توان استدلال بهبود یافته."
|
||
},
|
||
"meta/llama-3.1-70b-instruct": {
|
||
"description": "توانمندسازی گفتگوهای پیچیده با درک زمینهای عالی، توانایی استدلال و قابلیت تولید متن."
|
||
},
|
||
"meta/llama-3.1-8b": {
|
||
"description": "Llama 3.1 8B از پنجره زمینه 128K پشتیبانی میکند که آن را برای رابطهای گفتگوی بلادرنگ و تحلیل داده ایدهآل میسازد و در عین حال صرفهجویی قابل توجهی در هزینه نسبت به مدلهای بزرگتر ارائه میدهد. توسط Groq با استفاده از سختافزار واحد پردازش زبان سفارشی (LPU) ارائه میشود تا استدلال سریع و کارآمد فراهم کند."
|
||
},
|
||
"meta/llama-3.1-8b-instruct": {
|
||
"description": "مدل پیشرفته و پیشرفته که دارای درک زبان، توانایی استدلال عالی و قابلیت تولید متن است."
|
||
},
|
||
"meta/llama-3.2-11b": {
|
||
"description": "مدل تولید استدلال تصویری تنظیم شده با دستورالعمل (ورودی متن + تصویر / خروجی متن) که برای شناسایی بصری، استدلال تصویری، تولید عنوان و پاسخ به سوالات عمومی درباره تصاویر بهینه شده است."
|
||
},
|
||
"meta/llama-3.2-11b-vision-instruct": {
|
||
"description": "مدل بینایی-زبان پیشرفته که در استدلال با کیفیت بالا از تصاویر مهارت دارد."
|
||
},
|
||
"meta/llama-3.2-1b": {
|
||
"description": "مدل فقط متنی که از موارد استفاده روی دستگاه مانند بازیابی دانش محلی چندزبانه، خلاصهسازی و بازنویسی پشتیبانی میکند."
|
||
},
|
||
"meta/llama-3.2-1b-instruct": {
|
||
"description": "مدل زبان کوچک پیشرفته و پیشرفته که دارای درک زبان، توانایی استدلال عالی و قابلیت تولید متن است."
|
||
},
|
||
"meta/llama-3.2-3b": {
|
||
"description": "مدل فقط متنی که به دقت برای پشتیبانی از موارد استفاده روی دستگاه مانند بازیابی دانش محلی چندزبانه، خلاصهسازی و بازنویسی تنظیم شده است."
|
||
},
|
||
"meta/llama-3.2-3b-instruct": {
|
||
"description": "مدل زبان کوچک پیشرفته و پیشرفته که دارای درک زبان، توانایی استدلال عالی و قابلیت تولید متن است."
|
||
},
|
||
"meta/llama-3.2-90b": {
|
||
"description": "مدل تولید استدلال تصویری تنظیم شده با دستورالعمل (ورودی متن + تصویر / خروجی متن) که برای شناسایی بصری، استدلال تصویری، تولید عنوان و پاسخ به سوالات عمومی درباره تصاویر بهینه شده است."
|
||
},
|
||
"meta/llama-3.2-90b-vision-instruct": {
|
||
"description": "مدل بینایی-زبان پیشرفته که در استدلال با کیفیت بالا از تصاویر مهارت دارد."
|
||
},
|
||
"meta/llama-3.3-70b": {
|
||
"description": "ترکیب کامل عملکرد و کارایی. این مدل از گفتگوی هوش مصنوعی با عملکرد بالا پشتیبانی میکند و برای ایجاد محتوا، برنامههای شرکتی و پژوهش طراحی شده است و تواناییهای پیشرفته درک زبان از جمله خلاصهسازی متن، دستهبندی، تحلیل احساسات و تولید کد را ارائه میدهد."
|
||
},
|
||
"meta/llama-3.3-70b-instruct": {
|
||
"description": "مدل LLM پیشرفته که در استدلال، ریاضیات، دانش عمومی و فراخوانی توابع مهارت دارد."
|
||
},
|
||
"meta/llama-4-maverick": {
|
||
"description": "مجموعه مدلهای Llama 4 مدلهای هوش مصنوعی چندرسانهای بومی هستند که از تجربههای متنی و چندرسانهای پشتیبانی میکنند. این مدلها با استفاده از معماری متخصص ترکیبی عملکرد پیشرو در صنعت در درک متن و تصویر ارائه میدهند. Llama 4 Maverick، مدلی با 17 میلیارد پارامتر و 128 متخصص است. توسط DeepInfra ارائه میشود."
|
||
},
|
||
"meta/llama-4-scout": {
|
||
"description": "مجموعه مدلهای Llama 4 مدلهای هوش مصنوعی چندرسانهای بومی هستند که از تجربههای متنی و چندرسانهای پشتیبانی میکنند. این مدلها با استفاده از معماری متخصص ترکیبی عملکرد پیشرو در صنعت در درک متن و تصویر ارائه میدهند. Llama 4 Scout، مدلی با 17 میلیارد پارامتر و 16 متخصص است. توسط DeepInfra ارائه میشود."
|
||
},
|
||
"microsoft/Phi-3-medium-128k-instruct": {
|
||
"description": "همان مدل Phi-3-medium با اندازه زمینه بزرگتر، مناسب برای RAG یا تعداد کمی از پرامپتها."
|
||
},
|
||
"microsoft/Phi-3-medium-4k-instruct": {
|
||
"description": "مدلی با ۱۴ میلیارد پارامتر که کیفیت آن از Phi-3-mini بالاتر است و تمرکز بر دادههای با کیفیت و استدلالی دارد."
|
||
},
|
||
"microsoft/Phi-3-mini-128k-instruct": {
|
||
"description": "همان مدل Phi-3-mini با اندازه زمینه بزرگتر، مناسب برای RAG یا تعداد کمی از پرامپتها."
|
||
},
|
||
"microsoft/Phi-3-mini-4k-instruct": {
|
||
"description": "کوچکترین عضو خانواده Phi-3 که برای کیفیت و تأخیر کم بهینه شده است."
|
||
},
|
||
"microsoft/Phi-3-small-128k-instruct": {
|
||
"description": "همان مدل Phi-3-small با اندازه زمینه بزرگتر، مناسب برای RAG یا تعداد کمی از پرامپتها."
|
||
},
|
||
"microsoft/Phi-3-small-8k-instruct": {
|
||
"description": "مدلی با ۷ میلیارد پارامتر که کیفیت آن از Phi-3-mini بالاتر است و تمرکز بر دادههای با کیفیت و استدلالی دارد."
|
||
},
|
||
"microsoft/Phi-3.5-mini-instruct": {
|
||
"description": "نسخه بهروزشده مدل Phi-3-mini."
|
||
},
|
||
"microsoft/Phi-3.5-vision-instruct": {
|
||
"description": "نسخه بهروزشده مدل Phi-3-vision."
|
||
},
|
||
"microsoft/WizardLM-2-8x22B": {
|
||
"description": "WizardLM 2 یک مدل زبانی است که توسط AI مایکروسافت ارائه شده و در زمینههای گفتگوی پیچیده، چند زبانه، استدلال و دستیار هوشمند به ویژه عملکرد خوبی دارد."
|
||
},
|
||
"microsoft/wizardlm-2-8x22b": {
|
||
"description": "WizardLM-2 8x22B پیشرفتهترین مدل Wizard از مایکروسافت AI است که عملکردی بسیار رقابتی از خود نشان میدهد."
|
||
},
|
||
"minicpm-v": {
|
||
"description": "MiniCPM-V نسل جدید مدل چندوجهی است که توسط OpenBMB ارائه شده و دارای تواناییهای برجسته در تشخیص OCR و درک چندوجهی است و از طیف گستردهای از کاربردها پشتیبانی میکند."
|
||
},
|
||
"minimax-m2": {
|
||
"description": "MiniMax M2 یک مدل زبانی بزرگ و کارآمد است که بهطور خاص برای کدنویسی و جریانهای کاری عاملمحور طراحی شده است."
|
||
},
|
||
"minimax/minimax-m2": {
|
||
"description": "MiniMax-M2 مدلی با عملکرد عالی در کدنویسی و وظایف نمایندگی است که برای سناریوهای مهندسی متنوع مناسب است."
|
||
},
|
||
"minimaxai/minimax-m2": {
|
||
"description": "MiniMax-M2 یک مدل فشرده، سریع و مقرونبهصرفه از نوع متخصصان ترکیبی (MoE) است که دارای ۲۳۰ میلیارد پارامتر کلی و ۱۰ میلیارد پارامتر فعال میباشد. این مدل برای ارائه عملکردی عالی در وظایف کدنویسی و عاملهای هوشمند طراحی شده و در عین حال هوش عمومی قدرتمندی را حفظ میکند. این مدل در ویرایش چندفایلی، چرخه کدنویسی-اجرا-اصلاح، آزمون و تصحیح، و زنجیره ابزارهای پیچیده و طولانی عملکردی برجسته دارد و گزینهای ایدهآل برای جریان کاری توسعهدهندگان محسوب میشود."
|
||
},
|
||
"ministral-3b-latest": {
|
||
"description": "Ministral 3B مدل پیشرفته و برتر Mistral در سطح جهانی است."
|
||
},
|
||
"ministral-8b-latest": {
|
||
"description": "Ministral 8B یک مدل لبهای با صرفه اقتصادی بالا از Mistral است."
|
||
},
|
||
"mistral": {
|
||
"description": "Mistral یک مدل 7B است که توسط Mistral AI منتشر شده و برای نیازهای متنوع پردازش زبان مناسب است."
|
||
},
|
||
"mistral-ai/Mistral-Large-2411": {
|
||
"description": "مدل پرچمدار Mistral که برای وظایف پیچیدهای که نیاز به توان استدلال در مقیاس بزرگ یا تخصصی بالا دارند (تولید متن ترکیبی، تولید کد، RAG یا عاملها) مناسب است."
|
||
},
|
||
"mistral-ai/Mistral-Nemo": {
|
||
"description": "Mistral Nemo یک مدل زبان پیشرفته (LLM) است که در دسته اندازه خود دارای بهترین تواناییهای استدلال، دانش جهانی و کدنویسی است."
|
||
},
|
||
"mistral-ai/mistral-small-2503": {
|
||
"description": "Mistral Small برای هر وظیفه مبتنی بر زبان که نیاز به کارایی بالا و تأخیر کم دارد، قابل استفاده است."
|
||
},
|
||
"mistral-large": {
|
||
"description": "Mixtral Large مدل پرچمدار Mistral است که توانایی تولید کد، ریاضیات و استدلال را ترکیب میکند و از پنجره متنی ۱۲۸k پشتیبانی میکند."
|
||
},
|
||
"mistral-large-instruct": {
|
||
"description": "Mistral-Large-Instruct-2407 یک مدل زبانی بزرگ و پیشرفته (LLM) است که ۱۲۳ میلیارد پارامتر دارد و توانایی استدلال، دانش و برنامهنویسی مدرن را در خود جمع آوری کرده است."
|
||
},
|
||
"mistral-large-latest": {
|
||
"description": "Mistral Large یک مدل بزرگ پرچمدار است که در انجام وظایف چندزبانه، استدلال پیچیده و تولید کد مهارت دارد و انتخابی ایدهآل برای کاربردهای سطح بالا است."
|
||
},
|
||
"mistral-medium-latest": {
|
||
"description": "Mistral Medium 3 با هزینه 8 برابری، عملکرد پیشرفتهای را ارائه میدهد و به طور اساسی استقرارهای شرکتی را سادهتر میکند."
|
||
},
|
||
"mistral-nemo": {
|
||
"description": "Mistral Nemo توسط Mistral AI و NVIDIA بهطور مشترک عرضه شده است و یک مدل ۱۲ میلیاردی با کارایی بالا میباشد."
|
||
},
|
||
"mistral-nemo-instruct": {
|
||
"description": "مدل زبانی بزرگ (LLM) میسترال-نیمو-آموزش-۲۴۰۷ نسخهای از میسترال-نیمو-پایه-۲۴۰۷ است که برای اجرای دستورالعملها آموزش داده شده است."
|
||
},
|
||
"mistral-small": {
|
||
"description": "Mistral Small میتواند برای هر وظیفهای که نیاز به کارایی بالا و تأخیر کم دارد، مبتنی بر زبان استفاده شود."
|
||
},
|
||
"mistral-small-latest": {
|
||
"description": "Mistral Small یک گزینه مقرونبهصرفه، سریع و قابلاعتماد است که برای موارد استفادهای مانند ترجمه، خلاصهسازی و تحلیل احساسات مناسب است."
|
||
},
|
||
"mistral/codestral": {
|
||
"description": "Mistral Codestral 25.01 مدل کدنویسی پیشرفتهای است که برای موارد استفاده با تأخیر کم و فرکانس بالا بهینه شده است. این مدل به بیش از 80 زبان برنامهنویسی مسلط است و در وظایفی مانند پر کردن میانی (FIM)، اصلاح کد و تولید تست عملکرد برجستهای دارد."
|
||
},
|
||
"mistral/codestral-embed": {
|
||
"description": "مدل جاسازی کد که میتواند در پایگاههای داده و مخازن کد جاسازی شود تا از دستیارهای کدنویسی پشتیبانی کند."
|
||
},
|
||
"mistral/devstral-small": {
|
||
"description": "Devstral یک مدل زبان بزرگ نمایندگی برای وظایف مهندسی نرمافزار است که آن را به انتخابی عالی برای نمایندگان مهندسی نرمافزار تبدیل میکند."
|
||
},
|
||
"mistral/magistral-medium": {
|
||
"description": "تفکر پیچیده با درک عمیق که استدلال شفاف قابل پیگیری و تأیید را ارائه میدهد. این مدل حتی هنگام تغییر زبان در میانه وظیفه، استدلال با وفاداری بالا را در زبانهای متعدد حفظ میکند."
|
||
},
|
||
"mistral/magistral-small": {
|
||
"description": "تفکر پیچیده با درک عمیق که استدلال شفاف قابل پیگیری و تأیید را ارائه میدهد. این مدل حتی هنگام تغییر زبان در میانه وظیفه، استدلال با وفاداری بالا را در زبانهای متعدد حفظ میکند."
|
||
},
|
||
"mistral/ministral-3b": {
|
||
"description": "مدلی جمعوجور و کارآمد برای وظایف روی دستگاه مانند دستیار هوشمند و تحلیل محلی که عملکرد با تأخیر کم ارائه میدهد."
|
||
},
|
||
"mistral/ministral-8b": {
|
||
"description": "مدلی قدرتمندتر با استدلال سریعتر و بهینهتر از نظر حافظه که برای جریانهای کاری پیچیده و برنامههای لبهای با نیازهای بالا ایدهآل است."
|
||
},
|
||
"mistral/mistral-embed": {
|
||
"description": "مدل جاسازی متن عمومی برای جستجوی معنایی، تشابه، خوشهبندی و جریانهای کاری RAG."
|
||
},
|
||
"mistral/mistral-large": {
|
||
"description": "Mistral Large انتخاب ایدهآل برای وظایف پیچیده است که نیازمند توان استدلال بزرگ یا تخصص بالا هستند — مانند تولید متن ترکیبی، تولید کد، RAG یا نمایندگی."
|
||
},
|
||
"mistral/mistral-small": {
|
||
"description": "Mistral Small انتخاب ایدهآل برای وظایف سادهای است که میتوانند به صورت دستهای انجام شوند — مانند دستهبندی، پشتیبانی مشتری یا تولید متن. این مدل عملکرد عالی را با قیمت مقرونبهصرفه ارائه میدهد."
|
||
},
|
||
"mistral/mixtral-8x22b-instruct": {
|
||
"description": "مدل 8x22b Instruct. 8x22b مدل متنباز متخصص ترکیبی است که توسط Mistral ارائه میشود."
|
||
},
|
||
"mistral/pixtral-12b": {
|
||
"description": "مدل 12 میلیارد پارامتری با توانایی درک تصویر و متن."
|
||
},
|
||
"mistral/pixtral-large": {
|
||
"description": "Pixtral Large دومین مدل خانواده چندرسانهای ما است که سطح پیشرفتهای از درک تصویر را نشان میدهد. به طور خاص، این مدل قادر به درک اسناد، نمودارها و تصاویر طبیعی است و در عین حال توانایی پیشرو در درک متن مدل Mistral Large 2 را حفظ میکند."
|
||
},
|
||
"mistralai/Mistral-7B-Instruct-v0.1": {
|
||
"description": "Mistral (7B) Instruct به دلیل عملکرد بالا شناخته شده است و برای وظایف مختلف زبانی مناسب است."
|
||
},
|
||
"mistralai/Mistral-7B-Instruct-v0.2": {
|
||
"description": "مدل تنظیم دستور Mistral AI"
|
||
},
|
||
"mistralai/Mistral-7B-Instruct-v0.3": {
|
||
"description": "Mistral (7B) Instruct v0.3 توانایی محاسباتی بالا و درک زبان طبیعی را ارائه میدهد و برای کاربردهای گسترده مناسب است."
|
||
},
|
||
"mistralai/Mistral-7B-v0.1": {
|
||
"description": "Mistral 7B یک مدل فشرده اما با عملکرد بالا است که در پردازش دستهای و وظایف ساده مانند طبقهبندی و تولید متن مهارت دارد و دارای توانایی استدلال خوبی است."
|
||
},
|
||
"mistralai/Mixtral-8x22B-Instruct-v0.1": {
|
||
"description": "Mixtral-8x22B Instruct (141B) یک مدل زبان بسیار بزرگ است که از نیازهای پردازشی بسیار بالا پشتیبانی میکند."
|
||
},
|
||
"mistralai/Mixtral-8x7B-Instruct-v0.1": {
|
||
"description": "Mixtral-8x7B Instruct (46.7B) یک چارچوب محاسباتی با ظرفیت بالا ارائه میدهد که برای پردازش دادههای بزرگ مقیاس مناسب است."
|
||
},
|
||
"mistralai/Mixtral-8x7B-v0.1": {
|
||
"description": "Mixtral 8x7B یک مدل متخصص پراکنده است که با استفاده از پارامترهای متعدد سرعت استنتاج را افزایش میدهد و برای انجام وظایف چندزبانه و تولید کد مناسب است."
|
||
},
|
||
"mistralai/mistral-nemo": {
|
||
"description": "Mistral Nemo یک مدل با 7.3 میلیارد پارامتر است که از برنامهنویسی با عملکرد بالا و پشتیبانی چندزبانه برخوردار است."
|
||
},
|
||
"mixtral": {
|
||
"description": "Mixtral مدل تخصصی Mistral AI است که دارای وزنهای متنباز بوده و در زمینه تولید کد و درک زبان پشتیبانی ارائه میدهد."
|
||
},
|
||
"mixtral-8x7b-32768": {
|
||
"description": "Mixtral 8x7B قابلیت محاسبات موازی با تحمل خطای بالا را ارائه میدهد و برای وظایف پیچیده مناسب است."
|
||
},
|
||
"mixtral:8x22b": {
|
||
"description": "Mixtral مدل تخصصی Mistral AI است که دارای وزنهای متنباز بوده و در تولید کد و درک زبان پشتیبانی ارائه میدهد."
|
||
},
|
||
"moonshot-v1-128k": {
|
||
"description": "Moonshot V1 128K یک مدل با قابلیت پردازش متن طولانی است که برای تولید متون بسیار طولانی مناسب است. این مدل میتواند تا 128,000 توکن را پردازش کند و برای کاربردهایی مانند پژوهش، علمی و تولید اسناد بزرگ بسیار مناسب است."
|
||
},
|
||
"moonshot-v1-128k-vision-preview": {
|
||
"description": "مدل بصری Kimi (شامل moonshot-v1-8k-vision-preview/moonshot-v1-32k-vision-preview/moonshot-v1-128k-vision-preview و غیره) قادر به درک محتوای تصویر است، از جمله متن تصویر، رنگ تصویر و شکل اشیاء."
|
||
},
|
||
"moonshot-v1-32k": {
|
||
"description": "Moonshot V1 32K توانایی پردازش متن با طول متوسط را فراهم میکند و قادر به پردازش 32,768 توکن است. این مدل بهویژه برای تولید اسناد طولانی و مکالمات پیچیده مناسب است و در زمینههایی مانند تولید محتوا، ایجاد گزارش و سیستمهای مکالمه کاربرد دارد."
|
||
},
|
||
"moonshot-v1-32k-vision-preview": {
|
||
"description": "مدل بصری Kimi (شامل moonshot-v1-8k-vision-preview/moonshot-v1-32k-vision-preview/moonshot-v1-128k-vision-preview و غیره) قادر به درک محتوای تصویر است، از جمله متن تصویر، رنگ تصویر و شکل اشیاء."
|
||
},
|
||
"moonshot-v1-8k": {
|
||
"description": "Moonshot V1 8K بهطور ویژه برای تولید متنهای کوتاه طراحی شده است و دارای عملکرد پردازشی کارآمدی است که میتواند ۸,۱۹۲ توکن را پردازش کند. این مدل برای مکالمات کوتاه، یادداشتبرداری سریع و تولید محتوای سریع بسیار مناسب است."
|
||
},
|
||
"moonshot-v1-8k-vision-preview": {
|
||
"description": "مدل بصری Kimi (شامل moonshot-v1-8k-vision-preview/moonshot-v1-32k-vision-preview/moonshot-v1-128k-vision-preview و غیره) قادر به درک محتوای تصویر است، از جمله متن تصویر، رنگ تصویر و شکل اشیاء."
|
||
},
|
||
"moonshot-v1-auto": {
|
||
"description": "Moonshot V1 Auto میتواند بر اساس تعداد توکنهای اشغال شده در متن فعلی، مدل مناسب را انتخاب کند."
|
||
},
|
||
"moonshotai/Kimi-Dev-72B": {
|
||
"description": "Kimi-Dev-72B یک مدل بزرگ کد منبع باز است که با یادگیری تقویتی گسترده بهینه شده است و قادر به تولید پچهای پایدار و قابل استفاده مستقیم در تولید میباشد. این مدل در SWE-bench Verified امتیاز جدید ۶۰.۴٪ را کسب کرده و رکورد مدلهای منبع باز را در وظایف مهندسی نرمافزار خودکار مانند رفع اشکال و بازبینی کد شکسته است."
|
||
},
|
||
"moonshotai/Kimi-K2-Instruct-0905": {
|
||
"description": "Kimi K2-Instruct-0905 جدیدترین و قدرتمندترین نسخه Kimi K2 است. این مدل یک مدل زبان برتر با معماری متخصص ترکیبی (MoE) است که دارای ۱ تریلیون پارامتر کل و ۳۲ میلیارد پارامتر فعال میباشد. ویژگیهای اصلی این مدل شامل: هوش کدگذاری عامل بهبود یافته که در آزمونهای معیار عمومی و وظایف واقعی کدگذاری عامل عملکرد قابل توجهی نشان میدهد؛ تجربه کدگذاری فرانتاند بهبود یافته که از نظر زیبایی و کاربردی بودن برنامهنویسی فرانتاند پیشرفت داشته است."
|
||
},
|
||
"moonshotai/Kimi-K2-Thinking": {
|
||
"description": "Kimi K2 Thinking جدیدترین و قدرتمندترین مدل تفکر متنباز است. این مدل با افزایش چشمگیر عمق استنتاج چندمرحلهای و حفظ پایداری در بیش از ۲۰۰ تا ۳۰۰ بار استفاده متوالی از ابزارها، استانداردهای جدیدی را در آزمون Humanity's Last Exam (HLE)، BrowseComp و سایر معیارها تعیین کرده است. همچنین، K2 Thinking در برنامهنویسی، ریاضیات، استدلال منطقی و سناریوهای Agent عملکردی برجسته دارد. این مدل بر پایه معماری متخصصان ترکیبی (MoE) ساخته شده، دارای حدود ۱ تریلیون پارامتر است، از پنجره زمینه ۲۵۶ هزار توکن پشتیبانی میکند و قابلیت استفاده از ابزارها را دارد."
|
||
},
|
||
"moonshotai/kimi-k2": {
|
||
"description": "Kimi K2 مدل زبان بزرگ متخصص ترکیبی (MoE) با مقیاس بزرگ توسعه یافته توسط Moonshot AI است که دارای 1 تریلیون پارامتر کل و 32 میلیارد پارامتر فعال در هر عبور جلو است. این مدل برای توانایی نمایندگی بهینه شده است، از جمله استفاده پیشرفته از ابزارها، استدلال و ترکیب کد."
|
||
},
|
||
"moonshotai/kimi-k2-0711": {
|
||
"description": "Kimi K2 0711 نسخه Instruct از سری Kimi است که برای کدهای با کیفیت بالا و فراخوانی ابزارها مناسب است."
|
||
},
|
||
"moonshotai/kimi-k2-0905": {
|
||
"description": "Kimi K2 0905 بهروزرسانی نسخه 0905 از سری Kimi است که زمینه و عملکرد استدلال را گسترش داده و برای سناریوهای کدنویسی بهینه شده است."
|
||
},
|
||
"moonshotai/kimi-k2-instruct-0905": {
|
||
"description": "مدل پیشنمایش kimi-k2-0905 دارای طول متن ۲۵۶ هزار توکنی است و تواناییهای قویتری در برنامهنویسی عاملمحور، زیبایی و کاربردی بودن کدهای فرانتاند و درک بهتر متن دارد."
|
||
},
|
||
"moonshotai/kimi-k2-thinking": {
|
||
"description": "Kimi K2 Thinking مدل تفکری بهینهشده از Moonshot برای وظایف استدلال عمیق است که توانایی عامل عمومی را داراست."
|
||
},
|
||
"moonshotai/kimi-k2-thinking-turbo": {
|
||
"description": "Kimi K2 Thinking Turbo نسخه پرسرعت Kimi K2 Thinking است که با حفظ توانایی استدلال عمیق، تأخیر پاسخ را بهطور قابل توجهی کاهش میدهد."
|
||
},
|
||
"morph/morph-v3-fast": {
|
||
"description": "Morph مدل هوش مصنوعی تخصصی است که تغییرات کد پیشنهادی مدلهای پیشرفته مانند Claude یا GPT-4o را به فایلهای کد موجود شما به سرعت اعمال میکند — بیش از 4500 توکن در ثانیه. این مدل به عنوان مرحله نهایی در جریان کاری کدنویسی هوش مصنوعی عمل میکند و از ورودی و خروجی 16k توکن پشتیبانی میکند."
|
||
},
|
||
"morph/morph-v3-large": {
|
||
"description": "Morph مدل هوش مصنوعی تخصصی است که تغییرات کد پیشنهادی مدلهای پیشرفته مانند Claude یا GPT-4o را به فایلهای کد موجود شما با سرعت بیش از 2500 توکن در ثانیه اعمال میکند. این مدل به عنوان مرحله نهایی در جریان کاری کدنویسی هوش مصنوعی عمل میکند و از ورودی و خروجی 16k توکن پشتیبانی میکند."
|
||
},
|
||
"nousresearch/hermes-2-pro-llama-3-8b": {
|
||
"description": "هرمس ۲ پرو لاما ۳ ۸B نسخه ارتقاء یافته Nous Hermes 2 است که شامل جدیدترین مجموعه دادههای توسعهیافته داخلی میباشد."
|
||
},
|
||
"nvidia/Llama-3.1-Nemotron-70B-Instruct-HF": {
|
||
"description": "Llama 3.1 Nemotron 70B یک مدل زبانی بزرگ سفارشی شده توسط NVIDIA است که به منظور افزایش کمک به پاسخهای تولید شده توسط LLM برای پرسشهای کاربران طراحی شده است. این مدل در آزمونهای معیار مانند Arena Hard، AlpacaEval 2 LC و GPT-4-Turbo MT-Bench عملکرد عالی داشته و تا تاریخ 1 اکتبر 2024 در تمامی سه آزمون خودکار همراستایی در رتبه اول قرار دارد. این مدل با استفاده از RLHF (به ویژه REINFORCE)، Llama-3.1-Nemotron-70B-Reward و HelpSteer2-Preference در مدل Llama-3.1-70B-Instruct آموزش دیده است."
|
||
},
|
||
"nvidia/llama-3.1-nemotron-51b-instruct": {
|
||
"description": "مدل زبان منحصر به فرد که دقت و کارایی بینظیری را ارائه میدهد."
|
||
},
|
||
"nvidia/llama-3.1-nemotron-70b-instruct": {
|
||
"description": "Llama-3.1-Nemotron-70B یک مدل زبان بزرگ سفارشی از NVIDIA است که به منظور افزایش کمکپذیری پاسخهای تولید شده توسط LLM طراحی شده است."
|
||
},
|
||
"o1": {
|
||
"description": "متمرکز بر استدلال پیشرفته و حل مسائل پیچیده، از جمله وظایف ریاضی و علمی. بسیار مناسب برای برنامههایی که به درک عمیق زمینه و مدیریت جریانهای کاری نیاز دارند."
|
||
},
|
||
"o1-mini": {
|
||
"description": "کوچکتر و سریعتر از o1-preview، با ۸۰٪ هزینه کمتر، عملکرد خوب در تولید کد و عملیات با زمینههای کوچک."
|
||
},
|
||
"o1-preview": {
|
||
"description": "متمرکز بر استدلال پیشرفته و حل مسائل پیچیده، از جمله مسائل ریاضی و علمی. بسیار مناسب برای برنامههایی که نیاز به درک عمیقِ زمینه و جریانهای کاری خودگردان دارند."
|
||
},
|
||
"o1-pro": {
|
||
"description": "مدلهای سری o1 با آموزش تقویت یادگیری قادرند پیش از پاسخدهی تفکر کنند و وظایف استدلال پیچیده را انجام دهند. مدل o1-pro از منابع محاسباتی بیشتری استفاده میکند تا تفکر عمیقتری داشته باشد و پاسخهای با کیفیتتری ارائه دهد."
|
||
},
|
||
"o3": {
|
||
"description": "o3 یک مدل همهکاره و قدرتمند است که در چندین حوزه عملکرد عالی دارد. این مدل استاندارد جدیدی برای وظایف ریاضی، علمی، برنامهنویسی و استدلال بصری تعیین کرده است. همچنین در نوشتن فنی و پیروی از دستورات نیز مهارت دارد. کاربران میتوانند از آن برای تحلیل متن، کد و تصاویر و حل مسائل پیچیده چند مرحلهای استفاده کنند."
|
||
},
|
||
"o3-2025-04-16": {
|
||
"description": "o3 مدل استدلال جدید OpenAI است که از ورودی تصویر و متن پشتیبانی میکند و خروجی متنی ارائه میدهد، مناسب برای وظایف پیچیده با دانش عمومی گسترده."
|
||
},
|
||
"o3-deep-research": {
|
||
"description": "o3-deep-research پیشرفتهترین مدل تحقیق عمیق ما است که بهطور خاص برای انجام وظایف تحقیقاتی پیچیده و چندمرحلهای طراحی شده است. این مدل میتواند از اینترنت جستجو و اطلاعات را ترکیب کند و همچنین از طریق اتصال MCP به دادههای اختصاصی شما دسترسی پیدا کرده و از آنها بهرهبرداری کند."
|
||
},
|
||
"o3-mini": {
|
||
"description": "o3-mini جدیدترین مدل استنتاج کوچک ماست که هوش بالایی را با هزینه و هدف تأخیر مشابه o1-mini ارائه میدهد."
|
||
},
|
||
"o3-pro": {
|
||
"description": "مدل o3-pro با استفاده از محاسبات بیشتر، تفکر عمیقتری انجام میدهد و همواره پاسخهای بهتری ارائه میکند. فقط در API پاسخها قابل استفاده است."
|
||
},
|
||
"o3-pro-2025-06-10": {
|
||
"description": "o3 Pro مدل استدلال جدید OpenAI است که از ورودی تصویر و متن پشتیبانی میکند و خروجی متنی ارائه میدهد، مناسب برای وظایف پیچیده با دانش عمومی گسترده."
|
||
},
|
||
"o4-mini": {
|
||
"description": "o4-mini جدیدترین مدل کوچک از سری o ما است. این مدل بهطور خاص برای استدلال سریع و مؤثر بهینهسازی شده و در وظایف کدنویسی و بصری عملکرد بسیار بالایی دارد."
|
||
},
|
||
"o4-mini-2025-04-16": {
|
||
"description": "o4-mini مدل استدلال OpenAI است که از ورودی تصویر و متن پشتیبانی میکند و خروجی متنی ارائه میدهد، مناسب برای وظایف پیچیده با دانش عمومی گسترده. این مدل دارای زمینه متنی 200 هزار توکن است."
|
||
},
|
||
"o4-mini-deep-research": {
|
||
"description": "o4-mini-deep-research مدل تحقیق عمیق سریعتر و مقرونبهصرفهتر ما است که برای انجام وظایف تحقیقاتی پیچیده و چندمرحلهای بسیار مناسب است. این مدل میتواند از اینترنت جستجو و اطلاعات را ترکیب کند و همچنین از طریق اتصال MCP به دادههای اختصاصی شما دسترسی پیدا کرده و از آنها بهرهبرداری کند."
|
||
},
|
||
"open-codestral-mamba": {
|
||
"description": "Codestral Mamba یک مدل زبان Mamba 2 است که بر تولید کد تمرکز دارد و پشتیبانی قدرتمندی برای وظایف پیشرفته کدنویسی و استدلال ارائه میدهد."
|
||
},
|
||
"open-mistral-7b": {
|
||
"description": "Mistral 7B یک مدل فشرده اما با عملکرد بالا است که در پردازش دستهای و وظایف ساده مانند طبقهبندی و تولید متن مهارت دارد و دارای توانایی استدلال خوبی است."
|
||
},
|
||
"open-mistral-nemo": {
|
||
"description": "Mistral Nemo یک مدل 12 میلیاردی است که با همکاری Nvidia توسعه یافته و عملکرد عالی در استدلال و کدنویسی ارائه میدهد و به راحتی قابل ادغام و جایگزینی است."
|
||
},
|
||
"open-mixtral-8x22b": {
|
||
"description": "Mixtral 8x22B یک مدل تخصصی بزرگتر است که بر روی وظایف پیچیده تمرکز دارد و توانایی استدلال عالی و توان عملیاتی بالاتری را ارائه میدهد."
|
||
},
|
||
"open-mixtral-8x7b": {
|
||
"description": "Mixtral 8x7B یک مدل متخصص پراکنده است که با استفاده از پارامترهای متعدد سرعت استنتاج را افزایش میدهد و برای پردازش وظایف چندزبانه و تولید کد مناسب است."
|
||
},
|
||
"openai/gpt-3.5-turbo": {
|
||
"description": "توانمندترین و مقرونبهصرفهترین مدل در سری GPT-3.5 از OpenAI که برای اهداف مکالمه بهینه شده است، اما در وظایف تکمیل سنتی نیز عملکرد خوبی دارد."
|
||
},
|
||
"openai/gpt-3.5-turbo-instruct": {
|
||
"description": "توانایی مشابه مدلهای دوره GPT-3. با نقاط انتهایی تکمیل سنتی سازگار است، نه نقاط انتهایی تکمیل مکالمه."
|
||
},
|
||
"openai/gpt-4-turbo": {
|
||
"description": "gpt-4-turbo از OpenAI دانش عمومی گسترده و تخصص حوزهای دارد که آن را قادر میسازد دستورالعملهای پیچیده زبان طبیعی را دنبال کرده و مسائل دشوار را با دقت حل کند. تاریخ قطع دانش آن آوریل 2023 است و پنجره زمینه آن 128,000 توکن است."
|
||
},
|
||
"openai/gpt-4.1": {
|
||
"description": "سری GPT-4.1 زمینه متنی گستردهتر و تواناییهای مهندسی و استدلال قویتری را ارائه میدهد."
|
||
},
|
||
"openai/gpt-4.1-mini": {
|
||
"description": "GPT-4.1 Mini با تأخیر کمتر و صرفهجویی بیشتر، برای کاربردهای با زمینه متنی متوسط مناسب است."
|
||
},
|
||
"openai/gpt-4.1-nano": {
|
||
"description": "GPT-4.1 Nano گزینهای با هزینه و تأخیر بسیار پایین است که برای مکالمات کوتاه و پرتکرار یا سناریوهای طبقهبندی مناسب است."
|
||
},
|
||
"openai/gpt-4o": {
|
||
"description": "سری GPT-4o مدل Omni شرکت OpenAI است که از ورودی متن + تصویر و خروجی متنی پشتیبانی میکند."
|
||
},
|
||
"openai/gpt-4o-mini": {
|
||
"description": "GPT-4o-mini نسخه کوچک و سریع GPT-4o است که برای سناریوهای ترکیبی متن و تصویر با تأخیر پایین مناسب است."
|
||
},
|
||
"openai/gpt-5": {
|
||
"description": "GPT-5 مدل قدرتمند OpenAI است که برای طیف گستردهای از وظایف تولیدی و پژوهشی مناسب است."
|
||
},
|
||
"openai/gpt-5-chat": {
|
||
"description": "GPT-5 Chat زیرمدلی از GPT-5 است که برای سناریوهای گفتوگو بهینهسازی شده و با کاهش تأخیر، تجربه تعاملی بهتری ارائه میدهد."
|
||
},
|
||
"openai/gpt-5-codex": {
|
||
"description": "GPT-5-Codex نسخهای از GPT-5 است که برای سناریوهای برنامهنویسی بهینه شده و برای جریانهای کاری کدنویسی در مقیاس بزرگ مناسب است."
|
||
},
|
||
"openai/gpt-5-mini": {
|
||
"description": "GPT-5 Mini نسخهای فشرده از خانواده GPT-5 است که برای سناریوهای با تأخیر و هزینه پایین مناسب است."
|
||
},
|
||
"openai/gpt-5-nano": {
|
||
"description": "GPT-5 Nano نسخه فوقکوچک این خانواده است که برای کاربردهایی با نیاز بسیار بالا به کاهش هزینه و تأخیر طراحی شده است."
|
||
},
|
||
"openai/gpt-5-pro": {
|
||
"description": "GPT-5 Pro مدل پرچمدار OpenAI است که قابلیتهای پیشرفتهای در استدلال، تولید کد و ویژگیهای سطح سازمانی ارائه میدهد و از مسیریابی در زمان تست و سیاستهای امنیتی دقیقتر پشتیبانی میکند."
|
||
},
|
||
"openai/gpt-5.1": {
|
||
"description": "GPT-5.1 جدیدترین مدل پرچمدار سری GPT-5 است که در استدلال عمومی، پیروی از دستورالعملها و طبیعی بودن مکالمه نسبت به GPT-5 بهبود چشمگیری دارد و برای وظایف متنوع مناسب است."
|
||
},
|
||
"openai/gpt-5.1-chat": {
|
||
"description": "GPT-5.1 Chat عضو سبکتر خانواده GPT-5.1 است که برای گفتوگوهای با تأخیر پایین بهینه شده و در عین حال توانایی استدلال و اجرای دستورالعمل را حفظ کرده است."
|
||
},
|
||
"openai/gpt-5.1-codex": {
|
||
"description": "GPT-5.1-Codex نسخهای از GPT-5.1 است که برای مهندسی نرمافزار و جریانهای کاری کدنویسی بهینه شده و برای بازسازیهای بزرگ، اشکالزدایی پیچیده و کدنویسی خودکار طولانیمدت مناسب است."
|
||
},
|
||
"openai/gpt-5.1-codex-mini": {
|
||
"description": "GPT-5.1-Codex-Mini نسخه کوچک و سریع GPT-5.1-Codex است که برای سناریوهای کدنویسی حساس به تأخیر و هزینه مناسبتر است."
|
||
},
|
||
"openai/gpt-oss-120b": {
|
||
"description": "مدل زبان بزرگ عمومی بسیار توانمند با توان استدلال قوی و قابل کنترل."
|
||
},
|
||
"openai/gpt-oss-20b": {
|
||
"description": "مدل زبان جمعوجور با وزنهای متنباز که برای تأخیر کم و محیطهای محدود منابع بهینه شده است، شامل استقرار محلی و لبه."
|
||
},
|
||
"openai/o1": {
|
||
"description": "o1 از OpenAI مدل استدلال پرچمدار است که برای مسائل پیچیده نیازمند تفکر عمیق طراحی شده است. این مدل توان استدلال قوی و دقت بالاتری برای وظایف چندمرحلهای پیچیده ارائه میدهد."
|
||
},
|
||
"openai/o1-mini": {
|
||
"description": "o1-mini یک مدل استنتاج سریع و مقرونبهصرفه است که برای برنامهنویسی، ریاضیات و کاربردهای علمی طراحی شده است. این مدل دارای ۱۲۸ هزار بایت زمینه و تاریخ قطع دانش تا اکتبر ۲۰۲۳ میباشد."
|
||
},
|
||
"openai/o1-preview": {
|
||
"description": "o1 مدل جدید استنتاج OpenAI است که برای وظایف پیچیدهای که به دانش عمومی گسترده نیاز دارند، مناسب است. این مدل دارای 128K زمینه و تاریخ قطع دانش تا اکتبر 2023 است."
|
||
},
|
||
"openai/o3": {
|
||
"description": "o3 از OpenAI قدرتمندترین مدل استدلال است که سطوح پیشرفته جدیدی در کدنویسی، ریاضیات، علوم و درک بصری ایجاد کرده است. این مدل در پرسشهای پیچیده که نیازمند تحلیل چندجانبه هستند مهارت دارد و در تحلیل تصاویر، نمودارها و گرافها برتری خاصی دارد."
|
||
},
|
||
"openai/o3-mini": {
|
||
"description": "o3-mini جدیدترین مدل استدلال کوچک OpenAI است که هوشمندی بالایی را با همان اهداف هزینه و تأخیر o1-mini ارائه میدهد."
|
||
},
|
||
"openai/o3-mini-high": {
|
||
"description": "نسخه o3-mini با سطح استدلال بالا، هوش بالایی را در همان هزینه و هدف تأخیر o1-mini ارائه میدهد."
|
||
},
|
||
"openai/o4-mini": {
|
||
"description": "OpenAI o4-mini مدل استدلالی کوچک و کارآمد OpenAI است که برای سناریوهای با تأخیر پایین مناسب است."
|
||
},
|
||
"openai/o4-mini-high": {
|
||
"description": "نسخه با سطح استدلال بالا o4-mini، که بهطور خاص برای استدلال سریع و مؤثر بهینهسازی شده و در وظایف کدنویسی و بصری عملکرد بسیار بالایی دارد."
|
||
},
|
||
"openai/text-embedding-3-large": {
|
||
"description": "توانمندترین مدل جاسازی OpenAI برای وظایف انگلیسی و غیرانگلیسی."
|
||
},
|
||
"openai/text-embedding-3-small": {
|
||
"description": "نسخه بهبود یافته و با عملکرد بالاتر مدل جاسازی ada از OpenAI."
|
||
},
|
||
"openai/text-embedding-ada-002": {
|
||
"description": "مدل جاسازی متن سنتی OpenAI."
|
||
},
|
||
"openrouter/auto": {
|
||
"description": "با توجه به طول متن، موضوع و پیچیدگی، درخواست شما به Llama 3 70B Instruct، Claude 3.5 Sonnet (تنظیم خودکار) یا GPT-4o ارسال خواهد شد."
|
||
},
|
||
"perplexity/sonar": {
|
||
"description": "محصول سبک Perplexity با قابلیت جستجوی مبتنی بر زمینه، سریعتر و ارزانتر از Sonar Pro."
|
||
},
|
||
"perplexity/sonar-pro": {
|
||
"description": "محصول پرچمدار Perplexity با قابلیت جستجوی مبتنی بر زمینه که از پرسشهای پیشرفته و عملیات پیگیری پشتیبانی میکند."
|
||
},
|
||
"perplexity/sonar-reasoning": {
|
||
"description": "مدلی متمرکز بر استدلال که زنجیره تفکر (CoT) را در پاسخها ارائه میدهد و توضیحات مفصل با جستجوی مبتنی بر زمینه فراهم میکند."
|
||
},
|
||
"perplexity/sonar-reasoning-pro": {
|
||
"description": "مدل پیشرفته متمرکز بر استدلال که زنجیره تفکر (CoT) را در پاسخها ارائه میدهد و توضیحات جامع با قابلیت جستجوی پیشرفته و چندین پرسوجوی جستجو برای هر درخواست فراهم میکند."
|
||
},
|
||
"phi3": {
|
||
"description": "Phi-3 یک مدل سبک و باز از مایکروسافت است که برای یکپارچهسازی کارآمد و استدلال دانش در مقیاس بزرگ مناسب است."
|
||
},
|
||
"phi3:14b": {
|
||
"description": "Phi-3 یک مدل سبک و باز از مایکروسافت است که برای یکپارچهسازی کارآمد و استدلال دانش در مقیاس بزرگ طراحی شده است."
|
||
},
|
||
"pixtral-12b-2409": {
|
||
"description": "مدل Pixtral در وظایفی مانند نمودار و درک تصویر، پرسش و پاسخ اسناد، استدلال چندوجهی و پیروی از دستورات، تواناییهای قدرتمندی از خود نشان میدهد. این مدل قادر است تصاویر را با وضوح طبیعی و نسبت ابعاد دریافت کند و همچنین میتواند هر تعداد تصویری را در یک پنجره متنی طولانی تا ۱۲۸ هزار توکن پردازش کند."
|
||
},
|
||
"pixtral-large-latest": {
|
||
"description": "Pixtral Large یک مدل چندرسانهای متنباز با ۱۲۴۰ میلیارد پارامتر است که بر اساس Mistral Large 2 ساخته شده است. این دومین مدل در خانواده چندرسانهای ماست که تواناییهای پیشرفتهای در درک تصویر را به نمایش میگذارد."
|
||
},
|
||
"pro-128k": {
|
||
"description": "Spark Pro 128K با قابلیت پردازش متن بسیار بزرگ، قادر به پردازش تا 128K اطلاعات متنی است. این ویژگی بهویژه برای تحلیل کامل و پردازش ارتباطات منطقی طولانیمدت در محتوای متنی طولانی مناسب است و میتواند در ارتباطات متنی پیچیده، پشتیبانی از منطق روان و یکپارچه و ارجاعات متنوع را فراهم کند."
|
||
},
|
||
"pro-deepseek-r1": {
|
||
"description": "مدل اختصاصی برای خدمات سازمانی، شامل پشتیبانی از سرویسهای همزمان."
|
||
},
|
||
"pro-deepseek-v3": {
|
||
"description": "مدل اختصاصی برای خدمات سازمانی، شامل پشتیبانی از سرویسهای همزمان."
|
||
},
|
||
"qianfan-70b": {
|
||
"description": "Qianfan 70B، یک مدل چینی با پارامترهای بزرگ، مناسب برای تولید محتوای با کیفیت بالا و وظایف استدلال پیچیده است."
|
||
},
|
||
"qianfan-8b": {
|
||
"description": "Qianfan 8B، یک مدل عمومی متوسط، مناسب برای تولید متن و پاسخگویی با توازن بین هزینه و کارایی."
|
||
},
|
||
"qianfan-agent-intent-32k": {
|
||
"description": "Qianfan Agent Intent 32K، مدلی برای شناسایی نیت و سازماندهی عاملها، پشتیبانی از سناریوهای با زمینه طولانی."
|
||
},
|
||
"qianfan-agent-lite-8k": {
|
||
"description": "Qianfan Agent Lite 8K، مدل سبکوزن عامل، مناسب برای گفتگوهای چندمرحلهای کمهزینه و سازماندهی کسبوکار."
|
||
},
|
||
"qianfan-agent-speed-32k": {
|
||
"description": "Qianfan Agent Speed 32K، مدل عامل با کنترل جریان بالا، مناسب برای کاربردهای عامل در مقیاس بزرگ و چندوظیفهای."
|
||
},
|
||
"qianfan-agent-speed-8k": {
|
||
"description": "Qianfan Agent Speed 8K، مدل عامل با توان پاسخگویی سریع و همزمانی بالا، مناسب برای گفتگوهای کوتاه و متوسط."
|
||
},
|
||
"qianfan-check-vl": {
|
||
"description": "Qianfan Check VL، مدل بررسی و تشخیص محتوای چندرسانهای، پشتیبانی از تطابق و شناسایی تصویر و متن."
|
||
},
|
||
"qianfan-composition": {
|
||
"description": "Qianfan Composition، مدل تولید محتوای چندرسانهای، پشتیبانی از درک و تولید ترکیبی تصویر و متن."
|
||
},
|
||
"qianfan-engcard-vl": {
|
||
"description": "Qianfan EngCard VL، مدل شناسایی چندرسانهای با تمرکز بر سناریوهای انگلیسی."
|
||
},
|
||
"qianfan-lightning-128b-a19b": {
|
||
"description": "Qianfan Lightning 128B A19B، مدل عمومی چینی با عملکرد بالا، مناسب برای پرسش و پاسخ پیچیده و استدلال در مقیاس بزرگ."
|
||
},
|
||
"qianfan-llama-vl-8b": {
|
||
"description": "Qianfan Llama VL 8B، مدل چندرسانهای مبتنی بر Llama، مناسب برای وظایف عمومی درک تصویر و متن."
|
||
},
|
||
"qianfan-multipicocr": {
|
||
"description": "Qianfan MultiPicOCR، مدل OCR چندتصویری، پشتیبانی از شناسایی و تشخیص متن در چندین تصویر."
|
||
},
|
||
"qianfan-qi-vl": {
|
||
"description": "Qianfan QI VL، مدل پرسش و پاسخ چندرسانهای، پشتیبانی از جستجو و پاسخ دقیق در سناریوهای پیچیده تصویر و متن."
|
||
},
|
||
"qianfan-singlepicocr": {
|
||
"description": "Qianfan SinglePicOCR، مدل OCR تکتصویری، پشتیبانی از شناسایی دقیق کاراکترها."
|
||
},
|
||
"qianfan-vl-70b": {
|
||
"description": "Qianfan VL 70B، مدل زبان تصویری با پارامترهای بزرگ، مناسب برای درک پیچیده تصویر و متن."
|
||
},
|
||
"qianfan-vl-8b": {
|
||
"description": "Qianfan VL 8B، مدل سبک زبان تصویری، مناسب برای پرسش و پاسخ روزمره و تحلیل تصویر و متن."
|
||
},
|
||
"qvq-72b-preview": {
|
||
"description": "مدل QVQ یک مدل تحقیقاتی تجربی است که توسط تیم Qwen توسعه یافته و بر بهبود توانایی استدلال بصری، بهویژه در زمینه استدلال ریاضی تمرکز دارد."
|
||
},
|
||
"qvq-max": {
|
||
"description": "مدل استدلال بینایی QVQ Tongyi Qianwen که از ورودیهای بینایی و خروجی زنجیره فکری پشتیبانی میکند و در ریاضیات، برنامهنویسی، تحلیل بینایی، خلاقیت و وظایف عمومی تواناییهای قویتری نشان میدهد."
|
||
},
|
||
"qvq-plus": {
|
||
"description": "مدل استدلال بصری. پشتیبانی از ورودیهای بصری و خروجی زنجیره تفکر، نسخه پلاس پس از مدل qvq-max، که نسبت به مدل qvq-max سرعت استدلال بالاتر و تعادل بهتری بین عملکرد و هزینه دارد."
|
||
},
|
||
"qwen-3-32b": {
|
||
"description": "Qwen 3 32B: مدل سری Qwen با عملکرد عالی در وظایف چندزبانه و برنامهنویسی، مناسب برای استفاده در مقیاس متوسط تولیدی."
|
||
},
|
||
"qwen-coder-plus": {
|
||
"description": "مدل کد نویسی Tongyi Qianwen."
|
||
},
|
||
"qwen-coder-turbo": {
|
||
"description": "مدل کد نویسی Tongyi Qianwen."
|
||
},
|
||
"qwen-coder-turbo-latest": {
|
||
"description": "مدل کدنویسی تونگی چیانون."
|
||
},
|
||
"qwen-flash": {
|
||
"description": "مدلهای سری «通义千问» با سریعترین پاسخدهی و هزینهای بسیار پایین، مناسب برای وظایف ساده."
|
||
},
|
||
"qwen-image": {
|
||
"description": "Qwen-Image یک مدل عمومی تولید تصویر است که از سبکهای هنری متنوعی پشتیبانی میکند و بهویژه در رندر متنهای پیچیده تبحر دارد، بهخصوص رندر متنهای چینی و انگلیسی. این مدل از چینش چندخطی، تولید متن در سطح پاراگراف و بازنمایی جزئیات ریز پشتیبانی میکند و قادر است طراحیهای پیچیده ترکیبی متن و تصویر را تحقق بخشد."
|
||
},
|
||
"qwen-image-edit": {
|
||
"description": "Qwen Image Edit یک مدل تصویر به تصویر است که از ویرایش و اصلاح تصویر بر اساس تصویر ورودی و راهنمای متنی پشتیبانی میکند و قادر است بر اساس نیازهای کاربر، تصویر اصلی را به دقت تنظیم و به صورت خلاقانه تغییر دهد."
|
||
},
|
||
"qwen-long": {
|
||
"description": "مدل زبانی بسیار بزرگ Tongyi Qianwen که از متنهای طولانی و همچنین قابلیت مکالمه در چندین سناریو مانند اسناد طولانی و چندین سند پشتیبانی میکند."
|
||
},
|
||
"qwen-math-plus": {
|
||
"description": "مدل ریاضی Tongyi Qianwen که به طور خاص برای حل مسائل ریاضی طراحی شده است."
|
||
},
|
||
"qwen-math-plus-latest": {
|
||
"description": "مدل ریاضی Qwen یک مدل زبانی است که به طور خاص برای حل مسائل ریاضی طراحی شده است."
|
||
},
|
||
"qwen-math-turbo": {
|
||
"description": "مدل ریاضی Tongyi Qianwen که به طور خاص برای حل مسائل ریاضی طراحی شده است."
|
||
},
|
||
"qwen-math-turbo-latest": {
|
||
"description": "مدل ریاضی Qwen Math Turbo یک مدل زبانی است که به طور خاص برای حل مسائل ریاضی طراحی شده است."
|
||
},
|
||
"qwen-max": {
|
||
"description": "مدل زبان بسیار بزرگ و با ظرفیت Qwen با توانایی پشتیبانی از ورودی زبانهای مختلف مانند چینی و انگلیسی، در حال حاضر مدل API پشت نسخه محصول Qwen 2.5 است."
|
||
},
|
||
"qwen-omni-turbo": {
|
||
"description": "مدلهای سری Qwen-Omni از ورودیهای چندرسانهای مختلف از جمله ویدئو، صدا، تصویر و متن پشتیبانی میکنند و خروجی صوتی و متنی ارائه میدهند."
|
||
},
|
||
"qwen-plus": {
|
||
"description": "مدل زبان بسیار بزرگ Qwen در نسخه تقویت شده، از ورودی زبانهای مختلف مانند چینی و انگلیسی پشتیبانی میکند."
|
||
},
|
||
"qwen-turbo": {
|
||
"description": "نسخهٔ Turbo مدل «通义千问» از این پس بهروزرسانی نخواهد شد؛ پیشنهاد میشود آن را با «通义千问 Flash» جایگزین کنید. 通义千问 یک مدل زبانی فوقالعاده بزرگ است که از ورودیهایی به زبانهای چینی، انگلیسی و دیگر زبانها پشتیبانی میکند."
|
||
},
|
||
"qwen-vl-chat-v1": {
|
||
"description": "مدل Qwen-VL از روشهای تعاملی انعطافپذیر پشتیبانی میکند، از جمله قابلیتهای چندتصویری، پرسش و پاسخ چندمرحلهای و خلاقیت."
|
||
},
|
||
"qwen-vl-max": {
|
||
"description": "مدل بزرگ زبان-بینایی فوقالعاده بزرگ Tongyi Qianwen. نسبت به نسخه تقویتشده، توانایی استدلال بینایی و پیروی از دستورات را مجدداً ارتقاء داده و سطح بالاتری از ادراک و شناخت بینایی را ارائه میدهد."
|
||
},
|
||
"qwen-vl-max-latest": {
|
||
"description": "مدل زبان بصری فوقالعاده بزرگ Qwen-VL. در مقایسه با نسخه تقویتشده، توانایی استدلال بصری و پیروی از دستورات را دوباره بهبود میبخشد و سطح بالاتری از ادراک و شناخت بصری را ارائه میدهد."
|
||
},
|
||
"qwen-vl-ocr": {
|
||
"description": "مدل اختصاصی استخراج متن Tongyi Qianwen OCR که بر استخراج متن از تصاویر اسناد، جداول، سوالات و دستنوشتهها تمرکز دارد. این مدل قادر به شناسایی چندین زبان است که شامل چینی، انگلیسی، فرانسوی، ژاپنی، کرهای، آلمانی، روسی، ایتالیایی، ویتنامی و عربی میباشد."
|
||
},
|
||
"qwen-vl-plus": {
|
||
"description": "نسخه تقویتشده مدل بزرگ زبان-بینایی Tongyi Qianwen. توانایی شناسایی جزئیات و تشخیص متن را به طور چشمگیری افزایش داده و از تصاویر با رزولوشن بیش از یک میلیون پیکسل و نسبت ابعاد دلخواه پشتیبانی میکند."
|
||
},
|
||
"qwen-vl-plus-latest": {
|
||
"description": "نسخه تقویتشده مدل زبان تصویری بزرگ تونگی چیانون. بهبود قابل توجه در توانایی تشخیص جزئیات و شناسایی متن، پشتیبانی از وضوح بیش از یک میلیون پیکسل و تصاویر با هر نسبت طول به عرض."
|
||
},
|
||
"qwen-vl-v1": {
|
||
"description": "مدل زبان Qwen-7B با اضافه کردن مدل تصویر و وضوح ورودی تصویر 448، به عنوان یک مدل پیشآموزششده، اولیهسازی شده است."
|
||
},
|
||
"qwen/qwen-2-7b-instruct": {
|
||
"description": "Qwen2 یک سری جدید از مدلهای زبان بزرگ Qwen است. Qwen2 7B یک مدل مبتنی بر ترنسفورمر است که در درک زبان، قابلیتهای چند زبانه، برنامهنویسی، ریاضی و استدلال عملکرد عالی دارد."
|
||
},
|
||
"qwen/qwen-2-7b-instruct:free": {
|
||
"description": "Qwen2 یک سری جدید از مدلهای زبان بزرگ است که دارای تواناییهای درک و تولید قویتری میباشد."
|
||
},
|
||
"qwen/qwen-2-vl-72b-instruct": {
|
||
"description": "Qwen2-VL جدیدترین نسخه از مدل Qwen-VL است که در آزمونهای معیار درک بصری به عملکرد پیشرفتهای دست یافته است، از جمله MathVista، DocVQA، RealWorldQA و MTVQA. Qwen2-VL قادر به درک ویدیوهای بیش از 20 دقیقه است و برای پرسش و پاسخ، گفتگو و تولید محتوا مبتنی بر ویدیو با کیفیت بالا استفاده میشود. این مدل همچنین دارای قابلیتهای پیچیده استدلال و تصمیمگیری است و میتواند با دستگاههای موبایل، رباتها و غیره ادغام شود و بر اساس محیط بصری و دستورات متنی به طور خودکار عمل کند. علاوه بر انگلیسی و چینی، Qwen2-VL اکنون از درک متنهای مختلف زبان در تصاویر نیز پشتیبانی میکند، از جمله بیشتر زبانهای اروپایی، ژاپنی، کرهای، عربی و ویتنامی."
|
||
},
|
||
"qwen/qwen-2.5-72b-instruct": {
|
||
"description": "Qwen2.5-72B-Instruct یکی از جدیدترین سری مدلهای زبان بزرگ منتشر شده توسط Alibaba Cloud است. این مدل 72B در زمینههای کدنویسی و ریاضی دارای قابلیتهای بهبود یافته قابل توجهی است. این مدل همچنین از چندین زبان پشتیبانی میکند و بیش از 29 زبان از جمله چینی و انگلیسی را پوشش میدهد. این مدل در پیروی از دستورات، درک دادههای ساختاری و تولید خروجیهای ساختاری (به ویژه JSON) بهبودهای قابل توجهی داشته است."
|
||
},
|
||
"qwen/qwen2.5-32b-instruct": {
|
||
"description": "Qwen2.5-32B-Instruct یکی از جدیدترین سری مدلهای زبان بزرگ منتشر شده توسط Alibaba Cloud است. این مدل 32B در زمینههای کدنویسی و ریاضی دارای قابلیتهای بهبود یافته قابل توجهی است. این مدل از چندین زبان پشتیبانی میکند و بیش از 29 زبان از جمله چینی و انگلیسی را پوشش میدهد. این مدل در پیروی از دستورات، درک دادههای ساختاری و تولید خروجیهای ساختاری (به ویژه JSON) بهبودهای قابل توجهی داشته است."
|
||
},
|
||
"qwen/qwen2.5-7b-instruct": {
|
||
"description": "مدل LLM برای زبانهای چینی و انگلیسی که در زمینههای زبان، برنامهنویسی، ریاضیات و استدلال تخصص دارد."
|
||
},
|
||
"qwen/qwen2.5-coder-32b-instruct": {
|
||
"description": "مدل LLM پیشرفته که از تولید کد، استدلال و اصلاح پشتیبانی میکند و شامل زبانهای برنامهنویسی اصلی است."
|
||
},
|
||
"qwen/qwen2.5-coder-7b-instruct": {
|
||
"description": "مدل کد قدرتمند و متوسط که از طول زمینه 32K پشتیبانی میکند و در برنامهنویسی چند زبانه مهارت دارد."
|
||
},
|
||
"qwen/qwen3-14b": {
|
||
"description": "Qwen3-14B نسخه 14 میلیاردی از سری Qwen است که برای استدلال و گفتوگوهای معمولی مناسب است."
|
||
},
|
||
"qwen/qwen3-14b:free": {
|
||
"description": "Qwen3-14B یک مدل زبان علّی با ۱۴.۸ میلیارد پارامتر در سری Qwen3 است که به طور خاص برای استدلال پیچیده و مکالمات کارآمد طراحی شده است. این مدل از جابجایی بیوقفه بین حالت «تفکر» برای وظایف ریاضی، برنامهنویسی و استدلال منطقی و حالت «غیرتفکری» برای مکالمات عمومی پشتیبانی میکند. این مدل به طور خاص برای پیروی از دستورات، استفاده از ابزارهای نمایندگی، نوشتن خلاق و انجام وظایف چند زبانه در بیش از ۱۰۰ زبان و گویش مختلف تنظیم شده است. این مدل به طور بومی از ۳۲K توکن زمینه پشتیبانی میکند و میتواند با استفاده از گسترش مبتنی بر YaRN به ۱۳۱K توکن گسترش یابد."
|
||
},
|
||
"qwen/qwen3-235b-a22b": {
|
||
"description": "Qwen3-235B-A22B یک مدل متخصص ترکیبی (MoE) با ۲۳۵B پارامتر است که توسط Qwen توسعه یافته و در هر بار انتقال رو به جلو ۲۲B پارامتر فعال میشود. این مدل از جابجایی بیوقفه بین حالت «تفکر» برای استدلال پیچیده، ریاضیات و وظایف کدنویسی و حالت «غیرتفکری» برای کارایی مکالمات عمومی پشتیبانی میکند. این مدل تواناییهای استدلال قوی، پشتیبانی چند زبانه (بیش از ۱۰۰ زبان و گویش)، پیروی از دستورات پیشرفته و توانایی فراخوانی ابزارهای نمایندگی را نشان میدهد. این مدل به طور بومی از پنجره زمینه ۳۲K توکن پشتیبانی میکند و میتواند با استفاده از گسترش مبتنی بر YaRN به ۱۳۱K توکن گسترش یابد."
|
||
},
|
||
"qwen/qwen3-235b-a22b-2507": {
|
||
"description": "Qwen3-235B-A22B-Instruct نسخه Instruct از سری Qwen3 است که برای دستورالعملهای چندزبانه و زمینههای طولانی بهینه شده است."
|
||
},
|
||
"qwen/qwen3-235b-a22b-thinking-2507": {
|
||
"description": "Qwen3-235B-A22B-Thinking نسخه Thinking از Qwen3 است که برای وظایف پیچیده ریاضی و استدلالی تقویت شده است."
|
||
},
|
||
"qwen/qwen3-235b-a22b:free": {
|
||
"description": "Qwen3-235B-A22B یک مدل متخصص ترکیبی (MoE) با ۲۳۵B پارامتر است که توسط Qwen توسعه یافته و در هر بار انتقال رو به جلو ۲۲B پارامتر فعال میشود. این مدل از جابجایی بیوقفه بین حالت «تفکر» برای استدلال پیچیده، ریاضیات و وظایف کدنویسی و حالت «غیرتفکری» برای کارایی مکالمات عمومی پشتیبانی میکند. این مدل تواناییهای استدلال قوی، پشتیبانی چند زبانه (بیش از ۱۰۰ زبان و گویش)، پیروی از دستورات پیشرفته و توانایی فراخوانی ابزارهای نمایندگی را نشان میدهد. این مدل به طور بومی از پنجره زمینه ۳۲K توکن پشتیبانی میکند و میتواند با استفاده از گسترش مبتنی بر YaRN به ۱۳۱K توکن گسترش یابد."
|
||
},
|
||
"qwen/qwen3-30b-a3b": {
|
||
"description": "Qwen3 نسل جدیدی از سری مدلهای زبان بزرگ Qwen است که دارای معماری ترکیبی فشرده و متخصص (MoE) میباشد و در زمینه استدلال، پشتیبانی چند زبانه و وظایف پیشرفته نمایشی عالی دارد. توانایی منحصر به فرد آن در جابجایی بیوقفه بین حالتهای تفکر برای استدلال پیچیده و حالتهای غیرتفکری برای مکالمات کارآمد، عملکرد چندمنظوره و با کیفیت بالا را تضمین میکند.\n\nQwen3 به طور قابل توجهی از مدلهای قبلی مانند QwQ و Qwen2.5 برتر است و تواناییهای فوقالعادهای در ریاضیات، کدنویسی، استدلال عمومی، نوشتن خلاق و مکالمات تعاملی ارائه میدهد. واریانت Qwen3-30B-A3B شامل ۳۰.۵ میلیارد پارامتر (۳.۳ میلیارد پارامتر فعال)، ۴۸ لایه، ۱۲۸ متخصص (که هر کدام ۸ مورد را فعال میکنند) است و از زمینه ۱۳۱K توکن پشتیبانی میکند (با استفاده از YaRN) و استاندارد جدیدی برای مدلهای متنباز تعیین میکند."
|
||
},
|
||
"qwen/qwen3-30b-a3b:free": {
|
||
"description": "Qwen3 نسل جدیدی از سری مدلهای زبان بزرگ Qwen است که دارای معماری ترکیبی فشرده و متخصص (MoE) میباشد و در زمینه استدلال، پشتیبانی چند زبانه و وظایف پیشرفته نمایشی عالی دارد. توانایی منحصر به فرد آن در جابجایی بیوقفه بین حالتهای تفکر برای استدلال پیچیده و حالتهای غیرتفکری برای مکالمات کارآمد، عملکرد چندمنظوره و با کیفیت بالا را تضمین میکند.\n\nQwen3 به طور قابل توجهی از مدلهای قبلی مانند QwQ و Qwen2.5 برتر است و تواناییهای فوقالعادهای در ریاضیات، کدنویسی، استدلال عمومی، نوشتن خلاق و مکالمات تعاملی ارائه میدهد. واریانت Qwen3-30B-A3B شامل ۳۰.۵ میلیارد پارامتر (۳.۳ میلیارد پارامتر فعال)، ۴۸ لایه، ۱۲۸ متخصص (که هر کدام ۸ مورد را فعال میکنند) است و از زمینه ۱۳۱K توکن پشتیبانی میکند (با استفاده از YaRN) و استاندارد جدیدی برای مدلهای متنباز تعیین میکند."
|
||
},
|
||
"qwen/qwen3-32b": {
|
||
"description": "Qwen3-32B یک مدل زبان علّی با ۳۲.۸ میلیارد پارامتر در سری Qwen3 است که به طور خاص برای استدلال پیچیده و مکالمات کارآمد بهینهسازی شده است. این مدل از جابجایی بیوقفه بین حالت «تفکر» برای وظایف ریاضی، کدنویسی و استدلال منطقی و حالت «غیرتفکری» برای مکالمات سریع و عمومی پشتیبانی میکند. این مدل در پیروی از دستورات، استفاده از ابزارهای نمایندگی، نوشتن خلاق و انجام وظایف چند زبانه در بیش از ۱۰۰ زبان و گویش مختلف عملکرد قوی دارد. این مدل به طور بومی از ۳۲K توکن زمینه پشتیبانی میکند و میتواند با استفاده از گسترش مبتنی بر YaRN به ۱۳۱K توکن گسترش یابد."
|
||
},
|
||
"qwen/qwen3-32b:free": {
|
||
"description": "Qwen3-32B یک مدل زبان علّی با ۳۲.۸ میلیارد پارامتر در سری Qwen3 است که به طور خاص برای استدلال پیچیده و مکالمات کارآمد بهینهسازی شده است. این مدل از جابجایی بیوقفه بین حالت «تفکر» برای وظایف ریاضی، کدنویسی و استدلال منطقی و حالت «غیرتفکری» برای مکالمات سریع و عمومی پشتیبانی میکند. این مدل در پیروی از دستورات، استفاده از ابزارهای نمایندگی، نوشتن خلاق و انجام وظایف چند زبانه در بیش از ۱۰۰ زبان و گویش مختلف عملکرد قوی دارد. این مدل به طور بومی از ۳۲K توکن زمینه پشتیبانی میکند و میتواند با استفاده از گسترش مبتنی بر YaRN به ۱۳۱K توکن گسترش یابد."
|
||
},
|
||
"qwen/qwen3-8b:free": {
|
||
"description": "Qwen3-8B یک مدل زبان علّی با ۸.۲ میلیارد پارامتر در سری Qwen3 است که به طور خاص برای وظایف استدلال فشرده و مکالمات کارآمد طراحی شده است. این مدل از جابجایی بیوقفه بین حالت «تفکر» برای ریاضیات، کدنویسی و استدلال منطقی و حالت «غیرتفکری» برای مکالمات عمومی پشتیبانی میکند. این مدل به طور خاص برای پیروی از دستورات، ادغام نمایندگی، نوشتن خلاق و استفاده چند زبانه در بیش از ۱۰۰ زبان و گویش مختلف تنظیم شده است. این مدل به طور بومی از پنجره زمینه ۳۲K توکن پشتیبانی میکند و میتواند از طریق YaRN به ۱۳۱K توکن گسترش یابد."
|
||
},
|
||
"qwen/qwen3-coder": {
|
||
"description": "Qwen3-Coder خانواده تولیدکننده کد از Qwen3 است که در درک و تولید کد در اسناد طولانی تخصص دارد."
|
||
},
|
||
"qwen/qwen3-coder-plus": {
|
||
"description": "Qwen3-Coder-Plus مدل کدنویسی بهینهشده ویژه از سری Qwen است که از فراخوانی ابزارهای پیچیده و مکالمات بلندمدت پشتیبانی میکند."
|
||
},
|
||
"qwen/qwen3-max": {
|
||
"description": "Qwen3 Max مدل استدلالی سطح بالا از سری Qwen3 است که برای استدلال چندزبانه و یکپارچهسازی ابزارها مناسب است."
|
||
},
|
||
"qwen/qwen3-max-preview": {
|
||
"description": "Qwen3 Max (پیشنمایش) نسخه Max از سری Qwen است که برای استدلال پیشرفته و یکپارچهسازی ابزارها طراحی شده است."
|
||
},
|
||
"qwen/qwen3-vl-plus": {
|
||
"description": "Qwen3 VL-Plus نسخه تقویتشده بصری از Qwen3 است که توانایی استدلال چندحالته و پردازش ویدیو را بهبود داده است."
|
||
},
|
||
"qwen2": {
|
||
"description": "Qwen2 مدل زبان بزرگ نسل جدید علیبابا است که با عملکرد عالی از نیازهای متنوع کاربردی پشتیبانی میکند."
|
||
},
|
||
"qwen2.5": {
|
||
"description": "Qwen2.5 نسل جدید مدل زبانی مقیاس بزرگ Alibaba است که با عملکرد عالی از نیازهای متنوع کاربردی پشتیبانی میکند."
|
||
},
|
||
"qwen2.5-14b-instruct": {
|
||
"description": "مدل 14B مقیاس Qwen 2.5 که به صورت منبع باز ارائه شده است."
|
||
},
|
||
"qwen2.5-14b-instruct-1m": {
|
||
"description": "مدل 72B مقیاس Qwen2.5 که به صورت متنباز ارائه شده است."
|
||
},
|
||
"qwen2.5-32b-instruct": {
|
||
"description": "مدل 32B مقیاس Qwen 2.5 که به صورت منبع باز ارائه شده است."
|
||
},
|
||
"qwen2.5-72b-instruct": {
|
||
"description": "مدل 72B مقیاس بازمتن Qwen 2.5 برای استفاده عمومی."
|
||
},
|
||
"qwen2.5-7b-instruct": {
|
||
"description": "Qwen2.5 7B Instruct، مدل دستورالعمل متنباز و بالغ، مناسب برای گفتگو و تولید در سناریوهای مختلف."
|
||
},
|
||
"qwen2.5-coder-1.5b-instruct": {
|
||
"description": "نسخه متنباز مدل کد Qwen."
|
||
},
|
||
"qwen2.5-coder-14b-instruct": {
|
||
"description": "نسخه متنباز مدل کد نویسی Tongyi Qianwen."
|
||
},
|
||
"qwen2.5-coder-32b-instruct": {
|
||
"description": "نسخه متن باز مدل کد Qwen."
|
||
},
|
||
"qwen2.5-coder-7b-instruct": {
|
||
"description": "نسخه متنباز مدل کدنویسی تونگی چیانون."
|
||
},
|
||
"qwen2.5-coder-instruct": {
|
||
"description": "Qwen2.5-Coder جدیدترین مدل زبانی بزرگ مخصوص کد نویسی از سری Qwen (که قبلاً با نام CodeQwen شناخته میشد) است."
|
||
},
|
||
"qwen2.5-instruct": {
|
||
"description": "Qwen2.5 جدیدترین سری مدلهای زبانی بزرگ Qwen است. برای Qwen2.5، ما چندین مدل زبانی پایه و مدلهای زبانی با تنظیم دستورالعملهای میکرو منتشر کردهایم که تعداد پارامتر آنها از 500 میلیون تا 7.2 میلیارد متفاوت است."
|
||
},
|
||
"qwen2.5-math-1.5b-instruct": {
|
||
"description": "مدل Qwen-Math دارای قابلیتهای قوی حل مسئله ریاضی است."
|
||
},
|
||
"qwen2.5-math-72b-instruct": {
|
||
"description": "مدل Qwen-Math دارای توانایی قوی در حل مسائل ریاضی است."
|
||
},
|
||
"qwen2.5-math-7b-instruct": {
|
||
"description": "مدل Qwen-Math دارای توانایی قوی در حل مسائل ریاضی است."
|
||
},
|
||
"qwen2.5-omni-7b": {
|
||
"description": "مدلهای سری Qwen-Omni از ورودیهای چندگانه شامل ویدیو، صدا، تصویر و متن پشتیبانی میکنند و خروجیهایی به صورت صدا و متن ارائه میدهند."
|
||
},
|
||
"qwen2.5-vl-32b-instruct": {
|
||
"description": "Qwen2.5 VL 32B Instruct، مدل چندرسانهای متنباز، مناسب برای استقرار خصوصی و کاربردهای متنوع."
|
||
},
|
||
"qwen2.5-vl-72b-instruct": {
|
||
"description": "پیروی از دستورات، ریاضیات، حل مسائل، بهبود کلی کد، بهبود توانایی شناسایی همه چیز، پشتیبانی از فرمتهای مختلف برای شناسایی دقیق عناصر بصری، پشتیبانی از درک فایلهای ویدیویی طولانی (حداکثر 10 دقیقه) و شناسایی لحظات رویداد در سطح ثانیه، توانایی درک زمان و سرعت، بر اساس توانایی تجزیه و تحلیل و شناسایی، پشتیبانی از کنترل عاملهای OS یا Mobile، توانایی استخراج اطلاعات کلیدی و خروجی به فرمت Json قوی، این نسخه 72B است و قویترین نسخه در این سری است."
|
||
},
|
||
"qwen2.5-vl-7b-instruct": {
|
||
"description": "Qwen2.5 VL 7B Instruct، مدل سبک چندرسانهای، توازن بین هزینه استقرار و توان شناسایی."
|
||
},
|
||
"qwen2.5-vl-instruct": {
|
||
"description": "Qwen2.5-VL نسخه جدید مدل زبانی و بصری از خانواده مدلهای Qwen است."
|
||
},
|
||
"qwen2.5:0.5b": {
|
||
"description": "Qwen2.5 نسل جدید مدل زبانی مقیاس بزرگ Alibaba است که با عملکرد عالی از نیازهای متنوع کاربردی پشتیبانی میکند."
|
||
},
|
||
"qwen2.5:1.5b": {
|
||
"description": "Qwen2.5 نسل جدید مدل زبانی مقیاس بزرگ Alibaba است که با عملکرد عالی از نیازهای متنوع کاربردی پشتیبانی میکند."
|
||
},
|
||
"qwen2.5:72b": {
|
||
"description": "Qwen2.5 نسل جدید مدل زبانی مقیاس بزرگ Alibaba است که با عملکرد عالی از نیازهای متنوع کاربردی پشتیبانی میکند."
|
||
},
|
||
"qwen2:0.5b": {
|
||
"description": "Qwen2 مدل زبان بزرگ نسل جدید علیبابا است که با عملکرد عالی از نیازهای متنوع کاربردی پشتیبانی میکند."
|
||
},
|
||
"qwen2:1.5b": {
|
||
"description": "Qwen2 مدل زبان بزرگ نسل جدید علیبابا است که با عملکرد عالی از نیازهای متنوع کاربردی پشتیبانی میکند."
|
||
},
|
||
"qwen2:72b": {
|
||
"description": "Qwen2 مدل زبان بزرگ نسل جدید علیبابا است که با عملکرد عالی از نیازهای متنوع کاربردی پشتیبانی میکند."
|
||
},
|
||
"qwen3": {
|
||
"description": "Qwen3 مدل زبان نسل جدید علیبابا است که با عملکرد عالی، نیازهای متنوع کاربردی را پشتیبانی میکند."
|
||
},
|
||
"qwen3-0.6b": {
|
||
"description": "Qwen3 0.6B، مدل سطح ابتدایی، مناسب برای استدلال ساده و محیطهای با منابع بسیار محدود."
|
||
},
|
||
"qwen3-1.7b": {
|
||
"description": "Qwen3 1.7B، مدل فوقسبک، مناسب برای استقرار در لبه و دستگاههای نهایی."
|
||
},
|
||
"qwen3-14b": {
|
||
"description": "Qwen3 14B، مدل متوسط، مناسب برای پرسش و پاسخ چندزبانه و تولید متن."
|
||
},
|
||
"qwen3-235b-a22b": {
|
||
"description": "Qwen3 235B A22B، مدل بزرگ عمومی، مناسب برای وظایف پیچیده گوناگون."
|
||
},
|
||
"qwen3-235b-a22b-instruct-2507": {
|
||
"description": "Qwen3 235B A22B Instruct 2507، مدل دستورالعمل پرچمدار عمومی، مناسب برای تولید و استدلال در وظایف مختلف."
|
||
},
|
||
"qwen3-235b-a22b-thinking-2507": {
|
||
"description": "Qwen3 235B A22B Thinking 2507، مدل تفکر در مقیاس بسیار بزرگ، مناسب برای استدلالهای دشوار."
|
||
},
|
||
"qwen3-30b-a3b": {
|
||
"description": "Qwen3 30B A3B، مدل عمومی متوسط تا بزرگ، توازن بین هزینه و کارایی."
|
||
},
|
||
"qwen3-30b-a3b-instruct-2507": {
|
||
"description": "Qwen3 30B A3B Instruct 2507، مدل دستورالعمل متوسط تا بزرگ، مناسب برای تولید با کیفیت و پرسش و پاسخ."
|
||
},
|
||
"qwen3-30b-a3b-thinking-2507": {
|
||
"description": "Qwen3 30B A3B Thinking 2507، مدل تفکر متوسط تا بزرگ، توازن بین دقت و هزینه."
|
||
},
|
||
"qwen3-32b": {
|
||
"description": "Qwen3 32B، مناسب برای وظایف عمومی که نیاز به درک قویتری دارند."
|
||
},
|
||
"qwen3-4b": {
|
||
"description": "Qwen3 4B، مناسب برای کاربردهای کوچک تا متوسط و سناریوهای استدلال محلی."
|
||
},
|
||
"qwen3-8b": {
|
||
"description": "Qwen3 8B، مدل سبک، با استقرار انعطافپذیر، مناسب برای کاربردهای با همزمانی بالا."
|
||
},
|
||
"qwen3-coder-30b-a3b-instruct": {
|
||
"description": "نسخه متنباز مدل کدنویسی Qwen. مدل جدید qwen3-coder-30b-a3b-instruct بر پایه Qwen3 ساخته شده و دارای تواناییهای قدرتمند در نقش عامل کدنویس (Coding Agent) است. این مدل در فراخوانی ابزارها و تعامل با محیط مهارت دارد و ضمن حفظ تواناییهای عمومی، قابلیت برنامهنویسی خودکار و تولید کد پیشرفته را ارائه میدهد."
|
||
},
|
||
"qwen3-coder-480b-a35b-instruct": {
|
||
"description": "Qwen3 Coder 480B A35B Instruct، مدل پرچمدار کدنویسی، پشتیبانی از برنامهنویسی چندزبانه و درک کد پیچیده."
|
||
},
|
||
"qwen3-coder-flash": {
|
||
"description": "مدل کد نویسی Tongyi Qianwen. جدیدترین مدلهای سری Qwen3-Coder بر پایه Qwen3 ساخته شدهاند و دارای تواناییهای قدرتمند Coding Agent هستند، در فراخوانی ابزارها و تعامل با محیط مهارت دارند، قادر به برنامهنویسی خودکار هستند و در کنار تواناییهای کدنویسی برجسته، قابلیتهای عمومی نیز دارند."
|
||
},
|
||
"qwen3-coder-plus": {
|
||
"description": "مدل کد نویسی Tongyi Qianwen. جدیدترین مدلهای سری Qwen3-Coder بر پایه Qwen3 ساخته شدهاند و دارای تواناییهای قدرتمند Coding Agent هستند، در فراخوانی ابزارها و تعامل با محیط مهارت دارند، قادر به برنامهنویسی خودکار هستند و در کنار تواناییهای کدنویسی برجسته، قابلیتهای عمومی نیز دارند."
|
||
},
|
||
"qwen3-coder:480b": {
|
||
"description": "مدل با عملکرد بالا و زمینه طولانی طراحی شده توسط علیبابا برای وظایف نمایندگی و کدنویسی."
|
||
},
|
||
"qwen3-max": {
|
||
"description": "مدل سری Qwen3-Max از Tongyi Qianwen 3 که نسبت به سری 2.5 به طور کلی تواناییهای عمومی بهبود یافتهای دارد؛ شامل درک متن دو زبانه چینی و انگلیسی، پیروی از دستورالعملهای پیچیده، توانایی انجام وظایف باز و ذهنی، پشتیبانی چندزبانه و فراخوانی ابزارها که همه به طور قابل توجهی تقویت شدهاند؛ خطاهای دانش مدل نیز کاهش یافته است. جدیدترین مدل Qwen3-Max نسبت به نسخه پیشنمایش Qwen3-Max در زمینه برنامهنویسی هوشمند و فراخوانی ابزارها بهروزرسانیهای ویژهای داشته است. نسخه رسمی منتشر شده به سطح SOTA حوزه رسیده و برای نیازهای پیچیدهتر هوش مصنوعی تطبیق یافته است."
|
||
},
|
||
"qwen3-max-preview": {
|
||
"description": "بهترین مدل در سری Qwen، مناسب برای وظایف پیچیده و چندمرحلهای. نسخه پیشنمایش اکنون از قابلیت تفکر پشتیبانی میکند."
|
||
},
|
||
"qwen3-next-80b-a3b-instruct": {
|
||
"description": "مدل متنباز نسل جدید بدون حالت تفکر مبتنی بر Qwen3، که نسبت به نسخه قبلی (Tongyi Qianwen 3-235B-A22B-Instruct-2507) در درک متنهای چینی بهتر است، توانایی استدلال منطقی بهبود یافته و عملکرد بهتری در وظایف تولید متن دارد."
|
||
},
|
||
"qwen3-next-80b-a3b-thinking": {
|
||
"description": "Qwen3 Next 80B A3B Thinking، نسخه پرچمدار مدل استدلال برای وظایف پیچیده."
|
||
},
|
||
"qwen3-omni-flash": {
|
||
"description": "مدل Qwen-Omni قادر است ورودیهایی از انواع مختلف مانند متن، تصویر، صدا و ویدیو را دریافت کرده و پاسخهایی به صورت متن یا گفتار تولید کند. این مدل از صداهای شبهانسانی متنوع، چندزبانگی و گویشهای مختلف پشتیبانی میکند و در کاربردهایی مانند تولید محتوا، تشخیص بصری و دستیار صوتی قابل استفاده است."
|
||
},
|
||
"qwen3-vl-235b-a22b-instruct": {
|
||
"description": "Qwen3 VL 235B A22B Instruct، مدل چندرسانهای پرچمدار، مناسب برای درک و تولید در سناریوهای با نیاز بالا."
|
||
},
|
||
"qwen3-vl-235b-a22b-thinking": {
|
||
"description": "Qwen3 VL 235B A22B Thinking، نسخه تفکر پرچمدار، برای استدلال و برنامهریزی چندرسانهای پیچیده."
|
||
},
|
||
"qwen3-vl-30b-a3b-instruct": {
|
||
"description": "Qwen3 VL 30B A3B Instruct، مدل بزرگ چندرسانهای، توازن بین دقت و عملکرد استدلال."
|
||
},
|
||
"qwen3-vl-30b-a3b-thinking": {
|
||
"description": "Qwen3 VL 30B A3B Thinking، نسخه تفکر برای وظایف پیچیده چندرسانهای."
|
||
},
|
||
"qwen3-vl-32b-instruct": {
|
||
"description": "Qwen3 VL 32B Instruct، مدل دستورالعمل چندرسانهای، مناسب برای پرسش و پاسخ تصویری با کیفیت و تولید محتوا."
|
||
},
|
||
"qwen3-vl-32b-thinking": {
|
||
"description": "Qwen3 VL 32B Thinking، نسخه تفکر چندرسانهای، تقویتشده برای استدلال پیچیده و تحلیل زنجیرهای طولانی."
|
||
},
|
||
"qwen3-vl-8b-instruct": {
|
||
"description": "Qwen3 VL 8B Instruct، مدل سبک چندرسانهای، مناسب برای پرسش و پاسخ تصویری روزمره و یکپارچهسازی در برنامهها."
|
||
},
|
||
"qwen3-vl-8b-thinking": {
|
||
"description": "Qwen3 VL 8B Thinking، مدل زنجیره تفکر چندرسانهای، مناسب برای استدلال دقیق بر اساس اطلاعات تصویری."
|
||
},
|
||
"qwen3-vl-flash": {
|
||
"description": "Qwen3 VL Flash نسخهای سبک و با سرعت بالای استدلال است که برای سناریوهای حساس به تأخیر یا درخواستهای حجیم مناسب میباشد."
|
||
},
|
||
"qwen3-vl-plus": {
|
||
"description": "Tongyi Qianwen VL مدلی برای تولید متن با قابلیت درک بصری (تصویر) است که نه تنها میتواند OCR (تشخیص متن در تصویر) انجام دهد، بلکه قادر به خلاصهسازی و استنتاج بیشتر نیز هست، مانند استخراج ویژگیها از عکس محصولات یا حل مسائل بر اساس تصاویر تمرین."
|
||
},
|
||
"qwq": {
|
||
"description": "QwQ یک مدل تحقیقاتی تجربی است که بر بهبود توانایی استدلال AI تمرکز دارد."
|
||
},
|
||
"qwq-32b": {
|
||
"description": "مدل استنتاج QwQ مبتنی بر مدل Qwen2.5-32B است که از طریق یادگیری تقویتی به طور قابل توجهی توانایی استنتاج مدل را افزایش داده است. شاخصهای اصلی مدل مانند کد ریاضی (AIME 24/25، LiveCodeBench) و برخی از شاخصهای عمومی (IFEval، LiveBench و غیره) به سطح DeepSeek-R1 نسخه کامل رسیدهاند و تمامی شاخصها به طور قابل توجهی از DeepSeek-R1-Distill-Qwen-32B که نیز مبتنی بر Qwen2.5-32B است، پیشی گرفتهاند."
|
||
},
|
||
"qwq-32b-preview": {
|
||
"description": "مدل QwQ یک مدل تحقیقاتی تجربی است که توسط تیم Qwen توسعه یافته و بر تقویت توانایی استدلال AI تمرکز دارد."
|
||
},
|
||
"qwq-plus": {
|
||
"description": "مدل استدلال QwQ مبتنی بر مدل Qwen2.5 است که با یادگیری تقویتی توانایی استدلال مدل را به طور قابل توجهی افزایش داده است. شاخصهای اصلی مدل در ریاضیات و کد نویسی (AIME 24/25، LiveCodeBench) و برخی شاخصهای عمومی (IFEval، LiveBench و غیره) به سطح نسخه کامل DeepSeek-R1 رسیدهاند."
|
||
},
|
||
"qwq_32b": {
|
||
"description": "مدل استدلالی با اندازه متوسط از سری Qwen. نسبت به مدلهای معمولی تنظیمشده بر اساس دستورات، QwQ که دارای تواناییهای تفکر و استدلال است، در وظایف پاییندستی، بهویژه در حل مسائل دشوار، میتواند عملکرد را بهطور قابل توجهی افزایش دهد."
|
||
},
|
||
"r1-1776": {
|
||
"description": "R1-1776 نسخهای از مدل DeepSeek R1 است که پس از آموزش مجدد، اطلاعات واقعی بدون سانسور و بدون تعصب را ارائه میدهد."
|
||
},
|
||
"solar-mini": {
|
||
"description": "Solar Mini یک LLM فشرده است که عملکردی بهتر از GPT-3.5 دارد و دارای تواناییهای چند زبانه قوی است و از انگلیسی و کرهای پشتیبانی میکند و راهحلهای کارآمد و کوچکی را ارائه میدهد."
|
||
},
|
||
"solar-mini-ja": {
|
||
"description": "Solar Mini (Ja) تواناییهای Solar Mini را گسترش میدهد و بر روی زبان ژاپنی تمرکز دارد و در استفاده از انگلیسی و کرهای نیز کارایی و عملکرد عالی را حفظ میکند."
|
||
},
|
||
"solar-pro": {
|
||
"description": "Solar Pro یک مدل هوش مصنوعی پیشرفته از Upstage است که بر توانایی پیروی از دستورات با استفاده از یک GPU تمرکز دارد و امتیاز IFEval بالای 80 را کسب کرده است. در حال حاضر از زبان انگلیسی پشتیبانی میکند و نسخه رسمی آن برای نوامبر 2024 برنامهریزی شده است که پشتیبانی از زبانهای بیشتر و طول زمینه را گسترش خواهد داد."
|
||
},
|
||
"sonar": {
|
||
"description": "محصول جستجوی سبک بر اساس زمینه جستجو که سریعتر و ارزانتر از Sonar Pro است."
|
||
},
|
||
"sonar-deep-research": {
|
||
"description": "تحقیق عمیق، تحقیقاتی جامع و تخصصی را انجام میدهد و آن را به گزارشهای قابل دسترسی و قابل استفاده تبدیل میکند."
|
||
},
|
||
"sonar-pro": {
|
||
"description": "محصول جستجوی پیشرفته که از جستجوی زمینه پشتیبانی میکند و قابلیتهای پیشرفتهای برای پرسش و پیگیری دارد."
|
||
},
|
||
"sonar-reasoning": {
|
||
"description": "محصول جدید API که توسط مدل استدلال DeepSeek پشتیبانی میشود."
|
||
},
|
||
"sonar-reasoning-pro": {
|
||
"description": "محصول جدید API که توسط مدل استدلال DeepSeek پشتیبانی میشود."
|
||
},
|
||
"spark-x": {
|
||
"description": "معرفی قابلیتهای X1.5: (۱) افزودن تنظیم پویا برای حالت تفکر، قابل کنترل از طریق فیلد thinking؛ (۲) افزایش طول زمینه: ورودی و خروجی هرکدام ۶۴ هزار توکن؛ (۳) پشتیبانی از قابلیت FunctionCall."
|
||
},
|
||
"stable-diffusion-3-medium": {
|
||
"description": "جدیدترین مدل بزرگ تولید تصویر از متن که توسط Stability AI ارائه شده است. این نسخه با حفظ مزایای نسلهای قبلی، بهبودهای قابل توجهی در کیفیت تصویر، درک متن و تنوع سبکها دارد و قادر است دستورات پیچیده زبان طبیعی را دقیقتر تفسیر کرده و تصاویر دقیقتر و متنوعتری تولید کند."
|
||
},
|
||
"stable-diffusion-3.5-large": {
|
||
"description": "stable-diffusion-3.5-large یک مدل مولد تصویر از متن مبتنی بر ترنسفورمر انتشار چندرسانهای (MMDiT) با 800 میلیون پارامتر است که کیفیت تصویر عالی و تطابق بالا با دستورات متنی دارد، قادر به تولید تصاویر با وضوح بالا تا 1 میلیون پیکسل است و میتواند به طور کارآمد روی سختافزارهای مصرفی معمول اجرا شود."
|
||
},
|
||
"stable-diffusion-3.5-large-turbo": {
|
||
"description": "stable-diffusion-3.5-large-turbo مدلی است که بر پایه stable-diffusion-3.5-large ساخته شده و با استفاده از تکنولوژی تقطیر انتشار متخاصم (ADD) سرعت بالاتری دارد."
|
||
},
|
||
"stable-diffusion-v1.5": {
|
||
"description": "stable-diffusion-v1.5 با وزنهای نقطه بررسی stable-diffusion-v1.2 آغاز شده و با 595 هزار مرحله تنظیم دقیق روی مجموعه \"laion-aesthetics v2 5+\" با وضوح 512x512 انجام شده است. این مدل 10٪ کاهش شرطبندی متنی دارد تا نمونهبرداری هدایتشده بدون طبقهبندیکننده را بهبود بخشد."
|
||
},
|
||
"stable-diffusion-xl": {
|
||
"description": "stable-diffusion-xl نسبت به نسخه v1.5 بهبودهای قابل توجهی داشته و با مدلهای متنباز پیشرفته مانند midjourney قابل مقایسه است. بهبودها شامل: شبکه اصلی unet بزرگتر که سه برابر نسخه قبلی است؛ افزودن ماژول پالایش برای بهبود کیفیت تصاویر تولید شده؛ و تکنیکهای آموزش بهینهتر."
|
||
},
|
||
"stable-diffusion-xl-base-1.0": {
|
||
"description": "مدل بزرگ تولید تصویر از متن که توسط Stability AI توسعه یافته و متنباز است و در تولید تصاویر خلاقانه در صنعت پیشرو است. دارای توانایی درک دقیق دستورات و پشتیبانی از تعریف معکوس Prompt برای تولید دقیق محتوا است."
|
||
},
|
||
"step-1-128k": {
|
||
"description": "تعادل بین عملکرد و هزینه، مناسب برای سناریوهای عمومی."
|
||
},
|
||
"step-1-256k": {
|
||
"description": "دارای توانایی پردازش متن طولانی، بهویژه مناسب برای تحلیل اسناد بلند."
|
||
},
|
||
"step-1-32k": {
|
||
"description": "پشتیبانی از مکالمات با طول متوسط، مناسب برای انواع مختلف کاربردها."
|
||
},
|
||
"step-1-8k": {
|
||
"description": "مدل کوچک، مناسب برای وظایف سبک."
|
||
},
|
||
"step-1-flash": {
|
||
"description": "مدل پرسرعت، مناسب برای مکالمات در لحظه."
|
||
},
|
||
"step-1.5v-mini": {
|
||
"description": "این مدل دارای تواناییهای قوی در درک ویدیو است."
|
||
},
|
||
"step-1o-turbo-vision": {
|
||
"description": "این مدل دارای تواناییهای قوی در درک تصویر است و در زمینههای ریاضی و کدنویسی از 1o قویتر است. این مدل کوچکتر از 1o است و سرعت خروجی بیشتری دارد."
|
||
},
|
||
"step-1o-vision-32k": {
|
||
"description": "این مدل دارای تواناییهای قوی در درک تصویر است. در مقایسه با مدلهای سری step-1v، عملکرد بصری بهتری دارد."
|
||
},
|
||
"step-1v-32k": {
|
||
"description": "پشتیبانی از ورودی بصری، تقویت تجربه تعامل چندحالته."
|
||
},
|
||
"step-1v-8k": {
|
||
"description": "مدل بصری کوچک، مناسب برای وظایف پایهای تصویر و متن."
|
||
},
|
||
"step-1x-edit": {
|
||
"description": "این مدل بر وظایف ویرایش تصویر تمرکز دارد و قادر است بر اساس تصویر و توصیف متنی ارائه شده توسط کاربر، تصویر را اصلاح و بهبود بخشد. از فرمتهای ورودی مختلف از جمله توصیف متنی و تصاویر نمونه پشتیبانی میکند. مدل قادر به درک نیت کاربر و تولید نتایج ویرایش تصویر مطابق با خواستهها است."
|
||
},
|
||
"step-1x-medium": {
|
||
"description": "این مدل دارای توانایی قوی در تولید تصویر است و از توصیف متنی به عنوان ورودی پشتیبانی میکند. پشتیبانی بومی از زبان چینی دارد و میتواند توصیفهای متنی چینی را بهتر درک و پردازش کند و معنای دقیقتر را به ویژگیهای تصویری تبدیل کند تا تولید تصویر دقیقتری داشته باشد. مدل قادر است تصاویر با وضوح و کیفیت بالا تولید کند و توانایی انتقال سبک نیز دارد."
|
||
},
|
||
"step-2-16k": {
|
||
"description": "پشتیبانی از تعاملات متنی گسترده، مناسب برای سناریوهای مکالمه پیچیده."
|
||
},
|
||
"step-2-16k-exp": {
|
||
"description": "نسخه آزمایشی مدل step-2 که شامل جدیدترین ویژگیها است و بهطور مداوم بهروزرسانی میشود. استفاده در محیطهای تولیدی رسمی توصیه نمیشود."
|
||
},
|
||
"step-2-mini": {
|
||
"description": "مدل بزرگ فوقالعاده سریع مبتنی بر معماری توجه MFA که بهطور خودجوش توسعه یافته است، با هزینه بسیار کم به نتایجی مشابه با مرحله ۱ دست مییابد و در عین حال توانایی پردازش بالاتر و زمان پاسخ سریعتری را حفظ میکند. این مدل قادر به انجام وظایف عمومی است و در تواناییهای کدنویسی تخصص دارد."
|
||
},
|
||
"step-2x-large": {
|
||
"description": "مدل نسل جدید Step Star برای تولید تصویر است که بر تولید تصویر بر اساس توصیف متنی کاربر تمرکز دارد و تصاویر با کیفیت بالا تولید میکند. مدل جدید تصاویر با بافت واقعیتر و توانایی تولید متنهای چینی و انگلیسی قویتر دارد."
|
||
},
|
||
"step-3": {
|
||
"description": "این مدل از تواناییهای قوی در ادراک بصری و استدلال پیچیده برخوردار است. میتواند بهدقت مفاهیم پیچیده میانرشتهای را درک کند، تحلیلهای تقاطعی اطلاعات ریاضی و بصری را انجام دهد و به انواع مسائل تحلیل بصری در زندگی روزمره پاسخ دهد."
|
||
},
|
||
"step-r1-v-mini": {
|
||
"description": "این مدل یک مدل استدلال بزرگ با تواناییهای قوی در درک تصویر است که میتواند اطلاعات تصویری و متنی را پردازش کند و پس از تفکر عمیق، متن تولید کند. این مدل در زمینه استدلال بصری عملکرد برجستهای دارد و همچنین دارای تواناییهای ریاضی، کدنویسی و استدلال متنی در سطح اول است. طول متن زمینهای 100k است."
|
||
},
|
||
"stepfun-ai/step3": {
|
||
"description": "Step3 یک مدل استنتاج چندمودالی پیشرفته است که توسط شرکت StepFun منتشر شده است. این مدل بر پایهٔ معماری مخلوط متخصصان (MoE) با مجموع 321 میلیارد پارامتر و 38 میلیارد پارامتر فعال ساخته شده است. طراحی آن انتهابهانتها است و هدفش کمینهسازی هزینهٔ رمزگشایی در حالیست که در استدلال بینایی-زبانی عملکردی در سطح برتر ارائه میدهد. از طریق طراحی همافزا مبتنی بر توجه چند-ماتریسی تجزیهشده (MFA) و جداسازی توجه و FFN (AFD)، Step3 قادر است کارایی برجستهای را هم روی شتابدهندههای ردهپرچمدار و هم روی شتابدهندههای سطح پایین حفظ کند. در مرحلهٔ پیشآموزش، Step3 بیش از 20T توکن متنی و 4T توکن ترکیبی تصویر-متن را پردازش کرده و بیش از ده زبان را پوشش داده است. این مدل در بنچمارکهای متعددی از جمله ریاضیات، کدنویسی و چندمودال در میان مدلهای متنباز در جایگاه پیشرو قرار گرفته است."
|
||
},
|
||
"taichu_llm": {
|
||
"description": "Taichu 2.0 بر اساس حجم زیادی از دادههای با کیفیت بالا آموزش دیده است و دارای تواناییهای قویتری در درک متن، تولید محتوا، پرسش و پاسخ در مکالمه و غیره میباشد."
|
||
},
|
||
"taichu_o1": {
|
||
"description": "taichu_o1 نسل جدید مدلهای استدلال بزرگ است که از طریق تعامل چندرسانهای و یادگیری تقویتی زنجیرههای تفکر شبیه به انسان را ایجاد میکند و از تصمیمگیریهای پیچیده پشتیبانی میکند و در عین حفظ خروجی با دقت بالا، مسیرهای تفکر قابل مدلسازی را نشان میدهد و برای تحلیل استراتژی و تفکر عمیق مناسب است."
|
||
},
|
||
"taichu_vl": {
|
||
"description": "تواناییهای درک تصویر، انتقال دانش، و استدلال منطقی را ترکیب کرده و در زمینه پرسش و پاسخ تصویری و متنی عملکرد برجستهای دارد."
|
||
},
|
||
"tencent/Hunyuan-A13B-Instruct": {
|
||
"description": "Hunyuan-A13B-Instruct با ۸۰ میلیارد پارامتر، با فعالسازی ۱۳ میلیارد پارامتر قادر به رقابت با مدلهای بزرگتر است و از استدلال ترکیبی «تفکر سریع/تفکر کند» پشتیبانی میکند؛ درک متون بلند به صورت پایدار؛ توانایی عامل با تأیید BFCL-v3 و τ-Bench پیشرو است؛ با ترکیب GQA و چندین فرمت کوانتیزهسازی، استدلال کارآمد را محقق میسازد."
|
||
},
|
||
"tencent/Hunyuan-MT-7B": {
|
||
"description": "مدل ترجمه Hunyuan (Hunyuan Translation Model) شامل دو بخش است: مدل ترجمه Hunyuan-MT-7B و مدل ترکیبی Hunyuan-MT-Chimera. Hunyuan-MT-7B یک مدل ترجمه سبکوزن با ۷ میلیارد پارامتر است که برای ترجمه متن مبدأ به زبان مقصد طراحی شده است. این مدل از ترجمه بین ۳۳ زبان و ۵ زبان اقلیت چینی پشتیبانی میکند. در رقابت بینالمللی ترجمه ماشینی WMT25، این مدل در ۳۰ مورد از ۳۱ زبان شرکتکننده رتبه اول را کسب کرد و توانایی ترجمه برجستهای از خود نشان داد. تیم Hunyuan شرکت Tencent یک الگوی آموزشی کامل از پیشآموزش تا تنظیم نظارتی، تقویت ترجمه و تقویت ترکیبی ارائه کرده است که باعث شده این مدل در میان مدلهای همرده از نظر اندازه، عملکردی پیشرو داشته باشد. این مدل از بهرهوری محاسباتی بالا و قابلیت استقرار آسان برخوردار است و برای کاربردهای متنوع مناسب است."
|
||
},
|
||
"text-embedding-3-large": {
|
||
"description": "قدرتمندترین مدل وکتور سازی، مناسب برای وظایف انگلیسی و غیرانگلیسی."
|
||
},
|
||
"text-embedding-3-small": {
|
||
"description": "مدل جدید و کارآمد Embedding، مناسب برای جستجوی دانش، کاربردهای RAG و سایر سناریوها."
|
||
},
|
||
"thudm/glm-4-32b": {
|
||
"description": "GLM-4-32B-0414 یک مدل زبان با وزنهای باز 32B دو زبانه (چینی و انگلیسی) است که برای تولید کد، فراخوانی توابع و وظایف نمایندگی بهینهسازی شده است. این مدل بر روی 15T دادههای با کیفیت بالا و دادههای استدلال مجدد پیشآموزش شده و با همراستایی ترجیحات انسانی، نمونهبرداری رد و یادگیری تقویتی بهبود یافته است. این مدل در استدلال پیچیده، تولید آثار و وظایف خروجی ساختاری عملکرد عالی از خود نشان میدهد و در چندین آزمون معیار به عملکردی معادل با GPT-4o و DeepSeek-V3-0324 دست یافته است."
|
||
},
|
||
"thudm/glm-4-32b:free": {
|
||
"description": "GLM-4-32B-0414 یک مدل زبان با وزنهای باز 32B دو زبانه (چینی و انگلیسی) است که برای تولید کد، فراخوانی توابع و وظایف نمایندگی بهینهسازی شده است. این مدل بر روی 15T دادههای با کیفیت بالا و دادههای استدلال مجدد پیشآموزش شده و با همراستایی ترجیحات انسانی، نمونهبرداری رد و یادگیری تقویتی بهبود یافته است. این مدل در استدلال پیچیده، تولید آثار و وظایف خروجی ساختاری عملکرد عالی از خود نشان میدهد و در چندین آزمون معیار به عملکردی معادل با GPT-4o و DeepSeek-V3-0324 دست یافته است."
|
||
},
|
||
"thudm/glm-4-9b-chat": {
|
||
"description": "نسخه متن باز جدیدترین نسل مدلهای پیشآموزش GLM-4 منتشر شده توسط Zhizhu AI."
|
||
},
|
||
"thudm/glm-z1-32b": {
|
||
"description": "GLM-Z1-32B-0414 یک واریانت تقویتشده استدلال GLM-4-32B است که به طور خاص برای حل مسائل عمیق ریاضی، منطقی و کد محور طراحی شده است. این مدل از یادگیری تقویتی گسترشیافته (وظیفهمحور و مبتنی بر ترجیحات جفتی عمومی) برای بهبود عملکرد در وظایف پیچیده چند مرحلهای استفاده میکند. نسبت به مدل پایه GLM-4-32B، Z1 به طور قابل توجهی تواناییهای استدلال ساختاری و حوزههای رسمی را افزایش میدهد.\n\nاین مدل از طریق مهندسی نشانهگذاری، مراحل «تفکر» را تحمیل میکند و برای خروجیهای طولانی، انسجام بهبودیافتهای را فراهم میکند. این مدل برای جریانهای کاری نمایندگی بهینهسازی شده و از زمینههای طولانی (از طریق YaRN)، فراخوانی ابزار JSON و پیکربندی نمونهبرداری دقیق برای استدلال پایدار پشتیبانی میکند. این مدل برای مواردی که نیاز به تفکر عمیق، استدلال چند مرحلهای یا استنتاج رسمی دارند، بسیار مناسب است."
|
||
},
|
||
"thudm/glm-z1-rumination-32b": {
|
||
"description": "THUDM: GLM Z1 Rumination 32B یک مدل عمیق استدلال با ۳۲B پارامتر در سری GLM-4-Z1 است که برای وظایف پیچیده و باز که نیاز به تفکر طولانی دارند بهینهسازی شده است. این مدل بر اساس glm-4-32b-0414 ساخته شده و مراحل تقویت یادگیری اضافی و استراتژیهای همراستایی چند مرحلهای را اضافه کرده است و توانایی «تفکر» را که به شبیهسازی پردازش شناختی گسترش یافته طراحی شده است، معرفی میکند. این شامل استدلال تکراری، تحلیل چندپرش و جریانهای کاری تقویتشده با ابزارهایی مانند جستجو، بازیابی و ترکیب آگاهانه است.\n\nاین مدل در نوشتن تحقیقاتی، تحلیل مقایسهای و پرسش و پاسخ پیچیده عملکرد عالی دارد. این مدل از فراخوانی توابع برای جستجو و ناوبری (جستجو، کلیک، باز کردن، اتمام) پشتیبانی میکند و میتواند در لولههای نمایندگی استفاده شود. رفتار تفکری توسط کنترل چند دوری با پاداشهای مبتنی بر قوانین و مکانیزم تصمیمگیری تأخیری شکل میگیرد و به عنوان مرجع از چارچوبهای عمیق تحقیقاتی مانند انباشت همراستایی داخلی OpenAI استفاده میشود. این واریانت برای صحنههایی که نیاز به عمق به جای سرعت دارند مناسب است."
|
||
},
|
||
"tngtech/deepseek-r1t-chimera:free": {
|
||
"description": "DeepSeek-R1T-Chimera با ترکیب DeepSeek-R1 و DeepSeek-V3 (۰۳۲۴) ایجاد شده است و توانایی استدلال R1 و بهبود کارایی توکن V3 را ترکیب میکند. این مدل بر اساس معماری DeepSeek-MoE Transformer ساخته شده و برای وظایف تولید متن عمومی بهینهسازی شده است.\n\nاین مدل وزنهای پیشآموزش دو مدل منبع را ترکیب میکند تا عملکرد استدلال، کارایی و پیروی از دستورات را متعادل کند. این مدل تحت مجوز MIT منتشر شده و برای استفادههای تحقیقاتی و تجاری طراحی شده است."
|
||
},
|
||
"togethercomputer/StripedHyena-Nous-7B": {
|
||
"description": "StripedHyena Nous (7B) با استفاده از استراتژیها و معماری مدل کارآمد، توان محاسباتی بهبودیافتهای را ارائه میدهد."
|
||
},
|
||
"tts-1": {
|
||
"description": "جدیدترین مدل تبدیل متن به گفتار، بهینهسازی شده برای سرعت در سناریوهای زنده."
|
||
},
|
||
"tts-1-hd": {
|
||
"description": "جدیدترین مدل تبدیل متن به گفتار، بهینهسازی شده برای کیفیت."
|
||
},
|
||
"upstage/SOLAR-10.7B-Instruct-v1.0": {
|
||
"description": "Upstage SOLAR Instruct v1 (11B) مناسب برای وظایف دقیق دستوری، ارائهدهنده تواناییهای برجسته در پردازش زبان."
|
||
},
|
||
"us.anthropic.claude-3-5-sonnet-20241022-v2:0": {
|
||
"description": "Claude 3.5 Sonnet استانداردهای صنعتی را ارتقا داده و عملکردی فراتر از مدلهای رقیب و Claude 3 Opus دارد و در ارزیابیهای گستردهای عملکرد عالی از خود نشان میدهد، در حالی که سرعت و هزینه مدلهای سطح متوسط ما را نیز داراست."
|
||
},
|
||
"us.anthropic.claude-3-7-sonnet-20250219-v1:0": {
|
||
"description": "Claude 3.7 sonnet سریعترین مدل نسل بعدی Anthropic است. در مقایسه با Claude 3 Haiku، Claude 3.7 Sonnet در تمام مهارتها بهبود یافته و در بسیاری از آزمونهای استاندارد هوش از بزرگترین مدل نسل قبلی، Claude 3 Opus، پیشی گرفته است."
|
||
},
|
||
"us.anthropic.claude-haiku-4-5-20251001-v1:0": {
|
||
"description": "Claude Haiku 4.5 سریعترین و هوشمندترین مدل Haiku از شرکت Anthropic است که دارای سرعتی برقآسا و توانایی تفکر توسعهیافته میباشد."
|
||
},
|
||
"us.anthropic.claude-sonnet-4-5-20250929-v1:0": {
|
||
"description": "Claude Sonnet 4.5 هوشمندترین مدلی است که تاکنون توسط Anthropic ارائه شده است."
|
||
},
|
||
"v0-1.0-md": {
|
||
"description": "مدل v0-1.0-md نسخه قدیمی مدلی است که از طریق API نسخه v0 ارائه میشود"
|
||
},
|
||
"v0-1.5-lg": {
|
||
"description": "مدل v0-1.5-lg برای وظایف پیشرفته تفکر یا استدلال مناسب است"
|
||
},
|
||
"v0-1.5-md": {
|
||
"description": "مدل v0-1.5-md برای وظایف روزمره و تولید رابط کاربری (UI) مناسب است"
|
||
},
|
||
"vercel/v0-1.0-md": {
|
||
"description": "دسترسی به مدل پشت v0 برای تولید، رفع اشکال و بهینهسازی برنامههای وب مدرن با استدلال چارچوب خاص و دانش بهروز."
|
||
},
|
||
"vercel/v0-1.5-md": {
|
||
"description": "دسترسی به مدل پشت v0 برای تولید، رفع اشکال و بهینهسازی برنامههای وب مدرن با استدلال چارچوب خاص و دانش بهروز."
|
||
},
|
||
"volcengine/doubao-seed-code": {
|
||
"description": "Doubao-Seed-Code مدل بزرگ بهینهشده برای برنامهنویسی عاملی (Agentic Programming) از Volcengine است که در معیارهای مختلف برنامهنویسی و عاملها عملکرد برجستهای دارد و از زمینه ۲۵۶ هزار توکن پشتیبانی میکند."
|
||
},
|
||
"wan2.2-t2i-flash": {
|
||
"description": "نسخه سریع Wanxiang 2.2، جدیدترین مدل فعلی. در خلاقیت، پایداری و واقعگرایی به طور کامل ارتقا یافته، سرعت تولید بالا و نسبت قیمت به کیفیت عالی دارد."
|
||
},
|
||
"wan2.2-t2i-plus": {
|
||
"description": "نسخه حرفهای Wanxiang 2.2، جدیدترین مدل فعلی. در خلاقیت، پایداری و واقعگرایی به طور کامل ارتقا یافته و جزئیات تولید شده غنیتر است."
|
||
},
|
||
"wanx-v1": {
|
||
"description": "مدل پایه تولید تصویر از متن. معادل مدل عمومی 1.0 در وبسایت رسمی Tongyi Wanxiang."
|
||
},
|
||
"wanx2.0-t2i-turbo": {
|
||
"description": "متخصص در پرترههای با بافت، سرعت متوسط و هزینه پایین. معادل مدل سریع 2.0 در وبسایت رسمی Tongyi Wanxiang."
|
||
},
|
||
"wanx2.1-t2i-plus": {
|
||
"description": "نسخه ارتقا یافته کامل. جزئیات تصاویر تولید شده غنیتر و سرعت کمی کندتر است. معادل مدل حرفهای 2.1 در وبسایت رسمی Tongyi Wanxiang."
|
||
},
|
||
"wanx2.1-t2i-turbo": {
|
||
"description": "نسخه ارتقا یافته کامل. سرعت تولید بالا، عملکرد جامع و نسبت قیمت به کیفیت عالی. معادل مدل سریع 2.1 در وبسایت رسمی Tongyi Wanxiang."
|
||
},
|
||
"whisper-1": {
|
||
"description": "مدل شناسایی گفتار عمومی که از شناسایی گفتار چندزبانه، ترجمه گفتار و شناسایی زبان پشتیبانی میکند."
|
||
},
|
||
"wizardlm2": {
|
||
"description": "WizardLM 2 یک مدل زبانی ارائه شده توسط هوش مصنوعی مایکروسافت است که در مکالمات پیچیده، چندزبانه، استدلال و دستیارهای هوشمند عملکرد برجستهای دارد."
|
||
},
|
||
"wizardlm2:8x22b": {
|
||
"description": "WizardLM 2 یک مدل زبانی ارائه شده توسط مایکروسافت AI است که در زمینههای مکالمات پیچیده، چندزبانه، استدلال و دستیارهای هوشمند عملکرد برجستهای دارد."
|
||
},
|
||
"x-ai/grok-4": {
|
||
"description": "Grok 4 مدل پرچمدار استدلالی xAI است که تواناییهای قدرتمند در استدلال و چندحالته ارائه میدهد."
|
||
},
|
||
"x-ai/grok-4-fast": {
|
||
"description": "Grok 4 Fast مدل با توان عملیاتی بالا و هزینه پایین از xAI است (با پشتیبانی از پنجره زمینه ۲ میلیون توکن) که برای سناریوهای با نیاز به همزمانی بالا و زمینه طولانی مناسب است."
|
||
},
|
||
"x-ai/grok-4-fast-non-reasoning": {
|
||
"description": "Grok 4 Fast (بدون استدلال) مدل چندحالته با توان عملیاتی بالا و هزینه پایین از xAI است (با پشتیبانی از پنجره زمینه ۲ میلیون توکن) که برای سناریوهایی مناسب است که به استدلال درونمدلی نیاز ندارند اما به تأخیر و هزینه حساس هستند. این مدل در کنار نسخه reasoning از Grok 4 Fast قرار دارد و میتوان از طریق پارامتر reasoning enable در API، قابلیت استدلال را در صورت نیاز فعال کرد. ورودیها و خروجیها ممکن است توسط xAI یا OpenRouter برای بهبود مدلهای آینده استفاده شوند."
|
||
},
|
||
"x-ai/grok-4.1-fast": {
|
||
"description": "Grok 4.1 Fast مدل با توان عملیاتی بالا و هزینه پایین از xAI است (با پشتیبانی از پنجره زمینه ۲ میلیون توکن) که برای سناریوهای با نیاز به همزمانی بالا و زمینه طولانی مناسب است."
|
||
},
|
||
"x-ai/grok-4.1-fast-non-reasoning": {
|
||
"description": "Grok 4.1 Fast (بدون استدلال) مدل چندحالته با توان عملیاتی بالا و هزینه پایین از xAI است (با پشتیبانی از پنجره زمینه ۲ میلیون توکن) که برای سناریوهایی مناسب است که به استدلال درونمدلی نیاز ندارند اما به تأخیر و هزینه حساس هستند. این مدل در کنار نسخه reasoning از Grok 4.1 Fast قرار دارد و میتوان از طریق پارامتر reasoning enable در API، قابلیت استدلال را در صورت نیاز فعال کرد. ورودیها و خروجیها ممکن است توسط xAI یا OpenRouter برای بهبود مدلهای آینده استفاده شوند."
|
||
},
|
||
"x-ai/grok-code-fast-1": {
|
||
"description": "Grok Code Fast 1 مدل سریع کدنویسی از xAI است که خروجیهایی با خوانایی بالا و سازگار با مهندسی ارائه میدهد."
|
||
},
|
||
"xai/grok-2": {
|
||
"description": "Grok 2 مدل زبان پیشرفته با توان استدلال پیشرفته است. این مدل در مکالمه، کدنویسی و استدلال تواناییهای پیشرفته دارد و در رتبهبندی LMSYS بالاتر از Claude 3.5 Sonnet و GPT-4-Turbo قرار دارد."
|
||
},
|
||
"xai/grok-2-vision": {
|
||
"description": "مدل بصری Grok 2 در وظایف مبتنی بر دید عملکرد برجستهای دارد و در استدلال ریاضی بصری (MathVista) و پرسش و پاسخ مبتنی بر سند (DocVQA) عملکرد پیشرفته ارائه میدهد. این مدل قادر به پردازش انواع اطلاعات بصری از جمله اسناد، نمودارها، جداول، اسکرینشاتها و عکسها است."
|
||
},
|
||
"xai/grok-3": {
|
||
"description": "مدل پرچمدار xAI که در موارد استفاده شرکتی مانند استخراج داده، کدنویسی و خلاصهسازی متن عملکرد برجستهای دارد. دارای دانش عمیق حوزه در مالی، مراقبتهای بهداشتی، حقوقی و علوم است."
|
||
},
|
||
"xai/grok-3-fast": {
|
||
"description": "مدل پرچمدار xAI که در موارد استفاده شرکتی مانند استخراج داده، کدنویسی و خلاصهسازی متن عملکرد برجستهای دارد. نسخه سریعتر مدل روی زیرساخت سریعتر ارائه میشود و زمان پاسخ بسیار کوتاهتری دارد. افزایش سرعت با هزینه بالاتر به ازای هر توکن خروجی همراه است."
|
||
},
|
||
"xai/grok-3-mini": {
|
||
"description": "مدل سبک وزن xAI که قبل از پاسخ دادن تفکر میکند. برای وظایف ساده یا مبتنی بر منطق که نیاز به دانش عمیق حوزه ندارند بسیار مناسب است. مسیر تفکر خام قابل دسترسی است."
|
||
},
|
||
"xai/grok-3-mini-fast": {
|
||
"description": "مدل سبک وزن xAI که قبل از پاسخ دادن تفکر میکند. برای وظایف ساده یا مبتنی بر منطق که نیاز به دانش عمیق حوزه ندارند بسیار مناسب است. مسیر تفکر خام قابل دسترسی است. نسخه سریعتر مدل روی زیرساخت سریعتر ارائه میشود و زمان پاسخ بسیار کوتاهتری دارد. افزایش سرعت با هزینه بالاتر به ازای هر توکن خروجی همراه است."
|
||
},
|
||
"xai/grok-4": {
|
||
"description": "جدیدترین و بزرگترین مدل پرچمدار xAI که عملکرد بینظیری در زبان طبیعی، ریاضیات و استدلال ارائه میدهد — انتخابی کامل و همهکاره."
|
||
},
|
||
"yi-large": {
|
||
"description": "مدل جدید با میلیاردها پارامتر، ارائهدهنده تواناییهای فوقالعاده در پاسخگویی و تولید متن."
|
||
},
|
||
"yi-large-fc": {
|
||
"description": "بر اساس مدل yi-large، قابلیت استفاده از ابزارها را پشتیبانی و تقویت کرده است و برای انواع سناریوهای کسبوکاری که نیاز به ساخت agent یا workflow دارند، مناسب است."
|
||
},
|
||
"yi-large-preview": {
|
||
"description": "نسخه اولیه، توصیه میشود از yi-large (نسخه جدید) استفاده کنید."
|
||
},
|
||
"yi-large-rag": {
|
||
"description": "خدمات پیشرفته مبتنی بر مدل فوقالعاده yi-large، که با ترکیب فناوریهای جستجو و تولید، پاسخهای دقیقی ارائه میدهد و خدمات جستجوی اطلاعات در سراسر وب به صورت لحظهای فراهم میکند."
|
||
},
|
||
"yi-large-turbo": {
|
||
"description": "عملکرد عالی با صرفهجویی بالا. بهینهسازی دقت بالا با توجه به تعادل بین عملکرد، سرعت استنتاج و هزینه."
|
||
},
|
||
"yi-lightning": {
|
||
"description": "جدیدترین مدل با عملکرد بالا که ضمن تضمین خروجی با کیفیت بالا، سرعت استنتاج را به طور قابل توجهی افزایش میدهد."
|
||
},
|
||
"yi-lightning-lite": {
|
||
"description": "نسخه سبک، استفاده از yi-lightning توصیه میشود."
|
||
},
|
||
"yi-medium": {
|
||
"description": "ارتقاء مدل با اندازه متوسط، با تواناییهای متعادل و مقرونبهصرفه. بهینهسازی عمیق در توانایی پیروی از دستورات."
|
||
},
|
||
"yi-medium-200k": {
|
||
"description": "پنجره متنی بسیار طولانی ۲۰۰ هزار کلمهای، با قابلیت درک و تولید متون طولانی و پیچیده."
|
||
},
|
||
"yi-spark": {
|
||
"description": "کوچک و قدرتمند، مدلی سبک و فوقالعاده سریع. قابلیتهای تقویتشده برای محاسبات ریاضی و نوشتن کد ارائه میدهد."
|
||
},
|
||
"yi-vision": {
|
||
"description": "مدل وظایف پیچیده بینایی، ارائه دهنده قابلیتهای درک و تحلیل تصویر با عملکرد بالا."
|
||
},
|
||
"yi-vision-v2": {
|
||
"description": "مدلهای پیچیده بصری که قابلیتهای درک و تحلیل با عملکرد بالا را بر اساس چندین تصویر ارائه میدهند."
|
||
},
|
||
"z-ai/glm-4.5": {
|
||
"description": "GLM 4.5 مدل پرچمدار Z.AI است که از حالتهای استدلال ترکیبی پشتیبانی میکند و برای وظایف مهندسی و زمینههای طولانی بهینه شده است."
|
||
},
|
||
"z-ai/glm-4.5-air": {
|
||
"description": "GLM 4.5 Air نسخه سبکتر GLM 4.5 است که برای سناریوهای حساس به هزینه طراحی شده و همچنان توانایی استدلال قوی را حفظ کرده است."
|
||
},
|
||
"z-ai/glm-4.6": {
|
||
"description": "GLM 4.6 مدل پرچمدار Z.AI است که طول زمینه و تواناییهای کدنویسی را گسترش داده است."
|
||
},
|
||
"zai-glm-4.6": {
|
||
"description": "عملکرد عالی در وظایف برنامهنویسی و استدلال، پشتیبانی از حالت جریانی و فراخوانی ابزار، مناسب برای کدنویسی Agentic و سناریوهای استدلال پیچیده."
|
||
},
|
||
"zai-org/GLM-4.5": {
|
||
"description": "GLM-4.5 یک مدل پایه طراحی شده برای کاربردهای عامل هوشمند است که از معماری Mixture-of-Experts استفاده میکند. این مدل در زمینههای فراخوانی ابزار، مرور وب، مهندسی نرمافزار و برنامهنویسی فرانتاند بهینهسازی عمیق شده و از ادغام بیوقفه با عاملهای کد مانند Claude Code و Roo Code پشتیبانی میکند. GLM-4.5 از حالت استدلال ترکیبی بهره میبرد و میتواند در سناریوهای استدلال پیچیده و استفاده روزمره به خوبی عمل کند."
|
||
},
|
||
"zai-org/GLM-4.5-Air": {
|
||
"description": "GLM-4.5-Air یک مدل پایه طراحی شده برای کاربردهای عامل هوشمند است که از معماری Mixture-of-Experts استفاده میکند. این مدل در زمینههای فراخوانی ابزار، مرور وب، مهندسی نرمافزار و برنامهنویسی فرانتاند بهینهسازی عمیق شده و از ادغام بیوقفه با عاملهای کد مانند Claude Code و Roo Code پشتیبانی میکند. GLM-4.5 از حالت استدلال ترکیبی بهره میبرد و میتواند در سناریوهای استدلال پیچیده و استفاده روزمره به خوبی عمل کند."
|
||
},
|
||
"zai-org/GLM-4.5V": {
|
||
"description": "GLM-4.5V نسل جدیدی از مدلهای زبان-بینایی (VLM) است که توسط Zhipu AI (智谱 AI) منتشر شده. این مدل بر پایهٔ مدل متنی پرچمدار GLM-4.5-Air ساخته شده که دارای 106 میلیارد پارامتر کل و 12 میلیارد پارامتر فعالسازی است؛ از معماری متخصصان ترکیبی (MoE) بهره میبرد و هدفش ارائهٔ عملکرد برجسته با هزینهٔ استدلال کمتر است. از منظر فناوری، GLM-4.5V راهبرد GLM-4.1V-Thinking را ادامه میدهد و نوآوریهایی مانند کدگذاری موقعیت چرخشی سهبعدی (3D-RoPE) را معرفی کرده که بهطور چشمگیری درک و استدلال نسبتهای فضایی سهبعدی را تقویت میکند. با بهینهسازی در مراحل پیشآموزش، ریزتنظیم نظارتی و یادگیری تقویتی، این مدل قادر به پردازش انواع محتواهای بصری از جمله تصویر، ویدیو و اسناد بلند شده و در 41 معیار چندوجهی عمومی به سطح برتر مدلهای متنباز همرده دست یافته است. علاوه بر این، یک سوئیچ «حالت تفکر» به مدل افزوده شده که به کاربران اجازه میدهد بین پاسخدهی سریع و استدلال عمیق بهصورت انعطافپذیر انتخاب کنند تا تعادل بین کارایی و کیفیت برقرار شود."
|
||
},
|
||
"zai-org/GLM-4.6": {
|
||
"description": "در مقایسه با GLM-4.5، GLM-4.6 چندین بهبود کلیدی را به همراه دارد. پنجره متنی آن از 128K به 200K توکن افزایش یافته است که امکان پردازش وظایف پیچیدهتر عامل را فراهم میکند. مدل در آزمونهای معیار کد امتیاز بالاتری کسب کرده و در برنامههایی مانند Claude Code، Cline، Roo Code و Kilo Code عملکرد واقعی بهتری نشان داده است، از جمله بهبود در تولید صفحات فرانتاند با جلوههای بصری دقیق. GLM-4.6 در عملکرد استنتاج پیشرفت قابل توجهی داشته و از استفاده از ابزارها در حین استنتاج پشتیبانی میکند که منجر به توانمندی جامعتر شده است. این مدل در استفاده از ابزارها و عاملهای مبتنی بر جستجو قویتر است و میتواند به طور مؤثرتری در چارچوبهای عامل ادغام شود. در زمینه نگارش، این مدل سبک و خوانایی بهتری دارد که با ترجیحات انسانی همخوانی دارد و در سناریوهای نقشآفرینی طبیعیتر عمل میکند."
|
||
},
|
||
"zai/glm-4.5": {
|
||
"description": "مجموعه مدلهای GLM-4.5 مدلهای پایه طراحی شده برای نمایندگان هوشمند هستند. مدل پرچمدار GLM-4.5 با 355 میلیارد پارامتر کل (32 میلیارد فعال) یکپارچهسازی استدلال، کدنویسی و تواناییهای نمایندگی را برای حل نیازهای پیچیده برنامهها ارائه میدهد. به عنوان یک سیستم استدلال ترکیبی، دو حالت عملیاتی دارد."
|
||
},
|
||
"zai/glm-4.5-air": {
|
||
"description": "GLM-4.5 و GLM-4.5-Air مدلهای پرچمدار جدید ما هستند که به عنوان مدلهای پایه برای برنامههای نمایندگی طراحی شدهاند. هر دو از معماری متخصص ترکیبی (MoE) بهره میبرند. GLM-4.5 دارای 355 میلیارد پارامتر کل و 32 میلیارد پارامتر فعال در هر عبور جلو است، در حالی که GLM-4.5-Air طراحی سادهتری دارد با 106 میلیارد پارامتر کل و 12 میلیارد پارامتر فعال."
|
||
},
|
||
"zai/glm-4.5v": {
|
||
"description": "GLM-4.5V بر پایه مدل پایه GLM-4.5-Air ساخته شده است، فناوری اثبات شده GLM-4.1V-Thinking را به ارث برده و در عین حال با معماری قدرتمند MoE با 106 میلیارد پارامتر به طور مؤثر مقیاسپذیر شده است."
|
||
},
|
||
"zenmux/auto": {
|
||
"description": "ویژگی مسیریابی خودکار ZenMux بر اساس محتوای درخواست شما، بهترین مدل موجود از نظر عملکرد و هزینه را از میان مدلهای پشتیبانیشده انتخاب میکند."
|
||
}
|
||
}
|