mirror of
https://github.com/lobehub/lobe-chat.git
synced 2026-06-13 19:20:04 +00:00
346812ab88
* chore: update i18n files & fix title skeleton * chore: update taskTemplate json * chore: update i18n files
1451 lines
505 KiB
JSON
1451 lines
505 KiB
JSON
{
|
||
"01-ai/yi-1.5-34b-chat.description": "جدیدترین مدل متنباز و بهینهسازیشده 01.AI با ۳۴ میلیارد پارامتر، پشتیبانی از سناریوهای مختلف گفتوگو، آموزشدیده با دادههای باکیفیت و همراستا با ترجیحات انسانی.",
|
||
"01-ai/yi-1.5-9b-chat.description": "جدیدترین مدل متنباز و بهینهسازیشده 01.AI با ۹ میلیارد پارامتر، پشتیبانی از سناریوهای مختلف گفتوگو، آموزشدیده با دادههای باکیفیت و همراستا با ترجیحات انسانی.",
|
||
"360/deepseek-r1.description": "مدل DeepSeek-R1 که توسط 360 پیادهسازی شده، از یادگیری تقویتی در مقیاس وسیع در مرحله پسآموزش استفاده میکند تا توانایی استدلال را با حداقل دادههای برچسبخورده بهطور چشمگیری افزایش دهد. این مدل در وظایف استدلال ریاضی، کدنویسی و زبان طبیعی با مدل OpenAI o1 برابری میکند.",
|
||
"360gpt-pro-trans.description": "مدلی تخصصی در ترجمه که بهطور عمیق برای دستیابی به کیفیت پیشرو در ترجمه بهینهسازی شده است.",
|
||
"360gpt-pro.description": "360GPT Pro یکی از مدلهای کلیدی هوش مصنوعی 360 است که پردازش متنی کارآمد را برای سناریوهای متنوع NLP ارائه میدهد و از درک متون بلند و گفتوگوی چندمرحلهای پشتیبانی میکند.",
|
||
"360gpt-turbo-responsibility-8k.description": "360GPT Turbo Responsibility 8K بر ایمنی معنایی و مسئولیتپذیری در کاربردهای حساس به محتوا تأکید دارد و تجربهای دقیق و پایدار برای کاربران فراهم میکند.",
|
||
"360gpt-turbo.description": "360GPT Turbo توان پردازشی و گفتوگویی بالایی را با درک معنایی عالی و کارایی بالا در تولید متن ارائه میدهد و گزینهای ایدهآل برای کسبوکارها و توسعهدهندگان است.",
|
||
"360gpt2-o1.description": "360gpt2-o1 با استفاده از جستوجوی درختی و مکانیزم بازتاب و آموزش با یادگیری تقویتی، زنجیره تفکر را ایجاد میکند و قابلیت بازاندیشی و اصلاح خودکار را فراهم میسازد.",
|
||
"360gpt2-pro.description": "360GPT2 Pro یک مدل NLP پیشرفته از 360 است که در تولید و درک متن عملکردی عالی دارد، بهویژه در وظایف خلاقانه، تبدیلهای پیچیده و ایفای نقش.",
|
||
"360zhinao2-o1.5.description": "مدل استدلال قدرتمند 360 Zhinao، با قابلیتهای قویترین و پشتیبانی از فراخوانی ابزار و استدلال پیشرفته.",
|
||
"360zhinao2-o1.description": "360zhinao2-o1 با استفاده از جستوجوی درختی و مکانیزم بازتاب و آموزش با یادگیری تقویتی، زنجیره تفکر را ایجاد میکند و قابلیت بازاندیشی و اصلاح خودکار را فراهم میسازد.",
|
||
"360zhinao3-o1.5.description": "مدل استدلال نسل بعدی 360 Zhinao.",
|
||
"4.0Ultra.description": "Spark Ultra قدرتمندترین مدل در سری Spark است که درک متن و خلاصهسازی را بهبود میبخشد و جستوجوی وب را ارتقا میدهد. این مدل راهحلی جامع برای افزایش بهرهوری در محیط کار و ارائه پاسخهای دقیق است و بهعنوان محصولی هوشمند پیشرو شناخته میشود.",
|
||
"AnimeSharp.description": "AnimeSharp (با نام قبلی \"4x-TextSharpV1\") یک مدل متنباز برای افزایش وضوح تصاویر به سبک انیمه است که بر پایه ESRGAN توسط Kim2091 توسعه یافته است. این مدل در ابتدا برای تصاویر متنی نیز طراحی شده بود اما بهطور ویژه برای محتوای انیمه بهینهسازی شده است.",
|
||
"Baichuan-M2-Plus.description": "ما Baichuan-M2 را معرفی میکنیم؛ یک مدل استدلال پزشکیمحور که برای انجام وظایف استدلال پزشکی در شرایط واقعی طراحی شده است. ما با پرسشهای واقعی پزشکی آغاز کرده و آموزش تقویتی را بر اساس یک سیستم ارزیابِ مقیاسبالا انجام دادهایم. ضمن حفظ تواناییهای عمومی مدل، کارایی پزشکی Baichuan-M2 شاهد یک جهش چشمگیر بوده است. Baichuan-M2 در حال حاضر بهترین مدل پزشکی متنباز در جهان است. این مدل از تمامی مدلهای متنباز، شامل gpt-oss-120b، و همچنین بسیاری از مدلهای پیشرفته بسته در ارزیابی HealthBench پیشی میگیرد. این مدل نزدیکترین نمونه متنباز به GPT-5 از نظر تواناییهای پزشکی است. تجربه ما نشان میدهد که وجود یک ارزیاب قدرتمند برای پیوند دادن تواناییهای مدل با دنیای واقعی حیاتی است و رویکرد آموزش تقویتی سرتاسری، بهطور بنیادی توانایی استدلال پزشکی مدل را ارتقا میدهد. انتشار Baichuan-M2 مرزهای فناوری در حوزه هوش مصنوعی پزشکی را پیش میبرد.",
|
||
"Baichuan-M2.description": "ما Baichuan-M2 را معرفی میکنیم؛ یک مدل استدلال پزشکیمحور که برای انجام وظایف استدلال پزشکی در شرایط واقعی طراحی شده است. ما با پرسشهای واقعی پزشکی آغاز کرده و آموزش تقویتی را بر اساس یک سیستم ارزیابِ مقیاسبالا انجام دادهایم. ضمن حفظ تواناییهای عمومی مدل، کارایی پزشکی Baichuan-M2 شاهد یک جهش چشمگیر بوده است. Baichuan-M2 در حال حاضر بهترین مدل پزشکی متنباز در جهان است. این مدل از تمامی مدلهای متنباز، شامل gpt-oss-120b، و همچنین بسیاری از مدلهای پیشرفته بسته در ارزیابی HealthBench پیشی میگیرد. این مدل نزدیکترین نمونه متنباز به GPT-5 از نظر تواناییهای پزشکی است. تجربه ما نشان میدهد که وجود یک ارزیاب قدرتمند برای پیوند دادن تواناییهای مدل با دنیای واقعی حیاتی است و رویکرد آموزش تقویتی سرتاسری، بهطور بنیادی توانایی استدلال پزشکی مدل را ارتقا میدهد. انتشار Baichuan-M2 مرزهای فناوری در حوزه هوش مصنوعی پزشکی را پیش میبرد.",
|
||
"Baichuan-M3-Plus.description": "ما Baichuan-M3 را معرفی میکنیم؛ یک مدل زبانی بزرگ نسل جدید با تقویت پزشکی که برای پشتیبانی از کمکهای پزشکی در سطح بالینی طراحی شده است. برخلاف رویکردهای پیشین که عمدتاً بر پرسشوپاسخ ایستا یا نقشآفرینی سطحی تمرکز داشتند، Baichuan-M3 بهگونهای آموزش یافته است که فرآیند تصمیمگیری بالینی را بهطور صریح مدلسازی کند و هدف آن بهبود کاربردپذیری و قابلیت اعتماد در عمل بالینی واقعی است. این مدل بهجای ارائه پاسخهای ظاهراً منطقی، یا پرسشهای شبیهبهپزشک، یا توصیههای مبهم و تکراری مانند «بهزودی به پزشک مراجعه کنید»، بهطور فعال آموزش دیده تا اطلاعات بالینی حیاتی را جمعآوری کند، مسیرهای منسجم استدلال پزشکی بسازد و رفتارهای مستعد خطا (توهم) را در طول تصمیمسازی مهار کند. این طراحی باعث شده مدل بهطور ذاتی با جریانهای واقعی کاری در پزشکی همسو باشد. در مجموعهای از ارزیابیهای مربوط به پرسشگری بالینی، مقاومت در برابر توهم پزشکی، HealthBench و HealthBench-Hard، Baichuan-M3 از مدل پرچمدار جدید OpenAI یعنی GPT-5.2 نیز پیشی میگیرد و سطح جدیدی در مدلهای زبانی تقویتشده پزشکی ایجاد میکند.",
|
||
"Baichuan-M3.description": "ما Baichuan-M3 را معرفی میکنیم؛ یک مدل زبانی بزرگ نسل جدید با تقویت پزشکی که برای پشتیبانی از کمکهای پزشکی در سطح بالینی طراحی شده است. برخلاف رویکردهای پیشین که عمدتاً بر پرسشوپاسخ ایستا یا نقشآفرینی سطحی تمرکز داشتند، Baichuan-M3 بهگونهای آموزش یافته است که فرآیند تصمیمگیری بالینی را بهطور صریح مدلسازی کند و هدف آن بهبود کاربردپذیری و قابلیت اعتماد در عمل بالینی واقعی است. این مدل بهجای ارائه پاسخهای ظاهراً منطقی، یا پرسشهای شبیهبهپزشک، یا توصیههای مبهم و تکراری مانند «بهزودی به پزشک مراجعه کنید»، بهطور فعال آموزش دیده تا اطلاعات بالینی حیاتی را جمعآوری کند، مسیرهای منسجم استدلال پزشکی بسازد و رفتارهای مستعد خطا (توهم) را در طول تصمیمسازی مهار کند. این طراحی باعث شده مدل بهطور ذاتی با جریانهای واقعی کاری در پزشکی همسو باشد. در مجموعهای از ارزیابیهای مربوط به پرسشگری بالینی، مقاومت در برابر توهم پزشکی، HealthBench و HealthBench-Hard، Baichuan-M3 از مدل پرچمدار جدید OpenAI یعنی GPT-5.2 نیز پیشی میگیرد و سطح جدیدی در مدلهای زبانی تقویتشده پزشکی ایجاد میکند.",
|
||
"Baichuan2-Turbo.description": "با استفاده از تقویت جستوجو، این مدل به دانش دامنهای و وب متصل میشود. از بارگذاری فایلهای PDF/Word و ورودی URL پشتیبانی میکند تا بازیابی اطلاعات بهموقع و جامع و خروجیهای حرفهای و دقیق را فراهم سازد.",
|
||
"Baichuan3-Turbo-128k.description": "با پنجره متنی فوقالعاده بلند ۱۲۸ هزار توکن، این مدل برای سناریوهای پرتکرار سازمانی بهینهسازی شده و ارزش بالایی ارائه میدهد. در مقایسه با Baichuan2، تولید محتوا ۲۰٪، پرسشوپاسخ دانشی ۱۷٪ و ایفای نقش ۴۰٪ بهبود یافته است. عملکرد کلی آن بهتر از GPT-3.5 است.",
|
||
"Baichuan3-Turbo.description": "برای سناریوهای پرتکرار سازمانی بهینهسازی شده و ارزش بالایی ارائه میدهد. در مقایسه با Baichuan2، تولید محتوا ۲۰٪، پرسشوپاسخ دانشی ۱۷٪ و ایفای نقش ۴۰٪ بهبود یافته است. عملکرد کلی آن بهتر از GPT-3.5 است.",
|
||
"Baichuan4-Air.description": "مدلی پیشرو در چین که در وظایف زبان چینی مانند دانش، متون بلند و تولید خلاقانه از مدلهای مطرح خارجی پیشی میگیرد. همچنین دارای قابلیتهای چندوجهی پیشرفته با نتایج قوی در آزمونهای معتبر است.",
|
||
"Baichuan4-Turbo.description": "مدلی پیشرو در چین که در وظایف زبان چینی مانند دانش، متون بلند و تولید خلاقانه از مدلهای مطرح خارجی پیشی میگیرد. همچنین دارای قابلیتهای چندوجهی پیشرفته با نتایج قوی در آزمونهای معتبر است.",
|
||
"Baichuan4.description": "عملکرد برتر داخلی که در وظایف زبان چینی مانند دانش دایرهالمعارفی، متون بلند و تولید خلاقانه از مدلهای مطرح خارجی پیشی میگیرد. همچنین دارای قابلیتهای چندوجهی پیشرفته و نتایج قوی در آزمونهای معیار است.",
|
||
"ByteDance-Seed/Seed-OSS-36B-Instruct.description": "Seed-OSS مجموعهای از مدلهای متنباز LLM از ByteDance Seed است که برای مدیریت زمینههای بلند، استدلال، عاملها و تواناییهای عمومی طراحی شدهاند. Seed-OSS-36B-Instruct یک مدل ۳۶ میلیارد پارامتری با تنظیمات دستوری است که بهطور بومی از زمینههای بسیار بلند برای پردازش اسناد یا پایگاههای کد پشتیبانی میکند. این مدل برای استدلال، تولید کد و وظایف عامل (استفاده از ابزار) بهینهسازی شده و در عین حال توانایی عمومی قوی خود را حفظ کرده است. ویژگی کلیدی آن «بودجه تفکر» است که امکان تنظیم طول استدلال برای افزایش کارایی را فراهم میسازد.",
|
||
"DeepSeek-OCR.description": "DeepSeek-OCR یک مدل زبان-بینایی از DeepSeek AI است که بر OCR و «فشردهسازی نوریِ بافت» تمرکز دارد. این مدل روشهایی را برای فشردهسازی محتوای تصویری بررسی کرده، اسناد را بهصورت کارآمد پردازش میکند و آنها را به متنی ساختیافته (مانند Markdown) تبدیل مینماید. این مدل در شناسایی متن داخل تصاویر دقت بالایی دارد و برای دیجیتالیسازی اسناد، استخراج متن و پردازش ساختیافته بسیار مناسب است.",
|
||
"DeepSeek-R1-Distill-Llama-70B.description": "مدل DeepSeek R1 که بزرگتر و هوشمندتر است، در معماری Llama 70B تقطیر شده است. آزمونهای معیار و ارزیابیهای انسانی نشان میدهند که این مدل از نسخه پایه Llama 70B هوشمندتر است، بهویژه در وظایف ریاضی و دقت اطلاعات.",
|
||
"DeepSeek-R1-Distill-Qwen-1.5B.description": "مدلی تقطیرشده از DeepSeek-R1 بر پایه Qwen2.5-Math-1.5B. با استفاده از یادگیری تقویتی و دادههای شروع سرد، عملکرد استدلال را بهینه کرده و معیارهای جدیدی برای مدلهای متنباز در وظایف چندگانه تعیین کرده است.",
|
||
"DeepSeek-R1-Distill-Qwen-14B.description": "مدلهای DeepSeek-R1-Distill از مدلهای متنباز با استفاده از دادههای نمونه تولیدشده توسط DeepSeek-R1 بهصورت دقیق تنظیم شدهاند.",
|
||
"DeepSeek-R1-Distill-Qwen-32B.description": "مدلهای DeepSeek-R1-Distill از مدلهای متنباز با استفاده از دادههای نمونه تولیدشده توسط DeepSeek-R1 بهصورت دقیق تنظیم شدهاند.",
|
||
"DeepSeek-R1-Distill-Qwen-7B.description": "مدلی تقطیرشده از DeepSeek-R1 بر پایه Qwen2.5-Math-7B. با استفاده از یادگیری تقویتی و دادههای شروع سرد، عملکرد استدلال را بهینه کرده و معیارهای جدیدی برای مدلهای متنباز در وظایف چندگانه تعیین کرده است.",
|
||
"DeepSeek-R1.description": "DeepSeek-R1 در مرحله پسآموزش از یادگیری تقویتی در مقیاس وسیع استفاده میکند تا توانایی استدلال را با دادههای بسیار کم برچسبخورده بهطور چشمگیری افزایش دهد. این مدل در وظایف استدلال ریاضی، کدنویسی و زبان طبیعی با مدل تولیدی OpenAI o1 برابری میکند.",
|
||
"DeepSeek-V3-1.description": "DeepSeek V3.1 یک مدل نسل جدید استدلال با بهبود در استدلال پیچیده و زنجیره تفکر است که برای وظایف تحلیلی عمیق مناسب است.",
|
||
"DeepSeek-V3-Fast.description": "ارائهدهنده: sophnet. DeepSeek V3 Fast نسخه با نرخ پردازش بالا از DeepSeek V3 0324 است که با دقت کامل (بدون کوانتیزهسازی) عملکرد قویتری در کدنویسی و ریاضی دارد و پاسخهای سریعتری ارائه میدهد.",
|
||
"DeepSeek-V3.1-Fast.description": "DeepSeek V3.1 Fast نسخه سریع با نرخ پردازش بالا از DeepSeek V3.1 است. حالت تفکر ترکیبی: از طریق قالبهای چت، یک مدل از هر دو حالت تفکر و غیرتفکر پشتیبانی میکند. استفاده هوشمندانهتر از ابزار: پسآموزش عملکرد وظایف ابزار و عامل را بهبود میبخشد.",
|
||
"DeepSeek-V3.1-Think.description": "حالت تفکر DeepSeek-V3.1: یک مدل استدلال ترکیبی جدید با حالتهای تفکر و غیرتفکر که کارآمدتر از DeepSeek-R1-0528 است. بهینهسازیهای پسآموزش عملکرد استفاده از ابزار عامل و وظایف عامل را بهطور قابلتوجهی بهبود میبخشد.",
|
||
"DeepSeek-V3.2.description": "deepseek-v3.2 یک سازوکار توجه تنک معرفی میکند که با هدف بهبود کارایی آموزش و استنتاج در پردازش متون طولانی طراحی شده و نسبت به deepseek-v3.1 با قیمت پایینتری ارائه میشود.",
|
||
"DeepSeek-V3.description": "DeepSeek-V3 یک مدل MoE توسعهیافته توسط DeepSeek است. این مدل در بسیاری از آزمونهای معیار از مدلهای متنباز دیگر مانند Qwen2.5-72B و Llama-3.1-405B پیشی میگیرد و با مدلهای بسته پیشرو مانند GPT-4o و Claude 3.5 Sonnet رقابت میکند.",
|
||
"Doubao-lite-128k.description": "Doubao-lite پاسخهای فوقالعاده سریع و ارزش بالاتری ارائه میدهد و گزینههای انعطافپذیری را در سناریوهای مختلف فراهم میسازد. از زمینه ۱۲۸ هزار توکن برای استنتاج و تنظیم دقیق پشتیبانی میکند.",
|
||
"Doubao-lite-32k.description": "Doubao-lite پاسخهای فوقالعاده سریع و ارزش بالاتری ارائه میدهد و گزینههای انعطافپذیری را در سناریوهای مختلف فراهم میسازد. از زمینه ۳۲ هزار توکن برای استنتاج و تنظیم دقیق پشتیبانی میکند.",
|
||
"Doubao-lite-4k.description": "Doubao-lite پاسخهای فوقالعاده سریع و ارزش بالاتری ارائه میدهد و گزینههای انعطافپذیری را در سناریوهای مختلف فراهم میسازد. از زمینه ۴ هزار توکن برای استنتاج و تنظیم دقیق پشتیبانی میکند.",
|
||
"Doubao-pro-128k.description": "بهترین مدل پرچمدار برای وظایف پیچیده با عملکرد قوی در پرسشوپاسخ مرجع، خلاصهسازی، تولید محتوا، طبقهبندی و ایفای نقش. از زمینه ۱۲۸ هزار توکن برای استنتاج و تنظیم دقیق پشتیبانی میکند.",
|
||
"Doubao-pro-32k.description": "بهترین مدل پرچمدار برای وظایف پیچیده با عملکرد قوی در پرسشوپاسخ مرجع، خلاصهسازی، تولید محتوا، طبقهبندی و ایفای نقش. از زمینه ۳۲ هزار توکن برای استنتاج و تنظیم دقیق پشتیبانی میکند.",
|
||
"Doubao-pro-4k.description": "بهترین مدل پرچمدار برای وظایف پیچیده با عملکرد قوی در پرسشوپاسخ مرجع، خلاصهسازی، تولید محتوا، طبقهبندی و ایفای نقش. از زمینه ۴ هزار توکن برای استنتاج و تنظیم دقیق پشتیبانی میکند.",
|
||
"DreamO.description": "DreamO یک مدل متنباز برای سفارشیسازی تصویر است که بهطور مشترک توسط ByteDance و دانشگاه پکن توسعه یافته و از معماری یکپارچه برای پشتیبانی از تولید چندوظیفهای تصویر استفاده میکند. این مدل با مدلسازی ترکیبی کارآمد، تصاویر سفارشی و منسجم را بر اساس هویت، موضوع، سبک، پسزمینه و شرایط دیگر مشخصشده توسط کاربر تولید میکند.",
|
||
"ERNIE-3.5-128K.description": "مدل زبان بزرگ پرچمدار بایدو که با استفاده از حجم عظیمی از متون چینی و انگلیسی آموزش دیده و توانایی بالایی در گفتگو، تولید محتوا و استفاده از افزونهها دارد؛ از ادغام خودکار افزونه جستجوی بایدو برای ارائه پاسخهای بهروز پشتیبانی میکند.",
|
||
"ERNIE-3.5-8K-Preview.description": "مدل زبان بزرگ پرچمدار بایدو که با استفاده از حجم عظیمی از متون چینی و انگلیسی آموزش دیده و توانایی بالایی در گفتگو، تولید محتوا و استفاده از افزونهها دارد؛ از ادغام خودکار افزونه جستجوی بایدو برای ارائه پاسخهای بهروز پشتیبانی میکند.",
|
||
"ERNIE-3.5-8K.description": "مدل زبان بزرگ پرچمدار بایدو که با استفاده از حجم عظیمی از متون چینی و انگلیسی آموزش دیده و توانایی بالایی در گفتگو، تولید محتوا و استفاده از افزونهها دارد؛ از ادغام خودکار افزونه جستجوی بایدو برای ارائه پاسخهای بهروز پشتیبانی میکند.",
|
||
"ERNIE-4.0-8K-Latest.description": "مدل زبان بسیار بزرگ پرچمدار بایدو با ارتقاءهای جامع نسبت به ERNIE 3.5، مناسب برای انجام وظایف پیچیده در حوزههای مختلف؛ از ادغام افزونه جستجوی بایدو برای ارائه پاسخهای بهروز پشتیبانی میکند.",
|
||
"ERNIE-4.0-8K-Preview.description": "مدل زبان بسیار بزرگ پرچمدار بایدو با ارتقاءهای جامع نسبت به ERNIE 3.5، مناسب برای انجام وظایف پیچیده در حوزههای مختلف؛ از ادغام افزونه جستجوی بایدو برای ارائه پاسخهای بهروز پشتیبانی میکند.",
|
||
"ERNIE-4.0-Turbo-8K-Latest.description": "مدل زبان بسیار بزرگ پرچمدار بایدو با عملکرد کلی قدرتمند برای وظایف پیچیده، همراه با ادغام افزونه جستجوی بایدو برای پاسخهای بهروز. عملکرد آن از ERNIE 4.0 بهتر است.",
|
||
"ERNIE-4.0-Turbo-8K-Preview.description": "مدل زبان بسیار بزرگ پرچمدار بایدو با عملکرد کلی قدرتمند برای وظایف پیچیده، همراه با ادغام افزونه جستجوی بایدو برای پاسخهای بهروز. عملکرد آن از ERNIE 4.0 بهتر است.",
|
||
"ERNIE-Character-8K.description": "مدل زبان تخصصی بایدو برای شخصیتهای بازی، خدمات مشتری و نقشآفرینی، با ثبات بیشتر در شخصیت، پیروی بهتر از دستورات و استدلال قویتر.",
|
||
"ERNIE-Lite-Pro-128K.description": "مدل سبک بایدو با تعادل بین کیفیت و عملکرد استنتاج، بهتر از ERNIE Lite و مناسب برای شتابدهندههای کممصرف.",
|
||
"ERNIE-Speed-128K.description": "جدیدترین مدل زبان با عملکرد بالا از بایدو (۲۰۲۴) با توانایی عمومی قوی، مناسب برای تنظیم دقیق در سناریوهای خاص، با عملکرد استدلال عالی.",
|
||
"ERNIE-Speed-Pro-128K.description": "جدیدترین مدل زبان با عملکرد بالا از بایدو (۲۰۲۴) با توانایی عمومی قوی، بهتر از ERNIE Speed، مناسب برای تنظیم دقیق با عملکرد استدلال عالی.",
|
||
"FLUX-1.1-pro.description": "FLUX.1.1 Pro",
|
||
"FLUX.1-Kontext-dev.description": "FLUX.1-Kontext-dev یک مدل چندوجهی برای تولید و ویرایش تصویر از آزمایشگاه Black Forest است که بر پایه معماری Rectified Flow Transformer با ۱۲ میلیارد پارامتر ساخته شده است. این مدل بر تولید، بازسازی، بهبود یا ویرایش تصاویر در شرایط زمینهای مشخص تمرکز دارد. با ترکیب قدرت تولید قابل کنترل مدلهای انتشار با مدلسازی زمینهای ترنسفورمر، خروجیهای باکیفیتی برای وظایفی مانند inpainting، outpainting و بازسازی صحنههای بصری ارائه میدهد.",
|
||
"FLUX.1-Kontext-pro.description": "FLUX.1 Kontext [pro]",
|
||
"FLUX.1-dev.description": "FLUX.1-dev یک مدل زبان چندوجهی متن-تصویر متنباز از آزمایشگاه Black Forest است که برای وظایف درک و تولید تصویر/متن بهینهسازی شده است. این مدل بر پایه LLMهای پیشرفته (مانند Mistral-7B) ساخته شده و از رمزگذار بینایی طراحیشده و تنظیمات چندمرحلهای دستورالعمل بهره میبرد تا هماهنگی چندوجهی و استدلال پیچیده را ممکن سازد.",
|
||
"GLM-4.5-Air.description": "GLM-4.5-Air: نسخه سبک برای پاسخهای سریع.",
|
||
"GLM-4.5.description": "GLM-4.5: مدل با عملکرد بالا برای استدلال، کدنویسی و وظایف عامل.",
|
||
"GLM-4.6.description": "GLM-4.6: مدل نسل قبلی.",
|
||
"GLM-4.7.description": "GLM-4.7 جدیدترین مدل پرچمدار Zhipu است که برای سناریوهای کدنویسی عامل بهبود یافته است و قابلیتهای کدنویسی، برنامهریزی وظایف بلندمدت و همکاری ابزار را ارتقا داده است.",
|
||
"GLM-5-Turbo.description": "GLM-5-Turbo یک مدل پایه است که برای سناریوهای عاملیتمحور بهینهسازی عمیق شده است. این مدل از مرحلهٔ آموزش برای نیازهای اصلی کارهای عاملها بهینه شده و قابلیتهایی مانند فراخوانی ابزار، پیروی از دستورات و اجرای زنجیرهای طولانی را تقویت کرده است. این مدل برای ساخت دستیارهای عامل با کارایی بالا ایدهآل است.",
|
||
"GLM-5.1.description": "GLM-5.1 جدیدترین مدل پرچمدار Zhipu است، نسخهای پیشرفتهتر از GLM-5 با قابلیتهای مهندسی عامل بهبود یافته برای مهندسی سیستمهای پیچیده و وظایف بلندمدت.",
|
||
"GLM-5.description": "GLM-5 مدل پرچمدار نسل بعدی Zhipu و ویژهٔ مهندسی Agentic است. این مدل بهرهوری قابلاعتمادی را در مهندسی سامانههای پیچیده و وظایف بلندمدت عاملانه ارائه میدهد. در حوزهٔ کدنویسی و قابلیتهای عاملی، GLM-5 عملکردی در سطح پیشرفتهترین مدلهای متنباز دارد. در سناریوهای واقعی برنامهنویسی، تجربهٔ کاربری آن به Claude Opus 4.5 نزدیک میشود. این مدل در مهندسی سامانههای پیچیده و وظایف عاملانهٔ بلندمدت برتری دارد و گزینهای مناسب برای ساخت دستیارهای عامل عمومی است.",
|
||
"Gryphe/MythoMax-L2-13b.description": "MythoMax-L2 (13B) مدلی نوآورانه برای حوزههای متنوع و وظایف پیچیده است.",
|
||
"HelloMeme.description": "HelloMeme یک ابزار هوش مصنوعی برای تولید میم، گیف یا ویدیوهای کوتاه از تصاویر یا حرکاتی است که ارائه میدهید. بدون نیاز به مهارت طراحی یا کدنویسی، تنها با یک تصویر مرجع، محتوایی سرگرمکننده، جذاب و از نظر سبک هماهنگ تولید میکند.",
|
||
"HiDream-E1-Full.description": "HiDream-E1-Full یک مدل ویرایش تصویر چندوجهی متنباز از HiDream.ai است که بر اساس معماری پیشرفته Diffusion Transformer و درک قوی زبان (LLaMA 3.1-8B-Instruct داخلی) ساخته شده است. این مدل از تولید تصویر با زبان طبیعی، انتقال سبک، ویرایشهای محلی و بازسازی با درک و اجرای عالی متن-تصویر پشتیبانی میکند.",
|
||
"HiDream-I1-Full.description": "HiDream-I1 یک مدل جدید تولید تصویر پایه متنباز است که توسط HiDream منتشر شده است. با 17 میلیارد پارامتر (Flux دارای 12 میلیارد است)، میتواند کیفیت تصویر پیشرو در صنعت را در چند ثانیه ارائه دهد.",
|
||
"HunyuanDiT-v1.2-Diffusers-Distilled.description": "hunyuandit-v1.2-distilled یک مدل سبک تبدیل متن به تصویر است که با استفاده از تقطیر بهینهسازی شده تا تصاویر باکیفیت را بهسرعت تولید کند، بهویژه مناسب برای محیطهای کممنبع و تولید بلادرنگ.",
|
||
"I2V-01-Director.description": "مدل تولید ویدئو در سطح کارگردان به طور رسمی منتشر شده است، با بهبود در پیروی از دستورالعملهای حرکت دوربین و زبان داستانگویی سینمایی.",
|
||
"I2V-01-live.description": "عملکرد بهبود یافته شخصیتها: پایدارتر، روانتر و زندهتر.",
|
||
"I2V-01.description": "مدل پایه تصویر به ویدئو سری 01.",
|
||
"InstantCharacter.description": "InstantCharacter مدلی برای تولید شخصیت شخصیسازیشده بدون نیاز به تنظیم است که توسط Tencent AI در سال ۲۰۲۵ عرضه شده است. این مدل با هدف تولید شخصیتهایی با دقت بالا و سازگاری در سناریوهای مختلف طراحی شده و میتواند تنها با یک تصویر مرجع، شخصیت را مدلسازی کرده و آن را در سبکها، حرکات و پسزمینههای مختلف منتقل کند.",
|
||
"InternVL2-8B.description": "InternVL2-8B یک مدل قدرتمند بینایی-زبان است که از پردازش چندوجهی تصویر-متن پشتیبانی میکند و محتوای تصویر را با دقت شناسایی کرده و توضیحات یا پاسخهای مرتبط تولید میکند.",
|
||
"InternVL2.5-26B.description": "InternVL2.5-26B یک مدل قدرتمند بینایی-زبان است که از پردازش چندوجهی تصویر-متن پشتیبانی میکند و محتوای تصویر را با دقت شناسایی کرده و توضیحات یا پاسخهای مرتبط تولید میکند.",
|
||
"KAT-Coder-Air-V1.description": "نسخهای سبک از سری KAT-Coder که بهطور ویژه برای Agentic Coding طراحی شده است. این مدل طیف کامل وظایف و سناریوهای برنامهنویسی را پوشش میدهد و با بهرهگیری از یادگیری تقویتی مبتنی بر عاملهای گسترده، رفتارهای هوشمند نوظهور را ممکن میسازد و عملکردی فراتر از مدلهای مشابه در کدنویسی ارائه میدهد.",
|
||
"KAT-Coder-Exp-72B-1010.description": "KAT-Coder-Exp-72B نسخهٔ تجربی نوآوری مبتنی بر RL در سری KAT-Coder است که عملکرد چشمگیر 74.6٪ را در بنچمارک SWE-Bench verified به دست آورده و رکورد جدیدی برای مدلهای متنباز ثبت کرده است. این مدل بر Agentic Coding متمرکز است و در حال حاضر تنها از چارچوب SWE-Agent پشتیبانی میکند، اما برای مکالمات ساده نیز قابل استفاده است.",
|
||
"KAT-Coder-Pro-V1.description": "طراحیشده برای Agentic Coding، این مدل طیف کامل کارها و سناریوهای برنامهنویسی را پوشش میدهد و از طریق یادگیری تقویتی گسترده به ظهور رفتارهای هوشمند دست مییابد و نسبت به مدلهای مشابه در عملکرد کدنویسی بهطور قابلتوجهی بهتر عمل میکند.",
|
||
"KAT-Coder-Pro-V2.description": "جدیدترین مدل پرفورمنسبالای تیم Kuaishou Kwaipilot که برای پروژههای پیچیدهٔ سازمانی و یکپارچهسازی SaaS طراحی شده است. این مدل در سناریوهای مرتبط با کدنویسی برتری دارد، با انواع چارچوبهای عامل (Claude Code، OpenCode، KiloCode) سازگار است، بهطور بومی از OpenClaw پشتیبانی میکند و برای زیباییشناسی صفحات فرانتاند بهینهسازی شده است.",
|
||
"Kimi-K2.5.description": "Kimi K2.5 قدرتمندترین مدل Kimi است که در کارهای عاملی، کدنویسی و درک بصری عملکردی در سطح SOTA ارائه میدهد. این مدل از ورودی چندوجهی و حالتهای تفکری و غیرفتکری پشتیبانی میکند.",
|
||
"Kolors.description": "Kolors یک مدل تبدیل متن به تصویر است که توسط تیم Kolors در Kuaishou توسعه یافته است. این مدل با میلیاردها پارامتر آموزش دیده و در کیفیت بصری، درک معنایی چینی و رندر متن عملکرد برجستهای دارد.",
|
||
"Kwai-Kolors/Kolors.description": "Kolors یک مدل بزرگ تبدیل متن به تصویر با انتشار نهفته است که توسط تیم Kolors در Kuaishou توسعه یافته است. این مدل با میلیاردها جفت متن-تصویر آموزش دیده و در کیفیت بصری، دقت معنایی پیچیده و رندر متن چینی/انگلیسی عملکرد عالی دارد و در درک و تولید محتوای چینی بسیار قوی است.",
|
||
"Kwaipilot/KAT-Dev.description": "KAT-Dev (32B) یک مدل متنباز برای وظایف مهندسی نرمافزار است. این مدل با نرخ حل ۶۲.۴٪ در SWE-Bench Verified، در میان مدلهای متنباز رتبه پنجم را دارد. با آموزش میانی، تنظیم با نظارت (SFT) و یادگیری تقویتی (RL) برای تکمیل کد، رفع اشکال و بازبینی کد بهینهسازی شده است.",
|
||
"Llama-3.2-11B-Vision-Instruct.description": "استدلال تصویری قوی روی تصاویر با وضوح بالا، مناسب برای کاربردهای درک بصری.",
|
||
"Llama-3.2-90B-Vision-Instruct\t.description": "استدلال تصویری پیشرفته برای کاربردهای عاملهای درک بصری.",
|
||
"LongCat-2.0-Preview.description": "ویژگیهای اصلی LongCat-2.0-Preview عبارتاند از: طراحیشده برای سناریوهای توسعه ایجنت، با پشتیبانی بومی از استفاده از ابزار، استدلال چندمرحلهای و وظایف با زمینه طولانی؛ عملکرد برجسته در تولید کد، خودکارسازی جریان کار و اجرای دستورهای پیچیده؛ ادغام عمیق با ابزارهای بهرهوری مانند Claude Code، OpenClaw، OpenCode و Kilo Code.",
|
||
"LongCat-Flash-Chat.description": "مدل LongCat-Flash-Chat به نسخه جدیدی ارتقا یافته است. این بهروزرسانی شامل بهبودهایی در قابلیتهای مدل است؛ نام مدل و روش فراخوانی API بدون تغییر باقی ماندهاند. با تکیه بر ویژگیهای برجسته «کارایی فوقالعاده» و «پاسخدهی سریع»، نسخه جدید درک متنی و عملکرد برنامهنویسی در دنیای واقعی را تقویت میکند: قابلیتهای کدنویسی بهطور قابلتوجهی بهبود یافتهاند: این مدل برای سناریوهای متمرکز بر توسعهدهندگان بهینهسازی عمیقی شده و پیشرفتهای چشمگیری در تولید کد، اشکالزدایی و وظایف توضیحی ارائه میدهد. توسعهدهندگان به شدت تشویق میشوند که این بهبودها را ارزیابی و مقایسه کنند. پشتیبانی از متن فوقالعاده طولانی 256K: پنجره متنی از نسل قبلی (128K) به 256K دو برابر شده است و پردازش اسناد حجیم و وظایف طولانی را کارآمدتر میکند. عملکرد چندزبانه بهطور جامع بهبود یافته است: پشتیبانی قوی از 9 زبان از جمله اسپانیایی، فرانسوی، عربی، پرتغالی، روسی و اندونزیایی ارائه میدهد. قابلیتهای قدرتمند عامل: در فراخوانی ابزارهای پیچیده و اجرای وظایف چندمرحلهای، استحکام و کارایی بیشتری نشان میدهد.",
|
||
"LongCat-Flash-Lite.description": "مدل LongCat-Flash-Lite بهطور رسمی منتشر شده است. این مدل از معماری کارآمد Mixture-of-Experts (MoE) با 68.5 میلیارد پارامتر کل و تقریباً 3 میلیارد پارامتر فعال استفاده میکند. با استفاده از جدول تعبیه N-gram، بهرهوری پارامترها را بهطور بسیار کارآمدی بهینه میکند و برای کارایی استنتاج و سناریوهای کاربردی خاص بهینهسازی عمیقی شده است. در مقایسه با مدلهای مشابه، ویژگیهای اصلی آن به شرح زیر است: کارایی استنتاج برجسته: با استفاده از جدول تعبیه N-gram برای کاهش اساسی گلوگاه I/O در معماریهای MoE، همراه با مکانیزمهای کشینگ اختصاصی و بهینهسازیهای سطح کرنل، تأخیر استنتاج را بهطور قابلتوجهی کاهش داده و کارایی کلی را بهبود میبخشد. عملکرد قوی در ابزارها و کدنویسی: در وظایف فراخوانی ابزار و توسعه نرمافزار، قابلیتهای بسیار رقابتی نشان میدهد و عملکرد استثنایی نسبت به اندازه مدل خود ارائه میدهد.",
|
||
"LongCat-Flash-Thinking-2601.description": "مدل LongCat-Flash-Thinking-2601 بهطور رسمی منتشر شده است. بهعنوان یک مدل استدلال ارتقا یافته که بر اساس معماری Mixture-of-Experts (MoE) ساخته شده، دارای 560 میلیارد پارامتر کل است. در حالی که رقابت قوی خود را در معیارهای استدلال سنتی حفظ میکند، قابلیتهای استدلال در سطح عامل را از طریق یادگیری تقویتی چندمحیطی در مقیاس بزرگ بهطور سیستماتیک بهبود میبخشد. در مقایسه با مدل LongCat-Flash-Thinking، ارتقاهای کلیدی به شرح زیر است: استحکام فوقالعاده در محیطهای پر سر و صدا: از طریق آموزش سیستماتیک به سبک برنامه درسی که نویز و عدم قطعیت در تنظیمات دنیای واقعی را هدف قرار میدهد، مدل عملکرد برجستهای در فراخوانی ابزار عامل، جستجوی مبتنی بر عامل و استدلال یکپارچه با ابزار نشان میدهد و تعمیمپذیری را بهطور قابلتوجهی بهبود میبخشد. قابلیتهای قدرتمند عامل: با ساخت یک گراف وابستگی بهشدت متصل که بیش از 60 ابزار را در بر میگیرد و گسترش آموزش از طریق گسترش چندمحیطی و یادگیری اکتشافی در مقیاس بزرگ، توانایی مدل برای تعمیم به سناریوهای پیچیده و خارج از توزیع دنیای واقعی بهطور قابلتوجهی بهبود مییابد. حالت تفکر عمیق پیشرفته: با استنتاج موازی دامنه استدلال را گسترش داده و با مکانیسمهای خلاصهسازی و انتزاع بازخورد محور، قابلیت تحلیلی را عمیقتر میکند و بهطور مؤثری مشکلات بسیار چالشبرانگیز را حل میکند.",
|
||
"LongCat-Flash-Thinking.description": "برای تضمین دریافت بهترین عملکرد استدلال، پلتفرم API مدل LongCat فراخوانیهای مربوط به LongCat-Flash-Thinking را یکپارچه و بهروز کرده است. تمامی درخواستهایی که از model=LongCat-Flash-Thinking استفاده میکنند بهصورت خودکار به آخرین نسخه، یعنی LongCat-Flash-Thinking-2601، هدایت میشوند و هیچ تغییری در کد لازم نیست.",
|
||
"M2-her.description": "مدل گفتگوی متنی طراحی شده برای نقشآفرینی و مکالمات چندنوبتی، با امکان شخصیسازی شخصیت و بیان احساسات.",
|
||
"Meta-Llama-3-3-70B-Instruct.description": "Llama 3.3 70B یک مدل ترنسفورمر همهکاره برای گفتگو و تولید محتوا است.",
|
||
"Meta-Llama-3.1-405B-Instruct.description": "مدل متنی تنظیمشده Llama 3.1 برای دستورالعملها که برای گفتگوهای چندزبانه بهینهسازی شده و در میان مدلهای باز و بسته در ارزیابیهای صنعتی عملکرد قوی دارد.",
|
||
"Meta-Llama-3.1-70B-Instruct.description": "مدل متنی تنظیمشده Llama 3.1 برای دستورالعملها که برای گفتگوهای چندزبانه بهینهسازی شده و در میان مدلهای باز و بسته در ارزیابیهای صنعتی عملکرد قوی دارد.",
|
||
"Meta-Llama-3.1-8B-Instruct.description": "مدل متنی تنظیمشده Llama 3.1 برای دستورالعملها که برای گفتگوهای چندزبانه بهینهسازی شده و در میان مدلهای باز و بسته در ارزیابیهای صنعتی عملکرد قوی دارد.",
|
||
"Meta-Llama-3.2-1B-Instruct.description": "مدل زبان کوچک پیشرفته با درک زبانی قوی، استدلال عالی و تولید متن باکیفیت.",
|
||
"Meta-Llama-3.2-3B-Instruct.description": "مدل زبان کوچک پیشرفته با درک زبانی قوی، استدلال عالی و تولید متن باکیفیت.",
|
||
"Meta-Llama-3.3-70B-Instruct.description": "Llama 3.3 پیشرفتهترین مدل چندزبانه متنباز Llama است که عملکردی نزدیک به مدلهای ۴۰۵B با هزینه بسیار پایین ارائه میدهد. این مدل بر پایه ترنسفورمر ساخته شده و با SFT و RLHF برای کاربردپذیری و ایمنی بهبود یافته است. نسخه تنظیمشده برای گفتگوهای چندزبانه بهینه شده و در ارزیابیهای صنعتی بسیاری از مدلهای باز و بسته را پشت سر گذاشته است. تاریخ قطع دانش: دسامبر ۲۰۲۳.",
|
||
"Meta-Llama-4-Maverick-17B-128E-Instruct-FP8.description": "Llama 4 Maverick یک مدل MoE بزرگ با فعالسازی کارآمد متخصصان برای عملکرد استدلالی قوی است.",
|
||
"MiMo-V2-Pro.description": "MiMo-V2-Pro بهطور ویژه برای جریانهای کاری عاملی با شدت بالا در سناریوهای واقعی طراحی شده است. این مدل بیش از یک تریلیون پارامتر کل (۴۲ میلیارد پارامتر فعال) دارد، از معماری توجه ترکیبی نوآورانه بهره میبرد و از طول بافت فوقالعاده بلند تا یک میلیون توکن پشتیبانی میکند. با تکیه بر یک مدل پایهٔ قدرتمند، منابع محاسباتی در دامنهٔ وسیعتری از سناریوهای عاملی گسترش یافته و فضای عمل هوش افزایش یافته و توانایی تعمیم از کدنویسی تا اجرای وظایف واقعی («چنگال/claw») بهشکل چشمگیری بهبود یافته است.",
|
||
"MiniMax-Hailuo-02.description": "مدل نسل بعدی تولید ویدئو، MiniMax Hailuo 02، به طور رسمی منتشر شده است، با پشتیبانی از وضوح 1080P و تولید ویدئو 10 ثانیهای.",
|
||
"MiniMax-Hailuo-2.3-Fast.description": "مدل جدید تولید ویدئو با ارتقاهای جامع در حرکت بدن، واقعگرایی فیزیکی و پیروی از دستورالعملها.",
|
||
"MiniMax-Hailuo-2.3.description": "مدل جدید تولید ویدئو با ارتقاهای جامع در حرکت بدن، واقعگرایی فیزیکی و پیروی از دستورالعملها.",
|
||
"MiniMax-M1.description": "یک مدل استدلالی داخلی جدید با ۸۰ هزار زنجیره تفکر و ورودی ۱ میلیون توکن، با عملکردی در سطح مدلهای برتر جهانی.",
|
||
"MiniMax-M2-Stable.description": "طراحیشده برای کدنویسی کارآمد و جریانهای کاری عاملمحور، با همزمانی بالاتر برای استفاده تجاری.",
|
||
"MiniMax-M2.1-highspeed.description": "قابلیتهای برنامهنویسی چندزبانه قدرتمند، تجربه برنامهنویسی کاملاً ارتقاء یافته. سریعتر و کارآمدتر.",
|
||
"MiniMax-M2.1.description": "MiniMax-M2.1 یک مدل بزرگ متنباز پیشرفته از MiniMax است که بر حل وظایف پیچیده دنیای واقعی تمرکز دارد. نقاط قوت اصلی آن شامل توانایی برنامهنویسی چندزبانه و قابلیت عمل بهعنوان یک عامل هوشمند برای حل مسائل پیچیده است.",
|
||
"MiniMax-M2.5-highspeed.description": "MiniMax M2.5 Highspeed: همان عملکرد M2.5 با استنتاج سریعتر.",
|
||
"MiniMax-M2.5.description": "MiniMax-M2.5 یک مدل بزرگ متنباز پرچمدار از MiniMax است که بر حل وظایف پیچیده دنیای واقعی تمرکز دارد. نقاط قوت اصلی آن توانایی برنامهنویسی چندزبانه و قابلیت حل وظایف پیچیده به عنوان یک عامل (Agent) است.",
|
||
"MiniMax-M2.7-highspeed.description": "MiniMax M2.7 Highspeed: همان عملکرد M2.7 با استنتاج بهطور قابل توجهی سریعتر.",
|
||
"MiniMax-M2.7.description": "نخستین مدل خودتکاملی با عملکرد سطحبالا در کدنویسی و کارهای عاملی (حدود ۶۰ tps).",
|
||
"MiniMax-M2.description": "MiniMax M2: مدل نسل قبلی.",
|
||
"MiniMax-Text-01.description": "MiniMax-01 توجه خطی در مقیاس بزرگ را فراتر از ترنسفورمرهای کلاسیک معرفی میکند، با ۴۵۶ میلیارد پارامتر و ۴۵.۹ میلیارد پارامتر فعال در هر عبور. این مدل عملکردی در سطح برتر ارائه میدهد و تا ۴ میلیون توکن زمینه را پشتیبانی میکند (۳۲ برابر GPT-4o، ۲۰ برابر Claude-3.5-Sonnet).",
|
||
"MiniMaxAI/MiniMax-M1-80k.description": "MiniMax-M1 یک مدل استدلال توجه ترکیبی با وزنهای باز و 456 میلیارد پارامتر کل و ~45.9 میلیارد پارامتر فعال در هر توکن است. این مدل بهطور بومی از 1 میلیون زمینه پشتیبانی میکند و با استفاده از Flash Attention، FLOPs را در تولید 100 هزار توکن نسبت به DeepSeek R1 تا 75٪ کاهش میدهد. با معماری MoE بهعلاوه CISPO و آموزش RL توجه ترکیبی، عملکرد پیشرو در استدلال ورودی طولانی و وظایف مهندسی نرمافزار واقعی را ارائه میدهد.",
|
||
"MiniMaxAI/MiniMax-M2.description": "MiniMax-M2 کارایی عامل را بازتعریف میکند. این مدل MoE جمعوجور، سریع و مقرونبهصرفه با 230 میلیارد پارامتر کل و 10 میلیارد پارامتر فعال است که برای وظایف کدنویسی و عامل سطح بالا طراحی شده است و در عین حال هوش عمومی قوی را حفظ میکند. با تنها 10 میلیارد پارامتر فعال، با مدلهای بسیار بزرگتر رقابت میکند و برای کاربردهای با کارایی بالا ایدهآل است.",
|
||
"Moonshot-Kimi-K2-Instruct.description": "با ۱ تریلیون پارامتر کل و ۳۲ میلیارد فعال، در میان مدلهای غیرتفکری، در دانش پیشرفته، ریاضی و کدنویسی در سطح برتر قرار دارد و در وظایف عمومی عاملها نیز قویتر است. برای بارهای کاری عاملها بهینه شده و میتواند اقدام کند، نه فقط پاسخ دهد. برای چت عمومی، بداههگویی و تجربههای عاملمحور در سطح واکنشی بدون تفکر طولانی بهترین گزینه است.",
|
||
"NousResearch/Nous-Hermes-2-Mixtral-8x7B-DPO.description": "Nous Hermes 2 - Mixtral 8x7B-DPO (۴۶.۷ میلیارد) یک مدل دستورالعملمحور با دقت بالا برای محاسبات پیچیده است.",
|
||
"OmniConsistency.description": "OmniConsistency با معرفی ترنسفورمرهای انتشار در مقیاس بزرگ (DiTs) و دادههای سبکدهیشده جفتشده، ثبات سبک و تعمیمپذیری را در وظایف تصویر به تصویر بهبود میبخشد و از تخریب سبک جلوگیری میکند.",
|
||
"PaddlePaddle/PaddleOCR-VL-1.5.description": "PaddleOCR-VL-1.5 نسخه ارتقاءیافتهای از سری PaddleOCR-VL است که با دقت ۹۴.۵٪ در معیار OmniDocBench v1.5 برای تجزیه و تحلیل اسناد، از مدلهای بزرگ عمومی و مدلهای تخصصی تجزیه اسناد پیشی گرفته است. این مدل بهصورت نوآورانه از مکانیابی جعبههای نامنظم برای عناصر سند پشتیبانی میکند و تصاویر اسکنشده، کجشده و گرفتهشده از صفحهنمایش را بهخوبی پردازش میکند.",
|
||
"Phi-3-medium-128k-instruct.description": "همان مدل Phi-3-medium با پنجره زمینه بزرگتر برای RAG یا نمونههای چندگانه.",
|
||
"Phi-3-medium-4k-instruct.description": "مدلی با ۱۴ میلیارد پارامتر و کیفیت بالاتر نسبت به Phi-3-mini، متمرکز بر دادههای با کیفیت و نیازمند استدلال.",
|
||
"Phi-3-mini-128k-instruct.description": "همان مدل Phi-3-mini با پنجره زمینه بزرگتر برای RAG یا نمونههای چندگانه.",
|
||
"Phi-3-mini-4k-instruct.description": "کوچکترین عضو خانواده Phi-3، بهینهشده برای کیفیت و تأخیر پایین.",
|
||
"Phi-3-small-128k-instruct.description": "همان مدل Phi-3-small با پنجره زمینه بزرگتر برای RAG یا نمونههای چندگانه.",
|
||
"Phi-3-small-8k-instruct.description": "مدلی با ۷ میلیارد پارامتر و کیفیت بالاتر نسبت به Phi-3-mini، متمرکز بر دادههای با کیفیت و نیازمند استدلال.",
|
||
"Phi-3.5-mini-instruct.description": "نسخه بهروزشده مدل Phi-3-mini.",
|
||
"Phi-3.5-vision-instrust.description": "نسخه بهروزشده مدل Phi-3-vision.",
|
||
"Pro/MiniMaxAI/MiniMax-M2.5.description": "MiniMax-M2.5 جدیدترین مدل زبان بزرگ توسعهیافته توسط MiniMax است که از طریق یادگیری تقویتی در مقیاس بزرگ در صدها هزار محیط پیچیده و واقعی آموزش دیده است. با معماری MoE و 229 میلیارد پارامتر، عملکرد پیشرو در صنعت را در وظایفی مانند برنامهنویسی، فراخوانی ابزار عامل، جستجو و سناریوهای اداری ارائه میدهد.",
|
||
"Pro/Qwen/Qwen2.5-7B-Instruct.description": "Qwen2.5-7B-Instruct بخشی از جدیدترین سری LLM علیبابا کلود است. این مدل ۷ میلیاردی پیشرفتهای قابل توجهی در کدنویسی و ریاضی دارد، از بیش از ۲۹ زبان پشتیبانی میکند و در پیروی از دستورالعملها، درک دادههای ساختاریافته و تولید خروجی ساختاریافته (بهویژه JSON) بهبود یافته است.",
|
||
"Pro/THUDM/GLM-4.1V-9B-Thinking.description": "GLM-4.1V-9B-Thinking یک مدل VLM متنباز از Zhipu AI و آزمایشگاه KEG دانشگاه Tsinghua است که برای شناخت چندوجهی پیچیده طراحی شده است. بر پایه GLM-4-9B-0414 ساخته شده و با افزودن زنجیره تفکر و یادگیری تقویتی، استدلال میانوجهی و پایداری را بهطور قابل توجهی بهبود میبخشد.",
|
||
"Pro/deepseek-ai/DeepSeek-R1-Distill-Qwen-7B.description": "DeepSeek-R1-Distill-Qwen-7B از Qwen2.5-Math-7B استخراج شده و بر روی 800 هزار نمونه DeepSeek-R1 منتخب تنظیم شده است. این مدل عملکرد قوی دارد، با 92.8٪ در MATH-500، 55.5٪ در AIME 2024 و رتبه 1189 CodeForces برای یک مدل 7 میلیاردی.",
|
||
"Pro/deepseek-ai/DeepSeek-R1.description": "DeepSeek-R1 یک مدل استدلالی مبتنی بر یادگیری تقویتی است که تکرار را کاهش داده و خوانایی را بهبود میبخشد. با استفاده از دادههای شروع سرد پیش از RL، استدلال را بیشتر تقویت میکند، در وظایف ریاضی، کدنویسی و استدلال با OpenAI-o1 برابری میکند و با آموزش دقیق، نتایج کلی را بهبود میبخشد.",
|
||
"Pro/deepseek-ai/DeepSeek-V3.1-Terminus.description": "DeepSeek-V3.1-Terminus نسخه بهروزشده مدل V3.1 است که بهعنوان یک LLM عامل ترکیبی طراحی شده است. مشکلات گزارششده کاربران را رفع کرده، پایداری و سازگاری زبانی را بهبود داده و نویسههای غیرعادی و ترکیب چینی/انگلیسی را کاهش داده است. حالتهای تفکری و غیرتفکری را با قالبهای چت یکپارچه میکند تا امکان جابجایی انعطافپذیر فراهم شود. همچنین عملکرد عامل کد و عامل جستجو را برای استفاده مطمئنتر از ابزارها و وظایف چندمرحلهای بهبود میبخشد.",
|
||
"Pro/deepseek-ai/DeepSeek-V3.2.description": "DeepSeek-V3.2 مدلی است که کارایی محاسباتی بالا را با استدلال و عملکرد عامل عالی ترکیب میکند. رویکرد آن بر سه پیشرفت کلیدی فناوری استوار است: DeepSeek Sparse Attention (DSA)، یک مکانیزم توجه کارآمد که پیچیدگی محاسباتی را به طور قابل توجهی کاهش میدهد در حالی که عملکرد مدل را حفظ میکند و به طور خاص برای سناریوهای با زمینه طولانی بهینه شده است؛ یک چارچوب یادگیری تقویتی مقیاسپذیر که از طریق آن عملکرد مدل میتواند با GPT-5 رقابت کند و نسخه با محاسبات بالا آن میتواند با Gemini-3.0-Pro در قابلیتهای استدلال رقابت کند؛ و یک خط لوله سنتز وظایف عامل در مقیاس بزرگ که با هدف ادغام قابلیتهای استدلال در سناریوهای استفاده از ابزار طراحی شده است و در نتیجه پیروی از دستورالعملها و تعمیم در محیطهای تعاملی پیچیده را بهبود میبخشد. این مدل عملکرد مدال طلا را در المپیاد بینالمللی ریاضی (IMO) و المپیاد بینالمللی انفورماتیک (IOI) سال 2025 به دست آورد.",
|
||
"Pro/deepseek-ai/DeepSeek-V3.description": "DeepSeek-V3 یک مدل MoE با ۶۷۱ میلیارد پارامتر است که از MLA و DeepSeekMoE با تعادل بار بدون اتلاف برای استنتاج و آموزش کارآمد استفاده میکند. با پیشآموزش بر روی ۱۴.۸ تریلیون توکن با کیفیت بالا و تنظیم بیشتر با SFT و RL، از سایر مدلهای باز پیشی میگیرد و به مدلهای بسته پیشرو نزدیک میشود.",
|
||
"Pro/moonshotai/Kimi-K2-Instruct-0905.description": "Kimi K2-Instruct-0905 جدیدترین و قدرتمندترین نسخه Kimi K2 است. این مدل MoE سطح بالا با ۱ تریلیون پارامتر کل و ۳۲ میلیارد پارامتر فعال است. ویژگیهای کلیدی شامل هوش کدنویسی عاملمحور قویتر با پیشرفتهای قابل توجه در معیارها و وظایف واقعی عاملها، بهعلاوه زیباییشناسی و قابلیت استفاده بهتر در کدنویسی رابط کاربری است.",
|
||
"Pro/moonshotai/Kimi-K2-Thinking.description": "Kimi K2 Thinking Turbo نسخه توربو بهینهشده برای سرعت استدلال و توان عملیاتی است، در حالی که استدلال چندمرحلهای و استفاده از ابزار K2 Thinking را حفظ میکند. این مدل MoE با حدود ۱ تریلیون پارامتر کل، زمینه بومی ۲۵۶ هزار توکن و فراخوانی ابزار در مقیاس بزرگ پایدار برای سناریوهای تولیدی با نیازهای سختگیرانهتر در تأخیر و همزمانی است.",
|
||
"Pro/moonshotai/Kimi-K2.5.description": "Kimi K2.5 یک مدل عامل چندوجهی بومی متنباز است که بر پایه Kimi-K2-Base ساخته شده و با حدود ۱.۵ تریلیون توکن ترکیبی بینایی و متنی آموزش دیده است. این مدل از معماری MoE با ۱ تریلیون پارامتر کل و ۳۲ میلیارد پارامتر فعال بهره میبرد و از پنجره متنی ۲۵۶ هزار توکن پشتیبانی میکند و درک زبان و تصویر را بهصورت یکپارچه ارائه میدهد.",
|
||
"Pro/zai-org/GLM-5.1.description": "GLM-5.1 یک مدل پرچمدار نسل بعدی برای مهندسی عاملها است که از معماری Mixture of Experts (MoE) با 754 میلیارد پارامتر بهره میبرد. این مدل تواناییهای برنامهنویسی را بهطور چشمگیری ارتقا داده و نتایج پیشرو در SWE-Bench Pro به دست آورده و عملکردی بسیار بهتر از نسل قبلی در بنچمارکهایی مانند NL2Repo و Terminal-Bench 2.0 ارائه میدهد. این مدل برای وظایف عاملی بلندمدت طراحی شده و در برخورد با پرسشهای مبهم قضاوت بهتری دارد، وظایف پیچیده را تجزیه میکند، آزمایشها را اجرا میکند، نتایج را تحلیل میکند و از طریق صدها تکرار و هزاران فراخوان ابزار بهطور مستمر بهینهسازی میشود.",
|
||
"Pro/zai-org/glm-4.7.description": "GLM-4.7 مدل پرچمدار نسل جدید Zhipu با 355 میلیارد پارامتر کل و 32 میلیارد پارامتر فعال است که بهطور کامل در قابلیتهای گفتگوی عمومی، استدلال و عامل ارتقا یافته است. GLM-4.7 تفکر متداخل را بهبود میبخشد و تفکر حفظشده و تفکر سطح چرخش را معرفی میکند.",
|
||
"Pro/zai-org/glm-5.description": "GLM-5 مدل زبان بزرگ نسل بعدی Zhipu است که بر مهندسی سیستمهای پیچیده و وظایف عامل با مدت زمان طولانی تمرکز دارد. پارامترهای مدل به 744 میلیارد (40 میلیارد فعال) گسترش یافته و DeepSeek Sparse Attention را ادغام میکند.",
|
||
"QwQ-32B-Preview.description": "Qwen QwQ یک مدل تحقیقاتی آزمایشی است که بر بهبود توانایی استدلال تمرکز دارد.",
|
||
"Qwen/QVQ-72B-Preview.description": "QVQ-72B-Preview یک مدل تحقیقاتی از Qwen است که بر استدلال بصری تمرکز دارد و در درک صحنههای پیچیده و مسائل ریاضی بصری قوی است.",
|
||
"Qwen/QwQ-32B-Preview.description": "Qwen QwQ یک مدل تحقیقاتی آزمایشی است که بر بهبود استدلال هوش مصنوعی تمرکز دارد.",
|
||
"Qwen/QwQ-32B.description": "QwQ یک مدل استدلال از خانواده Qwen است. در مقایسه با مدلهای استاندارد تنظیمشده با دستورالعمل، این مدل تفکر و استدلال را اضافه میکند که عملکرد مدل را در وظایف دشوار بهطور قابل توجهی بهبود میبخشد. QwQ-32B یک مدل استدلال میانرده است که با مدلهای برتر مانند DeepSeek-R1 و o1-mini رقابت میکند. این مدل از RoPE، SwiGLU، RMSNorm و بایاس QKV در توجه استفاده میکند و دارای ۶۴ لایه و ۴۰ سر توجه Q (با ۸ KV در GQA) است.",
|
||
"Qwen/Qwen-Image-Edit-2509.description": "Qwen-Image-Edit-2509 جدیدترین نسخه ویرایش مدل Qwen-Image از تیم Qwen است. این مدل بر پایه Qwen-Image با ۲۰ میلیارد پارامتر ساخته شده و قابلیت رندر دقیق متن را به ویرایش تصویر گسترش میدهد. با استفاده از معماری کنترل دوگانه، ورودیها را به Qwen2.5-VL برای کنترل معنایی و به رمزگذار VAE برای کنترل ظاهر ارسال میکند و امکان ویرایش در سطح معنا و ظاهر را فراهم میسازد. این مدل از ویرایشهای محلی (افزودن/حذف/تغییر) و ویرایشهای معنایی سطح بالا مانند خلق IP و انتقال سبک پشتیبانی میکند و در عین حال معنا را حفظ مینماید. این مدل در چندین معیار عملکرد پیشرفتهای (SOTA) دارد.",
|
||
"Qwen/Qwen-Image.description": "Qwen-Image یک مدل پایه تولید تصویر با ۲۰ میلیارد پارامتر از تیم Qwen است. این مدل در رندر متنهای پیچیده و ویرایش دقیق تصویر، بهویژه برای متون چینی/انگلیسی با وفاداری بالا، پیشرفت چشمگیری دارد. از چیدمانهای چندخطی و پاراگرافی پشتیبانی میکند و انسجام تایپوگرافی را حفظ مینماید. فراتر از رندر متن، از سبکهای متنوعی از واقعگرایانه تا انیمه پشتیبانی میکند و قابلیتهایی مانند انتقال سبک، افزودن/حذف اشیاء، افزایش جزئیات، ویرایش متن و کنترل حالت را ارائه میدهد و هدف آن تبدیل شدن به یک مدل پایه جامع برای خلق بصری است.",
|
||
"Qwen/Qwen2-72B-Instruct.description": "Qwen 2 Instruct (72B) دستورالعملها را با دقت بالا برای بارهای کاری سازمانی دنبال میکند.",
|
||
"Qwen/Qwen2-7B-Instruct.description": "Qwen2-7B-Instruct یک مدل ۷ میلیارد پارامتری تنظیمشده با دستورالعمل در سری Qwen2 است که از Transformer، SwiGLU، بایاس QKV و توجه با پرسوجوی گروهی استفاده میکند. این مدل ورودیهای بزرگ را پردازش میکند و در معیارهای درک، تولید، چندزبانه، کدنویسی، ریاضی و استدلال عملکرد قوی دارد و از بیشتر مدلهای باز پیشی میگیرد و در چندین ارزیابی از Qwen1.5-7B-Chat بهتر عمل میکند.",
|
||
"Qwen/Qwen2-VL-72B-Instruct.description": "Qwen2-VL جدیدترین مدل Qwen-VL است که در معیارهای بینایی مانند MathVista، DocVQA، RealWorldQA و MTVQA به سطح پیشرفته (SOTA) رسیده است. این مدل توانایی درک ویدیوهای بیش از ۲۰ دقیقه را برای پرسش و پاسخ ویدیویی، گفتوگو و تولید محتوا دارد. همچنین از استدلال پیچیده و تصمیمگیری پشتیبانی میکند و با دستگاهها/رباتها برای اقدامات مبتنی بر بینایی یکپارچه میشود. فراتر از زبانهای انگلیسی و چینی، این مدل میتواند متون را به زبانهای مختلف از جمله بیشتر زبانهای اروپایی، ژاپنی، کرهای، عربی و ویتنامی بخواند.",
|
||
"Qwen/Qwen2.5-14B-Instruct.description": "Qwen2.5-14B-Instruct بخشی از جدیدترین سری مدلهای زبانی بزرگ (LLM) علیبابا کلود است. این مدل ۱۴ میلیارد پارامتری پیشرفتهای قابل توجهی در کدنویسی و ریاضی دارد، از بیش از ۲۹ زبان پشتیبانی میکند و در دنبال کردن دستورالعملها، درک دادههای ساختاریافته و تولید خروجی ساختاریافته (بهویژه JSON) بهبود یافته است.",
|
||
"Qwen/Qwen2.5-32B-Instruct.description": "Qwen2.5-32B-Instruct بخشی از جدیدترین سری مدلهای زبانی بزرگ (LLM) علیبابا کلود است. این مدل ۳۲ میلیارد پارامتری پیشرفتهای قابل توجهی در کدنویسی و ریاضی دارد، از بیش از ۲۹ زبان پشتیبانی میکند و در دنبال کردن دستورالعملها، درک دادههای ساختاریافته و تولید خروجی ساختاریافته (بهویژه JSON) بهبود یافته است.",
|
||
"Qwen/Qwen2.5-72B-Instruct-128K.description": "Qwen2.5-72B-Instruct بخشی از جدیدترین سری مدلهای زبانی بزرگ (LLM) علیبابا کلود است. این مدل ۷۲ میلیارد پارامتری در کدنویسی و ریاضی بهبود یافته، از ورودی تا ۱۲۸ هزار توکن و خروجی بیش از ۸ هزار توکن پشتیبانی میکند، بیش از ۲۹ زبان را پوشش میدهد و در دنبال کردن دستورالعملها و تولید خروجی ساختاریافته (بهویژه JSON) عملکرد بهتری دارد.",
|
||
"Qwen/Qwen2.5-72B-Instruct-Turbo.description": "Qwen2.5 یک خانواده جدید از مدلهای زبانی بزرگ است که برای وظایف مبتنی بر دستورالعمل بهینهسازی شده است.",
|
||
"Qwen/Qwen2.5-72B-Instruct.description": "Qwen2.5-72B-Instruct بخشی از جدیدترین سری مدلهای زبانی بزرگ (LLM) علیبابا کلود است. این مدل ۷۲ میلیارد پارامتری پیشرفتهای قابل توجهی در کدنویسی و ریاضی دارد، از بیش از ۲۹ زبان پشتیبانی میکند و در دنبال کردن دستورالعملها، درک دادههای ساختاریافته و تولید خروجی ساختاریافته (بهویژه JSON) بهبود یافته است.",
|
||
"Qwen/Qwen2.5-7B-Instruct-Turbo.description": "Qwen2.5 یک خانواده جدید از مدلهای زبانی بزرگ است که برای وظایف مبتنی بر دستورالعمل بهینهسازی شده است.",
|
||
"Qwen/Qwen2.5-7B-Instruct.description": "Qwen2.5-7B-Instruct بخشی از جدیدترین سری مدلهای زبانی بزرگ (LLM) علیبابا کلود است. این مدل ۷ میلیارد پارامتری پیشرفتهای قابل توجهی در کدنویسی و ریاضی دارد، از بیش از ۲۹ زبان پشتیبانی میکند و در دنبال کردن دستورالعملها، درک دادههای ساختاریافته و تولید خروجی ساختاریافته (بهویژه JSON) بهبود یافته است.",
|
||
"Qwen/Qwen2.5-Coder-32B-Instruct.description": "Qwen2.5 Coder 32B Instruct جدیدترین مدل کدنویسی علیبابا کلود است. این مدل بر پایه Qwen2.5 ساخته شده و با ۵.۵ تریلیون توکن آموزش دیده است. این مدل بهطور قابل توجهی در تولید کد، استدلال و اصلاح کد بهبود یافته و در عین حال تواناییهای ریاضی و عمومی خود را حفظ کرده است و پایهای قوی برای عاملهای کدنویسی فراهم میکند.",
|
||
"Qwen/Qwen2.5-VL-32B-Instruct.description": "Qwen2.5-VL-32B-Instruct یک مدل چندوجهی از تیم Qwen است. این مدل اشیاء رایج را شناسایی کرده و متن، نمودارها، آیکونها، گرافیکها و چیدمانها را تحلیل میکند. بهعنوان یک عامل بصری، میتواند استدلال کند و ابزارها را بهصورت پویا کنترل نماید، از جمله استفاده از رایانه و تلفن. این مدل اشیاء را با دقت مکانیابی کرده و خروجیهای ساختاریافته برای فاکتورها و جداول تولید میکند. در مقایسه با Qwen2-VL، نسخه RL در ریاضی و حل مسئله بهبود یافته و پاسخهایی با ترجیح انسانی بیشتری ارائه میدهد.",
|
||
"Qwen/Qwen2.5-VL-72B-Instruct.description": "Qwen2.5-VL مدل بینایی-زبان در سری Qwen2.5 است که با ارتقاءهای عمده همراه است: درک بصری قویتر برای اشیاء، متن، نمودارها و چیدمانها؛ استدلال بهعنوان یک عامل بصری با استفاده پویا از ابزارها؛ درک ویدیوهای بیش از ۱ ساعت و ثبت رویدادهای کلیدی؛ مکانیابی دقیق اشیاء از طریق جعبهها یا نقاط؛ و خروجیهای ساختاریافته برای دادههای اسکنشده مانند فاکتورها و جداول.",
|
||
"Qwen/Qwen3-14B.description": "Qwen3 یک مدل نسل جدید از خانواده Tongyi Qwen است که پیشرفتهای چشمگیری در استدلال، توانایی عمومی، قابلیتهای عاملمحور و عملکرد چندزبانه دارد و از تغییر حالتهای تفکر پشتیبانی میکند.",
|
||
"Qwen/Qwen3-235B-A22B-Instruct-2507.description": "Qwen3-235B-A22B-Instruct-2507 یک مدل پرچمدار MoE از سری Qwen3 با ۲۳۵ میلیارد پارامتر کل و ۲۲ میلیارد پارامتر فعال است. این نسخه غیرتفکری بهروزرسانی شده، بر بهبود پیروی از دستورالعملها، استدلال منطقی، درک متن، ریاضیات، علوم، برنامهنویسی و استفاده از ابزار تمرکز دارد. همچنین دانش چندزبانه در حوزههای کمکاربرد را گسترش داده و با ترجیحات کاربران در وظایف ذهنی و باز بهتر همراستا میشود.",
|
||
"Qwen/Qwen3-235B-A22B-Thinking-2507.description": "Qwen3-235B-A22B-Thinking-2507 یک مدل Qwen3 متمرکز بر استدلال پیچیده و دشوار است. این مدل از معماری MoE با ۲۳۵ میلیارد پارامتر کل و حدود ۲۲ میلیارد پارامتر فعال در هر توکن استفاده میکند تا بهرهوری را افزایش دهد. بهعنوان یک مدل تفکری اختصاصی، پیشرفتهای چشمگیری در منطق، ریاضیات، علوم، برنامهنویسی و معیارهای دانشگاهی نشان میدهد و به عملکردی در سطح برتر در تفکر باز میرسد. همچنین پیروی از دستورالعملها، استفاده از ابزار و تولید متن را بهبود میبخشد و بهصورت بومی از زمینه ۲۵۶ هزار توکن برای استدلال عمیق و اسناد طولانی پشتیبانی میکند.",
|
||
"Qwen/Qwen3-235B-A22B.description": "Qwen3 235B A22B یک مدل فوقالعاده مقیاس Qwen3 است که قابلیتهای برتر هوش مصنوعی را ارائه میدهد.",
|
||
"Qwen/Qwen3-30B-A3B-Instruct-2507.description": "Qwen3-30B-A3B-Instruct-2507 نسخه غیرتفکری بهروزرسانیشده Qwen3-30B-A3B است. این مدل MoE دارای ۳۰.۵ میلیارد پارامتر کل و ۳.۳ میلیارد پارامتر فعال است. این مدل بهطور قابلتوجهی پیروی از دستورالعملها، استدلال منطقی، درک متن، ریاضیات، علوم، برنامهنویسی و استفاده از ابزار را بهبود میبخشد، دانش چندزبانه در حوزههای کمکاربرد را گسترش میدهد و با ترجیحات کاربران در وظایف ذهنی باز بهتر همراستا میشود. از زمینه ۲۵۶ هزار توکن پشتیبانی میکند. این مدل فقط در حالت غیرتفکری عمل میکند و تگهای `<think></think>` تولید نمیکند.",
|
||
"Qwen/Qwen3-30B-A3B-Thinking-2507.description": "Qwen3-30B-A3B-Thinking-2507 جدیدترین مدل تفکری در سری Qwen3 است. این مدل MoE با ۳۰.۵ میلیارد پارامتر کل و ۳.۳ میلیارد پارامتر فعال، بر وظایف پیچیده تمرکز دارد. پیشرفتهای قابلتوجهی در منطق، ریاضیات، علوم، برنامهنویسی و معیارهای دانشگاهی نشان میدهد و پیروی از دستورالعملها، استفاده از ابزار، تولید متن و همراستایی با ترجیحات را بهبود میبخشد. بهصورت بومی از زمینه ۲۵۶ هزار توکن پشتیبانی میکند و قابلیت گسترش تا ۱ میلیون توکن را دارد. این نسخه برای حالت تفکری طراحی شده و استدلال گامبهگام دقیق و قابلیتهای قوی عاملمحور ارائه میدهد.",
|
||
"Qwen/Qwen3-32B.description": "Qwen3 یک مدل نسل جدید از خانواده Tongyi Qwen است که پیشرفتهای چشمگیری در استدلال، توانایی عمومی، قابلیتهای عاملمحور و عملکرد چندزبانه دارد و از تغییر حالتهای تفکر پشتیبانی میکند.",
|
||
"Qwen/Qwen3-8B.description": "Qwen3 یک مدل نسل جدید از خانواده Tongyi Qwen است که پیشرفتهای چشمگیری در استدلال، توانایی عمومی، قابلیتهای عاملمحور و عملکرد چندزبانه دارد و از تغییر حالتهای تفکر پشتیبانی میکند.",
|
||
"Qwen/Qwen3-Coder-30B-A3B-Instruct.description": "Qwen3-Coder-30B-A3B-Instruct یک مدل کدنویسی از تیم Qwen است. این مدل برای عملکرد بالا و بهرهوری بهینهسازی شده و تواناییهای کدنویسی را تقویت میکند. در کدنویسی عاملمحور، عملیات خودکار مرورگر و استفاده از ابزار در میان مدلهای باز عملکرد برجستهای دارد. بهصورت بومی از زمینه ۲۵۶ هزار توکن پشتیبانی میکند و میتواند تا ۱ میلیون توکن برای درک در سطح پایگاه کد گسترش یابد. این مدل کدنویسی عاملمحور را در پلتفرمهایی مانند Qwen Code و CLINE با فرمت فراخوانی تابع اختصاصی پشتیبانی میکند.",
|
||
"Qwen/Qwen3-Coder-480B-A35B-Instruct.description": "Qwen3-Coder-480B-A35B-Instruct پیشرفتهترین مدل کدنویسی عاملمحور علیبابا تا به امروز است. این مدل MoE با ۴۸۰ میلیارد پارامتر کل و ۳۵ میلیارد پارامتر فعال، تعادلی بین بهرهوری و عملکرد برقرار میکند. بهصورت بومی از زمینه ۲۵۶ هزار توکن پشتیبانی میکند و از طریق YaRN تا ۱ میلیون توکن گسترش مییابد و امکان پردازش پایگاههای کد بزرگ را فراهم میسازد. برای جریانهای کاری کدنویسی عاملمحور طراحی شده و میتواند با ابزارها و محیطها تعامل داشته باشد تا وظایف پیچیده برنامهنویسی را حل کند. در معیارهای کدنویسی و عاملمحور در میان مدلهای باز نتایج برتری دارد و با مدلهای پیشرو مانند Claude Sonnet 4 قابل مقایسه است.",
|
||
"Qwen/Qwen3-Omni-30B-A3B-Captioner.description": "Qwen3-Omni-30B-A3B-Captioner یک مدل VLM از سری Qwen3 است که برای تولید کپشنهای تصویری با کیفیت بالا، دقیق و جزئی طراحی شده است. این مدل از معماری MoE با ۳۰ میلیارد پارامتر استفاده میکند تا تصاویر را بهطور عمیق درک کرده و توصیفهای روان تولید کند. در ثبت جزئیات، درک صحنه، شناسایی اشیاء و استدلال رابطهای عملکرد برجستهای دارد.",
|
||
"Qwen/Qwen3-Omni-30B-A3B-Instruct.description": "Qwen3-Omni-30B-A3B-Instruct یک مدل MoE از سری Qwen3 با ۳۰ میلیارد پارامتر کل و ۳ میلیارد پارامتر فعال است که عملکرد قوی را با هزینه استنتاج پایین ارائه میدهد. این مدل با دادههای چندمنبعی و چندزبانه با کیفیت بالا آموزش دیده و از ورودیهای تماممدال (متن، تصویر، صدا، ویدیو) و درک و تولید میانمدال پشتیبانی میکند.",
|
||
"Qwen/Qwen3-Omni-30B-A3B-Thinking.description": "Qwen3-Omni-30B-A3B-Thinking هسته تفکری Qwen3-Omni است. این مدل ورودیهای چندمدال (متن، صدا، تصویر، ویدیو) را پردازش کرده و استدلال زنجیرهای پیچیده انجام میدهد و ورودیها را به نمایش مشترک برای درک عمیق میانمدال تبدیل میکند. این مدل MoE با ۳۰ میلیارد پارامتر کل و ۳ میلیارد پارامتر فعال است که تعادلی بین استدلال قوی و بهرهوری محاسباتی برقرار میکند.",
|
||
"Qwen/Qwen3-VL-235B-A22B-Instruct.description": "Qwen3-VL-235B-A22B-Instruct یک مدل بزرگ تنظیمشده با دستورالعمل از سری Qwen3-VL است که بر پایه MoE ساخته شده و درک و تولید چندمدال عالی ارائه میدهد. بهصورت بومی از زمینه ۲۵۶ هزار توکن پشتیبانی میکند و برای خدمات تولیدی چندمدال با همزمانی بالا مناسب است.",
|
||
"Qwen/Qwen3-VL-235B-A22B-Thinking.description": "Qwen3-VL-235B-A22B-Thinking نسخه تفکری پرچمدار Qwen3-VL است که برای استدلال پیچیده چندمدال، استدلال با زمینه طولانی و تعامل عاملمحور در سناریوهای سازمانی بهینهسازی شده است.",
|
||
"Qwen/Qwen3-VL-30B-A3B-Instruct.description": "Qwen3-VL-30B-A3B-Instruct نسخه تنظیمشده با دستورالعمل از مدل Qwen3-VL است که درک و تولید زبان-تصویر قوی دارد. بهصورت بومی از زمینه ۲۵۶ هزار توکن برای چت چندمدال و تولید مشروط بر تصویر پشتیبانی میکند.",
|
||
"Qwen/Qwen3-VL-30B-A3B-Thinking.description": "Qwen3-VL-30B-A3B-Thinking نسخه تقویتشده برای استدلال از Qwen3-VL است که برای استدلال چندمدال، تبدیل تصویر به کد و درک بصری پیچیده بهینهسازی شده است. از زمینه ۲۵۶ هزار توکن با توانایی قوی در زنجیره تفکر پشتیبانی میکند.",
|
||
"Qwen/Qwen3-VL-32B-Instruct.description": "Qwen3-VL-32B-Instruct یک مدل زبان-تصویر از تیم Qwen است که نتایج پیشرفتهای در چندین معیار VL دارد. از تصاویر با وضوح مگاپیکسل پشتیبانی میکند و درک بصری قوی، OCR چندزبانه، مکانیابی بصری دقیق و گفتوگوی تصویری ارائه میدهد. وظایف پیچیده چندمدال را مدیریت کرده و از فراخوانی ابزار و تکمیل پیشوند پشتیبانی میکند.",
|
||
"Qwen/Qwen3-VL-32B-Thinking.description": "Qwen3-VL-32B-Thinking برای استدلال بصری پیچیده بهینهسازی شده است. این مدل دارای حالت تفکری داخلی است که مراحل استدلال میانی را قبل از پاسخ تولید میکند و منطق چندمرحلهای، برنامهریزی و استدلال پیچیده را تقویت میکند. از تصاویر مگاپیکسلی، درک بصری قوی، OCR چندزبانه، مکانیابی دقیق، گفتوگوی تصویری، فراخوانی ابزار و تکمیل پیشوند پشتیبانی میکند.",
|
||
"Qwen/Qwen3-VL-8B-Instruct.description": "Qwen3-VL-8B-Instruct یک مدل زبان-تصویر از سری Qwen3 است که بر پایه Qwen3-8B-Instruct ساخته شده و با دادههای بزرگ تصویر-متن آموزش دیده است. در درک بصری عمومی، گفتوگوی متمرکز بر تصویر و شناسایی متن چندزبانه در تصاویر عملکرد برجستهای دارد و برای پرسشوپاسخ بصری، کپشننویسی، پیروی از دستورالعمل چندمدال و استفاده از ابزار مناسب است.",
|
||
"Qwen/Qwen3-VL-8B-Thinking.description": "Qwen3-VL-8B-Thinking نسخه تفکری بصری Qwen3 است که برای استدلال پیچیده چندمرحلهای بهینهسازی شده است. این مدل زنجیره تفکر را قبل از پاسخ تولید میکند تا دقت را افزایش دهد و برای پرسشوپاسخ بصری عمیق و تحلیل دقیق تصویر ایدهآل است.",
|
||
"Qwen/Qwen3.5-122B-A10B.description": "مدل Qwen3.5-122B-A10B یک مدل زبان بزرگ چندوجهی بومی از تیم Qwen است که دارای 122 میلیارد پارامتر کل و تنها 10 میلیارد پارامتر فعال است. این مدل از یک معماری ترکیبی کارآمد که شبکههای دلتا گیتدار و Mixture-of-Experts (MoE) را ترکیب میکند، استفاده میکند و بهطور بومی از طول متن 256K پشتیبانی میکند و قابلیت گسترش به حدود 1 میلیون توکن را دارد.",
|
||
"Qwen/Qwen3.5-27B.description": "مدل Qwen3.5-27B یک مدل زبان بزرگ چندوجهی بومی از تیم Qwen است که دارای 27 میلیارد پارامتر است. این مدل از یک معماری ترکیبی کارآمد که شبکههای دلتا گیتدار و توجه گیتدار را ترکیب میکند، استفاده میکند و بهطور بومی از طول متن 256K پشتیبانی میکند و قابلیت گسترش به حدود 1 میلیون توکن را دارد.",
|
||
"Qwen/Qwen3.5-35B-A3B.description": "مدل Qwen3.5-35B-A3B یک مدل زبان بزرگ چندوجهی بومی از تیم Qwen است که دارای 35 میلیارد پارامتر کل و تنها 3 میلیارد پارامتر فعال است. این مدل از یک معماری ترکیبی کارآمد که شبکههای دلتا گیتدار و Mixture-of-Experts (MoE) را ترکیب میکند، استفاده میکند و بهطور بومی از طول متن 256K پشتیبانی میکند و قابلیت گسترش به حدود 1 میلیون توکن را دارد.",
|
||
"Qwen/Qwen3.5-397B-A17B.description": "مدل Qwen3.5-397B-A17B جدیدترین مدل زبان-تصویر در سری Qwen3.5 است که از معماری Mixture-of-Experts (MoE) با 397 میلیارد پارامتر کل و 17 میلیارد پارامتر فعال استفاده میکند. این مدل بهطور بومی از طول متن 256K پشتیبانی میکند و قابلیت گسترش به حدود 1 میلیون توکن را دارد، از 201 زبان پشتیبانی میکند و قابلیتهای یکپارچه درک زبان-تصویر، فراخوانی ابزار و استدلال را ارائه میدهد.",
|
||
"Qwen/Qwen3.5-4B.description": "مدل Qwen3.5-4B یک مدل زبان بزرگ چندوجهی بومی از تیم Qwen است که دارای 4 میلیارد پارامتر است و سبکترین مدل Dense در سری Qwen3.5 محسوب میشود. این مدل از یک معماری ترکیبی کارآمد که شبکههای دلتا گیتدار و توجه گیتدار را ترکیب میکند، استفاده میکند و بهطور بومی از طول متن 256K پشتیبانی میکند و قابلیت گسترش به حدود 1 میلیون توکن را دارد.",
|
||
"Qwen/Qwen3.5-9B.description": "مدل Qwen3.5-9B یک مدل زبان بزرگ چندوجهی بومی از تیم Qwen است که دارای 9 میلیارد پارامتر است. بهعنوان یک مدل Dense سبک در سری Qwen3.5، این مدل از یک معماری ترکیبی کارآمد که شبکههای دلتا گیتدار و توجه گیتدار را ترکیب میکند، استفاده میکند و بهطور بومی از طول متن 256K پشتیبانی میکند و قابلیت گسترش به حدود 1 میلیون توکن را دارد.",
|
||
"Qwen/Qwen3.6-35B-A3B.description": "Qwen3.6-35B-A3B یک مدل زبانی بزرگ از تیم Qwen در سری Qwen3.6 است که از معماری Mixture-of-Experts (MoE) با ۳۵ میلیارد پارامتر کل و ۳ میلیارد پارامتر فعال استفاده میکند. این مدل میان کارایی بالا در استنتاج و عملکرد عالی توازن برقرار کرده و از هر دو حالت تفکری و غیرتفکری پشتیبانی میکند و امکان جابهجایی انعطافپذیر بین پاسخ سریع و استدلال عمیق را فراهم میسازد.",
|
||
"Qwen2-72B-Instruct.description": "Qwen2 جدیدترین مدل از سری Qwen است که از پنجره متنی ۱۲۸ هزار توکن پشتیبانی میکند. در مقایسه با بهترین مدلهای متنباز امروزی، Qwen2-72B درک زبان طبیعی، دانش، کدنویسی، ریاضیات و تواناییهای چندزبانه را بهطور چشمگیری بهبود میبخشد.",
|
||
"Qwen2-7B-Instruct.description": "Qwen2 جدیدترین مدل از سری Qwen است که از بهترین مدلهای متنباز همرده و حتی مدلهای بزرگتر پیشی میگیرد. Qwen2 7B در آزمونهای مختلف، بهویژه در زمینه کدنویسی و درک زبان چینی، برتری قابلتوجهی نشان میدهد.",
|
||
"Qwen2-VL-72B.description": "Qwen2-VL-72B یک مدل قدرتمند بینایی-زبان است که از پردازش چندوجهی تصویر-متن پشتیبانی میکند و میتواند محتوای تصویر را با دقت تشخیص داده و توصیفها یا پاسخهای مرتبط تولید کند.",
|
||
"Qwen2.5-14B-Instruct.description": "Qwen2.5-14B-Instruct یک مدل زبانی با ۱۴ میلیارد پارامتر است که عملکرد بالایی دارد و برای سناریوهای چینی و چندزبانه بهینهسازی شده است. این مدل از پرسشوپاسخ هوشمند و تولید محتوا پشتیبانی میکند.",
|
||
"Qwen2.5-32B-Instruct.description": "Qwen2.5-32B-Instruct یک مدل زبانی با ۳۲ میلیارد پارامتر است که عملکردی متعادل دارد و برای سناریوهای چینی و چندزبانه بهینهسازی شده است. این مدل از پرسشوپاسخ هوشمند و تولید محتوا پشتیبانی میکند.",
|
||
"Qwen2.5-72B-Instruct.description": "مدل زبانی برای زبانهای چینی و انگلیسی، تنظیمشده برای زبان، کدنویسی، ریاضیات و استدلال.",
|
||
"Qwen2.5-7B-Instruct.description": "Qwen2.5-7B-Instruct یک مدل زبانی با ۷ میلیارد پارامتر است که از فراخوانی توابع و یکپارچهسازی با سیستمهای خارجی پشتیبانی میکند و انعطافپذیری و قابلیت گسترش را بهطور چشمگیری افزایش میدهد. این مدل برای سناریوهای چینی و چندزبانه بهینهسازی شده و از پرسشوپاسخ هوشمند و تولید محتوا پشتیبانی میکند.",
|
||
"Qwen2.5-Coder-14B-Instruct.description": "Qwen2.5-Coder-14B-Instruct یک مدل بزرگ آموزشدیده برای دستورالعملهای کدنویسی است که در درک و تولید کد عملکرد بالایی دارد. این مدل بهطور مؤثر طیف گستردهای از وظایف برنامهنویسی را انجام میدهد و برای کدنویسی هوشمند، تولید خودکار اسکریپت و پرسشوپاسخ برنامهنویسی ایدهآل است.",
|
||
"Qwen2.5-Coder-32B-Instruct.description": "مدل پیشرفته زبانی برای تولید کد، استدلال و رفع اشکال در زبانهای برنامهنویسی اصلی.",
|
||
"Qwen3-235B-A22B-Instruct-2507-FP8.description": "Qwen3 235B A22B Instruct 2507 برای استدلال پیشرفته و پیروی از دستورالعملها بهینهسازی شده است و با استفاده از معماری MoE، استدلال را در مقیاس بالا بهصورت کارآمد انجام میدهد.",
|
||
"Qwen3-235B.description": "Qwen3-235B-A22B یک مدل MoE است که حالت استدلال ترکیبی را معرفی میکند و به کاربران اجازه میدهد بهصورت یکپارچه بین حالتهای تفکر و غیرتفکر جابجا شوند. این مدل از درک و استدلال در ۱۱۹ زبان و گویش پشتیبانی میکند و توانایی بالایی در فراخوانی ابزارها دارد. در آزمونهای توانایی عمومی، کدنویسی و ریاضی، قابلیت چندزبانه و استدلال دانشی با مدلهای پیشرو مانند DeepSeek R1، OpenAI o1، o3-mini، Grok 3 و Google Gemini 2.5 Pro رقابت میکند.",
|
||
"Qwen3-32B.description": "Qwen3-32B یک مدل متراکم است که حالت استدلال ترکیبی را معرفی میکند و به کاربران اجازه میدهد بین تفکر و غیرتفکر جابجا شوند. با بهبود معماری، دادههای بیشتر و آموزش بهتر، عملکردی همسطح با Qwen2.5-72B دارد.",
|
||
"Qwen3.5-Plus.description": "Qwen3.5 Plus از ورودی متن، تصویر و ویدئو پشتیبانی میکند. عملکرد آن در کارهای متنی خالص با Qwen3 Max قابل مقایسه است اما با هزینه کمتر و عملکرد بهتر. قابلیتهای چندوجهی آن نسبت به سری Qwen3 VL پیشرفت چشمگیری دارد.",
|
||
"S2V-01.description": "مدل پایه مرجع به ویدئو سری 01.",
|
||
"SenseChat-128K.description": "نسخه پایه V4 با پنجره متنی ۱۲۸ هزار توکن، قوی در درک و تولید متون بلند.",
|
||
"SenseChat-32K.description": "نسخه پایه V4 با پنجره متنی ۳۲ هزار توکن، انعطافپذیر برای سناریوهای مختلف.",
|
||
"SenseChat-5-1202.description": "جدیدترین نسخه مبتنی بر V5.5 با پیشرفتهای چشمگیر در مبانی چینی/انگلیسی، گفتوگو، دانش علوم پایه، علوم انسانی، نگارش، ریاضی/منطق و کنترل طول متن.",
|
||
"SenseChat-5-Cantonese.description": "طراحیشده بر اساس عادات گفتاری، اصطلاحات عامیانه و دانش محلی هنگکنگ؛ در درک زبان کانتونی از GPT-4 پیشی میگیرد و در دانش، استدلال، ریاضی و کدنویسی با GPT-4 Turbo رقابت میکند.",
|
||
"SenseChat-5-beta.description": "در برخی عملکردها از SenseChat-5-1202 پیشی میگیرد.",
|
||
"SenseChat-5.description": "نسخه V5.5 با پنجره متنی ۱۲۸ هزار توکن؛ پیشرفتهای عمده در استدلال ریاضی، گفتوگوی انگلیسی، پیروی از دستورالعملها و درک متون بلند، قابل مقایسه با GPT-4o.",
|
||
"SenseChat-Character-Pro.description": "مدل پیشرفته گفتوگوی شخصیتی با پنجره متنی ۳۲ هزار توکن، قابلیتهای بهبود یافته و پشتیبانی از زبانهای چینی و انگلیسی.",
|
||
"SenseChat-Character.description": "مدل استاندارد گفتوگوی شخصیتی با پنجره متنی ۸ هزار توکن و سرعت پاسخدهی بالا.",
|
||
"SenseChat-Turbo-1202.description": "جدیدترین مدل سبکوزن که با هزینه استنتاج بسیار کمتر، به بیش از ۹۰٪ از توانایی مدل کامل دست مییابد.",
|
||
"SenseChat-Turbo.description": "مناسب برای سناریوهای پرسشوپاسخ سریع و تنظیم دقیق مدل.",
|
||
"SenseChat-Vision.description": "نسخه V5.5 با ورودی چندتصویری و بهبودهای گسترده در تشخیص ویژگیها، روابط فضایی، شناسایی رویداد/عمل، درک صحنه، تشخیص احساسات، استدلال عقل سلیم و درک/تولید متن.",
|
||
"SenseChat.description": "نسخه پایه V4 با پنجره متنی ۴ هزار توکن و توانایی عمومی قوی.",
|
||
"SenseNova-V6-5-Pro.description": "با بهروزرسانیهای جامع در دادههای چندوجهی، زبانی و استدلالی و بهینهسازی استراتژی آموزش، این مدل بهطور چشمگیری استدلال چندوجهی و پیروی از دستورالعملهای عمومی را بهبود میبخشد، از پنجره متنی تا ۱۲۸ هزار توکن پشتیبانی میکند و در وظایف OCR و شناسایی IP گردشگری فرهنگی عملکرد برجستهای دارد.",
|
||
"SenseNova-V6-5-Turbo.description": "با بهروزرسانیهای جامع در دادههای چندوجهی، زبانی و استدلالی و بهینهسازی استراتژی آموزش، این مدل بهطور چشمگیری استدلال چندوجهی و پیروی از دستورالعملهای عمومی را بهبود میبخشد، از پنجره متنی تا ۱۲۸ هزار توکن پشتیبانی میکند و در وظایف OCR و شناسایی IP گردشگری فرهنگی عملکرد برجستهای دارد.",
|
||
"SenseNova-V6-Pro.description": "بهصورت بومی تصویر، متن و ویدیو را یکپارچه میکند و مرزهای سنتی چندوجهی را میشکند؛ در OpenCompass و SuperCLUE رتبههای برتر را کسب کرده است.",
|
||
"SenseNova-V6-Reasoner.description": "ترکیبی از استدلال عمیق بینایی و زبان، پشتیبانی از تفکر آهسته و زنجیره کامل تفکر.",
|
||
"SenseNova-V6-Turbo.description": "بهصورت بومی تصویر، متن و ویدیو را یکپارچه میکند و مرزهای سنتی چندوجهی را میشکند. در قابلیتهای اصلی چندوجهی و زبانی پیشتاز است و در ارزیابیهای متعدد در رده برتر قرار دارد.",
|
||
"Skylark2-lite-8k.description": "مدل نسل دوم Skylark. نسخه Skylark2-lite پاسخهای سریعی برای سناریوهای بلادرنگ و حساس به هزینه با نیازهای دقت پایینتر ارائه میدهد و از پنجره متنی ۸ هزار توکن پشتیبانی میکند.",
|
||
"Skylark2-pro-32k.description": "مدل نسل دوم Skylark. نسخه Skylark2-pro دقت بالاتری برای تولید متون پیچیده مانند نگارش حرفهای، رماننویسی و ترجمه با کیفیت بالا ارائه میدهد و از پنجره متنی ۳۲ هزار توکن پشتیبانی میکند.",
|
||
"Skylark2-pro-4k.description": "مدل نسل دوم Skylark. نسخه Skylark2-pro دقت بالاتری برای تولید متون پیچیده مانند نگارش حرفهای، رماننویسی و ترجمه با کیفیت بالا ارائه میدهد و از پنجره متنی ۴ هزار توکن پشتیبانی میکند.",
|
||
"Skylark2-pro-character-4k.description": "مدل نسل دوم Skylark. نسخه Skylark2-pro-character در ایفای نقش و گفتوگو عملکرد برجستهای دارد و سبکهای شخصیتی متمایز و گفتوگوی طبیعی را برای چتباتها، دستیارهای مجازی و خدمات مشتری ارائه میدهد، با پاسخدهی سریع.",
|
||
"Skylark2-pro-turbo-8k.description": "مدل نسل دوم Skylark. نسخه Skylark2-pro-turbo-8k استنتاج سریعتری با هزینه کمتر ارائه میدهد و از پنجره متنی ۸ هزار توکن پشتیبانی میکند.",
|
||
"T2V-01-Director.description": "مدل تولید ویدئو در سطح کارگردان به طور رسمی منتشر شده است، با بهبود در پیروی از دستورالعملهای حرکت دوربین و زبان داستانگویی سینمایی.",
|
||
"T2V-01.description": "مدل پایه متن به ویدئو سری 01.",
|
||
"THUDM/GLM-4-32B-0414.description": "GLM-4-32B-0414 یک مدل نسل جدید GLM با ۳۲ میلیارد پارامتر است که از نظر عملکرد با مدلهای OpenAI GPT و سری DeepSeek V3/R1 قابل مقایسه است.",
|
||
"THUDM/GLM-4-9B-0414.description": "GLM-4-9B-0414 یک مدل ۹ میلیاردی GLM است که تکنیکهای GLM-4-32B را به ارث برده و در عین حال استقرار سبکتری را ارائه میدهد. این مدل در تولید کد، طراحی وب، تولید SVG و نگارش مبتنی بر جستجو عملکرد خوبی دارد.",
|
||
"THUDM/GLM-4.1V-9B-Thinking.description": "GLM-4.1V-9B-Thinking یک مدل VLM متنباز از Zhipu AI و آزمایشگاه KEG دانشگاه Tsinghua است که برای شناخت چندوجهی پیچیده طراحی شده است. این مدل بر اساس GLM-4-9B-0414 ساخته شده و استدلال زنجیرهای و RL را اضافه میکند تا استدلال بینوجهی و پایداری را بهطور قابل توجهی بهبود بخشد.",
|
||
"THUDM/GLM-Z1-32B-0414.description": "GLM-Z1-32B-0414 یک مدل استدلال عمیق است که بر پایه GLM-4-32B-0414 با دادههای شروع سرد و یادگیری تقویتی گسترده ساخته شده و آموزش بیشتری در زمینه ریاضی، کدنویسی و منطق دیده است. این مدل توانایی حل مسائل پیچیده و ریاضی را نسبت به مدل پایه بهطور چشمگیری افزایش میدهد.",
|
||
"THUDM/GLM-Z1-9B-0414.description": "GLM-Z1-9B-0414 یک مدل GLM کوچک با ۹ میلیارد پارامتر است که در عین حفظ مزایای متنباز، عملکرد چشمگیری ارائه میدهد. این مدل در استدلال ریاضی و وظایف عمومی بسیار قوی عمل کرده و در میان مدلهای همرده خود پیشتاز است.",
|
||
"Tongyi-Zhiwen/QwenLong-L1-32B.description": "QwenLong-L1-32B اولین مدل استدلال زمینه طولانی (LRM) است که با RL آموزش دیده و برای استدلال متن طولانی بهینه شده است. RL گسترش زمینه پیشرفته آن انتقال پایدار از زمینه کوتاه به طولانی را امکانپذیر میکند. این مدل در هفت معیار QA سند زمینه طولانی از OpenAI-o3-mini و Qwen3-235B-A22B پیشی میگیرد و با Claude-3.7-Sonnet-Thinking رقابت میکند. این مدل بهویژه در ریاضیات، منطق و استدلال چندمرحلهای قوی است.",
|
||
"Wan-AI/Wan2.2-I2V-A14B.description": "Wan2.2-I2V-A14B یکی از اولین مدلهای تولید تصویر به ویدئو (I2V) متنباز منتشر شده توسط Wan-AI، ابتکار هوش مصنوعی تحت علیبابا، است که معماری Mixture of Experts (MoE) را به کار گرفته است. این مدل بر تولید توالیهای ویدئویی پویا و طبیعی با ترکیب تصاویر ثابت و دستورات متنی تمرکز دارد. نوآوری اصلی آن در معماری MoE نهفته است: یک متخصص نویز بالا مسئول رسیدگی به ساختار کلی در مراحل اولیه تولید ویدئو است، در حالی که یک متخصص نویز پایین جزئیات دقیق را در مراحل بعدی اصلاح میکند. این طراحی عملکرد کلی مدل را بدون افزایش هزینه استنتاج بهبود میبخشد. در مقایسه با نسخههای قبلی، Wan2.2 بر روی مجموعه دادهای به طور قابل توجهی بزرگتر آموزش داده شده است که منجر به بهبود قابل توجه در درک حرکت پیچیده، سبکهای زیباییشناسی و محتوای معنایی میشود. این مدل ویدئوهای پایدارتر تولید میکند و حرکات دوربین غیرواقعی را کاهش میدهد.",
|
||
"Wan-AI/Wan2.2-T2V-A14B.description": "Wan2.2-T2V-A14B اولین مدل تولید ویدئو متنباز منتشر شده توسط علیبابا است که معماری Mixture of Experts (MoE) را به کار گرفته است. این مدل برای وظایف تولید متن به ویدئو (T2V) طراحی شده است و قادر به تولید ویدئوهایی تا 5 ثانیه با وضوح 480P یا 720P است. با معرفی معماری MoE، ظرفیت کلی مدل به طور قابل توجهی افزایش یافته است در حالی که هزینههای استنتاج تقریباً بدون تغییر باقی مانده است. این مدل شامل یک متخصص نویز بالا است که ساختار کلی را در مراحل اولیه تولید مدیریت میکند و یک متخصص نویز پایین که جزئیات دقیق را در مراحل بعدی ویدئو اصلاح میکند. علاوه بر این، Wan2.2 دادههای زیباییشناسی با دقت انتخاب شده را شامل میشود، با توضیحات دقیق در ابعاد مختلف مانند نورپردازی، ترکیببندی و رنگ. این امکان تولید دقیقتر و قابل کنترلتر تصاویر با کیفیت سینمایی را فراهم میکند. در مقایسه با نسخههای قبلی، مدل بر روی مجموعه دادهای بزرگتر آموزش داده شده است که منجر به بهبود قابل توجه در تعمیم حرکت، معناشناسی و زیباییشناسی و مدیریت بهتر اثرات دینامیک پیچیده میشود.",
|
||
"Yi-34B-Chat.description": "Yi-1.5-34B ضمن حفظ تواناییهای زبانی قوی سری Yi، با آموزش افزایشی بر روی ۵۰۰ میلیارد توکن با کیفیت، تواناییهای منطق ریاضی و کدنویسی را بهطور قابل توجهی بهبود داده است.",
|
||
"abab5.5-chat.description": "برای سناریوهای بهرهوری طراحی شده است و توانایی انجام وظایف پیچیده و تولید متن کارآمد برای استفاده حرفهای را دارد.",
|
||
"abab5.5s-chat.description": "برای گفتوگوی شخصیتمحور به زبان چینی طراحی شده و گفتوگوی با کیفیت بالا به زبان چینی را در کاربردهای مختلف ارائه میدهد.",
|
||
"abab6.5g-chat.description": "برای گفتوگوی شخصیتمحور چندزبانه طراحی شده و تولید گفتوگوی با کیفیت به زبان انگلیسی و سایر زبانها را پشتیبانی میکند.",
|
||
"abab6.5s-chat.description": "برای طیف گستردهای از وظایف پردازش زبان طبیعی مناسب است، از جمله تولید متن و سیستمهای گفتوگو.",
|
||
"abab6.5t-chat.description": "برای گفتوگوی شخصیتمحور به زبان چینی بهینهسازی شده و گفتوگویی روان و منطبق با عادات بیانی زبان چینی ارائه میدهد.",
|
||
"accounts/fireworks/models/deepseek-r1.description": "DeepSeek-R1 یک مدل زبان بزرگ پیشرفته است که با یادگیری تقویتی و دادههای شروع سرد بهینهسازی شده و عملکرد عالی در استدلال، ریاضی و کدنویسی دارد.",
|
||
"accounts/fireworks/models/deepseek-v3.description": "مدلی قدرتمند از نوع Mixture-of-Experts (MoE) از DeepSeek با ۶۷۱ میلیارد پارامتر کل و ۳۷ میلیارد پارامتر فعال در هر توکن.",
|
||
"accounts/fireworks/models/llama-v3-70b-instruct.description": "Meta سری مدلهای Meta Llama 3 را توسعه داده و منتشر کرده است که شامل مدلهای تولید متن پیشآموزشدیده و تنظیمشده برای دستورالعمل در اندازههای ۸B و ۷۰B میباشد. مدلهای تنظیمشده برای دستورالعمل Llama 3 برای استفاده در گفتوگو بهینهسازی شدهاند و در بسیاری از معیارهای صنعتی از مدلهای متنباز موجود پیشی میگیرند.",
|
||
"accounts/fireworks/models/llama-v3-8b-instruct-hf.description": "مدلهای تنظیمشده برای دستورالعمل Meta Llama 3 برای استفاده در گفتوگو بهینهسازی شدهاند و در بسیاری از معیارهای صنعتی از مدلهای متنباز موجود پیشی میگیرند. Llama 3 8B Instruct (نسخه HF) نسخه اصلی FP16 از Llama 3 8B Instruct است و نتایج آن با پیادهسازی رسمی Hugging Face مطابقت دارد.",
|
||
"accounts/fireworks/models/llama-v3-8b-instruct.description": "Meta سری مدلهای Meta Llama 3 را توسعه داده و منتشر کرده است که شامل مدلهای تولید متن پیشآموزشدیده و تنظیمشده برای دستورالعمل در اندازههای ۸B و ۷۰B میباشد. مدلهای تنظیمشده برای دستورالعمل Llama 3 برای استفاده در گفتوگو بهینهسازی شدهاند و در بسیاری از معیارهای صنعتی از مدلهای متنباز موجود پیشی میگیرند.",
|
||
"accounts/fireworks/models/llama-v3p1-405b-instruct.description": "Meta Llama 3.1 یک خانواده چندزبانه از مدلهای زبان بزرگ است که شامل مدلهای تولید متن پیشآموزشدیده و تنظیمشده برای دستورالعمل در اندازههای ۸B، ۷۰B و ۴۰۵B میباشد. مدلهای تنظیمشده برای دستورالعمل برای گفتوگوی چندزبانه بهینهسازی شدهاند و در بسیاری از معیارهای صنعتی از مدلهای متنباز و بسته پیشی میگیرند. مدل ۴۰۵B قدرتمندترین مدل در خانواده Llama 3.1 است و از استنتاج FP8 استفاده میکند که با پیادهسازی مرجع مطابقت دارد.",
|
||
"accounts/fireworks/models/llama-v3p1-70b-instruct.description": "Meta Llama 3.1 یک خانواده چندزبانه از مدلهای زبان بزرگ است که شامل مدلهای تولید متن پیشآموزشدیده و تنظیمشده برای دستورالعمل در اندازههای ۸B، ۷۰B و ۴۰۵B میباشد. مدلهای تنظیمشده برای دستورالعمل برای گفتوگوی چندزبانه بهینهسازی شدهاند و در بسیاری از معیارهای صنعتی از مدلهای متنباز و بسته پیشی میگیرند.",
|
||
"accounts/fireworks/models/llama-v3p1-8b-instruct.description": "Meta Llama 3.1 یک خانواده چندزبانه از مدلهای زبان بزرگ است که شامل مدلهای تولید متن پیشآموزشدیده و تنظیمشده برای دستورالعمل در اندازههای ۸B، ۷۰B و ۴۰۵B میباشد. مدلهای تنظیمشده برای دستورالعمل برای گفتوگوی چندزبانه بهینهسازی شدهاند و در بسیاری از معیارهای صنعتی از مدلهای متنباز و بسته پیشی میگیرند.",
|
||
"accounts/fireworks/models/llama-v3p2-11b-vision-instruct.description": "مدل استدلال تصویری تنظیمشده برای دستورالعمل از Meta با ۱۱ میلیارد پارامتر، بهینهسازیشده برای شناسایی بصری، استدلال تصویری، تولید کپشن و پرسشوپاسخ مرتبط با تصویر. این مدل دادههای بصری مانند نمودارها و گرافها را درک میکند و با تولید توصیفهای متنی از جزئیات تصویر، بینایی و زبان را به هم پیوند میدهد.",
|
||
"accounts/fireworks/models/llama-v3p2-3b-instruct.description": "Llama 3.2 3B Instruct یک مدل چندزبانه سبک از Meta است که برای زمان اجرای کارآمد طراحی شده و نسبت به مدلهای بزرگتر تأخیر و هزینه کمتری دارد. موارد استفاده معمول شامل بازنویسی پرسوجو/پرامپت و کمک به نگارش است.",
|
||
"accounts/fireworks/models/llama-v3p2-90b-vision-instruct.description": "مدل استدلال تصویری تنظیمشده برای دستورالعمل از Meta با ۹۰ میلیارد پارامتر، بهینهسازیشده برای شناسایی بصری، استدلال تصویری، تولید کپشن و پرسشوپاسخ مرتبط با تصویر. این مدل دادههای بصری مانند نمودارها و گرافها را درک میکند و با تولید توصیفهای متنی از جزئیات تصویر، بینایی و زبان را به هم پیوند میدهد. توجه: این مدل در حال حاضر بهصورت آزمایشی بهعنوان مدل بدون سرور ارائه میشود. برای استفاده در تولید، توجه داشته باشید که Fireworks ممکن است استقرار آن را بهزودی متوقف کند.",
|
||
"accounts/fireworks/models/llama-v3p3-70b-instruct.description": "Llama 3.3 70B Instruct بهروزرسانی دسامبر برای Llama 3.1 70B است. این مدل استفاده از ابزار، پشتیبانی از متن چندزبانه، ریاضی و کدنویسی را نسبت به نسخه جولای ۲۰۲۴ بهبود میبخشد. عملکردی در سطح پیشرو در صنعت در استدلال، ریاضی و پیروی از دستورالعمل ارائه میدهد و عملکردی قابل مقایسه با 3.1 405B با مزایای قابل توجه در سرعت و هزینه دارد.",
|
||
"accounts/fireworks/models/mistral-small-24b-instruct-2501.description": "مدلی با ۲۴ میلیارد پارامتر و توانایی پیشرفته که با مدلهای بزرگتر قابل مقایسه است.",
|
||
"accounts/fireworks/models/mixtral-8x22b-instruct.description": "Mixtral MoE 8x22B Instruct v0.1 نسخه تنظیمشده برای دستورالعمل از Mixtral MoE 8x22B v0.1 است که API تکمیل گفتوگو در آن فعال شده است.",
|
||
"accounts/fireworks/models/mixtral-8x7b-instruct.description": "Mixtral MoE 8x7B Instruct نسخه تنظیمشده برای دستورالعمل از Mixtral MoE 8x7B است که API تکمیل گفتوگو در آن فعال شده است.",
|
||
"accounts/fireworks/models/mythomax-l2-13b.description": "نسخه بهبودیافتهای از MythoMix که احتمالاً شکل پالایششدهتری از آن است و با ترکیب MythoLogic-L2 و Huginn با تکنیک ادغام تنسور بسیار تجربی ساخته شده است. ماهیت منحصربهفرد آن را برای داستانسرایی و ایفای نقش عالی میسازد.",
|
||
"accounts/fireworks/models/phi-3-vision-128k-instruct.description": "Phi-3-Vision-128K-Instruct یک مدل چندرسانهای سبک و پیشرفته است که از دادههای مصنوعی و مجموعه دادههای عمومی وب انتخابشده ساخته شده و بر دادههای متنی و تصویری با کیفیت بالا و نیازمند استدلال تمرکز دارد. این مدل متعلق به خانواده Phi-3 است و نسخه چندرسانهای آن از طول زمینه ۱۲۸ هزار توکن پشتیبانی میکند. این مدل تحت بهبودهای دقیق از جمله تنظیم نظارتشده و بهینهسازی مستقیم ترجیح قرار گرفته تا پیروی دقیق از دستورالعمل و اقدامات ایمنی قوی را تضمین کند.",
|
||
"accounts/fireworks/models/qwen-qwq-32b-preview.description": "مدل Qwen QwQ بر پیشرفت در استدلال هوش مصنوعی تمرکز دارد و نشان میدهد که مدلهای باز میتوانند در استدلال با مدلهای پیشرفته بسته رقابت کنند. QwQ-32B-Preview یک نسخه آزمایشی است که با o1 برابری میکند و در استدلال و تحلیل در آزمونهای GPQA، AIME، MATH-500 و LiveCodeBench از GPT-4o و Claude 3.5 Sonnet پیشی میگیرد. توجه: این مدل در حال حاضر بهصورت آزمایشی و بدون سرور ارائه میشود. برای استفاده در محیط تولید، توجه داشته باشید که Fireworks ممکن است این استقرار را بدون اطلاع قبلی متوقف کند.",
|
||
"accounts/fireworks/models/qwen2-vl-72b-instruct.description": "مدل ۷۲B Qwen-VL جدیدترین نسخه از سوی علیبابا است که حاصل نزدیک به یک سال نوآوری میباشد.",
|
||
"accounts/fireworks/models/qwen2p5-72b-instruct.description": "Qwen2.5 یک سری مدل زبانی بزرگ فقط رمزگشا است که توسط تیم Qwen و علیبابا کلاد توسعه یافته و در اندازههای 0.5B، 1.5B، 3B، 7B، 14B، 32B و 72B با نسخههای پایه و تنظیمشده برای دستورالعملها ارائه میشود.",
|
||
"accounts/fireworks/models/qwen2p5-coder-32b-instruct.description": "Qwen2.5-Coder جدیدترین مدل زبانی بزرگ Qwen برای برنامهنویسی است (قبلاً با نام CodeQwen شناخته میشد). توجه: این مدل در حال حاضر بهصورت آزمایشی و بدون سرور ارائه میشود. برای استفاده در محیط تولید، توجه داشته باشید که Fireworks ممکن است این استقرار را بدون اطلاع قبلی متوقف کند.",
|
||
"accounts/yi-01-ai/models/yi-large.description": "Yi-Large یک مدل زبانی سطح بالا است که در رتبهبندی LMSYS درست پس از GPT-4، Gemini 1.5 Pro و Claude 3 Opus قرار دارد. این مدل در پشتیبانی از زبانهای چندگانه، بهویژه اسپانیایی، چینی، ژاپنی، آلمانی و فرانسوی، عملکرد برجستهای دارد. Yi-Large همچنین برای توسعهدهندگان مناسب است و از همان ساختار API مشابه OpenAI برای یکپارچهسازی آسان استفاده میکند.",
|
||
"ai21-jamba-1.5-large.description": "مدلی چندزبانه با ۳۹۸ میلیارد پارامتر (۹۴ میلیارد فعال) با پنجره متنی ۲۵۶ هزار توکن، قابلیت فراخوانی توابع، خروجی ساختاریافته و تولید مبتنی بر دادههای واقعی.",
|
||
"ai21-jamba-1.5-mini.description": "مدلی چندزبانه با ۵۲ میلیارد پارامتر (۱۲ میلیارد فعال) با پنجره متنی ۲۵۶ هزار توکن، قابلیت فراخوانی توابع، خروجی ساختاریافته و تولید مبتنی بر دادههای واقعی.",
|
||
"ai21-labs/AI21-Jamba-1.5-Large.description": "مدلی چندزبانه با ۳۹۸ میلیارد پارامتر (۹۴ میلیارد فعال) با پنجره متنی ۲۵۶ هزار توکن، قابلیت فراخوانی توابع، خروجی ساختاریافته و تولید مبتنی بر دادههای واقعی.",
|
||
"ai21-labs/AI21-Jamba-1.5-Mini.description": "مدلی چندزبانه با ۵۲ میلیارد پارامتر (۱۲ میلیارد فعال) با پنجره متنی ۲۵۶ هزار توکن، قابلیت فراخوانی توابع، خروجی ساختاریافته و تولید مبتنی بر دادههای واقعی.",
|
||
"alibaba/qwen-3-14b.description": "Qwen3 جدیدترین نسل از سری Qwen است که مجموعهای جامع از مدلهای متراکم و MoE را ارائه میدهد. این مدل بر پایه آموزش گسترده ساخته شده و در زمینههای استدلال، پیروی از دستورالعملها، قابلیتهای عاملمحور و پشتیبانی چندزبانه پیشرفتهای چشمگیری دارد.",
|
||
"alibaba/qwen-3-235b.description": "Qwen3 جدیدترین نسل از سری Qwen است که مجموعهای جامع از مدلهای متراکم و MoE را ارائه میدهد. این مدل بر پایه آموزش گسترده ساخته شده و در زمینههای استدلال، پیروی از دستورالعملها، قابلیتهای عاملمحور و پشتیبانی چندزبانه پیشرفتهای چشمگیری دارد.",
|
||
"alibaba/qwen-3-30b.description": "Qwen3 جدیدترین نسل از سری Qwen است که مجموعهای جامع از مدلهای متراکم و MoE را ارائه میدهد. این مدل بر پایه آموزش گسترده ساخته شده و در زمینههای استدلال، پیروی از دستورالعملها، قابلیتهای عاملمحور و پشتیبانی چندزبانه پیشرفتهای چشمگیری دارد.",
|
||
"alibaba/qwen-3-32b.description": "Qwen3 جدیدترین نسل از سری Qwen است که مجموعهای جامع از مدلهای متراکم و MoE را ارائه میدهد. این مدل بر پایه آموزش گسترده ساخته شده و در زمینههای استدلال، پیروی از دستورالعملها، قابلیتهای عاملمحور و پشتیبانی چندزبانه پیشرفتهای چشمگیری دارد.",
|
||
"alibaba/qwen3-coder.description": "Qwen3-Coder-480B-A35B-Instruct پیشرفتهترین مدل برنامهنویسی Qwen است که در وظایف کدنویسی عاملمحور، استفاده از مرورگر توسط عامل و سایر وظایف اصلی برنامهنویسی عملکردی قوی دارد و نتایجی در سطح Claude Sonnet ارائه میدهد.",
|
||
"amazon/nova-lite.description": "مدلی چندوجهی با هزینه بسیار پایین که ورودیهای تصویر، ویدیو و متن را با سرعت بسیار بالا پردازش میکند.",
|
||
"amazon/nova-micro.description": "مدلی فقط متنی با تأخیر بسیار پایین و هزینه بسیار کم.",
|
||
"amazon/nova-pro.description": "مدلی چندوجهی با قابلیت بالا که بهترین تعادل بین دقت، سرعت و هزینه را برای طیف گستردهای از وظایف ارائه میدهد.",
|
||
"amazon/titan-embed-text-v2.description": "Amazon Titan Text Embeddings V2 یک مدل جاسازی چندزبانه سبک و کارآمد است که از ابعاد ۱۰۲۴، ۵۱۲ و ۲۵۶ پشتیبانی میکند.",
|
||
"anthropic.claude-3-5-sonnet-20240620-v1:0.description": "Claude 3.5 Sonnet استاندارد صنعت را ارتقا داده و در ارزیابیهای گسترده از رقبا و Claude 3 Opus پیشی میگیرد، در حالی که سرعت و هزینه متوسط را حفظ میکند.",
|
||
"anthropic.claude-3-5-sonnet-20241022-v2:0.description": "Claude 3.5 Sonnet استاندارد صنعت را ارتقا داده و در ارزیابیهای گسترده از رقبا و Claude 3 Opus پیشی میگیرد، در حالی که سرعت و هزینه متوسط را حفظ میکند.",
|
||
"anthropic.claude-3-haiku-20240307-v1:0.description": "Claude 3 Haiku سریعترین و فشردهترین مدل Anthropic است که پاسخهای تقریباً فوری برای پرسشهای ساده ارائه میدهد. این مدل تجربهای روان و شبیه انسان را فراهم کرده و از ورودی تصویری با پنجره متنی ۲۰۰ هزار توکن پشتیبانی میکند.",
|
||
"anthropic.claude-3-opus-20240229-v1:0.description": "Claude 3 Opus قدرتمندترین مدل هوش مصنوعی Anthropic است که در وظایف بسیار پیچیده عملکردی در سطح پیشرفته دارد. این مدل درخواستهای باز و سناریوهای جدید را با روانی و درک انسانی استثنایی مدیریت میکند و از ورودی تصویری با پنجره متنی ۲۰۰ هزار توکن پشتیبانی میکند.",
|
||
"anthropic.claude-3-sonnet-20240229-v1:0.description": "Claude 3 Sonnet تعادلی بین هوش و سرعت برای بارهای کاری سازمانی فراهم میکند و ارزش بالایی را با هزینه کمتر ارائه میدهد. این مدل برای استقرار گسترده هوش مصنوعی طراحی شده و از ورودی تصویری با پنجره متنی ۲۰۰ هزار توکن پشتیبانی میکند.",
|
||
"anthropic.claude-instant-v1.description": "مدلی سریع، اقتصادی و در عین حال توانمند برای چت روزمره، تحلیل متن، خلاصهسازی و پرسش و پاسخ اسناد.",
|
||
"anthropic.claude-v2.description": "مدلی بسیار توانمند برای وظایف مختلف از گفتوگوی پیچیده و تولید خلاقانه تا پیروی دقیق از دستورالعملها.",
|
||
"anthropic.claude-v2:1.description": "نسخه بهروزشده Claude 2 با دو برابر پنجره متنی و بهبود در قابلیت اطمینان، کاهش توهمات و دقت مبتنی بر شواهد برای اسناد طولانی و بازیابی اطلاعات.",
|
||
"anthropic/claude-3-haiku.description": "Claude 3 Haiku سریعترین مدل Anthropic است که برای بارهای کاری سازمانی با درخواستهای طولانی طراحی شده است. این مدل میتواند اسناد بزرگ مانند گزارشهای فصلی، قراردادها یا پروندههای حقوقی را با نیمی از هزینه رقبا تحلیل کند.",
|
||
"anthropic/claude-3-opus.description": "Claude 3 Opus هوشمندترین مدل Anthropic است که در وظایف بسیار پیچیده عملکردی در سطح بازار دارد و درخواستهای باز و سناریوهای جدید را با روانی و درک انسانی استثنایی مدیریت میکند.",
|
||
"anthropic/claude-3.5-haiku.description": "Claude 3.5 Haiku دارای سرعت بیشتر، دقت بالاتر در کدنویسی و استفاده از ابزارها است و برای سناریوهایی با نیازهای بالا به سرعت و تعامل با ابزارها مناسب است.",
|
||
"anthropic/claude-3.5-sonnet.description": "Claude 3.5 Sonnet مدل سریع و کارآمد خانواده Sonnet است که عملکرد بهتری در کدنویسی و استدلال ارائه میدهد و برخی نسخههای آن به تدریج با Sonnet 3.7 و نسخههای بعدی جایگزین میشوند.",
|
||
"anthropic/claude-3.7-sonnet.description": "Claude 3.7 Sonnet نسخه ارتقایافته مدل Sonnet با استدلال و کدنویسی قویتر است که برای وظایف پیچیده در سطح سازمانی مناسب میباشد.",
|
||
"anthropic/claude-haiku-4.5.description": "Claude Haiku 4.5 مدل سریع با عملکرد بالا از Anthropic است که تأخیر بسیار کم را در کنار دقت بالا ارائه میدهد.",
|
||
"anthropic/claude-opus-4.1.description": "Opus 4.1 مدل سطح بالای Anthropic است که برای برنامهنویسی، استدلال پیچیده و وظایف طولانی بهینهسازی شده است.",
|
||
"anthropic/claude-opus-4.5.description": "Claude Opus 4.5 مدل پرچمدار Anthropic است که هوش سطح بالا را با عملکرد مقیاسپذیر برای وظایف پیچیده و استدلال با کیفیت بالا ترکیب میکند.",
|
||
"anthropic/claude-opus-4.description": "Opus 4 مدل پرچمدار Anthropic است که برای وظایف پیچیده و کاربردهای سازمانی طراحی شده است.",
|
||
"anthropic/claude-sonnet-4.5.description": "Claude Sonnet 4.5 جدیدترین مدل استدلال ترکیبی Anthropic است که برای استدلال پیچیده و کدنویسی بهینهسازی شده است.",
|
||
"anthropic/claude-sonnet-4.description": "Claude Sonnet 4 مدل استدلال ترکیبی Anthropic است که قابلیت تفکر و عدم تفکر را با هم ترکیب میکند.",
|
||
"ascend-tribe/pangu-pro-moe.description": "Pangu-Pro-MoE 72B-A16B یک مدل زبانی پراکنده با ۷۲ میلیارد پارامتر کل و ۱۶ میلیارد پارامتر فعال است که بر پایه معماری MoE گروهبندیشده (MoGE) ساخته شده است. این مدل با گروهبندی متخصصان در زمان انتخاب و محدود کردن فعالسازی توکنها به تعداد مساوی متخصص در هر گروه، تعادل بار را حفظ کرده و بهرهوری استقرار را در پلتفرم Ascend بهبود میبخشد.",
|
||
"aya.description": "Aya 23 مدل چندزبانه شرکت Cohere است که از ۲۳ زبان برای کاربردهای متنوع پشتیبانی میکند.",
|
||
"aya:35b.description": "Aya 23 مدل چندزبانه شرکت Cohere است که از ۲۳ زبان برای کاربردهای متنوع پشتیبانی میکند.",
|
||
"azure-DeepSeek-R1-0528.description": "این مدل توسط مایکروسافت استقرار یافته است؛ DeepSeek R1 به نسخه DeepSeek-R1-0528 ارتقا یافته است. این بهروزرسانی با افزایش توان محاسباتی و بهینهسازی الگوریتمهای پسآموزش، عمق استدلال و استنتاج را بهطور چشمگیری بهبود میبخشد. عملکرد آن در آزمونهای ریاضی، برنامهنویسی و منطق عمومی بسیار قوی است و به مدلهای پیشرو مانند O3 و Gemini 2.5 Pro نزدیک میشود.",
|
||
"baichuan-m2-32b.description": "Baichuan M2 32B یک مدل MoE از شرکت Baichuan Intelligence است که در استدلال عملکرد قدرتمندی دارد.",
|
||
"baichuan/baichuan2-13b-chat.description": "Baichuan-13B یک مدل زبانی منبعباز با ۱۳ میلیارد پارامتر است که برای استفاده تجاری نیز مجاز است. این مدل در آزمونهای معتبر چینی و انگلیسی، بهترین نتایج را در میان مدلهای همرده خود کسب کرده است.",
|
||
"baidu/ERNIE-4.5-300B-A47B.description": "ERNIE-4.5-300B-A47B یک مدل MoE از شرکت Baidu با ۳۰۰ میلیارد پارامتر کل و ۴۷ میلیارد پارامتر فعال به ازای هر توکن است که تعادل بین عملکرد قوی و بهرهوری محاسباتی را برقرار میکند. این مدل بهعنوان هسته اصلی ERNIE 4.5 در درک، تولید، استدلال و برنامهنویسی بسیار توانمند است. با استفاده از روش پیشآموزش چندوجهی ناهمگن MoE و آموزش مشترک متن-تصویر، توانایی کلی خود را بهویژه در پیروی از دستورالعملها و دانش عمومی افزایش داده است.",
|
||
"baidu/ernie-5.0-thinking-preview.description": "پیشنمایش مدل ERNIE 5.0 Thinking نسل بعدی مدل چندوجهی بومی شرکت Baidu است که در درک چندوجهی، پیروی از دستورالعملها، تولید محتوا، پرسش و پاسخ واقعی و استفاده از ابزارها عملکرد بسیار خوبی دارد.",
|
||
"big-pickle.description": "Big Pickle از OpenCode — یک مدل متنباز رایگان با تواناییهای قوی در کدنویسی.",
|
||
"black-forest-labs/flux-1.1-pro.description": "FLUX 1.1 Pro نسخه سریعتر و بهبودیافته FLUX Pro است که کیفیت تصویر عالی و تبعیت دقیق از دستورات را ارائه میدهد.",
|
||
"black-forest-labs/flux-dev.description": "FLUX Dev نسخه توسعهای مدل FLUX برای استفاده غیرتجاری است.",
|
||
"black-forest-labs/flux-pro.description": "FLUX Pro مدل حرفهای FLUX برای تولید تصاویر با کیفیت بالا است.",
|
||
"black-forest-labs/flux-schnell.description": "FLUX Schnell یک مدل تولید تصویر سریع است که برای سرعت بهینهسازی شده است.",
|
||
"c4ai-aya-expanse-32b.description": "Aya Expanse یک مدل چندزبانه قدرتمند با ۳۲ میلیارد پارامتر است که با استفاده از تنظیمات دستوری، انتخاب داده، آموزش ترجیحی و ادغام مدلها، عملکردی در حد مدلهای تکزبانه ارائه میدهد. این مدل از ۲۳ زبان پشتیبانی میکند.",
|
||
"c4ai-aya-expanse-8b.description": "Aya Expanse یک مدل چندزبانه قدرتمند با ۸ میلیارد پارامتر است که با استفاده از تنظیمات دستوری، انتخاب داده، آموزش ترجیحی و ادغام مدلها، عملکردی در حد مدلهای تکزبانه ارائه میدهد. این مدل از ۲۳ زبان پشتیبانی میکند.",
|
||
"c4ai-aya-vision-32b.description": "Aya Vision یک مدل چندوجهی پیشرفته است که در آزمونهای کلیدی زبان، متن و تصویر عملکرد بسیار خوبی دارد. این نسخه ۳۲ میلیاردی بر عملکرد چندزبانه سطح بالا تمرکز دارد و از ۲۳ زبان پشتیبانی میکند.",
|
||
"c4ai-aya-vision-8b.description": "Aya Vision یک مدل چندوجهی پیشرفته است که در آزمونهای کلیدی زبان، متن و تصویر عملکرد بسیار خوبی دارد. این نسخه ۸ میلیاردی بر تأخیر کم و عملکرد قوی تمرکز دارد.",
|
||
"charglm-3.description": "CharGLM-3 برای نقشآفرینی و همراهی احساسی طراحی شده است و از حافظه چندنوبتی بسیار طولانی و گفتوگوی شخصیسازیشده پشتیبانی میکند.",
|
||
"charglm-4.description": "CharGLM-4 برای نقشآفرینی و همراهی احساسی طراحی شده است و از حافظه چندنوبتی بسیار طولانی و گفتوگوی شخصیسازیشده پشتیبانی میکند.",
|
||
"chatgpt-4o-latest.description": "ChatGPT-4o یک مدل پویا است که بهصورت لحظهای بهروزرسانی میشود. این مدل ترکیبی از درک زبان قوی و تولید محتوا برای موارد استفاده گسترده مانند پشتیبانی مشتری، آموزش و کمک فنی ارائه میدهد.",
|
||
"claude-2.0.description": "Claude 2 بهبودهای کلیدی برای سازمانها ارائه میدهد، از جمله زمینه ۲۰۰ هزار توکنی پیشرو، کاهش توهمات، دستورات سیستمی و ویژگی آزمایشی جدید: فراخوانی ابزار.",
|
||
"claude-2.1.description": "Claude 2 بهبودهای کلیدی برای سازمانها ارائه میدهد، از جمله زمینه ۲۰۰ هزار توکنی پیشرو، کاهش توهمات، دستورات سیستمی و ویژگی آزمایشی جدید: فراخوانی ابزار.",
|
||
"claude-3-5-haiku-20241022.description": "Claude 3.5 Haiku سریعترین مدل نسل بعدی Anthropic است. در مقایسه با Claude 3 Haiku، در مهارتها بهبود یافته و در بسیاری از معیارهای هوش از مدل قبلی Claude 3 Opus پیشی میگیرد.",
|
||
"claude-3-5-haiku-latest.description": "Claude 3.5 Haiku پاسخهای سریع برای وظایف سبک ارائه میدهد.",
|
||
"claude-3-5-haiku.description": "Claude Haiku 3.5 از Anthropic — مدلی سریع و مقرونبهصرفه با پشتیبانی از پردازش تصویری.",
|
||
"claude-3-7-sonnet-20250219.description": "Claude 3.7 Sonnet هوشمندترین مدل Anthropic و اولین مدل استدلال ترکیبی در بازار است. این مدل میتواند پاسخهای تقریباً فوری یا استدلال گامبهگام طولانی ارائه دهد که کاربران میتوانند آن را مشاهده کنند. Sonnet بهویژه در کدنویسی، علم داده، وظایف تصویری و عاملها قوی است.",
|
||
"claude-3-7-sonnet-latest.description": "Claude 3.7 Sonnet جدیدترین و توانمندترین مدل Anthropic برای وظایف بسیار پیچیده است که در عملکرد، هوش، روانی و درک زبان برتری دارد.",
|
||
"claude-3-haiku-20240307.description": "Claude 3 Haiku سریعترین و فشردهترین مدل Anthropic است که برای پاسخهای تقریباً فوری با عملکرد سریع و دقیق طراحی شده است.",
|
||
"claude-3-opus-20240229.description": "Claude 3 Opus قدرتمندترین مدل Anthropic برای وظایف بسیار پیچیده است که در عملکرد، هوش، روانی و درک زبان برتری دارد.",
|
||
"claude-3-sonnet-20240229.description": "Claude 3 Sonnet تعادل بین هوش و سرعت را برای بارهای کاری سازمانی برقرار میکند و با هزینه کمتر، بهرهوری بالا و استقرار قابل اعتماد در مقیاس وسیع را ارائه میدهد.",
|
||
"claude-haiku-4-5-20251001.description": "Claude Haiku 4.5 سریعترین و هوشمندترین مدل Haiku از Anthropic است، با سرعتی چشمگیر و استدلال تقویتشده.",
|
||
"claude-haiku-4-5.description": "Claude Haiku 4.5 از Anthropic — نسل جدید Haiku با استدلال و پردازش تصویری پیشرفته.",
|
||
"claude-haiku-4.5.description": "Claude Haiku 4.5 سریعترین و هوشمندترین مدل Haiku از Anthropic است که با سرعت برقآسا و توانایی استدلال پیشرفته ارائه میشود.",
|
||
"claude-opus-4-1-20250805-thinking.description": "Claude Opus 4.1 Thinking یک نسخه پیشرفته است که میتواند فرآیند استدلال خود را آشکار کند.",
|
||
"claude-opus-4-1-20250805.description": "Claude Opus 4.1 جدیدترین و توانمندترین مدل Anthropic برای وظایف بسیار پیچیده است و در عملکرد، هوشمندی، روانی و درک پیشتاز است.",
|
||
"claude-opus-4-1.description": "Claude Opus 4.1 از Anthropic — مدل استدلال سطحبالا با توانایی تحلیل عمیق.",
|
||
"claude-opus-4-20250514.description": "Claude Opus 4 قدرتمندترین مدل Anthropic برای وظایف بسیار پیچیده است و در عملکرد، هوشمندی، روانی و درک زبان برتر است.",
|
||
"claude-opus-4-5-20251101.description": "Claude Opus 4.5 مدل پرچمدار Anthropic است که هوش برجسته را با عملکرد مقیاسپذیر ترکیب میکند و برای وظایف پیچیدهای که نیاز به پاسخهای باکیفیت و استدلال دارند، ایدهآل است.",
|
||
"claude-opus-4-5.description": "Claude Opus 4.5 از Anthropic — مدل پرچمدار با استدلال و کدنویسی سطحبالا.",
|
||
"claude-opus-4-6.description": "Claude Opus 4.6 از Anthropic — مدل پرچمدار با پنجره زمینه ۱ میلیون و توانایی استدلال پیشرفته.",
|
||
"claude-opus-4-7.description": "Claude Opus 4.7 از Anthropic — جدیدترین نسخه Opus با استدلال و کدنویسی پیشرفته.",
|
||
"claude-opus-4.5.description": "Claude Opus 4.5 مدل پرچمدار Anthropic است که هوش برتر را با عملکرد مقیاسپذیر برای وظایف پیچیده و استدلال با کیفیت بالا ترکیب میکند.",
|
||
"claude-opus-4.6-fast.description": "Claude Opus 4.6 هوشمندترین مدل Anthropic برای ساخت عوامل و کدنویسی است.",
|
||
"claude-opus-4.6.description": "Claude Opus 4.6 هوشمندترین مدل Anthropic برای ساخت عوامل و کدنویسی است.",
|
||
"claude-sonnet-4-20250514-thinking.description": "Claude Sonnet 4 Thinking میتواند پاسخهای تقریباً فوری یا تفکر گامبهگام طولانی با فرآیند قابل مشاهده تولید کند.",
|
||
"claude-sonnet-4-20250514.description": "Claude Sonnet 4 میتواند پاسخهای تقریباً فوری یا استدلال مرحلهبهمرحله با فرایند قابل مشاهده تولید کند.",
|
||
"claude-sonnet-4-5-20250929.description": "Claude Sonnet 4.5 هوشمندترین مدل Anthropic تا به امروز است.",
|
||
"claude-sonnet-4-5.description": "Claude Sonnet 4.5 از Anthropic — نسخه بهبودیافته Sonnet با عملکرد بهتر در کدنویسی.",
|
||
"claude-sonnet-4-6.description": "Claude Sonnet 4.6 از Anthropic — جدیدترین Sonnet با کدنویسی برتر و استفاده بهتر از ابزار.",
|
||
"claude-sonnet-4.5.description": "Claude Sonnet 4.5 هوشمندترین مدل Anthropic تا به امروز است.",
|
||
"claude-sonnet-4.6.description": "Claude Sonnet 4.6 بهترین ترکیب از سرعت و هوش را ارائه میدهد.",
|
||
"claude-sonnet-4.description": "Claude Sonnet 4 از Anthropic — مدلی متعادل با توانایی قوی در کدنویسی و استدلال.",
|
||
"codegeex-4.description": "CodeGeeX-4 یک دستیار هوش مصنوعی قدرتمند برای برنامهنویسی است که از پرسش و پاسخ چندزبانه و تکمیل کد پشتیبانی میکند تا بهرهوری توسعهدهندگان را افزایش دهد.",
|
||
"codegeex4-all-9b.description": "CodeGeeX4-ALL-9B یک مدل تولید کد چندزبانه است که از تکمیل و تولید کد، مفسر کد، جستجوی وب، فراخوانی توابع و پرسش و پاسخ در سطح مخزن پشتیبانی میکند و طیف گستردهای از سناریوهای توسعه نرمافزار را پوشش میدهد. این مدل یکی از بهترین مدلهای کد زیر ۱۰ میلیارد پارامتر است.",
|
||
"codegemma.description": "CodeGemma یک مدل سبک برای وظایف متنوع برنامهنویسی است که امکان تکرار سریع و یکپارچهسازی آسان را فراهم میکند.",
|
||
"codegemma:2b.description": "CodeGemma یک مدل سبک برای وظایف متنوع برنامهنویسی است که امکان تکرار سریع و یکپارچهسازی آسان را فراهم میکند.",
|
||
"codellama.description": "Code Llama یک مدل زبانی بزرگ متمرکز بر تولید و بحث در مورد کد است که از زبانهای مختلف برای جریانهای کاری توسعهدهندگان پشتیبانی میکند.",
|
||
"codellama/CodeLlama-34b-Instruct-hf.description": "Code Llama یک مدل زبانی بزرگ متمرکز بر تولید و بحث در مورد کد است که از زبانهای مختلف برای جریانهای کاری توسعهدهندگان پشتیبانی میکند.",
|
||
"codellama:13b.description": "Code Llama یک مدل زبانی بزرگ متمرکز بر تولید و بحث در مورد کد است که از زبانهای مختلف برای جریانهای کاری توسعهدهندگان پشتیبانی میکند.",
|
||
"codellama:34b.description": "Code Llama یک مدل زبانی بزرگ متمرکز بر تولید و بحث در مورد کد است که از زبانهای مختلف برای جریانهای کاری توسعهدهندگان پشتیبانی میکند.",
|
||
"codellama:70b.description": "Code Llama یک مدل زبانی بزرگ متمرکز بر تولید و بحث در مورد کد است که از زبانهای مختلف برای جریانهای کاری توسعهدهندگان پشتیبانی میکند.",
|
||
"codeqwen.description": "CodeQwen1.5 یک مدل زبانی بزرگ است که بر پایه دادههای گسترده کد آموزش دیده و برای وظایف پیچیده برنامهنویسی طراحی شده است.",
|
||
"codestral-latest.description": "Codestral پیشرفتهترین مدل کدنویسی ماست؛ نسخه v2 (ژانویه ۲۰۲۵) برای وظایف با تأخیر کم و فرکانس بالا مانند FIM، اصلاح کد و تولید تست بهینه شده است.",
|
||
"codestral.description": "Codestral اولین مدل کدنویسی از Mistral AI است که پشتیبانی قوی برای تولید کد ارائه میدهد.",
|
||
"cogito-2.1:671b.description": "Cogito v2.1 671B یک مدل زبان بازمتن آمریکایی است که برای استفاده تجاری رایگان است. این مدل عملکردی در حد مدلهای برتر دارد، بازدهی بالای استدلال با توکن، زمینه طولانی ۱۲۸هزار توکنی و توانایی کلی قوی ارائه میدهد.",
|
||
"cogvideox-2.description": "CogVideoX-2 مدل پایه تولید ویدئو نسل جدید Zhipu است، با قابلیتهای تصویر به ویدئو که 38٪ بهبود یافتهاند. این مدل بهبودهای قابل توجهی در مدیریت حرکتهای بزرگ، پایداری بصری، پیروی از دستورالعملها، سبک هنری و زیباییشناسی کلی بصری ارائه میدهد.",
|
||
"cogvideox-3.description": "CogVideoX-3 ویژگی تولید فریمهای شروع و پایان را اضافه میکند، که به طور قابل توجهی پایداری و وضوح بصری را بهبود میبخشد. این مدل حرکتهای بزرگ و طبیعی سوژه را ممکن میسازد، پیروی بهتر از دستورالعملها و شبیهسازی فیزیکی واقعیتر را ارائه میدهد، و عملکرد در صحنههای واقعگرایانه با وضوح بالا و سبک سهبعدی را بیشتر بهبود میبخشد.",
|
||
"cogvideox-flash.description": "CogVideoX-Flash یک مدل تولید ویدئو رایگان منتشر شده توسط Zhipu است، که قادر به تولید ویدئوهایی است که دستورالعملهای کاربر را دنبال میکنند و در عین حال امتیازات کیفیت زیباییشناسی بالاتری را به دست میآورند.",
|
||
"cogview-3-flash.description": "CogView-3-Flash یک مدل تولید تصویر رایگان است که توسط Zhipu ارائه شده است. این مدل تصاویر را مطابق با دستورالعملهای کاربران تولید میکند و در عین حال امتیازات کیفیت زیباییشناسی بالاتری را به دست میآورد. CogView-3-Flash عمدتاً در زمینههایی مانند خلق هنری، مرجع طراحی، توسعه بازی و واقعیت مجازی استفاده میشود و به کاربران کمک میکند تا توضیحات متنی را به سرعت به تصاویر تبدیل کنند.",
|
||
"cogview-4.description": "CogView-4 نخستین مدل متن به تصویر بازمتن Zhipu است که توانایی تولید نویسههای چینی را دارد. این مدل درک معنایی، کیفیت تصویر و رندر متن چینی/انگلیسی را بهبود میبخشد، از دستورات دو زبانه با طول دلخواه پشتیبانی میکند و میتواند تصاویر را در هر وضوحی در محدوده مشخص تولید کند.",
|
||
"cohere-command-r-plus.description": "Command R+ یک مدل پیشرفته بهینهشده برای RAG است که برای بارهای کاری سازمانی طراحی شده است.",
|
||
"cohere-command-r.description": "Command R یک مدل مولد مقیاسپذیر است که برای استفاده در RAG و ابزارها طراحی شده و هوش مصنوعی در سطح تولید را ممکن میسازد.",
|
||
"cohere/Cohere-command-r-plus.description": "Command R+ یک مدل پیشرفته بهینهشده برای RAG است که برای بارهای کاری سازمانی طراحی شده است.",
|
||
"cohere/Cohere-command-r.description": "Command R یک مدل مولد مقیاسپذیر است که برای استفاده در RAG و ابزارها طراحی شده و هوش مصنوعی در سطح تولید را ممکن میسازد.",
|
||
"cohere/command-a.description": "Command A قویترین مدل Cohere تا به امروز است که در استفاده از ابزارها، عاملها، RAG و کاربردهای چندزبانه برتری دارد. این مدل دارای طول زمینه ۲۵۶هزار توکن است، تنها با دو GPU اجرا میشود و ۱۵۰٪ بازدهی بالاتری نسبت به Command R+ 08-2024 دارد.",
|
||
"cohere/embed-v4.0.description": "مدلی برای طبقهبندی یا تبدیل متن، تصویر یا محتوای ترکیبی به بردارهای تعبیهشده.",
|
||
"comfyui/flux-dev.description": "FLUX.1 Dev یک مدل متن به تصویر با کیفیت بالا (۱۰ تا ۵۰ مرحله) است که برای خروجیهای خلاقانه و هنری ممتاز ایدهآل است.",
|
||
"comfyui/flux-kontext-dev.description": "FLUX.1 Kontext-dev یک مدل ویرایش تصویر است که از ویرایشهای هدایتشده با متن، از جمله ویرایشهای محلی و انتقال سبک پشتیبانی میکند.",
|
||
"comfyui/flux-krea-dev.description": "FLUX.1 Krea-dev یک مدل متن به تصویر با فیلترهای ایمنی داخلی است که با همکاری Krea توسعه یافته است.",
|
||
"comfyui/flux-schnell.description": "FLUX.1 Schnell یک مدل متن به تصویر فوقسریع است که تصاویر با کیفیت بالا را در ۱ تا ۴ مرحله تولید میکند و برای استفاده بلادرنگ و نمونهسازی سریع ایدهآل است.",
|
||
"comfyui/stable-diffusion-15.description": "Stable Diffusion 1.5 یک مدل کلاسیک متن به تصویر با وضوح ۵۱۲x۵۱۲ است که برای نمونهسازی سریع و آزمایشهای خلاقانه مناسب است.",
|
||
"comfyui/stable-diffusion-35-inclclip.description": "Stable Diffusion 3.5 با رمزگذارهای داخلی CLIP/T5 نیازی به فایلهای رمزگذار خارجی ندارد و برای مدلهایی مانند sd3.5_medium_incl_clips با مصرف منابع کمتر مناسب است.",
|
||
"comfyui/stable-diffusion-35.description": "Stable Diffusion 3.5 یک مدل نسل جدید متن به تصویر است که در دو نسخه بزرگ و متوسط ارائه میشود. این مدل به فایلهای رمزگذار CLIP خارجی نیاز دارد و کیفیت تصویر عالی و تبعیت دقیق از دستورات را ارائه میدهد.",
|
||
"comfyui/stable-diffusion-custom-refiner.description": "مدل تصویر به تصویر SDXL سفارشی. از custom_sd_lobe.safetensors به عنوان نام فایل مدل استفاده کنید؛ اگر VAE دارید، از custom_sd_vae_lobe.safetensors استفاده کنید. فایلهای مدل را در پوشههای مورد نیاز Comfy قرار دهید.",
|
||
"comfyui/stable-diffusion-custom.description": "مدل متن به تصویر SD سفارشی. از custom_sd_lobe.safetensors به عنوان نام فایل مدل استفاده کنید؛ اگر VAE دارید، از custom_sd_vae_lobe.safetensors استفاده کنید. فایلهای مدل را در پوشههای مورد نیاز Comfy قرار دهید.",
|
||
"comfyui/stable-diffusion-refiner.description": "مدل تصویر به تصویر SDXL که تبدیلهای با کیفیت بالا از تصاویر ورودی انجام میدهد و از انتقال سبک، بازسازی و تغییرات خلاقانه پشتیبانی میکند.",
|
||
"comfyui/stable-diffusion-xl.description": "SDXL یک مدل متن به تصویر است که از تولید تصاویر با وضوح بالا ۱۰۲۴x۱۰۲۴ پشتیبانی میکند و کیفیت و جزئیات تصویر بهتری ارائه میدهد.",
|
||
"command-a-03-2025.description": "Command A توانمندترین مدل ما تا به امروز است که در استفاده از ابزارها، عاملها، RAG و سناریوهای چندزبانه برتری دارد. این مدل دارای پنجره زمینه ۲۵۶هزار توکن است، تنها با دو GPU اجرا میشود و ۱۵۰٪ بازدهی بالاتری نسبت به Command R+ 08-2024 دارد.",
|
||
"command-light-nightly.description": "برای کاهش فاصله بین نسخههای اصلی، نسخههای شبانه Command را ارائه میدهیم. برای سری command-light، این نسخه command-light-nightly نام دارد. این نسخه جدیدترین و آزمایشیترین (و احتمالاً ناپایدارترین) نسخه است که بهطور منظم و بدون اطلاع بهروزرسانی میشود، بنابراین برای استفاده در تولید توصیه نمیشود.",
|
||
"command-light.description": "نسخهای کوچکتر و سریعتر از Command که تقریباً به همان اندازه توانمند است اما سریعتر عمل میکند.",
|
||
"command-nightly.description": "برای کاهش فاصله بین نسخههای اصلی، نسخههای شبانه Command را ارائه میدهیم. برای سری Command، این نسخه command-nightly نام دارد. این نسخه جدیدترین و آزمایشیترین (و احتمالاً ناپایدارترین) نسخه است که بهطور منظم و بدون اطلاع بهروزرسانی میشود، بنابراین برای استفاده در تولید توصیه نمیشود.",
|
||
"command-r-03-2024.description": "command-r یک مدل چت پیروی از دستورالعمل است که وظایف زبانی را با کیفیت بالاتر، قابلیت اطمینان بهبود یافته و زمینه طولانیتر نسبت به مدلهای قبلی انجام میدهد. این مدل از جریانهای کاری پیچیده مانند تولید کد، RAG، استفاده از ابزار و عوامل پشتیبانی میکند.",
|
||
"command-r-08-2024.description": "command-r-08-2024 نسخه بهروزرسانیشده مدل Command R است که در آگوست ۲۰۲۴ منتشر شده است.",
|
||
"command-r-plus-04-2024.description": "command-r-plus نام مستعار command-r-plus-04-2024 است، بنابراین استفاده از command-r-plus در API به آن مدل اشاره دارد.",
|
||
"command-r-plus-08-2024.description": "Command R+ یک مدل چت پیرو دستورالعمل است که کیفیت بالاتر، قابلیت اطمینان بیشتر و پنجره زمینه طولانیتری نسبت به مدلهای قبلی دارد. این مدل برای جریانهای کاری پیچیده RAG و استفاده چندمرحلهای از ابزارها بهترین گزینه است.",
|
||
"command-r-plus.description": "Command R+ یک مدل زبان بزرگ با عملکرد بالا است که برای سناریوهای واقعی سازمانی و برنامههای پیچیده طراحی شده است.",
|
||
"command-r.description": "Command R یک مدل زبان بزرگ بهینهشده برای چت و وظایف با زمینه طولانی است که برای تعامل پویا و مدیریت دانش ایدهآل است.",
|
||
"command-r7b-12-2024.description": "command-r7b-12-2024 یک بهروزرسانی کوچک و کارآمد است که در دسامبر ۲۰۲۴ منتشر شده است. این مدل در RAG، استفاده از ابزار و وظایف عاملها که نیاز به استدلال پیچیده و چندمرحلهای دارند، عملکرد عالی دارد.",
|
||
"command.description": "مدل چت پیرو دستورالعمل که کیفیت و قابلیت اطمینان بالاتری در وظایف زبانی ارائه میدهد و پنجره زمینه طولانیتری نسبت به مدلهای مولد پایه ما دارد.",
|
||
"computer-use-preview.description": "computer-use-preview یک مدل تخصصی برای ابزار «استفاده از رایانه» است که برای درک و اجرای وظایف مرتبط با رایانه آموزش دیده است.",
|
||
"dall-e-2.description": "مدل نسل دوم DALL·E با تولید تصاویر واقعگرایانهتر، دقیقتر و وضوحی ۴ برابر بیشتر از نسل اول.",
|
||
"dall-e-3.description": "جدیدترین مدل DALL·E که در نوامبر ۲۰۲۳ منتشر شد و از تولید تصاویر واقعگرایانهتر، دقیقتر و با جزئیات قویتر پشتیبانی میکند.",
|
||
"databricks/dbrx-instruct.description": "DBRX Instruct مدیریت دستورالعملها را با قابلیت اطمینان بالا در صنایع مختلف ارائه میدهد.",
|
||
"deepseek-ai/DeepSeek-OCR.description": "DeepSeek-OCR یک مدل بینایی-زبانی از DeepSeek AI است که بر OCR و «فشردهسازی نوری متنی» تمرکز دارد. این مدل با فشردهسازی اطلاعات متنی از تصاویر، اسناد را بهطور کارآمد پردازش کرده و به متن ساختاریافته (مانند Markdown) تبدیل میکند. این مدل در شناسایی دقیق متن در تصاویر عملکرد بالایی دارد و برای دیجیتالیسازی اسناد، استخراج متن و پردازش ساختاریافته مناسب است.",
|
||
"deepseek-ai/DeepSeek-R1-0528-Qwen3-8B.description": "DeepSeek-R1-0528-Qwen3-8B زنجیره تفکر را از DeepSeek-R1-0528 به Qwen3 8B Base منتقل میکند. این مدل در میان مدلهای متنباز به SOTA رسیده، در AIME 2024 نسبت به Qwen3 8B ده درصد بهتر عمل کرده و عملکردی همسطح با Qwen3-235B-thinking دارد. در استدلال ریاضی، برنامهنویسی و منطق عمومی عملکرد درخشانی دارد. معماری آن مشابه Qwen3-8B است اما از توکنایزر DeepSeek-R1-0528 استفاده میکند.",
|
||
"deepseek-ai/DeepSeek-R1-0528.description": "DeepSeek R1 با استفاده از منابع محاسباتی بیشتر و بهینهسازیهای الگوریتمی پس از آموزش، توانایی استدلال را تعمیق میبخشد. این مدل در معیارهای ریاضی، برنامهنویسی و منطق عمومی عملکرد قوی دارد و به سطح مدلهای پیشرو مانند o3 و Gemini 2.5 Pro نزدیک میشود.",
|
||
"deepseek-ai/DeepSeek-R1-Distill-Llama-70B.description": "مدلهای تقطیرشده DeepSeek-R1 با استفاده از یادگیری تقویتی و دادههای شروع سرد، توانایی استدلال را بهبود داده و معیارهای چندوظیفهای جدیدی را در مدلهای متنباز ثبت میکنند.",
|
||
"deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B.description": "مدلهای تقطیرشده DeepSeek-R1 با استفاده از یادگیری تقویتی و دادههای شروع سرد، توانایی استدلال را بهبود داده و معیارهای چندوظیفهای جدیدی را در مدلهای متنباز ثبت میکنند.",
|
||
"deepseek-ai/DeepSeek-R1-Distill-Qwen-14B.description": "مدلهای تقطیرشده DeepSeek-R1 با استفاده از یادگیری تقویتی و دادههای شروع سرد، توانایی استدلال را بهبود داده و معیارهای چندوظیفهای جدیدی را در مدلهای متنباز ثبت میکنند.",
|
||
"deepseek-ai/DeepSeek-R1-Distill-Qwen-32B.description": "DeepSeek-R1-Distill-Qwen-32B از Qwen2.5-32B تقطیر شده و با ۸۰۰ هزار نمونه انتخابشده از DeepSeek-R1 آموزش دیده است. این مدل در ریاضی، برنامهنویسی و استدلال عملکرد درخشانی دارد و نتایج قویای در AIME 2024، MATH-500 (با دقت ۹۴.۳٪) و GPQA Diamond کسب کرده است.",
|
||
"deepseek-ai/DeepSeek-R1-Distill-Qwen-7B.description": "DeepSeek-R1-Distill-Qwen-7B از Qwen2.5-Math-7B استخراج شده و بر روی 800 هزار نمونه DeepSeek-R1 منتخب تنظیم شده است. این مدل عملکرد قوی دارد، با 92.8٪ در MATH-500، 55.5٪ در AIME 2024 و رتبه 1189 CodeForces برای یک مدل 7 میلیاردی.",
|
||
"deepseek-ai/DeepSeek-R1.description": "DeepSeek-R1 با استفاده از دادههای شروع سرد پیش از یادگیری تقویتی، توانایی استدلال را بهبود داده و معیارهای چندوظیفهای جدیدی را در مدلهای متنباز ثبت کرده و از OpenAI-o1-mini پیشی گرفته است.",
|
||
"deepseek-ai/DeepSeek-V2.5.description": "DeepSeek-V2.5 نسخه ارتقاءیافته DeepSeek-V2-Chat و DeepSeek-Coder-V2-Instruct است که تواناییهای عمومی و برنامهنویسی را ترکیب میکند. این مدل در نوشتن و پیروی از دستورالعملها بهبود یافته و در معیارهایی مانند AlpacaEval 2.0، ArenaHard، AlignBench و MT-Bench پیشرفت چشمگیری نشان داده است.",
|
||
"deepseek-ai/DeepSeek-V3.1-Terminus.description": "DeepSeek-V3.1-Terminus نسخه بهروزشده مدل V3.1 است که بهعنوان یک عامل ترکیبی LLM طراحی شده است. این مدل مشکلات گزارششده کاربران را رفع کرده، ثبات و سازگاری زبانی را بهبود بخشیده و نویسههای غیرعادی و ترکیب چینی/انگلیسی را کاهش داده است. این مدل حالتهای تفکر و غیرتفکر را با قالبهای چت ترکیب کرده و امکان جابجایی انعطافپذیر را فراهم میکند. همچنین عملکرد عامل کدنویسی و جستجو را برای استفاده مطمئنتر از ابزارها و انجام وظایف چندمرحلهای بهبود داده است.",
|
||
"deepseek-ai/DeepSeek-V3.1.description": "DeepSeek V3.1 از معماری استدلال ترکیبی استفاده میکند و از هر دو حالت تفکر و غیرتفکر پشتیبانی میکند.",
|
||
"deepseek-ai/DeepSeek-V3.2-Exp.description": "DeepSeek V3.2 Exp از یک معماری استدلال ترکیبی استفاده میکند و از هر دو حالت تفکر و غیرتفکر پشتیبانی میکند.",
|
||
"deepseek-ai/DeepSeek-V3.2.description": "DeepSeek-V3.2 مدلی است که کارایی محاسباتی بالا را با استدلال و عملکرد عامل عالی ترکیب میکند. رویکرد آن بر سه پیشرفت کلیدی فناوری استوار است: DeepSeek Sparse Attention (DSA)، یک مکانیزم توجه کارآمد که پیچیدگی محاسباتی را به طور قابل توجهی کاهش میدهد در حالی که عملکرد مدل را حفظ میکند و به طور خاص برای سناریوهای با زمینه طولانی بهینه شده است؛ یک چارچوب یادگیری تقویتی مقیاسپذیر که از طریق آن عملکرد مدل میتواند با GPT-5 رقابت کند و نسخه با محاسبات بالا آن میتواند با Gemini-3.0-Pro در قابلیتهای استدلال رقابت کند؛ و یک خط لوله سنتز وظایف عامل در مقیاس بزرگ که با هدف ادغام قابلیتهای استدلال در سناریوهای استفاده از ابزار طراحی شده است و در نتیجه پیروی از دستورالعملها و تعمیم در محیطهای تعاملی پیچیده را بهبود میبخشد. این مدل عملکرد مدال طلا را در المپیاد بینالمللی ریاضی (IMO) و المپیاد بینالمللی انفورماتیک (IOI) سال 2025 به دست آورد.",
|
||
"deepseek-ai/DeepSeek-V3.description": "DeepSeek-V3 یک مدل MoE با ۶۷۱ میلیارد پارامتر است که از MLA و DeepSeekMoE با تعادل بار بدون اتلاف برای آموزش و استنتاج کارآمد استفاده میکند. این مدل با استفاده از ۱۴.۸ تریلیون توکن با کیفیت بالا و آموزش با SFT و RL، از سایر مدلهای متنباز پیشی گرفته و به مدلهای بسته پیشرو نزدیک شده است.",
|
||
"deepseek-ai/deepseek-llm-67b-chat.description": "DeepSeek LLM Chat (67B) یک مدل نوآورانه با درک عمیق زبان و تعامل است.",
|
||
"deepseek-ai/deepseek-v3.1-terminus.description": "DeepSeek V3.1 یک مدل استدلال نسل بعدی با توانایی استدلال پیچیده و زنجیره تفکر برای وظایف تحلیلی عمیق است.",
|
||
"deepseek-ai/deepseek-v3.1.description": "DeepSeek V3.1 یک مدل استدلال نسل بعدی با توانایی استدلال پیچیده و زنجیره تفکر برای وظایف تحلیلی عمیق است.",
|
||
"deepseek-ai/deepseek-v3.2.description": "DeepSeek V3.2 یک مدل استدلال نسل بعدی با قابلیتهای استدلال پیچیدهتر و زنجیرهای از تفکر است.",
|
||
"deepseek-chat.description": "مدلی متنباز جدید که تواناییهای عمومی و کدنویسی را ترکیب میکند. قابلیتهای گفتوگویی مدل چت و تواناییهای قوی مدل کدنویسی را حفظ کرده و همسوسازی ترجیحی بهتری ارائه میدهد. DeepSeek-V2.5 همچنین نوشتن و پیروی از دستور را بهبود میدهد.",
|
||
"deepseek-coder-33B-instruct.description": "DeepSeek Coder 33B یک مدل زبان برنامهنویسی است که با ۲ تریلیون توکن (۸۷٪ کد، ۱۳٪ متن چینی/انگلیسی) آموزش دیده است. این مدل دارای پنجره متنی ۱۶K و وظایف تکمیل در میانه است که تکمیل کد در سطح پروژه و پر کردن قطعات کد را فراهم میکند.",
|
||
"deepseek-coder-v2.description": "DeepSeek Coder V2 یک مدل کدنویسی MoE متنباز است که در وظایف برنامهنویسی عملکردی همسطح با GPT-4 Turbo دارد.",
|
||
"deepseek-coder-v2:236b.description": "DeepSeek Coder V2 یک مدل کدنویسی MoE متنباز است که در وظایف برنامهنویسی عملکردی همسطح با GPT-4 Turbo دارد.",
|
||
"deepseek-ocr.description": "DeepSeek-OCR یک مدل بینایی-زبانی از DeepSeek AI است که بر OCR و «فشردهسازی نوری متنی» تمرکز دارد. این مدل با فشردهسازی اطلاعات متنی از تصاویر، اسناد را بهطور کارآمد پردازش کرده و به فرمتهای متنی ساختاریافته مانند Markdown تبدیل میکند. این مدل در شناسایی دقیق متن در تصاویر عملکرد بالایی دارد و برای دیجیتالیسازی اسناد، استخراج متن و پردازش ساختاریافته مناسب است.",
|
||
"deepseek-r1-0528.description": "مدل کامل ۶۸۵ میلیارد پارامتری منتشرشده در ۲۸ مه ۲۰۲۵. DeepSeek-R1 از یادگیری تقویتی در مقیاس بزرگ در مرحله پسآموزش استفاده میکند که توانایی استدلال را با حداقل دادههای برچسبخورده بهطور چشمگیری بهبود میبخشد و در ریاضی، کدنویسی و استدلال زبان طبیعی عملکرد قویای دارد.",
|
||
"deepseek-r1-250528.description": "DeepSeek R1 250528 نسخه کامل مدل استدلال DeepSeek-R1 برای وظایف سخت ریاضی و منطقی است.",
|
||
"deepseek-r1-70b-fast-online.description": "نسخه سریع DeepSeek R1 70B با جستجوی وب در زمان واقعی که پاسخهای سریعتری را با حفظ عملکرد ارائه میدهد.",
|
||
"deepseek-r1-70b-online.description": "نسخه استاندارد DeepSeek R1 70B با جستجوی وب در زمان واقعی، مناسب برای چت و وظایف متنی بهروز.",
|
||
"deepseek-r1-distill-llama-70b.description": "DeepSeek R1 Distill Llama 70B ترکیبی از استدلال R1 با اکوسیستم Llama است.",
|
||
"deepseek-r1-distill-llama-8b.description": "DeepSeek-R1-Distill-Llama-8B از Llama-3.1-8B با استفاده از خروجیهای DeepSeek R1 تقطیر شده است.",
|
||
"deepseek-r1-distill-llama.description": "deepseek-r1-distill-llama از DeepSeek-R1 بر پایه Llama تقطیر شده است.",
|
||
"deepseek-r1-distill-qianfan-70b.description": "DeepSeek R1 Distill Qianfan 70B یک مدل تقطیر R1 بر پایه Qianfan-70B با ارزش بالا است.",
|
||
"deepseek-r1-distill-qianfan-8b.description": "DeepSeek R1 Distill Qianfan 8B یک مدل تقطیر R1 بر پایه Qianfan-8B برای برنامههای کوچک و متوسط است.",
|
||
"deepseek-r1-distill-qianfan-llama-70b.description": "DeepSeek R1 Distill Qianfan Llama 70B یک مدل تقطیر R1 بر پایه Llama-70B است.",
|
||
"deepseek-r1-distill-qwen-1.5b.description": "DeepSeek R1 Distill Qwen 1.5B یک مدل تقطیر فوقسبک برای محیطهای بسیار کممنبع است.",
|
||
"deepseek-r1-distill-qwen-14b.description": "DeepSeek R1 Distill Qwen 14B یک مدل تقطیر میانرده برای استقرار در سناریوهای چندگانه است.",
|
||
"deepseek-r1-distill-qwen-32b.description": "DeepSeek R1 Distill Qwen 32B یک مدل تقطیر R1 بر پایه Qwen-32B است که بین عملکرد و هزینه تعادل برقرار میکند.",
|
||
"deepseek-r1-distill-qwen-7b.description": "DeepSeek R1 Distill Qwen 7B یک مدل تقطیر سبک برای محیطهای لبهای و سازمانی خصوصی است.",
|
||
"deepseek-r1-distill-qwen.description": "deepseek-r1-distill-qwen از DeepSeek-R1 بر پایه Qwen تقطیر شده است.",
|
||
"deepseek-r1-fast-online.description": "نسخه کامل سریع DeepSeek R1 با جستجوی وب در زمان واقعی که توانایی در مقیاس ۶۷۱B را با پاسخدهی سریعتر ترکیب میکند.",
|
||
"deepseek-r1-online.description": "نسخه کامل DeepSeek R1 با ۶۷۱ میلیارد پارامتر و جستجوی وب در زمان واقعی که درک و تولید قویتری را ارائه میدهد.",
|
||
"deepseek-r1.description": "DeepSeek-R1 پیش از یادگیری تقویتی از دادههای شروع سرد استفاده میکند و در وظایف ریاضی، کدنویسی و استدلال عملکردی همسطح با OpenAI-o1 دارد.",
|
||
"deepseek-reasoner.description": "نام سازگار برای حالت استدلال سریع DeepSeek V4 Flash. این نسخه بهزودی منسوخ میشود — از deepseek-v4-flash استفاده کنید.",
|
||
"deepseek-v2.description": "DeepSeek V2 یک مدل MoE کارآمد است که پردازش مقرونبهصرفه را امکانپذیر میسازد.",
|
||
"deepseek-v2:236b.description": "DeepSeek V2 236B مدل متمرکز بر کدنویسی DeepSeek است که توانایی بالایی در تولید کد دارد.",
|
||
"deepseek-v3-0324.description": "DeepSeek-V3-0324 یک مدل MoE با ۶۷۱ میلیارد پارامتر است که در برنامهنویسی، تواناییهای فنی، درک زمینه و پردازش متون بلند عملکرد برجستهای دارد.",
|
||
"deepseek-v3.1-terminus.description": "DeepSeek-V3.1-Terminus یک مدل زبان بزرگ بهینهشده برای دستگاههای ترمینال است که توسط DeepSeek توسعه یافته است.",
|
||
"deepseek-v3.1-think-250821.description": "DeepSeek V3.1 Think 250821 نسخه تفکر عمیق مدل Terminus است که برای استدلال با عملکرد بالا طراحی شده است.",
|
||
"deepseek-v3.1.description": "DeepSeek-V3.1 یک مدل استدلال ترکیبی جدید از DeepSeek است که از هر دو حالت تفکر و بدون تفکر پشتیبانی میکند و بهرهوری تفکر بالاتری نسبت به DeepSeek-R1-0528 دارد. بهینهسازیهای پس از آموزش، استفاده از ابزارها و عملکرد وظایف نماینده را بهطور قابل توجهی بهبود میبخشد. این مدل از پنجره متنی ۱۲۸ هزار توکن و خروجی تا ۶۴ هزار توکن پشتیبانی میکند.",
|
||
"deepseek-v3.1:671b.description": "DeepSeek V3.1 یک مدل استدلال نسل بعدی با توانایی استدلال پیچیده و زنجیرهای بهبود یافته است که برای وظایف نیازمند تحلیل عمیق مناسب است.",
|
||
"deepseek-v3.2-exp.description": "مدل deepseek-v3.2-exp با معرفی توجه پراکنده، کارایی آموزش و استنتاج در متون بلند را بهبود میبخشد و نسبت به deepseek-v3.1 قیمت پایینتری دارد.",
|
||
"deepseek-v3.2-speciale.description": "در وظایف بسیار پیچیده، مدل Speciale بهطور قابلتوجهی از نسخه استاندارد بهتر عمل میکند، اما مصرف توکن بیشتری دارد و هزینههای بالاتری ایجاد میکند. در حال حاضر، DeepSeek-V3.2-Speciale فقط برای استفاده تحقیقاتی در نظر گرفته شده است، از فراخوانی ابزار پشتیبانی نمیکند و بهطور خاص برای مکالمات روزمره یا وظایف نوشتاری بهینه نشده است.",
|
||
"deepseek-v3.2-think.description": "DeepSeek V3.2 Think یک مدل تفکر عمیق کامل است که توانایی استدلال زنجیرهای بلندتری دارد.",
|
||
"deepseek-v3.2-thinking.description": "DeepSeek-V3.2 Thinking حالت تفکر متغیر DeepSeek-V3.2 است که بر وظایف استدلال تمرکز دارد.",
|
||
"deepseek-v3.2.description": "DeepSeek-V3.2 جدیدترین مدل کدنویسی DeepSeek با قابلیتهای استدلال قوی است.",
|
||
"deepseek-v3.description": "DeepSeek-V3 یک مدل MoE قدرتمند با ۶۷۱ میلیارد پارامتر کل و ۳۷ میلیارد پارامتر فعال در هر توکن است.",
|
||
"deepseek-v4-flash.description": "DeepSeek V4 Flash عضوی مقرونبهصرفه از خانواده V4 با پنجره زمینه ۱ میلیون و حالت تفکر ترکیبی است. حالت تفکر بهطور پیشفرض فعال است و از طریق پارامتر thinking قابل تغییر میباشد. حالت بدون تفکر برای کارهای حساس به تأخیر بهینهسازی شده است.",
|
||
"deepseek-v4-pro.description": "DeepSeek V4 Pro مدل پرچمدار خانواده V4 است که برای استدلال شدید، گردش کارهای ایجنتی و برنامهریزی بلندمدت بهینه شده است. حالت تفکر پیشفرض فعال بوده و قابل تغییر است.",
|
||
"deepseek-vl2-small.description": "DeepSeek VL2 Small نسخه چندوجهی سبکوزن برای استفاده در شرایط محدود منابع و همزمانی بالا است.",
|
||
"deepseek-vl2.description": "DeepSeek VL2 یک مدل چندوجهی برای درک تصویر-متن و پاسخگویی دقیق بصری است.",
|
||
"deepseek/deepseek-chat-v3-0324.description": "DeepSeek V3 یک مدل MoE با ۶۸۵ میلیارد پارامتر است و جدیدترین نسخه از سری چت پرچمدار DeepSeek محسوب میشود.\n\nاین مدل بر پایه [DeepSeek V3](/deepseek/deepseek-chat-v3) ساخته شده و در انجام وظایف مختلف عملکرد قوی دارد.",
|
||
"deepseek/deepseek-chat-v3-0324:free.description": "DeepSeek V3 یک مدل MoE با ۶۸۵ میلیارد پارامتر است و جدیدترین نسخه از سری چت پرچمدار DeepSeek محسوب میشود.\n\nاین مدل بر پایه [DeepSeek V3](/deepseek/deepseek-chat-v3) ساخته شده و در انجام وظایف مختلف عملکرد قوی دارد.",
|
||
"deepseek/deepseek-chat-v3.1.description": "DeepSeek-V3.1 مدل استدلال ترکیبی با زمینه بلند از DeepSeek است که از حالتهای تفکر/بدون تفکر و ادغام ابزارها پشتیبانی میکند.",
|
||
"deepseek/deepseek-chat.description": "DeepSeek-V3 مدل استدلال ترکیبی با عملکرد بالا از DeepSeek برای وظایف پیچیده و ادغام ابزارها است.",
|
||
"deepseek/deepseek-math-v2.description": "نسخه دوم DeepSeek Math یک مدل با پیشرفتهای چشمگیر در توانایی استدلال ریاضی است. نوآوری اصلی آن در مکانیزم آموزش «خود-بازبینی» نهفته است و در چندین رقابت برتر ریاضی به سطح مدال طلا دست یافته است.",
|
||
"deepseek/deepseek-r1-0528.description": "DeepSeek R1 0528 نسخه بهروزرسانیشدهای است که بر در دسترس بودن آزاد و استدلال عمیق تمرکز دارد.",
|
||
"deepseek/deepseek-r1-0528:free.description": "DeepSeek-R1 با استفاده از دادههای برچسبخورده حداقلی، توانایی استدلال را بهطور چشمگیری بهبود میبخشد و پیش از پاسخ نهایی، زنجیرهای از افکار تولید میکند تا دقت را افزایش دهد.",
|
||
"deepseek/deepseek-r1-distill-llama-70b.description": "DeepSeek R1 Distill Llama 70B یک مدل تقطیرشده بر پایه Llama 3.3 70B است که با استفاده از خروجیهای DeepSeek R1 تنظیم دقیق شده و عملکردی رقابتی با مدلهای پیشرفته بزرگ دارد.",
|
||
"deepseek/deepseek-r1-distill-llama-8b.description": "DeepSeek R1 Distill Llama 8B یک مدل تقطیرشده بر پایه Llama-3.1-8B-Instruct است که با استفاده از خروجیهای DeepSeek R1 آموزش دیده است.",
|
||
"deepseek/deepseek-r1-distill-qwen-14b.description": "DeepSeek R1 Distill Qwen 14B یک مدل تقطیرشده بر پایه Qwen 2.5 14B است که با استفاده از خروجیهای DeepSeek R1 آموزش دیده است. این مدل در چندین معیار از OpenAI o1-mini پیشی گرفته و در میان مدلهای متراکم نتایج پیشرفتهای ارائه میدهد. نکات برجسته:\nAIME 2024 pass@1: 69.7\nMATH-500 pass@1: 93.9\nرتبه CodeForces: 1481\nتنظیم دقیق با خروجیهای DeepSeek R1 عملکردی رقابتی با مدلهای پیشرفته بزرگ ارائه میدهد.",
|
||
"deepseek/deepseek-r1-distill-qwen-32b.description": "DeepSeek R1 Distill Qwen 32B یک مدل تقطیرشده بر پایه Qwen 2.5 32B است که با استفاده از خروجیهای DeepSeek R1 آموزش دیده است. این مدل در چندین معیار از OpenAI o1-mini پیشی گرفته و در میان مدلهای متراکم نتایج پیشرفتهای ارائه میدهد. نکات برجسته:\nAIME 2024 pass@1: 72.6\nMATH-500 pass@1: 94.3\nرتبه CodeForces: 1691\nتنظیم دقیق با خروجیهای DeepSeek R1 عملکردی رقابتی با مدلهای پیشرفته بزرگ ارائه میدهد.",
|
||
"deepseek/deepseek-r1.description": "DeepSeek R1 به نسخه DeepSeek-R1-0528 بهروزرسانی شده است. با استفاده از محاسبات بیشتر و بهینهسازیهای الگوریتمی پس از آموزش، عمق و توانایی استدلال را بهطور قابل توجهی بهبود میبخشد. این مدل در معیارهای ریاضی، برنامهنویسی و منطق عمومی عملکرد قوی دارد و به سطح مدلهایی مانند o3 و Gemini 2.5 Pro نزدیک میشود.",
|
||
"deepseek/deepseek-r1/community.description": "DeepSeek R1 جدیدترین مدل متنباز منتشرشده توسط تیم DeepSeek است که عملکرد استدلالی بسیار قوی، بهویژه در ریاضی، کدنویسی و وظایف استدلالی دارد و با OpenAI o1 قابل مقایسه است.",
|
||
"deepseek/deepseek-r1:free.description": "DeepSeek-R1 با استفاده از دادههای برچسبخورده حداقلی، توانایی استدلال را بهطور چشمگیری بهبود میبخشد و پیش از پاسخ نهایی، زنجیرهای از افکار تولید میکند تا دقت را افزایش دهد.",
|
||
"deepseek/deepseek-reasoner.description": "DeepSeek-V3 Thinking (reasoner) مدل آزمایشی استدلالی DeepSeek است که برای وظایف استدلالی با پیچیدگی بالا مناسب است.",
|
||
"deepseek/deepseek-v3.description": "یک مدل زبان بزرگ سریع و عمومی با توانایی استدلال تقویتشده.",
|
||
"deepseek/deepseek-v3/community.description": "DeepSeek-V3 پیشرفتی بزرگ در سرعت استدلال نسبت به مدلهای قبلی ارائه میدهد. این مدل در میان مدلهای متنباز رتبه اول را دارد و با مدلهای بسته پیشرفته رقابت میکند. DeepSeek-V3 از معماری Multi-Head Latent Attention (MLA) و DeepSeekMoE استفاده میکند که در DeepSeek-V2 بهطور کامل اعتبارسنجی شدهاند. همچنین از استراتژی کمکی بدون اتلاف برای تعادل بار و هدف آموزشی پیشبینی چندتوکنی برای عملکرد قویتر بهره میبرد.",
|
||
"deepseek_r1.description": "DeepSeek-R1 یک مدل استدلالی مبتنی بر یادگیری تقویتی است که مشکلات تکرار و خوانایی را برطرف میکند. پیش از یادگیری تقویتی، از دادههای شروع سرد برای بهبود بیشتر عملکرد استدلال استفاده میکند. این مدل در وظایف ریاضی، کدنویسی و استدلال با OpenAI-o1 برابری میکند و با طراحی دقیق آموزش، نتایج کلی را بهبود میبخشد.",
|
||
"deepseek_r1_distill_llama_70b.description": "DeepSeek-R1-Distill-Llama-70B از Llama-3.3-70B-Instruct تقطیر شده است. بهعنوان بخشی از سری DeepSeek-R1، با استفاده از نمونههای تولیدشده توسط DeepSeek-R1 تنظیم دقیق شده و در ریاضی، کدنویسی و استدلال عملکرد قوی دارد.",
|
||
"deepseek_r1_distill_qwen_14b.description": "DeepSeek-R1-Distill-Qwen-14B از Qwen2.5-14B تقطیر شده و با استفاده از ۸۰۰ هزار نمونه منتخب تولیدشده توسط DeepSeek-R1 تنظیم دقیق شده است و عملکرد استدلالی قوی ارائه میدهد.",
|
||
"deepseek_r1_distill_qwen_32b.description": "DeepSeek-R1-Distill-Qwen-32B از Qwen2.5-32B تقطیر شده و با استفاده از ۸۰۰ هزار نمونه منتخب تولیدشده توسط DeepSeek-R1 تنظیم دقیق شده است و در ریاضی، کدنویسی و استدلال عملکرد برجستهای دارد.",
|
||
"devstral-2512.description": "Devstral 2 یک مدل متنی در سطح سازمانی است که در استفاده از ابزارها برای کاوش در پایگاههای کد، ویرایش چندین فایل و تقویت عوامل مهندسی نرمافزار برتری دارد.",
|
||
"devstral-2:123b.description": "Devstral 2 123B در استفاده از ابزارها برای بررسی پایگاههای کد، ویرایش چندین فایل و پشتیبانی از عاملهای مهندسی نرمافزار عملکرد برجستهای دارد.",
|
||
"doubao-1.5-lite-32k.description": "Doubao-1.5-lite یک مدل سبک و جدید با پاسخدهی فوقالعاده سریع است که کیفیت و تأخیر سطح بالا را ارائه میدهد.",
|
||
"doubao-1.5-pro-256k.description": "Doubao-1.5-pro-256k ارتقایی جامع از Doubao-1.5-Pro است که عملکرد کلی را ۱۰٪ بهبود میبخشد. این مدل از پنجره متنی ۲۵۶هزار توکن و خروجی تا ۱۲هزار توکن پشتیبانی میکند و عملکرد بالاتر، پنجره بزرگتر و ارزش قویتری برای کاربردهای گستردهتر ارائه میدهد.",
|
||
"doubao-1.5-pro-32k.description": "Doubao-1.5-pro یک مدل پرچمدار نسل جدید با ارتقاهای همهجانبه است که در دانش، کدنویسی و استدلال عملکرد درخشانی دارد.",
|
||
"doubao-1.5-thinking-pro-m.description": "Doubao-1.5 یک مدل جدید با استدلال عمیق است (نسخه m شامل استدلال عمیق چندوجهی بومی است) که در ریاضیات، کدنویسی، استدلال علمی و وظایف عمومی مانند نوشتن خلاقانه عملکرد برجستهای دارد. این مدل به نتایج سطح بالا در معیارهایی مانند AIME 2024، Codeforces و GPQA دست یافته یا نزدیک شده است. از پنجره متنی ۱۲۸هزار توکن و خروجی تا ۱۶هزار توکن پشتیبانی میکند.",
|
||
"doubao-1.5-thinking-pro.description": "Doubao-1.5 یک مدل جدید با استدلال عمیق است که در ریاضیات، کدنویسی، استدلال علمی و وظایف عمومی مانند نوشتن خلاقانه عملکرد برجستهای دارد. این مدل به نتایج سطح بالا در معیارهایی مانند AIME 2024، Codeforces و GPQA دست یافته یا نزدیک شده است. از پنجره متنی ۱۲۸هزار توکن و خروجی تا ۱۶هزار توکن پشتیبانی میکند.",
|
||
"doubao-1.5-thinking-vision-pro.description": "مدلی جدید با استدلال بصری عمیق و درک و استدلال چندوجهی قویتر که در ۳۷ از ۵۹ معیار عمومی به نتایج SOTA دست یافته است.",
|
||
"doubao-1.5-ui-tars.description": "Doubao-1.5-UI-TARS یک مدل عامل بومی متمرکز بر رابط گرافیکی است که با ادراک، استدلال و اقدام شبیه انسان بهطور یکپارچه با رابطها تعامل دارد.",
|
||
"doubao-1.5-vision-lite.description": "Doubao-1.5-vision-lite یک مدل چندوجهی ارتقایافته است که از تصاویر با هر وضوح و نسبت تصویر پشتیبانی میکند و استدلال بصری، شناسایی اسناد، درک جزئیات و پیروی از دستورالعملها را بهبود میبخشد. از پنجره متنی ۱۲۸هزار توکن و خروجی تا ۱۶هزار توکن پشتیبانی میکند.",
|
||
"doubao-1.5-vision-pro-32k.description": "Doubao-1.5-vision-pro یک مدل چندوجهی ارتقایافته است که از تصاویر با هر وضوح و نسبت تصویر پشتیبانی میکند و استدلال بصری، شناسایی اسناد، درک جزئیات و پیروی از دستورالعملها را بهبود میبخشد.",
|
||
"doubao-1.5-vision-pro.description": "Doubao-1.5-vision-pro یک مدل چندوجهی ارتقایافته است که از تصاویر با هر وضوح و نسبت تصویر پشتیبانی میکند و استدلال بصری، شناسایی اسناد، درک جزئیات و پیروی از دستورالعملها را بهبود میبخشد.",
|
||
"doubao-lite-32k.description": "پاسخدهی فوقالعاده سریع با ارزش بهتر، ارائه گزینههای انعطافپذیرتر در سناریوهای مختلف. از استدلال و تنظیم دقیق با پنجره متنی ۳۲هزار توکن پشتیبانی میکند.",
|
||
"doubao-pro-32k.description": "بهترین مدل پرچمدار برای وظایف پیچیده با نتایج قوی در پرسش و پاسخ مرجع، خلاصهسازی، تولید محتوا، طبقهبندی متنی و نقشآفرینی. از استدلال و تنظیم دقیق با پنجره متنی ۳۲هزار توکن پشتیبانی میکند.",
|
||
"doubao-seed-1.6-flash.description": "Doubao-Seed-1.6-flash یک مدل چندوجهی با استدلال عمیق و پاسخدهی فوقالعاده سریع با TPOT تا ۱۰ میلیثانیه است. از متن و تصویر پشتیبانی میکند، در درک متن از مدل lite قبلی پیشی میگیرد و در درک تصویر با مدلهای pro رقابت میکند. از پنجره متنی ۲۵۶هزار توکن و خروجی تا ۱۶هزار توکن پشتیبانی میکند.",
|
||
"doubao-seed-1.6-lite.description": "Doubao-Seed-1.6-lite یک مدل جدید چندوجهی با استدلال عمیق است که تلاش استدلالی قابل تنظیم (حداقل، کم، متوسط، زیاد) را ارائه میدهد و گزینهای با ارزش بالا برای وظایف رایج است. از پنجره متنی تا ۲۵۶هزار توکن پشتیبانی میکند.",
|
||
"doubao-seed-1.6-thinking.description": "Doubao-Seed-1.6-thinking استدلال را بهطور قابل توجهی تقویت کرده و تواناییهای اصلی در کدنویسی، ریاضیات و استدلال منطقی را نسبت به Doubao-1.5-thinking-pro بهبود میبخشد و درک تصویر را نیز اضافه میکند. از پنجره متنی ۲۵۶هزار توکن و خروجی تا ۱۶هزار توکن پشتیبانی میکند.",
|
||
"doubao-seed-1.6-vision.description": "Doubao-Seed-1.6-vision یک مدل استدلال بصری است که درک و استدلال چندوجهی قویتری را برای آموزش، بررسی تصویر، بازرسی/امنیت و پرسش و پاسخ هوش مصنوعی ارائه میدهد. از پنجره متنی ۲۵۶هزار توکن و خروجی تا ۶۴هزار توکن پشتیبانی میکند.",
|
||
"doubao-seed-1.6.description": "Doubao-Seed-1.6 یک مدل جدید چندوجهی با استدلال عمیق است که از حالتهای خودکار، تفکری و غیرتفکری پشتیبانی میکند. در حالت غیرتفکری، عملکرد آن بهطور قابل توجهی از Doubao-1.5-pro/250115 بهتر است. از پنجره متنی ۲۵۶هزار توکن و خروجی تا ۱۶هزار توکن پشتیبانی میکند.",
|
||
"doubao-seed-1.8.description": "Doubao-Seed-1.8 دارای درک چندوجهی قویتر و تواناییهای عامل پیشرفتهتری است، از ورودی متن/تصویر/ویدیو و ذخیرهسازی زمینه پشتیبانی میکند و در انجام وظایف پیچیده عملکردی عالی ارائه میدهد.",
|
||
"doubao-seed-2.0-code.description": "Doubao-Seed-2.0-code برای کدنویسی عامل بهینهسازی عمیق شده، از ورودیهای چندوجهی و یک پنجره متنی 256k پشتیبانی میکند و مناسب برای کدنویسی، درک بصری و جریانهای کاری عامل است.",
|
||
"doubao-seed-2.0-lite.description": "Doubao-Seed-2.0-lite یک مدل استدلال عمیق چندوجهی جدید است که ارزش بهتری ارائه میدهد و انتخابی قوی برای وظایف عمومی است، با پنجره متنی تا 256k.",
|
||
"doubao-seed-2.0-mini.description": "Doubao-Seed-2.0-mini یک مدل سبک با پاسخدهی سریع و عملکرد بالا است که برای وظایف کوچک و سناریوهای با همزمانی بالا مناسب است.",
|
||
"doubao-seed-2.0-pro.description": "Doubao-Seed-2.0-pro مدل عمومی Agent پرچمدار ByteDance است که در برنامهریزی و اجرای وظایف پیچیده جهشهای همهجانبهای دارد.",
|
||
"doubao-seed-code.description": "Doubao-Seed-Code برای کدنویسی عاملمحور بهینهسازی عمیقی شده است، از ورودیهای چندوجهی (متن/تصویر/ویدیو) و پنجره متنی ۲۵۶هزار توکن پشتیبانی میکند، با API شرکت Anthropic سازگار است و برای کدنویسی، درک تصویر و جریانهای کاری عامل مناسب است.",
|
||
"doubao-seedance-1-0-lite-i2v-250428.description": "کیفیت تولید پایدار با صرفه اقتصادی بالا، قادر به تولید ویدیوها از اولین فریم، اولین و آخرین فریمها، یا تصاویر مرجع.",
|
||
"doubao-seedance-1-0-lite-t2v-250428.description": "کیفیت تولید پایدار با صرفه اقتصادی بالا، قادر به تولید ویدیوها بر اساس دستورالعملهای متنی.",
|
||
"doubao-seedance-1-0-pro-250528.description": "Seedance 1.0 Pro یک مدل پایه تولید ویدیو است که از داستانگویی چند شات پشتیبانی میکند. این مدل عملکرد قوی در ابعاد مختلف ارائه میدهد. مدل به پیشرفتهایی در درک معنایی و پیروی از دستورالعملها دست یافته است، که امکان تولید ویدیوهای با کیفیت 1080P با حرکت روان، جزئیات غنی، سبکهای متنوع و زیبایی بصری در سطح سینمایی را فراهم میکند.",
|
||
"doubao-seedance-1-0-pro-fast-251015.description": "Seedance 1.0 Pro Fast یک مدل جامع طراحی شده برای کاهش هزینهها و افزایش عملکرد است، که تعادل عالی بین کیفیت تولید ویدیو، سرعت و قیمت را به دست میآورد. این مدل نقاط قوت اصلی Seedance 1.0 Pro را به ارث برده است، در حالی که سرعت تولید سریعتر و قیمتهای رقابتیتر ارائه میدهد، و به خالقان بهینهسازی دوگانه کارایی و هزینه را ارائه میکند.",
|
||
"doubao-seedance-1-5-pro-251215.description": "Seedance 1.5 Pro توسط ByteDance از تولید متن به ویدیو، تصویر به ویدیو (اولین فریم، اولین+آخرین فریم)، و تولید صوت هماهنگ با تصاویر پشتیبانی میکند.",
|
||
"doubao-seedance-2-0-260128.description": "Seedance 2.0 توسط ByteDance قدرتمندترین مدل تولید ویدئو است، که از تولید ویدئو چندوجهی مرجع، ویرایش ویدئو، گسترش ویدئو، متن به ویدئو، و تصویر به ویدئو با صدای همگامشده پشتیبانی میکند.",
|
||
"doubao-seedance-2-0-fast-260128.description": "Seedance 2.0 Fast توسط ByteDance همان قابلیتهای Seedance 2.0 را با سرعت تولید سریعتر و قیمت رقابتیتر ارائه میدهد.",
|
||
"doubao-seededit-3-0-i2i-250628.description": "مدل تصویر Doubao از ByteDance Seed از ورودیهای متن و تصویر پشتیبانی میکند و تولید تصویر با کیفیت بالا و قابل کنترل را ارائه میدهد. از ویرایش تصویر با راهنمایی متن پشتیبانی میکند و اندازه خروجی بین ۵۱۲ تا ۱۵۳۶ در ضلع بلندتر است.",
|
||
"doubao-seedream-3-0-t2i-250415.description": "Seedream 3.0 یک مدل تولید تصویر از ByteDance Seed است که از ورودیهای متن و تصویر پشتیبانی میکند و تولید تصویر با کیفیت بالا و قابل کنترل را ارائه میدهد. این مدل تصاویر را از دستورات متنی تولید میکند.",
|
||
"doubao-seedream-4-0-250828.description": "Seedream 4.0 یک مدل تولید تصویر از ByteDance Seed است که از ورودیهای متن و تصویر پشتیبانی میکند و تولید تصویر با کیفیت بالا و قابل کنترل را ارائه میدهد. این مدل تصاویر را از دستورات متنی تولید میکند.",
|
||
"doubao-seedream-4-5-251128.description": "Seedream 4.5 جدیدترین مدل چندوجهی تصویر ByteDance است که قابلیتهای تبدیل متن به تصویر، تصویر به تصویر و تولید دستهای تصاویر را ادغام میکند و تواناییهای استدلال و دانش عمومی را نیز در بر میگیرد. در مقایسه با نسخه قبلی 4.0، کیفیت تولید بهطور قابلتوجهی بهبود یافته است، با سازگاری بهتر در ویرایش و ترکیب چند تصویر. کنترل دقیقتری بر جزئیات بصری ارائه میدهد، متنهای کوچک و چهرههای کوچک را بهطور طبیعیتر تولید میکند و به هماهنگی بهتر در چیدمان و رنگ دست مییابد، که زیبایی کلی را افزایش میدهد.",
|
||
"doubao-seedream-5-0-260128.description": "Doubao-Seedream-5.0-lite جدیدترین مدل تولید تصویر ByteDance است. برای اولین بار، قابلیتهای بازیابی آنلاین را ادغام کرده است که به آن امکان میدهد اطلاعات وب لحظهای را وارد کند و بهموقع بودن تصاویر تولید شده را افزایش دهد. هوش مدل نیز ارتقا یافته است، که تفسیر دقیق دستورالعملهای پیچیده و محتوای بصری را امکانپذیر میکند. علاوه بر این، پوشش دانش جهانی، سازگاری مرجع و کیفیت تولید در سناریوهای حرفهای بهبود یافته است، که نیازهای خلق بصری در سطح سازمانی را بهتر برآورده میکند.",
|
||
"emohaa.description": "Emohaa یک مدل سلامت روان با توانایی مشاوره حرفهای است که به کاربران در درک مسائل احساسی کمک میکند.",
|
||
"ernie-4.5-0.3b.description": "ERNIE 4.5 0.3B یک مدل سبک متنباز برای استقرار محلی و سفارشیسازی شده است.",
|
||
"ernie-4.5-21b-a3b-thinking.description": "ERNIE-4.5-21B-A3B-Thinking یک مدل متن MoE (ترکیب متخصصان) پس از آموزش با مجموع 21 میلیارد پارامتر و 3 میلیارد پارامتر فعال است که کیفیت و عمق استدلال را بهطور قابلتوجهی افزایش میدهد.",
|
||
"ernie-4.5-21b-a3b.description": "ERNIE 4.5 21B A3B یک مدل متنباز با پارامترهای زیاد و توانایی درک و تولید قویتر است.",
|
||
"ernie-4.5-300b-a47b.description": "ERNIE 4.5 300B A47B مدل MoE بسیار بزرگ Baidu ERNIE با توانایی استدلال عالی است.",
|
||
"ernie-4.5-8k-preview.description": "پیشنمایش مدل با پنجره متنی ۸هزار توکن برای ارزیابی ERNIE 4.5.",
|
||
"ernie-4.5-turbo-128k-preview.description": "پیشنمایش ERNIE 4.5 Turbo 128K با قابلیتهای سطح انتشار، مناسب برای یکپارچهسازی و تستهای مقدماتی.",
|
||
"ernie-4.5-turbo-128k.description": "ERNIE 4.5 Turbo 128K یک مدل عمومی با عملکرد بالا است که از تقویت جستجو و فراخوانی ابزار برای پرسش و پاسخ، کدنویسی و سناریوهای عامل پشتیبانی میکند.",
|
||
"ernie-4.5-turbo-32k.description": "ERNIE 4.5 Turbo 32K نسخهای با طول زمینه متوسط برای پرسش و پاسخ، بازیابی از پایگاه دانش و گفتوگوی چندمرحلهای است.",
|
||
"ernie-4.5-turbo-latest.description": "جدیدترین نسخه ERNIE 4.5 Turbo با عملکرد کلی بهینهشده، ایدهآل برای استفاده در تولید اصلی است.",
|
||
"ernie-4.5-turbo-vl-32k-preview.description": "پیشنمایش چندوجهی ERNIE 4.5 Turbo VL 32K برای ارزیابی توانایی دید در زمینههای طولانی.",
|
||
"ernie-4.5-turbo-vl-32k.description": "ERNIE 4.5 Turbo VL 32K نسخهای چندوجهی با طول زمینه متوسط برای درک ترکیبی اسناد بلند و تصاویر است.",
|
||
"ernie-4.5-turbo-vl-latest.description": "جدیدترین نسخه چندوجهی ERNIE 4.5 Turbo VL با درک و استدلال بهتر تصویر-متن.",
|
||
"ernie-4.5-turbo-vl-preview.description": "پیشنمایش مدل چندوجهی ERNIE 4.5 Turbo VL برای درک و تولید تصویر-متن، مناسب برای پرسش و پاسخ بصری و درک محتوا.",
|
||
"ernie-4.5-turbo-vl.description": "ERNIE 4.5 Turbo VL یک مدل چندوجهی بالغ برای درک و شناسایی تصویر-متن در محیطهای تولیدی است.",
|
||
"ernie-4.5-vl-28b-a3b.description": "ERNIE 4.5 VL 28B A3B یک مدل چندوجهی متنباز برای درک و استدلال تصویر-متن است.",
|
||
"ernie-5.0-thinking-latest.description": "Wenxin 5.0 Thinking یک مدل پرچمدار بومی تماموجهی است که مدلسازی متن، تصویر، صدا و ویدیو را یکپارچه میکند. این مدل ارتقاهای گستردهای در توانایی برای پرسش و پاسخ پیچیده، تولید محتوا و سناریوهای عامل ارائه میدهد.",
|
||
"ernie-5.0-thinking-preview.description": "پیشنمایش Wenxin 5.0 Thinking، یک مدل پرچمدار بومی تماموجهی با مدلسازی یکپارچه متن، تصویر، صدا و ویدیو. این مدل ارتقاهای گستردهای در توانایی برای پرسش و پاسخ پیچیده، تولید محتوا و سناریوهای عامل ارائه میدهد.",
|
||
"ernie-5.0.description": "ERNIE 5.0 نسل جدید مدلهای سری ERNIE است؛ یک مدل بزرگ چندوجهی که از ابتدا بر اساس یک رویکرد مدلسازی یکپارچه ساخته شده است. این مدل متن، تصویر، صوت و ویدئو را به شکل مشترک مدلسازی کرده و تواناییهای چندوجهی قدرتمندی ارائه میدهد. تواناییهای بنیادی آن ارتقا یافته و عملکرد قوی در ارزیابیهای معیار نشان میدهد. این مدل در درک چندوجهی، پیروی از دستور، نوشتن خلاق، دقت واقعی، برنامهریزی ایجنتی و استفاده از ابزار عملکرد برجستهای دارد.",
|
||
"ernie-char-8k.description": "ERNIE Character 8K یک مدل گفتوگوی شخصیتی برای ساخت شخصیتهای IP و چت همراه بلندمدت است.",
|
||
"ernie-char-fiction-8k-preview.description": "پیشنمایش ERNIE Character Fiction 8K یک مدل ساخت شخصیت و داستان برای ارزیابی و آزمایش ویژگیها است.",
|
||
"ernie-char-fiction-8k.description": "ERNIE Character Fiction 8K یک مدل شخصیتی برای رماننویسی و خلق داستان است که برای تولید داستانهای بلند مناسب است.",
|
||
"ernie-image-turbo.description": "ERNIE-Image یک مدل متنبهتصویر با ۸ میلیارد پارامتر از Baidu است. این مدل در چندین معیار در میان بهترینها قرار میگیرد و در SuperCLUE چین رتبه اول مشترک و رتبه برتر در بخش متنباز دارد.",
|
||
"ernie-irag-edit.description": "ERNIE iRAG Edit یک مدل ویرایش تصویر است که از پاککردن، بازنقاشی و تولید نسخههای جایگزین پشتیبانی میکند.",
|
||
"ernie-lite-pro-128k.description": "ERNIE Lite Pro 128K یک مدل سبک و پرکاربرد برای سناریوهای حساس به تأخیر و هزینه است.",
|
||
"ernie-novel-8k.description": "ERNIE Novel 8K برای رمانهای بلند و داستانهای IP با روایت چندشخصیتی طراحی شده است.",
|
||
"ernie-speed-pro-128k.description": "ERNIE Speed Pro 128K یک مدل با ارزش بالا و همزمانی بالا برای خدمات آنلاین گسترده و برنامههای سازمانی است.",
|
||
"ernie-x1-turbo-32k-preview.description": "پیشنمایش ERNIE X1 Turbo 32K یک مدل سریع تفکر با زمینه 32K برای استدلال پیچیده و چت چندمرحلهای است.",
|
||
"ernie-x1-turbo-32k.description": "ERNIE X1 Turbo 32K یک مدل تفکر سریع با زمینه ۳۲K برای استدلال پیچیده و گفتوگوی چندمرحلهای است.",
|
||
"ernie-x1.1-preview.description": "پیشنمایش ERNIE X1.1 یک مدل تفکر برای ارزیابی و آزمایش است.",
|
||
"ernie-x1.1.description": "ERNIE X1.1 یک مدل تفکر پیشنمایش برای ارزیابی و آزمایش است.",
|
||
"fal-ai/bytedance/seedream/v4.description": "Seedream 4.0 یک مدل تولید تصویر از تیم ByteDance Seed است که از ورودی متن و تصویر پشتیبانی میکند و تولید تصاویر بسیار باکیفیت و قابل کنترل را ارائه میدهد. این مدل تصاویر را بر اساس متن تولید میکند.",
|
||
"fal-ai/flux-kontext/dev.description": "مدل FLUX.1 با تمرکز بر ویرایش تصویر که از ورودیهای متنی و تصویری پشتیبانی میکند.",
|
||
"fal-ai/flux-pro/kontext.description": "FLUX.1 Kontext [pro] ورودیهای متنی و تصاویر مرجع را میپذیرد و امکان ویرایشهای محلی هدفمند و تغییرات پیچیده در صحنه کلی را فراهم میکند.",
|
||
"fal-ai/flux/krea.description": "Flux Krea [dev] یک مدل تولید تصویر با تمایل زیباییشناسی به تصاویر طبیعی و واقعگرایانهتر است.",
|
||
"fal-ai/flux/schnell.description": "FLUX.1 [schnell] یک مدل تولید تصویر با ۱۲ میلیارد پارامتر است که برای خروجی سریع و با کیفیت بالا طراحی شده است.",
|
||
"fal-ai/hunyuan-image/v3.description": "یک مدل قدرتمند بومی چندوجهی برای تولید تصویر.",
|
||
"fal-ai/imagen4/preview.description": "مدل تولید تصویر با کیفیت بالا از گوگل.",
|
||
"fal-ai/nano-banana.description": "Nano Banana جدیدترین، سریعترین و کارآمدترین مدل چندوجهی بومی گوگل است که امکان تولید و ویرایش تصویر از طریق مکالمه را فراهم میکند.",
|
||
"fal-ai/qwen-image-edit.description": "یک مدل ویرایش تصویر حرفهای از تیم Qwen که از ویرایش معنایی و ظاهری، ویرایش دقیق متن چینی و انگلیسی، و ویرایشهای باکیفیت مانند تغییر سبک و چرخش اشیا پشتیبانی میکند.",
|
||
"fal-ai/qwen-image.description": "یک مدل قدرتمند تولید تصویر از تیم Qwen با رندر عالی متن چینی و سبکهای بصری متنوع.",
|
||
"flux-1-schnell.description": "مدل تبدیل متن به تصویر با ۱۲ میلیارد پارامتر از Black Forest Labs که از تقطیر انتشار تقابلی نهفته برای تولید تصاویر با کیفیت بالا در ۱ تا ۴ مرحله استفاده میکند. این مدل با جایگزینهای بسته رقابت میکند و تحت مجوز Apache-2.0 برای استفاده شخصی، تحقیقاتی و تجاری منتشر شده است.",
|
||
"flux-dev.description": "مدل تولید تصویر متنباز برای تحقیق و توسعه، بهطور کارآمد برای پژوهشهای نوآورانهٔ غیرتجاری بهینهسازی شده است.",
|
||
"flux-kontext-max.description": "تولید و ویرایش تصویر متنی-زمینهای پیشرفته که متن و تصویر را برای نتایج دقیق و منسجم ترکیب میکند.",
|
||
"flux-kontext-pro.description": "تولید و ویرایش تصویر متنی-زمینهای پیشرفته که متن و تصویر را برای نتایج دقیق و منسجم ترکیب میکند.",
|
||
"flux-pro-1.1-ultra.description": "تولید تصویر با وضوح فوقالعاده بالا با خروجی ۴ مگاپیکسلی، تولید تصاویر شفاف در ۱۰ ثانیه.",
|
||
"flux-pro-1.1.description": "مدل ارتقاءیافته تولید تصویر حرفهای با کیفیت تصویر عالی و پیروی دقیق از دستورات.",
|
||
"flux-pro.description": "مدل تولید تصویر تجاری سطح بالا با کیفیت تصویر بینظیر و خروجیهای متنوع.",
|
||
"flux.1-schnell.description": "FLUX.1-schnell یک مدل تولید تصویر با عملکرد بالا برای خروجیهای سریع و چندسبکی است.",
|
||
"gemini-1.0-pro-001.description": "Gemini 1.0 Pro 001 (تنظیمشده) عملکردی پایدار و قابل تنظیم برای وظایف پیچیده ارائه میدهد.",
|
||
"gemini-1.0-pro-002.description": "Gemini 1.0 Pro 002 (تنظیمشده) پشتیبانی قوی چندوجهی برای وظایف پیچیده فراهم میکند.",
|
||
"gemini-1.0-pro-latest.description": "Gemini 1.0 Pro مدل هوش مصنوعی با عملکرد بالای گوگل است که برای مقیاسپذیری گسترده وظایف طراحی شده است.",
|
||
"gemini-1.5-flash-001.description": "Gemini 1.5 Flash 001 یک مدل چندوجهی کارآمد برای مقیاسپذیری گسترده کاربردها است.",
|
||
"gemini-1.5-flash-002.description": "Gemini 1.5 Flash 002 یک مدل چندوجهی کارآمد است که برای استقرار گسترده طراحی شده است.",
|
||
"gemini-1.5-flash-8b-exp-0924.description": "Gemini 1.5 Flash 8B 0924 جدیدترین مدل آزمایشی با پیشرفتهای قابل توجه در کاربردهای متنی و چندوجهی است.",
|
||
"gemini-1.5-flash-8b-latest.description": "Gemini 1.5 Flash 8B یک مدل چندوجهی کارآمد است که برای استقرار گسترده طراحی شده است.",
|
||
"gemini-1.5-flash-8b.description": "Gemini 1.5 Flash 8B یک مدل چندوجهی کارآمد برای مقیاسپذیری گسترده کاربردها است.",
|
||
"gemini-1.5-flash-exp-0827.description": "Gemini 1.5 Flash 0827 پردازش چندوجهی بهینهشده برای وظایف پیچیده ارائه میدهد.",
|
||
"gemini-1.5-flash-latest.description": "Gemini 1.5 Flash جدیدترین مدل چندوجهی هوش مصنوعی گوگل است که از ورودیهای متنی، تصویری و ویدیویی پشتیبانی میکند و پردازش سریع را برای مقیاسپذیری مؤثر در وظایف مختلف فراهم میسازد.",
|
||
"gemini-1.5-pro-001.description": "Gemini 1.5 Pro 001 یک راهکار چندوجهی مقیاسپذیر برای وظایف پیچیده است.",
|
||
"gemini-1.5-pro-002.description": "Gemini 1.5 Pro 002 جدیدترین مدل آماده تولید با خروجی با کیفیت بالاتر، بهویژه برای ریاضی، زمینههای طولانی و وظایف بصری است.",
|
||
"gemini-1.5-pro-exp-0801.description": "Gemini 1.5 Pro 0801 پردازش چندوجهی قوی با انعطافپذیری بیشتر برای توسعه برنامهها ارائه میدهد.",
|
||
"gemini-1.5-pro-exp-0827.description": "Gemini 1.5 Pro 0827 آخرین بهینهسازیها را برای پردازش چندوجهی کارآمدتر اعمال میکند.",
|
||
"gemini-1.5-pro-latest.description": "Gemini 1.5 Pro از حداکثر ۲ میلیون توکن پشتیبانی میکند و یک مدل چندوجهی میانرده ایدهآل برای وظایف پیچیده است.",
|
||
"gemini-2.0-flash-001.description": "Gemini 2.0 Flash ویژگیهای نسل بعدی از جمله سرعت استثنایی، استفاده بومی از ابزارها، تولید چندوجهی و پنجره زمینه ۱ میلیون توکن را ارائه میدهد.",
|
||
"gemini-2.0-flash-lite-001.description": "یک نسخه بهینهشده Gemini 2.0 Flash برای بهرهوری هزینه و تأخیر کم.",
|
||
"gemini-2.0-flash-lite.description": "یک نسخه بهینهشده Gemini 2.0 Flash برای بهرهوری هزینه و تأخیر کم.",
|
||
"gemini-2.0-flash.description": "Gemini 2.0 Flash ویژگیهای نسل بعدی از جمله سرعت استثنایی، استفاده بومی از ابزارها، تولید چندوجهی و پنجره زمینه ۱ میلیون توکن را ارائه میدهد.",
|
||
"gemini-2.5-flash-image.description": "Nano Banana جدیدترین، سریعترین و کارآمدترین مدل چندوجهی بومی گوگل است که تولید و ویرایش تصویری مکالمهای را ممکن میسازد.",
|
||
"gemini-2.5-flash-image:image.description": "Nano Banana جدیدترین، سریعترین و کارآمدترین مدل چندوجهی بومی گوگل است که تولید و ویرایش تصویری مکالمهای را ممکن میسازد.",
|
||
"gemini-2.5-flash-lite-preview-06-17.description": "نسخه پیشنمایش Gemini 2.5 Flash-Lite کوچکترین و مقرونبهصرفهترین مدل گوگل است که برای استفاده در مقیاس وسیع طراحی شده است.",
|
||
"gemini-2.5-flash-lite-preview-09-2025.description": "نسخه پیشنمایش (۲۵ سپتامبر ۲۰۲۵) از Gemini 2.5 Flash-Lite",
|
||
"gemini-2.5-flash-lite.description": "Gemini 2.5 Flash-Lite کوچکترین و مقرونبهصرفهترین مدل گوگل است که برای استفاده در مقیاس وسیع طراحی شده است.",
|
||
"gemini-2.5-flash-preview-04-17.description": "Gemini 2.5 Flash Preview مقرونبهصرفهترین مدل گوگل با قابلیتهای کامل است.",
|
||
"gemini-2.5-flash.description": "Gemini 2.5 Flash مقرونبهصرفهترین مدل گوگل با قابلیتهای کامل است.",
|
||
"gemini-2.5-pro-preview-03-25.description": "Gemini 2.5 Pro Preview پیشرفتهترین مدل استدلالی گوگل است که توانایی استدلال در کد، ریاضی و مسائل STEM را دارد و میتواند مجموعهدادههای بزرگ، پایگاههای کد و اسناد را با زمینه طولانی تحلیل کند.",
|
||
"gemini-2.5-pro-preview-05-06.description": "Gemini 2.5 Pro Preview پیشرفتهترین مدل استدلالی گوگل است که توانایی استدلال در کد، ریاضی و مسائل STEM را دارد و میتواند مجموعهدادههای بزرگ، پایگاههای کد و اسناد را با زمینه طولانی تحلیل کند.",
|
||
"gemini-2.5-pro.description": "Gemini 2.5 Pro پرچمدار مدلهای استدلالی گوگل است که از زمینههای طولانی برای انجام وظایف پیچیده پشتیبانی میکند.",
|
||
"gemini-3-flash-preview.description": "Gemini 3 Flash هوشمندترین مدل طراحیشده برای سرعت است که هوش پیشرفته را با قابلیت جستوجوی دقیق ترکیب میکند.",
|
||
"gemini-3-flash.description": "Gemini 3 Flash از Google — مدل بسیار سریع با پشتیبانی ورودی چندوجهی.",
|
||
"gemini-3-pro-image-preview.description": "Gemini 3 Pro Image (Nano Banana Pro) مدل تولید تصویر گوگل است که از گفتگوی چندوجهی نیز پشتیبانی میکند.",
|
||
"gemini-3-pro-image-preview:image.description": "Gemini 3 Pro Image (Nano Banana Pro) مدل تولید تصویر Google است و از گفتوگو چندوجهی نیز پشتیبانی میکند.",
|
||
"gemini-3-pro-preview.description": "Gemini 3 Pro قدرتمندترین مدل عامل و کدنویسی احساسی گوگل است که تعاملات بصری غنیتر و تعامل عمیقتری را بر پایه استدلال پیشرفته ارائه میدهد.",
|
||
"gemini-3.1-flash-image-preview.description": "Gemini 3.1 Flash Image (Nano Banana 2) سریعترین مدل تولید تصویر بومی گوگل با پشتیبانی از تفکر، تولید و ویرایش تصویر مکالمهای است.",
|
||
"gemini-3.1-flash-image-preview:image.description": "Gemini 3.1 Flash Image (Nano Banana 2) سریعترین مدل تولید تصویر بومی Google با پشتیبانی از تفکر، تولید مکالمهای تصویر و ویرایش تصویر است.",
|
||
"gemini-3.1-flash-lite-preview.description": "Gemini 3.1 Flash-Lite Preview اقتصادیترین مدل چندوجهی گوگل است که برای وظایف عاملمحور با حجم بالا، ترجمه و پردازش دادهها بهینه شده است.",
|
||
"gemini-3.1-pro-preview.description": "پیشنمایش Gemini 3.1 Pro قابلیتهای استدلال بهبود یافته را به Gemini 3 Pro اضافه میکند و از سطح تفکر متوسط پشتیبانی میکند.",
|
||
"gemini-3.1-pro.description": "Gemini 3.1 Pro از Google — مدل ممتاز چندوجهی با پنجره زمینه ۱ میلیون.",
|
||
"gemini-flash-latest.description": "آخرین نسخه منتشرشده از Gemini Flash",
|
||
"gemini-flash-lite-latest.description": "آخرین نسخه منتشرشده از Gemini Flash-Lite",
|
||
"gemini-pro-latest.description": "آخرین نسخه منتشرشده از Gemini Pro",
|
||
"gemma-7b-it.description": "Gemma 7B برای وظایف کوچک تا متوسط مقرونبهصرفه است.",
|
||
"gemma2-9b-it.description": "Gemma 2 9B برای وظایف خاص و یکپارچهسازی ابزارها بهینهسازی شده است.",
|
||
"gemma2.description": "Gemma 2 مدل کارآمد گوگل است که از برنامههای کوچک تا پردازش دادههای پیچیده را پوشش میدهد.",
|
||
"gemma2:27b.description": "Gemma 2 مدل کارآمد گوگل است که از برنامههای کوچک تا پردازش دادههای پیچیده را پوشش میدهد.",
|
||
"gemma2:2b.description": "Gemma 2 مدل کارآمد گوگل است که از برنامههای کوچک تا پردازش دادههای پیچیده را پوشش میدهد.",
|
||
"generalv3.5.description": "Spark Max کاملترین نسخه است که از جستجوی وب و افزونههای داخلی متعددی پشتیبانی میکند. قابلیتهای اصلی آن بهینهسازی شدهاند و نقشهای سیستمی و فراخوانی توابع عملکردی عالی در سناریوهای پیچیده ارائه میدهند.",
|
||
"generalv3.description": "Spark Pro یک مدل LLM با عملکرد بالا است که برای حوزههای حرفهای بهینهسازی شده و بر ریاضی، برنامهنویسی، سلامت و آموزش تمرکز دارد. این مدل از جستجوی وب و افزونههای داخلی مانند آبوهوا و تاریخ پشتیبانی میکند و در پرسشوپاسخ دانش پیچیده، درک زبان و تولید متن پیشرفته عملکرد قوی و کارآمدی دارد و گزینهای ایدهآل برای کاربردهای حرفهای است.",
|
||
"glm-4-0520.description": "GLM-4-0520 جدیدترین نسخه مدل است که برای وظایف بسیار پیچیده و متنوع با عملکرد عالی طراحی شده است.",
|
||
"glm-4-7.description": "GLM-4.7 جدیدترین مدل پرچمدار Zhipu AI است. این مدل تواناییهای برنامهنویسی، برنامهریزی بلندمدت وظایف و همکاری با ابزارها را برای سناریوهای Agentic Coding بهبود میبخشد و در چندین معیار عمومی عملکردی پیشرو در میان مدلهای متنباز دارد. پاسخها طبیعیتر و نوشتار غنیتر شدهاند. در وظایف پیچیده عامل، پیروی از دستورالعملها در هنگام استفاده از ابزارها قویتر است و زیباییشناسی رابط و کارایی انجام وظایف بلندمدت نیز بهبود یافته است.",
|
||
"glm-4-9b-chat.description": "GLM-4-9B-Chat در حوزههای معناشناسی، ریاضی، استدلال، کدنویسی و دانش عملکرد قوی دارد. همچنین از مرور وب، اجرای کد، فراخوانی ابزارهای سفارشی و استدلال متنهای طولانی پشتیبانی میکند و از ۲۶ زبان از جمله ژاپنی، کرهای و آلمانی پشتیبانی میکند.",
|
||
"glm-4-air-250414.description": "GLM-4-Air گزینهای با ارزش بالا است که عملکردی نزدیک به GLM-4 دارد، سرعت بالایی دارد و هزینه کمتری دارد.",
|
||
"glm-4-air.description": "GLM-4-Air گزینهای با ارزش بالا است که عملکردی نزدیک به GLM-4 دارد، سرعت بالایی دارد و هزینه کمتری دارد.",
|
||
"glm-4-airx.description": "GLM-4-AirX نسخهای کارآمدتر از GLM-4-Air است که تا ۲.۶ برابر استدلال سریعتری دارد.",
|
||
"glm-4-alltools.description": "GLM-4-AllTools یک مدل عامل چندمنظوره است که برای برنامهریزی دستورالعملهای پیچیده و استفاده از ابزارهایی مانند مرور وب، توضیح کد و تولید متن بهینهسازی شده و برای اجرای چندوظیفهای مناسب است.",
|
||
"glm-4-flash-250414.description": "GLM-4-Flash برای وظایف ساده ایدهآل است: سریعترین و رایگان.",
|
||
"glm-4-flash.description": "GLM-4-Flash برای وظایف ساده ایدهآل است: سریعترین و رایگان.",
|
||
"glm-4-flashx.description": "GLM-4-FlashX نسخه پیشرفته Flash با استدلال فوقالعاده سریع است.",
|
||
"glm-4-long.description": "GLM-4-Long از ورودیهای بسیار طولانی برای وظایف حافظهمحور و پردازش اسناد در مقیاس بزرگ پشتیبانی میکند.",
|
||
"glm-4-plus.description": "GLM-4-Plus پرچمدار با هوش بالا است که در مدیریت متنهای طولانی و وظایف پیچیده قوی عمل میکند و عملکرد کلی ارتقاء یافتهای دارد.",
|
||
"glm-4.1v-thinking-flash.description": "GLM-4.1V-Thinking قویترین مدل VLM شناختهشده با حدود ۱۰ میلیارد پارامتر است که وظایف پیشرفتهای مانند درک ویدیو، پرسشوپاسخ تصویری، حل مسائل موضوعی، OCR، خواندن اسناد و نمودارها، عاملهای رابط کاربری، کدنویسی فرانتاند و اتصال به واقعیت را پوشش میدهد. این مدل حتی از Qwen2.5-VL-72B که ۸ برابر بزرگتر است در بسیاری از وظایف پیشی میگیرد. با استفاده از یادگیری تقویتی پیشرفته، از استدلال زنجیرهای برای بهبود دقت و غنای پاسخها بهره میبرد و در نتایج و قابلیت توضیحپذیری از مدلهای سنتی بدون تفکر بهتر عمل میکند.",
|
||
"glm-4.1v-thinking-flashx.description": "GLM-4.1V-Thinking قویترین مدل VLM شناختهشده با حدود ۱۰ میلیارد پارامتر است که وظایف پیشرفتهای مانند درک ویدیو، پرسشوپاسخ تصویری، حل مسائل موضوعی، OCR، خواندن اسناد و نمودارها، عاملهای رابط کاربری، کدنویسی فرانتاند و اتصال به واقعیت را پوشش میدهد. این مدل حتی از Qwen2.5-VL-72B که ۸ برابر بزرگتر است در بسیاری از وظایف پیشی میگیرد. با استفاده از یادگیری تقویتی پیشرفته، از استدلال زنجیرهای برای بهبود دقت و غنای پاسخها بهره میبرد و در نتایج و قابلیت توضیحپذیری از مدلهای سنتی بدون تفکر بهتر عمل میکند.",
|
||
"glm-4.5-air.description": "نسخه سبک GLM-4.5 که بین عملکرد و هزینه تعادل برقرار میکند و از حالتهای تفکر ترکیبی انعطافپذیر پشتیبانی میکند.",
|
||
"glm-4.5-airx.description": "نسخه سریع GLM-4.5-Air با پاسخدهی سریعتر برای استفاده در مقیاس بالا و سرعت بالا.",
|
||
"glm-4.5-x.description": "نسخه سریع GLM-4.5 با عملکرد قوی و سرعت تولید تا ۱۰۰ توکن در ثانیه.",
|
||
"glm-4.5.description": "مدل پرچمدار Zhipu با حالت تفکر قابل تغییر، ارائهدهنده بهترین عملکرد متنباز و پشتیبانی از زمینه تا ۱۲۸ هزار توکن.",
|
||
"glm-4.5v.description": "مدل نسل بعدی بینایی و استدلال Zhipu با معماری MoE، دارای ۱۰۶ میلیارد پارامتر کل و ۱۲ میلیارد فعال، که در میان مدلهای چندوجهی متنباز همرده خود درک تصویر، ویدیو، اسناد و رابطهای گرافیکی را به سطح SOTA میرساند.",
|
||
"glm-4.6.description": "مدل پرچمدار جدید Zhipu با نام GLM-4.6 (۳۵۵ میلیارد پارامتر) در زمینههای برنامهنویسی پیشرفته، پردازش متون بلند، استدلال و تواناییهای عامل از نسخههای قبلی خود فراتر رفته است. این مدل بهویژه در توانایی برنامهنویسی با Claude Sonnet 4 همتراز است و به عنوان برترین مدل برنامهنویسی در چین شناخته میشود.",
|
||
"glm-4.6v-flash.description": "سری GLM-4.6V یک نسخه مهم از خانواده GLM در جهت چندوجهی است که شامل GLM-4.6V (پرچمدار)، GLM-4.6V-FlashX (سبک و پرسرعت) و GLM-4.6V-Flash (کاملاً رایگان) میشود. این مدل پنجره زمینه زمان آموزش را به 128k توکن گسترش میدهد، دقت درک بصری پیشرفتهای را در مقیاسهای پارامتری مشابه به دست میآورد و برای اولین بار قابلیتهای فراخوانی عملکرد (ابزار فراخوانی) را به طور بومی در معماری مدل بصری ادغام میکند. این امر خط لوله از «ادراک بصری» تا «اقدامات قابل اجرا» را یکپارچه میکند و پایه فنی سازگاری برای عوامل چندوجهی در سناریوهای تولید واقعی فراهم میآورد.",
|
||
"glm-4.6v-flashx.description": "سری GLM-4.6V یک نسخه مهم از خانواده GLM در جهت چندوجهی است که شامل GLM-4.6V (پرچمدار)، GLM-4.6V-FlashX (سبک و پرسرعت) و GLM-4.6V-Flash (کاملاً رایگان) میشود. این مدل پنجره زمینه زمان آموزش را به 128k توکن گسترش میدهد، دقت درک بصری پیشرفتهای را در مقیاسهای پارامتری مشابه به دست میآورد و برای اولین بار قابلیتهای فراخوانی عملکرد (ابزار فراخوانی) را به طور بومی در معماری مدل بصری ادغام میکند. این امر خط لوله از «ادراک بصری» تا «اقدامات قابل اجرا» را یکپارچه میکند و پایه فنی سازگاری برای عوامل چندوجهی در سناریوهای تولید واقعی فراهم میآورد.",
|
||
"glm-4.6v.description": "سری GLM-4.6V یک نسخه مهم از خانواده GLM در جهت چندوجهی است که شامل GLM-4.6V (پرچمدار)، GLM-4.6V-FlashX (سبک و پرسرعت) و GLM-4.6V-Flash (کاملاً رایگان) میشود. این مدل پنجره زمینه زمان آموزش را به 128k توکن گسترش میدهد، دقت درک بصری پیشرفتهای را در مقیاسهای پارامتری مشابه به دست میآورد و برای اولین بار قابلیتهای فراخوانی عملکرد (ابزار فراخوانی) را به طور بومی در معماری مدل بصری ادغام میکند. این امر خط لوله از «ادراک بصری» تا «اقدامات قابل اجرا» را یکپارچه میکند و پایه فنی سازگاری برای عوامل چندوجهی در سناریوهای تولید واقعی فراهم میآورد.",
|
||
"glm-4.7-flash.description": "GLM-4.7-Flash بهعنوان یک مدل سطح ۳۰ میلیاردی SOTA، گزینهای جدید برای تعادل بین عملکرد و کارایی ارائه میدهد. این مدل تواناییهای برنامهنویسی، برنامهریزی بلندمدت وظایف و همکاری با ابزارها را برای سناریوهای Agentic Coding بهبود میبخشد و در معیارهای فعلی در میان مدلهای متنباز همرده عملکردی پیشرو دارد.",
|
||
"glm-4.7-flashx.description": "GLM-4.7-Flash بهعنوان یک مدل سطح ۳۰ میلیاردی SOTA، گزینهای جدید برای تعادل بین عملکرد و کارایی ارائه میدهد. این مدل تواناییهای برنامهنویسی، برنامهریزی بلندمدت وظایف و همکاری با ابزارها را برای سناریوهای Agentic Coding بهبود میبخشد و در معیارهای فعلی در میان مدلهای متنباز همرده عملکردی پیشرو دارد.",
|
||
"glm-4.7.description": "GLM-4.7 جدیدترین مدل پرچمدار Zhipu است که برای سناریوهای برنامهنویسی عاملمحور بهینهسازی شده و دارای تواناییهای برنامهنویسی پیشرفتهتر، برنامهریزی وظایف بلندمدت و همکاری با ابزارها است. این مدل در چندین معیار عمومی عملکردی پیشرو در میان مدلهای متنباز دارد. تواناییهای عمومی آن با پاسخهای طبیعیتر و مختصرتر و نوشتاری جذابتر بهبود یافته است. در وظایف پیچیده عاملمحور، پیروی از دستورالعملها هنگام استفاده از ابزارها قویتر شده و زیبایی ظاهری رابط کاربری و کارایی انجام وظایف بلندمدت در Artifacts و برنامهنویسی عاملمحور ارتقا یافته است.",
|
||
"glm-4.description": "GLM-4 پرچمدار قدیمی است که در ژانویه ۲۰۲۴ منتشر شد و اکنون با GLM-4-0520 قویتر جایگزین شده است.",
|
||
"glm-4v-flash.description": "GLM-4V-Flash بر درک کارآمد تصویر تکی تمرکز دارد و برای سناریوهای تحلیلی سریع مانند پردازش تصویر بلادرنگ یا دستهای مناسب است.",
|
||
"glm-4v-plus-0111.description": "GLM-4V-Plus توانایی درک ویدیو و چند تصویر را دارد و برای وظایف چندوجهی مناسب است.",
|
||
"glm-4v-plus.description": "GLM-4V-Plus توانایی درک ویدیو و چند تصویر را دارد و برای وظایف چندوجهی مناسب است.",
|
||
"glm-4v.description": "GLM-4V درک تصویر و استدلال قوی در وظایف بصری را ارائه میدهد.",
|
||
"glm-5-turbo.description": "GLM-5-Turbo یک مدل پایه است که به طور عمیق برای سناریوهای عامل بهینه شده است. این مدل به طور خاص برای نیازهای اصلی وظایف عامل از مرحله آموزش بهینه شده است، و قابلیتهای کلیدی مانند فراخوانی ابزار، پیروی از دستورات، و اجرای زنجیره طولانی را بهبود میبخشد. این مدل برای ساخت دستیارهای عامل با عملکرد بالا ایدهآل است.",
|
||
"glm-5.1.description": "GLM-5.1 جدیدترین مدل پرچمدار Zhipu است که از نظر توانمندیهای کلی و برنامهنویسی همتراز با Claude Opus 4.6 است. این مدل در انجام وظایف بلندمدت عملکردی درخشان دارد و میتواند در قالب یک وظیفه واحد، تا ۸ ساعت بهصورت خودکار برنامهریزی، اجرا و تکرار کند؛ از این رو، پایهای ایدهآل برای عاملهای خودمختار و عاملهای برنامهنویسی بلندمدت به شمار میرود.",
|
||
"glm-5.description": "GLM-5 مدل پایه پرچمدار نسل بعدی Zhipu است که به طور خاص برای مهندسی عامل طراحی شده است. این مدل بهرهوری قابل اعتمادی را در مهندسی سیستمهای پیچیده و وظایف عامل با افق طولانی ارائه میدهد. در قابلیتهای کدنویسی و عامل، GLM-5 عملکرد پیشرفتهای در میان مدلهای متنباز به دست میآورد. در سناریوهای برنامهنویسی واقعی، تجربه کاربری آن به سطح Claude Opus 4.5 نزدیک میشود. این مدل در مهندسی سیستمهای پیچیده و وظایف عامل با افق طولانی برجسته است و آن را به یک مدل پایه ایدهآل برای دستیاران عامل عمومی تبدیل میکند.",
|
||
"glm-5v-turbo.description": "GLM-5V-Turbo اولین مدل پایه کدنویسی چندوجهی Zhipu است، که برای وظایف برنامهنویسی بصری طراحی شده است. این مدل میتواند ورودیهای چندوجهی مانند تصاویر، ویدئوها، و متن را به طور بومی پردازش کند، در حالی که در برنامهریزی بلندمدت، برنامهنویسی پیچیده، و اجرای اقدامات برتری دارد. این مدل به طور عمیق با جریانهای کاری عامل ادغام شده است و میتواند به طور یکپارچه با عواملی مانند Claude Code و OpenClaw همکاری کند تا یک چرخه کامل از \"درک محیط → برنامهریزی اقدامات → اجرای وظایف\" را تکمیل کند.",
|
||
"glm-image.description": "GLM-Image مدل جدید پرچمدار تولید تصویر Zhipu است. این مدل به طور کامل بر روی تراشههای تولید داخلی آموزش داده شده و از معماری ترکیبی اصلی که مدلسازی خودبازگشتی را با رمزگشای انتشار ترکیب میکند، استفاده میکند. این طراحی امکان درک قوی دستورالعملهای جهانی همراه با ارائه جزئیات دقیق محلی را فراهم میآورد و چالشهای طولانیمدت در تولید محتوای دانشمحور مانند پوسترها، ارائهها و نمودارهای آموزشی را برطرف میکند. این مدل نمایانگر یک اکتشاف مهم به سوی نسل جدیدی از پارادایمهای فناوری «تولید شناختی» است که توسط Nano Banana Pro نمونهسازی شده است.",
|
||
"glm-z1-air.description": "مدل استدلال با توانایی قوی در استنتاج عمیق برای وظایف پیچیده.",
|
||
"glm-z1-airx.description": "استدلال فوقسریع با کیفیت بالای استدلال.",
|
||
"glm-z1-flash.description": "سری GLM-Z1 استدلال پیچیده قوی را ارائه میدهد و در منطق، ریاضی و برنامهنویسی برتری دارد.",
|
||
"glm-z1-flashx.description": "سریع و کمهزینه: نسخه Flash با استدلال فوقسریع و همزمانی بیشتر.",
|
||
"glm-zero-preview.description": "GLM-Zero-Preview استدلال پیچیده قوی را ارائه میدهد و در منطق، ریاضی و برنامهنویسی برتری دارد.",
|
||
"global.anthropic.claude-haiku-4-5-20251001-v1:0.description": "Claude Haiku 4.5 سریعترین و هوشمندترین مدل Haiku از Anthropic است، با سرعت فوقالعاده و تفکر گسترده.",
|
||
"global.anthropic.claude-opus-4-5-20251101-v1:0.description": "Claude Opus 4.5 مدل پرچمدار Anthropic است که هوش استثنایی و عملکرد مقیاسپذیر را برای وظایف پیچیده با نیاز به پاسخهای باکیفیت و استدلال قوی ترکیب میکند.",
|
||
"global.anthropic.claude-opus-4-6-v1.description": "Claude Opus 4.6 هوشمندترین مدل Anthropic برای ساخت عوامل و کدنویسی است.",
|
||
"global.anthropic.claude-opus-4-7.description": "Claude Opus 4.7 توانمندترین مدل Anthropic برای استدلال پیچیده و کدنویسی ایجنتی است.",
|
||
"global.anthropic.claude-sonnet-4-5-20250929-v1:0.description": "Claude Sonnet 4.5 هوشمندترین مدل Anthropic تا به امروز است.",
|
||
"global.anthropic.claude-sonnet-4-6.description": "Claude Sonnet 4.6 بهترین ترکیب سرعت و هوش Anthropic است.",
|
||
"google/gemini-2.0-flash-001.description": "Gemini 2.0 Flash قابلیتهای نسل بعدی را ارائه میدهد، از جمله سرعت عالی، استفاده بومی از ابزارها، تولید چندوجهی و پنجره زمینهای ۱ میلیون توکن.",
|
||
"google/gemini-2.0-flash-lite-001.description": "Gemini 2.0 Flash Lite نسخه سبک Gemini است که بهطور پیشفرض تفکر را غیرفعال کرده تا تأخیر و هزینه را کاهش دهد، اما میتوان آن را از طریق پارامترها فعال کرد.",
|
||
"google/gemini-2.0-flash-lite.description": "Gemini 2.0 Flash Lite ویژگیهای نسل بعدی را ارائه میدهد، از جمله سرعت بالا، استفاده داخلی از ابزارها، تولید چندوجهی و پنجره زمینهای ۱ میلیون توکن.",
|
||
"google/gemini-2.0-flash.description": "Gemini 2.0 Flash مدل استدلال با عملکرد بالای گوگل برای وظایف چندوجهی گسترده است.",
|
||
"google/gemini-2.5-flash-image.description": "Gemini 2.5 Flash Image (Nano Banana) مدل تولید تصویر گوگل با پشتیبانی از گفتوگوی چندوجهی است.",
|
||
"google/gemini-2.5-flash-lite.description": "Gemini 2.5 Flash Lite نسخه سبک Gemini 2.5 است که برای تأخیر کم و هزینه پایین بهینه شده و برای سناریوهای با حجم بالا مناسب است.",
|
||
"google/gemini-2.5-flash-preview.description": "Gemini 2.5 Flash پیشرفتهترین مدل پرچمدار گوگل است که برای استدلال پیشرفته، برنامهنویسی، ریاضی و علوم طراحی شده است. این مدل دارای قابلیت تفکر داخلی است تا پاسخهایی با دقت بالاتر و پردازش زمینهای دقیقتر ارائه دهد.",
|
||
"google/gemini-2.5-flash-preview:thinking.description": "Gemini 2.5 Flash پیشرفتهترین مدل پرچمدار گوگل است که برای وظایف استدلالی، برنامهنویسی، ریاضی و علمی طراحی شده است. این مدل دارای قابلیت «تفکر» داخلی است که پاسخهایی با دقت بالاتر و پردازش زمینهای دقیقتر ارائه میدهد.\n\nتوجه: این مدل دو نسخه دارد — با تفکر و بدون تفکر. قیمتگذاری خروجی بهطور قابل توجهی بسته به فعال بودن تفکر متفاوت است. اگر نسخه استاندارد (بدون پسوند “:thinking”) را انتخاب کنید، مدل بهطور صریح از تولید توکنهای تفکر خودداری میکند.\n\nبرای استفاده از تفکر و دریافت توکنهای تفکر، باید نسخه “:thinking” را انتخاب کنید که هزینه بیشتری دارد.\n\nGemini 2.5 Flash همچنین میتواند از طریق پارامتر “max reasoning tokens” پیکربندی شود (https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning).",
|
||
"google/gemini-2.5-flash.description": "Gemini 2.5 Flash خانوادهای از گوگل است که از تأخیر کم تا استدلال با عملکرد بالا را پوشش میدهد.",
|
||
"google/gemini-2.5-pro-preview.description": "Gemini 2.5 Pro Preview پیشرفتهترین مدل تفکر گوگل برای استدلال در مسائل پیچیده کد، ریاضی و علوم است و برای تحلیل مجموعه دادههای بزرگ، پایگاههای کد و اسناد با زمینه طولانی مناسب است.",
|
||
"google/gemini-2.5-pro.description": "Gemini 2.5 Pro مدل پرچمدار استدلالی گوگل با پشتیبانی از زمینه طولانی برای وظایف پیچیده است.",
|
||
"google/gemini-3-pro-image-preview.description": "Gemini 3 Pro Image (Nano Banana Pro) مدل تولید تصویر گوگل با پشتیبانی از مکالمه چندحالته است.",
|
||
"google/gemini-3-pro-preview.description": "Gemini 3 Pro نسل بعدی مدل استدلال چندحالته در خانواده Gemini است که متن، صدا، تصویر و ویدیو را درک میکند و وظایف پیچیده و پایگاههای کد بزرگ را مدیریت میکند.",
|
||
"google/gemini-3.1-flash-image-preview.description": "Gemini 3.1 Flash Image Preview، معروف به \"Nano Banana 2,\" جدیدترین مدل پیشرفته گوگل برای تولید و ویرایش تصویر است، که کیفیت بصری در سطح حرفهای را با سرعت Flash ارائه میدهد. این مدل ترکیبی از درک زمینهای پیشرفته با استنتاج سریع و مقرون به صرفه است، که تولید تصویر پیچیده و ویرایشهای تکراری را به طور قابل توجهی در دسترستر میکند.",
|
||
"google/gemini-embedding-001.description": "مدل جاسازی پیشرفته با عملکرد قوی در وظایف انگلیسی، چندزبانه و کدنویسی.",
|
||
"google/gemini-flash-1.5.description": "Gemini 1.5 Flash پردازش چندحالته بهینهشده برای طیف وسیعی از وظایف پیچیده را ارائه میدهد.",
|
||
"google/gemini-pro-1.5.description": "Gemini 1.5 Pro آخرین بهینهسازیها را برای پردازش کارآمدتر دادههای چندحالته ترکیب میکند.",
|
||
"google/gemma-2-27b-it.description": "Gemma 2 27B یک مدل زبان عمومی با عملکرد قوی در سناریوهای مختلف است.",
|
||
"google/gemma-2-27b.description": "Gemma 2 خانواده مدلهای کارآمد گوگل برای استفاده از برنامههای کوچک تا پردازش دادههای پیچیده است.",
|
||
"google/gemma-2-2b-it.description": "مدل زبان کوچک پیشرفته طراحیشده برای برنامههای لبهای.",
|
||
"google/gemma-2-9b-it.description": "Gemma 2 9B، توسعهیافته توسط گوگل، پیروی مؤثر از دستورالعملها و توانایی کلی قوی را ارائه میدهد.",
|
||
"google/gemma-2-9b-it:free.description": "Gemma 2 خانواده مدلهای متن سبک و متنباز گوگل است.",
|
||
"google/gemma-2-9b.description": "Gemma 2 خانواده مدلهای کارآمد گوگل برای استفاده از برنامههای کوچک تا پردازش دادههای پیچیده است.",
|
||
"google/gemma-2b-it.description": "Gemma Instruct (2B) مدیریت پایهای دستورالعملها را برای برنامههای سبک ارائه میدهد.",
|
||
"google/gemma-3-12b-it.description": "Gemma 3 12B یک مدل زبان متنباز گوگل است که استاندارد جدیدی برای کارایی و عملکرد تعیین میکند.",
|
||
"google/gemma-3-27b-it.description": "Gemma 3 27B یک مدل زبان متنباز گوگل است که استاندارد جدیدی برای کارایی و عملکرد تعیین میکند.",
|
||
"google/text-embedding-005.description": "مدل جاسازی متن متمرکز بر زبان انگلیسی که برای وظایف کد و زبان انگلیسی بهینه شده است.",
|
||
"google/text-multilingual-embedding-002.description": "مدل جاسازی متن چندزبانه بهینهشده برای وظایف میانزبانی در زبانهای مختلف.",
|
||
"gpt-3.5-turbo-0125.description": "GPT 3.5 Turbo برای تولید و درک متن؛ در حال حاضر به gpt-3.5-turbo-0125 اشاره دارد.",
|
||
"gpt-3.5-turbo-1106.description": "GPT 3.5 Turbo برای تولید و درک متن؛ در حال حاضر به gpt-3.5-turbo-0125 اشاره دارد.",
|
||
"gpt-3.5-turbo-instruct.description": "GPT 3.5 Turbo برای وظایف تولید و درک متن، بهینهشده برای پیروی از دستورالعملها.",
|
||
"gpt-3.5-turbo.description": "GPT 3.5 Turbo برای تولید و درک متن؛ در حال حاضر به gpt-3.5-turbo-0125 اشاره دارد.",
|
||
"gpt-35-turbo-16k.description": "GPT-3.5 Turbo 16k یک مدل تولید متن با ظرفیت بالا برای وظایف پیچیده است.",
|
||
"gpt-35-turbo.description": "GPT-3.5 Turbo مدل کارآمد OpenAI برای چت و تولید متن است که از فراخوانی توابع بهصورت موازی پشتیبانی میکند.",
|
||
"gpt-4-0125-preview.description": "جدیدترین GPT-4 Turbo با قابلیت بینایی همراه است. درخواستهای تصویری از حالت JSON و فراخوانی توابع پشتیبانی میکنند. این مدل چندوجهی مقرونبهصرفه، تعادلی میان دقت و کارایی برای کاربردهای بلادرنگ ارائه میدهد.",
|
||
"gpt-4-0613.description": "GPT-4 پنجره متنی بزرگتری برای مدیریت ورودیهای طولانی فراهم میکند و برای ترکیب گسترده اطلاعات و تحلیل دادهها مناسب است.",
|
||
"gpt-4-1106-preview.description": "جدیدترین GPT-4 Turbo با قابلیت بینایی همراه است. درخواستهای تصویری از حالت JSON و فراخوانی توابع پشتیبانی میکنند. این مدل چندوجهی مقرونبهصرفه، تعادلی میان دقت و کارایی برای کاربردهای بلادرنگ ارائه میدهد.",
|
||
"gpt-4-32k-0613.description": "GPT-4 پنجره متنی بزرگتری برای مدیریت ورودیهای طولانی فراهم میکند و برای سناریوهایی که نیاز به ادغام گسترده اطلاعات و تحلیل داده دارند مناسب است.",
|
||
"gpt-4-32k.description": "GPT-4 پنجره متنی بزرگتری برای مدیریت ورودیهای طولانی فراهم میکند و برای سناریوهایی که نیاز به ادغام گسترده اطلاعات و تحلیل داده دارند مناسب است.",
|
||
"gpt-4-turbo-2024-04-09.description": "جدیدترین GPT-4 Turbo با قابلیت بینایی همراه است. درخواستهای تصویری از حالت JSON و فراخوانی توابع پشتیبانی میکنند. این مدل چندوجهی مقرونبهصرفه، تعادلی میان دقت و کارایی برای کاربردهای بلادرنگ ارائه میدهد.",
|
||
"gpt-4-turbo-preview.description": "جدیدترین GPT-4 Turbo با قابلیت بینایی همراه است. درخواستهای تصویری از حالت JSON و فراخوانی توابع پشتیبانی میکنند. این مدل چندوجهی مقرونبهصرفه، تعادلی میان دقت و کارایی برای کاربردهای بلادرنگ ارائه میدهد.",
|
||
"gpt-4-turbo.description": "جدیدترین GPT-4 Turbo با قابلیت بینایی همراه است. درخواستهای تصویری از حالت JSON و فراخوانی توابع پشتیبانی میکنند. این مدل چندوجهی مقرونبهصرفه، تعادلی میان دقت و کارایی برای کاربردهای بلادرنگ ارائه میدهد.",
|
||
"gpt-4-vision-preview.description": "پیشنمایش GPT-4 Vision، طراحیشده برای وظایف تحلیل و پردازش تصویر.",
|
||
"gpt-4.1-mini.description": "GPT-4.1 mini تعادلی میان هوش، سرعت و هزینه برقرار میکند و برای بسیاری از کاربردها جذاب است.",
|
||
"gpt-4.1-nano.description": "GPT-4.1 nano سریعترین و مقرونبهصرفهترین مدل GPT-4.1 است.",
|
||
"gpt-4.1.description": "GPT-4.1 مدل پرچمدار ما برای وظایف پیچیده و حل مسائل میاندامنهای است.",
|
||
"gpt-4.5-preview.description": "GPT-4.5-preview جدیدترین مدل عمومی با دانش عمیق از جهان و درک بهتر از نیت کاربر است که در وظایف خلاقانه و برنامهریزی عاملها بسیار قوی عمل میکند. تاریخ قطع دانش آن اکتبر ۲۰۲۳ است.",
|
||
"gpt-4.description": "GPT-4 پنجره متنی بزرگتری برای مدیریت ورودیهای طولانی فراهم میکند و برای ترکیب گسترده اطلاعات و تحلیل دادهها مناسب است.",
|
||
"gpt-4o-2024-05-13.description": "ChatGPT-4o مدلی پویا است که بهصورت بلادرنگ بهروزرسانی میشود و درک و تولید قوی را برای کاربردهای وسیع مانند پشتیبانی مشتری، آموزش و پشتیبانی فنی ترکیب میکند.",
|
||
"gpt-4o-2024-08-06.description": "ChatGPT-4o مدلی پویا است که بهصورت بلادرنگ بهروزرسانی میشود و درک و تولید قوی را برای کاربردهای وسیع مانند پشتیبانی مشتری، آموزش و پشتیبانی فنی ترکیب میکند.",
|
||
"gpt-4o-2024-11-20.description": "ChatGPT-4o مدلی پویا است که بهصورت بلادرنگ بهروزرسانی میشود و درک و تولید قوی را برای کاربردهای وسیع مانند پشتیبانی مشتری، آموزش و پشتیبانی فنی ترکیب میکند.",
|
||
"gpt-4o-audio-preview.description": "مدل پیشنمایش صوتی GPT-4o با ورودی و خروجی صوتی.",
|
||
"gpt-4o-mini-audio-preview.description": "مدل صوتی کوچک GPT-4o با ورودی و خروجی صوتی.",
|
||
"gpt-4o-mini-realtime-preview.description": "نسخه بلادرنگ GPT-4o-mini با ورودی/خروجی بلادرنگ صوتی و متنی.",
|
||
"gpt-4o-mini-search-preview.description": "پیشنمایش جستوجوی GPT-4o mini برای درک و اجرای پرسوجوهای جستوجوی وب از طریق API تکمیل چت. جستوجوی وب به ازای هر فراخوانی ابزار، علاوه بر هزینه توکن، محاسبه میشود.",
|
||
"gpt-4o-mini-transcribe.description": "GPT-4o Mini Transcribe مدلی برای تبدیل گفتار به متن است که با استفاده از GPT-4o دقت شناسایی کلمات، تشخیص زبان و صحت را نسبت به مدل Whisper اصلی بهبود میبخشد.",
|
||
"gpt-4o-mini-tts.description": "GPT-4o mini TTS مدلی برای تبدیل متن به گفتار است که بر پایه GPT-4o mini ساخته شده و متن را به گفتاری طبیعی تبدیل میکند (حداکثر ورودی ۲۰۰۰ توکن).",
|
||
"gpt-4o-mini.description": "GPT-4o mini جدیدترین مدل OpenAI پس از GPT-4 Omni است که از ورودی متن+تصویر و خروجی متنی پشتیبانی میکند. این مدل پیشرفتهترین مدل کوچک آنهاست، بسیار ارزانتر از مدلهای پیشرفته اخیر و بیش از ۶۰٪ ارزانتر از GPT-3.5 Turbo، در حالی که هوش سطح بالا (۸۲٪ MMLU) را حفظ میکند.",
|
||
"gpt-4o-realtime-preview-2024-10-01.description": "نسخه بلادرنگ GPT-4o با ورودی/خروجی بلادرنگ صوتی و متنی.",
|
||
"gpt-4o-realtime-preview-2025-06-03.description": "نسخه بلادرنگ GPT-4o با ورودی/خروجی بلادرنگ صوتی و متنی.",
|
||
"gpt-4o-realtime-preview.description": "نسخه بلادرنگ GPT-4o با ورودی/خروجی بلادرنگ صوتی و متنی.",
|
||
"gpt-4o-search-preview.description": "پیشنمایش جستوجوی GPT-4o برای درک و اجرای پرسوجوهای جستوجوی وب از طریق API تکمیل چت. جستوجوی وب به ازای هر فراخوانی ابزار، علاوه بر هزینه توکن، محاسبه میشود.",
|
||
"gpt-4o-transcribe.description": "GPT-4o Transcribe مدلی برای تبدیل گفتار به متن است که با استفاده از GPT-4o دقت شناسایی کلمات، تشخیص زبان و صحت را نسبت به مدل Whisper اصلی بهبود میبخشد.",
|
||
"gpt-4o.description": "ChatGPT-4o مدلی پویا و بهروزرسانیشونده در زمان واقعی است که درک و تولید قوی را برای کاربردهای وسیع مانند پشتیبانی مشتری، آموزش و پشتیبانی فنی ترکیب میکند.",
|
||
"gpt-5-chat-latest.description": "مدل GPT-5 مورد استفاده در ChatGPT که درک و تولید قوی را برای کاربردهای مکالمهای ترکیب میکند.",
|
||
"gpt-5-chat.description": "GPT-5 Chat یک مدل پیشنمایش بهینهشده برای سناریوهای مکالمهای است. از ورودی متن و تصویر پشتیبانی میکند، فقط خروجی متنی دارد و برای چتباتها و برنامههای هوش مصنوعی مکالمهای مناسب است.",
|
||
"gpt-5-codex.description": "GPT-5 Codex از OpenAI — نسخه تخصصی کدنویسی با پشتیبانی از ابزار.",
|
||
"gpt-5-mini.description": "نسخهای سریعتر و مقرونبهصرفهتر از GPT-5 برای وظایف مشخص، با پاسخهای سریعتر در عین حفظ کیفیت.",
|
||
"gpt-5-nano.description": "GPT-5 Nano از OpenAI — مدلی سبک و مقرونبهصرفه.",
|
||
"gpt-5-pro.description": "GPT-5 pro از منابع محاسباتی بیشتر برای تفکر عمیقتر استفاده میکند و بهطور مداوم پاسخهای بهتری ارائه میدهد.",
|
||
"gpt-5.1-chat-latest.description": "GPT-5.1 Chat: نسخه ChatGPT از GPT-5.1، ساختهشده برای سناریوهای چت.",
|
||
"gpt-5.1-codex-max.description": "GPT-5.1 Codex Max از OpenAI — قدرتمندترین نسخه Codex.",
|
||
"gpt-5.1-codex-mini.description": "GPT-5.1 Codex Mini از OpenAI — مدل فشرده کدنویسی با تواناییهای قوی.",
|
||
"gpt-5.1-codex.description": "GPT-5.1 Codex از OpenAI — نسخه متمرکز بر کدنویسی با استفاده بهتر از ابزار.",
|
||
"gpt-5.1.description": "GPT-5.1 از OpenAI — نسخه بهبودیافته GPT-5 با دقت استدلال بهتر.",
|
||
"gpt-5.2-chat-latest.description": "GPT-5.2 Chat نسخه ChatGPT برای تجربه آخرین بهبودهای مکالمهای است.",
|
||
"gpt-5.2-codex.description": "GPT-5.2 Codex از OpenAI — نسخه تخصصی کدنویسی با دقت بالاتر در فراخوانی ابزار.",
|
||
"gpt-5.2-pro.description": "GPT-5.2 Pro: نسخهای هوشمندتر و دقیقتر از GPT-5.2 (فقط از طریق API پاسخها)، مناسب برای مسائل دشوار و استدلال چندمرحلهای طولانی.",
|
||
"gpt-5.2.description": "GPT-5.2 از OpenAI — نسخه ارتقایافته با استدلال و پردازش چندوجهی بهتر.",
|
||
"gpt-5.3-chat-latest.description": "GPT-5.3 Chat جدیدترین مدل ChatGPT است که تجربههای مکالمهای بهبودیافتهای ارائه میدهد.",
|
||
"gpt-5.3-codex-spark.description": "GPT-5.3 Codex Spark از OpenAI — مدل فشرده کدنویسی بهینه برای سرعت.",
|
||
"gpt-5.3-codex.description": "GPT-5.3 Codex از OpenAI — نسخه جدید Codex با درک بهتر کد.",
|
||
"gpt-5.4-mini.description": "GPT-5.4 Mini از OpenAI — مدلی کارآمد با توازن میان هزینه و عملکرد.",
|
||
"gpt-5.4-nano.description": "GPT-5.4 Nano از OpenAI — مدلی فوقسبک برای وظایف با حجم بالا.",
|
||
"gpt-5.4-pro.description": "GPT-5.4 Pro از OpenAI — توانمندترین مدل با بیشترین زمینه و پیشرفتهترین استدلال.",
|
||
"gpt-5.4.description": "GPT-5.4 از OpenAI — مدل نسل جدید با پنجره زمینه بالای ۱ میلیون و ورودی چندوجهی.",
|
||
"gpt-5.5-pro.description": "GPT-5.5 Pro از محاسبات بیشتر برای ارائه پاسخهای دقیقتر و بهتر استفاده میکند.",
|
||
"gpt-5.5.description": "GPT-5.5 مدل پیشرو برای کارهای حرفهای بسیار پیچیده، کدنویسی و وظایف ایجنتی است.",
|
||
"gpt-5.description": "GPT-5 از OpenAI — مدل پرچمدار با استدلال پیشرفته و ورودی چندوجهی.",
|
||
"gpt-audio.description": "GPT Audio یک مدل چت عمومی برای ورودی/خروجی صوتی است که در API تکمیل چت پشتیبانی میشود.",
|
||
"gpt-image-1-mini.description": "نسخه کمهزینهتر GPT Image 1 با ورودی بومی متن و تصویر و خروجی تصویری.",
|
||
"gpt-image-1.5.description": "مدل بهبودیافته GPT Image 1 با تولید ۴ برابر سریعتر، ویرایش دقیقتر و رندر بهتر متن.",
|
||
"gpt-image-1.description": "مدل تولید تصویر چندوجهی بومی ChatGPT.",
|
||
"gpt-image-2.description": "مدل چندوجهی نسل جدید OpenAI برای تولید تصویر با استدلال بومی، وضوح تا 4K، رندر تقریباً بیعیب متن و پشتیبانی چندزبانه دقیق.",
|
||
"gpt-oss-120b.description": "دسترسی نیاز به درخواست دارد. GPT-OSS-120B یک مدل زبان بزرگ متنباز از OpenAI با توانایی قوی در تولید متن است.",
|
||
"gpt-oss-20b.description": "دسترسی نیاز به درخواست دارد. GPT-OSS-20B یک مدل زبان میانرده متنباز از OpenAI با تولید متن کارآمد است.",
|
||
"gpt-oss:120b.description": "GPT-OSS 120B مدل LLM بزرگ متنباز OpenAI با کوانتیزاسیون MXFP4 است که به عنوان مدل پرچمدار معرفی شده. نیازمند محیط چند GPU یا ایستگاه کاری پیشرفته است و در استدلال پیچیده، تولید کد و پردازش چندزبانه عملکرد عالی دارد، با قابلیت فراخوانی توابع پیشرفته و ادغام ابزارها.",
|
||
"gpt-oss:20b.description": "GPT-OSS 20B یک LLM متنباز از OpenAI با کوانتیزاسیون MXFP4 است که برای GPUهای مصرفی پیشرفته یا مکهای Apple Silicon مناسب است. در تولید گفتوگو، برنامهنویسی و وظایف استدلالی عملکرد خوبی دارد و از فراخوانی توابع و استفاده از ابزارها پشتیبانی میکند.",
|
||
"gpt-realtime.description": "مدل بلادرنگ عمومی با پشتیبانی از ورودی/خروجی بلادرنگ متن و صوت، بهعلاوه ورودی تصویری.",
|
||
"grok-3-mini.description": "Grok 3 Mini از xAI — مدل سریع با استدلال قوی.",
|
||
"grok-3.description": "Grok 3 از xAI — با توانایی استدلال قدرتمند.",
|
||
"grok-4-0709.description": "Grok 4 از xAI با توانایی استدلال قوی.",
|
||
"grok-4-1-fast-non-reasoning.description": "مدل چندوجهی پیشرفتهای که برای استفاده از ابزارهای عامل با عملکرد بالا بهینهسازی شده است.",
|
||
"grok-4-1-fast-reasoning.description": "مدل چندوجهی پیشرفتهای که برای استفاده از ابزارهای عامل با عملکرد بالا بهینهسازی شده است.",
|
||
"grok-4-20-non-reasoning.description": "نسخه بدون استدلال برای کاربردهای ساده.",
|
||
"grok-4-20-reasoning.description": "مدلی هوشمند و بسیار سریع که قبل از پاسخ استدلال میکند.",
|
||
"grok-4-fast-non-reasoning.description": "با افتخار Grok 4 Fast را معرفی میکنیم، جدیدترین پیشرفت ما در مدلهای استدلال مقرونبهصرفه.",
|
||
"grok-4-fast-reasoning.description": "با افتخار Grok 4 Fast را معرفی میکنیم، جدیدترین پیشرفت ما در مدلهای استدلال مقرونبهصرفه.",
|
||
"grok-4.20-0309-non-reasoning.description": "نسخه بدون استدلال برای کاربردهای ساده.",
|
||
"grok-4.20-0309-reasoning.description": "مدلی هوشمند و بسیار سریع که قبل از پاسخ استدلال میکند.",
|
||
"grok-4.20-multi-agent-0309.description": "مجموعهای از ۴ یا ۱۶ ایجنت که در پژوهش عملکرد عالی دارد. در حال حاضر از ابزارهای سمت کاربر پشتیبانی نمیکند و تنها ابزارهای سمت سرور xAI (مانند X Search و Web Search) و ابزارهای MCP از راه دور را پشتیبانی میکند.",
|
||
"grok-4.description": "جدیدترین مدل پرچمدار Grok با عملکرد بیرقیب در زبان، ریاضیات و استدلال — یک مدل همهفنحریف. در حال حاضر به grok-4-0709 اشاره دارد؛ به دلیل محدودیت منابع، قیمت آن موقتاً ۱۰٪ بالاتر از قیمت رسمی است و بعداً به قیمت رسمی بازمیگردد.",
|
||
"grok-code-fast-1.description": "با افتخار grok-code-fast-1 را معرفی میکنیم، مدلی سریع و مقرونبهصرفه برای استدلال که در برنامهنویسی عاملمحور عملکرد درخشانی دارد.",
|
||
"grok-imagine-image-pro.description": "تصاویر را از دستورات متنی تولید کنید، تصاویر موجود را با زبان طبیعی ویرایش کنید، یا تصاویر را از طریق مکالمات چندمرحلهای بهطور مکرر اصلاح کنید.",
|
||
"grok-imagine-image.description": "تصاویر را از دستورات متنی تولید کنید، تصاویر موجود را با زبان طبیعی ویرایش کنید، یا تصاویر را از طریق مکالمات چندمرحلهای بهطور مکرر اصلاح کنید.",
|
||
"grok-imagine-video.description": "تولید ویدئو پیشرفته در کیفیت، هزینه، و تأخیر.",
|
||
"groq/compound-mini.description": "Compound-mini یک سیستم هوش مصنوعی ترکیبی است که با مدلهای عمومی پشتیبانیشده در GroqCloud کار میکند و بهصورت هوشمندانه و انتخابی از ابزارها برای پاسخ به پرسشهای کاربران استفاده میکند.",
|
||
"groq/compound.description": "Compound یک سیستم هوش مصنوعی ترکیبی است که با چندین مدل عمومی پشتیبانیشده در GroqCloud کار میکند و بهصورت هوشمندانه و انتخابی از ابزارها برای پاسخ به پرسشهای کاربران استفاده میکند.",
|
||
"gryphe/mythomax-l2-13b.description": "MythoMax L2 13B یک مدل زبانی خلاق و هوشمند است که از ترکیب چندین مدل برتر ساخته شده است.",
|
||
"happyhorse-1.0-i2v.description": "HappyHorse-1.0-I2V از تبدیل متن به ویدئو پشتیبانی میکند و تصاویر پویا را با دقت بالا تولید میکند. مدل قادر است معنای متن را بهطور دقیق درک کرده و ویدئوهایی باکیفیت، روان و طبیعی تولید کند.",
|
||
"happyhorse-1.0-r2v.description": "HappyHorse-1.0-R2V از تولید ویدئو مبتنی بر تصویر مرجع پشتیبانی میکند و ثبات بیشتری در چهره، موضوع و صحنه ارائه میدهد. این مدل از تا ۹ تصویر مرجع پشتیبانی کرده و نیت خلاقه را با دقت حفظ میکند.",
|
||
"happyhorse-1.0-t2v.description": "HappyHorse-1.0-T2V از تولید ویدئو از متن پشتیبانی میکند و تصاویر پویا را با دقت بالا ارائه میدهد. مدل معنای متن را بهدرستی درک کرده و ویدئوهای روان، طبیعی و پرجزئیات تولید میکند.",
|
||
"hunyuan-2.0-instruct-20251111.description": "پایه مدل بهطور کامل ارتقا یافته است و تواناییهای هستهای قدرتمندتری ارائه میدهد. در دانش، ریاضیات، نوشتن و استدلال عملکرد سطحبالایی دارد. همچنین در پیروی از دستورات، تعاملات چندمرحلهای و درک متن بلند بسیار خوب عمل میکند.",
|
||
"hunyuan-2.0-thinking-20251109.description": "متخصص در تولید محتوای خلاقانه، تعاملات چندمرحلهای و سناریوهای عملی پیروی از دستور. تواناییهای ریاضی، کدنویسی و وظایف مبتنی بر ایجنت را بهطور چشمگیری تقویت کرده است.",
|
||
"hunyuan-code.description": "جدیدترین مدل کدنویسی Hunyuan که بر اساس دادههای کد با کیفیت بالا بهمیزان 200 میلیارد و شش ماه داده SFT آموزش داده شده است، با زمینه 8K. این مدل در معیارهای کدنویسی خودکار و ارزیابیهای انسانی متخصص در پنج زبان رتبه بالایی دارد.",
|
||
"hunyuan-functioncall.description": "جدیدترین مدل MoE FunctionCall Hunyuan که بر اساس دادههای فراخوانی ابزار با کیفیت بالا آموزش داده شده است، با پنجره زمینه 32K و معیارهای پیشرو در ابعاد مختلف.",
|
||
"hunyuan-lite.description": "با ارتقا به معماری MoE با پنجره زمینه ۲۵۶ هزار، از بسیاری از مدلهای متنباز در معیارهای NLP، کد، ریاضی و حوزههای تخصصی پیشی میگیرد.",
|
||
"hunyuan-pro.description": "مدل MoE با تریلیون پارامتر و پنجره زمینه ۳۲ هزار که در ارزیابیها پیشتاز است، در دستورالعملهای پیچیده و استدلال، ریاضی پیشرفته، تماس تابع و ترجمه چندزبانه، مالی، حقوقی و پزشکی عملکرد قوی دارد.",
|
||
"hunyuan-role-latest.description": "برای سناریوهای نقشآفرینی طراحی شده است و همترازسازی شخصیتی بسیار دقیق و گفتوگوی طبیعی و انسانمانند ارائه میدهد. همچنین روایت جذاب، پیشبرد داستان و همراهی احساسی قوی فراهم میکند.",
|
||
"hunyuan-role.description": "جدیدترین مدل نقشآفرینی Hunyuan که بهطور رسمی با دادههای نقشآفرینی تنظیم شده است و عملکرد پایه قویتری در سناریوهای نقشآفرینی ارائه میدهد.",
|
||
"hunyuan-standard-256K.description": "با استفاده از مسیریابی ارتقایافته برای کاهش عدمتعادل بار و فروپاشی متخصصها. عملکرد «سوزن در انبار کاه» متن بلند به ۹۹.۹٪ میرسد. مدل MOE-256K با افزایش طول و کیفیت، ظرفیت ورودی را بهطور چشمگیری گسترش میدهد.",
|
||
"hunyuan-standard.description": "با استفاده از مسیریابی ارتقایافته برای کاهش عدمتعادل بار و فروپاشی متخصصها. عملکرد «سوزن در انبار کاه» متن بلند به ۹۹.۹٪ میرسد. نسخه MOE-32K نسبت به قیمت، ارزش بالاتری ارائه میدهد و توازن کیفیت/هزینه را برای ورودی متن بلند برقرار میکند.",
|
||
"hunyuan-turbo.description": "پیشنمایشی از مدل LLM نسل بعدی Hunyuan با معماری جدید MoE، ارائهدهنده استدلال سریعتر و نتایج قویتر نسبت به hunyuan-pro.",
|
||
"hunyuan-vision.description": "جدیدترین مدل چندوجهی Hunyuan که از ورودیهای تصویر + متن برای تولید متن پشتیبانی میکند.",
|
||
"hy-image-lite.description": "این مدل از کدک فشردهسازی فوقالعاده استفاده میکند تا تولید تصویر سریع را با حفظ کیفیت بالا ممکن کند. از کاربردهایی مانند بهبود تصاویر محصولات تجارت الکترونیک، تولید داراییهای طراحی و توسعه صحنههای بازی پشتیبانی میکند.",
|
||
"hy-image-v3.0.description": "بر پایه مدل بزرگ Hunyuan، قادر به استدلال درباره چیدمان، ترکیب و قلمگذاری تصویر است و از دانش جهان برای استنتاج صحنههای بصری متداول استفاده میکند. همچنین قادر به درک معانی پیچیده در سطح هزاران کاراکتر، تولید محتوای متنی بلند، کمیکهای پیچیده، میمها و تولید تصاویر آموزشی زنده و جذاب است.",
|
||
"hy-video-1.5.description": "این مدل از ورودیهای چندوجهی شامل متن و تصویر پشتیبانی کرده و ویدئوهای باکیفیت با امکان گذار صحنه و تعامل چند کاراکتر تولید میکند. این مدل جریان تولید ویدئو را سادهتر کرده و هزینهها را کاهش میدهد؛ برای تبلیغات سازمانی، بازاریابی و کاربردهای خلاقانه مناسب است.",
|
||
"hy3-preview.description": "Hunyuan Hy3 Preview برای بارهای کاری ایجنت طراحی شده و از معماری Mixture-of-Experts با ۲۹۵ میلیارد پارامتر کل و ۲۱ میلیارد پارامتر فعال استفاده میکند. سه حالت no_think (پاسخ فوقسریع)، think_low (استدلال سریع) و think_high (استدلال عمیق) را برای نیازهای مختلف تأخیر و عمق ارائه میدهد. عملکردی نزدیک به بهترینهای جهان در معیارهای کد مانند SWE-bench Verified داشته و از پنجره زمینه ۲۵۶ هزار برای بازآرایی کد چندفایلی و تحلیل اسناد بلند پشتیبانی میکند. این مدل برای توسعهدهندگانی مناسب است که به اتمام قابل اعتماد وظایف با هزینه استنتاج پایین نیاز دارند.",
|
||
"image-01-live.description": "مدل تولید تصویر با جزئیات دقیق، پشتیبانی از تبدیل متن به تصویر و تنظیمات سبک قابل کنترل.",
|
||
"image-01.description": "مدل جدید تولید تصویر با جزئیات دقیق، پشتیبانی از تبدیل متن به تصویر و تصویر به تصویر.",
|
||
"imagen-4.0-fast-generate-001.description": "نسخه سریع از سری مدلهای تبدیل متن به تصویر نسل چهارم Imagen",
|
||
"imagen-4.0-generate-001.description": "سری مدلهای تبدیل متن به تصویر نسل چهارم Imagen",
|
||
"imagen-4.0-ultra-generate-001.description": "نسخه Ultra از سری مدلهای تبدیل متن به تصویر نسل چهارم Imagen",
|
||
"inception/mercury-coder-small.description": "Mercury Coder Small برای تولید کد، اشکالزدایی و بازسازی کد با کمترین تأخیر ایدهآل است.",
|
||
"inclusionAI/Ling-flash-2.0.description": "Ling-flash-2.0 سومین مدل معماری Ling 2.0 از تیم Bailing گروه Ant است. این مدل MoE با ۱۰۰ میلیارد پارامتر کل و تنها ۶.۱ میلیارد فعال در هر توکن (۴.۸ میلیارد بدون جاسازی) است. با وجود پیکربندی سبک، عملکردی برابر یا بهتر از مدلهای چگال ۴۰B و حتی MoEهای بزرگتر در چندین معیار دارد و کارایی بالا را از طریق معماری و استراتژی آموزش بررسی میکند.",
|
||
"inclusionAI/Ling-mini-2.0.description": "Ling-mini-2.0 یک مدل MoE کوچک و با عملکرد بالا با ۱۶ میلیارد پارامتر کل و تنها ۱.۴ میلیارد فعال در هر توکن (۷۸۹ میلیون بدون جاسازی) است که تولید بسیار سریعی دارد. با طراحی کارآمد MoE و دادههای آموزشی با کیفیت بالا، عملکردی در سطح بالا ارائه میدهد که با مدلهای چگال زیر ۱۰B و MoEهای بزرگتر قابل مقایسه است.",
|
||
"inclusionAI/Ring-flash-2.0.description": "Ring-flash-2.0 یک مدل تفکر با عملکرد بالا است که از Ling-flash-2.0-base بهینهسازی شده است. از معماری MoE با ۱۰۰ میلیارد پارامتر کل و تنها ۶.۱ میلیارد فعال در هر استنتاج استفاده میکند. الگوریتم icepop آموزش RL را برای مدلهای MoE پایدار میسازد و امکان پیشرفت در استدلال پیچیده را فراهم میکند. در معیارهای دشوار (مسابقات ریاضی، تولید کد، استدلال منطقی) پیشرفتهای بزرگی دارد و از مدلهای چگال برتر زیر ۴۰B پیشی میگیرد و با مدلهای MoE باز و بسته بزرگتر رقابت میکند. همچنین در نوشتن خلاقانه عملکرد خوبی دارد و معماری کارآمد آن استنتاج سریع با هزینه کمتر برای همزمانی بالا را ارائه میدهد.",
|
||
"inclusionai/ling-1t.description": "Ling-1T مدل MoE با ۱ تریلیون پارامتر از inclusionAI است که برای وظایف استدلال شدید و بارهای کاری با زمینه بزرگ بهینه شده است.",
|
||
"inclusionai/ling-flash-2.0.description": "Ling-flash-2.0 مدل MoE از inclusionAI است که برای کارایی و عملکرد استدلال بهینه شده و برای وظایف متوسط تا بزرگ مناسب است.",
|
||
"inclusionai/ling-mini-2.0.description": "Ling-mini-2.0 مدل MoE سبک از inclusionAI است که هزینه را بهطور قابل توجهی کاهش میدهد در حالی که توانایی استدلال را حفظ میکند.",
|
||
"inclusionai/ming-flash-omini-preview.description": "Ming-flash-omni Preview مدل چندوجهی inclusionAI است که از ورودیهای صوتی، تصویری و ویدیویی پشتیبانی میکند و رندر تصویر و تشخیص گفتار را بهبود میبخشد.",
|
||
"inclusionai/ring-1t.description": "Ring-1T مدل MoE با یک تریلیون پارامتر از inclusionAI برای وظایف استدلال در مقیاس بزرگ و تحقیقات مناسب است.",
|
||
"inclusionai/ring-flash-2.0.description": "Ring-flash-2.0 گونهای از مدل Ring از inclusionAI برای سناریوهای با توان بالا است که بر سرعت و کارایی هزینه تأکید دارد.",
|
||
"inclusionai/ring-mini-2.0.description": "Ring-mini-2.0 مدل MoE سبک و با توان بالا از inclusionAI است که برای همزمانی طراحی شده است.",
|
||
"intern-latest.description": "بهطور پیشفرض به جدیدترین مدل منتشر شده سری Intern اشاره دارد، که در حال حاضر به intern-s1-pro تنظیم شده است.",
|
||
"intern-s1-mini.description": "یک مدل بزرگ چندوجهی سبک با قابلیتهای استدلال علمی قوی.",
|
||
"intern-s1-pro.description": "ما پیشرفتهترین مدل استدلال چندوجهی متنباز خود را راهاندازی کردهایم، که در حال حاضر بهترین مدل بزرگ زبان چندوجهی متنباز از نظر عملکرد کلی است.",
|
||
"intern-s1.description": "مدل استدلال چندوجهی متنباز نه تنها قابلیتهای عمومی قوی نشان میدهد، بلکه عملکرد پیشرفتهای در طیف گستردهای از وظایف علمی دارد.",
|
||
"internlm/internlm2_5-7b-chat.description": "InternLM2.5-7B-Chat یک مدل چت متنباز بر پایه معماری InternLM2 است. این مدل ۷B بر تولید گفتوگو تمرکز دارد و از زبانهای چینی و انگلیسی پشتیبانی میکند و با آموزش مدرن، گفتوگویی روان و هوشمند ارائه میدهد. برای بسیاری از سناریوهای چت مانند پشتیبانی مشتری و دستیار شخصی مناسب است.",
|
||
"internvl2.5-38b-mpo.description": "InternVL2.5 38B MPO یک مدل پیشآموزش چندوجهی برای استدلال پیچیده تصویر-متن است.",
|
||
"internvl3-14b.description": "InternVL3 14B یک مدل چندوجهی با اندازه متوسط است که بین عملکرد و هزینه تعادل برقرار میکند.",
|
||
"internvl3-1b.description": "InternVL3 1B یک مدل چندوجهی سبک برای استقرار در محیطهای با منابع محدود است.",
|
||
"internvl3-38b.description": "InternVL3 38B یک مدل چندوجهی متنباز بزرگ برای درک دقیق تصویر-متن است.",
|
||
"internvl3.5-241b-a28b.description": "مدل بزرگ چندوجهی تازه منتشر شده ما قابلیتهای درک تصویر و متن پیشرفته و درک تصویر با دنباله طولانی را ارائه میدهد و عملکردی قابل مقایسه با مدلهای متنبسته پیشرو دارد.",
|
||
"internvl3.5-latest.description": "بهطور پیشفرض به جدیدترین مدل در سری InternVL3.5 اشاره دارد، که در حال حاضر به internvl3.5-241b-a28b تنظیم شده است.",
|
||
"irag-1.0.description": "ERNIE iRAG یک مدل تولید تقویتشده با بازیابی تصویر برای جستجوی تصویر، بازیابی تصویر-متن و تولید محتوا است.",
|
||
"jamba-large.description": "پیشرفتهترین و قدرتمندترین مدل ما، طراحیشده برای وظایف پیچیده سازمانی با عملکرد برجسته.",
|
||
"jamba-mini.description": "کارآمدترین مدل در کلاس خود، با تعادل بین سرعت و کیفیت و ردپای کوچکتر.",
|
||
"jina-deepsearch-v1.description": "DeepSearch جستجوی وب، خواندن و استدلال را برای تحقیقات جامع ترکیب میکند. آن را مانند عاملی تصور کنید که وظیفه تحقیق شما را میگیرد، جستجوهای گستردهای با تکرارهای متعدد انجام میدهد و سپس پاسخ تولید میکند. این فرآیند شامل تحقیق مداوم، استدلال و حل مسئله از زوایای مختلف است و اساساً با مدلهای زبانی استاندارد یا سیستمهای RAG سنتی متفاوت است.",
|
||
"kimi-k2-0711-preview.description": "kimi-k2 یک مدل پایه MoE با قابلیتهای قوی در برنامهنویسی و عاملسازی است (۱ تریلیون پارامتر کل، ۳۲ میلیارد فعال) که در معیارهای استدلال، برنامهنویسی، ریاضی و عامل از سایر مدلهای متنباز پیشی میگیرد.",
|
||
"kimi-k2-0905-preview.description": "kimi-k2-0905-preview دارای پنجره متنی ۲۵۶هزار توکن، برنامهنویسی عاملمحور قویتر، کیفیت بهتر کد فرانتاند و درک بهتر از زمینه است.",
|
||
"kimi-k2-instruct.description": "Kimi K2 Instruct مدل رسمی استدلال Kimi با پشتیبانی از زمینه طولانی برای کدنویسی، پرسشوپاسخ و موارد دیگر است.",
|
||
"kimi-k2-thinking-turbo.description": "نسخه سریع K2 با تفکر طولانی، دارای پنجره متنی ۲۵۶هزار توکن، استدلال عمیق قوی و خروجی ۶۰ تا ۱۰۰ توکن در ثانیه.",
|
||
"kimi-k2-thinking.description": "Kimi-K2 یک مدل پایه معماری MoE است که توسط Moonshot AI راهاندازی شده است، با قابلیتهای فوقالعاده کدنویسی و عامل. این مدل دارای مجموع پارامتر 1T و پارامتر فعال 32B است. در آزمونهای عملکرد معیار در دستههای اصلی مانند استدلال دانش عمومی، برنامهنویسی، ریاضیات، و عوامل، عملکرد مدل K2 از سایر مدلهای متنباز اصلی پیشی میگیرد.",
|
||
"kimi-k2-turbo-preview.description": "kimi-k2 یک مدل پایه MoE با قابلیتهای قوی در برنامهنویسی و عاملسازی است (۱ تریلیون پارامتر کل، ۳۲ میلیارد فعال) که در معیارهای استدلال، برنامهنویسی، ریاضی و عامل از سایر مدلهای متنباز پیشی میگیرد.",
|
||
"kimi-k2.5.description": "Kimi K2.5 همهکارهترین مدل Kimi تا به امروز است که دارای معماری چندوجهی بومی است و از ورودیهای دیداری و متنی، حالتهای 'تفکر' و 'غیرتفکر' و وظایف مکالمهای و عامل پشتیبانی میکند.",
|
||
"kimi-k2.6.description": "Kimi K2.6 جدیدترین و توانمندترین مدل Kimi است و کدنویسی بلندمدت، پیروی از دستور و خوداصلاحگری قویتر ارائه میدهد. همچنین از ورودی متن، تصویر و ویدئو و وظایف چت و ایجنت پشتیبانی میکند.",
|
||
"kimi-k2.description": "Kimi-K2 یک مدل پایه MoE از Moonshot AI با قابلیتهای قوی در برنامهنویسی و عاملسازی است که در مجموع دارای ۱ تریلیون پارامتر و ۳۲ میلیارد فعال است. در معیارهای استدلال عمومی، برنامهنویسی، ریاضی و وظایف عامل از سایر مدلهای متنباز پیشی میگیرد.",
|
||
"kimi-k2:1t.description": "Kimi K2 یک مدل زبانی بزرگ MoE از Moonshot AI با ۱ تریلیون پارامتر کل و ۳۲ میلیارد فعال در هر عبور است. این مدل برای قابلیتهای عامل از جمله استفاده پیشرفته از ابزار، استدلال و ترکیب کد بهینهسازی شده است.",
|
||
"kling/kling-v3-image-generation.description": "از حداکثر 10 تصویر مرجع پشتیبانی میکند، که به شما امکان میدهد سوژهها، عناصر، و تن رنگها را قفل کنید تا سبک ثابت را تضمین کنید. ترکیب انتقال سبک، ارجاع پرتره/شخصیت، ترکیب چند تصویر، و نقاشی محلی برای کنترل انعطافپذیر. جزئیات پرتره واقعی ارائه میدهد، با تصاویر کلی که ظریف و غنی از لایهها هستند، و دارای رنگ و جو سینمایی.",
|
||
"kling/kling-v3-omni-image-generation.description": "تصاویر بصری داستانگویی سینمایی را با تولید سری جدید تصاویر و خروجی مستقیم 2K/4K باز کنید. عناصر صوتی و تصویری در دستورات را به طور عمیق تحلیل میکند تا دستورالعملهای خلاقانه را به دقت اجرا کند. از ورودیهای چند مرجع انعطافپذیر و ارتقاهای جامع کیفیت پشتیبانی میکند، که برای استوریبوردها، هنر مفهومی روایت، و طراحی صحنه ایدهآل است.",
|
||
"kling/kling-v3-omni-video-generation.description": "ویژگی جدید \"مرجع همهجانبه\" از ویدئوهای 3–8 ثانیهای یا تصاویر متعدد برای لنگر انداختن عناصر شخصیت پشتیبانی میکند. میتواند صدا و حرکات لب اصلی را برای نمایش واقعی شخصیت مطابقت دهد. ثبات ویدئو و بیان پویا را بهبود میبخشد. از همگامسازی صوتی و تصویری و استوریبورد هوشمند پشتیبانی میکند.",
|
||
"kling/kling-v3-video-generation.description": "استوریبورد هوشمند انتقال صحنهها را در اسکریپتها درک میکند، و به طور خودکار موقعیتهای دوربین و انواع شاتها را ترتیب میدهد. چارچوب چندوجهی بومی ثبات صوتی و تصویری را تضمین میکند. محدودیتهای مدت زمان را حذف میکند، که امکان داستانگویی چند شات انعطافپذیرتر را فراهم میکند.",
|
||
"kuaishou/kat-coder-pro-v1.description": "KAT-Coder-Pro-V1 (رایگان برای مدت محدود) بر درک کد و خودکارسازی برای عاملهای برنامهنویسی کارآمد تمرکز دارد.",
|
||
"labs-devstral-small-2512.description": "Devstral Small 2 در استفاده از ابزارها برای کاوش در پایگاههای کد، ویرایش چندین فایل و تقویت عوامل مهندسی نرمافزار برتری دارد.",
|
||
"labs-leanstral-2603.description": "اولین عامل کدنویسی متنباز Mistral طراحی شده برای Lean 4، ساخته شده برای مهندسی اثبات رسمی در مخازن واقعی. 119B پارامتر با 6.5B فعال.",
|
||
"lite.description": "Spark Lite یک مدل زبانی سبک با تأخیر بسیار پایین و پردازش کارآمد است. این مدل کاملاً رایگان است و از جستجوی وب در زمان واقعی پشتیبانی میکند. پاسخهای سریع آن در دستگاههای با توان محاسباتی پایین و برای تنظیم دقیق مدل عملکرد خوبی دارد و تجربهای هوشمندانه و مقرونبهصرفه، بهویژه برای پرسشوپاسخ دانشی، تولید محتوا و سناریوهای جستجو ارائه میدهد.",
|
||
"llama-3.1-70b-versatile.description": "Llama 3.1 70B استدلال هوش مصنوعی قویتری را برای کاربردهای پیچیده ارائه میدهد و از محاسبات سنگین با کارایی و دقت بالا پشتیبانی میکند.",
|
||
"llama-3.1-8b-instant.description": "Llama 3.1 8B یک مدل کارآمد با تولید سریع متن است که برای کاربردهای گسترده و مقرونبهصرفه ایدهآل است.",
|
||
"llama-3.1-instruct.description": "مدل Llama 3.1 تنظیمشده برای دستورالعملها برای چت بهینهسازی شده و در بسیاری از معیارهای صنعتی از مدلهای چت متنباز پیشی میگیرد.",
|
||
"llama-3.2-11b-vision-instruct.description": "استدلال تصویری قوی بر روی تصاویر با وضوح بالا، مناسب برای برنامههای درک بصری.",
|
||
"llama-3.2-11b-vision-preview.description": "Llama 3.2 برای وظایف ترکیبی بین تصویر و متن طراحی شده و در تولید کپشن تصویر و پرسشوپاسخ بصری برتری دارد و شکاف بین تولید زبان و استدلال بصری را پر میکند.",
|
||
"llama-3.2-90b-vision-instruct.description": "استدلال تصویری پیشرفته برای برنامههای عامل درک بصری.",
|
||
"llama-3.2-90b-vision-preview.description": "Llama 3.2 برای وظایف ترکیبی بین تصویر و متن طراحی شده و در تولید کپشن تصویر و پرسشوپاسخ بصری برتری دارد و شکاف بین تولید زبان و استدلال بصری را پر میکند.",
|
||
"llama-3.2-vision-instruct.description": "مدل تنظیمشده Llama 3.2-Vision برای تشخیص بصری، استدلال تصویری، تولید کپشن و پرسشوپاسخ عمومی تصویری بهینهسازی شده است.",
|
||
"llama-3.3-70b-versatile.description": "Meta Llama 3.3 یک مدل زبانی چندزبانه با ۷۰ میلیارد پارامتر (ورودی/خروجی متنی) است که نسخههای پیشآموزشدیده و تنظیمشده برای دستورالعمل دارد. نسخه تنظیمشده فقط متنی برای چت چندزبانه بهینه شده و در بسیاری از معیارهای صنعتی از مدلهای چت متنباز و بسته پیشی میگیرد.",
|
||
"llama-3.3-instruct.description": "مدل تنظیمشده Llama 3.3 برای چت بهینه شده و در بسیاری از معیارهای صنعتی از مدلهای چت متنباز پیشی میگیرد.",
|
||
"llama3-70b-8192.description": "Meta Llama 3 70B توانایی بینظیری در مدیریت پیچیدگی برای پروژههای پرچالش ارائه میدهد.",
|
||
"llama3-8b-8192.description": "Meta Llama 3 8B عملکرد استدلالی قوی را در سناریوهای متنوع ارائه میدهد.",
|
||
"llama3-groq-70b-8192-tool-use-preview.description": "Llama 3 Groq 70B Tool Use قابلیت فراخوانی ابزار قدرتمندی برای مدیریت مؤثر وظایف پیچیده فراهم میکند.",
|
||
"llama3-groq-8b-8192-tool-use-preview.description": "Llama 3 Groq 8B Tool Use برای استفاده مؤثر از ابزار با محاسبات موازی سریع بهینهسازی شده است.",
|
||
"llama3.1-8b.description": "Llama 3.1 8B: نسخهای کوچک و کمتاخیر از Llama برای استنتاج آنلاین سبک و گفتگو.",
|
||
"llama3.1.description": "Llama 3.1 پیشرفتهترین مدل Meta است که تا 405 میلیارد پارامتر مقیاسپذیر است و برای گفتگوهای پیچیده، ترجمه چندزبانه و تحلیل دادهها طراحی شده است.",
|
||
"llama3.1:405b.description": "Llama 3.1 پیشرفتهترین مدل Meta است که تا 405 میلیارد پارامتر مقیاسپذیر است و برای گفتگوهای پیچیده، ترجمه چندزبانه و تحلیل دادهها طراحی شده است.",
|
||
"llama3.1:70b.description": "Llama 3.1 پیشرفتهترین مدل Meta است که تا 405 میلیارد پارامتر مقیاسپذیر است و برای گفتگوهای پیچیده، ترجمه چندزبانه و تحلیل دادهها طراحی شده است.",
|
||
"llava-v1.5-7b-4096-preview.description": "LLaVA 1.5 7B پردازش بصری را با تولید خروجیهای پیچیده از ورودیهای تصویری ترکیب میکند.",
|
||
"llava.description": "LLaVA یک مدل چندوجهی است که رمزگذار بینایی را با Vicuna ترکیب میکند تا درک قوی زبان-تصویر را فراهم آورد.",
|
||
"llava:13b.description": "LLaVA یک مدل چندوجهی است که رمزگذار بینایی را با Vicuna ترکیب میکند تا درک قوی زبان-تصویر را فراهم آورد.",
|
||
"llava:34b.description": "LLaVA یک مدل چندوجهی است که رمزگذار بینایی را با Vicuna ترکیب میکند تا درک قوی زبان-تصویر را فراهم آورد.",
|
||
"magistral-medium-2509.description": "Magistral Medium 1.2 یک مدل استدلال پیشرفته از Mistral AI (سپتامبر 2025) با پشتیبانی از دید است.",
|
||
"magistral-small-2509.description": "Magistral Small 1.2 یک مدل استدلال کوچک و متنباز از Mistral AI (سپتامبر ۲۰۲۵) با پشتیبانی از بینایی است.",
|
||
"mathstral.description": "MathΣtral برای پژوهش علمی و استدلال ریاضی ساخته شده و توانایی بالایی در محاسبه و توضیح دارد.",
|
||
"max-32k.description": "Spark Max 32K پردازش با زمینه وسیع را با درک قویتر زمینه و استدلال منطقی ارائه میدهد و از ورودیهای ۳۲ هزار توکنی برای خواندن اسناد طولانی و پرسش و پاسخ دانش خصوصی پشتیبانی میکند.",
|
||
"megrez-3b-instruct.description": "Megrez 3B Instruct یک مدل کوچک و کارآمد از Wuwen Xinqiong است.",
|
||
"meituan/longcat-flash-chat.description": "مدلی پایه و متنباز از Meituan که برای گفتگو و وظایف عامل بهینهسازی شده و در استفاده از ابزار و تعاملات چندمرحلهای پیچیده قوی است.",
|
||
"meta-llama-3-70b-instruct.description": "مدلی قدرتمند با ۷۰ میلیارد پارامتر که در استدلال، برنامهنویسی و وظایف زبانی گسترده عملکرد بالایی دارد.",
|
||
"meta-llama-3-8b-instruct.description": "مدلی همهکاره با ۸ میلیارد پارامتر که برای گفتگو و تولید متن بهینهسازی شده است.",
|
||
"meta-llama-3.1-405b-instruct.description": "مدل متنی Llama 3.1 با تنظیمات دستورالعملی برای گفتگوهای چندزبانه بهینه شده و در ارزیابیهای صنعتی در میان مدلهای باز و بسته عملکرد بالایی دارد.",
|
||
"meta-llama-3.1-70b-instruct.description": "مدل متنی Llama 3.1 با تنظیمات دستورالعملی برای گفتگوهای چندزبانه بهینه شده و در ارزیابیهای صنعتی در میان مدلهای باز و بسته عملکرد بالایی دارد.",
|
||
"meta-llama-3.1-8b-instruct.description": "مدل متنی Llama 3.1 با تنظیمات دستورالعملی برای گفتگوهای چندزبانه بهینه شده و در ارزیابیهای صنعتی در میان مدلهای باز و بسته عملکرد بالایی دارد.",
|
||
"meta-llama/Llama-2-13b-chat-hf.description": "LLaMA-2 Chat (13B) قابلیتهای زبانی قوی و تجربه گفتگوی قابلاعتمادی ارائه میدهد.",
|
||
"meta-llama/Llama-2-70b-hf.description": "LLaMA-2 قابلیتهای زبانی قوی و تجربه تعاملی قابلاعتمادی ارائه میدهد.",
|
||
"meta-llama/Llama-3-70b-chat-hf.description": "Llama 3 70B Instruct Reference یک مدل گفتگوی قدرتمند برای مکالمات پیچیده است.",
|
||
"meta-llama/Llama-3-8b-chat-hf.description": "Llama 3 8B Instruct Reference از چندزبانگی پشتیبانی میکند و دانش گستردهای در حوزههای مختلف دارد.",
|
||
"meta-llama/Llama-3.2-11B-Vision-Instruct-Turbo.description": "LLaMA 3.2 برای وظایف ترکیبی بینایی و متن طراحی شده است. در توصیف تصویر و پرسش و پاسخ بصری عملکرد بالایی دارد و بین تولید زبان و استدلال بصری پل میزند.",
|
||
"meta-llama/Llama-3.2-3B-Instruct-Turbo.description": "LLaMA 3.2 برای وظایف ترکیبی بینایی و متن طراحی شده است. در توصیف تصویر و پرسش و پاسخ بصری عملکرد بالایی دارد و بین تولید زبان و استدلال بصری پل میزند.",
|
||
"meta-llama/Llama-3.2-90B-Vision-Instruct-Turbo.description": "LLaMA 3.2 برای وظایف ترکیبی بینایی و متن طراحی شده است. در توصیف تصویر و پرسش و پاسخ بصری عملکرد بالایی دارد و بین تولید زبان و استدلال بصری پل میزند.",
|
||
"meta-llama/Llama-3.3-70B-Instruct-Turbo.description": "مدل چندزبانه Meta Llama 3.3 با ۷۰ میلیارد پارامتر (ورودی/خروجی متنی) آموزش دیده و با دستورالعمل تنظیم شده است. نسخه متنی تنظیمشده برای گفتگوهای چندزبانه بهینه شده و در ارزیابیهای صنعتی از بسیاری از مدلهای باز و بسته پیشی میگیرد.",
|
||
"meta-llama/Llama-Vision-Free.description": "LLaMA 3.2 برای وظایف ترکیبی بینایی و متن طراحی شده است. در توصیف تصویر و پرسش و پاسخ بصری عملکرد بالایی دارد و بین تولید زبان و استدلال بصری پل میزند.",
|
||
"meta-llama/Meta-Llama-3-70B-Instruct-Lite.description": "Llama 3 70B Instruct Lite برای عملکرد بالا با تاخیر کمتر طراحی شده است.",
|
||
"meta-llama/Meta-Llama-3-70B-Instruct-Turbo.description": "Llama 3 70B Instruct Turbo درک و تولید قوی را برای بارهای کاری سنگین ارائه میدهد.",
|
||
"meta-llama/Meta-Llama-3-8B-Instruct-Lite.description": "Llama 3 8B Instruct Lite تعادلی میان عملکرد و منابع محدود فراهم میکند.",
|
||
"meta-llama/Meta-Llama-3-8B-Instruct-Turbo.description": "Llama 3 8B Instruct Turbo یک مدل زبانی با عملکرد بالا برای طیف وسیعی از کاربردها است.",
|
||
"meta-llama/Meta-Llama-3.1-405B-Instruct-Turbo.description": "مدل 405B Llama 3.1 Turbo ظرفیت زمینهای عظیمی برای پردازش دادههای بزرگ فراهم میکند و در کاربردهای هوش مصنوعی در مقیاس فوقالعاده عملکرد بالایی دارد.",
|
||
"meta-llama/Meta-Llama-3.1-405B-Instruct.description": "Llama 3.1 خانواده پیشرو مدلهای Meta است که تا 405 میلیارد پارامتر مقیاسپذیر است و برای گفتگوهای پیچیده، ترجمه چندزبانه و تحلیل دادهها طراحی شده است.",
|
||
"meta-llama/Meta-Llama-3.1-70B-Instruct-Turbo.description": "Llama 3.1 70B برای کاربردهای سنگین بهخوبی تنظیم شده است؛ کمیتسازی FP8 محاسبه کارآمد و دقت بالا را برای سناریوهای پیچیده فراهم میکند.",
|
||
"meta-llama/Meta-Llama-3.1-70B.description": "Llama 3.1 خانواده پیشرو مدلهای Meta است که تا 405 میلیارد پارامتر مقیاسپذیر است و برای گفتگوهای پیچیده، ترجمه چندزبانه و تحلیل دادهها طراحی شده است.",
|
||
"meta-llama/Meta-Llama-3.1-8B-Instruct-Turbo.description": "Llama 3.1 8B از کمیتسازی FP8 استفاده میکند، تا ۱۳۱٬۰۷۲ توکن زمینه را پشتیبانی میکند و در میان مدلهای باز برتر برای وظایف پیچیده در بسیاری از معیارها قرار دارد.",
|
||
"meta-llama/llama-3-70b-instruct.description": "Llama 3 70B Instruct برای گفتگوهای با کیفیت بالا بهینه شده و در ارزیابیهای انسانی عملکرد قوی دارد.",
|
||
"meta-llama/llama-3-8b-instruct.description": "Llama 3 8B Instruct برای گفتگوهای با کیفیت بالا بهینه شده و از بسیاری از مدلهای بسته پیشی میگیرد.",
|
||
"meta-llama/llama-3.1-70b-instruct.description": "جدیدترین سری Llama 3.1 از Meta، نسخه ۷۰B تنظیمشده با دستورالعمل برای گفتگوهای با کیفیت بالا بهینه شده است. در ارزیابیهای صنعتی، عملکرد قوی در برابر مدلهای بسته پیشرو نشان میدهد. (فقط برای نهادهای تأییدشده سازمانی در دسترس است.)",
|
||
"meta-llama/llama-3.1-8b-instruct.description": "جدیدترین سری Llama 3.1 از Meta، نسخه ۸B تنظیمشده با دستورالعمل بهویژه سریع و کارآمد است. در ارزیابیهای صنعتی، عملکرد قوی دارد و از بسیاری از مدلهای بسته پیشرو پیشی میگیرد. (فقط برای نهادهای تأییدشده سازمانی در دسترس است.)",
|
||
"meta-llama/llama-3.1-8b-instruct:free.description": "LLaMA 3.1 از چندزبانگی پشتیبانی میکند و یکی از مدلهای پیشرو تولیدی است.",
|
||
"meta-llama/llama-3.2-11b-vision-instruct.description": "LLaMA 3.2 برای وظایف ترکیبی بینایی و متن طراحی شده است. در توصیف تصویر و پرسش و پاسخ بصری عملکرد بالایی دارد و بین تولید زبان و استدلال بصری پل میزند.",
|
||
"meta-llama/llama-3.2-3b-instruct.description": "meta-llama/llama-3.2-3b-instruct",
|
||
"meta-llama/llama-3.3-70b-instruct.description": "Llama 3.3 پیشرفتهترین مدل چندزبانه متنباز Llama است که عملکردی نزدیک به 405B را با هزینه بسیار پایین ارائه میدهد. این مدل مبتنی بر Transformer بوده و با SFT و RLHF برای مفید بودن و ایمنی بهبود یافته است. نسخه تنظیمشده با دستورالعمل برای گفتگوهای چندزبانه بهینه شده و در ارزیابیهای صنعتی از بسیاری از مدلهای باز و بسته پیشی میگیرد. تاریخ قطع دانش: دسامبر ۲۰۲۳.",
|
||
"meta-llama/llama-3.3-70b-instruct:free.description": "Llama 3.3 پیشرفتهترین مدل چندزبانه متنباز Llama است که عملکردی نزدیک به 405B را با هزینه بسیار پایین ارائه میدهد. این مدل مبتنی بر Transformer بوده و با SFT و RLHF برای مفید بودن و ایمنی بهبود یافته است. نسخه تنظیمشده با دستورالعمل برای گفتگوهای چندزبانه بهینه شده و در ارزیابیهای صنعتی از بسیاری از مدلهای باز و بسته پیشی میگیرد. تاریخ قطع دانش: دسامبر ۲۰۲۳.",
|
||
"meta.llama3-1-405b-instruct-v1:0.description": "Meta Llama 3.1 405B Instruct بزرگترین و قدرتمندترین مدل Llama 3.1 Instruct است؛ مدلی بسیار پیشرفته برای استدلال در گفتوگو و تولید دادههای مصنوعی، و پایهای قوی برای آموزش تکمیلی یا تنظیم دقیق در حوزههای خاص. مدلهای چندزبانه Llama 3.1 مجموعهای از مدلهای تولیدی آموزشدیده و تنظیمشده با دستورالعمل در اندازههای 8B، 70B و 405B هستند (ورودی/خروجی متنی). این مدلها برای گفتوگوهای چندزبانه بهینه شدهاند و در بسیاری از معیارهای صنعتی از مدلهای چت متنباز موجود بهتر عمل میکنند. Llama 3.1 برای استفاده تجاری و پژوهشی در زبانهای مختلف طراحی شده است. مدلهای تنظیمشده با دستورالعمل برای چت به سبک دستیار مناسباند، در حالی که مدلهای آموزشدیده برای وظایف گستردهتر تولید زبان طبیعی مناسباند. خروجیهای Llama 3.1 همچنین میتوانند برای بهبود مدلهای دیگر، از جمله تولید و پالایش دادههای مصنوعی، استفاده شوند. Llama 3.1 یک مدل ترنسفورمر خودرگرسیو با معماری بهینهشده است. نسخههای تنظیمشده از آموزش نظارتشده (SFT) و یادگیری تقویتی از بازخورد انسانی (RLHF) برای همراستایی با ترجیحات انسانی در مفید بودن و ایمنی استفاده میکنند.",
|
||
"meta.llama3-1-70b-instruct-v1:0.description": "نسخه بهروزشده Meta Llama 3.1 70B Instruct با پنجره متنی گسترده 128K، پشتیبانی چندزبانه و استدلال بهبودیافته. مدلهای چندزبانه Llama 3.1 مجموعهای از مدلهای تولیدی آموزشدیده و تنظیمشده با دستورالعمل در اندازههای 8B، 70B و 405B هستند (ورودی/خروجی متنی). این مدلها برای گفتوگوهای چندزبانه بهینه شدهاند و در بسیاری از معیارهای صنعتی از مدلهای چت متنباز موجود بهتر عمل میکنند. Llama 3.1 برای استفاده تجاری و پژوهشی در زبانهای مختلف طراحی شده است. مدلهای تنظیمشده با دستورالعمل برای چت به سبک دستیار مناسباند، در حالی که مدلهای آموزشدیده برای وظایف گستردهتر تولید زبان طبیعی مناسباند. خروجیهای Llama 3.1 همچنین میتوانند برای بهبود مدلهای دیگر، از جمله تولید و پالایش دادههای مصنوعی، استفاده شوند. Llama 3.1 یک مدل ترنسفورمر خودرگرسیو با معماری بهینهشده است. نسخههای تنظیمشده از آموزش نظارتشده (SFT) و یادگیری تقویتی از بازخورد انسانی (RLHF) برای همراستایی با ترجیحات انسانی در مفید بودن و ایمنی استفاده میکنند.",
|
||
"meta.llama3-1-8b-instruct-v1:0.description": "نسخه بهروزشده Meta Llama 3.1 8B Instruct با پنجره متنی 128K، پشتیبانی چندزبانه و استدلال بهبودیافته. خانواده Llama 3.1 شامل مدلهای متنی تنظیمشده با دستورالعمل در اندازههای 8B، 70B و 405B است که برای چت چندزبانه و عملکرد قوی در معیارها بهینه شدهاند. این مدل برای استفاده تجاری و پژوهشی در زبانهای مختلف طراحی شده است؛ مدلهای تنظیمشده با دستورالعمل برای چت به سبک دستیار مناسباند، در حالی که مدلهای آموزشدیده برای وظایف گستردهتر تولید مناسباند. خروجیهای Llama 3.1 همچنین میتوانند برای بهبود مدلهای دیگر (مانند دادههای مصنوعی و پالایش) استفاده شوند. این مدل یک ترنسفورمر خودرگرسیو است که از SFT و RLHF برای همراستایی با مفید بودن و ایمنی استفاده میکند.",
|
||
"meta.llama3-70b-instruct-v1:0.description": "Meta Llama 3 یک مدل زبان باز برای توسعهدهندگان، پژوهشگران و شرکتها است که برای کمک به ساخت، آزمایش و گسترش مسئولانه ایدههای هوش مصنوعی مولد طراحی شده است. بهعنوان بخشی از زیربنای نوآوری جامعه جهانی، برای تولید محتوا، هوش مصنوعی مکالمهای، درک زبان، تحقیق و توسعه و کاربردهای سازمانی بسیار مناسب است.",
|
||
"meta.llama3-8b-instruct-v1:0.description": "متا لاما ۳ یک مدل زبان باز برای توسعهدهندگان، پژوهشگران و شرکتها است که برای کمک به ساخت، آزمایش و گسترش مسئولانه ایدههای هوش مصنوعی مولد طراحی شده است. این مدل بهعنوان بخشی از زیرساخت نوآوری جامعه جهانی، برای محیطهایی با منابع محدود، دستگاههای لبه و زمانهای آموزش سریع مناسب است.",
|
||
"meta/Llama-3.2-11B-Vision-Instruct.description": "استدلال تصویری قوی بر روی تصاویر با وضوح بالا، مناسب برای برنامههای درک بصری.",
|
||
"meta/Llama-3.2-90B-Vision-Instruct.description": "استدلال تصویری پیشرفته برای برنامههای عامل با قابلیت درک بصری.",
|
||
"meta/Llama-3.3-70B-Instruct.description": "لاما ۳.۳ پیشرفتهترین مدل چندزبانه متنباز لاما است که عملکردی نزدیک به مدلهای ۴۰۵ میلیارد پارامتری را با هزینه بسیار پایین ارائه میدهد. این مدل مبتنی بر ترنسفورمر بوده و با SFT و RLHF برای افزایش کارایی و ایمنی بهبود یافته است. نسخه تنظیمشده برای دستورالعملها برای چت چندزبانه بهینه شده و در بسیاری از معیارهای صنعتی از مدلهای باز و بسته پیشی میگیرد. تاریخ قطع دانش: دسامبر ۲۰۲۳.",
|
||
"meta/Meta-Llama-3-70B-Instruct.description": "مدلی قدرتمند با ۷۰ میلیارد پارامتر که در استدلال، برنامهنویسی و وظایف زبانی گسترده عملکرد بالایی دارد.",
|
||
"meta/Meta-Llama-3-8B-Instruct.description": "مدلی همهکاره با ۸ میلیارد پارامتر که برای چت و تولید متن بهینه شده است.",
|
||
"meta/Meta-Llama-3.1-405B-Instruct.description": "مدل متنی تنظیمشده لاما ۳.۱ برای چت چندزبانه، با عملکرد قوی در معیارهای صنعتی رایج در میان مدلهای چت باز و بسته.",
|
||
"meta/Meta-Llama-3.1-70B-Instruct.description": "مدل متنی تنظیمشده لاما ۳.۱ برای چت چندزبانه، با عملکرد قوی در معیارهای صنعتی رایج در میان مدلهای چت باز و بسته.",
|
||
"meta/Meta-Llama-3.1-8B-Instruct.description": "مدل متنی تنظیمشده لاما ۳.۱ برای چت چندزبانه، با عملکرد قوی در معیارهای صنعتی رایج در میان مدلهای چت باز و بسته.",
|
||
"meta/llama-3.1-405b-instruct.description": "مدلی پیشرفته برای تولید داده مصنوعی، تقطیر دانش و استدلال در چتباتها، برنامهنویسی و وظایف تخصصی.",
|
||
"meta/llama-3.1-70b-instruct.description": "طراحیشده برای گفتوگوهای پیچیده با درک عالی از زمینه، استدلال و تولید متن.",
|
||
"meta/llama-3.1-70b.description": "نسخه بهروزشده لاما ۳.۱ با ۷۰ میلیارد پارامتر، پشتیبانی از زمینه ۱۲۸ هزار توکن، پشتیبانی چندزبانه و استدلال بهبود یافته.",
|
||
"meta/llama-3.1-8b-instruct.description": "مدلی پیشرفته با درک زبانی قوی، توانایی استدلال و تولید متن.",
|
||
"meta/llama-3.1-8b.description": "لاما ۳.۱ با ۸ میلیارد پارامتر از پنجره زمینه ۱۲۸ هزار توکن پشتیبانی میکند، برای چت بلادرنگ و تحلیل دادهها ایدهآل است و در مقایسه با مدلهای بزرگتر صرفهجویی قابلتوجهی در هزینه دارد. توسط Groq بر روی سختافزار LPU برای استنتاج سریع و کارآمد ارائه میشود.",
|
||
"meta/llama-3.2-11b-vision-instruct.description": "مدلی پیشرفته در حوزه بینایی-زبان که در استدلال با کیفیت بالا از تصاویر عملکرد درخشانی دارد.",
|
||
"meta/llama-3.2-11b.description": "مدل استدلال تصویری تنظیمشده برای دستورالعملها (ورودی متن+تصویر، خروجی متن) که برای شناسایی بصری، استدلال تصویری، زیرنویسگذاری و پرسشوپاسخ عمومی تصویری بهینه شده است.",
|
||
"meta/llama-3.2-1b-instruct.description": "مدل زبانی کوچک و پیشرفته با درک قوی، توانایی استدلال و تولید متن.",
|
||
"meta/llama-3.2-1b.description": "مدل فقط متنی برای استفاده در دستگاههایی مانند بازیابی محلی چندزبانه، خلاصهسازی و بازنویسی.",
|
||
"meta/llama-3.2-3b-instruct.description": "مدل زبانی کوچک و پیشرفته با درک قوی، توانایی استدلال و تولید متن.",
|
||
"meta/llama-3.2-3b.description": "مدل فقط متنی تنظیمشده برای استفاده در دستگاههایی مانند بازیابی محلی چندزبانه، خلاصهسازی و بازنویسی.",
|
||
"meta/llama-3.2-90b-vision-instruct.description": "مدلی پیشرفته در حوزه بینایی-زبان که در استدلال با کیفیت بالا از تصاویر عملکرد درخشانی دارد.",
|
||
"meta/llama-3.2-90b.description": "مدل استدلال تصویری تنظیمشده برای دستورالعملها (ورودی متن+تصویر، خروجی متن) که برای شناسایی بصری، استدلال تصویری، زیرنویسگذاری و پرسشوپاسخ عمومی تصویری بهینه شده است.",
|
||
"meta/llama-3.3-70b-instruct.description": "مدلی پیشرفته با توانایی بالا در استدلال، ریاضی، منطق عمومی و فراخوانی توابع.",
|
||
"meta/llama-3.3-70b.description": "ترکیبی ایدهآل از عملکرد و بهرهوری. طراحیشده برای هوش مصنوعی مکالمهای با عملکرد بالا در تولید محتوا، برنامههای سازمانی و پژوهش، با درک زبانی قوی برای خلاصهسازی، طبقهبندی، تحلیل احساسات و تولید کد.",
|
||
"meta/llama-4-maverick.description": "خانواده لاما ۴ مجموعهای از مدلهای بومی چندوجهی است که از متن و ورودیهای چندرسانهای پشتیبانی میکند و با استفاده از MoE درک پیشرفتهای از متن و تصویر ارائه میدهد. لاما ۴ ماوریک یک مدل ۱۷ میلیاردی با ۱۲۸ متخصص است که توسط DeepInfra ارائه میشود.",
|
||
"meta/llama-4-scout.description": "خانواده لاما ۴ مجموعهای از مدلهای بومی چندوجهی است که از متن و ورودیهای چندرسانهای پشتیبانی میکند و با استفاده از MoE درک پیشرفتهای از متن و تصویر ارائه میدهد. لاما ۴ اسکات یک مدل ۱۷ میلیاردی با ۱۶ متخصص است که توسط DeepInfra ارائه میشود.",
|
||
"microsoft/Phi-3-medium-128k-instruct.description": "همان مدل Phi-3-medium با پنجره متنی بزرگتر برای درخواستهای RAG یا نمونههای کمتعداد.",
|
||
"microsoft/Phi-3-medium-4k-instruct.description": "مدلی با ۱۴ میلیارد پارامتر و کیفیت بالاتر نسبت به Phi-3-mini، متمرکز بر دادههای با کیفیت بالا و نیازمند استدلال.",
|
||
"microsoft/Phi-3-mini-128k-instruct.description": "همان مدل Phi-3-mini با پنجره متنی بزرگتر برای درخواستهای RAG یا نمونههای کمتعداد.",
|
||
"microsoft/Phi-3-mini-4k-instruct.description": "کوچکترین عضو خانواده Phi-3، بهینهشده برای کیفیت بالا و تأخیر کم.",
|
||
"microsoft/Phi-3-small-128k-instruct.description": "همان مدل Phi-3-small با پنجره متنی بزرگتر برای درخواستهای RAG یا نمونههای کمتعداد.",
|
||
"microsoft/Phi-3-small-8k-instruct.description": "مدلی با ۷ میلیارد پارامتر و کیفیت بالاتر نسبت به Phi-3-mini، متمرکز بر دادههای با کیفیت بالا و نیازمند استدلال.",
|
||
"microsoft/Phi-3.5-mini-instruct.description": "نسخه بهروزشدهای از مدل Phi-3-mini.",
|
||
"microsoft/Phi-3.5-vision-instruct.description": "نسخه بهروزشدهای از مدل Phi-3-vision.",
|
||
"microsoft/WizardLM-2-8x22B.description": "WizardLM 2 یک مدل زبانی از Microsoft AI است که در گفتوگوی پیچیده، وظایف چندزبانه، استدلال و دستیارها عملکرد برجستهای دارد.",
|
||
"microsoft/wizardlm-2-8x22b.description": "WizardLM-2 8x22B پیشرفتهترین مدل Wizard از Microsoft AI با عملکردی بسیار رقابتی است.",
|
||
"mimo-v2-flash.description": "MiMo-V2-Flash اکنون بهطور رسمی متنباز است! این مدل MoE (ترکیب متخصصان) برای بهرهوری استنتاجی فوقالعاده طراحی شده است، با 309 میلیارد پارامتر کل (15 میلیارد فعال). از طریق نوآوریها در معماری توجه ترکیبی و شتابدهی استنتاج چندلایه MTP، در میان 2 مدل برتر متنباز جهانی در مجموعههای ارزیابی عامل قرار میگیرد. قابلیتهای کدنویسی آن از تمام مدلهای متنباز پیشی میگیرد و با مدلهای بسته پیشرو مانند Claude 4.5 Sonnet رقابت میکند، در حالی که تنها 2.5٪ هزینه استنتاج را متحمل میشود و سرعت تولید 2 برابر سریعتر را ارائه میدهد—بهرهوری استنتاج مدلهای بزرگ را به حد نهایی میرساند.",
|
||
"mimo-v2-omni.description": "MiMo-V2-Omni برای تعاملات پیچیده چندوجهی و سناریوهای اجرایی در دنیای واقعی طراحی شده است. ما یک پایه کامل چندوجهی را از ابتدا ساختیم، متن، تصویر و گفتار را یکپارچه کردیم و «ادراک» و «عمل» را در یک معماری واحد متحد کردیم. این نه تنها محدودیت سنتی مدلهایی که بر درک بیش از اجرا تأکید دارند را میشکند، بلکه مدل را با قابلیتهای بومی در ادراک چندوجهی، استفاده از ابزار، اجرای عملکرد و عملیات GUI مجهز میکند. MiMo-V2-Omni میتواند بهطور یکپارچه با چارچوبهای عامل اصلی ادغام شود، جهشی از درک به کنترل را به دست آورد و در عین حال مانع استقرار عوامل کاملاً چندوجهی را بهطور قابلتوجهی کاهش دهد.",
|
||
"mimo-v2-pro.description": "MiMo-V2-Pro به طور خاص برای جریانهای کاری عامل با شدت بالا در سناریوهای واقعی طراحی شده است. این مدل دارای بیش از ۱ تریلیون پارامتر کل (۴۲ میلیارد پارامتر فعال) است، از معماری نوآورانه توجه ترکیبی استفاده میکند و از طول زمینه فوقالعاده بلند تا ۱ میلیون توکن پشتیبانی میکند. بر پایه یک مدل بنیادی قدرتمند ساخته شده است، ما به طور مداوم منابع محاسباتی را در طیف گستردهتری از سناریوهای عامل گسترش میدهیم، فضای عمل هوش را بیشتر گسترش میدهیم و به تعمیم قابل توجهی دست مییابیم—از کدنویسی تا اجرای وظایف دنیای واقعی (\"چنگال\").",
|
||
"mimo-v2.5-pro.description": "MiMo-V2.5-Pro قدرتمندترین مدل پرچمدار Xiaomi تاکنون است و پیشرفت قابل توجهی در قابلیتهای ایجنتی عمومی، مهندسی نرمافزار پیچیده و وظایف بلندمدت ارائه میدهد. این مدل معماری هیبریدی ۱ تریلیون پارامتری / ۴۲ میلیارد فعال با پنجره زمینه ۱ میلیون را حفظ کرده و قادر است وظایف بلندمدت با بیش از هزار فراخوانی ابزار را مدیریت کند. عملکرد آن در معیارهای سخت ایجنتی مانند ClawEval، GDPVal و SWE-bench Pro قابل مقایسه با Claude Opus 4.6 است.",
|
||
"mimo-v2.5.description": "MiMo-V2.5 یک مدل بنیانی ایجنت همهوجهی بومی است که تصویر، ویدئو، صوت و متن را در یک معماری یکپارچه درک میکند و پنجره زمینه ۱ میلیون ارائه میدهد. این مدل عملکرد ایجنتی سطح Pro را با نصف هزینه استنتاج MiMo-V2.5-Pro ارائه کرده و درک چندوجهی بهتر از MiMo-V2-Omni دارد. تواناییهای ایجنتی داخلی آن (مرور، درک، استدلال، اجرا) و استنتاج سریعتر آن را برای چارچوبهای ایجنت حساس به تأخیر مانند OpenClaw مناسب میکند.",
|
||
"minicpm-v.description": "MiniCPM-V مدل چندوجهی نسل بعدی OpenBMB با توانایی عالی در OCR و درک چندوجهی برای کاربردهای گسترده است.",
|
||
"minimax-m2.1.description": "MiniMax-M2.1 جدیدترین نسخه از سری MiniMax است که برای برنامهنویسی چندزبانه و وظایف پیچیده دنیای واقعی بهینه شده است. بهعنوان یک مدل بومی هوش مصنوعی، MiniMax-M2.1 پیشرفتهای قابلتوجهی در عملکرد مدل، پشتیبانی از چارچوب عامل و سازگاری با سناریوهای مختلف دارد و هدف آن کمک به شرکتها و افراد برای یافتن سبک زندگی و کاری بومی هوش مصنوعی است.",
|
||
"minimax-m2.5-free.description": "MiniMax M2.5 Free — مدل رایگان کدنویسی با توانایی کامل در استدلال.",
|
||
"minimax-m2.5.description": "MiniMax M2.5 — مدل کارآمد کدنویسی با توانایی استدلال قوی.",
|
||
"minimax-m2.7.description": "MiniMax M2.7 — جدیدترین مدل کدنویسی MiniMax با استدلال و استفاده از ابزار بهتر.",
|
||
"minimax-m2.description": "MiniMax M2 یک مدل زبانی بزرگ کارآمد است که بهطور خاص برای برنامهنویسی و جریانهای کاری عامل طراحی شده است.",
|
||
"minimax/minimax-m2.1.description": "MiniMax-M2.1 یک مدل زبانی بزرگ سبک و پیشرفته است که برای برنامهنویسی، جریانهای کاری نماینده و توسعه برنامههای مدرن بهینه شده و خروجیهای تمیزتر، مختصرتر و پاسخدهی سریعتری ارائه میدهد.",
|
||
"minimax/minimax-m2.description": "MiniMax-M2 مدلی با ارزش بالا است که در برنامهنویسی و وظایف عامل در بسیاری از سناریوهای مهندسی عملکرد خوبی دارد.",
|
||
"minimaxai/minimax-m2.5.description": "MiniMax-M2.5 جدیدترین مدل زبان بزرگ از MiniMax است که دارای معماری Mixture-of-Experts (MoE) با 229 میلیارد پارامتر کل است. این مدل عملکرد پیشرو در صنعت را در برنامهنویسی، فراخوانی ابزار عامل، وظایف جستجو و سناریوهای اداری ارائه میدهد.",
|
||
"ministral-3:14b.description": "Ministral 3 14B بزرگترین مدل در سری Ministral 3 است، که عملکرد پیشرفتهای را ارائه میدهد که قابل مقایسه با مدل بزرگتر Mistral Small 3.2 24B است. برای استقرار محلی بهینه شده است، و عملکرد بالایی را در سختافزارهای مختلف از جمله تنظیمات محلی ارائه میدهد.",
|
||
"ministral-3:3b.description": "Ministral 3 3B کوچکترین و کارآمدترین مدل در سری Ministral 3 است، که قابلیتهای زبان و دید قوی را در یک بسته جمع و جور ارائه میدهد. برای استقرار در لبه طراحی شده است، و عملکرد بالایی را در سختافزارهای مختلف از جمله تنظیمات محلی ارائه میدهد.",
|
||
"ministral-3:8b.description": "Ministral 3 8B یک مدل قدرتمند و کارآمد در سری Ministral 3 است، که قابلیتهای متن و دید در سطح بالا را ارائه میدهد. برای استقرار در لبه طراحی شده است، و عملکرد بالایی را در سختافزارهای مختلف از جمله تنظیمات محلی ارائه میدهد.",
|
||
"ministral-3b-latest.description": "Ministral 3B پیشرفتهترین مدل لبهای Mistral است.",
|
||
"ministral-8b-latest.description": "Ministral 8B یک مدل لبهای بسیار مقرونبهصرفه از Mistral است.",
|
||
"mistral-ai/Mistral-Large-2411.description": "مدل پرچمدار Mistral برای وظایف پیچیده که نیاز به استدلال در مقیاس بزرگ یا تخصص دارند (تولید متن مصنوعی، تولید کد، RAG یا عاملها).",
|
||
"mistral-ai/Mistral-Nemo.description": "Mistral Nemo یک مدل زبانی پیشرفته با استدلال پیشرفته، دانش جهانی و توانایی برنامهنویسی قوی نسبت به اندازه خود است.",
|
||
"mistral-ai/mistral-small-2503.description": "Mistral Small برای هر وظیفه مبتنی بر زبان که نیاز به کارایی بالا و تأخیر کم دارد مناسب است.",
|
||
"mistral-large-2411.description": "Mistral Large مدل پرچمدار است، که در وظایف چندزبانه، استدلال پیچیده، و تولید کد قوی است—ایدهآل برای برنامههای سطح بالا.",
|
||
"mistral-large-2512.description": "Mistral Large 3، یک مدل چندوجهی عمومی پیشرفته با وزن باز و معماری Mixture-of-Experts گرانولار است. این مدل دارای 41B پارامتر فعال و 675B پارامتر کل است.",
|
||
"mistral-large-3:675b.description": "Mistral Large 3 یک مدل چندوجهی عمومی پیشرفته با وزن باز و معماری Mixture of Experts اصلاح شده است. این مدل دارای 41B پارامتر فعال و 675B پارامتر کل است.",
|
||
"mistral-large-instruct.description": "Mistral-Large-Instruct-2407 یک مدل LLM متراکم پیشرفته با ۱۲۳ میلیارد پارامتر و استدلال، دانش و برنامهنویسی پیشرفته است.",
|
||
"mistral-large-latest.description": "Mistral Large مدل پرچمدار است، که در وظایف چندزبانه، استدلال پیچیده، و تولید کد برای برنامههای سطح بالا برتری دارد.",
|
||
"mistral-large.description": "Mixtral Large مدل پرچمدار Mistral است که تولید کد، ریاضی و استدلال را با پنجره متنی ۱۲۸ هزار ترکیب میکند.",
|
||
"mistral-medium-2508.description": "Mistral Medium 3.1 عملکرد پیشرفتهای را با هزینه 8× کمتر ارائه میدهد و استقرار سازمانی را ساده میکند.",
|
||
"mistral-nemo-instruct.description": "Mistral-Nemo-Instruct-2407 نسخه تنظیمشده بر اساس دستورالعمل از Mistral-Nemo-Base-2407 است.",
|
||
"mistral-nemo.description": "Mistral Nemo یک مدل ۱۲ میلیاردی با کارایی بالا از Mistral AI و NVIDIA است.",
|
||
"mistral-small-2506.description": "Mistral Small یک گزینه مقرون به صرفه، سریع، و قابل اعتماد برای ترجمه، خلاصهسازی، و تحلیل احساسات است.",
|
||
"mistral-small-2603.description": "مدل ترکیبی قدرتمند Mistral که قابلیتهای دستورالعمل، استدلال، و کدنویسی را در یک مدل واحد متحد میکند. 119B پارامتر با 6.5B فعال.",
|
||
"mistral-small-latest.description": "Mistral Small گزینهای مقرونبهصرفه، سریع و قابلاعتماد برای ترجمه، خلاصهسازی و تحلیل احساسات است.",
|
||
"mistral-small.description": "Mistral Small برای هر وظیفه مبتنی بر زبان که نیاز به کارایی بالا و تأخیر کم دارد مناسب است.",
|
||
"mistral.description": "Mistral مدل ۷ میلیاردی Mistral AI است که برای وظایف زبانی متنوع مناسب است.",
|
||
"mistral/codestral-embed.description": "مدل جاسازی کد برای جاسازی پایگاههای کد و مخازن بهمنظور پشتیبانی از دستیارهای برنامهنویسی.",
|
||
"mistral/codestral.description": "Mistral Codestral 25.01 یک مدل برنامهنویسی پیشرفته است که برای تأخیر کم و استفاده مکرر بهینه شده است. از بیش از ۸۰ زبان پشتیبانی میکند و در FIM، اصلاح کد و تولید تست عملکرد عالی دارد.",
|
||
"mistral/devstral-small.description": "Devstral یک مدل LLM عاملمحور برای وظایف مهندسی نرمافزار است که آن را به گزینهای قوی برای عاملهای مهندسی نرمافزار تبدیل میکند.",
|
||
"mistral/magistral-medium.description": "تفکر پیچیده با درک عمیق و استدلال شفاف که میتوانید آن را دنبال و تأیید کنید. استدلال با دقت بالا را در زبانهای مختلف حتی در میانه وظیفه حفظ میکند.",
|
||
"mistral/magistral-small.description": "تفکر پیچیده با درک عمیق و استدلال شفاف که میتوانید آن را دنبال و تأیید کنید. استدلال با دقت بالا را در زبانهای مختلف حتی در میانه وظیفه حفظ میکند.",
|
||
"mistral/ministral-3b.description": "مدلی فشرده و کارآمد برای وظایف روی دستگاه مانند دستیارها و تحلیلهای محلی با عملکرد تأخیر پایین.",
|
||
"mistral/ministral-8b.description": "مدلی قدرتمندتر با استنتاج سریعتر و بهینه در مصرف حافظه، ایدهآل برای جریانهای کاری پیچیده و برنامههای لبهای پرتقاضا.",
|
||
"mistral/mistral-embed.description": "مدل جاسازی متن عمومی برای جستجوی معنایی، شباهت، خوشهبندی و جریانهای کاری RAG.",
|
||
"mistral/mistral-large.description": "Mistral Large برای وظایف پیچیدهای که نیاز به استدلال قوی یا تخصص دارند ایدهآل است — تولید متن مصنوعی، تولید کد، RAG یا عاملها.",
|
||
"mistral/mistral-small.description": "Mistral Small برای وظایف ساده و قابل دستهبندی مانند طبقهبندی، پشتیبانی مشتری یا تولید متن مناسب است و عملکرد عالی را با قیمتی مناسب ارائه میدهد.",
|
||
"mistral/mixtral-8x22b-instruct.description": "مدل Instruct با 8x22B. این مدل MoE باز توسط Mistral ارائه میشود.",
|
||
"mistral/pixtral-12b.description": "مدلی با ۱۲ میلیارد پارامتر با درک تصویر و متن.",
|
||
"mistral/pixtral-large.description": "Pixtral Large دومین مدل در خانواده چندوجهی ما با درک تصویر در سطح پیشرفته است. اسناد، نمودارها و تصاویر طبیعی را پردازش میکند و درک متنی پیشرفته Mistral Large 2 را حفظ میکند.",
|
||
"mistralai/Mistral-7B-Instruct-v0.1.description": "Mistral (7B) Instruct به دلیل عملکرد قوی در بسیاری از وظایف زبانی شناخته شده است.",
|
||
"mistralai/Mistral-7B-Instruct-v0.2.description": "Mistral (7B) Instruct v0.2 در مدیریت دستورالعملها و دقت نتایج بهبود یافته است.",
|
||
"mistralai/Mistral-7B-Instruct-v0.3.description": "Mistral (7B) Instruct v0.3 محاسبات کارآمد و درک زبانی قوی را برای بسیاری از کاربردها ارائه میدهد.",
|
||
"mistralai/Mistral-7B-v0.1.description": "Mistral 7B فشرده اما با عملکرد بالا است، برای پردازش دستهای و وظایف ساده مانند طبقهبندی و تولید متن با استدلال قوی مناسب است.",
|
||
"mistralai/Mixtral-8x22B-Instruct-v0.1.description": "Mixtral-8x22B Instruct (۱۴۱ میلیارد) یک مدل LLM بسیار بزرگ برای بارهای کاری سنگین است.",
|
||
"mistralai/Mixtral-8x7B-Instruct-v0.1.description": "Mixtral-8x7B Instruct (۴۶.۷ میلیارد) ظرفیت بالایی برای پردازش دادههای در مقیاس بزرگ فراهم میکند.",
|
||
"mistralai/Mixtral-8x7B-v0.1.description": "Mixtral 8x7B یک مدل MoE پراکنده است که سرعت استنتاج را افزایش میدهد و برای وظایف چندزبانه و تولید کد مناسب است.",
|
||
"mistralai/mistral-nemo.description": "Mistral Nemo یک مدل ۷.۳ میلیاردی با پشتیبانی چندزبانه و عملکرد قوی در برنامهنویسی است.",
|
||
"mixtral-8x7b-32768.description": "Mixtral 8x7B محاسبات موازی مقاوم در برابر خطا را برای وظایف پیچیده فراهم میکند.",
|
||
"mixtral.description": "Mixtral مدل MoE از Mistral AI با وزنهای باز است که از تولید کد و درک زبان پشتیبانی میکند.",
|
||
"mixtral:8x22b.description": "Mixtral مدل MoE از Mistral AI با وزنهای باز است که از تولید کد و درک زبان پشتیبانی میکند.",
|
||
"moonshot-v1-128k-vision-preview.description": "مدلهای بینایی Kimi (شامل moonshot-v1-8k-vision-preview/moonshot-v1-32k-vision-preview/moonshot-v1-128k-vision-preview) قادر به درک محتوای تصاویر مانند متن، رنگها و اشکال اشیاء هستند.",
|
||
"moonshot-v1-128k.description": "Moonshot V1 128K با پشتیبانی از زمینه بسیار طولانی، امکان تولید متون بسیار بلند را فراهم میکند و تا ۱۲۸٬۰۰۰ توکن را برای سناریوهای پژوهشی، دانشگاهی و اسناد بزرگ مدیریت میکند.",
|
||
"moonshot-v1-32k-vision-preview.description": "مدلهای بینایی Kimi (شامل moonshot-v1-8k-vision-preview/moonshot-v1-32k-vision-preview/moonshot-v1-128k-vision-preview) قادر به درک محتوای تصاویر مانند متن، رنگها و اشکال اشیاء هستند.",
|
||
"moonshot-v1-32k.description": "Moonshot V1 32K از ۳۲٬۷۶۸ توکن برای زمینههای متوسط پشتیبانی میکند و برای اسناد بلند و گفتگوهای پیچیده در تولید محتوا، گزارشها و سامانههای چت ایدهآل است.",
|
||
"moonshot-v1-8k-vision-preview.description": "مدلهای بینایی Kimi (شامل moonshot-v1-8k-vision-preview/moonshot-v1-32k-vision-preview/moonshot-v1-128k-vision-preview) قادر به درک محتوای تصاویر مانند متن، رنگها و اشکال اشیاء هستند.",
|
||
"moonshot-v1-8k.description": "Moonshot V1 8K برای تولید متون کوتاه بهینهسازی شده و عملکردی کارآمد دارد. این مدل تا ۸٬۱۹۲ توکن را برای چتهای کوتاه، یادداشتها و محتوای سریع مدیریت میکند.",
|
||
"moonshotai/Kimi-Dev-72B.description": "Kimi-Dev-72B یک مدل کد متنباز LLM است که با RL در مقیاس بزرگ بهینه شده است تا پچهای قوی و آماده تولید ایجاد کند. این مدل با امتیاز 60.4٪ در SWE-bench Verified، رکورد جدیدی برای وظایف مهندسی نرمافزار خودکار مانند رفع اشکال و بررسی کد در مدلهای متنباز ثبت کرده است.",
|
||
"moonshotai/Kimi-K2-Instruct-0905.description": "Kimi K2-Instruct-0905 جدیدترین و قدرتمندترین نسخه Kimi K2 است. این مدل MoE سطح بالا با ۱ تریلیون پارامتر کل و ۳۲ میلیارد پارامتر فعال است. ویژگیهای کلیدی آن شامل هوش برنامهنویسی عاملمحور قویتر، بهبود چشمگیر در آزمونها و وظایف واقعی عاملها، و کدنویسی ظاهری و کاربردی بهتر در رابط کاربری است.",
|
||
"moonshotai/Kimi-K2-Thinking.description": "Kimi K2 Thinking جدیدترین و قدرتمندترین مدل تفکر متنباز است. عمق استدلال چندمرحلهای را به طور قابل توجهی گسترش میدهد و استفاده پایدار از ابزار را در 200–300 تماس متوالی حفظ میکند و رکوردهای جدیدی در Humanity's Last Exam (HLE)، BrowseComp و سایر معیارها ثبت میکند. در کدنویسی، ریاضیات، منطق و سناریوهای عامل برتری دارد. بر اساس معماری MoE با ~1 تریلیون پارامتر کل ساخته شده است، از یک پنجره زمینه 256K و تماس با ابزار پشتیبانی میکند.",
|
||
"moonshotai/kimi-k2-0711.description": "Kimi K2 0711 نسخه instruct از سری Kimi است که برای تولید کد با کیفیت بالا و استفاده از ابزارها مناسب است.",
|
||
"moonshotai/kimi-k2-0905.description": "Kimi K2 0905 نسخهای بهروزشده است که عملکرد زمینه و استدلال را با بهینهسازیهای برنامهنویسی گسترش میدهد.",
|
||
"moonshotai/kimi-k2-instruct-0905.description": "مدل kimi-k2-0905-preview از پنجره زمینه ۲۵۶K پشتیبانی میکند و دارای برنامهنویسی عاملمحور قویتر، کد رابط کاربری زیباتر و کاربردیتر و درک بهتر زمینه است.",
|
||
"moonshotai/kimi-k2-thinking-turbo.description": "Kimi K2 Thinking Turbo نسخه پرسرعت مدل Kimi K2 Thinking است که با حفظ عمق استدلال، تأخیر را بهطور قابلتوجهی کاهش میدهد.",
|
||
"moonshotai/kimi-k2-thinking.description": "Kimi K2 Thinking مدل استدلال Moonshot است که برای وظایف استدلال عمیق بهینهسازی شده و قابلیتهای عمومی عامل را داراست.",
|
||
"moonshotai/kimi-k2.5.description": "Kimi K2.5 هوشمندترین مدل Kimi تا به امروز است که دارای معماری چندوجهی بومی است.",
|
||
"moonshotai/kimi-k2.description": "Kimi K2 یک مدل بزرگ MoE از Moonshot AI با ۱ تریلیون پارامتر کل و ۳۲ میلیارد پارامتر فعال در هر عبور است که برای قابلیتهای عامل از جمله استفاده پیشرفته از ابزار، استدلال و تولید کد بهینهسازی شده است.",
|
||
"morph/morph-v3-fast.description": "Morph یک مدل تخصصی است که تغییرات کدی پیشنهادشده توسط مدلهای پیشرفته (مانند Claude یا GPT-4o) را با سرعت بیش از ۴۵۰۰ توکن در ثانیه روی فایلهای موجود شما اعمال میکند. این مدل مرحله نهایی در جریان کاری برنامهنویسی با هوش مصنوعی است و از ورودی/خروجی ۱۶K توکن پشتیبانی میکند.",
|
||
"morph/morph-v3-large.description": "Morph یک مدل تخصصی است که تغییرات کدی پیشنهادشده توسط مدلهای پیشرفته (مانند Claude یا GPT-4o) را با سرعت بیش از ۲۵۰۰ توکن در ثانیه روی فایلهای موجود شما اعمال میکند. این مدل مرحله نهایی در جریان کاری برنامهنویسی با هوش مصنوعی است و از ورودی/خروجی ۱۶K توکن پشتیبانی میکند.",
|
||
"musesteamer-2.0-lite-i2v.description": "در مقایسه با Turbo، عملکرد برتر با هزینه-اثربخشی عالی ارائه میدهد.",
|
||
"musesteamer-2.0-pro-i2v.description": "بر اساس Turbo، از تولید ویدئو پویا 1080P پشتیبانی میکند، که کیفیت بصری بالاتر و بیان ویدئویی بهتری ارائه میدهد.",
|
||
"musesteamer-2.0-turbo-i2v-audio.description": "از تولید ویدئو پویا 5 و 10 ثانیهای 720P با صدا پشتیبانی میکند. امکان ایجاد صوتی-تصویری چند نفره با صدا و تصاویر همگامشده، تصاویر با کیفیت سینمایی، و حرکات دوربین در سطح استادانه را فراهم میکند.",
|
||
"musesteamer-2.0-turbo-i2v.description": "از تولید ویدئو پویا 5 ثانیهای 720P بدون صدا پشتیبانی میکند، که تصاویر با کیفیت سینمایی، حرکات پیچیده دوربین، و احساسات و اقدامات واقعی شخصیتها را ارائه میدهد.",
|
||
"musesteamer-air-i2v.description": "مدل تولید ویدئو Baidu MuseSteamer Air در ثبات سوژه، واقعگرایی فیزیکی، اثرات حرکت دوربین، و سرعت تولید عملکرد خوبی دارد. از تولید ویدئو پویا 5 ثانیهای 720P بدون صدا پشتیبانی میکند، که تصاویر با کیفیت سینمایی، تولید سریع، و هزینه-اثربخشی عالی ارائه میدهد.",
|
||
"musesteamer-air-image.description": "musesteamer-air-image یک مدل تولید تصویر است که توسط تیم جستجوی Baidu توسعه یافته است تا عملکرد هزینهای استثنایی ارائه دهد. این مدل میتواند بهسرعت تصاویر واضح و منسجم با عمل را بر اساس دستورات کاربر تولید کند و توصیفات کاربر را بهراحتی به تصاویر تبدیل کند.",
|
||
"nemotron-3-super-free.description": "Nemotron 3 Super Free از Nvidia — مدل رایگان برای استدلال با پشتیبانی قوی از کدنویسی.",
|
||
"nousresearch/hermes-2-pro-llama-3-8b.description": "Hermes 2 Pro Llama 3 8B نسخه بهروزشدهای از Nous Hermes 2 است که با جدیدترین دادههای داخلی توسعه یافته است.",
|
||
"nvidia/Llama-3.1-Nemotron-70B-Instruct-HF.description": "Llama 3.1 Nemotron 70B یک مدل سفارشیشده توسط NVIDIA برای بهبود مفید بودن پاسخهای LLM است. این مدل در Arena Hard، AlpacaEval 2 LC و GPT-4-Turbo MT-Bench عملکرد قوی دارد و تا ۱ اکتبر ۲۰۲۴ در هر سه معیار همترازی خودکار رتبه اول را کسب کرده است. این مدل از Llama-3.1-70B-Instruct با استفاده از RLHF (REINFORCE)، Llama-3.1-Nemotron-70B-Reward و درخواستهای HelpSteer2-Preference آموزش دیده است.",
|
||
"nvidia/llama-3.1-nemotron-51b-instruct.description": "مدلی متمایز با دقت و کارایی استثنایی در پردازش زبان طبیعی.",
|
||
"nvidia/llama-3.1-nemotron-70b-instruct.description": "Llama-3.1-Nemotron-70B-Instruct یک مدل سفارشیشده توسط NVIDIA است که برای بهبود مفید بودن پاسخهای LLM طراحی شده است.",
|
||
"o1-mini.description": "o1-mini یک مدل استدلال سریع و مقرونبهصرفه است که برای کدنویسی، ریاضیات و علوم طراحی شده است. دارای زمینه 128K و برش دانش تا اکتبر 2023 است.",
|
||
"o1-preview.description": "o1 مدل استدلال جدید OpenAI برای وظایف پیچیدهای است که نیاز به دانش گسترده دارند. دارای زمینه 128K و برش دانش تا اکتبر 2023 است.",
|
||
"o1-pro.description": "سری o1 با یادگیری تقویتی آموزش دیده تا پیش از پاسخدهی فکر کند و استدلال پیچیده را مدیریت کند. o1-pro از منابع محاسباتی بیشتری برای تفکر عمیقتر استفاده میکند و پاسخهایی با کیفیت بالاتر بهطور مداوم ارائه میدهد.",
|
||
"o1.description": "o1 مدل جدید استدلال OpenAI با ورودی متن+تصویر و خروجی متنی است که برای وظایف پیچیده با نیاز به دانش گسترده مناسب است. این مدل دارای پنجره زمینه ۲۰۰K و تاریخ قطع دانش اکتبر ۲۰۲۳ است.",
|
||
"o3-2025-04-16.description": "o3 مدل جدید استدلال OpenAI با ورودی متن+تصویر و خروجی متنی برای وظایف پیچیده با نیاز به دانش گسترده است.",
|
||
"o3-deep-research.description": "o3-deep-research پیشرفتهترین مدل تحقیقاتی ما برای وظایف پیچیده چندمرحلهای است. این مدل میتواند در وب جستجو کند و به دادههای شما از طریق اتصالدهندههای MCP دسترسی داشته باشد.",
|
||
"o3-mini.description": "o3-mini جدیدترین مدل کوچک استدلال ماست که هوش بالاتری را با همان هزینه و تأخیر مدل o1-mini ارائه میدهد.",
|
||
"o3-pro-2025-06-10.description": "o3 Pro مدل جدید استدلال OpenAI با ورودی متن+تصویر و خروجی متنی برای وظایف پیچیده با نیاز به دانش گسترده است.",
|
||
"o3-pro.description": "o3-pro از منابع محاسباتی بیشتری برای تفکر عمیقتر استفاده میکند و بهطور مداوم پاسخهای بهتری ارائه میدهد؛ فقط از طریق API پاسخها در دسترس است.",
|
||
"o3.description": "o3 یک مدل قدرتمند همهجانبه است که استاندارد جدیدی در ریاضی، علوم، برنامهنویسی و استدلال بصری تعیین میکند. این مدل در نگارش فنی و پیروی از دستورالعملها عالی عمل میکند و میتواند متن، کد و تصاویر را برای حل مسائل چندمرحلهای تحلیل کند.",
|
||
"o4-mini-2025-04-16.description": "o4-mini یک مدل استدلالی از OpenAI با ورودی متن+تصویر و خروجی متنی است که برای وظایف پیچیده با نیاز به دانش گسترده مناسب است و پنجره متنی ۲۰۰ هزار توکنی دارد.",
|
||
"o4-mini-deep-research.description": "o4-mini-deep-research یک مدل تحقیق عمیق سریعتر و مقرونبهصرفهتر برای پژوهشهای چندمرحلهای پیچیده است. این مدل میتواند در وب جستجو کند و از طریق اتصالدهندههای MCP به دادههای شما دسترسی یابد.",
|
||
"o4-mini.description": "o4-mini جدیدترین مدل کوچک سری o است که برای استدلال سریع و مؤثر بهینهسازی شده و در وظایف کدنویسی و بینایی عملکرد بالایی دارد.",
|
||
"open-codestral-mamba.description": "Codestral Mamba یک مدل زبانی Mamba 2 متمرکز بر تولید کد است که از وظایف پیشرفته کدنویسی و استدلال پشتیبانی میکند.",
|
||
"open-mistral-7b.description": "Mistral 7B مدلی جمعوجور اما قدرتمند است که برای پردازش دستهای و وظایف ساده مانند طبقهبندی و تولید متن مناسب بوده و استدلال خوبی دارد.",
|
||
"open-mistral-nemo.description": "Mistral Nemo یک مدل ۱۲ میلیاردی است که با همکاری Nvidia توسعه یافته و عملکرد قوی در استدلال و کدنویسی با ادغام آسان دارد.",
|
||
"open-mixtral-8x22b.description": "Mixtral 8x22B یک مدل MoE بزرگ برای وظایف پیچیده است که استدلال قوی و بازدهی بالاتری ارائه میدهد.",
|
||
"open-mixtral-8x7b.description": "Mixtral 8x7B یک مدل MoE پراکنده است که سرعت استنتاج را افزایش داده و برای وظایف چندزبانه و تولید کد مناسب است.",
|
||
"openai/gpt-3.5-turbo-instruct.description": "قابلیتهایی مشابه مدلهای دوره GPT-3 دارد و با نقاط پایانی تکمیل قدیمی سازگار است، نه چت.",
|
||
"openai/gpt-3.5-turbo.description": "قویترین و مقرونبهصرفهترین مدل GPT-3.5 از OpenAI که برای چت بهینهسازی شده اما در تکمیلهای کلاسیک نیز عملکرد خوبی دارد.",
|
||
"openai/gpt-4-turbo.description": "gpt-4-turbo از OpenAI دارای دانش عمومی گسترده و تخصص در حوزههای مختلف است، دستورالعملهای پیچیده زبان طبیعی را دنبال میکند و مسائل دشوار را با دقت حل میکند. تاریخ قطع دانش آن آوریل ۲۰۲۳ است و پنجره متنی ۱۲۸ هزار توکنی دارد.",
|
||
"openai/gpt-4.1-mini.description": "GPT-4.1 Mini تأخیر کمتر و ارزش بهتری برای وظایف با زمینه متوسط ارائه میدهد.",
|
||
"openai/gpt-4.1-nano.description": "GPT-4.1 Nano گزینهای بسیار کمهزینه و با تأخیر پایین برای چتهای کوتاه با فرکانس بالا یا طبقهبندی است.",
|
||
"openai/gpt-4.1.description": "سری GPT-4.1 پنجرههای متنی بزرگتر و قابلیتهای مهندسی و استدلال قویتری ارائه میدهد.",
|
||
"openai/gpt-4o-mini.description": "GPT-4o-mini نسخهای سریع و کوچک از GPT-4o برای استفاده چندوجهی با تأخیر پایین است.",
|
||
"openai/gpt-4o.description": "خانواده GPT-4o مدل Omni از OpenAI است که از ورودی متن + تصویر و خروجی متنی پشتیبانی میکند.",
|
||
"openai/gpt-5-chat.description": "GPT-5 Chat نسخهای از GPT-5 است که برای مکالمات بهینهسازی شده و تأخیر کمتری برای تعامل بهتر دارد.",
|
||
"openai/gpt-5-codex.description": "GPT-5-Codex نسخهای از GPT-5 است که برای کدنویسی و جریانهای کاری کد در مقیاس بزرگ بهینه شده است.",
|
||
"openai/gpt-5-mini.description": "GPT-5 Mini نسخهای کوچکتر از GPT-5 برای سناریوهای کمهزینه و با تأخیر پایین است.",
|
||
"openai/gpt-5-nano.description": "GPT-5 Nano نسخهای فوقالعاده کوچک برای سناریوهایی با محدودیت شدید هزینه و تأخیر است.",
|
||
"openai/gpt-5-pro.description": "GPT-5 Pro مدل پرچمدار OpenAI است که استدلال قویتر، تولید کد و ویژگیهای سطح سازمانی را با مسیریابی در زمان اجرا و سیاستهای ایمنی سختگیرانه ارائه میدهد.",
|
||
"openai/gpt-5.1-chat.description": "GPT-5.1 Chat عضو سبکوزن خانواده GPT-5.1 است که برای مکالمات با تأخیر پایین بهینه شده و همچنان استدلال قوی و اجرای دستورالعمل را حفظ میکند.",
|
||
"openai/gpt-5.1-codex-mini.description": "GPT-5.1-Codex-Mini نسخهای کوچکتر و سریعتر از GPT-5.1-Codex است که برای سناریوهای کدنویسی حساس به تأخیر و هزینه مناسبتر است.",
|
||
"openai/gpt-5.1-codex.description": "GPT-5.1-Codex نسخهای از GPT-5.1 است که برای مهندسی نرمافزار و جریانهای کاری کدنویسی بهینه شده و برای بازسازیهای بزرگ، اشکالزدایی پیچیده و وظایف خودکار طولانی مناسب است.",
|
||
"openai/gpt-5.1.description": "GPT-5.1 جدیدترین مدل پرچمدار در سری GPT-5 است که بهبودهای قابلتوجهی در استدلال عمومی، پیروی از دستورالعمل و طبیعی بودن مکالمه نسبت به GPT-5 دارد و برای وظایف گسترده مناسب است.",
|
||
"openai/gpt-5.2-chat.description": "GPT-5.2 Chat نسخه ChatGPT برای تجربه بهبودهای جدید مکالمهای است.",
|
||
"openai/gpt-5.2-pro.description": "GPT-5.2 Pro: نسخهای هوشمندتر و دقیقتر از GPT-5.2 (فقط از طریق API پاسخها)، مناسب برای مسائل دشوار و استدلال چندمرحلهای طولانی.",
|
||
"openai/gpt-5.2.description": "GPT-5.2 یک مدل پرچمدار برای برنامهنویسی و جریانهای کاری عاملمحور با استدلال قویتر و عملکرد بهتر در زمینههای طولانی است.",
|
||
"openai/gpt-5.description": "GPT-5 مدل قدرتمند OpenAI برای طیف وسیعی از وظایف تولیدی و پژوهشی است.",
|
||
"openai/gpt-oss-120b.description": "یک مدل زبانی بزرگ چندمنظوره با قابلیت استدلال قوی و قابلکنترل.",
|
||
"openai/gpt-oss-20b.description": "مدلی جمعوجور با وزنهای باز که برای تأخیر پایین و محیطهای با منابع محدود، از جمله اجراهای محلی و لبهای بهینه شده است.",
|
||
"openai/o1-mini.description": "مدل o1-mini یک مدل استدلالی سریع و مقرونبهصرفه است که برای برنامهنویسی، ریاضیات و علوم طراحی شده است. این مدل دارای حافظه متنی ۱۲۸ هزار توکن و دانش بهروز تا اکتبر ۲۰۲۳ است.",
|
||
"openai/o1-preview.description": "مدل o1 پیشنمایشی از مدل استدلالی جدید OpenAI برای انجام وظایف پیچیده با نیاز به دانش گسترده است. این مدل دارای حافظه متنی ۱۲۸ هزار توکن و دانش بهروز تا اکتبر ۲۰۲۳ است.",
|
||
"openai/o1.description": "مدل o1 پرچمدار OpenAI در حوزه استدلال است که برای حل مسائل پیچیده با نیاز به تفکر عمیق طراحی شده و دقت بالایی در انجام وظایف چندمرحلهای ارائه میدهد.",
|
||
"openai/o3-mini-high.description": "مدل o3-mini (با توان استدلال بالا) هوشمندی بیشتری را با همان هزینه و تأخیر مدل o1-mini ارائه میدهد.",
|
||
"openai/o3-mini.description": "مدل o3-mini جدیدترین مدل کوچک استدلالی OpenAI است که با همان هزینه و تأخیر مدل o1-mini، هوشمندی بیشتری ارائه میدهد.",
|
||
"openai/o3.description": "مدل o3 قدرتمندترین مدل استدلالی OpenAI است که استاندارد جدیدی در برنامهنویسی، ریاضیات، علوم و درک بصری ایجاد کرده است. این مدل در پاسخ به پرسشهای پیچیده و چندوجهی، بهویژه در تحلیل تصاویر، نمودارها و دیاگرامها بسیار توانمند است.",
|
||
"openai/o4-mini-high.description": "مدل o4-mini در سطح استدلال بالا، برای استدلال سریع و کارآمد با عملکرد قوی در برنامهنویسی و بینایی بهینهسازی شده است.",
|
||
"openai/o4-mini.description": "مدل o4-mini یک مدل کوچک و کارآمد از OpenAI برای سناریوهای با تأخیر پایین است.",
|
||
"openai/text-embedding-3-large.description": "قویترین مدل تعبیه متن OpenAI برای وظایف انگلیسی و غیرانگلیسی.",
|
||
"openai/text-embedding-3-small.description": "نسخه بهبودیافته و با عملکرد بالاتر مدل تعبیه ada از OpenAI.",
|
||
"openai/text-embedding-ada-002.description": "مدل تعبیه متن قدیمی OpenAI.",
|
||
"openrouter/auto.description": "بر اساس طول متن، موضوع و پیچیدگی، درخواست شما به یکی از مدلهای Llama 3 70B Instruct، Claude 3.5 Sonnet (با خودنظارتی) یا GPT-4o هدایت میشود.",
|
||
"oswe-vscode-prime.description": "Raptor mini یک مدل پیشنمایش بهینهسازیشده برای وظایف مرتبط با کدنویسی است.",
|
||
"oswe-vscode-secondary.description": "Raptor mini یک مدل پیشنمایش بهینهسازیشده برای وظایف مرتبط با کدنویسی است.",
|
||
"paratera/deepseek-v3.2.description": "DeepSeek V3.2 مدلی است که بین کارایی محاسباتی بالا و عملکرد استدلال و عامل عالی تعادل برقرار میکند.",
|
||
"perplexity/sonar-pro.description": "محصول پرچمدار Perplexity با اتصال به جستجو، پشتیبانی از پرسشهای پیشرفته و پیگیریهای بعدی.",
|
||
"perplexity/sonar-reasoning-pro.description": "مدلی پیشرفته با تمرکز بر استدلال که خروجی زنجیره تفکر (CoT) را با جستجوی تقویتشده و چند پرسوجو در هر درخواست ارائه میدهد.",
|
||
"perplexity/sonar-reasoning.description": "مدلی با تمرکز بر استدلال که زنجیره تفکر (CoT) را با توضیحات دقیق و مبتنی بر جستجو تولید میکند.",
|
||
"perplexity/sonar.description": "محصول سبک Perplexity با اتصال به جستجو، سریعتر و ارزانتر از Sonar Pro.",
|
||
"phi3.description": "Phi-3 مدل سبک و متنباز مایکروسافت برای یکپارچهسازی کارآمد و استدلال در مقیاس بزرگ است.",
|
||
"phi3:14b.description": "Phi-3 مدل سبک و متنباز مایکروسافت برای یکپارچهسازی کارآمد و استدلال در مقیاس بزرگ است.",
|
||
"pixtral-12b-2409.description": "Pixtral در درک نمودار/تصویر، پاسخ به پرسشهای اسنادی، استدلال چندوجهی و پیروی از دستورالعملها بسیار توانمند است. این مدل تصاویر را با وضوح و نسبت تصویر اصلی دریافت کرده و هر تعداد تصویر را در پنجره متنی ۱۲۸ هزار توکن پردازش میکند.",
|
||
"pixtral-large-latest.description": "Pixtral Large یک مدل چندوجهی باز با ۱۲۴ میلیارد پارامتر است که بر پایه Mistral Large 2 ساخته شده و دومین مدل در خانواده چندوجهی ما با درک پیشرفته تصویر در سطح مرزی است.",
|
||
"pixverse/pixverse-c1-it2v.description": "C1 یک مدل مقیاسبالا برای صنعت فیلم و تلویزیون است که توسط PixVerse در اواخر مارس ۲۰۲۶ عرضه شده است. قابلیت it2v (تصویر به ویدیو) آن نهتنها کنترلپذیری مشابه t2v (متن به ویدیو) ارائه میدهد، بلکه رنگ، اشباع، صحنهها و ویژگیهای شخصیتی تصاویر مرجع را با دقت بالا حفظ میکند. نسبت به نسخه V6، تفسیر بهتر پرامپت، خلاقیت قویتر و اجرای حرکات رزمی و جلوههای بصری (مانند جادوها) نزدیکتر به استانداردهای سینمایی حرفهای ارائه میدهد. این مدل تا ۱۵ ثانیه تولید ویدیو را پشتیبانی میکند، شامل موسیقی با خروجی مستقیم ویدیو است و از زبانهای متعدد پشتیبانی میکند. بهویژه برای شاتهای کوتاه مانند کلوزآپ تکنفره، مونولوگ، فریزفریم یا صحنههای آهسته، و شاتهای گذار بسیار مناسب است.",
|
||
"pixverse/pixverse-c1-kf2v.description": "C1 یک مدل مقیاسبالا برای صنعت فیلم و تلویزیون است که توسط PixVerse در اواخر مارس ۲۰۲۶ عرضه شده است. قابلیت kf2v (تصویر کلیدی به ویدیو) امکان انتقالی روان و طبیعی بین هر دو تصویر ورودی را فراهم میکند. این مدل تا ۱۵ ثانیه تولید ویدیو، همراه با موسیقی و خروجی مستقیم ویدیو را پشتیبانی کرده و از زبانهای متعدد پشتیبانی میکند.",
|
||
"pixverse/pixverse-c1-r2v.description": "C1 یک مدل مقیاسبالا برای صنعت فیلم و تلویزیون است که توسط PixVerse در اواخر مارس ۲۰۲۶ عرضه شده است. قابلیت r2v (مرجع به ویدیو) امکان ورود ۲ تا ۷ تصویر را فراهم کرده و با ترکیب هوشمندانه چند سوژه، کنترلپذیری پرامپت مشابه t2v و همچنین انسجام و خلاقیت مشابه it2v را حفظ میکند. این مدل اجرای حرکات رزمی و جلوههای بصری (مانند جادوها و سکانسهای اکشن) را نزدیکتر به استانداردهای سینمایی حرفهای ارائه میدهد. تا ۱۵ ثانیه تولید ویدیو، همراه با موسیقی و خروجی مستقیم ویدیو را پشتیبانی کرده و با زبانهای مختلف سازگار است. برای صحنههای پیچیده مانند شاتهای گروهی چندشخصیتی، دیالوگها و تعاملات بهویژه در شاتهای مدیوم و واید بسیار مناسب است. در صورت ارائه یک تصویر استوریبورد چندبخشی (تا ۹ بخش)، میتواند تنها با یک کلیک یک توالی ویدیویی چندشاتی پیوسته تولید کند.",
|
||
"pixverse/pixverse-c1-t2v.description": "C1 یک مدل مقیاسبالا برای صنعت فیلم و تلویزیون است که توسط PixVerse در اواخر مارس ۲۰۲۶ عرضه شده است. قابلیت t2v (متن به ویدیو) امکان کنترل دقیق تولید ویدیو از طریق پرامپت را فراهم میکند و تکنیکهای مختلف زبان سینمایی مانند تراولینگ به جلو یا عقب، پن، تیلت و حرکات تعقیبی دوربین را با حرکت روان و کنترل خوب پرسپکتیو بازتولید میکند. این مدل تا ۱۵ ثانیه تولید ویدیو را پشتیبانی میکند، شامل موسیقی با خروجی مستقیم ویدیو است و از چندین زبان پشتیبانی میکند.",
|
||
"pixverse/pixverse-v5.6-it2v.description": "هر تصویری را آپلود کنید تا داستان، سرعت، و سبک را به طور آزاد سفارشی کنید، ویدئوهای زنده و منسجم تولید کنید. PixVerse V5.6 یک مدل بزرگ تولید ویدئو خود توسعهیافته توسط فناوری Aishi است، که ارتقاهای جامع در قابلیتهای متن به ویدئو و تصویر به ویدئو ارائه میدهد. این مدل وضوح تصویر، پایداری در حرکت پیچیده، و همگامسازی صوتی-تصویری را به طور قابل توجهی بهبود میبخشد. دقت همگامسازی لب و بیان طبیعی احساسات در صحنههای گفتگوی چند شخصیت بهبود یافته است. ترکیببندی، نورپردازی، و ثبات بافت نیز بهینه شدهاند، که کیفیت کلی تولید را بیشتر ارتقا میدهد. PixVerse V5.6 در رتبه برتر جهانی در جدول ردهبندی متن به ویدئو و تصویر به ویدئو تحلیل مصنوعی قرار دارد.",
|
||
"pixverse/pixverse-v5.6-kf2v.description": "انتقالهای یکپارچه بین هر دو تصویر را به دست آورید، و تغییرات صحنه روانتر و طبیعیتر با اثرات بصری چشمگیر ایجاد کنید. PixVerse V5.6 یک مدل بزرگ تولید ویدئو خود توسعهیافته توسط فناوری Aishi است، که ارتقاهای جامع در قابلیتهای متن به ویدئو و تصویر به ویدئو ارائه میدهد. این مدل وضوح تصویر، پایداری در حرکت پیچیده، و همگامسازی صوتی-تصویری را به طور قابل توجهی بهبود میبخشد. دقت همگامسازی لب و بیان طبیعی احساسات در صحنههای گفتگوی چند شخصیت بهبود یافته است. ترکیببندی، نورپردازی، و ثبات بافت نیز بهینه شدهاند، که کیفیت کلی تولید را بیشتر ارتقا میدهد. PixVerse V5.6 در رتبه برتر جهانی در جدول ردهبندی متن به ویدئو و تصویر به ویدئو تحلیل مصنوعی قرار دارد.",
|
||
"pixverse/pixverse-v5.6-r2v.description": "ورودی 2–7 تصویر برای ترکیب هوشمندانه سوژههای مختلف در حالی که سبک یکپارچه و حرکت هماهنگ حفظ میشود، به راحتی صحنههای روایتی غنی بسازید و قابلیت کنترل محتوا و آزادی خلاقانه را افزایش دهید. PixVerse V5.6 یک مدل بزرگ تولید ویدئو خود توسعهیافته توسط فناوری Aishi است، که ارتقاهای جامع در قابلیتهای متن به ویدئو و تصویر به ویدئو ارائه میدهد. این مدل وضوح تصویر، پایداری در حرکت پیچیده، و همگامسازی صوتی-تصویری را به طور قابل توجهی بهبود میبخشد. دقت همگامسازی لب و بیان طبیعی احساسات در صحنههای گفتگوی چند شخصیت بهبود یافته است. ترکیببندی، نورپردازی، و ثبات بافت نیز بهینه شدهاند، که کیفیت کلی تولید را بیشتر ارتقا میدهد. PixVerse V5.6 در رتبه برتر جهانی در جدول ردهبندی متن به ویدئو و تصویر به ویدئو تحلیل مصنوعی قرار دارد.",
|
||
"pixverse/pixverse-v5.6-t2v.description": "یک توضیح متنی وارد کنید تا ویدئوهای با کیفیت بالا با سرعت در سطح ثانیه و همترازی معنایی دقیق تولید کنید، که از سبکهای متعدد پشتیبانی میکند. PixVerse V5.6 یک مدل بزرگ تولید ویدئو خود توسعهیافته توسط فناوری Aishi است، که ارتقاهای جامع در قابلیتهای متن به ویدئو و تصویر به ویدئو ارائه میدهد. این مدل وضوح تصویر، پایداری در حرکت پیچیده، و همگامسازی صوتی-تصویری را به طور قابل توجهی بهبود میبخشد. دقت همگامسازی لب و بیان طبیعی احساسات در صحنههای گفتگوی چند شخصیت بهبود یافته است. ترکیببندی، نورپردازی، و ثبات بافت نیز بهینه شدهاند، که کیفیت کلی تولید را بیشتر ارتقا میدهد. PixVerse V5.6 در رتبه برتر جهانی در جدول ردهبندی متن به ویدئو و تصویر به ویدئو تحلیل مصنوعی قرار دارد.",
|
||
"pixverse/pixverse-v6-it2v.description": "V6 مدل جدید PixVerse است که در پایان مارس 2026 راهاندازی شده است. مدل it2v (تصویر به ویدئو) آن در رتبه دوم جهانی قرار دارد. علاوه بر قابلیتهای کنترل دستورات t2v (متن به ویدئو)، it2v میتواند رنگها، اشباع، صحنهها، و ویژگیهای شخصیت تصاویر مرجع را به دقت بازتولید کند، که احساسات شخصیت قویتر و عملکرد حرکت با سرعت بالا ارائه میدهد. این مدل از ویدئوهای تا 15 ثانیه، خروجی مستقیم موسیقی و ویدئو، و چند زبان پشتیبانی میکند. برای سناریوهایی مانند نمای نزدیک محصولات تجارت الکترونیک، تبلیغات تبلیغاتی، و مدلسازی شبیهسازی شده C4D برای نمایش ساختارهای محصول، با خروجی مستقیم یک کلیک ایدهآل است.",
|
||
"pixverse/pixverse-v6-kf2v.description": "V6 مدل جدید PixVerse است که در پایان مارس 2026 راهاندازی شده است. مدل kf2v (کلیدفریم به ویدئو) آن میتواند هر دو تصویر را به طور یکپارچه متصل کند، و انتقالهای ویدئویی روانتر و طبیعیتر تولید کند. این مدل از ویدئوهای تا 15 ثانیه، خروجی مستقیم موسیقی و ویدئو، و چند زبان پشتیبانی میکند.",
|
||
"pixverse/pixverse-v6-t2v.description": "V6 مدل جدید PixVerse است که در پایان مارس 2026 راهاندازی شده است. مدل t2v (متن به ویدئو) آن امکان کنترل دقیق تصاویر ویدئویی از طریق دستورات را فراهم میکند، و تکنیکهای سینمایی مختلف را به دقت بازتولید میکند. حرکات دوربین مانند فشار، کشش، پن، تیلت، دنبال کردن، و تعقیب روان و طبیعی هستند، با تغییرات دیدگاه دقیق و قابل کنترل. این مدل از ویدئوهای تا 15 ثانیه، خروجی مستقیم موسیقی و ویدئو، و چند زبان پشتیبانی میکند.",
|
||
"pro-128k.description": "Spark Pro 128K ظرفیت بسیار بالایی برای زمینهسازی دارد و تا ۱۲۸ هزار توکن را پشتیبانی میکند. این مدل برای اسناد بلند که نیاز به تحلیل کامل متن و انسجام بلندمدت دارند، ایدهآل است و از منطق روان و ارجاعهای متنوع در بحثهای پیچیده پشتیبانی میکند.",
|
||
"pro-deepseek-r1.description": "مدل خدمات اختصاصی سازمانی با همزمانی بستهبندیشده.",
|
||
"pro-deepseek-v3.description": "مدل خدمات اختصاصی سازمانی با همزمانی بستهبندیشده.",
|
||
"qianfan-70b.description": "Qianfan 70B یک مدل بزرگ چینی برای تولید با کیفیت بالا و استدلال پیچیده است.",
|
||
"qianfan-8b.description": "Qianfan 8B یک مدل عمومی میانرده است که بین هزینه و کیفیت در تولید متن و پاسخ به پرسشها تعادل برقرار میکند.",
|
||
"qianfan-agent-intent-32k.description": "Qianfan Agent Intent 32K برای شناسایی نیت و هماهنگی عاملها با پشتیبانی از زمینه طولانی طراحی شده است.",
|
||
"qianfan-agent-lite-8k.description": "Qianfan Agent Lite 8K یک مدل سبکوزن برای گفتوگوی چندمرحلهای کمهزینه و جریانهای کاری است.",
|
||
"qianfan-check-vl.description": "Qianfan Check VL یک مدل بازبینی محتوای چندوجهی برای تطابق تصویر-متن و وظایف شناسایی است.",
|
||
"qianfan-composition.description": "Qianfan Composition یک مدل تولید چندوجهی برای درک و تولید ترکیبی تصویر و متن است.",
|
||
"qianfan-engcard-vl.description": "Qianfan EngCard VL یک مدل شناسایی چندوجهی متمرکز بر سناریوهای انگلیسی است.",
|
||
"qianfan-llama-vl-8b.description": "Qianfan Llama VL 8B یک مدل چندوجهی مبتنی بر Llama برای درک عمومی تصویر و متن است.",
|
||
"qianfan-multipicocr.description": "Qianfan MultiPicOCR یک مدل OCR چندتصویری برای شناسایی و استخراج متن از تصاویر مختلف است.",
|
||
"qianfan-qi-vl.description": "Qianfan QI VL یک مدل پرسشوپاسخ چندوجهی برای بازیابی دقیق و پاسخدهی در سناریوهای پیچیده تصویر-متن است.",
|
||
"qianfan-singlepicocr.description": "Qianfan SinglePicOCR یک مدل OCR تکتصویری با دقت بالا در شناسایی کاراکترها است.",
|
||
"qianfan-vl-70b.description": "Qianfan VL 70B یک مدل بزرگ زبان-بینایی برای درک پیچیده تصویر و متن است.",
|
||
"qianfan-vl-8b.description": "Qianfan VL 8B یک مدل سبکوزن زبان-بینایی برای پرسشوپاسخ روزمره تصویر-متن و تحلیل است.",
|
||
"qvq-72b-preview.description": "QVQ-72B-Preview یک مدل تحقیقاتی آزمایشی از Qwen است که بر بهبود استدلال بصری تمرکز دارد.",
|
||
"qvq-max.description": "مدل استدلال بصری Qwen QVQ از ورودی تصویری و خروجی زنجیرهای پشتیبانی میکند و عملکرد قویتری در ریاضی، کدنویسی، تحلیل بصری، خلاقیت و وظایف عمومی دارد.",
|
||
"qvq-plus.description": "مدل استدلال بصری با ورودی تصویری و خروجی زنجیرهای. سری qvq-plus پس از qvq-max عرضه شده و استدلال سریعتر با تعادل بهتر کیفیت-هزینه ارائه میدهد.",
|
||
"qwen-coder-plus.description": "مدل کدنویسی Qwen.",
|
||
"qwen-coder-turbo-latest.description": "مدل کدنویسی Qwen.",
|
||
"qwen-coder-turbo.description": "مدل کدنویسی Qwen.",
|
||
"qwen-flash.description": "سریعترین و کمهزینهترین مدل Qwen، ایدهآل برای وظایف ساده.",
|
||
"qwen-image-2.0-pro-2026-04-22.description": "نسخه کامل مدل Qwen-Image-2.0 توانایی تولید و ویرایش تصویر را یکپارچه میکند. این نسخه از رندر حرفهای متن با ظرفیت دستور ۱۰۰۰ توکن، بافتهای بصری دقیق و واقعی، توصیف ریزبینانه صحنهها و همترازی معنایی قویتر با فرمانها پشتیبانی میکند. نسخه کامل قویترین رندر متن و بالاترین واقعگرایی را در سری ۲.۰ ارائه میدهد.",
|
||
"qwen-image-2.0-pro.description": "مدل نسخه کامل سری Qwen-Image-2.0 قابلیت تولید و ویرایش تصویر را در یک توانایی یکپارچه ترکیب میکند. این مدل از رندر متن حرفهایتر با ظرفیت دستورالعمل تا ۱۰۰۰ توکن پشتیبانی میکند، بافتهای بصری ظریفتر و واقعیتری ارائه میدهد، امکان توصیف دقیق صحنههای واقعی را فراهم میکند و همترازی معنایی قویتری با دستورات نشان میدهد. مدل نسخه کامل، قویترین قابلیت رندر متن و بالاترین سطح واقعگرایی را در سری ۲.۰ ارائه میدهد.",
|
||
"qwen-image-2.0.description": "مدل نسخه تسریعشده سری Qwen-Image-2.0 قابلیت تولید و ویرایش تصویر را در یک توانایی یکپارچه ترکیب میکند. این مدل از رندر متن حرفهایتر با ظرفیت دستورالعمل تا ۱۰۰۰ توکن پشتیبانی میکند، بافتهای بصری دقیقتر و واقعیتری ارائه میدهد، امکان توصیف دقیق صحنههای واقعی را فراهم میکند و پایبندی معنایی قویتری به دستورات نشان میدهد. نسخه تسریعشده به طور مؤثر بهینهترین تعادل بین کیفیت مدل و عملکرد را فراهم میکند.",
|
||
"qwen-image-edit-max.description": "مدل ویرایش تصویر Qwen از ورودی چندتصویر و خروجی چندتصویر پشتیبانی میکند و امکان ویرایش دقیق متن در تصویر، افزودن، حذف یا جابجایی اشیاء، تغییر عمل سوژه، انتقال سبک تصویر و بهبود جزئیات بصری را فراهم میکند.",
|
||
"qwen-image-edit-plus.description": "مدل ویرایش تصویر Qwen از ورودی چندتصویر و خروجی چندتصویر پشتیبانی میکند و امکان ویرایش دقیق متن در تصویر، افزودن، حذف یا جابجایی اشیاء، تغییر عمل سوژه، انتقال سبک تصویر و بهبود جزئیات بصری را فراهم میکند.",
|
||
"qwen-image-edit.description": "Qwen Image Edit یک مدل تصویر به تصویر است که تصاویر را بر اساس ورودی تصویری و دستورات متنی ویرایش میکند و امکان تنظیمات دقیق و تغییرات خلاقانه را فراهم میسازد.",
|
||
"qwen-image-max.description": "مدل تولید تصویر Qwen (سری Max) واقعگرایی و طبیعی بودن بصری را نسبت به سری Plus بهبود میبخشد، مصنوعات تولید شده توسط هوش مصنوعی را بهطور مؤثر کاهش میدهد و عملکرد برجستهای در ظاهر انسانی، جزئیات بافت و رندر متن نشان میدهد.",
|
||
"qwen-image-plus.description": "از طیف گستردهای از سبکهای هنری پشتیبانی میکند و بهویژه در رندر متن پیچیده در تصاویر مهارت دارد، که طراحی چیدمان تصویر-متن یکپارچه را امکانپذیر میکند.",
|
||
"qwen-image.description": "Qwen-Image یک مدل عمومی تولید تصویر است که از سبکهای هنری مختلف و رندر پیچیده متن (بهویژه چینی و انگلیسی) پشتیبانی میکند. از چیدمان چندخطی، متن در سطح پاراگراف و جزئیات دقیق برای ترکیبهای پیچیده متن-تصویر پشتیبانی میکند.",
|
||
"qwen-long.description": "مدل Qwen فوقالعاده بزرگ با پشتیبانی از زمینه طولانی و گفتوگو در سناریوهای چندسندی و چندسندی بلند.",
|
||
"qwen-math-plus-latest.description": "Qwen Math یک مدل زبانی تخصصی برای حل مسائل ریاضی است.",
|
||
"qwen-math-plus.description": "Qwen Math یک مدل زبانی تخصصی برای حل مسائل ریاضی است.",
|
||
"qwen-math-turbo-latest.description": "Qwen Math یک مدل زبانی تخصصی برای حل مسائل ریاضی است.",
|
||
"qwen-math-turbo.description": "Qwen Math یک مدل زبانی تخصصی برای حل مسائل ریاضی است.",
|
||
"qwen-max.description": "مدل فوقالعاده بزرگ Qwen در مقیاس صد میلیارد پارامتر که از زبانهای چینی، انگلیسی و دیگر زبانها پشتیبانی میکند؛ مدل API پشت محصولات فعلی Qwen2.5 است.",
|
||
"qwen-omni-turbo.description": "مدلهای Qwen-Omni از ورودیهای چندوجهی (ویدیو، صدا، تصویر، متن) پشتیبانی میکنند و خروجی صوتی و متنی تولید میکنند.",
|
||
"qwen-plus.description": "مدل Qwen فوقالعاده بزرگ تقویتشده با پشتیبانی از زبانهای چینی، انگلیسی و دیگر زبانها.",
|
||
"qwen-turbo.description": "Qwen Turbo دیگر بهروزرسانی نخواهد شد؛ لطفاً از Qwen Flash استفاده کنید. مدل فوقالعاده بزرگ Qwen با پشتیبانی از زبانهای چینی، انگلیسی و دیگر زبانها.",
|
||
"qwen-vl-chat-v1.description": "Qwen VL از تعاملات انعطافپذیر شامل ورودی چندتصویری، پرسشوپاسخ چندمرحلهای و وظایف خلاقانه پشتیبانی میکند.",
|
||
"qwen-vl-max-latest.description": "مدل فوقالعاده بزرگ زبان-بینایی Qwen. در مقایسه با نسخه تقویتشده، استدلال بصری و پیروی از دستورالعملها را برای درک و شناخت قویتر بهبود میبخشد.",
|
||
"qwen-vl-max.description": "مدل فوقالعاده بزرگ زبان-بینایی Qwen. در مقایسه با نسخه تقویتشده، استدلال بصری و پیروی از دستورالعملها را برای درک و شناخت بصری قویتر بهبود میبخشد.",
|
||
"qwen-vl-ocr.description": "Qwen OCR یک مدل استخراج متن از اسناد، جداول، تصاویر آزمون و دستخط است. از زبانهای چینی، انگلیسی، فرانسوی، ژاپنی، کرهای، آلمانی، روسی، ایتالیایی، ویتنامی و عربی پشتیبانی میکند.",
|
||
"qwen-vl-plus-latest.description": "مدل تقویتشده زبان-بینایی Qwen در مقیاس بزرگ با بهبودهای عمده در شناسایی جزئیات و متن، پشتیبانی از وضوح بیش از یک مگاپیکسل و نسبتهای ابعاد دلخواه.",
|
||
"qwen-vl-plus.description": "مدل تقویتشده زبان-بینایی Qwen در مقیاس بزرگ با بهبودهای عمده در شناسایی جزئیات و متن، پشتیبانی از وضوح بیش از یک مگاپیکسل و نسبتهای ابعاد دلخواه.",
|
||
"qwen-vl-v1.description": "مدل پیشآموزششده مبتنی بر Qwen-7B با ماژول بینایی افزوده و ورودی تصویری با وضوح ۴۴۸.",
|
||
"qwen/qwen-2-7b-instruct.description": "Qwen2 نسل جدید مدلهای زبانی Qwen است. Qwen2 7B یک مدل مبتنی بر ترنسفورمر است که در درک زبان، توانایی چندزبانه، برنامهنویسی، ریاضی و استدلال عملکرد بالایی دارد.",
|
||
"qwen/qwen-2-7b-instruct:free.description": "Qwen2 یک خانواده جدید از مدلهای زبانی بزرگ با درک و تولید قویتر است.",
|
||
"qwen/qwen-2-vl-72b-instruct.description": "Qwen2-VL جدیدترین نسخه Qwen-VL است که به عملکرد پیشرفته در بنچمارکهای بینایی مانند MathVista، DocVQA، RealWorldQA و MTVQA دست یافته است. این مدل میتواند بیش از ۲۰ دقیقه ویدیو را برای پرسشوپاسخ، گفتوگو و تولید محتوا با کیفیت بالا درک کند. همچنین استدلال و تصمیمگیری پیچیده را انجام میدهد و با دستگاههای همراه و رباتها برای اقدام بر اساس زمینه بصری و دستور متنی یکپارچه میشود. فراتر از زبانهای انگلیسی و چینی، متن در تصاویر را به زبانهای مختلف از جمله بیشتر زبانهای اروپایی، ژاپنی، کرهای، عربی و ویتنامی میخواند.",
|
||
"qwen/qwen-2.5-72b-instruct.description": "Qwen2.5-72B-Instruct یکی از جدیدترین مدلهای LLM شرکت Alibaba Cloud است. این مدل ۷۲ میلیارد پارامتری پیشرفتهای قابلتوجهی در برنامهنویسی و ریاضیات دارد، از بیش از ۲۹ زبان (از جمله چینی و انگلیسی) پشتیبانی میکند و در پیروی از دستورالعملها، درک دادههای ساختاریافته و تولید خروجی ساختاریافته (بهویژه JSON) بسیار بهبود یافته است.",
|
||
"qwen/qwen2.5-32b-instruct.description": "Qwen2.5-32B-Instruct یکی از جدیدترین مدلهای LLM شرکت Alibaba Cloud است. این مدل ۳۲ میلیارد پارامتری پیشرفتهای قابلتوجهی در برنامهنویسی و ریاضیات دارد، از بیش از ۲۹ زبان (از جمله چینی و انگلیسی) پشتیبانی میکند و در پیروی از دستورالعملها، درک دادههای ساختاریافته و تولید خروجی ساختاریافته (بهویژه JSON) بسیار بهبود یافته است.",
|
||
"qwen/qwen2.5-7b-instruct.description": "یک مدل LLM دوزبانه برای زبان چینی و انگلیسی در حوزههای زبان، برنامهنویسی، ریاضیات و استدلال.",
|
||
"qwen/qwen2.5-coder-32b-instruct.description": "مدلی پیشرفته برای تولید، استدلال و اصلاح کد در زبانهای برنامهنویسی رایج.",
|
||
"qwen/qwen2.5-coder-7b-instruct.description": "مدل کد میانرده قدرتمند با حافظه متنی ۳۲ هزار توکن، توانمند در برنامهنویسی چندزبانه.",
|
||
"qwen/qwen3-14b.description": "Qwen3-14B نسخه ۱۴ میلیارد پارامتری برای استدلال عمومی و سناریوهای چت است.",
|
||
"qwen/qwen3-14b:free.description": "Qwen3-14B یک مدل LLM علّی با ۱۴.۸ میلیارد پارامتر است که برای استدلال پیچیده و چت کارآمد طراحی شده است. این مدل بین حالت تفکر (برای ریاضی، کدنویسی و منطق) و حالت غیرتفکر (برای چت عمومی) جابجا میشود. برای پیروی از دستورالعملها، استفاده از ابزارهای عامل و نوشتن خلاقانه در بیش از ۱۰۰ زبان و گویش تنظیم شده است. بهصورت بومی از حافظه متنی ۳۲ هزار توکن پشتیبانی میکند و با YaRN تا ۱۳۱ هزار توکن گسترش مییابد.",
|
||
"qwen/qwen3-235b-a22b-2507.description": "Qwen3-235B-A22B-Instruct-2507 نسخه Instruct از سری Qwen3 است که بین استفاده چندزبانه از دستورالعملها و سناریوهای با حافظه بلند تعادل برقرار میکند.",
|
||
"qwen/qwen3-235b-a22b-thinking-2507.description": "Qwen3-235B-A22B-Thinking-2507 نسخه تفکری Qwen3 است که برای وظایف پیچیده ریاضی و استدلال تقویت شده است.",
|
||
"qwen/qwen3-235b-a22b.description": "Qwen3-235B-A22B یک مدل MoE با ۲۳۵ میلیارد پارامتر از Qwen است که در هر عبور رو به جلو ۲۲ میلیارد پارامتر فعال دارد. این مدل بین حالت تفکر (برای استدلال پیچیده، ریاضی و کدنویسی) و حالت غیرتفکر (برای چت کارآمد) جابجا میشود. از استدلال قوی، پشتیبانی چندزبانه (بیش از ۱۰۰ زبان/گویش)، پیروی پیشرفته از دستورالعملها و استفاده از ابزارهای عامل پشتیبانی میکند. بهصورت بومی از حافظه متنی ۳۲ هزار توکن پشتیبانی میکند و با YaRN تا ۱۳۱ هزار توکن گسترش مییابد.",
|
||
"qwen/qwen3-235b-a22b:free.description": "Qwen3-235B-A22B یک مدل MoE با ۲۳۵ میلیارد پارامتر از Qwen است که در هر عبور رو به جلو ۲۲ میلیارد پارامتر فعال دارد. این مدل بین حالت تفکر (برای استدلال پیچیده، ریاضی و کدنویسی) و حالت غیرتفکر (برای چت کارآمد) جابجا میشود. از استدلال قوی، پشتیبانی چندزبانه (بیش از ۱۰۰ زبان/گویش)، پیروی پیشرفته از دستورالعملها و استفاده از ابزارهای عامل پشتیبانی میکند. بهصورت بومی از حافظه متنی ۳۲ هزار توکن پشتیبانی میکند و با YaRN تا ۱۳۱ هزار توکن گسترش مییابد.",
|
||
"qwen/qwen3-30b-a3b.description": "Qwen3 جدیدترین نسل مدلهای LLM Qwen با معماریهای متراکم و MoE است که در استدلال، پشتیبانی چندزبانه و وظایف پیشرفته عامل بسیار توانمند است. توانایی منحصربهفرد آن در جابجایی بین حالت تفکر برای استدلال پیچیده و حالت غیرتفکر برای چت کارآمد، عملکردی همهجانبه و با کیفیت بالا را تضمین میکند.\n\nQwen3 بهطور قابلتوجهی از مدلهای قبلی مانند QwQ و Qwen2.5 پیشی میگیرد و عملکردی عالی در ریاضی، برنامهنویسی، استدلال عقل سلیم، نوشتن خلاقانه و چت تعاملی ارائه میدهد. نسخه Qwen3-30B-A3B دارای ۳۰.۵ میلیارد پارامتر (۳.۳ میلیارد فعال)، ۴۸ لایه، ۱۲۸ متخصص (۸ فعال در هر وظیفه) است و از حافظه متنی تا ۱۳۱ هزار توکن با YaRN پشتیبانی میکند و استاندارد جدیدی برای مدلهای متنباز تعیین میکند.",
|
||
"qwen/qwen3-30b-a3b:free.description": "Qwen3 جدیدترین نسل مدلهای زبانی Qwen با معماریهای متراکم و MoE است که در استدلال، پشتیبانی چندزبانه و وظایف پیشرفته عاملها عملکردی برجسته دارد. توانایی منحصربهفرد آن در جابجایی بین حالت تفکر برای استدلال پیچیده و حالت بدون تفکر برای گفتوگوی سریع، عملکردی همهجانبه و با کیفیت بالا را تضمین میکند.\n\nQwen3 بهطور قابلتوجهی از مدلهای قبلی مانند QwQ و Qwen2.5 پیشی میگیرد و در ریاضیات، برنامهنویسی، استدلال عقل سلیم، نویسندگی خلاق و گفتوگوی تعاملی عملکردی عالی دارد. نسخه Qwen3-30B-A3B دارای ۳۰.۵ میلیارد پارامتر (۳.۳ میلیارد فعال)، ۴۸ لایه، ۱۲۸ کارشناس (۸ فعال در هر وظیفه) است و با پشتیبانی از زمینه تا ۱۳۱ هزار توکن با استفاده از YaRN، استاندارد جدیدی برای مدلهای باز ایجاد کرده است.",
|
||
"qwen/qwen3-32b.description": "Qwen3-32B یک مدل زبانی علّی متراکم با ۳۲.۸ میلیارد پارامتر است که برای استدلال پیچیده و گفتوگوی کارآمد بهینهسازی شده است. این مدل بین حالت تفکر برای ریاضی، برنامهنویسی و منطق و حالت بدون تفکر برای گفتوگوی عمومی سریع جابجا میشود. در پیروی از دستورالعملها، استفاده از ابزارهای عامل و نویسندگی خلاق در بیش از ۱۰۰ زبان و گویش عملکردی قوی دارد. بهصورت بومی از زمینه ۳۲ هزار توکن پشتیبانی میکند و با YaRN تا ۱۳۱ هزار توکن گسترش مییابد.",
|
||
"qwen/qwen3-32b:free.description": "Qwen3-32B یک مدل زبانی علّی متراکم با ۳۲.۸ میلیارد پارامتر است که برای استدلال پیچیده و گفتوگوی کارآمد بهینهسازی شده است. این مدل بین حالت تفکر برای ریاضی، برنامهنویسی و منطق و حالت بدون تفکر برای گفتوگوی عمومی سریع جابجا میشود. در پیروی از دستورالعملها، استفاده از ابزارهای عامل و نویسندگی خلاق در بیش از ۱۰۰ زبان و گویش عملکردی قوی دارد. بهصورت بومی از زمینه ۳۲ هزار توکن پشتیبانی میکند و با YaRN تا ۱۳۱ هزار توکن گسترش مییابد.",
|
||
"qwen/qwen3-8b:free.description": "Qwen3-8B یک مدل زبانی علّی متراکم با ۸.۲ میلیارد پارامتر است که برای وظایف مبتنی بر استدلال و گفتوگوی کارآمد طراحی شده است. این مدل بین حالت تفکر برای ریاضی، برنامهنویسی و منطق و حالت بدون تفکر برای گفتوگوی عمومی جابجا میشود. برای پیروی از دستورالعملها، یکپارچهسازی با عاملها و نویسندگی خلاق در بیش از ۱۰۰ زبان و گویش بهخوبی تنظیم شده است. بهصورت بومی از زمینه ۳۲ هزار توکن پشتیبانی میکند و با YaRN تا ۱۳۱ هزار توکن گسترش مییابد.",
|
||
"qwen/qwen3-coder-plus.description": "Qwen3-Coder-Plus یک مدل عامل برنامهنویسی از سری Qwen است که برای استفاده از ابزارهای پیچیدهتر و جلسات طولانی بهینهسازی شده است.",
|
||
"qwen/qwen3-coder.description": "Qwen3-Coder خانواده تولید کد Qwen3 است که در درک و تولید کد در اسناد طولانی عملکردی قوی دارد.",
|
||
"qwen/qwen3-max-preview.description": "Qwen3 Max (پیشنمایش) نسخه Max برای استدلال پیشرفته و یکپارچهسازی ابزارها است.",
|
||
"qwen/qwen3-max.description": "Qwen3 Max مدل استدلال سطح بالا در سری Qwen3 برای استدلال چندزبانه و یکپارچهسازی ابزارها است.",
|
||
"qwen/qwen3-vl-plus.description": "Qwen3 VL-Plus نسخه تقویتشده Qwen3 با قابلیتهای بینایی است که در استدلال چندوجهی و پردازش ویدئو بهبود یافته است.",
|
||
"qwen/qwen3.5-122b-a10b.description": "مدل Qwen3.5-122B-A10B یک مدل زبان بزرگ چندوجهی بومی توسعهیافته توسط تیم Qwen است که دارای 122 میلیارد پارامتر کل و تنها 10 میلیارد پارامتر فعال است. این مدل از یک معماری ترکیبی کارآمد که شبکههای دلتا گیتدار و Mixture of Experts (MoE) را ترکیب میکند، استفاده میکند. بهطور بومی از طول متن 256K پشتیبانی میکند و قابلیت گسترش به حدود 1 میلیون توکن را دارد. از طریق آموزش ادغام اولیه، این مدل قابلیتهای بنیادی یکپارچه زبان-تصویر را به دست میآورد و از متن، تصویر و ویدئو پشتیبانی میکند. عملکرد عالی در معیارهای مختلف از جمله دانش، استدلال، کدنویسی، عاملها، درک بصری و وظایف چندزبانه ارائه میدهد و در چندین معیار از GPT-5-mini و Qwen3-235B-A22B پیشی میگیرد. این مدل بهطور پیشفرض دارای حالت تفکر است، از فراخوانی ابزار پشتیبانی میکند و 201 زبان و گویش را پوشش میدهد.",
|
||
"qwen/qwen3.5-27b.description": "مدل Qwen3.5-27B یک مدل زبان بزرگ چندوجهی بومی توسعهیافته توسط تیم Qwen است که دارای 27 میلیارد پارامتر است. این مدل از یک معماری ترکیبی کارآمد که شبکههای دلتا گیتدار و توجه گیتدار را ترکیب میکند، استفاده میکند. بهطور بومی از طول متن 256K پشتیبانی میکند و قابلیت گسترش به حدود 1 میلیون توکن را دارد. از طریق آموزش ادغام اولیه، این مدل قابلیتهای بنیادی یکپارچه زبان-تصویر را به دست میآورد و از متن، تصویر و ویدئو پشتیبانی میکند. عملکرد عالی در معیارهای مختلف از جمله استدلال، کدنویسی، عاملها و درک بصری ارائه میدهد و در چندین معیار از Qwen3-235B-A22B و GPT-5-mini پیشی میگیرد. این مدل بهطور پیشفرض دارای حالت تفکر است، از فراخوانی ابزار پشتیبانی میکند و 201 زبان و گویش را پوشش میدهد.",
|
||
"qwen/qwen3.5-35b-a3b.description": "مدل Qwen3.5-35B-A3B یک مدل زبان بزرگ چندوجهی بومی توسعهیافته توسط تیم Qwen است که دارای 35 میلیارد پارامتر کل و تنها 3 میلیارد پارامتر فعال است. این مدل از یک معماری ترکیبی کارآمد که شبکههای دلتا گیتدار و Mixture of Experts (MoE) را ترکیب میکند، استفاده میکند. بهطور بومی از طول متن 256K پشتیبانی میکند و قابلیت گسترش به حدود 1 میلیون توکن را دارد. از طریق آموزش ادغام اولیه، این مدل قابلیتهای بنیادی یکپارچه زبان-تصویر را به دست میآورد و از متن، تصویر و ویدئو پشتیبانی میکند. عملکرد عالی در معیارهای مختلف از جمله استدلال، کدنویسی، عاملها و درک بصری ارائه میدهد. این مدل بهطور پیشفرض دارای حالت تفکر است، از فراخوانی ابزار پشتیبانی میکند و 201 زبان و گویش را پوشش میدهد.",
|
||
"qwen/qwen3.5-397b-a17b.description": "مدل Qwen3.5-397B-A17B جدیدترین مدل زبان-تصویر در سری Qwen است که از معماری Mixture of Experts (MoE) با 397 میلیارد پارامتر کل و 17 میلیارد پارامتر فعال استفاده میکند. این مدل بهطور بومی از طول متن 256K پشتیبانی میکند و قابلیت گسترش به حدود 1 میلیون توکن را دارد. از 201 زبان پشتیبانی میکند و قابلیتهای یکپارچه درک زبان-تصویر، فراخوانی ابزار و حالتهای تفکر استدلالی را ارائه میدهد.",
|
||
"qwen/qwen3.5-4b.description": "مدل Qwen3.5-4B یک مدل زبان بزرگ چندوجهی بومی توسعهیافته توسط تیم Qwen است که دارای 4 میلیارد پارامتر است و سبکترین مدل Dense در سری Qwen3.5 محسوب میشود. این مدل از یک معماری ترکیبی کارآمد که شبکههای دلتا گیتدار و توجه گیتدار را ترکیب میکند، استفاده میکند. بهطور بومی از طول متن 256K پشتیبانی میکند و قابلیت گسترش به حدود 1 میلیون توکن را دارد. از طریق آموزش ادغام اولیه، این مدل قابلیتهای بنیادی یکپارچه زبان-تصویر را به دست میآورد و از متن، تصویر و ویدئو پشتیبانی میکند. عملکرد عالی در میان مدلهای مشابه ارائه میدهد و در چندین معیار از GPT-5-Nano و Gemini-2.5-Flash-Lite پیشی میگیرد. این مدل بهطور پیشفرض دارای حالت تفکر است، از فراخوانی ابزار پشتیبانی میکند و 201 زبان و گویش را پوشش میدهد.",
|
||
"qwen/qwen3.5-9b.description": "مدل Qwen3.5-9B یک مدل زبان بزرگ چندوجهی بومی توسعهیافته توسط تیم Qwen است که دارای 9 میلیارد پارامتر است. بهعنوان یک مدل Dense سبک در سری Qwen3.5، این مدل از یک معماری ترکیبی کارآمد که شبکههای دلتا گیتدار و توجه گیتدار را ترکیب میکند، استفاده میکند. بهطور بومی از طول متن 256K پشتیبانی میکند و قابلیت گسترش به حدود 1 میلیون توکن را دارد. از طریق آموزش ادغام اولیه، این مدل قابلیتهای بنیادی یکپارچه زبان-تصویر را به دست میآورد و از متن، تصویر و ویدئو پشتیبانی میکند. این مدل بهطور پیشفرض دارای حالت تفکر است، از فراخوانی ابزار پشتیبانی میکند و 201 زبان و گویش را پوشش میدهد.",
|
||
"qwen2.5-14b-instruct-1m.description": "مدل متنباز Qwen2.5 با ۷۲ میلیارد پارامتر.",
|
||
"qwen2.5-14b-instruct.description": "مدل متنباز Qwen2.5 با ۱۴ میلیارد پارامتر.",
|
||
"qwen2.5-32b-instruct.description": "مدل متنباز Qwen2.5 با ۳۲ میلیارد پارامتر.",
|
||
"qwen2.5-72b-instruct.description": "مدل متنباز Qwen2.5 با ۷۲ میلیارد پارامتر.",
|
||
"qwen2.5-7b-instruct.description": "Qwen2.5 7B Instruct یک مدل متنباز بالغ برای گفتوگو و تولید در سناریوهای مختلف است.",
|
||
"qwen2.5-coder-1.5b-instruct.description": "مدل برنامهنویسی متنباز Qwen.",
|
||
"qwen2.5-coder-14b-instruct.description": "مدل برنامهنویسی متنباز Qwen.",
|
||
"qwen2.5-coder-32b-instruct.description": "مدل برنامهنویسی متنباز Qwen.",
|
||
"qwen2.5-coder-7b-instruct.description": "مدل برنامهنویسی متنباز Qwen.",
|
||
"qwen2.5-coder-instruct.description": "Qwen2.5-Coder جدیدترین مدل متمرکز بر کدنویسی در خانواده Qwen (قبلاً با نام CodeQwen شناخته میشد) است.",
|
||
"qwen2.5-instruct.description": "Qwen2.5 جدیدترین سری مدلهای زبانی Qwen است که شامل مدلهای پایه و تنظیمشده برای دستورالعملها با اندازههایی از ۰.۵ تا ۷۲ میلیارد پارامتر میباشد.",
|
||
"qwen2.5-math-1.5b-instruct.description": "Qwen-Math در حل مسائل ریاضی عملکردی قوی دارد.",
|
||
"qwen2.5-math-72b-instruct.description": "Qwen-Math در حل مسائل ریاضی عملکردی قوی دارد.",
|
||
"qwen2.5-math-7b-instruct.description": "Qwen-Math در حل مسائل ریاضی عملکردی قوی دارد.",
|
||
"qwen2.5-omni-7b.description": "مدلهای Qwen-Omni از ورودیهای چندرسانهای (ویدیو، صدا، تصویر، متن) پشتیبانی میکنند و خروجی آنها به صورت صوتی و متنی است.",
|
||
"qwen2.5-vl-32b-instruct.description": "Qwen2.5 VL 32B Instruct یک مدل چندرسانهای متنباز است که برای استقرار خصوصی و استفاده در سناریوهای مختلف مناسب میباشد.",
|
||
"qwen2.5-vl-72b-instruct.description": "بهبود در پیروی از دستورالعملها، ریاضیات، حل مسئله و برنامهنویسی، با توانایی قویتر در شناسایی اشیاء عمومی. از مکانیابی دقیق عناصر بصری در قالبهای مختلف، درک ویدیوهای طولانی (تا ۱۰ دقیقه) با زمانبندی رویداد در سطح ثانیه، ترتیب زمانی و درک سرعت، و عاملهایی که میتوانند سیستمعامل یا موبایل را از طریق تجزیه و تحلیل و مکانیابی کنترل کنند، پشتیبانی میکند. استخراج اطلاعات کلیدی قوی و خروجی JSON. این نسخه ۷۲B، قویترین نسخه در این سری است.",
|
||
"qwen2.5-vl-7b-instruct.description": "Qwen2.5 VL 7B Instruct یک مدل چندرسانهای سبک است که بین هزینه استقرار و توانایی شناسایی تعادل برقرار میکند.",
|
||
"qwen2.5-vl-instruct.description": "Qwen2.5-VL جدیدترین مدل زبان-بینایی در خانواده Qwen است.",
|
||
"qwen2.5.description": "Qwen2.5 نسل بعدی مدل زبان بزرگ علیبابا است که عملکرد قدرتمندی در کاربردهای متنوع دارد.",
|
||
"qwen2.5:0.5b.description": "Qwen2.5 نسل بعدی مدل زبان بزرگ علیبابا است که عملکرد قدرتمندی در کاربردهای متنوع دارد.",
|
||
"qwen2.5:1.5b.description": "Qwen2.5 نسل بعدی مدل زبان بزرگ علیبابا است که عملکرد قدرتمندی در کاربردهای متنوع دارد.",
|
||
"qwen2.5:72b.description": "Qwen2.5 نسل بعدی مدل زبان بزرگ علیبابا است که عملکرد قدرتمندی در کاربردهای متنوع دارد.",
|
||
"qwen2.description": "Qwen2 نسل بعدی مدل زبان بزرگ علیبابا است که عملکرد قدرتمندی در کاربردهای متنوع دارد.",
|
||
"qwen2:0.5b.description": "Qwen2 نسل بعدی مدل زبان بزرگ علیبابا است که عملکرد قدرتمندی در کاربردهای متنوع دارد.",
|
||
"qwen2:1.5b.description": "Qwen2 نسل بعدی مدل زبان بزرگ علیبابا است که عملکرد قدرتمندی در کاربردهای متنوع دارد.",
|
||
"qwen2:72b.description": "Qwen2 نسل بعدی مدل زبان بزرگ علیبابا است که عملکرد قدرتمندی در کاربردهای متنوع دارد.",
|
||
"qwen3-0.6b.description": "Qwen3 0.6B یک مدل سطح ابتدایی برای استدلال ساده و محیطهای بسیار محدود است.",
|
||
"qwen3-1.7b.description": "Qwen3 1.7B یک مدل فوقسبک برای استقرار در لبه و دستگاهها است.",
|
||
"qwen3-14b.description": "Qwen3 14B یک مدل میانرده برای پرسشوپاسخ چندزبانه و تولید متن است.",
|
||
"qwen3-235b-a22b-instruct-2507.description": "Qwen3 235B A22B Instruct یک مدل راهبردی برای طیف گستردهای از وظایف تولید و استدلال است.",
|
||
"qwen3-235b-a22b-thinking-2507.description": "Qwen3 235B A22B Thinking یک مدل بسیار بزرگ برای استدلال پیچیده است.",
|
||
"qwen3-235b-a22b.description": "Qwen3 نسل جدید مدل Tongyi Qwen است که در استدلال، توانایی عمومی، قابلیتهای عامل و عملکرد چندزبانه پیشرفت چشمگیری داشته و از تغییر حالت تفکر پشتیبانی میکند.",
|
||
"qwen3-30b-a3b-instruct-2507.description": "Qwen3 30B A3B Instruct یک مدل میانتابزرگ برای تولید با کیفیت بالا و پرسشوپاسخ است.",
|
||
"qwen3-30b-a3b-thinking-2507.description": "Qwen3 30B A3B Thinking یک مدل میانتابزرگ برای استدلال است که بین دقت و هزینه تعادل برقرار میکند.",
|
||
"qwen3-30b-a3b.description": "Qwen3 30B A3B یک مدل عمومی میانتابزرگ است که بین هزینه و کیفیت تعادل برقرار میکند.",
|
||
"qwen3-32b.description": "Qwen3 32B برای وظایف عمومی که نیاز به درک قویتری دارند مناسب است.",
|
||
"qwen3-4b.description": "Qwen3 4B برای برنامههای کوچک تا متوسط و استنتاج محلی مناسب است.",
|
||
"qwen3-8b.description": "Qwen3 8B یک مدل سبک با قابلیت استقرار انعطافپذیر برای بارهای کاری با همزمانی بالا است.",
|
||
"qwen3-coder-30b-a3b-instruct.description": "مدل کدنویسی متنباز Qwen. نسخه جدید qwen3-coder-30b-a3b-instruct بر پایه Qwen3 ساخته شده و تواناییهای قوی در عاملهای کدنویس، استفاده از ابزارها و تعامل با محیط برای برنامهنویسی خودکار دارد، با عملکرد عالی در کد و توانایی عمومی قوی.",
|
||
"qwen3-coder-480b-a35b-instruct.description": "Qwen3 Coder 480B A35B Instruct یک مدل کدنویسی پیشرفته برای برنامهنویسی چندزبانه و درک کد پیچیده است.",
|
||
"qwen3-coder-flash.description": "مدل کدنویسی Qwen. سری جدید Qwen3-Coder بر پایه Qwen3 ساخته شده و تواناییهای قوی در عاملهای کدنویس، استفاده از ابزارها و تعامل با محیط برای برنامهنویسی خودکار دارد، با عملکرد عالی در کد و توانایی عمومی قوی.",
|
||
"qwen3-coder-next.description": "کدنویس نسل بعدی Qwen که برای تولید کد چندفایلی پیچیده، اشکالزدایی و جریانهای کاری عامل با توان بالا بهینه شده است. طراحی شده برای ادغام ابزار قوی و عملکرد استدلال بهبود یافته.",
|
||
"qwen3-coder-plus.description": "مدل کدنویسی Qwen. سری جدید Qwen3-Coder بر پایه Qwen3 ساخته شده و تواناییهای قوی در عاملهای کدنویس، استفاده از ابزارها و تعامل با محیط برای برنامهنویسی خودکار دارد، با عملکرد عالی در کد و توانایی عمومی قوی.",
|
||
"qwen3-coder:480b.description": "مدل با عملکرد بالا از علیبابا برای وظایف عامل و کدنویسی با پشتیبانی از زمینه طولانی.",
|
||
"qwen3-max-2026-01-23.description": "Qwen3 Max: بهترین مدل Qwen برای وظایف کدنویسی پیچیده و چندمرحلهای با پشتیبانی از تفکر.",
|
||
"qwen3-max-preview.description": "بهترین مدل Qwen برای وظایف پیچیده و چندمرحلهای. نسخه پیشنمایش از تفکر پشتیبانی میکند.",
|
||
"qwen3-max.description": "مدلهای Qwen3 Max نسبت به سری 2.5 پیشرفتهای چشمگیری در توانایی عمومی، درک زبان چینی/انگلیسی، پیروی از دستورالعملهای پیچیده، وظایف باز ذهنی، توانایی چندزبانه و استفاده از ابزار دارند، با کاهش خطاهای توهمی. نسخه جدید qwen3-max توانایی برنامهنویسی عاملمحور و استفاده از ابزار را نسبت به qwen3-max-preview بهبود داده است. این نسخه به سطح پیشرفته در حوزه خود رسیده و برای نیازهای پیچیدهتر عاملها طراحی شده است.",
|
||
"qwen3-next-80b-a3b-instruct.description": "مدل متنباز نسل بعدی Qwen3 بدون قابلیت تفکر. نسبت به نسخه قبلی (Qwen3-235B-A22B-Instruct-2507)، درک زبان چینی بهتر، استدلال منطقی قویتر و تولید متن بهبود یافتهای دارد.",
|
||
"qwen3-next-80b-a3b-thinking.description": "Qwen3 Next 80B A3B Thinking نسخه پرچمدار مدل استدلال برای وظایف پیچیده است.",
|
||
"qwen3-omni-flash.description": "Qwen3-Omni-Flash یک مدل بزرگ چندوجهی است که بر اساس معماری Thinker–Talker Mixture-of-Experts (MoE) ساخته شده است. این مدل از درک کارآمد متن، تصاویر، صدا و ویدئو، همراه با قابلیتهای تولید گفتار پشتیبانی میکند. این مدل تعامل متنی در ۱۱۹ زبان و تعامل صوتی در ۲۰ زبان را امکانپذیر میسازد و گفتاری شبیه به انسان برای ارتباط دقیق بینزبانی تولید میکند. این مدل دارای قابلیتهای قوی پیروی از دستورالعملها است و از اعلانهای سیستمی قابل تنظیم پشتیبانی میکند، که امکان تطبیق انعطافپذیر با سبکهای مختلف مکالمه و تنظیمات نقش را فراهم میکند. این مدل در سناریوهایی مانند تولید متن، دستیارهای صوتی و تحلیل چندرسانهای به طور گسترده قابل استفاده است و تجربهای طبیعی و یکپارچه از تعامل چندوجهی ارائه میدهد.",
|
||
"qwen3-vl-235b-a22b-instruct.description": "Qwen3 VL 235B A22B Instruct یک مدل چندرسانهای پرچمدار برای درک و تولید پیشرفته است.",
|
||
"qwen3-vl-235b-a22b-thinking.description": "Qwen3 VL 235B A22B Thinking نسخه پرچمدار تفکر برای استدلال و برنامهریزی چندرسانهای پیچیده است.",
|
||
"qwen3-vl-30b-a3b-instruct.description": "Qwen3 VL 30B A3B Instruct یک مدل چندرسانهای بزرگ است که بین دقت و عملکرد استدلال تعادل برقرار میکند.",
|
||
"qwen3-vl-30b-a3b-thinking.description": "Qwen3 VL 30B A3B Thinking نسخه تفکر عمیق برای وظایف چندرسانهای پیچیده است.",
|
||
"qwen3-vl-32b-instruct.description": "Qwen3 VL 32B Instruct یک مدل چندرسانهای تنظیمشده با دستورالعمل برای پرسشوپاسخ تصویری-متنی با کیفیت بالا و تولید محتوا است.",
|
||
"qwen3-vl-32b-thinking.description": "Qwen3 VL 32B Thinking نسخه تفکر عمیق چندرسانهای برای استدلال پیچیده و تحلیل زنجیرهای طولانی است.",
|
||
"qwen3-vl-8b-instruct.description": "Qwen3 VL 8B Instruct یک مدل چندرسانهای سبک برای پرسشوپاسخ تصویری روزمره و یکپارچهسازی با برنامهها است.",
|
||
"qwen3-vl-8b-thinking.description": "Qwen3 VL 8B Thinking یک مدل زنجیره تفکر چندرسانهای برای استدلال بصری دقیق است.",
|
||
"qwen3-vl-flash.description": "Qwen3 VL Flash: نسخه سبک و پرسرعت برای استدلال در درخواستهای حساس به تأخیر یا با حجم بالا.",
|
||
"qwen3-vl-plus.description": "Qwen VL یک مدل تولید متن با درک بصری است. میتواند OCR انجام دهد و همچنین خلاصهسازی و استدلال کند، مانند استخراج ویژگیها از عکسهای محصول یا حل مسائل از روی تصاویر.",
|
||
"qwen3.5-122b-a10b.description": "از ورودیهای متنی، تصویری و ویدیویی پشتیبانی میکند. برای وظایف فقط متنی، عملکرد آن قابل مقایسه با Qwen3 Max است و کارایی بالاتر و هزینه کمتری ارائه میدهد. در قابلیتهای چندوجهی، بهبودهای قابل توجهی نسبت به سری Qwen3 VL ارائه میدهد.",
|
||
"qwen3.5-27b.description": "از ورودیهای متنی، تصویری و ویدیویی پشتیبانی میکند. برای وظایف فقط متنی، عملکرد آن قابل مقایسه با Qwen3 Max است و کارایی بالاتر و هزینه کمتری ارائه میدهد. در قابلیتهای چندوجهی، بهبودهای قابل توجهی نسبت به سری Qwen3 VL ارائه میدهد.",
|
||
"qwen3.5-35b-a3b.description": "از ورودیهای متنی، تصویری و ویدیویی پشتیبانی میکند. برای وظایف فقط متنی، عملکرد آن قابل مقایسه با Qwen3 Max است و کارایی بالاتر و هزینه کمتری ارائه میدهد. در قابلیتهای چندوجهی، بهبودهای قابل توجهی نسبت به سری Qwen3 VL ارائه میدهد.",
|
||
"qwen3.5-397b-a17b.description": "از ورودیهای متن، تصویر و ویدئو پشتیبانی میکند. برای وظایف فقط متنی، عملکرد آن قابل مقایسه با Qwen3 Max است، که کارایی بالاتر و هزینه کمتری ارائه میدهد. در قابلیتهای چندوجهی، بهبودهای قابلتوجهی نسبت به سری Qwen3 VL ارائه میدهد.",
|
||
"qwen3.5-flash.description": "مدل بومی بینایی-زبانی Qwen3.5 Flash بر پایه معماری ترکیبی ساخته شده است که مکانیزم توجه خطی را با طراحی پراکنده Mixture-of-Experts (MoE) ترکیب میکند و راندمان استنتاج بالاتری به دست میآورد. نسبت به سری ۳، بهبود چشمگیری در عملکرد متنی و چندوجهی ارائه میدهد. همچنین پاسخدهی سریع داشته و میان سرعت استنتاج و توانایی کلی توازن برقرار میکند.",
|
||
"qwen3.5-omni-flash.description": "Qwen3.5 Omni Flash یک مدل کامل چندوجهی Qwen سریع و مقرونبهصرفه است که از ورودی متن، تصویر و ویدئو پشتیبانی میکند.",
|
||
"qwen3.5-omni-plus.description": "Qwen3.5 Omni Plus از ورودی متن، تصویر و ویدئو پشتیبانی میکند. این مدل کامل چندوجهی Qwen جدیدترین مدل برای درک و تولید چندرسانهای با کیفیت بالا است.",
|
||
"qwen3.5-plus-2026-04-20.description": "Qwen 3.5 یک مدل بینایی-زبانی Plus است. نسبت به نسخه ۱۵ فوریه، این نسخه پیشرفت چشمگیری در توانایی کدنویسی ایجنتی و سرعت استنتاج دارد. تواناییهای دانش، استدلال و زمینه بلند همچنان در سطح بالا حفظ شده و نیازهای وظایف پیچیده ایجنتی را برآورده میکند. این نسخه مربوط به اسنپشات ۲۰ آوریل ۲۰۲۶ است.",
|
||
"qwen3.5-plus.description": "Qwen3.5 Plus از ورودی متن، تصویر و ویدئو پشتیبانی میکند. عملکرد آن در وظایف متنی خالص قابل مقایسه با Qwen3 Max است، با عملکرد بهتر و هزینه کمتر. قابلیتهای چندوجهی آن به طور قابل توجهی نسبت به سری Qwen3 VL بهبود یافته است.",
|
||
"qwen3.5:397b.description": "Qwen3.5 یک مدل پایه بینایی-زبان یکپارچه با معماری ترکیبی (Mixture-of-Experts + توجه خطی) است که استدلال چندوجهی قوی، کدنویسی و قابلیتهای زمینه طولانی با یک پنجره زمینه 256K ارائه میدهد.",
|
||
"qwen3.6-27b.description": "Qwen 3.6 سری 27B یک مدل بینایی-زبانی چگال است. نسبت به نسخه 3.5-27B، تواناییهای کدنویسی ایجنتی، عملکرد STEM و قدرت استدلال بهطور چشمگیری افزایش یافته است. در بخش بینایی نیز در هوش فضایی، تشخیص و مکانیابی اشیا پیشرفتهایی داشته و در درک ویدئو، OCR اسناد و قابلیتهای ایجنت بصری بهبود پیوستهای نشان میدهد.",
|
||
"qwen3.6-35b-a3b.description": "مدل بومی بینایی-زبانی Qwen3.6 35B-A3B بر پایه معماری ترکیبی ساخته شده است که مکانیزم توجه خطی را با طراحی پراکنده Mixture-of-Experts (MoE) ترکیب میکند و راندمان استنتاج بالاتری فراهم میسازد. نسبت به مدل 3.5-35B-A3B، در قابلیتهای کدنویسی عاملی، استدلال ریاضی، استدلال کدنویسی، هوش فضایی و همچنین مکانیابی اشیا و تشخیص هدف، بهبود چشمگیری ارائه میدهد.",
|
||
"qwen3.6-flash.description": "مدل بومی بینایی-زبانی Qwen3.6 Flash نسبت به نسخه 3.5-Flash عملکرد بهمراتب بهتری ارائه میدهد. این مدل بر بهبود قابلیتهای کدنویسی عاملی (با برتری قابلتوجه نسبت به نسخه قبلی در چندین بنچمارک عامل کدنویسی) و همچنین تواناییهای استدلال ریاضی و کدنویسی تمرکز دارد. در بخش بینایی، پیشرفتهای قابلتوجهی در هوش فضایی و بهویژه در مکانیابی اشیا و تشخیص هدف نشان میدهد.",
|
||
"qwen3.6-max-preview.description": "بزرگترین مدل متنباز سری Qwen3.6. این مدل دانش جهان، پیروی از دستورالعملها و عملکرد کدنویسی عاملی را برای وظایف پیچیده بهبود میبخشد. این مدل فقط متنی بوده، از حالت تفکری بهصورت پیشفرض پشتیبانی میکند و قابلیت کش صریح و فراخوانی تابع را دارد.",
|
||
"qwen3.6-plus.description": "Qwen 3.6-Plus ارتقاهای عمدهای در قابلیتهای کدنویسی ارائه میدهد و با تمرکز بر کدنویسی عاملی و توسعه فرانتاند، تجربه Vibe Coding را بهطور چشمگیری بهبود میبخشد. توانایی استدلال در سناریوهای عمومی نیز بیشتر شده است. در حوزه چندوجهی، تواناییهایی مانند تشخیص عمومی، OCR و مکانیابی اشیا بهطور قابلتوجهی ارتقا یافتهاند. همچنین مشکلات شناختهشده نسخه Qwen 3.5-Plus برطرف شده است. نحوه استفاده همانند Qwen 3.5-Plus باقی مانده است.",
|
||
"qwen3.description": "Qwen3 نسل بعدی مدل زبان بزرگ علیبابا است که عملکرد قدرتمندی در کاربردهای متنوع دارد.",
|
||
"qwq-32b-preview.description": "QwQ یک مدل تحقیقاتی آزمایشی از Qwen است که بر بهبود استدلال تمرکز دارد.",
|
||
"qwq-32b.description": "QwQ یک مدل استدلال در خانواده Qwen است. در مقایسه با مدلهای تنظیمشده با دستورالعمل استاندارد، توانایی تفکر و استدلال آن عملکرد پاییندستی را بهویژه در مسائل پیچیده بهطور قابل توجهی بهبود میبخشد. QwQ-32B یک مدل استدلال میانرده است که با مدلهای برتر مانند DeepSeek-R1 و o1-mini رقابت میکند.",
|
||
"qwq-plus.description": "مدل استدلال QwQ که بر پایه Qwen2.5 آموزش دیده و با استفاده از یادگیری تقویتی (RL) توانایی استدلال را بهطور چشمگیری بهبود داده است. در معیارهای اصلی ریاضی/کد (AIME 24/25، LiveCodeBench) و برخی معیارهای عمومی (IFEval، LiveBench) به سطح کامل DeepSeek-R1 رسیده است.",
|
||
"qwq.description": "QwQ یک مدل استدلال در خانواده Qwen است. در مقایسه با مدلهای تنظیمشده با دستورالعمل استاندارد، توانایی تفکر و استدلال آن عملکرد پاییندستی را بهویژه در مسائل دشوار بهطور قابل توجهی بهبود میبخشد. QwQ-32B یک مدل استدلال میانرده است که با مدلهای برتر مانند DeepSeek-R1 و o1-mini رقابت میکند.",
|
||
"qwq_32b.description": "مدل استدلال میانرده در خانواده Qwen. در مقایسه با مدلهای تنظیمشده با دستورالعمل استاندارد، توانایی تفکر و استدلال QwQ عملکرد پاییندستی را بهویژه در مسائل دشوار بهطور قابل توجهی بهبود میبخشد.",
|
||
"r1-1776.description": "R1-1776 نسخه پسآموزشی مدل DeepSeek R1 است که برای ارائه اطلاعات واقعی، بدون سانسور و بیطرف طراحی شده است.",
|
||
"solar-mini-ja.description": "Solar Mini (ژاپنی) نسخهای از Solar Mini با تمرکز بر زبان ژاپنی است که در عین حال عملکرد قوی و کارآمدی در زبانهای انگلیسی و کرهای حفظ میکند.",
|
||
"solar-mini.description": "Solar Mini یک مدل زبانی فشرده است که عملکردی بهتر از GPT-3.5 دارد و با پشتیبانی چندزبانه قوی از زبانهای انگلیسی و کرهای، راهحلی کارآمد با حجم کم ارائه میدهد.",
|
||
"solar-pro.description": "Solar Pro یک مدل زبانی هوشمند از Upstage است که برای پیروی از دستورالعملها روی یک GPU طراحی شده و امتیاز IFEval بالای ۸۰ دارد. در حال حاضر از زبان انگلیسی پشتیبانی میکند؛ انتشار کامل آن برای نوامبر ۲۰۲۴ با پشتیبانی زبانی گستردهتر و زمینه طولانیتر برنامهریزی شده است.",
|
||
"sonar-deep-research.description": "Deep Research پژوهشی جامع در سطح تخصصی انجام داده و آن را به گزارشهایی قابلفهم و قابلاقدام تبدیل میکند.",
|
||
"sonar-pro.description": "یک محصول جستجوی پیشرفته با پشتیبانی از جستجوی مبتنی بر زمینه برای پرسوجوهای پیچیده و پیگیریها.",
|
||
"sonar-reasoning-pro.description": "یک محصول جستجوی پیشرفته با پشتیبانی از جستجوی مبتنی بر زمینه برای پرسوجوهای پیچیده و پیگیریها.",
|
||
"sonar-reasoning.description": "یک محصول جستجوی پیشرفته با پشتیبانی از جستجوی مبتنی بر زمینه برای پرسوجوهای پیچیده و پیگیریها.",
|
||
"sonar.description": "یک محصول سبکوزن با جستجوی مبتنی بر زمینه، سریعتر و ارزانتر از Sonar Pro.",
|
||
"sophnet/deepseek-v3.2.description": "DeepSeek V3.2 مدلی است که بین کارایی محاسباتی بالا و عملکرد استدلال و عامل عالی تعادل برقرار میکند.",
|
||
"sora-2-pro.description": "Sora 2 Pro پیشرفتهترین مدل تولید رسانهای ما است، که ویدئوهایی با صدای همگامشده تولید میکند. این مدل میتواند کلیپهای پویا و غنی از جزئیات را از زبان طبیعی یا تصاویر ایجاد کند.",
|
||
"sora-2.description": "Sora 2 مدل قدرتمند جدید تولید رسانهای ما است، که ویدئوهایی با صدای همگامشده تولید میکند. این مدل میتواند کلیپهای پویا و غنی از جزئیات را از زبان طبیعی یا تصاویر ایجاد کند.",
|
||
"spark-x.description": "بررسی قابلیتهای X2: 1. معرفی تنظیم پویا حالت استدلال، کنترل شده از طریق فیلد `thinking`. 2. طول زمینه گسترش یافته: 64K توکن ورودی و 128K توکن خروجی. 3. از قابلیت Function Call پشتیبانی میکند.",
|
||
"stable-diffusion-3-medium.description": "جدیدترین مدل تبدیل متن به تصویر از Stability AI. این نسخه کیفیت تصویر، درک متن و تنوع سبک را بهطور قابلتوجهی بهبود میبخشد، دستورات زبان طبیعی پیچیده را دقیقتر تفسیر کرده و تصاویر متنوعتری تولید میکند.",
|
||
"stable-diffusion-3.5-large-turbo.description": "Stable Diffusion 3.5 Large Turbo بر تولید تصاویر باکیفیت با رندر دقیق جزئیات و حفظ وفاداری صحنه تمرکز دارد.",
|
||
"stable-diffusion-xl-base-1.0.description": "یک مدل متنباز تبدیل متن به تصویر از Stability AI با قابلیتهای خلاقانه پیشرو در صنعت. درک قوی از دستورالعملها دارد و از تعریف معکوس دستورات برای تولید دقیق پشتیبانی میکند.",
|
||
"step-1-128k.description": "تعادل بین عملکرد و هزینه برای سناریوهای عمومی.",
|
||
"step-1-256k.description": "پشتیبانی از زمینههای بسیار طولانی، ایدهآل برای تحلیل اسناد بلند.",
|
||
"step-1-32k.description": "پشتیبانی از مکالمات با طول متوسط برای طیف گستردهای از کاربردها.",
|
||
"step-1-8k.description": "مدلی کوچک مناسب برای وظایف سبک.",
|
||
"step-1-flash.description": "مدلی پرسرعت مناسب برای چت بلادرنگ.",
|
||
"step-1.5v-mini.description": "توانایی قوی در درک ویدیو.",
|
||
"step-1o-turbo-vision.description": "درک قوی تصویر، عملکرد بهتر از 1o در ریاضی و کدنویسی. کوچکتر از 1o با خروجی سریعتر.",
|
||
"step-1o-vision-32k.description": "درک قوی تصویر با عملکرد بصری بهتر نسبت به سری Step-1V.",
|
||
"step-1v-32k.description": "پشتیبانی از ورودیهای تصویری برای تعامل چندوجهی غنیتر.",
|
||
"step-1v-8k.description": "مدل تصویری کوچک برای وظایف پایه تصویر و متن.",
|
||
"step-1x-edit.description": "این مدل بر ویرایش تصویر تمرکز دارد و تصاویر را بر اساس ورودیهای کاربر شامل متن و تصویر تغییر و بهبود میدهد. از فرمتهای ورودی مختلف پشتیبانی میکند و ویرایشهایی مطابق با هدف کاربر تولید میکند.",
|
||
"step-1x-medium.description": "این مدل تولید تصویر قوی با ورودی دستورات متنی ارائه میدهد. با پشتیبانی بومی از زبان چینی، توصیفهای چینی را بهتر درک کرده و به ویژگیهای بصری دقیقتری تبدیل میکند. تصاویر با کیفیت بالا و وضوح بالا تولید میکند و از انتقال سبک نیز پشتیبانی میکند.",
|
||
"step-2-16k-exp.description": "نسخه آزمایشی Step-2 با ویژگیهای جدید و بهروزرسانیهای پیوسته. برای استفاده در تولید توصیه نمیشود.",
|
||
"step-2-16k.description": "پشتیبانی از تعاملات با زمینه بزرگ برای گفتوگوهای پیچیده.",
|
||
"step-2-mini.description": "ساختهشده بر پایه معماری توجه MFA نسل بعدی داخلی، با نتایجی مشابه Step-1 اما با هزینه کمتر، توان عملیاتی بالاتر و تأخیر کمتر. وظایف عمومی را با توانایی قوی در کدنویسی انجام میدهد.",
|
||
"step-2x-large.description": "مدل تصویری نسل جدید StepFun با تمرکز بر تولید تصویر، تولید تصاویر با کیفیت بالا از دستورات متنی. بافت واقعیتر و رندر بهتر متون چینی/انگلیسی ارائه میدهد.",
|
||
"step-3.5-flash-2603.description": "بر پایه Step 3.5 Flash، برای سناریوهای پرتکرار ایجنت بهینه شده، کارایی توکن و سرعت استنتاج را افزایش میدهد و در عین حال استدلال سطحبالا و توانایی فراخوانی ابزار را حفظ میکند. همچنین از حالت کماستدلال برای کاهش مصرف منابع پشتیبانی میکند. بهینهسازیهای هدفمند برای بهبود سازگاری با وظایف کدنویسی و چارچوبهای ایجنتی نیز انجام شده است.",
|
||
"step-3.5-flash.description": "مدل استدلال زبانی پرچمدار Stepfun. این مدل دارای قابلیتهای استدلال برتر و قابلیتهای اجرای سریع و قابل اعتماد است. قادر به تجزیه و برنامهریزی وظایف پیچیده، فراخوانی ابزارها به سرعت و با اطمینان برای انجام وظایف و شایستگی در وظایف پیچیده مختلف مانند استدلال منطقی، ریاضیات، مهندسی نرمافزار و تحقیقات عمیق است.",
|
||
"step-3.description": "این مدل دارای درک بصری قوی و استدلال پیچیده است و درک دانش میانرشتهای، تحلیل ریاضی-تصویری و طیف گستردهای از وظایف تحلیل بصری روزمره را با دقت انجام میدهد.",
|
||
"step-r1-v-mini.description": "مدل استدلال با درک قوی تصویر که میتواند تصاویر و متون را پردازش کرده و پس از استدلال عمیق، متن تولید کند. در استدلال بصری، ریاضی، کدنویسی و استدلال متنی عملکردی در سطح بالا دارد و از پنجره زمینه ۱۰۰ هزار توکن پشتیبانی میکند.",
|
||
"stepfun-ai/step3.description": "Step3 یک مدل استدلال چندوجهی پیشرفته از StepFun است که بر اساس معماری MoE با 321 میلیارد پارامتر کل و 38 میلیارد پارامتر فعال ساخته شده است. طراحی انتها به انتهای آن هزینه رمزگشایی را به حداقل میرساند و در عین حال استدلال زبان-تصویر سطح بالا را ارائه میدهد. با طراحی MFA و AFD، این مدل بر روی شتابدهندههای پرچمدار و کمهزینه کارآمد باقی میماند. پیشآموزش آن از بیش از 20 تریلیون توکن متنی و 4 تریلیون توکن متن-تصویر در بسیاری از زبانها استفاده میکند. این مدل به عملکرد پیشرو در مدلهای متنباز در معیارهای ریاضی، کد و چندوجهی دست مییابد.",
|
||
"taichu4_vl_2b_nothinking.description": "نسخه بدون تفکر مدل Taichu4.0-VL 2B دارای مصرف حافظه کمتر، طراحی سبک، سرعت پاسخ سریع و قابلیتهای درک چندوجهی قوی است.",
|
||
"taichu4_vl_32b.description": "نسخه تفکر مدل Taichu4.0-VL 32B برای وظایف درک و استدلال چندوجهی پیچیده مناسب است و عملکرد برجستهای در استدلال ریاضی چندوجهی، قابلیتهای عامل چندوجهی و درک عمومی تصویر و بصری نشان میدهد.",
|
||
"taichu4_vl_32b_nothinking.description": "نسخه بدون تفکر مدل Taichu4.0-VL 32B برای سناریوهای درک تصویر و متن پیچیده و پرسش و پاسخ دانش بصری طراحی شده است و در زیرنویس تصویر، پرسش و پاسخ بصری، درک ویدئو و وظایف مکانیابی بصری برتری دارد.",
|
||
"taichu4_vl_3b.description": "نسخه تفکر مدل Taichu4.0-VL 3B وظایف درک و استدلال چندوجهی را بهطور کارآمد انجام میدهد، با ارتقاهای جامع در درک بصری، مکانیابی بصری، تشخیص OCR و قابلیتهای مرتبط.",
|
||
"taichu_llm.description": "مدل زبان بزرگ Zidong Taichu یک مدل تولید متن با عملکرد بالا است که با استفاده از فناوریهای تمامداخلی و تمامپشته توسعه یافته است. از طریق فشردهسازی ساختاری مدل پایه صد میلیارد پارامتری و بهینهسازی وظیفهمحور، قابلیتهای درک متن پیچیده و استدلال دانش را بهطور قابلتوجهی افزایش میدهد. در سناریوهایی مانند تحلیل اسناد طولانی، استخراج اطلاعات بینزبانی و تولید محدود به دانش برتری دارد.",
|
||
"taichu_llm_14b.description": "مدل زبان بزرگ Zidong Taichu یک مدل تولید متن با عملکرد بالا است که با استفاده از فناوریهای تمامداخلی و تمامپشته توسعه یافته است. از طریق فشردهسازی ساختاری مدل پایه صد میلیارد پارامتری و بهینهسازی وظیفهمحور، قابلیتهای درک متن پیچیده و استدلال دانش را بهطور قابلتوجهی افزایش میدهد. در سناریوهایی مانند تحلیل اسناد طولانی، استخراج اطلاعات بینزبانی و تولید محدود به دانش برتری دارد.",
|
||
"taichu_llm_2b.description": "مدل زبان بزرگ Zidong Taichu یک مدل تولید متن با عملکرد بالا است که با استفاده از فناوریهای تمامداخلی و تمامپشته توسعه یافته است. از طریق فشردهسازی ساختاری مدل پایه صد میلیارد پارامتری و بهینهسازی وظیفهمحور، قابلیتهای درک متن پیچیده و استدلال دانش را بهطور قابلتوجهی افزایش میدهد. در سناریوهایی مانند تحلیل اسناد طولانی، استخراج اطلاعات بینزبانی و تولید محدود به دانش برتری دارد.",
|
||
"taichu_o1.description": "taichu_o1 یک مدل بزرگ استدلال نسل بعدی است که زنجیره تفکر انسانمانند را از طریق تعامل چندوجهی و یادگیری تقویتی به دست میآورد. از شبیهسازی تصمیمگیری پیچیده پشتیبانی میکند و در حالی که خروجی با دقت بالا را حفظ میکند، مسیرهای استدلال قابلتفسیر را نشان میدهد. برای تحلیل استراتژی، تفکر عمیق و سناریوهای مشابه مناسب است.",
|
||
"tencent/Hunyuan-A13B-Instruct.description": "Hunyuan-A13B-Instruct با استفاده از ۸۰ میلیارد پارامتر کلی و ۱۳ میلیارد پارامتر فعال، عملکردی همتراز با مدلهای بزرگتر ارائه میدهد. این مدل از استدلال ترکیبی سریع/کند، درک پایدار متون بلند و توانایی پیشرو در عاملها در آزمونهای BFCL-v3 و τ-Bench پشتیبانی میکند. فرمتهای GQA و چندکوانتیزهسازی، استنتاج کارآمد را ممکن میسازند.",
|
||
"tencent/Hunyuan-MT-7B.description": "مدل ترجمه Hunyuan شامل Hunyuan-MT-7B و مدل ترکیبی Hunyuan-MT-Chimera است. Hunyuan-MT-7B یک مدل ترجمه سبک با ۷ میلیارد پارامتر است که از ۳۳ زبان بهعلاوه ۵ زبان اقلیت چینی پشتیبانی میکند. در رقابت WMT25، در ۳۰ جفتزبان از ۳۱ مورد، رتبه اول را کسب کرد. Hunyuan از یک زنجیره کامل آموزش شامل پیشآموزش، SFT، تقویت یادگیری ترجمه و تقویت یادگیری ترکیبی استفاده میکند و با عملکردی پیشرو در اندازه خود، بهراحتی قابل استقرار است.",
|
||
"text-embedding-3-large.description": "قویترین مدل تعبیهسازی برای وظایف انگلیسی و غیرانگلیسی.",
|
||
"text-embedding-3-small.description": "مدل تعبیهسازی نسل جدید با کارایی بالا و مقرونبهصرفه برای بازیابی اطلاعات و سناریوهای RAG.",
|
||
"thudm/glm-4-32b.description": "GLM-4-32B-0414 یک مدل ۳۲ میلیارد پارامتری دوزبانه (چینی/انگلیسی) با وزنهای باز است که برای تولید کد، فراخوانی توابع و وظایف عامل بهینهسازی شده است. این مدل با ۱۵ ترابایت داده باکیفیت و متمرکز بر استدلال پیشآموزش دیده و با همراستاسازی ترجیحات انسانی، نمونهگیری ردشده و یادگیری تقویتی بهبود یافته است. در استدلال پیچیده، تولید محتوای ساختاریافته و خروجیهای منظم عملکردی در سطح GPT-4o و DeepSeek-V3-0324 دارد.",
|
||
"thudm/glm-4-32b:free.description": "GLM-4-32B-0414 یک مدل ۳۲ میلیارد پارامتری دوزبانه (چینی/انگلیسی) با وزنهای باز است که برای تولید کد، فراخوانی توابع و وظایف عامل بهینهسازی شده است. این مدل با ۱۵ ترابایت داده باکیفیت و متمرکز بر استدلال پیشآموزش دیده و با همراستاسازی ترجیحات انسانی، نمونهگیری ردشده و یادگیری تقویتی بهبود یافته است. در استدلال پیچیده، تولید محتوای ساختاریافته و خروجیهای منظم عملکردی در سطح GPT-4o و DeepSeek-V3-0324 دارد.",
|
||
"thudm/glm-4-9b-chat.description": "انتشار متنباز جدیدترین مدل پیشآموزش GLM-4 از Zhipu AI.",
|
||
"thudm/glm-z1-32b.description": "GLM-Z1-32B-0414 نسخهای تقویتشده از GLM-4-32B برای استدلال عمیق در ریاضیات، منطق و حل مسائل کدنویسی است. این مدل با استفاده از یادگیری تقویتی گسترده (ترجیحات جفتی خاص وظیفه و عمومی) برای بهبود وظایف چندمرحلهای پیچیده طراحی شده است. نسبت به GLM-4-32B، Z1 در استدلال ساختاریافته و توانایی در حوزههای رسمی بهطور قابلتوجهی بهتر عمل میکند.\n\nاین مدل از مهندسی اعلان برای تحمیل مراحل «تفکر»، انسجام بهتر در خروجیهای بلند، و بهینهسازی برای جریانهای کاری عامل با زمینه طولانی (از طریق YaRN)، فراخوانی ابزار JSON و نمونهگیری دقیق برای استدلال پایدار پشتیبانی میکند. مناسب برای موارد استفادهای است که نیاز به استنتاج چندمرحلهای دقیق یا استنتاج رسمی دارند.",
|
||
"thudm/glm-z1-rumination-32b.description": "GLM Z1 Rumination 32B یک مدل استدلال عمیق ۳۲ میلیارد پارامتری از سری GLM-4-Z1 است که برای وظایف پیچیده و باز با نیاز به تفکر طولانی بهینهسازی شده است. این مدل بر پایه glm-4-32b-0414 ساخته شده و مراحل یادگیری تقویتی اضافی و همراستاسازی چندمرحلهای را اضافه میکند تا قابلیت «تفکر عمیق» را شبیهسازی کند. این شامل استدلال تکراری، تحلیل چندمرحلهای و جریانهای کاری تقویتشده با ابزار مانند جستجو، بازیابی و ترکیب آگاه از منابع است.\n\nدر نگارش پژوهشی، تحلیل مقایسهای و پرسشوپاسخ پیچیده عملکردی عالی دارد. از فراخوانی توابع برای عملیات پایه جستجو/ناوبری (`search`، `click`، `open`، `finish`) در خطوط لوله عامل پشتیبانی میکند. رفتار تفکر عمیق از طریق حلقههای چندمرحلهای با شکلدهی پاداش مبتنی بر قواعد و مکانیزمهای تصمیمگیری تأخیری کنترل میشود و در برابر چارچوبهای پژوهشی عمیق مانند پشته همراستاسازی داخلی OpenAI ارزیابی شده است. این نسخه برای عمق بیشتر نسبت به سرعت طراحی شده است.",
|
||
"tngtech/deepseek-r1t-chimera:free.description": "DeepSeek-R1T-Chimera با ترکیب DeepSeek-R1 و DeepSeek-V3 (0324) ساخته شده و استدلال R1 را با کارایی توکنی V3 ترکیب میکند. این مدل بر پایه DeepSeek-MoE Transformer است و برای تولید متن عمومی بهینهسازی شده است.\n\nوزنهای پیشآموزشیافته را برای تعادل بین استدلال، کارایی و پیروی از دستورالعملها ترکیب میکند. تحت مجوز MIT برای استفاده پژوهشی و تجاری منتشر شده است.",
|
||
"togethercomputer/StripedHyena-Nous-7B.description": "StripedHyena Nous (7B) با بهرهگیری از معماری و استراتژی خود، بهرهوری محاسباتی بهبودیافتهای ارائه میدهد.",
|
||
"tts-1-hd.description": "جدیدترین مدل تبدیل متن به گفتار با بهینهسازی برای کیفیت بالا.",
|
||
"tts-1.description": "جدیدترین مدل تبدیل متن به گفتار با بهینهسازی برای سرعت در زمان واقعی.",
|
||
"upstage/SOLAR-10.7B-Instruct-v1.0.description": "Upstage SOLAR Instruct v1 (11B) برای انجام دقیق وظایف دستوری با عملکرد زبانی قوی تنظیم شده است.",
|
||
"us.anthropic.claude-3-5-sonnet-20241022-v2:0.description": "Claude 3.5 Sonnet استاندارد صنعت را ارتقا داده و در ارزیابیهای گسترده از رقبا و Claude 3 Opus پیشی میگیرد، در حالی که سرعت و هزینه متوسط را حفظ میکند.",
|
||
"us.anthropic.claude-3-7-sonnet-20250219-v1:0.description": "Claude 3.7 Sonnet سریعترین مدل نسل جدید Anthropic است. در مقایسه با Claude 3 Haiku، در مهارتهای مختلف بهبود یافته و در بسیاری از معیارهای هوش از مدل پرچمدار قبلی Claude 3 Opus پیشی گرفته است.",
|
||
"v0-1.0-md.description": "v0-1.0-md یک مدل قدیمی است که از طریق API نسخه v0 ارائه میشود.",
|
||
"v0-1.5-lg.description": "v0-1.5-lg برای وظایف پیشرفته تفکر یا استدلال مناسب است.",
|
||
"v0-1.5-md.description": "v0-1.5-md برای وظایف روزمره و تولید رابط کاربری مناسب است.",
|
||
"veo-2.0-generate-001.description": "مدل پیشرفته تولید ویدئو ما، که برای توسعهدهندگان در سطح پرداختی API Gemini در دسترس است.",
|
||
"veo-3.0-fast-generate-001.description": "مدل تولید ویدئو پایدار ما، که برای توسعهدهندگان در سطح پرداختی API Gemini در دسترس است.",
|
||
"veo-3.0-generate-001.description": "مدل تولید ویدئو پایدار ما، که برای توسعهدهندگان در سطح پرداختی API Gemini در دسترس است.",
|
||
"veo-3.1-fast-generate-preview.description": "مدل تولید ویدئو جدید ما، که برای توسعهدهندگان در سطح پرداختی API Gemini در دسترس است.",
|
||
"veo-3.1-generate-preview.description": "مدل تولید ویدئو جدید ما، که برای توسعهدهندگان در سطح پرداختی API Gemini در دسترس است.",
|
||
"vercel/v0-1.0-md.description": "به مدلهای پشت v0 دسترسی پیدا کنید تا برنامههای وب مدرن را با استدلال خاص فریمورک و دانش بهروز تولید، اصلاح و بهینهسازی کنید.",
|
||
"vercel/v0-1.5-md.description": "به مدلهای پشت v0 دسترسی پیدا کنید تا برنامههای وب مدرن را با استدلال خاص فریمورک و دانش بهروز تولید، اصلاح و بهینهسازی کنید.",
|
||
"vidu/viduq2-pro_img2video.description": "یک تصویر و یک توضیح متنی وارد کنید تا ویدئو تولید شود. ViduQ2-Pro تصویر به ویدئو اولین مدل ویدئویی \"همه چیز قابل ارجاع است\" در جهان است. این مدل از شش بعد مرجع—اثرات، بیانها، بافتها، اقدامات، شخصیتها، و صحنهها—پشتیبانی میکند، که ویرایش ویدئویی کاملاً تکاملیافته را ممکن میسازد. از طریق افزودن، حذف، و اصلاح قابل کنترل، ویرایش ویدئویی دقیق را به دست میآورد، که به عنوان یک موتور تولید در سطح تولید برای سریهای انیمیشنی، درامهای کوتاه، و تولید فیلم طراحی شده است.",
|
||
"vidu/viduq2-pro_reference2video.description": "ویدئوهای مرجع، تصاویر، و یک توضیح متنی وارد کنید تا ویدئو تولید شود. ViduQ2-Pro مرجع به ویدئو اولین مدل ویدئویی \"همه چیز قابل ارجاع است\" در جهان است. این مدل از شش بعد مرجع—اثرات، بیانها، بافتها، اقدامات، شخصیتها، و صحنهها—پشتیبانی میکند، که ویرایش ویدئویی کاملاً تکاملیافته را ممکن میسازد. از طریق افزودن، حذف، و اصلاح قابل کنترل، ویرایش ویدئویی دقیق را به دست میآورد، که به عنوان یک موتور تولید در سطح تولید برای سریهای انیمیشنی، درامهای کوتاه، و تولید فیلم طراحی شده است.",
|
||
"vidu/viduq2-pro_start-end2video.description": "تصاویر فریم اول و آخر همراه با یک توضیح متنی وارد کنید تا ویدئو تولید شود. ViduQ2-Pro کلیدفریم به ویدئو اولین مدل ویدئویی \"همه چیز قابل ارجاع است\" در جهان است. این مدل از شش بعد مرجع—اثرات، بیانها، بافتها، اقدامات، شخصیتها، و صحنهها—پشتیبانی میکند، که ویرایش ویدئویی کاملاً تکاملیافته را ممکن میسازد. از طریق افزودن، حذف، و اصلاح قابل کنترل، ویرایش ویدئویی دقیق را به دست میآورد، که به عنوان یک موتور تولید در سطح تولید برای سریهای انیمیشنی، درامهای کوتاه، و تولید فیلم طراحی شده است.",
|
||
"vidu/viduq2-turbo_img2video.description": "یک تصویر و یک توضیح متنی وارد کنید تا ویدئو تولید شود. ViduQ2-Turbo تصویر به ویدئو یک موتور تولید فوقالعاده سریع است. یک ویدئو 5 ثانیهای 720P میتواند در کمتر از 19 ثانیه تولید شود، و یک ویدئو 5 ثانیهای 1080P در حدود 27 ثانیه. اقدامات و بیانهای شخصیت طبیعی و واقعی هستند، که اصالت قوی و عملکرد عالی در صحنههای با دینامیک بالا مانند سکانسهای اکشن ارائه میدهد، با حرکت گسترده.",
|
||
"vidu/viduq2-turbo_start-end2video.description": "تصاویر فریم اول و آخر همراه با یک توضیح متنی وارد کنید تا ویدئو تولید شود. ViduQ2-Turbo کلیدفریم به ویدئو یک موتور تولید فوقالعاده سریع است. یک ویدئو 5 ثانیهای 720P میتواند در کمتر از 19 ثانیه تولید شود، و یک ویدئو 5 ثانیهای 1080P در حدود 27 ثانیه. اقدامات و بیانهای شخصیت طبیعی و واقعی هستند، که اصالت قوی و عملکرد عالی در صحنههای با دینامیک بالا مانند سکانسهای اکشن ارائه میدهد، و از حرکت گسترده پشتیبانی میکند.",
|
||
"vidu/viduq2_reference2video.description": "تصاویر مرجع همراه با یک توضیح متنی وارد کنید تا ویدئو تولید شود. ViduQ2 مرجع به ویدئو یک مدل طراحی شده برای پیروی دقیق از دستورالعملها و ضبط احساسات ظریف است. این مدل کنترل روایتی برجسته ارائه میدهد، تغییرات میکرو-بیان را به دقت تفسیر و بیان میکند؛ ویژگیهای زبان سینمایی غنی، حرکات روان دوربین، و تنش بصری قوی دارد. به طور گسترده در فیلم و انیمیشن، تبلیغات و تجارت الکترونیک، درامهای کوتاه، و صنایع گردشگری فرهنگی قابل استفاده است.",
|
||
"vidu/viduq2_text2video.description": "یک دستور متنی وارد کنید تا ویدئو تولید شود. ViduQ2 متن به ویدئو یک مدل طراحی شده برای پیروی دقیق از دستورالعملها و ضبط احساسات ظریف است. این مدل کنترل روایتی برجسته ارائه میدهد، تغییرات میکرو-بیان را به دقت تفسیر و بیان میکند؛ ویژگیهای زبان سینمایی غنی، حرکات روان دوربین، و تنش بصری قوی دارد. به طور گسترده در فیلم و انیمیشن، تبلیغات و تجارت الکترونیک، درامهای کوتاه، و صنایع گردشگری فرهنگی قابل استفاده است.",
|
||
"vidu/viduq3-pro_img2video.description": "یک تصویر و یک توضیح متنی وارد کنید تا ویدئو تولید شود. ViduQ3-Pro تصویر به ویدئو یک مدل بومی صوتی-تصویری در سطح پرچمدار است. این مدل از تولید صوتی-تصویری همگامشده تا 16 ثانیه پشتیبانی میکند، که امکان تغییر شاتهای چندگانه آزاد را فراهم میکند در حالی که سرعت، احساسات، و تداوم روایت را به دقت کنترل میکند. با مقیاس پارامتر پیشرو، کیفیت تصویر استثنایی، ثبات شخصیت، و بیان احساسی ارائه میدهد، که استانداردهای سینمایی را برآورده میکند. برای سناریوهای تولید حرفهای مانند تبلیغات (تجارت الکترونیک، TVC، کمپینهای عملکرد)، سریهای انیمیشنی، درامهای زنده، و بازیها ایدهآل است.",
|
||
"vidu/viduq3-pro_start-end2video.description": "تصاویر فریم اول و آخر همراه با یک توضیح متنی وارد کنید تا ویدئو تولید شود. ViduQ3-Pro کلیدفریم به ویدئو یک مدل بومی صوتی-تصویری در سطح پرچمدار است. این مدل از تولید صوتی-تصویری همگامشده تا 16 ثانیه پشتیبانی میکند، که امکان تغییر شاتهای چندگانه آزاد را فراهم میکند در حالی که سرعت، احساسات، و تداوم روایت را به دقت کنترل میکند. با مقیاس پارامتر پیشرو، کیفیت تصویر استثنایی، ثبات شخصیت، و بیان احساسی ارائه میدهد، که استانداردهای سینمایی را برآورده میکند. برای سناریوهای تولید حرفهای مانند تبلیغات (تجارت الکترونیک، TVC، کمپینهای عملکرد)، سریهای انیمیشنی، درامهای زنده، و بازیها ایدهآل است.",
|
||
"vidu/viduq3-pro_text2video.description": "یک دستور متنی وارد کنید تا ویدئو تولید شود. ViduQ3-Pro متن به ویدئو یک مدل بومی صوتی-تصویری در سطح پرچمدار است. از تولید صوتی-تصویری همگامشده تا 16 ثانیه پشتیبانی میکند، که امکان تغییر شاتهای چندگانه آزاد را فراهم میکند در حالی که سرعت، احساسات، و تداوم روایت را به دقت کنترل میکند. با مقیاس پارامتر پیشرو، کیفیت تصویر استثنایی، ثبات شخصیت، و بیان احساسی ارائه میدهد، که استانداردهای سینمایی را برآورده میکند. برای سناریوهای تولید حرفهای مانند تبلیغات (تجارت الکترونیک، TVC، کمپینهای عملکرد)، سریهای انیمیشنی، درامهای زنده، و بازیها ایدهآل است.",
|
||
"vidu/viduq3-turbo_img2video.description": "یک تصویر و یک توضیح متنی وارد کنید تا ویدئو تولید شود. ViduQ3-Turbo تصویر به ویدئو یک مدل شتابیافته با عملکرد بالا است. این مدل تولید فوقالعاده سریع را ارائه میدهد در حالی که تصاویر با کیفیت بالا و بیان پویا را حفظ میکند، که در صحنههای اکشن، ارائه احساسات، و درک معنایی برتری دارد. مقرون به صرفه و ایدهآل برای سناریوهای سرگرمی معمولی مانند تصاویر رسانههای اجتماعی، همراهان هوش مصنوعی، و داراییهای جلوههای ویژه.",
|
||
"vidu/viduq3-turbo_start-end2video.description": "تصاویر فریم اول و آخر همراه با یک توضیح متنی وارد کنید تا ویدئو تولید شود. ViduQ3-Turbo کلیدفریم به ویدئو یک مدل شتابیافته با عملکرد بالا است. این مدل تولید فوقالعاده سریع را ارائه میدهد در حالی که تصاویر با کیفیت بالا و بیان پویا را حفظ میکند، که در صحنههای اکشن، ارائه احساسات، و درک معنایی برتری دارد. مقرون به صرفه و ایدهآل برای سناریوهای سرگرمی معمولی مانند تصاویر رسانههای اجتماعی، همراهان هوش مصنوعی، و داراییهای جلوههای ویژه.",
|
||
"vidu/viduq3-turbo_text2video.description": "یک دستور متنی وارد کنید تا ویدئو تولید شود. ViduQ3-Turbo متن به ویدئو یک مدل شتابیافته با عملکرد بالا است. این مدل تولید فوقالعاده سریع را ارائه میدهد در حالی که تصاویر با کیفیت بالا و بیان پویا را حفظ میکند، که در صحنههای اکشن، ارائه احساسات، و درک معنایی برتری دارد. مقرون به صرفه و مناسب برای سناریوهای سرگرمی معمولی مانند تصاویر رسانههای اجتماعی، همراهان هوش مصنوعی، و داراییهای جلوههای ویژه.",
|
||
"vidu2-image.description": "Vidu 2 یک مدل پایه تولید ویدئو طراحی شده برای تعادل سرعت و کیفیت است. این مدل بر تولید تصویر به ویدئو و کنترل فریم شروع–پایان تمرکز دارد، که از ویدئوهای 4 ثانیهای با وضوح 720P پشتیبانی میکند. سرعت تولید به طور قابل توجهی بهبود یافته است در حالی که هزینهها به طور قابل توجهی کاهش یافتهاند. تولید تصویر به ویدئو مشکلات تغییر رنگ قبلی را برطرف میکند، که تصاویر پایدار و قابل کنترل مناسب برای تجارت الکترونیک و برنامههای مشابه ارائه میدهد. علاوه بر این، درک معنایی فریمهای شروع و پایان و ثبات در تصاویر مرجع متعدد بهبود یافته است، که آن را به ابزاری کارآمد برای تولید محتوای در مقیاس بزرگ در سرگرمی عمومی، رسانههای اینترنتی، درامهای کوتاه انیمیشنی، و تبلیغات تبدیل میکند.",
|
||
"vidu2-reference.description": "Vidu 2 یک مدل پایه تولید ویدئو طراحی شده برای تعادل سرعت و کیفیت است. این مدل بر تولید تصویر به ویدئو و کنترل فریم شروع–پایان تمرکز دارد، که از ویدئوهای 4 ثانیهای با وضوح 720P پشتیبانی میکند. سرعت تولید به طور قابل توجهی بهبود یافته است در حالی که هزینهها به طور قابل توجهی کاهش یافتهاند. تولید تصویر به ویدئو مشکلات تغییر رنگ قبلی را برطرف میکند، که تصاویر پایدار و قابل کنترل مناسب برای تجارت الکترونیک و برنامههای مشابه ارائه میدهد. علاوه بر این، درک معنایی فریمهای شروع و پایان و ثبات در تصاویر مرجع متعدد بهبود یافته است، که آن را به ابزاری کارآمد برای تولید محتوای در مقیاس بزرگ در سرگرمی عمومی، رسانههای اینترنتی، درامهای کوتاه انیمیشنی، و تبلیغات تبدیل میکند.",
|
||
"vidu2-start-end.description": "Vidu 2 یک مدل پایه تولید ویدئو طراحی شده برای تعادل سرعت و کیفیت است. این مدل بر تولید تصویر به ویدئو و کنترل فریم شروع–پایان تمرکز دارد، که از ویدئوهای 4 ثانیهای با وضوح 720P پشتیبانی میکند. سرعت تولید به طور قابل توجهی بهبود یافته است در حالی که هزینهها به طور قابل توجهی کاهش یافتهاند. تولید تصویر به ویدئو مشکلات تغییر رنگ قبلی را برطرف میکند، که تصاویر پایدار و قابل کنترل مناسب برای تجارت الکترونیک و برنامههای مشابه ارائه میدهد. علاوه بر این، درک معنایی فریمهای شروع و پایان و ثبات در تصاویر مرجع متعدد بهبود یافته است، که آن را به ابزاری کارآمد برای تولید محتوای در مقیاس بزرگ در سرگرمی عمومی، رسانههای اینترنتی، درامهای کوتاه انیمیشنی، و تبلیغات تبدیل میکند.",
|
||
"viduq1-image.description": "Vidu Q1 مدل پایه نسل بعدی تولید ویدئو Vidu است، که بر تولید ویدئو با کیفیت بالا تمرکز دارد. این مدل محتوایی با مشخصات ثابت 5 ثانیه، 24 FPS، و وضوح 1080P تولید میکند. از طریق بهینهسازی عمیق وضوح بصری، کیفیت کلی تصویر و بافت به طور قابل توجهی بهبود یافته است، در حالی که مشکلاتی مانند تغییر شکل دست و لرزش فریم به طور قابل توجهی کاهش یافتهاند. سبک واقعگرایانه به صحنههای دنیای واقعی نزدیکتر میشود، و سبکهای انیمیشن دوبعدی با وفاداری بالا حفظ میشوند. انتقالها بین فریمهای شروع و پایان روانتر هستند، که آن را برای سناریوهای خلاقانه با تقاضای بالا مانند تولید فیلم، تبلیغات، و درامهای کوتاه انیمیشنی مناسب میکند.",
|
||
"viduq1-start-end.description": "Vidu Q1 مدل پایه نسل بعدی تولید ویدئو Vidu است، که بر تولید ویدئو با کیفیت بالا تمرکز دارد. این مدل محتوایی با مشخصات ثابت 5 ثانیه، 24 FPS، و وضوح 1080P تولید میکند. از طریق بهینهسازی عمیق وضوح بصری، کیفیت کلی تصویر و بافت به طور قابل توجهی بهبود یافته است، در حالی که مشکلاتی مانند تغییر شکل دست و لرزش فریم به طور قابل توجهی کاهش یافتهاند. سبک واقعگرایانه به صحنههای دنیای واقعی نزدیکتر میشود، و سبکهای انیمیشن دوبعدی با وفاداری بالا حفظ میشوند. انتقالها بین فریمهای شروع و پایان روانتر هستند، که آن را برای سناریوهای خلاقانه با تقاضای بالا مانند تولید فیلم، تبلیغات، و درامهای کوتاه انیمیشنی مناسب میکند.",
|
||
"viduq1-text.description": "Vidu Q1 مدل پایه نسل بعدی تولید ویدئو Vidu است، که بر تولید ویدئو با کیفیت بالا تمرکز دارد. این مدل محتوایی با مشخصات ثابت 5 ثانیه، 24 FPS، و وضوح 1080P تولید میکند. از طریق بهینهسازی عمیق وضوح بصری، کیفیت کلی تصویر و بافت به طور قابل توجهی بهبود یافته است، در حالی که مشکلاتی مانند تغییر شکل دست و لرزش فریم به طور قابل توجهی کاهش یافتهاند. سبک واقعگرایانه به صحنههای دنیای واقعی نزدیکتر میشود، و سبکهای انیمیشن دوبعدی با وفاداری بالا حفظ میشوند. انتقالها بین فریمهای شروع و پایان روانتر هستند، که آن را برای سناریوهای خلاقانه با تقاضای بالا مانند تولید فیلم، تبلیغات، و درامهای کوتاه انیمیشنی مناسب میکند.",
|
||
"volcengine/doubao-seed-2-0-code.description": "Doubao-Seed-2.0-Code برای نیازهای برنامهنویسی در سطح سازمانی بهینه شده است. بر پایه قابلیتهای برجسته Agent و VLM در Seed 2.0 ساخته شده و تواناییهای کدنویسی را با عملکرد برجسته در بخش فرانتاند و بهینهسازی هدفمند برای نیازهای رایج کدنویسی چندزبانه سازمانی به طور ویژه تقویت میکند، که آن را برای ادغام با ابزارهای مختلف برنامهنویسی هوش مصنوعی ایدهآل میسازد.",
|
||
"volcengine/doubao-seed-2-0-lite.description": "کیفیت تولید و سرعت پاسخدهی را متعادل میکند، مناسب به عنوان یک مدل تولیدی عمومی در سطح تولید.",
|
||
"volcengine/doubao-seed-2-0-mini.description": "به آخرین نسخه doubao-seed-2-0-mini اشاره دارد.",
|
||
"volcengine/doubao-seed-2-0-pro.description": "به آخرین نسخه doubao-seed-2-0-pro اشاره دارد.",
|
||
"volcengine/doubao-seed-code.description": "Doubao-Seed-Code مدل LLM شرکت ByteDance Volcano Engine است که برای برنامهنویسی عاملمحور بهینهسازی شده و در معیارهای برنامهنویسی و عامل با پشتیبانی از زمینه ۲۵۶K عملکرد قوی دارد.",
|
||
"wan2.2-i2v-flash.description": "نسخه سرعت Wanxiang 2.2 تولید فوقالعاده سریع ارائه میدهد، با درک دقیقتر دستورات و کنترل دوربین. این مدل ثبات عناصر بصری را حفظ میکند در حالی که پایداری کلی و نرخ موفقیت را به طور قابل توجهی بهبود میبخشد.",
|
||
"wan2.2-i2v-plus.description": "نسخه حرفهای Wanxiang 2.2 درک دقیقتر دستورات و حرکات دوربین قابل کنترل ارائه میدهد. این مدل ثبات عناصر بصری را حفظ میکند در حالی که پایداری و نرخ موفقیت را به طور قابل توجهی بهبود میبخشد، و محتوای غنیتر و دقیقتر تولید میکند.",
|
||
"wan2.2-kf2v-flash.description": "نسخه سرعت Wanxiang 2.2",
|
||
"wan2.2-kf2v-plus.description": "نسخه Plus Wanxiang 2.2",
|
||
"wan2.2-t2i-flash.description": "Wanxiang 2.2 Flash جدیدترین مدل با ارتقاهایی در خلاقیت، پایداری و واقعگرایی است که تولید سریع و ارزش بالا را ارائه میدهد.",
|
||
"wan2.2-t2i-plus.description": "Wanxiang 2.2 Plus جدیدترین مدل با ارتقاهایی در خلاقیت، پایداری و واقعگرایی است که جزئیات غنیتری تولید میکند.",
|
||
"wan2.2-t2v-plus.description": "نسخه حرفهای Wanxiang 2.2 درک دقیقتر دستورات ارائه میدهد، تولید حرکت پایدار و روان را ارائه میدهد، و تصاویر غنیتر و دقیقتر تولید میکند.",
|
||
"wan2.5-i2i-preview.description": "پیشنمایش Wanxiang 2.5 I2I از ویرایش تصویر تکتصویر و ترکیب چندتصویر پشتیبانی میکند.",
|
||
"wan2.5-i2v-preview.description": "پیشنمایش Wanxiang 2.5 از تولید خودکار صداگذاری و قابلیت ادغام فایلهای صوتی سفارشی پشتیبانی میکند.",
|
||
"wan2.5-t2i-preview.description": "Wanxiang 2.5 T2I از انتخاب انعطافپذیر ابعاد تصویر در محدوده کل مساحت پیکسل و محدودیتهای نسبت ابعاد پشتیبانی میکند.",
|
||
"wan2.5-t2v-preview.description": "پیشنمایش Wanxiang 2.5 از تولید خودکار صداگذاری و قابلیت ادغام فایلهای صوتی سفارشی پشتیبانی میکند.",
|
||
"wan2.6-i2v-flash.description": "Wanxiang 2.6 قابلیتهای روایت چند شات را معرفی میکند، در حالی که از تولید خودکار صداگذاری و قابلیت ادغام فایلهای صوتی سفارشی پشتیبانی میکند.",
|
||
"wan2.6-i2v.description": "Wanxiang 2.6 قابلیتهای روایت چند شات را معرفی میکند، در حالی که از تولید خودکار صداگذاری و قابلیت ادغام فایلهای صوتی سفارشی پشتیبانی میکند.",
|
||
"wan2.6-image.description": "Wanxiang 2.6 Image از ویرایش تصویر و خروجی چیدمان ترکیبی تصویر-متن پشتیبانی میکند.",
|
||
"wan2.6-r2v-flash.description": "Wanxiang 2.6 مرجع به ویدئو – Flash تولید سریعتر و عملکرد هزینه بهتر ارائه میدهد. این مدل از ارجاع به شخصیتهای خاص یا هر شیء پشتیبانی میکند، که ثبات در ظاهر و صدا را به دقت حفظ میکند، و ارجاع چند شخصیت برای اجرای مشترک را ممکن میسازد.",
|
||
"wan2.6-r2v.description": "Wanxiang 2.6 مرجع به ویدئو از ارجاع به شخصیتهای خاص یا هر شیء پشتیبانی میکند، که ثبات در ظاهر و صدا را به دقت حفظ میکند، و ارجاع چند شخصیت برای اجرای مشترک را ممکن میسازد. توجه: هنگام استفاده از ویدئوها به عنوان مرجع، ویدئوی ورودی نیز به هزینه محاسبه خواهد شد. لطفاً به مستندات قیمتگذاری مدل مراجعه کنید.",
|
||
"wan2.6-t2i.description": "Wanxiang 2.6 T2I از انتخاب انعطافپذیر ابعاد تصویر در محدوده کل مساحت پیکسل و محدودیتهای نسبت ابعاد پشتیبانی میکند (مانند Wanxiang 2.5).",
|
||
"wan2.6-t2v.description": "Wanxiang 2.6 قابلیتهای روایت چند شات را معرفی میکند، در حالی که از تولید خودکار صداگذاری و قابلیت ادغام فایلهای صوتی سفارشی پشتیبانی میکند.",
|
||
"wan2.7-i2v-2026-04-25.description": "Wanxiang 2.7 Image-to-Video ارتقای جامع در تواناییهای تولید ویدئو ارائه میدهد. صحنههای احساسی دقیق و طبیعی هستند و صحنههای اکشن پرقدرت و تأثیرگذار. همراه با برشهای پویاتر و ریتمیکتر، این مدل عملکرد و روایتپردازی قویتری ارائه میدهد.",
|
||
"wan2.7-i2v.description": "Wanxiang 2.7 تصویر به ویدئو ارتقا جامع در قابلیتهای عملکرد ارائه میدهد. صحنههای دراماتیک بیان احساسی ظریف و طبیعی دارند، در حالی که سکانسهای اکشن شدید و تأثیرگذار هستند. همراه با انتقالهای شات پویاتر و ریتمیکتر، عملکرد کلی و داستانگویی قویتر به دست میآید.",
|
||
"wan2.7-image-pro.description": "نسخه حرفهای تصویر Wanxiang 2.7، از خروجی با وضوح بالا 4K پشتیبانی میکند.",
|
||
"wan2.7-image.description": "تصویر Wanxiang 2.7، سرعت تولید تصویر سریعتر.",
|
||
"wan2.7-r2v.description": "Wanxiang 2.7 مرجع به ویدئو ارجاعات پایدارتر برای شخصیتها، وسایل، و صحنهها ارائه میدهد. این مدل از حداکثر 5 تصویر یا ویدئو مرجع مختلط، همراه با ارجاع به تن صدا پشتیبانی میکند. همراه با قابلیتهای اصلی ارتقا یافته، عملکرد و قدرت بیان قویتر ارائه میدهد.",
|
||
"wan2.7-t2v-2026-04-25.description": "Wanxiang 2.7 Text-to-Video ارتقای جامع در تواناییهای تولید ویدئو ارائه میدهد. صحنههای احساسی دقیق و طبیعی و صحنههای اکشن پرقدرت هستند. با گذارهای پویاتر و ریتمیکتر، این مدل عملکرد بازیگری و روایتپردازی قویتری فراهم میکند.",
|
||
"wan2.7-t2v.description": "Wanxiang 2.7 متن به ویدئو ارتقا جامع در قابلیتهای عملکرد ارائه میدهد. صحنههای دراماتیک بیان احساسی ظریف و طبیعی دارند، در حالی که سکانسهای اکشن شدید و تأثیرگذار هستند. همراه با انتقالهای شات پویاتر و ریتمیکتر، عملکرد کلی بازیگری و داستانگویی قویتر به دست میآید.",
|
||
"wanx-v1.description": "مدل پایه تبدیل متن به تصویر. معادل Tongyi Wanxiang 1.0 General.",
|
||
"wanx2.0-t2i-turbo.description": "در پرترههای بافتدار با سرعت متوسط و هزینه کمتر عملکرد عالی دارد. معادل Tongyi Wanxiang 2.0 Speed.",
|
||
"wanx2.1-i2v-plus.description": "نسخه حرفهای Wanxiang 2.1 تصاویر بصری تصفیهشدهتر و با کیفیت بالاتر ارائه میدهد.",
|
||
"wanx2.1-i2v-turbo.description": "نسخه سرعت Wanxiang 2.1 عملکرد هزینه بالا ارائه میدهد.",
|
||
"wanx2.1-t2i-plus.description": "نسخه کاملاً ارتقاءیافته با جزئیات تصویری غنیتر و سرعت کمی کمتر. معادل Tongyi Wanxiang 2.1 Pro.",
|
||
"wanx2.1-t2i-turbo.description": "نسخه کاملاً ارتقاءیافته با تولید سریع، کیفیت کلی قوی و ارزش بالا. معادل Tongyi Wanxiang 2.1 Speed.",
|
||
"wanx2.1-t2v-plus.description": "نسخه حرفهای Wanxiang 2.1 بافت بصری غنیتر و تصاویر با کیفیت بالاتر ارائه میدهد.",
|
||
"wanx2.1-t2v-turbo.description": "نسخه سرعت Wanxiang 2.1 عملکرد هزینه عالی ارائه میدهد.",
|
||
"whisper-1.description": "مدل عمومی تشخیص گفتار با پشتیبانی از ASR چندزبانه، ترجمه گفتار و شناسایی زبان.",
|
||
"wizardlm2.description": "WizardLM 2 مدل زبانی از Microsoft AI است که در گفتوگوی پیچیده، وظایف چندزبانه، استدلال و دستیارها عملکرد عالی دارد.",
|
||
"wizardlm2:8x22b.description": "WizardLM 2 مدل زبانی از Microsoft AI است که در گفتوگوی پیچیده، وظایف چندزبانه، استدلال و دستیارها عملکرد عالی دارد.",
|
||
"x-ai/grok-4-fast-non-reasoning.description": "Grok 4 Fast (بدون استدلال) مدل چندوجهی با توان عملیاتی بالا و هزینه پایین از xAI است (با پشتیبانی از پنجره زمینه ۲ میلیون توکن) که برای سناریوهای حساس به تأخیر و هزینه طراحی شده و نیازی به استدلال درونمدلی ندارد. این مدل در کنار نسخه استدلالی Grok 4 Fast قرار دارد و میتوان استدلال را از طریق پارامتر API فعال کرد. اعلانها و تکمیلها ممکن است توسط xAI یا OpenRouter برای بهبود مدلهای آینده استفاده شوند.",
|
||
"x-ai/grok-4-fast.description": "Grok 4 Fast مدل با توان عملیاتی بالا و هزینه پایین از xAI است (با پشتیبانی از پنجره زمینه ۲ میلیون توکن) که برای موارد استفاده با همزمانی بالا و زمینههای طولانی ایدهآل است.",
|
||
"x-ai/grok-4.1-fast-non-reasoning.description": "Grok 4 Fast (بدون استدلال) مدل چندوجهی با توان عملیاتی بالا و هزینه پایین از xAI است (با پشتیبانی از پنجره زمینه ۲ میلیون توکن) که برای سناریوهای حساس به تأخیر و هزینه طراحی شده و نیازی به استدلال درونمدلی ندارد. این مدل در کنار نسخه استدلالی Grok 4 Fast قرار دارد و میتوان استدلال را از طریق پارامتر API فعال کرد. اعلانها و تکمیلها ممکن است توسط xAI یا OpenRouter برای بهبود مدلهای آینده استفاده شوند.",
|
||
"x-ai/grok-4.1-fast.description": "Grok 4 Fast مدل با توان عملیاتی بالا و هزینه پایین از xAI است (با پشتیبانی از پنجره زمینه ۲ میلیون توکن) که برای موارد استفاده با همزمانی بالا و زمینههای طولانی ایدهآل است.",
|
||
"x-ai/grok-4.description": "Grok 4 مدل پرچمدار xAI با توانایی استدلال قوی و قابلیت چندوجهی است.",
|
||
"x-ai/grok-code-fast-1.description": "Grok Code Fast 1 مدل سریع کدنویسی از xAI است که خروجیهایی خوانا و مناسب برای مهندسی ارائه میدهد.",
|
||
"x1.description": "بهروزرسانیهای X1.5: (1) اضافه کردن حالت تفکر پویا که توسط فیلد `thinking` کنترل میشود؛ (2) طول زمینه بزرگتر با 64K ورودی و 64K خروجی؛ (3) از FunctionCall پشتیبانی میکند.",
|
||
"xai/grok-2-vision.description": "Grok 2 Vision در وظایف بصری عملکردی عالی دارد و در استدلال ریاضی تصویری (MathVista) و پرسشوپاسخ اسناد (DocVQA) به سطح SOTA میرسد. این مدل اسناد، نمودارها، گرافها، اسکرینشاتها و عکسها را پردازش میکند.",
|
||
"xai/grok-2.description": "Grok 2 یک مدل پیشرفته با استدلال پیشرفته، چت قوی، کدنویسی و عملکرد استدلالی عالی است که در رتبهبندی LMSYS بالاتر از Claude 3.5 Sonnet و GPT-4 Turbo قرار دارد.",
|
||
"xai/grok-3-fast.description": "مدل پرچمدار xAI در کاربردهای سازمانی مانند استخراج داده، کدنویسی و خلاصهسازی برتری دارد و دانش عمیقی در حوزههای مالی، سلامت، حقوق و علوم دارد. نسخه سریع آن بر زیرساخت سریعتری اجرا میشود و پاسخهای بسیار سریعتری با هزینه بیشتر به ازای هر توکن ارائه میدهد.",
|
||
"xai/grok-3-mini-fast.description": "مدل سبک xAI که پیش از پاسخدهی فکر میکند، مناسب برای وظایف ساده یا مبتنی بر منطق بدون نیاز به دانش عمیق حوزهای است. ردپای خام استدلال در دسترس است. نسخه سریع آن بر زیرساخت سریعتری اجرا میشود و پاسخهای بسیار سریعتری با هزینه بیشتر به ازای هر توکن ارائه میدهد.",
|
||
"xai/grok-3-mini.description": "مدل سبک xAI که پیش از پاسخدهی فکر میکند، مناسب برای وظایف ساده یا مبتنی بر منطق بدون نیاز به دانش عمیق حوزهای است. ردپای خام استدلال در دسترس است.",
|
||
"xai/grok-3.description": "مدل پرچمدار xAI در کاربردهای سازمانی مانند استخراج داده، کدنویسی و خلاصهسازی برتری دارد و دانش عمیقی در حوزههای مالی، سلامت، حقوق و علوم دارد.",
|
||
"xai/grok-4.description": "جدیدترین مدل پرچمدار xAI با عملکرد بینظیر در زبان طبیعی، ریاضی و استدلال — یک مدل همهکاره ایدهآل.",
|
||
"yi-large-fc.description": "بر پایه yi-large با قابلیت فراخوانی ابزار پیشرفته، مناسب برای سناریوهای عامل و جریان کاری.",
|
||
"yi-large-preview.description": "نسخه اولیه؛ استفاده از yi-large (جدیدتر) توصیه میشود.",
|
||
"yi-large-rag.description": "یک سرویس پیشرفته بر پایه yi-large که بازیابی و تولید را برای پاسخهای دقیق با جستجوی وب در زمان واقعی ترکیب میکند.",
|
||
"yi-large-turbo.description": "ارزش و عملکرد استثنایی، تنظیمشده برای تعادل قوی میان کیفیت، سرعت و هزینه.",
|
||
"yi-large.description": "مدلی جدید با ۱۰۰ میلیارد پارامتر و توانایی قوی در پرسشوپاسخ و تولید متن.",
|
||
"yi-lightning-lite.description": "نسخه سبک؛ استفاده از yi-lightning توصیه میشود.",
|
||
"yi-lightning.description": "مدل جدید با عملکرد بالا، استنتاج سریعتر و خروجی با کیفیت بالا.",
|
||
"yi-medium-200k.description": "مدلی با زمینه طولانی ۲۰۰ هزار توکن برای درک و تولید عمیق متون بلند.",
|
||
"yi-medium.description": "مدل میانرده تنظیمشده با توانایی و ارزش متعادل، بهینهشده برای پیروی از دستورالعملها.",
|
||
"yi-spark.description": "مدلی جمعوجور و سریع با توانایی تقویتشده در ریاضی و برنامهنویسی.",
|
||
"yi-vision-v2.description": "مدل بینایی برای وظایف پیچیده با درک و تحلیل قوی چندتصویری.",
|
||
"yi-vision.description": "مدل بینایی برای وظایف پیچیده با درک و تحلیل قوی تصویر.",
|
||
"youtu-vita.description": "VITA یک مدل درک چندوجهی است که از تحلیل محتوای ویدئو و تصویر پشتیبانی میکند. برای وظایفی مانند تجزیه ساختاری ویدئو و تشخیص اشیای تصویر کاربرد دارد.",
|
||
"yt-video-2.0.description": "این مدل از تصاویر، ویدئوهای بسیار سازگار در گذر زمان تولید میکند و برای کاربردهای سنگینی مانند تبلیغات، کلیپهای فیلم و نمایش محصولات مناسب است.",
|
||
"z-ai/glm-4.5-air.description": "GLM 4.5 Air نسخه سبک GLM 4.5 برای سناریوهای حساس به هزینه است که در عین حال استدلال قوی را حفظ میکند.",
|
||
"z-ai/glm-4.5.description": "GLM 4.5 مدل پرچمدار Z.AI با استدلال ترکیبی بهینهشده برای وظایف مهندسی و زمینههای طولانی است.",
|
||
"z-ai/glm-4.6.description": "GLM 4.6 مدل پرچمدار Z.AI با طول زمینه گسترشیافته و قابلیت برنامهنویسی است.",
|
||
"z-ai/glm-4.7.description": "GLM-4.7 جدیدترین مدل پرچمدار Zhipu است که تواناییهای عمومی بهبود یافته، پاسخهای طبیعیتر و تجربه نوشتاری جذابتری ارائه میدهد.",
|
||
"z-ai/glm4.7.description": "GLM-4.7 جدیدترین مدل پرچمدار Zhipu است که برای سناریوهای کدنویسی عامل با قابلیتهای کدنویسی بهبود یافته طراحی شده است.",
|
||
"z-ai/glm5.description": "GLM-5 مدل پایه جدید پرچمدار Zhipu AI برای مهندسی عامل است که عملکرد SOTA متنباز در قابلیتهای کدنویسی و عامل را به دست میآورد. این مدل با عملکرد Claude Opus 4.5 مطابقت دارد.",
|
||
"z-image-turbo.description": "Z-Image یک مدل سبک تولید تصویر از متن است که میتواند بهسرعت تصاویر تولید کند، از رندر متن چینی و انگلیسی پشتیبانی میکند و بهطور انعطافپذیر با وضوحها و نسبتهای ابعاد مختلف سازگار میشود.",
|
||
"zai-org/GLM-4.5-Air.description": "GLM-4.5-Air یک مدل پایه برای برنامههای عامل با معماری Mixture-of-Experts است. این مدل برای استفاده از ابزار، مرور وب، مهندسی نرمافزار و کدنویسی فرانتاند بهینه شده و با عاملهای کد مانند Claude Code و Roo Code ادغام میشود. از استدلال ترکیبی برای مدیریت وظایف پیچیده و روزمره استفاده میکند.",
|
||
"zai-org/GLM-4.5V.description": "GLM-4.5V جدیدترین مدل VLM از Zhipu AI است که بر پایه مدل متنی پرچمدار GLM-4.5-Air (با ۱۰۶ میلیارد پارامتر کل و ۱۲ میلیارد فعال) ساخته شده و از معماری MoE برای عملکرد قوی با هزینه کمتر بهره میبرد. این مدل مسیر GLM-4.1V-Thinking را دنبال کرده و با افزودن 3D-RoPE استدلال فضایی سهبعدی را بهبود میبخشد. با پیشآموزش، SFT و RL بهینهسازی شده و تصاویر، ویدیو و اسناد بلند را پردازش میکند و در ۴۱ معیار چندوجهی عمومی در میان مدلهای متنباز رتبه برتر دارد. حالت تفکر قابل تنظیم به کاربران امکان میدهد بین سرعت و عمق تعادل برقرار کنند.",
|
||
"zai-org/GLM-4.6.description": "در مقایسه با GLM-4.5، مدل GLM-4.6 زمینه را از ۱۲۸ هزار به ۲۰۰ هزار توکن گسترش میدهد تا وظایف عامل پیچیدهتری را مدیریت کند. در معیارهای کد امتیاز بالاتری کسب کرده و عملکرد واقعی بهتری در برنامههایی مانند Claude Code، Cline، Roo Code و Kilo Code دارد، از جمله تولید بهتر صفحات فرانتاند. استدلال بهبود یافته و استفاده از ابزار در حین استدلال پشتیبانی میشود که توانایی کلی را تقویت میکند. این مدل بهتر در چارچوبهای عامل ادغام میشود، عاملهای ابزار/جستجو را بهبود میبخشد و سبک نوشتاری و نقشآفرینی طبیعیتری دارد.",
|
||
"zai-org/GLM-4.6V.description": "GLM-4.6V دقت درک بصری پیشرفتهای را برای مقیاس پارامتر خود به دست میآورد و اولین مدلی است که قابلیتهای فراخوانی تابع را بهطور بومی در معماری مدل دیداری ادغام میکند، شکاف بین 'ادراک بصری' و 'اقدامات اجرایی' را پر میکند و پایه فنی یکپارچهای برای عوامل چندوجهی در سناریوهای واقعی کسبوکار فراهم میکند. پنجره زمینه بصری به 128 هزار گسترش یافته و از پردازش جریان ویدیویی طولانی و تحلیل چندتصویری با وضوح بالا پشتیبانی میکند.",
|
||
"zai/glm-4.5-air.description": "GLM-4.5 و GLM-4.5-Air جدیدترین مدلهای پرچمدار ما برای برنامههای عامل هستند که هر دو از معماری MoE استفاده میکنند. GLM-4.5 دارای ۳۵۵ میلیارد پارامتر کل و ۳۲ میلیارد فعال در هر عبور است؛ GLM-4.5-Air نسخه سبکتر با ۱۰۶ میلیارد کل و ۱۲ میلیارد فعال است.",
|
||
"zai/glm-4.5.description": "سری GLM-4.5 برای عاملها طراحی شده است. مدل پرچمدار GLM-4.5 استدلال، کدنویسی و مهارتهای عامل را با ۳۵۵ میلیارد پارامتر کل (۳۲ میلیارد فعال) ترکیب میکند و دو حالت عملیاتی بهعنوان یک سیستم استدلال ترکیبی ارائه میدهد.",
|
||
"zai/glm-4.5v.description": "GLM-4.5V بر پایه GLM-4.5-Air ساخته شده، تکنیکهای اثباتشده GLM-4.1V-Thinking را به ارث برده و با معماری MoE قدرتمند ۱۰۶ میلیارد پارامتری مقیاس یافته است.",
|
||
"zenmux/auto.description": "مسیریابی خودکار ZenMux بهترین مدل از نظر ارزش و عملکرد را بر اساس درخواست شما از میان گزینههای پشتیبانیشده انتخاب میکند."
|
||
}
|