"01-ai/yi-1.5-34b-chat.description":"جدیدترین مدل متنباز و بهینهسازیشده 01.AI با ۳۴ میلیارد پارامتر، پشتیبانی از سناریوهای مختلف گفتوگو، آموزشدیده با دادههای باکیفیت و همراستا با ترجیحات انسانی.",
"01-ai/yi-1.5-9b-chat.description":"جدیدترین مدل متنباز و بهینهسازیشده 01.AI با ۹ میلیارد پارامتر، پشتیبانی از سناریوهای مختلف گفتوگو، آموزشدیده با دادههای باکیفیت و همراستا با ترجیحات انسانی.",
"360/deepseek-r1.description":"مدل DeepSeek-R1 که توسط 360 پیادهسازی شده، از یادگیری تقویتی در مقیاس وسیع در مرحله پسآموزش استفاده میکند تا توانایی استدلال را با حداقل دادههای برچسبخورده بهطور چشمگیری افزایش دهد. این مدل در وظایف استدلال ریاضی، کدنویسی و زبان طبیعی با مدل OpenAI o1 برابری میکند.",
"360gpt-pro-trans.description":"مدلی تخصصی در ترجمه که بهطور عمیق برای دستیابی به کیفیت پیشرو در ترجمه بهینهسازی شده است.",
"360gpt-pro.description":"360GPT Pro یکی از مدلهای کلیدی هوش مصنوعی 360 است که پردازش متنی کارآمد را برای سناریوهای متنوع NLP ارائه میدهد و از درک متون بلند و گفتوگوی چندمرحلهای پشتیبانی میکند.",
"360gpt-turbo-responsibility-8k.description":"360GPT Turbo Responsibility 8K بر ایمنی معنایی و مسئولیتپذیری در کاربردهای حساس به محتوا تأکید دارد و تجربهای دقیق و پایدار برای کاربران فراهم میکند.",
"360gpt-turbo.description":"360GPT Turbo توان پردازشی و گفتوگویی بالایی را با درک معنایی عالی و کارایی بالا در تولید متن ارائه میدهد و گزینهای ایدهآل برای کسبوکارها و توسعهدهندگان است.",
"360gpt2-o1.description":"360gpt2-o1 با استفاده از جستوجوی درختی و مکانیزم بازتاب و آموزش با یادگیری تقویتی، زنجیره تفکر را ایجاد میکند و قابلیت بازاندیشی و اصلاح خودکار را فراهم میسازد.",
"360gpt2-pro.description":"360GPT2 Pro یک مدل NLP پیشرفته از 360 است که در تولید و درک متن عملکردی عالی دارد، بهویژه در وظایف خلاقانه، تبدیلهای پیچیده و ایفای نقش.",
"360zhinao2-o1.description":"360zhinao2-o1 با استفاده از جستوجوی درختی و مکانیزم بازتاب و آموزش با یادگیری تقویتی، زنجیره تفکر را ایجاد میکند و قابلیت بازاندیشی و اصلاح خودکار را فراهم میسازد.",
"4.0Ultra.description":"Spark Ultra قدرتمندترین مدل در سری Spark است که درک متن و خلاصهسازی را بهبود میبخشد و جستوجوی وب را ارتقا میدهد. این مدل راهحلی جامع برای افزایش بهرهوری در محیط کار و ارائه پاسخهای دقیق است و بهعنوان محصولی هوشمند پیشرو شناخته میشود.",
"AnimeSharp.description":"AnimeSharp (با نام قبلی \"4x-TextSharpV1\") یک مدل متنباز برای افزایش وضوح تصاویر به سبک انیمه است که بر پایه ESRGAN توسط Kim2091 توسعه یافته است. این مدل در ابتدا برای تصاویر متنی نیز طراحی شده بود اما بهطور ویژه برای محتوای انیمه بهینهسازی شده است.",
"Baichuan2-Turbo.description":"با استفاده از تقویت جستوجو، این مدل به دانش دامنهای و وب متصل میشود. از بارگذاری فایلهای PDF/Word و ورودی URL پشتیبانی میکند تا بازیابی اطلاعات بهموقع و جامع و خروجیهای حرفهای و دقیق را فراهم سازد.",
"Baichuan3-Turbo-128k.description":"با پنجره متنی فوقالعاده بلند ۱۲۸ هزار توکن، این مدل برای سناریوهای پرتکرار سازمانی بهینهسازی شده و ارزش بالایی ارائه میدهد. در مقایسه با Baichuan2، تولید محتوا ۲۰٪، پرسشوپاسخ دانشی ۱۷٪ و ایفای نقش ۴۰٪ بهبود یافته است. عملکرد کلی آن بهتر از GPT-3.5 است.",
"Baichuan3-Turbo.description":"برای سناریوهای پرتکرار سازمانی بهینهسازی شده و ارزش بالایی ارائه میدهد. در مقایسه با Baichuan2، تولید محتوا ۲۰٪، پرسشوپاسخ دانشی ۱۷٪ و ایفای نقش ۴۰٪ بهبود یافته است. عملکرد کلی آن بهتر از GPT-3.5 است.",
"Baichuan4-Air.description":"مدلی پیشرو در چین که در وظایف زبان چینی مانند دانش، متون بلند و تولید خلاقانه از مدلهای مطرح خارجی پیشی میگیرد. همچنین دارای قابلیتهای چندوجهی پیشرفته با نتایج قوی در آزمونهای معتبر است.",
"Baichuan4-Turbo.description":"مدلی پیشرو در چین که در وظایف زبان چینی مانند دانش، متون بلند و تولید خلاقانه از مدلهای مطرح خارجی پیشی میگیرد. همچنین دارای قابلیتهای چندوجهی پیشرفته با نتایج قوی در آزمونهای معتبر است.",
"Baichuan4.description":"عملکرد برتر داخلی که در وظایف زبان چینی مانند دانش دایرهالمعارفی، متون بلند و تولید خلاقانه از مدلهای مطرح خارجی پیشی میگیرد. همچنین دارای قابلیتهای چندوجهی پیشرفته و نتایج قوی در آزمونهای معیار است.",
"ByteDance-Seed/Seed-OSS-36B-Instruct.description":"Seed-OSS مجموعهای از مدلهای متنباز LLM از ByteDance Seed است که برای مدیریت زمینههای بلند، استدلال، عاملها و تواناییهای عمومی طراحی شدهاند. Seed-OSS-36B-Instruct یک مدل ۳۶ میلیارد پارامتری با تنظیمات دستوری است که بهطور بومی از زمینههای بسیار بلند برای پردازش اسناد یا پایگاههای کد پشتیبانی میکند. این مدل برای استدلال، تولید کد و وظایف عامل (استفاده از ابزار) بهینهسازی شده و در عین حال توانایی عمومی قوی خود را حفظ کرده است. ویژگی کلیدی آن «بودجه تفکر» است که امکان تنظیم طول استدلال برای افزایش کارایی را فراهم میسازد.",
"DeepSeek-R1-Distill-Llama-70B.description":"مدل DeepSeek R1 که بزرگتر و هوشمندتر است، در معماری Llama 70B تقطیر شده است. آزمونهای معیار و ارزیابیهای انسانی نشان میدهند که این مدل از نسخه پایه Llama 70B هوشمندتر است، بهویژه در وظایف ریاضی و دقت اطلاعات.",
"DeepSeek-R1-Distill-Qwen-1.5B.description":"مدلی تقطیرشده از DeepSeek-R1 بر پایه Qwen2.5-Math-1.5B. با استفاده از یادگیری تقویتی و دادههای شروع سرد، عملکرد استدلال را بهینه کرده و معیارهای جدیدی برای مدلهای متنباز در وظایف چندگانه تعیین کرده است.",
"DeepSeek-R1-Distill-Qwen-14B.description":"مدلهای DeepSeek-R1-Distill از مدلهای متنباز با استفاده از دادههای نمونه تولیدشده توسط DeepSeek-R1 بهصورت دقیق تنظیم شدهاند.",
"DeepSeek-R1-Distill-Qwen-32B.description":"مدلهای DeepSeek-R1-Distill از مدلهای متنباز با استفاده از دادههای نمونه تولیدشده توسط DeepSeek-R1 بهصورت دقیق تنظیم شدهاند.",
"DeepSeek-R1-Distill-Qwen-7B.description":"مدلی تقطیرشده از DeepSeek-R1 بر پایه Qwen2.5-Math-7B. با استفاده از یادگیری تقویتی و دادههای شروع سرد، عملکرد استدلال را بهینه کرده و معیارهای جدیدی برای مدلهای متنباز در وظایف چندگانه تعیین کرده است.",
"DeepSeek-R1.description":"DeepSeek-R1 در مرحله پسآموزش از یادگیری تقویتی در مقیاس وسیع استفاده میکند تا توانایی استدلال را با دادههای بسیار کم برچسبخورده بهطور چشمگیری افزایش دهد. این مدل در وظایف استدلال ریاضی، کدنویسی و زبان طبیعی با مدل تولیدی OpenAI o1 برابری میکند.",
"DeepSeek-V3-1.description":"DeepSeek V3.1 یک مدل نسل جدید استدلال با بهبود در استدلال پیچیده و زنجیره تفکر است که برای وظایف تحلیلی عمیق مناسب است.",
"DeepSeek-V3-Fast.description":"ارائهدهنده: sophnet. DeepSeek V3 Fast نسخه با نرخ پردازش بالا از DeepSeek V3 0324 است که با دقت کامل (بدون کوانتیزهسازی) عملکرد قویتری در کدنویسی و ریاضی دارد و پاسخهای سریعتری ارائه میدهد.",
"DeepSeek-V3.1-Fast.description":"DeepSeek V3.1 Fast نسخه سریع با نرخ پردازش بالا از DeepSeek V3.1 است. حالت تفکر ترکیبی: از طریق قالبهای چت، یک مدل از هر دو حالت تفکر و غیرتفکر پشتیبانی میکند. استفاده هوشمندانهتر از ابزار: پسآموزش عملکرد وظایف ابزار و عامل را بهبود میبخشد.",
"DeepSeek-V3.1-Think.description":"حالت تفکر DeepSeek-V3.1: یک مدل استدلال ترکیبی جدید با حالتهای تفکر و غیرتفکر که کارآمدتر از DeepSeek-R1-0528 است. بهینهسازیهای پسآموزش عملکرد استفاده از ابزار عامل و وظایف عامل را بهطور قابلتوجهی بهبود میبخشد.",
"DeepSeek-V3.description":"DeepSeek-V3 یک مدل MoE توسعهیافته توسط DeepSeek است. این مدل در بسیاری از آزمونهای معیار از مدلهای متنباز دیگر مانند Qwen2.5-72B و Llama-3.1-405B پیشی میگیرد و با مدلهای بسته پیشرو مانند GPT-4o و Claude 3.5 Sonnet رقابت میکند.",
"Doubao-lite-128k.description":"Doubao-lite پاسخهای فوقالعاده سریع و ارزش بالاتری ارائه میدهد و گزینههای انعطافپذیری را در سناریوهای مختلف فراهم میسازد. از زمینه ۱۲۸ هزار توکن برای استنتاج و تنظیم دقیق پشتیبانی میکند.",
"Doubao-lite-32k.description":"Doubao-lite پاسخهای فوقالعاده سریع و ارزش بالاتری ارائه میدهد و گزینههای انعطافپذیری را در سناریوهای مختلف فراهم میسازد. از زمینه ۳۲ هزار توکن برای استنتاج و تنظیم دقیق پشتیبانی میکند.",
"Doubao-lite-4k.description":"Doubao-lite پاسخهای فوقالعاده سریع و ارزش بالاتری ارائه میدهد و گزینههای انعطافپذیری را در سناریوهای مختلف فراهم میسازد. از زمینه ۴ هزار توکن برای استنتاج و تنظیم دقیق پشتیبانی میکند.",
"Doubao-pro-128k.description":"بهترین مدل پرچمدار برای وظایف پیچیده با عملکرد قوی در پرسشوپاسخ مرجع، خلاصهسازی، تولید محتوا، طبقهبندی و ایفای نقش. از زمینه ۱۲۸ هزار توکن برای استنتاج و تنظیم دقیق پشتیبانی میکند.",
"Doubao-pro-32k.description":"بهترین مدل پرچمدار برای وظایف پیچیده با عملکرد قوی در پرسشوپاسخ مرجع، خلاصهسازی، تولید محتوا، طبقهبندی و ایفای نقش. از زمینه ۳۲ هزار توکن برای استنتاج و تنظیم دقیق پشتیبانی میکند.",
"Doubao-pro-4k.description":"بهترین مدل پرچمدار برای وظایف پیچیده با عملکرد قوی در پرسشوپاسخ مرجع، خلاصهسازی، تولید محتوا، طبقهبندی و ایفای نقش. از زمینه ۴ هزار توکن برای استنتاج و تنظیم دقیق پشتیبانی میکند.",
"DreamO.description":"DreamO یک مدل متنباز برای سفارشیسازی تصویر است که بهطور مشترک توسط ByteDance و دانشگاه پکن توسعه یافته و از معماری یکپارچه برای پشتیبانی از تولید چندوظیفهای تصویر استفاده میکند. این مدل با مدلسازی ترکیبی کارآمد، تصاویر سفارشی و منسجم را بر اساس هویت، موضوع، سبک، پسزمینه و شرایط دیگر مشخصشده توسط کاربر تولید میکند.",
"ERNIE-3.5-128K.description":"مدل زبان بزرگ پرچمدار بایدو که با استفاده از حجم عظیمی از متون چینی و انگلیسی آموزش دیده و توانایی بالایی در گفتگو، تولید محتوا و استفاده از افزونهها دارد؛ از ادغام خودکار افزونه جستجوی بایدو برای ارائه پاسخهای بهروز پشتیبانی میکند.",
"ERNIE-3.5-8K-Preview.description":"مدل زبان بزرگ پرچمدار بایدو که با استفاده از حجم عظیمی از متون چینی و انگلیسی آموزش دیده و توانایی بالایی در گفتگو، تولید محتوا و استفاده از افزونهها دارد؛ از ادغام خودکار افزونه جستجوی بایدو برای ارائه پاسخهای بهروز پشتیبانی میکند.",
"ERNIE-3.5-8K.description":"مدل زبان بزرگ پرچمدار بایدو که با استفاده از حجم عظیمی از متون چینی و انگلیسی آموزش دیده و توانایی بالایی در گفتگو، تولید محتوا و استفاده از افزونهها دارد؛ از ادغام خودکار افزونه جستجوی بایدو برای ارائه پاسخهای بهروز پشتیبانی میکند.",
"ERNIE-4.0-8K-Latest.description":"مدل زبان بسیار بزرگ پرچمدار بایدو با ارتقاءهای جامع نسبت به ERNIE 3.5، مناسب برای انجام وظایف پیچیده در حوزههای مختلف؛ از ادغام افزونه جستجوی بایدو برای ارائه پاسخهای بهروز پشتیبانی میکند.",
"ERNIE-4.0-8K-Preview.description":"مدل زبان بسیار بزرگ پرچمدار بایدو با ارتقاءهای جامع نسبت به ERNIE 3.5، مناسب برای انجام وظایف پیچیده در حوزههای مختلف؛ از ادغام افزونه جستجوی بایدو برای ارائه پاسخهای بهروز پشتیبانی میکند.",
"ERNIE-4.0-Turbo-8K-Latest.description":"مدل زبان بسیار بزرگ پرچمدار بایدو با عملکرد کلی قدرتمند برای وظایف پیچیده، همراه با ادغام افزونه جستجوی بایدو برای پاسخهای بهروز. عملکرد آن از ERNIE 4.0 بهتر است.",
"ERNIE-4.0-Turbo-8K-Preview.description":"مدل زبان بسیار بزرگ پرچمدار بایدو با عملکرد کلی قدرتمند برای وظایف پیچیده، همراه با ادغام افزونه جستجوی بایدو برای پاسخهای بهروز. عملکرد آن از ERNIE 4.0 بهتر است.",
"ERNIE-Character-8K.description":"مدل زبان تخصصی بایدو برای شخصیتهای بازی، خدمات مشتری و نقشآفرینی، با ثبات بیشتر در شخصیت، پیروی بهتر از دستورات و استدلال قویتر.",
"ERNIE-Lite-Pro-128K.description":"مدل سبک بایدو با تعادل بین کیفیت و عملکرد استنتاج، بهتر از ERNIE Lite و مناسب برای شتابدهندههای کممصرف.",
"ERNIE-Speed-128K.description":"جدیدترین مدل زبان با عملکرد بالا از بایدو (۲۰۲۴) با توانایی عمومی قوی، مناسب برای تنظیم دقیق در سناریوهای خاص، با عملکرد استدلال عالی.",
"ERNIE-Speed-Pro-128K.description":"جدیدترین مدل زبان با عملکرد بالا از بایدو (۲۰۲۴) با توانایی عمومی قوی، بهتر از ERNIE Speed، مناسب برای تنظیم دقیق با عملکرد استدلال عالی.",
"FLUX-1.1-pro.description":"FLUX.1.1 Pro",
"FLUX.1-Kontext-dev.description":"FLUX.1-Kontext-dev یک مدل چندوجهی برای تولید و ویرایش تصویر از آزمایشگاه Black Forest است که بر پایه معماری Rectified Flow Transformer با ۱۲ میلیارد پارامتر ساخته شده است. این مدل بر تولید، بازسازی، بهبود یا ویرایش تصاویر در شرایط زمینهای مشخص تمرکز دارد. با ترکیب قدرت تولید قابل کنترل مدلهای انتشار با مدلسازی زمینهای ترنسفورمر، خروجیهای باکیفیتی برای وظایفی مانند inpainting، outpainting و بازسازی صحنههای بصری ارائه میدهد.",
"FLUX.1-dev.description":"FLUX.1-dev یک مدل زبان چندوجهی متن-تصویر متنباز از آزمایشگاه Black Forest است که برای وظایف درک و تولید تصویر/متن بهینهسازی شده است. این مدل بر پایه LLMهای پیشرفته (مانند Mistral-7B) ساخته شده و از رمزگذار بینایی طراحیشده و تنظیمات چندمرحلهای دستورالعمل بهره میبرد تا هماهنگی چندوجهی و استدلال پیچیده را ممکن سازد.",
"Gryphe/MythoMax-L2-13b.description":"MythoMax-L2 (13B) مدلی نوآورانه برای حوزههای متنوع و وظایف پیچیده است.",
"HelloMeme.description":"HelloMeme یک ابزار هوش مصنوعی برای تولید میم، گیف یا ویدیوهای کوتاه از تصاویر یا حرکاتی است که ارائه میدهید. بدون نیاز به مهارت طراحی یا کدنویسی، تنها با یک تصویر مرجع، محتوایی سرگرمکننده، جذاب و از نظر سبک هماهنگ تولید میکند.",
"HiDream-I1-Full.description":"HiDream-E1-Full یک مدل متنباز ویرایش تصویر چندوجهی از HiDream.ai است که بر پایه معماری پیشرفته Diffusion Transformer و درک زبانی قوی (با LLaMA 3.1-8B-Instruct داخلی) ساخته شده است. این مدل از تولید تصویر با زبان طبیعی، انتقال سبک، ویرایشهای محلی و بازسازی پشتیبانی میکند و در درک و اجرای متن-تصویر عملکرد عالی دارد.",
"HunyuanDiT-v1.2-Diffusers-Distilled.description":"hunyuandit-v1.2-distilled یک مدل سبک تبدیل متن به تصویر است که با استفاده از تقطیر بهینهسازی شده تا تصاویر باکیفیت را بهسرعت تولید کند، بهویژه مناسب برای محیطهای کممنبع و تولید بلادرنگ.",
"InstantCharacter.description":"InstantCharacter مدلی برای تولید شخصیت شخصیسازیشده بدون نیاز به تنظیم است که توسط Tencent AI در سال ۲۰۲۵ عرضه شده است. این مدل با هدف تولید شخصیتهایی با دقت بالا و سازگاری در سناریوهای مختلف طراحی شده و میتواند تنها با یک تصویر مرجع، شخصیت را مدلسازی کرده و آن را در سبکها، حرکات و پسزمینههای مختلف منتقل کند.",
"InternVL2-8B.description":"InternVL2-8B یک مدل قدرتمند بینایی-زبان است که از پردازش چندوجهی تصویر-متن پشتیبانی میکند و محتوای تصویر را با دقت شناسایی کرده و توضیحات یا پاسخهای مرتبط تولید میکند.",
"InternVL2.5-26B.description":"InternVL2.5-26B یک مدل قدرتمند بینایی-زبان است که از پردازش چندوجهی تصویر-متن پشتیبانی میکند و محتوای تصویر را با دقت شناسایی کرده و توضیحات یا پاسخهای مرتبط تولید میکند.",
"Kolors.description":"Kolors یک مدل تبدیل متن به تصویر است که توسط تیم Kolors در Kuaishou توسعه یافته است. این مدل با میلیاردها پارامتر آموزش دیده و در کیفیت بصری، درک معنایی چینی و رندر متن عملکرد برجستهای دارد.",
"Kwai-Kolors/Kolors.description":"Kolors یک مدل بزرگ تبدیل متن به تصویر با انتشار نهفته است که توسط تیم Kolors در Kuaishou توسعه یافته است. این مدل با میلیاردها جفت متن-تصویر آموزش دیده و در کیفیت بصری، دقت معنایی پیچیده و رندر متن چینی/انگلیسی عملکرد عالی دارد و در درک و تولید محتوای چینی بسیار قوی است.",
"Kwaipilot/KAT-Dev.description":"KAT-Dev (32B) یک مدل متنباز برای وظایف مهندسی نرمافزار است. این مدل با نرخ حل ۶۲.۴٪ در SWE-Bench Verified، در میان مدلهای متنباز رتبه پنجم را دارد. با آموزش میانی، تنظیم با نظارت (SFT) و یادگیری تقویتی (RL) برای تکمیل کد، رفع اشکال و بازبینی کد بهینهسازی شده است.",
"Llama-3.2-11B-Vision-Instruct.description":"استدلال تصویری قوی روی تصاویر با وضوح بالا، مناسب برای کاربردهای درک بصری.",
"Llama-3.2-90B-Vision-Instruct\t.description":"استدلال تصویری پیشرفته برای کاربردهای عاملهای درک بصری.",
"Meta-Llama-3-3-70B-Instruct.description":"Llama 3.3 70B یک مدل ترنسفورمر همهکاره برای گفتگو و تولید محتوا است.",
"Meta-Llama-3.1-405B-Instruct.description":"مدل متنی تنظیمشده Llama 3.1 برای دستورالعملها که برای گفتگوهای چندزبانه بهینهسازی شده و در میان مدلهای باز و بسته در ارزیابیهای صنعتی عملکرد قوی دارد.",
"Meta-Llama-3.1-70B-Instruct.description":"مدل متنی تنظیمشده Llama 3.1 برای دستورالعملها که برای گفتگوهای چندزبانه بهینهسازی شده و در میان مدلهای باز و بسته در ارزیابیهای صنعتی عملکرد قوی دارد.",
"Meta-Llama-3.1-8B-Instruct.description":"مدل متنی تنظیمشده Llama 3.1 برای دستورالعملها که برای گفتگوهای چندزبانه بهینهسازی شده و در میان مدلهای باز و بسته در ارزیابیهای صنعتی عملکرد قوی دارد.",
"Meta-Llama-3.2-1B-Instruct.description":"مدل زبان کوچک پیشرفته با درک زبانی قوی، استدلال عالی و تولید متن باکیفیت.",
"Meta-Llama-3.2-3B-Instruct.description":"مدل زبان کوچک پیشرفته با درک زبانی قوی، استدلال عالی و تولید متن باکیفیت.",
"Meta-Llama-3.3-70B-Instruct.description":"Llama 3.3 پیشرفتهترین مدل چندزبانه متنباز Llama است که عملکردی نزدیک به مدلهای ۴۰۵B با هزینه بسیار پایین ارائه میدهد. این مدل بر پایه ترنسفورمر ساخته شده و با SFT و RLHF برای کاربردپذیری و ایمنی بهبود یافته است. نسخه تنظیمشده برای گفتگوهای چندزبانه بهینه شده و در ارزیابیهای صنعتی بسیاری از مدلهای باز و بسته را پشت سر گذاشته است. تاریخ قطع دانش: دسامبر ۲۰۲۳.",
"Meta-Llama-4-Maverick-17B-128E-Instruct-FP8.description":"Llama 4 Maverick یک مدل MoE بزرگ با فعالسازی کارآمد متخصصان برای عملکرد استدلالی قوی است.",
"MiniMax-M1.description":"یک مدل استدلالی داخلی جدید با ۸۰ هزار زنجیره تفکر و ورودی ۱ میلیون توکن، با عملکردی در سطح مدلهای برتر جهانی.",
"MiniMax-M2-Stable.description":"طراحیشده برای کدنویسی کارآمد و جریانهای کاری عاملمحور، با همزمانی بالاتر برای استفاده تجاری.",
"MiniMax-Text-01.description":"MiniMax-01 توجه خطی در مقیاس بزرگ را فراتر از ترنسفورمرهای کلاسیک معرفی میکند، با ۴۵۶ میلیارد پارامتر و ۴۵.۹ میلیارد پارامتر فعال در هر عبور. این مدل عملکردی در سطح برتر ارائه میدهد و تا ۴ میلیون توکن زمینه را پشتیبانی میکند (۳۲ برابر GPT-4o، ۲۰ برابر Claude-3.5-Sonnet).",
"MiniMaxAI/MiniMax-M1-80k.description":"MiniMax-M1 یک مدل استدلالی با وزنهای باز و معماری توجه ترکیبی در مقیاس بزرگ است با ۴۵۶ میلیارد پارامتر کل و حدود ۴۵.۹ میلیارد پارامتر فعال در هر توکن. این مدل بهصورت بومی از زمینه ۱ میلیون توکن پشتیبانی میکند و با استفاده از Flash Attention، مصرف FLOPs را در تولید ۱۰۰ هزار توکن تا ۷۵٪ نسبت به DeepSeek R1 کاهش میدهد. با معماری MoE بههمراه CISPO و آموزش تقویتی با توجه ترکیبی، عملکردی پیشرو در استدلال ورودیهای طولانی و وظایف واقعی مهندسی نرمافزار ارائه میدهد.",
"MiniMaxAI/MiniMax-M2.description":"MiniMax-M2 کارایی عاملها را بازتعریف میکند. این مدل MoE فشرده، سریع و مقرونبهصرفه با ۲۳۰ میلیارد پارامتر کل و ۱۰ میلیارد پارامتر فعال است که برای وظایف کدنویسی و عاملهای سطح بالا طراحی شده و در عین حال هوش عمومی قوی را حفظ میکند. با تنها ۱۰ میلیارد پارامتر فعال، با مدلهای بسیار بزرگتر رقابت میکند و برای کاربردهای با کارایی بالا ایدهآل است.",
"Moonshot-Kimi-K2-Instruct.description":"با ۱ تریلیون پارامتر کل و ۳۲ میلیارد فعال، در میان مدلهای غیرتفکری، در دانش پیشرفته، ریاضی و کدنویسی در سطح برتر قرار دارد و در وظایف عمومی عاملها نیز قویتر است. برای بارهای کاری عاملها بهینه شده و میتواند اقدام کند، نه فقط پاسخ دهد. برای چت عمومی، بداههگویی و تجربههای عاملمحور در سطح واکنشی بدون تفکر طولانی بهترین گزینه است.",
"NousResearch/Nous-Hermes-2-Mixtral-8x7B-DPO.description":"Nous Hermes 2 - Mixtral 8x7B-DPO (۴۶.۷ میلیارد) یک مدل دستورالعملمحور با دقت بالا برای محاسبات پیچیده است.",
"OmniConsistency.description":"OmniConsistency با معرفی ترنسفورمرهای انتشار در مقیاس بزرگ (DiTs) و دادههای سبکدهیشده جفتشده، ثبات سبک و تعمیمپذیری را در وظایف تصویر به تصویر بهبود میبخشد و از تخریب سبک جلوگیری میکند.",
"Phi-3-medium-128k-instruct.description":"همان مدل Phi-3-medium با پنجره زمینه بزرگتر برای RAG یا نمونههای چندگانه.",
"Phi-3-medium-4k-instruct.description":"مدلی با ۱۴ میلیارد پارامتر و کیفیت بالاتر نسبت به Phi-3-mini، متمرکز بر دادههای با کیفیت و نیازمند استدلال.",
"Phi-3-mini-128k-instruct.description":"همان مدل Phi-3-mini با پنجره زمینه بزرگتر برای RAG یا نمونههای چندگانه.",
"Phi-3-mini-4k-instruct.description":"کوچکترین عضو خانواده Phi-3، بهینهشده برای کیفیت و تأخیر پایین.",
"Phi-3-small-128k-instruct.description":"همان مدل Phi-3-small با پنجره زمینه بزرگتر برای RAG یا نمونههای چندگانه.",
"Phi-3-small-8k-instruct.description":"مدلی با ۷ میلیارد پارامتر و کیفیت بالاتر نسبت به Phi-3-mini، متمرکز بر دادههای با کیفیت و نیازمند استدلال.",
"Pro/Qwen/Qwen2-7B-Instruct.description":"Qwen2-7B-Instruct یک مدل LLM با ۷ میلیارد پارامتر در سری Qwen2 است که با معماری ترنسفورمر، SwiGLU، بایاس QKV توجه و توجه گروهی طراحی شده و ورودیهای بزرگ را مدیریت میکند. این مدل در درک زبان، تولید، وظایف چندزبانه، کدنویسی، ریاضی و استدلال عملکرد قوی دارد و از بسیاری از مدلهای باز پیشی میگیرد و با مدلهای اختصاصی رقابت میکند. در چندین معیار از Qwen1.5-7B-Chat بهتر عمل میکند.",
"Pro/Qwen/Qwen2.5-7B-Instruct.description":"Qwen2.5-7B-Instruct بخشی از جدیدترین سری LLM علیبابا کلود است. این مدل ۷ میلیاردی پیشرفتهای قابل توجهی در کدنویسی و ریاضی دارد، از بیش از ۲۹ زبان پشتیبانی میکند و در پیروی از دستورالعملها، درک دادههای ساختاریافته و تولید خروجی ساختاریافته (بهویژه JSON) بهبود یافته است.",
"Pro/Qwen/Qwen2.5-Coder-7B-Instruct.description":"Qwen2.5-Coder-7B-Instruct جدیدترین مدل LLM متمرکز بر کد از علیبابا کلود است. بر پایه Qwen2.5 ساخته شده و با ۵.۵ تریلیون توکن آموزش دیده، تولید کد، استدلال و اصلاح را بهطور قابل توجهی بهبود میبخشد و در عین حال تواناییهای ریاضی و عمومی را حفظ میکند، و پایهای قوی برای عاملهای کدنویسی فراهم میکند.",
"Pro/Qwen/Qwen2.5-VL-7B-Instruct.description":"Qwen2.5-VL یک مدل جدید زبان-بینایی از سری Qwen با درک بصری قوی است. این مدل متن، نمودارها و چیدمانها را در تصاویر تحلیل میکند، ویدیوهای طولانی و رویدادها را درک میکند، از استدلال و استفاده از ابزار پشتیبانی میکند، اشیاء را در قالبهای مختلف مکانیابی میکند و خروجیهای ساختاریافته تولید میکند. همچنین وضوح پویا و نرخ فریم را برای درک ویدیو بهبود میبخشد و کارایی رمزگذار بینایی را افزایش میدهد.",
"Pro/THUDM/GLM-4.1V-9B-Thinking.description":"GLM-4.1V-9B-Thinking یک مدل VLM متنباز از Zhipu AI و آزمایشگاه KEG دانشگاه Tsinghua است که برای شناخت چندوجهی پیچیده طراحی شده است. بر پایه GLM-4-9B-0414 ساخته شده و با افزودن زنجیره تفکر و یادگیری تقویتی، استدلال میانوجهی و پایداری را بهطور قابل توجهی بهبود میبخشد.",
"Pro/THUDM/glm-4-9b-chat.description":"GLM-4-9B-Chat مدل متنباز GLM-4 از Zhipu AI است. این مدل در معناشناسی، ریاضی، استدلال، کدنویسی و دانش عملکرد قوی دارد. فراتر از چت چندنوبتی، از مرور وب، اجرای کد، فراخوانی ابزارهای سفارشی و استدلال متون طولانی پشتیبانی میکند. از ۲۶ زبان (از جمله چینی، انگلیسی، ژاپنی، کرهای، آلمانی) پشتیبانی میکند. در معیارهایی مانند AlignBench-v2، MT-Bench، MMLU و C-Eval عملکرد خوبی دارد و تا ۱۲۸ هزار توکن زمینه را برای استفادههای علمی و تجاری پشتیبانی میکند.",
"Pro/deepseek-ai/DeepSeek-R1-Distill-Qwen-7B.description":"DeepSeek-R1-Distill-Qwen-7B از Qwen2.5-Math-7B استخراج شده و بر روی ۸۰۰ هزار نمونه منتخب DeepSeek-R1 تنظیم دقیق شده است. این مدل عملکرد قوی دارد: ۹۲.۸٪ در MATH-500، ۵۵.۵٪ در AIME 2024 و امتیاز ۱۱۸۹ در CodeForces برای یک مدل ۷ میلیاردی.",
"Pro/deepseek-ai/DeepSeek-R1.description":"DeepSeek-R1 یک مدل استدلالی مبتنی بر یادگیری تقویتی است که تکرار را کاهش داده و خوانایی را بهبود میبخشد. با استفاده از دادههای شروع سرد پیش از RL، استدلال را بیشتر تقویت میکند، در وظایف ریاضی، کدنویسی و استدلال با OpenAI-o1 برابری میکند و با آموزش دقیق، نتایج کلی را بهبود میبخشد.",
"Pro/deepseek-ai/DeepSeek-V3.1-Terminus.description":"DeepSeek-V3.1-Terminus نسخه بهروزشده مدل V3.1 است که بهعنوان یک LLM عامل ترکیبی طراحی شده است. مشکلات گزارششده کاربران را رفع کرده، پایداری و سازگاری زبانی را بهبود داده و نویسههای غیرعادی و ترکیب چینی/انگلیسی را کاهش داده است. حالتهای تفکری و غیرتفکری را با قالبهای چت یکپارچه میکند تا امکان جابجایی انعطافپذیر فراهم شود. همچنین عملکرد عامل کد و عامل جستجو را برای استفاده مطمئنتر از ابزارها و وظایف چندمرحلهای بهبود میبخشد.",
"Pro/deepseek-ai/DeepSeek-V3.2-Exp.description":"DeepSeek-V3.2-Exp یک نسخه آزمایشی از V3.2 است که پلی به سوی معماری بعدی ایجاد میکند. با افزودن DeepSeek Sparse Attention (DSA) بر پایه V3.1-Terminus، کارایی آموزش و استنتاج در زمینههای طولانی را بهبود میبخشد و برای استفاده از ابزارها، درک اسناد طولانی و استدلال چندمرحلهای بهینه شده است. برای بررسی کارایی بالاتر استدلال با بودجه زمینه بزرگ ایدهآل است.",
"Pro/deepseek-ai/DeepSeek-V3.description":"DeepSeek-V3 یک مدل MoE با ۶۷۱ میلیارد پارامتر است که از MLA و DeepSeekMoE با تعادل بار بدون اتلاف برای استنتاج و آموزش کارآمد استفاده میکند. با پیشآموزش بر روی ۱۴.۸ تریلیون توکن با کیفیت بالا و تنظیم بیشتر با SFT و RL، از سایر مدلهای باز پیشی میگیرد و به مدلهای بسته پیشرو نزدیک میشود.",
"Pro/moonshotai/Kimi-K2-Instruct-0905.description":"Kimi K2-Instruct-0905 جدیدترین و قدرتمندترین نسخه Kimi K2 است. این مدل MoE سطح بالا با ۱ تریلیون پارامتر کل و ۳۲ میلیارد پارامتر فعال است. ویژگیهای کلیدی شامل هوش کدنویسی عاملمحور قویتر با پیشرفتهای قابل توجه در معیارها و وظایف واقعی عاملها، بهعلاوه زیباییشناسی و قابلیت استفاده بهتر در کدنویسی رابط کاربری است.",
"Pro/moonshotai/Kimi-K2-Thinking.description":"Kimi K2 Thinking Turbo نسخه توربو بهینهشده برای سرعت استدلال و توان عملیاتی است، در حالی که استدلال چندمرحلهای و استفاده از ابزار K2 Thinking را حفظ میکند. این مدل MoE با حدود ۱ تریلیون پارامتر کل، زمینه بومی ۲۵۶ هزار توکن و فراخوانی ابزار در مقیاس بزرگ پایدار برای سناریوهای تولیدی با نیازهای سختگیرانهتر در تأخیر و همزمانی است.",
"Pro/zai-org/glm-4.7.description":"GLM-4.7 مدل پرچمدار نسل جدید شرکت Zhipu است که دارای ۳۵۵ میلیارد پارامتر کلی و ۳۲ میلیارد پارامتر فعال میباشد. این مدل در زمینههای گفتوگوی عمومی، استدلال و تواناییهای عامل هوشمند بهطور کامل ارتقاء یافته است. GLM-4.7 قابلیت Interleaved Thinking (تفکر درهمتنیده) را بهبود داده و مفاهیم Preserved Thinking (تفکر حفظشده) و Turn-level Thinking (تفکر در سطح نوبت) را معرفی کرده است.",
"QwQ-32B-Preview.description":"Qwen QwQ یک مدل تحقیقاتی آزمایشی است که بر بهبود توانایی استدلال تمرکز دارد.",
"Qwen/QVQ-72B-Preview.description":"QVQ-72B-Preview یک مدل تحقیقاتی از Qwen است که بر استدلال بصری تمرکز دارد و در درک صحنههای پیچیده و حل مسائل ریاضی بصری توانمند است.",
"Qwen/QwQ-32B-Preview.description":"Qwen QwQ یک مدل تحقیقاتی آزمایشی است که بر بهبود استدلال هوش مصنوعی تمرکز دارد.",
"Qwen/QwQ-32B.description":"QwQ یک مدل استدلال از خانواده Qwen است. در مقایسه با مدلهای استاندارد تنظیمشده با دستورالعمل، این مدل تفکر و استدلال را اضافه میکند که عملکرد مدل را در وظایف دشوار بهطور قابل توجهی بهبود میبخشد. QwQ-32B یک مدل استدلال میانرده است که با مدلهای برتر مانند DeepSeek-R1 و o1-mini رقابت میکند. این مدل از RoPE، SwiGLU، RMSNorm و بایاس QKV در توجه استفاده میکند و دارای ۶۴ لایه و ۴۰ سر توجه Q (با ۸ KV در GQA) است.",
"Qwen/Qwen-Image-Edit-2509.description":"Qwen-Image-Edit-2509 جدیدترین نسخه ویرایش مدل Qwen-Image از تیم Qwen است. این مدل بر پایه Qwen-Image با ۲۰ میلیارد پارامتر ساخته شده و قابلیت رندر دقیق متن را به ویرایش تصویر گسترش میدهد. با استفاده از معماری کنترل دوگانه، ورودیها را به Qwen2.5-VL برای کنترل معنایی و به رمزگذار VAE برای کنترل ظاهر ارسال میکند و امکان ویرایش در سطح معنا و ظاهر را فراهم میسازد. این مدل از ویرایشهای محلی (افزودن/حذف/تغییر) و ویرایشهای معنایی سطح بالا مانند خلق IP و انتقال سبک پشتیبانی میکند و در عین حال معنا را حفظ مینماید. این مدل در چندین معیار عملکرد پیشرفتهای (SOTA) دارد.",
"Qwen/Qwen-Image.description":"Qwen-Image یک مدل پایه تولید تصویر با ۲۰ میلیارد پارامتر از تیم Qwen است. این مدل در رندر متنهای پیچیده و ویرایش دقیق تصویر، بهویژه برای متون چینی/انگلیسی با وفاداری بالا، پیشرفت چشمگیری دارد. از چیدمانهای چندخطی و پاراگرافی پشتیبانی میکند و انسجام تایپوگرافی را حفظ مینماید. فراتر از رندر متن، از سبکهای متنوعی از واقعگرایانه تا انیمه پشتیبانی میکند و قابلیتهایی مانند انتقال سبک، افزودن/حذف اشیاء، افزایش جزئیات، ویرایش متن و کنترل حالت را ارائه میدهد و هدف آن تبدیل شدن به یک مدل پایه جامع برای خلق بصری است.",
"Qwen/Qwen2-72B-Instruct.description":"Qwen 2 Instruct (72B) دستورالعملها را با دقت بالا برای بارهای کاری سازمانی دنبال میکند.",
"Qwen/Qwen2-7B-Instruct.description":"Qwen2-7B-Instruct یک مدل ۷ میلیارد پارامتری تنظیمشده با دستورالعمل در سری Qwen2 است که از Transformer، SwiGLU، بایاس QKV و توجه با پرسوجوی گروهی استفاده میکند. این مدل ورودیهای بزرگ را پردازش میکند و در معیارهای درک، تولید، چندزبانه، کدنویسی، ریاضی و استدلال عملکرد قوی دارد و از بیشتر مدلهای باز پیشی میگیرد و در چندین ارزیابی از Qwen1.5-7B-Chat بهتر عمل میکند.",
"Qwen/Qwen2-VL-72B-Instruct.description":"Qwen2-VL جدیدترین مدل Qwen-VL است که در معیارهای بینایی مانند MathVista، DocVQA، RealWorldQA و MTVQA به سطح پیشرفته (SOTA) رسیده است. این مدل توانایی درک ویدیوهای بیش از ۲۰ دقیقه را برای پرسش و پاسخ ویدیویی، گفتوگو و تولید محتوا دارد. همچنین از استدلال پیچیده و تصمیمگیری پشتیبانی میکند و با دستگاهها/رباتها برای اقدامات مبتنی بر بینایی یکپارچه میشود. فراتر از زبانهای انگلیسی و چینی، این مدل میتواند متون را به زبانهای مختلف از جمله بیشتر زبانهای اروپایی، ژاپنی، کرهای، عربی و ویتنامی بخواند.",
"Qwen/Qwen2.5-14B-Instruct.description":"Qwen2.5-14B-Instruct بخشی از جدیدترین سری مدلهای زبانی بزرگ (LLM) علیبابا کلود است. این مدل ۱۴ میلیارد پارامتری پیشرفتهای قابل توجهی در کدنویسی و ریاضی دارد، از بیش از ۲۹ زبان پشتیبانی میکند و در دنبال کردن دستورالعملها، درک دادههای ساختاریافته و تولید خروجی ساختاریافته (بهویژه JSON) بهبود یافته است.",
"Qwen/Qwen2.5-32B-Instruct.description":"Qwen2.5-32B-Instruct بخشی از جدیدترین سری مدلهای زبانی بزرگ (LLM) علیبابا کلود است. این مدل ۳۲ میلیارد پارامتری پیشرفتهای قابل توجهی در کدنویسی و ریاضی دارد، از بیش از ۲۹ زبان پشتیبانی میکند و در دنبال کردن دستورالعملها، درک دادههای ساختاریافته و تولید خروجی ساختاریافته (بهویژه JSON) بهبود یافته است.",
"Qwen/Qwen2.5-72B-Instruct-128K.description":"Qwen2.5-72B-Instruct بخشی از جدیدترین سری مدلهای زبانی بزرگ (LLM) علیبابا کلود است. این مدل ۷۲ میلیارد پارامتری در کدنویسی و ریاضی بهبود یافته، از ورودی تا ۱۲۸ هزار توکن و خروجی بیش از ۸ هزار توکن پشتیبانی میکند، بیش از ۲۹ زبان را پوشش میدهد و در دنبال کردن دستورالعملها و تولید خروجی ساختاریافته (بهویژه JSON) عملکرد بهتری دارد.",
"Qwen/Qwen2.5-72B-Instruct-Turbo.description":"Qwen2.5 یک خانواده جدید از مدلهای زبانی بزرگ است که برای وظایف مبتنی بر دستورالعمل بهینهسازی شده است.",
"Qwen/Qwen2.5-72B-Instruct.description":"Qwen2.5-72B-Instruct بخشی از جدیدترین سری مدلهای زبانی بزرگ (LLM) علیبابا کلود است. این مدل ۷۲ میلیارد پارامتری پیشرفتهای قابل توجهی در کدنویسی و ریاضی دارد، از بیش از ۲۹ زبان پشتیبانی میکند و در دنبال کردن دستورالعملها، درک دادههای ساختاریافته و تولید خروجی ساختاریافته (بهویژه JSON) بهبود یافته است.",
"Qwen/Qwen2.5-7B-Instruct-Turbo.description":"Qwen2.5 یک خانواده جدید از مدلهای زبانی بزرگ است که برای وظایف مبتنی بر دستورالعمل بهینهسازی شده است.",
"Qwen/Qwen2.5-7B-Instruct.description":"Qwen2.5-7B-Instruct بخشی از جدیدترین سری مدلهای زبانی بزرگ (LLM) علیبابا کلود است. این مدل ۷ میلیارد پارامتری پیشرفتهای قابل توجهی در کدنویسی و ریاضی دارد، از بیش از ۲۹ زبان پشتیبانی میکند و در دنبال کردن دستورالعملها، درک دادههای ساختاریافته و تولید خروجی ساختاریافته (بهویژه JSON) بهبود یافته است.",
"Qwen/Qwen2.5-Coder-32B-Instruct.description":"Qwen2.5 Coder 32B Instruct جدیدترین مدل کدنویسی علیبابا کلود است. این مدل بر پایه Qwen2.5 ساخته شده و با ۵.۵ تریلیون توکن آموزش دیده است. این مدل بهطور قابل توجهی در تولید کد، استدلال و اصلاح کد بهبود یافته و در عین حال تواناییهای ریاضی و عمومی خود را حفظ کرده است و پایهای قوی برای عاملهای کدنویسی فراهم میکند.",
"Qwen/Qwen2.5-Coder-7B-Instruct.description":"Qwen2.5-Coder-7B-Instruct جدیدترین مدل کدنویسی علیبابا کلود است. این مدل بر پایه Qwen2.5 ساخته شده و با ۵.۵ تریلیون توکن آموزش دیده است. این مدل بهطور قابل توجهی در تولید کد، استدلال و اصلاح کد بهبود یافته و در عین حال تواناییهای ریاضی و عمومی خود را حفظ کرده است و پایهای محکم برای عاملهای کدنویسی فراهم میکند.",
"Qwen/Qwen2.5-VL-32B-Instruct.description":"Qwen2.5-VL-32B-Instruct یک مدل چندوجهی از تیم Qwen است. این مدل اشیاء رایج را شناسایی کرده و متن، نمودارها، آیکونها، گرافیکها و چیدمانها را تحلیل میکند. بهعنوان یک عامل بصری، میتواند استدلال کند و ابزارها را بهصورت پویا کنترل نماید، از جمله استفاده از رایانه و تلفن. این مدل اشیاء را با دقت مکانیابی کرده و خروجیهای ساختاریافته برای فاکتورها و جداول تولید میکند. در مقایسه با Qwen2-VL، نسخه RL در ریاضی و حل مسئله بهبود یافته و پاسخهایی با ترجیح انسانی بیشتری ارائه میدهد.",
"Qwen/Qwen2.5-VL-72B-Instruct.description":"Qwen2.5-VL مدل بینایی-زبان در سری Qwen2.5 است که با ارتقاءهای عمده همراه است: درک بصری قویتر برای اشیاء، متن، نمودارها و چیدمانها؛ استدلال بهعنوان یک عامل بصری با استفاده پویا از ابزارها؛ درک ویدیوهای بیش از ۱ ساعت و ثبت رویدادهای کلیدی؛ مکانیابی دقیق اشیاء از طریق جعبهها یا نقاط؛ و خروجیهای ساختاریافته برای دادههای اسکنشده مانند فاکتورها و جداول.",
"Qwen/Qwen3-14B.description":"Qwen3 یک مدل نسل جدید از خانواده Tongyi Qwen است که پیشرفتهای چشمگیری در استدلال، توانایی عمومی، قابلیتهای عاملمحور و عملکرد چندزبانه دارد و از تغییر حالتهای تفکر پشتیبانی میکند.",
"Qwen/Qwen3-235B-A22B-Instruct-2507.description":"Qwen3-235B-A22B-Instruct-2507 یک مدل پرچمدار MoE از سری Qwen3 با ۲۳۵ میلیارد پارامتر کل و ۲۲ میلیارد پارامتر فعال است. این نسخه غیرتفکری بهروزرسانی شده، بر بهبود پیروی از دستورالعملها، استدلال منطقی، درک متن، ریاضیات، علوم، برنامهنویسی و استفاده از ابزار تمرکز دارد. همچنین دانش چندزبانه در حوزههای کمکاربرد را گسترش داده و با ترجیحات کاربران در وظایف ذهنی و باز بهتر همراستا میشود.",
"Qwen/Qwen3-235B-A22B-Thinking-2507.description":"Qwen3-235B-A22B-Thinking-2507 یک مدل Qwen3 متمرکز بر استدلال پیچیده و دشوار است. این مدل از معماری MoE با ۲۳۵ میلیارد پارامتر کل و حدود ۲۲ میلیارد پارامتر فعال در هر توکن استفاده میکند تا بهرهوری را افزایش دهد. بهعنوان یک مدل تفکری اختصاصی، پیشرفتهای چشمگیری در منطق، ریاضیات، علوم، برنامهنویسی و معیارهای دانشگاهی نشان میدهد و به عملکردی در سطح برتر در تفکر باز میرسد. همچنین پیروی از دستورالعملها، استفاده از ابزار و تولید متن را بهبود میبخشد و بهصورت بومی از زمینه ۲۵۶ هزار توکن برای استدلال عمیق و اسناد طولانی پشتیبانی میکند.",
"Qwen/Qwen3-235B-A22B.description":"Qwen3 یک مدل نسل جدید از خانواده Tongyi Qwen است که پیشرفتهای چشمگیری در استدلال، توانایی عمومی، قابلیتهای عاملمحور و عملکرد چندزبانه دارد و از تغییر حالتهای تفکر پشتیبانی میکند.",
"Qwen/Qwen3-30B-A3B-Instruct-2507.description":"Qwen3-30B-A3B-Instruct-2507 نسخه غیرتفکری بهروزرسانیشده Qwen3-30B-A3B است. این مدل MoE دارای ۳۰.۵ میلیارد پارامتر کل و ۳.۳ میلیارد پارامتر فعال است. این مدل بهطور قابلتوجهی پیروی از دستورالعملها، استدلال منطقی، درک متن، ریاضیات، علوم، برنامهنویسی و استفاده از ابزار را بهبود میبخشد، دانش چندزبانه در حوزههای کمکاربرد را گسترش میدهد و با ترجیحات کاربران در وظایف ذهنی باز بهتر همراستا میشود. از زمینه ۲۵۶ هزار توکن پشتیبانی میکند. این مدل فقط در حالت غیرتفکری عمل میکند و تگهای `<think></think>` تولید نمیکند.",
"Qwen/Qwen3-30B-A3B-Thinking-2507.description":"Qwen3-30B-A3B-Thinking-2507 جدیدترین مدل تفکری در سری Qwen3 است. این مدل MoE با ۳۰.۵ میلیارد پارامتر کل و ۳.۳ میلیارد پارامتر فعال، بر وظایف پیچیده تمرکز دارد. پیشرفتهای قابلتوجهی در منطق، ریاضیات، علوم، برنامهنویسی و معیارهای دانشگاهی نشان میدهد و پیروی از دستورالعملها، استفاده از ابزار، تولید متن و همراستایی با ترجیحات را بهبود میبخشد. بهصورت بومی از زمینه ۲۵۶ هزار توکن پشتیبانی میکند و قابلیت گسترش تا ۱ میلیون توکن را دارد. این نسخه برای حالت تفکری طراحی شده و استدلال گامبهگام دقیق و قابلیتهای قوی عاملمحور ارائه میدهد.",
"Qwen/Qwen3-30B-A3B.description":"Qwen3 یک مدل نسل جدید از خانواده Tongyi Qwen است که پیشرفتهای چشمگیری در استدلال، توانایی عمومی، قابلیتهای عاملمحور و عملکرد چندزبانه دارد و از تغییر حالتهای تفکر پشتیبانی میکند.",
"Qwen/Qwen3-32B.description":"Qwen3 یک مدل نسل جدید از خانواده Tongyi Qwen است که پیشرفتهای چشمگیری در استدلال، توانایی عمومی، قابلیتهای عاملمحور و عملکرد چندزبانه دارد و از تغییر حالتهای تفکر پشتیبانی میکند.",
"Qwen/Qwen3-8B.description":"Qwen3 یک مدل نسل جدید از خانواده Tongyi Qwen است که پیشرفتهای چشمگیری در استدلال، توانایی عمومی، قابلیتهای عاملمحور و عملکرد چندزبانه دارد و از تغییر حالتهای تفکر پشتیبانی میکند.",
"Qwen/Qwen3-Coder-30B-A3B-Instruct.description":"Qwen3-Coder-30B-A3B-Instruct یک مدل کدنویسی از تیم Qwen است. این مدل برای عملکرد بالا و بهرهوری بهینهسازی شده و تواناییهای کدنویسی را تقویت میکند. در کدنویسی عاملمحور، عملیات خودکار مرورگر و استفاده از ابزار در میان مدلهای باز عملکرد برجستهای دارد. بهصورت بومی از زمینه ۲۵۶ هزار توکن پشتیبانی میکند و میتواند تا ۱ میلیون توکن برای درک در سطح پایگاه کد گسترش یابد. این مدل کدنویسی عاملمحور را در پلتفرمهایی مانند Qwen Code و CLINE با فرمت فراخوانی تابع اختصاصی پشتیبانی میکند.",
"Qwen/Qwen3-Coder-480B-A35B-Instruct.description":"Qwen3-Coder-480B-A35B-Instruct پیشرفتهترین مدل کدنویسی عاملمحور علیبابا تا به امروز است. این مدل MoE با ۴۸۰ میلیارد پارامتر کل و ۳۵ میلیارد پارامتر فعال، تعادلی بین بهرهوری و عملکرد برقرار میکند. بهصورت بومی از زمینه ۲۵۶ هزار توکن پشتیبانی میکند و از طریق YaRN تا ۱ میلیون توکن گسترش مییابد و امکان پردازش پایگاههای کد بزرگ را فراهم میسازد. برای جریانهای کاری کدنویسی عاملمحور طراحی شده و میتواند با ابزارها و محیطها تعامل داشته باشد تا وظایف پیچیده برنامهنویسی را حل کند. در معیارهای کدنویسی و عاملمحور در میان مدلهای باز نتایج برتری دارد و با مدلهای پیشرو مانند Claude Sonnet 4 قابل مقایسه است.",
"Qwen/Qwen3-Next-80B-A3B-Instruct.description":"Qwen3-Next-80B-A3B-Instruct یک مدل پایه نسل جدید است که از معماری Qwen3-Next برای بهرهوری شدید در آموزش و استنتاج استفاده میکند. این مدل ترکیبی از توجه ترکیبی (Gated DeltaNet + Gated Attention)، MoE بسیار پراکنده و بهینهسازیهای پایداری آموزش را بهکار میگیرد. با ۸۰ میلیارد پارامتر کل اما حدود ۳ میلیارد پارامتر فعال در زمان استنتاج، مصرف محاسباتی را کاهش داده و بیش از ۱۰ برابر بازدهی نسبت به Qwen3-32B در زمینههای بالای ۳۲ هزار توکن ارائه میدهد. این نسخه تنظیمشده برای دستورالعملها، وظایف عمومی را هدف قرار میدهد (بدون حالت تفکری). در برخی معیارها عملکردی مشابه Qwen3-235B دارد و در وظایف با زمینه بسیار طولانی مزایای قابلتوجهی نشان میدهد.",
"Qwen/Qwen3-Next-80B-A3B-Thinking.description":"Qwen3-Next-80B-A3B-Thinking یک مدل پایه نسل جدید برای استدلال پیچیده است. این مدل از معماری Qwen3-Next با توجه ترکیبی (Gated DeltaNet + Gated Attention) و MoE بسیار پراکنده برای بهرهوری شدید در آموزش و استنتاج استفاده میکند. با ۸۰ میلیارد پارامتر کل اما حدود ۳ میلیارد پارامتر فعال در زمان استنتاج، مصرف محاسباتی را کاهش داده و بیش از ۱۰ برابر بازدهی نسبت به Qwen3-32B در زمینههای بالای ۳۲ هزار توکن ارائه میدهد. این نسخه تفکری وظایف چندمرحلهای مانند اثباتها، ترکیب کد، تحلیل منطقی و برنامهریزی را هدف قرار میدهد و زنجیرهای ساختاریافته از تفکر تولید میکند. از Qwen3-32B-Thinking عملکرد بهتری دارد و در چندین معیار از Gemini-2.5-Flash-Thinking پیشی میگیرد.",
"Qwen/Qwen3-Omni-30B-A3B-Captioner.description":"Qwen3-Omni-30B-A3B-Captioner یک مدل VLM از سری Qwen3 است که برای تولید کپشنهای تصویری با کیفیت بالا، دقیق و جزئی طراحی شده است. این مدل از معماری MoE با ۳۰ میلیارد پارامتر استفاده میکند تا تصاویر را بهطور عمیق درک کرده و توصیفهای روان تولید کند. در ثبت جزئیات، درک صحنه، شناسایی اشیاء و استدلال رابطهای عملکرد برجستهای دارد.",
"Qwen/Qwen3-Omni-30B-A3B-Instruct.description":"Qwen3-Omni-30B-A3B-Instruct یک مدل MoE از سری Qwen3 با ۳۰ میلیارد پارامتر کل و ۳ میلیارد پارامتر فعال است که عملکرد قوی را با هزینه استنتاج پایین ارائه میدهد. این مدل با دادههای چندمنبعی و چندزبانه با کیفیت بالا آموزش دیده و از ورودیهای تماممدال (متن، تصویر، صدا، ویدیو) و درک و تولید میانمدال پشتیبانی میکند.",
"Qwen/Qwen3-Omni-30B-A3B-Thinking.description":"Qwen3-Omni-30B-A3B-Thinking هسته تفکری Qwen3-Omni است. این مدل ورودیهای چندمدال (متن، صدا، تصویر، ویدیو) را پردازش کرده و استدلال زنجیرهای پیچیده انجام میدهد و ورودیها را به نمایش مشترک برای درک عمیق میانمدال تبدیل میکند. این مدل MoE با ۳۰ میلیارد پارامتر کل و ۳ میلیارد پارامتر فعال است که تعادلی بین استدلال قوی و بهرهوری محاسباتی برقرار میکند.",
"Qwen/Qwen3-VL-235B-A22B-Instruct.description":"Qwen3-VL-235B-A22B-Instruct یک مدل بزرگ تنظیمشده با دستورالعمل از سری Qwen3-VL است که بر پایه MoE ساخته شده و درک و تولید چندمدال عالی ارائه میدهد. بهصورت بومی از زمینه ۲۵۶ هزار توکن پشتیبانی میکند و برای خدمات تولیدی چندمدال با همزمانی بالا مناسب است.",
"Qwen/Qwen3-VL-235B-A22B-Thinking.description":"Qwen3-VL-235B-A22B-Thinking نسخه تفکری پرچمدار Qwen3-VL است که برای استدلال پیچیده چندمدال، استدلال با زمینه طولانی و تعامل عاملمحور در سناریوهای سازمانی بهینهسازی شده است.",
"Qwen/Qwen3-VL-30B-A3B-Instruct.description":"Qwen3-VL-30B-A3B-Instruct نسخه تنظیمشده با دستورالعمل از مدل Qwen3-VL است که درک و تولید زبان-تصویر قوی دارد. بهصورت بومی از زمینه ۲۵۶ هزار توکن برای چت چندمدال و تولید مشروط بر تصویر پشتیبانی میکند.",
"Qwen/Qwen3-VL-30B-A3B-Thinking.description":"Qwen3-VL-30B-A3B-Thinking نسخه تقویتشده برای استدلال از Qwen3-VL است که برای استدلال چندمدال، تبدیل تصویر به کد و درک بصری پیچیده بهینهسازی شده است. از زمینه ۲۵۶ هزار توکن با توانایی قوی در زنجیره تفکر پشتیبانی میکند.",
"Qwen/Qwen3-VL-32B-Instruct.description":"Qwen3-VL-32B-Instruct یک مدل زبان-تصویر از تیم Qwen است که نتایج پیشرفتهای در چندین معیار VL دارد. از تصاویر با وضوح مگاپیکسل پشتیبانی میکند و درک بصری قوی، OCR چندزبانه، مکانیابی بصری دقیق و گفتوگوی تصویری ارائه میدهد. وظایف پیچیده چندمدال را مدیریت کرده و از فراخوانی ابزار و تکمیل پیشوند پشتیبانی میکند.",
"Qwen/Qwen3-VL-32B-Thinking.description":"Qwen3-VL-32B-Thinking برای استدلال بصری پیچیده بهینهسازی شده است. این مدل دارای حالت تفکری داخلی است که مراحل استدلال میانی را قبل از پاسخ تولید میکند و منطق چندمرحلهای، برنامهریزی و استدلال پیچیده را تقویت میکند. از تصاویر مگاپیکسلی، درک بصری قوی، OCR چندزبانه، مکانیابی دقیق، گفتوگوی تصویری، فراخوانی ابزار و تکمیل پیشوند پشتیبانی میکند.",
"Qwen/Qwen3-VL-8B-Instruct.description":"Qwen3-VL-8B-Instruct یک مدل زبان-تصویر از سری Qwen3 است که بر پایه Qwen3-8B-Instruct ساخته شده و با دادههای بزرگ تصویر-متن آموزش دیده است. در درک بصری عمومی، گفتوگوی متمرکز بر تصویر و شناسایی متن چندزبانه در تصاویر عملکرد برجستهای دارد و برای پرسشوپاسخ بصری، کپشننویسی، پیروی از دستورالعمل چندمدال و استفاده از ابزار مناسب است.",
"Qwen/Qwen3-VL-8B-Thinking.description":"Qwen3-VL-8B-Thinking نسخه تفکری بصری Qwen3 است که برای استدلال پیچیده چندمرحلهای بهینهسازی شده است. این مدل زنجیره تفکر را قبل از پاسخ تولید میکند تا دقت را افزایش دهد و برای پرسشوپاسخ بصری عمیق و تحلیل دقیق تصویر ایدهآل است.",
"Qwen2-72B-Instruct.description":"Qwen2 جدیدترین مدل از سری Qwen است که از پنجره متنی ۱۲۸ هزار توکن پشتیبانی میکند. در مقایسه با بهترین مدلهای متنباز امروزی، Qwen2-72B درک زبان طبیعی، دانش، کدنویسی، ریاضیات و تواناییهای چندزبانه را بهطور چشمگیری بهبود میبخشد.",
"Qwen2-7B-Instruct.description":"Qwen2 جدیدترین مدل از سری Qwen است که از بهترین مدلهای متنباز همرده و حتی مدلهای بزرگتر پیشی میگیرد. Qwen2 7B در آزمونهای مختلف، بهویژه در زمینه کدنویسی و درک زبان چینی، برتری قابلتوجهی نشان میدهد.",
"Qwen2-VL-72B.description":"Qwen2-VL-72B یک مدل قدرتمند بینایی-زبان است که از پردازش چندوجهی تصویر-متن پشتیبانی میکند و میتواند محتوای تصویر را با دقت تشخیص داده و توصیفها یا پاسخهای مرتبط تولید کند.",
"Qwen2.5-14B-Instruct.description":"Qwen2.5-14B-Instruct یک مدل زبانی با ۱۴ میلیارد پارامتر است که عملکرد بالایی دارد و برای سناریوهای چینی و چندزبانه بهینهسازی شده است. این مدل از پرسشوپاسخ هوشمند و تولید محتوا پشتیبانی میکند.",
"Qwen2.5-32B-Instruct.description":"Qwen2.5-32B-Instruct یک مدل زبانی با ۳۲ میلیارد پارامتر است که عملکردی متعادل دارد و برای سناریوهای چینی و چندزبانه بهینهسازی شده است. این مدل از پرسشوپاسخ هوشمند و تولید محتوا پشتیبانی میکند.",
"Qwen2.5-72B-Instruct.description":"مدل زبانی برای زبانهای چینی و انگلیسی، تنظیمشده برای زبان، کدنویسی، ریاضیات و استدلال.",
"Qwen2.5-7B-Instruct.description":"Qwen2.5-7B-Instruct یک مدل زبانی با ۷ میلیارد پارامتر است که از فراخوانی توابع و یکپارچهسازی با سیستمهای خارجی پشتیبانی میکند و انعطافپذیری و قابلیت گسترش را بهطور چشمگیری افزایش میدهد. این مدل برای سناریوهای چینی و چندزبانه بهینهسازی شده و از پرسشوپاسخ هوشمند و تولید محتوا پشتیبانی میکند.",
"Qwen2.5-Coder-14B-Instruct.description":"Qwen2.5-Coder-14B-Instruct یک مدل بزرگ آموزشدیده برای دستورالعملهای کدنویسی است که در درک و تولید کد عملکرد بالایی دارد. این مدل بهطور مؤثر طیف گستردهای از وظایف برنامهنویسی را انجام میدهد و برای کدنویسی هوشمند، تولید خودکار اسکریپت و پرسشوپاسخ برنامهنویسی ایدهآل است.",
"Qwen2.5-Coder-32B-Instruct.description":"مدل پیشرفته زبانی برای تولید کد، استدلال و رفع اشکال در زبانهای برنامهنویسی اصلی.",
"Qwen3-235B-A22B-Instruct-2507-FP8.description":"Qwen3 235B A22B Instruct 2507 برای استدلال پیشرفته و پیروی از دستورالعملها بهینهسازی شده است و با استفاده از معماری MoE، استدلال را در مقیاس بالا بهصورت کارآمد انجام میدهد.",
"Qwen3-235B.description":"Qwen3-235B-A22B یک مدل MoE است که حالت استدلال ترکیبی را معرفی میکند و به کاربران اجازه میدهد بهصورت یکپارچه بین حالتهای تفکر و غیرتفکر جابجا شوند. این مدل از درک و استدلال در ۱۱۹ زبان و گویش پشتیبانی میکند و توانایی بالایی در فراخوانی ابزارها دارد. در آزمونهای توانایی عمومی، کدنویسی و ریاضی، قابلیت چندزبانه و استدلال دانشی با مدلهای پیشرو مانند DeepSeek R1، OpenAI o1، o3-mini، Grok 3 و Google Gemini 2.5 Pro رقابت میکند.",
"Qwen3-32B.description":"Qwen3-32B یک مدل متراکم است که حالت استدلال ترکیبی را معرفی میکند و به کاربران اجازه میدهد بین تفکر و غیرتفکر جابجا شوند. با بهبود معماری، دادههای بیشتر و آموزش بهتر، عملکردی همسطح با Qwen2.5-72B دارد.",
"SenseChat-128K.description":"نسخه پایه V4 با پنجره متنی ۱۲۸ هزار توکن، قوی در درک و تولید متون بلند.",
"SenseChat-32K.description":"نسخه پایه V4 با پنجره متنی ۳۲ هزار توکن، انعطافپذیر برای سناریوهای مختلف.",
"SenseChat-5-1202.description":"جدیدترین نسخه مبتنی بر V5.5 با پیشرفتهای چشمگیر در مبانی چینی/انگلیسی، گفتوگو، دانش علوم پایه، علوم انسانی، نگارش، ریاضی/منطق و کنترل طول متن.",
"SenseChat-5-Cantonese.description":"طراحیشده بر اساس عادات گفتاری، اصطلاحات عامیانه و دانش محلی هنگکنگ؛ در درک زبان کانتونی از GPT-4 پیشی میگیرد و در دانش، استدلال، ریاضی و کدنویسی با GPT-4 Turbo رقابت میکند.",
"SenseChat-5-beta.description":"در برخی عملکردها از SenseChat-5-1202 پیشی میگیرد.",
"SenseChat-5.description":"نسخه V5.5 با پنجره متنی ۱۲۸ هزار توکن؛ پیشرفتهای عمده در استدلال ریاضی، گفتوگوی انگلیسی، پیروی از دستورالعملها و درک متون بلند، قابل مقایسه با GPT-4o.",
"SenseChat-Character-Pro.description":"مدل پیشرفته گفتوگوی شخصیتی با پنجره متنی ۳۲ هزار توکن، قابلیتهای بهبود یافته و پشتیبانی از زبانهای چینی و انگلیسی.",
"SenseChat-Character.description":"مدل استاندارد گفتوگوی شخصیتی با پنجره متنی ۸ هزار توکن و سرعت پاسخدهی بالا.",
"SenseChat-Turbo-1202.description":"جدیدترین مدل سبکوزن که با هزینه استنتاج بسیار کمتر، به بیش از ۹۰٪ از توانایی مدل کامل دست مییابد.",
"SenseChat-Turbo.description":"مناسب برای سناریوهای پرسشوپاسخ سریع و تنظیم دقیق مدل.",
"SenseChat-Vision.description":"نسخه V5.5 با ورودی چندتصویری و بهبودهای گسترده در تشخیص ویژگیها، روابط فضایی، شناسایی رویداد/عمل، درک صحنه، تشخیص احساسات، استدلال عقل سلیم و درک/تولید متن.",
"SenseChat.description":"نسخه پایه V4 با پنجره متنی ۴ هزار توکن و توانایی عمومی قوی.",
"SenseNova-V6-5-Pro.description":"با بهروزرسانیهای جامع در دادههای چندوجهی، زبانی و استدلالی و بهینهسازی استراتژی آموزش، این مدل بهطور چشمگیری استدلال چندوجهی و پیروی از دستورالعملهای عمومی را بهبود میبخشد، از پنجره متنی تا ۱۲۸ هزار توکن پشتیبانی میکند و در وظایف OCR و شناسایی IP گردشگری فرهنگی عملکرد برجستهای دارد.",
"SenseNova-V6-5-Turbo.description":"با بهروزرسانیهای جامع در دادههای چندوجهی، زبانی و استدلالی و بهینهسازی استراتژی آموزش، این مدل بهطور چشمگیری استدلال چندوجهی و پیروی از دستورالعملهای عمومی را بهبود میبخشد، از پنجره متنی تا ۱۲۸ هزار توکن پشتیبانی میکند و در وظایف OCR و شناسایی IP گردشگری فرهنگی عملکرد برجستهای دارد.",
"SenseNova-V6-Pro.description":"بهصورت بومی تصویر، متن و ویدیو را یکپارچه میکند و مرزهای سنتی چندوجهی را میشکند؛ در OpenCompass و SuperCLUE رتبههای برتر را کسب کرده است.",
"SenseNova-V6-Reasoner.description":"ترکیبی از استدلال عمیق بینایی و زبان، پشتیبانی از تفکر آهسته و زنجیره کامل تفکر.",
"SenseNova-V6-Turbo.description":"بهصورت بومی تصویر، متن و ویدیو را یکپارچه میکند و مرزهای سنتی چندوجهی را میشکند. در قابلیتهای اصلی چندوجهی و زبانی پیشتاز است و در ارزیابیهای متعدد در رده برتر قرار دارد.",
"Skylark2-lite-8k.description":"مدل نسل دوم Skylark. نسخه Skylark2-lite پاسخهای سریعی برای سناریوهای بلادرنگ و حساس به هزینه با نیازهای دقت پایینتر ارائه میدهد و از پنجره متنی ۸ هزار توکن پشتیبانی میکند.",
"Skylark2-pro-32k.description":"مدل نسل دوم Skylark. نسخه Skylark2-pro دقت بالاتری برای تولید متون پیچیده مانند نگارش حرفهای، رماننویسی و ترجمه با کیفیت بالا ارائه میدهد و از پنجره متنی ۳۲ هزار توکن پشتیبانی میکند.",
"Skylark2-pro-4k.description":"مدل نسل دوم Skylark. نسخه Skylark2-pro دقت بالاتری برای تولید متون پیچیده مانند نگارش حرفهای، رماننویسی و ترجمه با کیفیت بالا ارائه میدهد و از پنجره متنی ۴ هزار توکن پشتیبانی میکند.",
"Skylark2-pro-character-4k.description":"مدل نسل دوم Skylark. نسخه Skylark2-pro-character در ایفای نقش و گفتوگو عملکرد برجستهای دارد و سبکهای شخصیتی متمایز و گفتوگوی طبیعی را برای چتباتها، دستیارهای مجازی و خدمات مشتری ارائه میدهد، با پاسخدهی سریع.",
"Skylark2-pro-turbo-8k.description":"مدل نسل دوم Skylark. نسخه Skylark2-pro-turbo-8k استنتاج سریعتری با هزینه کمتر ارائه میدهد و از پنجره متنی ۸ هزار توکن پشتیبانی میکند.",
"THUDM/GLM-4-32B-0414.description":"GLM-4-32B-0414 یک مدل نسل جدید GLM با ۳۲ میلیارد پارامتر است که از نظر عملکرد با مدلهای OpenAI GPT و سری DeepSeek V3/R1 قابل مقایسه است.",
"THUDM/GLM-4-9B-0414.description":"GLM-4-9B-0414 یک مدل ۹ میلیاردی GLM است که تکنیکهای GLM-4-32B را به ارث برده و در عین حال استقرار سبکتری را ارائه میدهد. این مدل در تولید کد، طراحی وب، تولید SVG و نگارش مبتنی بر جستجو عملکرد خوبی دارد.",
"THUDM/GLM-4.1V-9B-Thinking.description":"GLM-4.1V-9B-Thinking یک مدل VLM متنباز از Zhipu AI و آزمایشگاه KEG دانشگاه Tsinghua است که برای درک پیچیده چندرسانهای طراحی شده است. این مدل بر پایه GLM-4-9B-0414 ساخته شده و با افزودن زنجیره تفکر و یادگیری تقویتی، توانایی استدلال میانوجهی و پایداری را بهطور قابل توجهی بهبود میبخشد.",
"THUDM/GLM-Z1-32B-0414.description":"GLM-Z1-32B-0414 یک مدل استدلال عمیق است که بر پایه GLM-4-32B-0414 با دادههای شروع سرد و یادگیری تقویتی گسترده ساخته شده و آموزش بیشتری در زمینه ریاضی، کدنویسی و منطق دیده است. این مدل توانایی حل مسائل پیچیده و ریاضی را نسبت به مدل پایه بهطور چشمگیری افزایش میدهد.",
"THUDM/GLM-Z1-9B-0414.description":"GLM-Z1-9B-0414 یک مدل GLM کوچک با ۹ میلیارد پارامتر است که در عین حفظ مزایای متنباز، عملکرد چشمگیری ارائه میدهد. این مدل در استدلال ریاضی و وظایف عمومی بسیار قوی عمل کرده و در میان مدلهای همرده خود پیشتاز است.",
"THUDM/GLM-Z1-Rumination-32B-0414.description":"GLM-Z1-Rumination-32B-0414 یک مدل استدلال عمیق با قابلیت تفکر تأملی است (با مدلهای تحقیق عمیق OpenAI مقایسه شده است). برخلاف مدلهای معمول تفکر عمیق، این مدل زمان بیشتری را صرف تأمل میکند تا مسائل باز و پیچیدهتری را حل کند.",
"THUDM/glm-4-9b-chat.description":"GLM-4-9B-Chat مدل متنباز GLM-4 از Zhipu AI است. این مدل در زمینههای معناشناسی، ریاضی، استدلال، کدنویسی و دانش عملکرد قوی دارد. علاوه بر گفتوگوی چندمرحلهای، از مرور وب، اجرای کد، فراخوانی ابزارهای سفارشی و استدلال متون بلند پشتیبانی میکند. این مدل از ۲۶ زبان (از جمله چینی، انگلیسی، ژاپنی، کرهای و آلمانی) پشتیبانی میکند و در آزمونهایی مانند AlignBench-v2، MT-Bench، MMLU و C-Eval عملکرد خوبی دارد. همچنین تا ۱۲۸ هزار توکن زمینه را برای کاربردهای علمی و تجاری پشتیبانی میکند.",
"Tongyi-Zhiwen/QwenLong-L1-32B.description":"QwenLong-L1-32B نخستین مدل استدلال با زمینه بلند (LRM) است که با یادگیری تقویتی آموزش دیده و برای استدلال متون بلند بهینهسازی شده است. یادگیری تقویتی با گسترش تدریجی زمینه، انتقال پایدار از زمینههای کوتاه به بلند را ممکن میسازد. این مدل در هفت معیار پرسشوپاسخ اسناد بلند از مدلهایی مانند OpenAI-o3-mini و Qwen3-235B-A22B پیشی گرفته و با Claude-3.7-Sonnet-Thinking رقابت میکند. در زمینه ریاضی، منطق و استدلال چندمرحلهای بسیار قوی عمل میکند.",
"Yi-34B-Chat.description":"Yi-1.5-34B ضمن حفظ تواناییهای زبانی قوی سری Yi، با آموزش افزایشی بر روی ۵۰۰ میلیارد توکن با کیفیت، تواناییهای منطق ریاضی و کدنویسی را بهطور قابل توجهی بهبود داده است.",
"abab5.5-chat.description":"برای سناریوهای بهرهوری طراحی شده است و توانایی انجام وظایف پیچیده و تولید متن کارآمد برای استفاده حرفهای را دارد.",
"abab5.5s-chat.description":"برای گفتوگوی شخصیتمحور به زبان چینی طراحی شده و گفتوگوی با کیفیت بالا به زبان چینی را در کاربردهای مختلف ارائه میدهد.",
"abab6.5g-chat.description":"برای گفتوگوی شخصیتمحور چندزبانه طراحی شده و تولید گفتوگوی با کیفیت به زبان انگلیسی و سایر زبانها را پشتیبانی میکند.",
"abab6.5s-chat.description":"برای طیف گستردهای از وظایف پردازش زبان طبیعی مناسب است، از جمله تولید متن و سیستمهای گفتوگو.",
"abab6.5t-chat.description":"برای گفتوگوی شخصیتمحور به زبان چینی بهینهسازی شده و گفتوگویی روان و منطبق با عادات بیانی زبان چینی ارائه میدهد.",
"accounts/fireworks/models/deepseek-r1.description":"DeepSeek-R1 یک مدل زبان بزرگ پیشرفته است که با یادگیری تقویتی و دادههای شروع سرد بهینهسازی شده و عملکرد عالی در استدلال، ریاضی و کدنویسی دارد.",
"accounts/fireworks/models/deepseek-v3.description":"مدلی قدرتمند از نوع Mixture-of-Experts (MoE) از DeepSeek با ۶۷۱ میلیارد پارامتر کل و ۳۷ میلیارد پارامتر فعال در هر توکن.",
"accounts/fireworks/models/llama-v3-70b-instruct.description":"Meta سری مدلهای Meta Llama 3 را توسعه داده و منتشر کرده است که شامل مدلهای تولید متن پیشآموزشدیده و تنظیمشده برای دستورالعمل در اندازههای ۸B و ۷۰B میباشد. مدلهای تنظیمشده برای دستورالعمل Llama 3 برای استفاده در گفتوگو بهینهسازی شدهاند و در بسیاری از معیارهای صنعتی از مدلهای متنباز موجود پیشی میگیرند.",
"accounts/fireworks/models/llama-v3-8b-instruct-hf.description":"مدلهای تنظیمشده برای دستورالعمل Meta Llama 3 برای استفاده در گفتوگو بهینهسازی شدهاند و در بسیاری از معیارهای صنعتی از مدلهای متنباز موجود پیشی میگیرند. Llama 3 8B Instruct (نسخه HF) نسخه اصلی FP16 از Llama 3 8B Instruct است و نتایج آن با پیادهسازی رسمی Hugging Face مطابقت دارد.",
"accounts/fireworks/models/llama-v3-8b-instruct.description":"Meta سری مدلهای Meta Llama 3 را توسعه داده و منتشر کرده است که شامل مدلهای تولید متن پیشآموزشدیده و تنظیمشده برای دستورالعمل در اندازههای ۸B و ۷۰B میباشد. مدلهای تنظیمشده برای دستورالعمل Llama 3 برای استفاده در گفتوگو بهینهسازی شدهاند و در بسیاری از معیارهای صنعتی از مدلهای متنباز موجود پیشی میگیرند.",
"accounts/fireworks/models/llama-v3p1-405b-instruct.description":"Meta Llama 3.1 یک خانواده چندزبانه از مدلهای زبان بزرگ است که شامل مدلهای تولید متن پیشآموزشدیده و تنظیمشده برای دستورالعمل در اندازههای ۸B، ۷۰B و ۴۰۵B میباشد. مدلهای تنظیمشده برای دستورالعمل برای گفتوگوی چندزبانه بهینهسازی شدهاند و در بسیاری از معیارهای صنعتی از مدلهای متنباز و بسته پیشی میگیرند. مدل ۴۰۵B قدرتمندترین مدل در خانواده Llama 3.1 است و از استنتاج FP8 استفاده میکند که با پیادهسازی مرجع مطابقت دارد.",
"accounts/fireworks/models/llama-v3p1-70b-instruct.description":"Meta Llama 3.1 یک خانواده چندزبانه از مدلهای زبان بزرگ است که شامل مدلهای تولید متن پیشآموزشدیده و تنظیمشده برای دستورالعمل در اندازههای ۸B، ۷۰B و ۴۰۵B میباشد. مدلهای تنظیمشده برای دستورالعمل برای گفتوگوی چندزبانه بهینهسازی شدهاند و در بسیاری از معیارهای صنعتی از مدلهای متنباز و بسته پیشی میگیرند.",
"accounts/fireworks/models/llama-v3p1-8b-instruct.description":"Meta Llama 3.1 یک خانواده چندزبانه از مدلهای زبان بزرگ است که شامل مدلهای تولید متن پیشآموزشدیده و تنظیمشده برای دستورالعمل در اندازههای ۸B، ۷۰B و ۴۰۵B میباشد. مدلهای تنظیمشده برای دستورالعمل برای گفتوگوی چندزبانه بهینهسازی شدهاند و در بسیاری از معیارهای صنعتی از مدلهای متنباز و بسته پیشی میگیرند.",
"accounts/fireworks/models/llama-v3p2-11b-vision-instruct.description":"مدل استدلال تصویری تنظیمشده برای دستورالعمل از Meta با ۱۱ میلیارد پارامتر، بهینهسازیشده برای شناسایی بصری، استدلال تصویری، تولید کپشن و پرسشوپاسخ مرتبط با تصویر. این مدل دادههای بصری مانند نمودارها و گرافها را درک میکند و با تولید توصیفهای متنی از جزئیات تصویر، بینایی و زبان را به هم پیوند میدهد.",
"accounts/fireworks/models/llama-v3p2-3b-instruct.description":"Llama 3.2 3B Instruct یک مدل چندزبانه سبک از Meta است که برای زمان اجرای کارآمد طراحی شده و نسبت به مدلهای بزرگتر تأخیر و هزینه کمتری دارد. موارد استفاده معمول شامل بازنویسی پرسوجو/پرامپت و کمک به نگارش است.",
"accounts/fireworks/models/llama-v3p2-90b-vision-instruct.description":"مدل استدلال تصویری تنظیمشده برای دستورالعمل از Meta با ۹۰ میلیارد پارامتر، بهینهسازیشده برای شناسایی بصری، استدلال تصویری، تولید کپشن و پرسشوپاسخ مرتبط با تصویر. این مدل دادههای بصری مانند نمودارها و گرافها را درک میکند و با تولید توصیفهای متنی از جزئیات تصویر، بینایی و زبان را به هم پیوند میدهد. توجه: این مدل در حال حاضر بهصورت آزمایشی بهعنوان مدل بدون سرور ارائه میشود. برای استفاده در تولید، توجه داشته باشید که Fireworks ممکن است استقرار آن را بهزودی متوقف کند.",
"accounts/fireworks/models/llama-v3p3-70b-instruct.description":"Llama 3.3 70B Instruct بهروزرسانی دسامبر برای Llama 3.1 70B است. این مدل استفاده از ابزار، پشتیبانی از متن چندزبانه، ریاضی و کدنویسی را نسبت به نسخه جولای ۲۰۲۴ بهبود میبخشد. عملکردی در سطح پیشرو در صنعت در استدلال، ریاضی و پیروی از دستورالعمل ارائه میدهد و عملکردی قابل مقایسه با 3.1 405B با مزایای قابل توجه در سرعت و هزینه دارد.",
"accounts/fireworks/models/mistral-small-24b-instruct-2501.description":"مدلی با ۲۴ میلیارد پارامتر و توانایی پیشرفته که با مدلهای بزرگتر قابل مقایسه است.",
"accounts/fireworks/models/mixtral-8x22b-instruct.description":"Mixtral MoE 8x22B Instruct v0.1 نسخه تنظیمشده برای دستورالعمل از Mixtral MoE 8x22B v0.1 است که API تکمیل گفتوگو در آن فعال شده است.",
"accounts/fireworks/models/mixtral-8x7b-instruct.description":"Mixtral MoE 8x7B Instruct نسخه تنظیمشده برای دستورالعمل از Mixtral MoE 8x7B است که API تکمیل گفتوگو در آن فعال شده است.",
"accounts/fireworks/models/mythomax-l2-13b.description":"نسخه بهبودیافتهای از MythoMix که احتمالاً شکل پالایششدهتری از آن است و با ترکیب MythoLogic-L2 و Huginn با تکنیک ادغام تنسور بسیار تجربی ساخته شده است. ماهیت منحصربهفرد آن را برای داستانسرایی و ایفای نقش عالی میسازد.",
"accounts/fireworks/models/phi-3-vision-128k-instruct.description":"Phi-3-Vision-128K-Instruct یک مدل چندرسانهای سبک و پیشرفته است که از دادههای مصنوعی و مجموعه دادههای عمومی وب انتخابشده ساخته شده و بر دادههای متنی و تصویری با کیفیت بالا و نیازمند استدلال تمرکز دارد. این مدل متعلق به خانواده Phi-3 است و نسخه چندرسانهای آن از طول زمینه ۱۲۸ هزار توکن پشتیبانی میکند. این مدل تحت بهبودهای دقیق از جمله تنظیم نظارتشده و بهینهسازی مستقیم ترجیح قرار گرفته تا پیروی دقیق از دستورالعمل و اقدامات ایمنی قوی را تضمین کند.",
"accounts/fireworks/models/qwen-qwq-32b-preview.description":"مدل Qwen QwQ بر پیشرفت در استدلال هوش مصنوعی تمرکز دارد و نشان میدهد که مدلهای باز میتوانند در استدلال با مدلهای پیشرفته بسته رقابت کنند. QwQ-32B-Preview یک نسخه آزمایشی است که با o1 برابری میکند و در استدلال و تحلیل در آزمونهای GPQA، AIME، MATH-500 و LiveCodeBench از GPT-4o و Claude 3.5 Sonnet پیشی میگیرد. توجه: این مدل در حال حاضر بهصورت آزمایشی و بدون سرور ارائه میشود. برای استفاده در محیط تولید، توجه داشته باشید که Fireworks ممکن است این استقرار را بدون اطلاع قبلی متوقف کند.",
"accounts/fireworks/models/qwen2-vl-72b-instruct.description":"مدل ۷۲B Qwen-VL جدیدترین نسخه از سوی علیبابا است که حاصل نزدیک به یک سال نوآوری میباشد.",
"accounts/fireworks/models/qwen2p5-72b-instruct.description":"Qwen2.5 یک سری مدل زبانی بزرگ فقط رمزگشا است که توسط تیم Qwen و علیبابا کلاد توسعه یافته و در اندازههای 0.5B، 1.5B، 3B، 7B، 14B، 32B و 72B با نسخههای پایه و تنظیمشده برای دستورالعملها ارائه میشود.",
"accounts/fireworks/models/qwen2p5-coder-32b-instruct.description":"Qwen2.5-Coder جدیدترین مدل زبانی بزرگ Qwen برای برنامهنویسی است (قبلاً با نام CodeQwen شناخته میشد). توجه: این مدل در حال حاضر بهصورت آزمایشی و بدون سرور ارائه میشود. برای استفاده در محیط تولید، توجه داشته باشید که Fireworks ممکن است این استقرار را بدون اطلاع قبلی متوقف کند.",
"accounts/yi-01-ai/models/yi-large.description":"Yi-Large یک مدل زبانی سطح بالا است که در رتبهبندی LMSYS درست پس از GPT-4، Gemini 1.5 Pro و Claude 3 Opus قرار دارد. این مدل در پشتیبانی از زبانهای چندگانه، بهویژه اسپانیایی، چینی، ژاپنی، آلمانی و فرانسوی، عملکرد برجستهای دارد. Yi-Large همچنین برای توسعهدهندگان مناسب است و از همان ساختار API مشابه OpenAI برای یکپارچهسازی آسان استفاده میکند.",
"ai21-jamba-1.5-large.description":"مدلی چندزبانه با ۳۹۸ میلیارد پارامتر (۹۴ میلیارد فعال) با پنجره متنی ۲۵۶ هزار توکن، قابلیت فراخوانی توابع، خروجی ساختاریافته و تولید مبتنی بر دادههای واقعی.",
"ai21-jamba-1.5-mini.description":"مدلی چندزبانه با ۵۲ میلیارد پارامتر (۱۲ میلیارد فعال) با پنجره متنی ۲۵۶ هزار توکن، قابلیت فراخوانی توابع، خروجی ساختاریافته و تولید مبتنی بر دادههای واقعی.",
"ai21-labs/AI21-Jamba-1.5-Large.description":"مدلی چندزبانه با ۳۹۸ میلیارد پارامتر (۹۴ میلیارد فعال) با پنجره متنی ۲۵۶ هزار توکن، قابلیت فراخوانی توابع، خروجی ساختاریافته و تولید مبتنی بر دادههای واقعی.",
"ai21-labs/AI21-Jamba-1.5-Mini.description":"مدلی چندزبانه با ۵۲ میلیارد پارامتر (۱۲ میلیارد فعال) با پنجره متنی ۲۵۶ هزار توکن، قابلیت فراخوانی توابع، خروجی ساختاریافته و تولید مبتنی بر دادههای واقعی.",
"alibaba/qwen-3-14b.description":"Qwen3 جدیدترین نسل از سری Qwen است که مجموعهای جامع از مدلهای متراکم و MoE را ارائه میدهد. این مدل بر پایه آموزش گسترده ساخته شده و در زمینههای استدلال، پیروی از دستورالعملها، قابلیتهای عاملمحور و پشتیبانی چندزبانه پیشرفتهای چشمگیری دارد.",
"alibaba/qwen-3-235b.description":"Qwen3 جدیدترین نسل از سری Qwen است که مجموعهای جامع از مدلهای متراکم و MoE را ارائه میدهد. این مدل بر پایه آموزش گسترده ساخته شده و در زمینههای استدلال، پیروی از دستورالعملها، قابلیتهای عاملمحور و پشتیبانی چندزبانه پیشرفتهای چشمگیری دارد.",
"alibaba/qwen-3-30b.description":"Qwen3 جدیدترین نسل از سری Qwen است که مجموعهای جامع از مدلهای متراکم و MoE را ارائه میدهد. این مدل بر پایه آموزش گسترده ساخته شده و در زمینههای استدلال، پیروی از دستورالعملها، قابلیتهای عاملمحور و پشتیبانی چندزبانه پیشرفتهای چشمگیری دارد.",
"alibaba/qwen-3-32b.description":"Qwen3 جدیدترین نسل از سری Qwen است که مجموعهای جامع از مدلهای متراکم و MoE را ارائه میدهد. این مدل بر پایه آموزش گسترده ساخته شده و در زمینههای استدلال، پیروی از دستورالعملها، قابلیتهای عاملمحور و پشتیبانی چندزبانه پیشرفتهای چشمگیری دارد.",
"alibaba/qwen3-coder.description":"Qwen3-Coder-480B-A35B-Instruct پیشرفتهترین مدل برنامهنویسی Qwen است که در وظایف کدنویسی عاملمحور، استفاده از مرورگر توسط عامل و سایر وظایف اصلی برنامهنویسی عملکردی قوی دارد و نتایجی در سطح Claude Sonnet ارائه میدهد.",
"amazon/nova-lite.description":"مدلی چندوجهی با هزینه بسیار پایین که ورودیهای تصویر، ویدیو و متن را با سرعت بسیار بالا پردازش میکند.",
"amazon/nova-micro.description":"مدلی فقط متنی با تأخیر بسیار پایین و هزینه بسیار کم.",
"amazon/nova-pro.description":"مدلی چندوجهی با قابلیت بالا که بهترین تعادل بین دقت، سرعت و هزینه را برای طیف گستردهای از وظایف ارائه میدهد.",
"amazon/titan-embed-text-v2.description":"Amazon Titan Text Embeddings V2 یک مدل جاسازی چندزبانه سبک و کارآمد است که از ابعاد ۱۰۲۴، ۵۱۲ و ۲۵۶ پشتیبانی میکند.",
"anthropic.claude-3-5-sonnet-20240620-v1:0.description":"Claude 3.5 Sonnet استاندارد صنعت را ارتقا داده و در ارزیابیهای گسترده از رقبا و Claude 3 Opus پیشی میگیرد، در حالی که سرعت و هزینه متوسط را حفظ میکند.",
"anthropic.claude-3-5-sonnet-20241022-v2:0.description":"Claude 3.5 Sonnet استاندارد صنعت را ارتقا داده و در ارزیابیهای گسترده از رقبا و Claude 3 Opus پیشی میگیرد، در حالی که سرعت و هزینه متوسط را حفظ میکند.",
"anthropic.claude-3-haiku-20240307-v1:0.description":"Claude 3 Haiku سریعترین و فشردهترین مدل Anthropic است که پاسخهای تقریباً فوری برای پرسشهای ساده ارائه میدهد. این مدل تجربهای روان و شبیه انسان را فراهم کرده و از ورودی تصویری با پنجره متنی ۲۰۰ هزار توکن پشتیبانی میکند.",
"anthropic.claude-3-opus-20240229-v1:0.description":"Claude 3 Opus قدرتمندترین مدل هوش مصنوعی Anthropic است که در وظایف بسیار پیچیده عملکردی در سطح پیشرفته دارد. این مدل درخواستهای باز و سناریوهای جدید را با روانی و درک انسانی استثنایی مدیریت میکند و از ورودی تصویری با پنجره متنی ۲۰۰ هزار توکن پشتیبانی میکند.",
"anthropic.claude-3-sonnet-20240229-v1:0.description":"Claude 3 Sonnet تعادلی بین هوش و سرعت برای بارهای کاری سازمانی فراهم میکند و ارزش بالایی را با هزینه کمتر ارائه میدهد. این مدل برای استقرار گسترده هوش مصنوعی طراحی شده و از ورودی تصویری با پنجره متنی ۲۰۰ هزار توکن پشتیبانی میکند.",
"anthropic.claude-instant-v1.description":"مدلی سریع، اقتصادی و در عین حال توانمند برای چت روزمره، تحلیل متن، خلاصهسازی و پرسش و پاسخ اسناد.",
"anthropic.claude-v2.description":"مدلی بسیار توانمند برای وظایف مختلف از گفتوگوی پیچیده و تولید خلاقانه تا پیروی دقیق از دستورالعملها.",
"anthropic.claude-v2:1.description":"نسخه بهروزشده Claude 2 با دو برابر پنجره متنی و بهبود در قابلیت اطمینان، کاهش توهمات و دقت مبتنی بر شواهد برای اسناد طولانی و بازیابی اطلاعات.",
"anthropic/claude-3-haiku.description":"Claude 3 Haiku سریعترین مدل Anthropic است که برای بارهای کاری سازمانی با درخواستهای طولانی طراحی شده است. این مدل میتواند اسناد بزرگ مانند گزارشهای فصلی، قراردادها یا پروندههای حقوقی را با نیمی از هزینه رقبا تحلیل کند.",
"anthropic/claude-3-opus.description":"Claude 3 Opus هوشمندترین مدل Anthropic است که در وظایف بسیار پیچیده عملکردی در سطح بازار دارد و درخواستهای باز و سناریوهای جدید را با روانی و درک انسانی استثنایی مدیریت میکند.",
"anthropic/claude-3.5-haiku.description":"Claude 3.5 Haiku دارای سرعت بیشتر، دقت بالاتر در کدنویسی و استفاده از ابزارها است و برای سناریوهایی با نیازهای بالا به سرعت و تعامل با ابزارها مناسب است.",
"anthropic/claude-3.5-sonnet.description":"Claude 3.5 Sonnet مدل سریع و کارآمد خانواده Sonnet است که عملکرد بهتری در کدنویسی و استدلال ارائه میدهد و برخی نسخههای آن به تدریج با Sonnet 3.7 و نسخههای بعدی جایگزین میشوند.",
"anthropic/claude-3.7-sonnet.description":"Claude 3.7 Sonnet نسخه ارتقایافته مدل Sonnet با استدلال و کدنویسی قویتر است که برای وظایف پیچیده در سطح سازمانی مناسب میباشد.",
"anthropic/claude-haiku-4.5.description":"Claude Haiku 4.5 مدل سریع با عملکرد بالا از Anthropic است که تأخیر بسیار کم را در کنار دقت بالا ارائه میدهد.",
"anthropic/claude-opus-4.1.description":"Opus 4.1 مدل سطح بالای Anthropic است که برای برنامهنویسی، استدلال پیچیده و وظایف طولانی بهینهسازی شده است.",
"anthropic/claude-opus-4.5.description":"Claude Opus 4.5 مدل پرچمدار Anthropic است که هوش سطح بالا را با عملکرد مقیاسپذیر برای وظایف پیچیده و استدلال با کیفیت بالا ترکیب میکند.",
"anthropic/claude-opus-4.description":"Opus 4 مدل پرچمدار Anthropic است که برای وظایف پیچیده و کاربردهای سازمانی طراحی شده است.",
"anthropic/claude-sonnet-4.5.description":"Claude Sonnet 4.5 جدیدترین مدل استدلال ترکیبی Anthropic است که برای استدلال پیچیده و کدنویسی بهینهسازی شده است.",
"anthropic/claude-sonnet-4.description":"Claude Sonnet 4 مدل استدلال ترکیبی Anthropic است که قابلیت تفکر و عدم تفکر را با هم ترکیب میکند.",
"ascend-tribe/pangu-pro-moe.description":"Pangu-Pro-MoE 72B-A16B یک مدل زبانی پراکنده با ۷۲ میلیارد پارامتر کل و ۱۶ میلیارد پارامتر فعال است که بر پایه معماری MoE گروهبندیشده (MoGE) ساخته شده است. این مدل با گروهبندی متخصصان در زمان انتخاب و محدود کردن فعالسازی توکنها به تعداد مساوی متخصص در هر گروه، تعادل بار را حفظ کرده و بهرهوری استقرار را در پلتفرم Ascend بهبود میبخشد.",
"aya.description":"Aya 23 مدل چندزبانه شرکت Cohere است که از ۲۳ زبان برای کاربردهای متنوع پشتیبانی میکند.",
"aya:35b.description":"Aya 23 مدل چندزبانه شرکت Cohere است که از ۲۳ زبان برای کاربردهای متنوع پشتیبانی میکند.",
"azure-DeepSeek-R1-0528.description":"این مدل توسط مایکروسافت استقرار یافته است؛ DeepSeek R1 به نسخه DeepSeek-R1-0528 ارتقا یافته است. این بهروزرسانی با افزایش توان محاسباتی و بهینهسازی الگوریتمهای پسآموزش، عمق استدلال و استنتاج را بهطور چشمگیری بهبود میبخشد. عملکرد آن در آزمونهای ریاضی، برنامهنویسی و منطق عمومی بسیار قوی است و به مدلهای پیشرو مانند O3 و Gemini 2.5 Pro نزدیک میشود.",
"baichuan-m2-32b.description":"Baichuan M2 32B یک مدل MoE از شرکت Baichuan Intelligence است که در استدلال عملکرد قدرتمندی دارد.",
"baichuan/baichuan2-13b-chat.description":"Baichuan-13B یک مدل زبانی منبعباز با ۱۳ میلیارد پارامتر است که برای استفاده تجاری نیز مجاز است. این مدل در آزمونهای معتبر چینی و انگلیسی، بهترین نتایج را در میان مدلهای همرده خود کسب کرده است.",
"baidu/ERNIE-4.5-300B-A47B.description":"ERNIE-4.5-300B-A47B یک مدل MoE از شرکت Baidu با ۳۰۰ میلیارد پارامتر کل و ۴۷ میلیارد پارامتر فعال به ازای هر توکن است که تعادل بین عملکرد قوی و بهرهوری محاسباتی را برقرار میکند. این مدل بهعنوان هسته اصلی ERNIE 4.5 در درک، تولید، استدلال و برنامهنویسی بسیار توانمند است. با استفاده از روش پیشآموزش چندوجهی ناهمگن MoE و آموزش مشترک متن-تصویر، توانایی کلی خود را بهویژه در پیروی از دستورالعملها و دانش عمومی افزایش داده است.",
"baidu/ernie-5.0-thinking-preview.description":"پیشنمایش مدل ERNIE 5.0 Thinking نسل بعدی مدل چندوجهی بومی شرکت Baidu است که در درک چندوجهی، پیروی از دستورالعملها، تولید محتوا، پرسش و پاسخ واقعی و استفاده از ابزارها عملکرد بسیار خوبی دارد.",
"black-forest-labs/flux-1.1-pro.description":"FLUX 1.1 Pro نسخه سریعتر و بهبودیافته FLUX Pro است که کیفیت تصویر عالی و تبعیت دقیق از دستورات را ارائه میدهد.",
"black-forest-labs/flux-dev.description":"FLUX Dev نسخه توسعهای مدل FLUX برای استفاده غیرتجاری است.",
"black-forest-labs/flux-pro.description":"FLUX Pro مدل حرفهای FLUX برای تولید تصاویر با کیفیت بالا است.",
"black-forest-labs/flux-schnell.description":"FLUX Schnell یک مدل تولید تصویر سریع است که برای سرعت بهینهسازی شده است.",
"c4ai-aya-expanse-32b.description":"Aya Expanse یک مدل چندزبانه قدرتمند با ۳۲ میلیارد پارامتر است که با استفاده از تنظیمات دستوری، انتخاب داده، آموزش ترجیحی و ادغام مدلها، عملکردی در حد مدلهای تکزبانه ارائه میدهد. این مدل از ۲۳ زبان پشتیبانی میکند.",
"c4ai-aya-expanse-8b.description":"Aya Expanse یک مدل چندزبانه قدرتمند با ۸ میلیارد پارامتر است که با استفاده از تنظیمات دستوری، انتخاب داده، آموزش ترجیحی و ادغام مدلها، عملکردی در حد مدلهای تکزبانه ارائه میدهد. این مدل از ۲۳ زبان پشتیبانی میکند.",
"c4ai-aya-vision-32b.description":"Aya Vision یک مدل چندوجهی پیشرفته است که در آزمونهای کلیدی زبان، متن و تصویر عملکرد بسیار خوبی دارد. این نسخه ۳۲ میلیاردی بر عملکرد چندزبانه سطح بالا تمرکز دارد و از ۲۳ زبان پشتیبانی میکند.",
"c4ai-aya-vision-8b.description":"Aya Vision یک مدل چندوجهی پیشرفته است که در آزمونهای کلیدی زبان، متن و تصویر عملکرد بسیار خوبی دارد. این نسخه ۸ میلیاردی بر تأخیر کم و عملکرد قوی تمرکز دارد.",
"charglm-3.description":"CharGLM-3 برای نقشآفرینی و همراهی احساسی طراحی شده است و از حافظه چندنوبتی بسیار طولانی و گفتوگوی شخصیسازیشده پشتیبانی میکند.",
"charglm-4.description":"CharGLM-4 برای نقشآفرینی و همراهی احساسی طراحی شده است و از حافظه چندنوبتی بسیار طولانی و گفتوگوی شخصیسازیشده پشتیبانی میکند.",
"chatgpt-4o-latest.description":"ChatGPT-4o یک مدل پویا است که بهصورت بلادرنگ بهروزرسانی میشود و درک و تولید قوی را برای کاربردهای وسیع مانند پشتیبانی مشتری، آموزش و پشتیبانی فنی ترکیب میکند.",
"claude-2.0.description":"Claude 2 بهبودهای کلیدی برای سازمانها ارائه میدهد، از جمله زمینه ۲۰۰ هزار توکنی پیشرو، کاهش توهمات، دستورات سیستمی و ویژگی آزمایشی جدید: فراخوانی ابزار.",
"claude-2.1.description":"Claude 2 بهبودهای کلیدی برای سازمانها ارائه میدهد، از جمله زمینه ۲۰۰ هزار توکنی پیشرو، کاهش توهمات، دستورات سیستمی و ویژگی آزمایشی جدید: فراخوانی ابزار.",
"claude-3-5-haiku-20241022.description":"Claude 3.5 Haiku سریعترین مدل نسل جدید Anthropic است. در مقایسه با Claude 3 Haiku، در مهارتها بهبود یافته و در بسیاری از معیارهای هوش از مدل بزرگتر قبلی، Claude 3 Opus، پیشی میگیرد.",
"claude-3-7-sonnet-20250219.description":"Claude 3.7 Sonnet هوشمندترین مدل Anthropic و نخستین مدل استدلال ترکیبی در بازار است. این مدل میتواند پاسخهای تقریباً فوری یا استدلال گامبهگام و قابل مشاهده تولید کند. Sonnet بهویژه در برنامهنویسی، علم داده، بینایی رایانهای و وظایف عاملها بسیار قدرتمند است.",
"claude-3-7-sonnet-latest.description":"Claude 3.7 Sonnet جدیدترین و توانمندترین مدل Anthropic برای وظایف بسیار پیچیده است که در عملکرد، هوش، روانی و درک زبان برتری دارد.",
"claude-3-haiku-20240307.description":"Claude 3 Haiku سریعترین و فشردهترین مدل Anthropic است که برای پاسخهای تقریباً فوری با عملکرد سریع و دقیق طراحی شده است.",
"claude-3-opus-20240229.description":"Claude 3 Opus قدرتمندترین مدل Anthropic برای وظایف بسیار پیچیده است که در عملکرد، هوش، روانی و درک زبان برتری دارد.",
"claude-3-sonnet-20240229.description":"Claude 3 Sonnet تعادل بین هوش و سرعت را برای بارهای کاری سازمانی برقرار میکند و با هزینه کمتر، بهرهوری بالا و استقرار قابل اعتماد در مقیاس وسیع را ارائه میدهد.",
"claude-haiku-4-5-20251001.description":"Claude Haiku 4.5 سریعترین و هوشمندترین مدل Haiku از Anthropic است که با سرعتی برقآسا و توانایی استدلال پیشرفته ارائه میشود.",
"claude-opus-4-1-20250805-thinking.description":"Claude Opus 4.1 Thinking یک نسخه پیشرفته است که میتواند فرآیند استدلال خود را آشکار کند.",
"claude-opus-4-1-20250805.description":"Claude Opus 4.1 جدیدترین و توانمندترین مدل Anthropic برای وظایف بسیار پیچیده است که در عملکرد، هوش، روانی و درک زبان برتری دارد.",
"claude-opus-4-20250514.description":"Claude Opus 4 قدرتمندترین مدل Anthropic برای وظایف بسیار پیچیده است و در عملکرد، هوش، روانی و درک مطلب برتری دارد.",
"claude-opus-4-5-20251101.description":"Claude Opus 4.5 مدل پرچمدار Anthropic است که هوش برجسته را با عملکرد مقیاسپذیر ترکیب میکند و برای وظایف پیچیدهای که نیاز به پاسخهای باکیفیت و استدلال دارند، ایدهآل است.",
"claude-sonnet-4-20250514-thinking.description":"Claude Sonnet 4 Thinking میتواند پاسخهای تقریباً فوری یا تفکر گامبهگام طولانی با فرآیند قابل مشاهده تولید کند.",
"claude-sonnet-4-5-20250929.description":"Claude Sonnet 4.5 هوشمندترین مدل Anthropic تا به امروز است.",
"codegeex-4.description":"CodeGeeX-4 یک دستیار هوش مصنوعی قدرتمند برای برنامهنویسی است که از پرسش و پاسخ چندزبانه و تکمیل کد پشتیبانی میکند تا بهرهوری توسعهدهندگان را افزایش دهد.",
"codegeex4-all-9b.description":"CodeGeeX4-ALL-9B یک مدل تولید کد چندزبانه است که از تکمیل و تولید کد، مفسر کد، جستجوی وب، فراخوانی توابع و پرسش و پاسخ در سطح مخزن پشتیبانی میکند و طیف گستردهای از سناریوهای توسعه نرمافزار را پوشش میدهد. این مدل یکی از بهترین مدلهای کد زیر ۱۰ میلیارد پارامتر است.",
"codegemma.description":"CodeGemma یک مدل سبک برای وظایف متنوع برنامهنویسی است که امکان تکرار سریع و یکپارچهسازی آسان را فراهم میکند.",
"codegemma:2b.description":"CodeGemma یک مدل سبک برای وظایف متنوع برنامهنویسی است که امکان تکرار سریع و یکپارچهسازی آسان را فراهم میکند.",
"codellama.description":"Code Llama یک مدل زبانی بزرگ متمرکز بر تولید و بحث در مورد کد است که از زبانهای مختلف برای جریانهای کاری توسعهدهندگان پشتیبانی میکند.",
"codellama/CodeLlama-34b-Instruct-hf.description":"Code Llama یک مدل زبانی بزرگ متمرکز بر تولید و بحث در مورد کد است که از زبانهای مختلف برای جریانهای کاری توسعهدهندگان پشتیبانی میکند.",
"codellama:13b.description":"Code Llama یک مدل زبانی بزرگ متمرکز بر تولید و بحث در مورد کد است که از زبانهای مختلف برای جریانهای کاری توسعهدهندگان پشتیبانی میکند.",
"codellama:34b.description":"Code Llama یک مدل زبانی بزرگ متمرکز بر تولید و بحث در مورد کد است که از زبانهای مختلف برای جریانهای کاری توسعهدهندگان پشتیبانی میکند.",
"codellama:70b.description":"Code Llama یک مدل زبانی بزرگ متمرکز بر تولید و بحث در مورد کد است که از زبانهای مختلف برای جریانهای کاری توسعهدهندگان پشتیبانی میکند.",
"codeqwen.description":"CodeQwen1.5 یک مدل زبانی بزرگ است که بر پایه دادههای گسترده کد آموزش دیده و برای وظایف پیچیده برنامهنویسی طراحی شده است.",
"codestral-latest.description":"Codestral پیشرفتهترین مدل کدنویسی ماست؛ نسخه v2 (ژانویه ۲۰۲۵) برای وظایف با تأخیر کم و فرکانس بالا مانند FIM، اصلاح کد و تولید تست بهینه شده است.",
"codestral.description":"Codestral اولین مدل کدنویسی از Mistral AI است که پشتیبانی قوی برای تولید کد ارائه میدهد.",
"codex-mini-latest.description":"codex-mini-latest نسخه تنظیمشده مدل o4-mini برای رابط خط فرمان Codex است. برای استفاده مستقیم از API، توصیه میشود با gpt-4.1 شروع کنید.",
"cogito-2.1:671b.description":"Cogito v2.1 671B یک مدل زبان بازمتن آمریکایی است که برای استفاده تجاری رایگان است. این مدل عملکردی در حد مدلهای برتر دارد، بازدهی بالای استدلال با توکن، زمینه طولانی ۱۲۸هزار توکنی و توانایی کلی قوی ارائه میدهد.",
"cogview-4.description":"CogView-4 نخستین مدل متن به تصویر بازمتن Zhipu است که توانایی تولید نویسههای چینی را دارد. این مدل درک معنایی، کیفیت تصویر و رندر متن چینی/انگلیسی را بهبود میبخشد، از دستورات دو زبانه با طول دلخواه پشتیبانی میکند و میتواند تصاویر را در هر وضوحی در محدوده مشخص تولید کند.",
"cohere-command-r-plus.description":"Command R+ یک مدل پیشرفته بهینهشده برای RAG است که برای بارهای کاری سازمانی طراحی شده است.",
"cohere-command-r.description":"Command R یک مدل مولد مقیاسپذیر است که برای استفاده در RAG و ابزارها طراحی شده و هوش مصنوعی در سطح تولید را ممکن میسازد.",
"cohere/Cohere-command-r-plus.description":"Command R+ یک مدل پیشرفته بهینهشده برای RAG است که برای بارهای کاری سازمانی طراحی شده است.",
"cohere/Cohere-command-r.description":"Command R یک مدل مولد مقیاسپذیر است که برای استفاده در RAG و ابزارها طراحی شده و هوش مصنوعی در سطح تولید را ممکن میسازد.",
"cohere/command-a.description":"Command A قویترین مدل Cohere تا به امروز است که در استفاده از ابزارها، عاملها، RAG و کاربردهای چندزبانه برتری دارد. این مدل دارای طول زمینه ۲۵۶هزار توکن است، تنها با دو GPU اجرا میشود و ۱۵۰٪ بازدهی بالاتری نسبت به Command R+ 08-2024 دارد.",
"cohere/command-r-plus.description":"Command R+ جدیدترین مدل زبان بزرگ Cohere است که برای چت و زمینه طولانی بهینه شده و عملکردی استثنایی ارائه میدهد تا شرکتها بتوانند از نمونهسازی فراتر روند.",
"cohere/command-r.description":"Command R برای وظایف چت و زمینه طولانی بهینه شده و به عنوان مدلی «مقیاسپذیر» معرفی میشود که تعادل بین عملکرد بالا و دقت را برقرار میکند تا شرکتها بتوانند از نمونهسازی فراتر روند.",
"cohere/embed-v4.0.description":"مدلی برای طبقهبندی یا تبدیل متن، تصویر یا محتوای ترکیبی به بردارهای تعبیهشده.",
"comfyui/flux-dev.description":"FLUX.1 Dev یک مدل متن به تصویر با کیفیت بالا (۱۰ تا ۵۰ مرحله) است که برای خروجیهای خلاقانه و هنری ممتاز ایدهآل است.",
"comfyui/flux-kontext-dev.description":"FLUX.1 Kontext-dev یک مدل ویرایش تصویر است که از ویرایشهای هدایتشده با متن، از جمله ویرایشهای محلی و انتقال سبک پشتیبانی میکند.",
"comfyui/flux-krea-dev.description":"FLUX.1 Krea-dev یک مدل متن به تصویر با فیلترهای ایمنی داخلی است که با همکاری Krea توسعه یافته است.",
"comfyui/flux-schnell.description":"FLUX.1 Schnell یک مدل متن به تصویر فوقسریع است که تصاویر با کیفیت بالا را در ۱ تا ۴ مرحله تولید میکند و برای استفاده بلادرنگ و نمونهسازی سریع ایدهآل است.",
"comfyui/stable-diffusion-15.description":"Stable Diffusion 1.5 یک مدل کلاسیک متن به تصویر با وضوح ۵۱۲x۵۱۲ است که برای نمونهسازی سریع و آزمایشهای خلاقانه مناسب است.",
"comfyui/stable-diffusion-35-inclclip.description":"Stable Diffusion 3.5 با رمزگذارهای داخلی CLIP/T5 نیازی به فایلهای رمزگذار خارجی ندارد و برای مدلهایی مانند sd3.5_medium_incl_clips با مصرف منابع کمتر مناسب است.",
"comfyui/stable-diffusion-35.description":"Stable Diffusion 3.5 یک مدل نسل جدید متن به تصویر است که در دو نسخه بزرگ و متوسط ارائه میشود. این مدل به فایلهای رمزگذار CLIP خارجی نیاز دارد و کیفیت تصویر عالی و تبعیت دقیق از دستورات را ارائه میدهد.",
"comfyui/stable-diffusion-custom-refiner.description":"مدل تصویر به تصویر SDXL سفارشی. از custom_sd_lobe.safetensors به عنوان نام فایل مدل استفاده کنید؛ اگر VAE دارید، از custom_sd_vae_lobe.safetensors استفاده کنید. فایلهای مدل را در پوشههای مورد نیاز Comfy قرار دهید.",
"comfyui/stable-diffusion-custom.description":"مدل متن به تصویر SD سفارشی. از custom_sd_lobe.safetensors به عنوان نام فایل مدل استفاده کنید؛ اگر VAE دارید، از custom_sd_vae_lobe.safetensors استفاده کنید. فایلهای مدل را در پوشههای مورد نیاز Comfy قرار دهید.",
"comfyui/stable-diffusion-refiner.description":"مدل تصویر به تصویر SDXL که تبدیلهای با کیفیت بالا از تصاویر ورودی انجام میدهد و از انتقال سبک، بازسازی و تغییرات خلاقانه پشتیبانی میکند.",
"comfyui/stable-diffusion-xl.description":"SDXL یک مدل متن به تصویر است که از تولید تصاویر با وضوح بالا ۱۰۲۴x۱۰۲۴ پشتیبانی میکند و کیفیت و جزئیات تصویر بهتری ارائه میدهد.",
"command-a-03-2025.description":"Command A توانمندترین مدل ما تا به امروز است که در استفاده از ابزارها، عاملها، RAG و سناریوهای چندزبانه برتری دارد. این مدل دارای پنجره زمینه ۲۵۶هزار توکن است، تنها با دو GPU اجرا میشود و ۱۵۰٪ بازدهی بالاتری نسبت به Command R+ 08-2024 دارد.",
"command-light-nightly.description":"برای کاهش فاصله بین نسخههای اصلی، نسخههای شبانه Command را ارائه میدهیم. برای سری command-light، این نسخه command-light-nightly نام دارد. این نسخه جدیدترین و آزمایشیترین (و احتمالاً ناپایدارترین) نسخه است که بهطور منظم و بدون اطلاع بهروزرسانی میشود، بنابراین برای استفاده در تولید توصیه نمیشود.",
"command-light.description":"نسخهای کوچکتر و سریعتر از Command که تقریباً به همان اندازه توانمند است اما سریعتر عمل میکند.",
"command-nightly.description":"برای کاهش فاصله بین نسخههای اصلی، نسخههای شبانه Command را ارائه میدهیم. برای سری Command، این نسخه command-nightly نام دارد. این نسخه جدیدترین و آزمایشیترین (و احتمالاً ناپایدارترین) نسخه است که بهطور منظم و بدون اطلاع بهروزرسانی میشود، بنابراین برای استفاده در تولید توصیه نمیشود.",
"command-r-03-2024.description":"Command R یک مدل چت پیرو دستورالعمل است که کیفیت بالاتر، قابلیت اطمینان بیشتر و پنجره زمینه طولانیتری نسبت به مدلهای قبلی دارد. این مدل از جریانهای کاری پیچیده مانند تولید کد، RAG، استفاده از ابزار و عاملها پشتیبانی میکند.",
"command-r-08-2024.description":"command-r-08-2024 نسخه بهروزرسانیشده مدل Command R است که در آگوست ۲۰۲۴ منتشر شده است.",
"command-r-plus-04-2024.description":"command-r-plus نام مستعار command-r-plus-04-2024 است، بنابراین استفاده از command-r-plus در API به آن مدل اشاره دارد.",
"command-r-plus-08-2024.description":"Command R+ یک مدل چت پیرو دستورالعمل است که کیفیت بالاتر، قابلیت اطمینان بیشتر و پنجره زمینه طولانیتری نسبت به مدلهای قبلی دارد. این مدل برای جریانهای کاری پیچیده RAG و استفاده چندمرحلهای از ابزارها بهترین گزینه است.",
"command-r-plus.description":"Command R+ یک مدل زبان بزرگ با عملکرد بالا است که برای سناریوهای واقعی سازمانی و برنامههای پیچیده طراحی شده است.",
"command-r.description":"Command R یک مدل زبان بزرگ بهینهشده برای چت و وظایف با زمینه طولانی است که برای تعامل پویا و مدیریت دانش ایدهآل است.",
"command-r7b-12-2024.description":"command-r7b-12-2024 یک بهروزرسانی کوچک و کارآمد است که در دسامبر ۲۰۲۴ منتشر شده است. این مدل در RAG، استفاده از ابزار و وظایف عاملها که نیاز به استدلال پیچیده و چندمرحلهای دارند، عملکرد عالی دارد.",
"command.description":"مدل چت پیرو دستورالعمل که کیفیت و قابلیت اطمینان بالاتری در وظایف زبانی ارائه میدهد و پنجره زمینه طولانیتری نسبت به مدلهای مولد پایه ما دارد.",
"computer-use-preview.description":"computer-use-preview یک مدل تخصصی برای ابزار «استفاده از رایانه» است که برای درک و اجرای وظایف مرتبط با رایانه آموزش دیده است.",
"dall-e-2.description":"مدل نسل دوم DALL·E با تولید تصاویر واقعگرایانهتر، دقیقتر و وضوحی ۴ برابر بیشتر از نسل اول.",
"dall-e-3.description":"جدیدترین مدل DALL·E که در نوامبر ۲۰۲۳ منتشر شد و از تولید تصاویر واقعگرایانهتر، دقیقتر و با جزئیات قویتر پشتیبانی میکند.",
"meta.llama3-8b-instruct-v1:0.description":"متا لاما ۳ یک مدل زبان باز برای توسعهدهندگان، پژوهشگران و شرکتها است که برای کمک به ساخت، آزمایش و گسترش مسئولانه ایدههای هوش مصنوعی مولد طراحی شده است. این مدل بهعنوان بخشی از زیرساخت نوآوری جامعه جهانی، برای محیطهایی با منابع محدود، دستگاههای لبه و زمانهای آموزش سریع مناسب است.",
"meta/Llama-3.2-11B-Vision-Instruct.description":"استدلال تصویری قوی بر روی تصاویر با وضوح بالا، مناسب برای برنامههای درک بصری.",
"meta/Llama-3.2-90B-Vision-Instruct.description":"استدلال تصویری پیشرفته برای برنامههای عامل با قابلیت درک بصری.",
"meta/Llama-3.3-70B-Instruct.description":"لاما ۳.۳ پیشرفتهترین مدل چندزبانه متنباز لاما است که عملکردی نزدیک به مدلهای ۴۰۵ میلیارد پارامتری را با هزینه بسیار پایین ارائه میدهد. این مدل مبتنی بر ترنسفورمر بوده و با SFT و RLHF برای افزایش کارایی و ایمنی بهبود یافته است. نسخه تنظیمشده برای دستورالعملها برای چت چندزبانه بهینه شده و در بسیاری از معیارهای صنعتی از مدلهای باز و بسته پیشی میگیرد. تاریخ قطع دانش: دسامبر ۲۰۲۳.",
"meta/Meta-Llama-3-70B-Instruct.description":"مدلی قدرتمند با ۷۰ میلیارد پارامتر که در استدلال، برنامهنویسی و وظایف زبانی گسترده عملکرد بالایی دارد.",
"meta/Meta-Llama-3-8B-Instruct.description":"مدلی همهکاره با ۸ میلیارد پارامتر که برای چت و تولید متن بهینه شده است.",
"meta/Meta-Llama-3.1-405B-Instruct.description":"مدل متنی تنظیمشده لاما ۳.۱ برای چت چندزبانه، با عملکرد قوی در معیارهای صنعتی رایج در میان مدلهای چت باز و بسته.",
"meta/Meta-Llama-3.1-70B-Instruct.description":"مدل متنی تنظیمشده لاما ۳.۱ برای چت چندزبانه، با عملکرد قوی در معیارهای صنعتی رایج در میان مدلهای چت باز و بسته.",
"meta/Meta-Llama-3.1-8B-Instruct.description":"مدل متنی تنظیمشده لاما ۳.۱ برای چت چندزبانه، با عملکرد قوی در معیارهای صنعتی رایج در میان مدلهای چت باز و بسته.",
"meta/llama-3-70b.description":"مدلی متنباز با ۷۰ میلیارد پارامتر که توسط متا برای پیروی از دستورالعملها تنظیم شده و توسط Groq بر روی سختافزار LPU برای استنتاج سریع و کارآمد ارائه میشود.",
"meta/llama-3-8b.description":"مدلی متنباز با ۸ میلیارد پارامتر که توسط متا برای پیروی از دستورالعملها تنظیم شده و توسط Groq بر روی سختافزار LPU برای استنتاج سریع و کارآمد ارائه میشود.",
"meta/llama-3.1-405b-instruct.description":"مدلی پیشرفته برای تولید داده مصنوعی، تقطیر دانش و استدلال در چتباتها، برنامهنویسی و وظایف تخصصی.",
"meta/llama-3.1-70b-instruct.description":"طراحیشده برای گفتوگوهای پیچیده با درک عالی از زمینه، استدلال و تولید متن.",
"meta/llama-3.1-70b.description":"نسخه بهروزشده لاما ۳.۱ با ۷۰ میلیارد پارامتر، پشتیبانی از زمینه ۱۲۸ هزار توکن، پشتیبانی چندزبانه و استدلال بهبود یافته.",
"meta/llama-3.1-8b.description":"لاما ۳.۱ با ۸ میلیارد پارامتر از پنجره زمینه ۱۲۸ هزار توکن پشتیبانی میکند، برای چت بلادرنگ و تحلیل دادهها ایدهآل است و در مقایسه با مدلهای بزرگتر صرفهجویی قابلتوجهی در هزینه دارد. توسط Groq بر روی سختافزار LPU برای استنتاج سریع و کارآمد ارائه میشود.",
"meta/llama-3.2-11b-vision-instruct.description":"مدلی پیشرفته در حوزه بینایی-زبان که در استدلال با کیفیت بالا از تصاویر عملکرد درخشانی دارد.",
"meta/llama-3.2-11b.description":"مدل استدلال تصویری تنظیمشده برای دستورالعملها (ورودی متن+تصویر، خروجی متن) که برای شناسایی بصری، استدلال تصویری، زیرنویسگذاری و پرسشوپاسخ عمومی تصویری بهینه شده است.",
"meta/llama-3.2-1b-instruct.description":"مدل زبانی کوچک و پیشرفته با درک قوی، توانایی استدلال و تولید متن.",
"meta/llama-3.2-1b.description":"مدل فقط متنی برای استفاده در دستگاههایی مانند بازیابی محلی چندزبانه، خلاصهسازی و بازنویسی.",
"meta/llama-3.2-3b-instruct.description":"مدل زبانی کوچک و پیشرفته با درک قوی، توانایی استدلال و تولید متن.",
"meta/llama-3.2-3b.description":"مدل فقط متنی تنظیمشده برای استفاده در دستگاههایی مانند بازیابی محلی چندزبانه، خلاصهسازی و بازنویسی.",
"meta/llama-3.2-90b-vision-instruct.description":"مدلی پیشرفته در حوزه بینایی-زبان که در استدلال با کیفیت بالا از تصاویر عملکرد درخشانی دارد.",
"meta/llama-3.2-90b.description":"مدل استدلال تصویری تنظیمشده برای دستورالعملها (ورودی متن+تصویر، خروجی متن) که برای شناسایی بصری، استدلال تصویری، زیرنویسگذاری و پرسشوپاسخ عمومی تصویری بهینه شده است.",
"meta/llama-3.3-70b-instruct.description":"مدلی پیشرفته با توانایی بالا در استدلال، ریاضی، منطق عمومی و فراخوانی توابع.",
"meta/llama-3.3-70b.description":"ترکیبی ایدهآل از عملکرد و بهرهوری. طراحیشده برای هوش مصنوعی مکالمهای با عملکرد بالا در تولید محتوا، برنامههای سازمانی و پژوهش، با درک زبانی قوی برای خلاصهسازی، طبقهبندی، تحلیل احساسات و تولید کد.",
"meta/llama-4-maverick.description":"خانواده لاما ۴ مجموعهای از مدلهای بومی چندوجهی است که از متن و ورودیهای چندرسانهای پشتیبانی میکند و با استفاده از MoE درک پیشرفتهای از متن و تصویر ارائه میدهد. لاما ۴ ماوریک یک مدل ۱۷ میلیاردی با ۱۲۸ متخصص است که توسط DeepInfra ارائه میشود.",
"meta/llama-4-scout.description":"خانواده لاما ۴ مجموعهای از مدلهای بومی چندوجهی است که از متن و ورودیهای چندرسانهای پشتیبانی میکند و با استفاده از MoE درک پیشرفتهای از متن و تصویر ارائه میدهد. لاما ۴ اسکات یک مدل ۱۷ میلیاردی با ۱۶ متخصص است که توسط DeepInfra ارائه میشود.",
"moonshot-v1-128k-vision-preview.description":"مدلهای بینایی Kimi (شامل moonshot-v1-8k-vision-preview/moonshot-v1-32k-vision-preview/moonshot-v1-128k-vision-preview) قادر به درک محتوای تصاویر مانند متن، رنگها و اشکال اشیاء هستند.",
"moonshot-v1-128k.description":"Moonshot V1 128K با پشتیبانی از زمینه بسیار طولانی، امکان تولید متون بسیار بلند را فراهم میکند و تا ۱۲۸٬۰۰۰ توکن را برای سناریوهای پژوهشی، دانشگاهی و اسناد بزرگ مدیریت میکند.",
"moonshot-v1-32k-vision-preview.description":"مدلهای بینایی Kimi (شامل moonshot-v1-8k-vision-preview/moonshot-v1-32k-vision-preview/moonshot-v1-128k-vision-preview) قادر به درک محتوای تصاویر مانند متن، رنگها و اشکال اشیاء هستند.",
"moonshot-v1-32k.description":"Moonshot V1 32K از ۳۲٬۷۶۸ توکن برای زمینههای متوسط پشتیبانی میکند و برای اسناد بلند و گفتگوهای پیچیده در تولید محتوا، گزارشها و سامانههای چت ایدهآل است.",
"moonshot-v1-8k-vision-preview.description":"مدلهای بینایی Kimi (شامل moonshot-v1-8k-vision-preview/moonshot-v1-32k-vision-preview/moonshot-v1-128k-vision-preview) قادر به درک محتوای تصاویر مانند متن، رنگها و اشکال اشیاء هستند.",
"moonshot-v1-8k.description":"Moonshot V1 8K برای تولید متون کوتاه بهینهسازی شده و عملکردی کارآمد دارد. این مدل تا ۸٬۱۹۲ توکن را برای چتهای کوتاه، یادداشتها و محتوای سریع مدیریت میکند.",
"moonshot-v1-auto.description":"Moonshot V1 Auto بهطور خودکار مدل مناسب را بر اساس میزان استفاده از توکنهای زمینه انتخاب میکند.",
"moonshotai/Kimi-Dev-72B.description":"Kimi-Dev-72B یک مدل کد متنباز است که با یادگیری تقویتی در مقیاس بزرگ بهینهسازی شده و وصلههای قابلاعتماد و آماده تولید ارائه میدهد. این مدل با امتیاز ۶۰.۴٪ در SWE-bench Verified، رکورد جدیدی را در میان مدلهای متنباز برای وظایف مهندسی نرمافزار خودکار مانند رفع باگ و بازبینی کد ثبت کرده است.",
"moonshotai/Kimi-K2-Instruct-0905.description":"Kimi K2-Instruct-0905 جدیدترین و قدرتمندترین نسخه Kimi K2 است. این مدل MoE سطح بالا با ۱ تریلیون پارامتر کل و ۳۲ میلیارد پارامتر فعال است. ویژگیهای کلیدی آن شامل هوش برنامهنویسی عاملمحور قویتر، بهبود چشمگیر در آزمونها و وظایف واقعی عاملها، و کدنویسی ظاهری و کاربردی بهتر در رابط کاربری است.",
"moonshotai/Kimi-K2-Thinking.description":"Kimi K2 Thinking جدیدترین و قدرتمندترین مدل متنباز برای تفکر است. این مدل عمق استدلال چندمرحلهای را بهطور چشمگیری افزایش داده و استفاده پایدار از ابزارها را در ۲۰۰ تا ۳۰۰ فراخوانی متوالی حفظ میکند. این مدل در آزمونهایی مانند Humanity's Last Exam (HLE)، BrowseComp و سایر معیارها رکورد جدیدی ثبت کرده و در برنامهنویسی، ریاضی، منطق و سناریوهای عامل عملکرد درخشانی دارد. این مدل بر پایه معماری MoE با حدود ۱ تریلیون پارامتر ساخته شده و از پنجره زمینه ۲۵۶K و فراخوانی ابزار پشتیبانی میکند.",
"moonshotai/kimi-k2-0711.description":"Kimi K2 0711 نسخه instruct از سری Kimi است که برای تولید کد با کیفیت بالا و استفاده از ابزارها مناسب است.",
"moonshotai/kimi-k2-0905.description":"Kimi K2 0905 نسخهای بهروزشده است که عملکرد زمینه و استدلال را با بهینهسازیهای برنامهنویسی گسترش میدهد.",
"moonshotai/kimi-k2-instruct-0905.description":"مدل kimi-k2-0905-preview از پنجره زمینه ۲۵۶K پشتیبانی میکند و دارای برنامهنویسی عاملمحور قویتر، کد رابط کاربری زیباتر و کاربردیتر و درک بهتر زمینه است.",
"moonshotai/kimi-k2-thinking-turbo.description":"Kimi K2 Thinking Turbo نسخه پرسرعت مدل Kimi K2 Thinking است که با حفظ عمق استدلال، تأخیر را بهطور قابلتوجهی کاهش میدهد.",
"moonshotai/kimi-k2-thinking.description":"Kimi K2 Thinking مدل استدلال Moonshot است که برای وظایف استدلال عمیق بهینهسازی شده و قابلیتهای عمومی عامل را داراست.",
"moonshotai/kimi-k2.description":"Kimi K2 یک مدل بزرگ MoE از Moonshot AI با ۱ تریلیون پارامتر کل و ۳۲ میلیارد پارامتر فعال در هر عبور است که برای قابلیتهای عامل از جمله استفاده پیشرفته از ابزار، استدلال و تولید کد بهینهسازی شده است.",
"morph/morph-v3-fast.description":"Morph یک مدل تخصصی است که تغییرات کدی پیشنهادشده توسط مدلهای پیشرفته (مانند Claude یا GPT-4o) را با سرعت بیش از ۴۵۰۰ توکن در ثانیه روی فایلهای موجود شما اعمال میکند. این مدل مرحله نهایی در جریان کاری برنامهنویسی با هوش مصنوعی است و از ورودی/خروجی ۱۶K توکن پشتیبانی میکند.",
"morph/morph-v3-large.description":"Morph یک مدل تخصصی است که تغییرات کدی پیشنهادشده توسط مدلهای پیشرفته (مانند Claude یا GPT-4o) را با سرعت بیش از ۲۵۰۰ توکن در ثانیه روی فایلهای موجود شما اعمال میکند. این مدل مرحله نهایی در جریان کاری برنامهنویسی با هوش مصنوعی است و از ورودی/خروجی ۱۶K توکن پشتیبانی میکند.",
"nousresearch/hermes-2-pro-llama-3-8b.description":"Hermes 2 Pro Llama 3 8B نسخه بهروزشدهای از Nous Hermes 2 است که با جدیدترین دادههای داخلی توسعه یافته است.",
"nvidia/Llama-3.1-Nemotron-70B-Instruct-HF.description":"Llama 3.1 Nemotron 70B یک مدل سفارشیشده توسط NVIDIA برای بهبود مفید بودن پاسخهای LLM است. این مدل در Arena Hard، AlpacaEval 2 LC و GPT-4-Turbo MT-Bench عملکرد قوی دارد و تا ۱ اکتبر ۲۰۲۴ در هر سه معیار همترازی خودکار رتبه اول را کسب کرده است. این مدل از Llama-3.1-70B-Instruct با استفاده از RLHF (REINFORCE)، Llama-3.1-Nemotron-70B-Reward و درخواستهای HelpSteer2-Preference آموزش دیده است.",
"nvidia/llama-3.1-nemotron-51b-instruct.description":"مدلی متمایز با دقت و کارایی استثنایی در پردازش زبان طبیعی.",
"nvidia/llama-3.1-nemotron-70b-instruct.description":"Llama-3.1-Nemotron-70B-Instruct یک مدل سفارشیشده توسط NVIDIA است که برای بهبود مفید بودن پاسخهای LLM طراحی شده است.",
"o1-mini.description":"کوچکتر و سریعتر از o1-preview، با ۸۰٪ هزینه کمتر، قوی در تولید کد و وظایف با زمینه کوتاه.",
"o1-preview.description":"متمرکز بر استدلال پیشرفته و حل مسائل پیچیده، از جمله ریاضی و علوم. ایدهآل برای برنامههایی که نیاز به درک عمیق زمینه و جریانهای کاری خودکار دارند.",
"o1-pro.description":"سری o1 با یادگیری تقویتی آموزش دیده تا پیش از پاسخدهی فکر کند و استدلال پیچیده را مدیریت کند. o1-pro از منابع محاسباتی بیشتری برای تفکر عمیقتر استفاده میکند و پاسخهایی با کیفیت بالاتر بهطور مداوم ارائه میدهد.",
"o1.description":"o1 مدل جدید استدلال OpenAI با ورودی متن+تصویر و خروجی متنی است که برای وظایف پیچیده با نیاز به دانش گسترده مناسب است. این مدل دارای پنجره زمینه ۲۰۰K و تاریخ قطع دانش اکتبر ۲۰۲۳ است.",
"o3-2025-04-16.description":"o3 مدل جدید استدلال OpenAI با ورودی متن+تصویر و خروجی متنی برای وظایف پیچیده با نیاز به دانش گسترده است.",
"o3-deep-research.description":"o3-deep-research پیشرفتهترین مدل تحقیقاتی ما برای وظایف پیچیده چندمرحلهای است. این مدل میتواند در وب جستجو کند و به دادههای شما از طریق اتصالدهندههای MCP دسترسی داشته باشد.",
"o3-mini.description":"o3-mini جدیدترین مدل کوچک استدلال ماست که هوش بالاتری را با همان هزینه و تأخیر مدل o1-mini ارائه میدهد.",
"o3-pro-2025-06-10.description":"o3 Pro مدل جدید استدلال OpenAI با ورودی متن+تصویر و خروجی متنی برای وظایف پیچیده با نیاز به دانش گسترده است.",
"o3-pro.description":"o3-pro از منابع محاسباتی بیشتری برای تفکر عمیقتر استفاده میکند و بهطور مداوم پاسخهای بهتری ارائه میدهد؛ فقط از طریق API پاسخها در دسترس است.",
"o3.description":"o3 یک مدل قدرتمند همهجانبه است که استاندارد جدیدی در ریاضی، علوم، برنامهنویسی و استدلال بصری تعیین میکند. این مدل در نگارش فنی و پیروی از دستورالعملها عالی عمل میکند و میتواند متن، کد و تصاویر را برای حل مسائل چندمرحلهای تحلیل کند.",
"pixtral-large-latest.description":"Pixtral Large یک مدل چندوجهی باز با ۱۲۴ میلیارد پارامتر است که بر پایه Mistral Large 2 ساخته شده و دومین مدل در خانواده چندوجهی ما با درک پیشرفته تصویر در سطح مرزی است.",
"pro-128k.description":"Spark Pro 128K ظرفیت بسیار بالایی برای زمینهسازی دارد و تا ۱۲۸ هزار توکن را پشتیبانی میکند. این مدل برای اسناد بلند که نیاز به تحلیل کامل متن و انسجام بلندمدت دارند، ایدهآل است و از منطق روان و ارجاعهای متنوع در بحثهای پیچیده پشتیبانی میکند.",
"pro-deepseek-r1.description":"مدل خدمات اختصاصی سازمانی با همزمانی بستهبندیشده.",
"pro-deepseek-v3.description":"مدل خدمات اختصاصی سازمانی با همزمانی بستهبندیشده.",
"qianfan-70b.description":"Qianfan 70B یک مدل بزرگ چینی برای تولید با کیفیت بالا و استدلال پیچیده است.",
"qianfan-8b.description":"Qianfan 8B یک مدل عمومی میانرده است که بین هزینه و کیفیت در تولید متن و پاسخ به پرسشها تعادل برقرار میکند.",
"qianfan-agent-intent-32k.description":"Qianfan Agent Intent 32K برای شناسایی نیت و هماهنگی عاملها با پشتیبانی از زمینه طولانی طراحی شده است.",
"qianfan-agent-lite-8k.description":"Qianfan Agent Lite 8K یک مدل سبکوزن برای گفتوگوی چندمرحلهای کمهزینه و جریانهای کاری است.",
"qianfan-agent-speed-32k.description":"Qianfan Agent Speed 32K یک مدل عامل با توان عملیاتی بالا برای برنامههای عامل چندوظیفهای در مقیاس بزرگ است.",
"qianfan-agent-speed-8k.description":"Qianfan Agent Speed 8K یک مدل عامل با همزمانی بالا برای گفتوگوهای کوتاه تا متوسط و پاسخدهی سریع است.",
"qianfan-check-vl.description":"Qianfan Check VL یک مدل بازبینی محتوای چندوجهی برای تطابق تصویر-متن و وظایف شناسایی است.",
"qianfan-composition.description":"Qianfan Composition یک مدل تولید چندوجهی برای درک و تولید ترکیبی تصویر و متن است.",
"qianfan-engcard-vl.description":"Qianfan EngCard VL یک مدل شناسایی چندوجهی متمرکز بر سناریوهای انگلیسی است.",
"qianfan-lightning-128b-a19b.description":"Qianfan Lightning 128B A19B یک مدل عمومی چینی با عملکرد بالا برای پرسشوپاسخ پیچیده و استدلال در مقیاس بزرگ است.",
"qianfan-llama-vl-8b.description":"Qianfan Llama VL 8B یک مدل چندوجهی مبتنی بر Llama برای درک عمومی تصویر و متن است.",
"qianfan-multipicocr.description":"Qianfan MultiPicOCR یک مدل OCR چندتصویری برای شناسایی و استخراج متن از تصاویر مختلف است.",
"qianfan-qi-vl.description":"Qianfan QI VL یک مدل پرسشوپاسخ چندوجهی برای بازیابی دقیق و پاسخدهی در سناریوهای پیچیده تصویر-متن است.",
"qianfan-singlepicocr.description":"Qianfan SinglePicOCR یک مدل OCR تکتصویری با دقت بالا در شناسایی کاراکترها است.",
"qianfan-vl-70b.description":"Qianfan VL 70B یک مدل بزرگ زبان-بینایی برای درک پیچیده تصویر و متن است.",
"qianfan-vl-8b.description":"Qianfan VL 8B یک مدل سبکوزن زبان-بینایی برای پرسشوپاسخ روزمره تصویر-متن و تحلیل است.",
"qvq-72b-preview.description":"QVQ-72B-Preview یک مدل تحقیقاتی آزمایشی از Qwen است که بر بهبود استدلال بصری تمرکز دارد.",
"qvq-max.description":"مدل استدلال بصری Qwen QVQ از ورودی تصویری و خروجی زنجیرهای پشتیبانی میکند و عملکرد قویتری در ریاضی، کدنویسی، تحلیل بصری، خلاقیت و وظایف عمومی دارد.",
"qvq-plus.description":"مدل استدلال بصری با ورودی تصویری و خروجی زنجیرهای. سری qvq-plus پس از qvq-max عرضه شده و استدلال سریعتر با تعادل بهتر کیفیت-هزینه ارائه میدهد.",
"qwen-3-32b.description":"Qwen 3 32B: قدرتمند در وظایف چندزبانه و کدنویسی، مناسب برای استفاده در مقیاس متوسط تولیدی.",
"qwen-flash.description":"سریعترین و کمهزینهترین مدل Qwen، ایدهآل برای وظایف ساده.",
"qwen-image-edit.description":"Qwen Image Edit یک مدل تصویر به تصویر است که تصاویر را بر اساس ورودی تصویری و دستورات متنی ویرایش میکند و امکان تنظیمات دقیق و تغییرات خلاقانه را فراهم میسازد.",
"qwen-image.description":"Qwen-Image یک مدل عمومی تولید تصویر است که از سبکهای هنری مختلف و رندر پیچیده متن (بهویژه چینی و انگلیسی) پشتیبانی میکند. از چیدمان چندخطی، متن در سطح پاراگراف و جزئیات دقیق برای ترکیبهای پیچیده متن-تصویر پشتیبانی میکند.",
"qwen-long.description":"مدل Qwen فوقالعاده بزرگ با پشتیبانی از زمینه طولانی و گفتوگو در سناریوهای چندسندی و چندسندی بلند.",
"qwen-math-plus-latest.description":"Qwen Math یک مدل زبانی تخصصی برای حل مسائل ریاضی است.",
"qwen-math-plus.description":"Qwen Math یک مدل زبانی تخصصی برای حل مسائل ریاضی است.",
"qwen-math-turbo-latest.description":"Qwen Math یک مدل زبانی تخصصی برای حل مسائل ریاضی است.",
"qwen-math-turbo.description":"Qwen Math یک مدل زبانی تخصصی برای حل مسائل ریاضی است.",
"qwen-max.description":"مدل فوقالعاده بزرگ Qwen در مقیاس صد میلیارد پارامتر که از زبانهای چینی، انگلیسی و دیگر زبانها پشتیبانی میکند؛ مدل API پشت محصولات فعلی Qwen2.5 است.",
"qwen-omni-turbo.description":"مدلهای Qwen-Omni از ورودیهای چندوجهی (ویدیو، صدا، تصویر، متن) پشتیبانی میکنند و خروجی صوتی و متنی تولید میکنند.",
"qwen-plus.description":"مدل Qwen فوقالعاده بزرگ تقویتشده با پشتیبانی از زبانهای چینی، انگلیسی و دیگر زبانها.",
"qwen-turbo.description":"Qwen Turbo دیگر بهروزرسانی نخواهد شد؛ لطفاً از Qwen Flash استفاده کنید. مدل فوقالعاده بزرگ Qwen با پشتیبانی از زبانهای چینی، انگلیسی و دیگر زبانها.",
"qwen-vl-chat-v1.description":"Qwen VL از تعاملات انعطافپذیر شامل ورودی چندتصویری، پرسشوپاسخ چندمرحلهای و وظایف خلاقانه پشتیبانی میکند.",
"qwen-vl-max-latest.description":"مدل فوقالعاده بزرگ زبان-بینایی Qwen. در مقایسه با نسخه تقویتشده، استدلال بصری و پیروی از دستورالعملها را برای درک و شناخت قویتر بهبود میبخشد.",
"qwen-vl-max.description":"مدل فوقالعاده بزرگ زبان-بینایی Qwen. در مقایسه با نسخه تقویتشده، استدلال بصری و پیروی از دستورالعملها را برای درک و شناخت بصری قویتر بهبود میبخشد.",
"qwen-vl-ocr.description":"Qwen OCR یک مدل استخراج متن از اسناد، جداول، تصاویر آزمون و دستخط است. از زبانهای چینی، انگلیسی، فرانسوی، ژاپنی، کرهای، آلمانی، روسی، ایتالیایی، ویتنامی و عربی پشتیبانی میکند.",
"qwen-vl-plus-latest.description":"مدل تقویتشده زبان-بینایی Qwen در مقیاس بزرگ با بهبودهای عمده در شناسایی جزئیات و متن، پشتیبانی از وضوح بیش از یک مگاپیکسل و نسبتهای ابعاد دلخواه.",
"qwen-vl-plus.description":"مدل تقویتشده زبان-بینایی Qwen در مقیاس بزرگ با بهبودهای عمده در شناسایی جزئیات و متن، پشتیبانی از وضوح بیش از یک مگاپیکسل و نسبتهای ابعاد دلخواه.",
"qwen-vl-v1.description":"مدل پیشآموزششده مبتنی بر Qwen-7B با ماژول بینایی افزوده و ورودی تصویری با وضوح ۴۴۸.",
"qwen/qwen-2-7b-instruct.description":"Qwen2 نسل جدید مدلهای زبانی Qwen است. Qwen2 7B یک مدل مبتنی بر ترنسفورمر است که در درک زبان، توانایی چندزبانه، برنامهنویسی، ریاضی و استدلال عملکرد بالایی دارد.",
"qwen/qwen-2-7b-instruct:free.description":"Qwen2 یک خانواده جدید از مدلهای زبانی بزرگ با درک و تولید قویتر است.",
"qwen/qwen-2-vl-72b-instruct.description":"Qwen2-VL جدیدترین نسخه Qwen-VL است که به عملکرد پیشرفته در بنچمارکهای بینایی مانند MathVista، DocVQA، RealWorldQA و MTVQA دست یافته است. این مدل میتواند بیش از ۲۰ دقیقه ویدیو را برای پرسشوپاسخ، گفتوگو و تولید محتوا با کیفیت بالا درک کند. همچنین استدلال و تصمیمگیری پیچیده را انجام میدهد و با دستگاههای همراه و رباتها برای اقدام بر اساس زمینه بصری و دستور متنی یکپارچه میشود. فراتر از زبانهای انگلیسی و چینی، متن در تصاویر را به زبانهای مختلف از جمله بیشتر زبانهای اروپایی، ژاپنی، کرهای، عربی و ویتنامی میخواند.",
"qwen2.5-omni-7b.description":"مدلهای Qwen-Omni از ورودیهای چندرسانهای (ویدیو، صدا، تصویر، متن) پشتیبانی میکنند و خروجی آنها به صورت صوتی و متنی است.",
"qwen2.5-vl-32b-instruct.description":"Qwen2.5 VL 32B Instruct یک مدل چندرسانهای متنباز است که برای استقرار خصوصی و استفاده در سناریوهای مختلف مناسب میباشد.",
"qwen2.5-vl-72b-instruct.description":"بهبود در پیروی از دستورالعملها، ریاضیات، حل مسئله و برنامهنویسی، با توانایی قویتر در شناسایی اشیاء عمومی. از مکانیابی دقیق عناصر بصری در قالبهای مختلف، درک ویدیوهای طولانی (تا ۱۰ دقیقه) با زمانبندی رویداد در سطح ثانیه، ترتیب زمانی و درک سرعت، و عاملهایی که میتوانند سیستمعامل یا موبایل را از طریق تجزیه و تحلیل و مکانیابی کنترل کنند، پشتیبانی میکند. استخراج اطلاعات کلیدی قوی و خروجی JSON. این نسخه ۷۲B، قویترین نسخه در این سری است.",
"qwen2.5-vl-7b-instruct.description":"Qwen2.5 VL 7B Instruct یک مدل چندرسانهای سبک است که بین هزینه استقرار و توانایی شناسایی تعادل برقرار میکند.",
"qwen2.5-vl-instruct.description":"Qwen2.5-VL جدیدترین مدل زبان-بینایی در خانواده Qwen است.",
"qwen2.5.description":"Qwen2.5 نسل بعدی مدل زبان بزرگ علیبابا است که عملکرد قدرتمندی در کاربردهای متنوع دارد.",
"qwen2.5:0.5b.description":"Qwen2.5 نسل بعدی مدل زبان بزرگ علیبابا است که عملکرد قدرتمندی در کاربردهای متنوع دارد.",
"qwen2.5:1.5b.description":"Qwen2.5 نسل بعدی مدل زبان بزرگ علیبابا است که عملکرد قدرتمندی در کاربردهای متنوع دارد.",
"qwen2.5:72b.description":"Qwen2.5 نسل بعدی مدل زبان بزرگ علیبابا است که عملکرد قدرتمندی در کاربردهای متنوع دارد.",
"qwen2.description":"Qwen2 نسل بعدی مدل زبان بزرگ علیبابا است که عملکرد قدرتمندی در کاربردهای متنوع دارد.",
"qwen2:0.5b.description":"Qwen2 نسل بعدی مدل زبان بزرگ علیبابا است که عملکرد قدرتمندی در کاربردهای متنوع دارد.",
"qwen2:1.5b.description":"Qwen2 نسل بعدی مدل زبان بزرگ علیبابا است که عملکرد قدرتمندی در کاربردهای متنوع دارد.",
"qwen2:72b.description":"Qwen2 نسل بعدی مدل زبان بزرگ علیبابا است که عملکرد قدرتمندی در کاربردهای متنوع دارد.",
"qwen3-0.6b.description":"Qwen3 0.6B یک مدل سطح ابتدایی برای استدلال ساده و محیطهای بسیار محدود است.",
"qwen3-1.7b.description":"Qwen3 1.7B یک مدل فوقسبک برای استقرار در لبه و دستگاهها است.",
"qwen3-14b.description":"Qwen3 14B یک مدل میانرده برای پرسشوپاسخ چندزبانه و تولید متن است.",
"qwen3-235b-a22b-instruct-2507.description":"Qwen3 235B A22B Instruct یک مدل راهبردی برای طیف گستردهای از وظایف تولید و استدلال است.",
"qwen3-235b-a22b-thinking-2507.description":"Qwen3 235B A22B Thinking یک مدل بسیار بزرگ برای استدلال پیچیده است.",
"qwen3-235b-a22b.description":"Qwen3 235B A22B یک مدل عمومی بزرگ برای وظایف پیچیده است.",
"qwen3-30b-a3b-instruct-2507.description":"Qwen3 30B A3B Instruct یک مدل میانتابزرگ برای تولید با کیفیت بالا و پرسشوپاسخ است.",
"qwen3-30b-a3b-thinking-2507.description":"Qwen3 30B A3B Thinking یک مدل میانتابزرگ برای استدلال است که بین دقت و هزینه تعادل برقرار میکند.",
"qwen3-30b-a3b.description":"Qwen3 30B A3B یک مدل عمومی میانتابزرگ است که بین هزینه و کیفیت تعادل برقرار میکند.",
"qwen3-32b.description":"Qwen3 32B برای وظایف عمومی که نیاز به درک قویتری دارند مناسب است.",
"qwen3-4b.description":"Qwen3 4B برای برنامههای کوچک تا متوسط و استنتاج محلی مناسب است.",
"qwen3-8b.description":"Qwen3 8B یک مدل سبک با قابلیت استقرار انعطافپذیر برای بارهای کاری با همزمانی بالا است.",
"qwen3-coder-30b-a3b-instruct.description":"مدل کدنویسی متنباز Qwen. نسخه جدید qwen3-coder-30b-a3b-instruct بر پایه Qwen3 ساخته شده و تواناییهای قوی در عاملهای کدنویس، استفاده از ابزارها و تعامل با محیط برای برنامهنویسی خودکار دارد، با عملکرد عالی در کد و توانایی عمومی قوی.",
"qwen3-coder-480b-a35b-instruct.description":"Qwen3 Coder 480B A35B Instruct یک مدل کدنویسی پیشرفته برای برنامهنویسی چندزبانه و درک کد پیچیده است.",
"qwen3-coder-flash.description":"مدل کدنویسی Qwen. سری جدید Qwen3-Coder بر پایه Qwen3 ساخته شده و تواناییهای قوی در عاملهای کدنویس، استفاده از ابزارها و تعامل با محیط برای برنامهنویسی خودکار دارد، با عملکرد عالی در کد و توانایی عمومی قوی.",
"qwen3-coder-plus.description":"مدل کدنویسی Qwen. سری جدید Qwen3-Coder بر پایه Qwen3 ساخته شده و تواناییهای قوی در عاملهای کدنویس، استفاده از ابزارها و تعامل با محیط برای برنامهنویسی خودکار دارد، با عملکرد عالی در کد و توانایی عمومی قوی.",
"qwen3-coder:480b.description":"مدل با عملکرد بالا از علیبابا برای وظایف عامل و کدنویسی با پشتیبانی از زمینه طولانی.",
"qwen3-max-preview.description":"بهترین مدل Qwen برای وظایف پیچیده و چندمرحلهای. نسخه پیشنمایش از تفکر پشتیبانی میکند.",
"qwen3-max.description":"مدلهای Qwen3 Max نسبت به سری 2.5 پیشرفتهای چشمگیری در توانایی عمومی، درک زبان چینی/انگلیسی، پیروی از دستورالعملهای پیچیده، وظایف باز ذهنی، توانایی چندزبانه و استفاده از ابزار دارند، با کاهش خطاهای توهمی. نسخه جدید qwen3-max توانایی برنامهنویسی عاملمحور و استفاده از ابزار را نسبت به qwen3-max-preview بهبود داده است. این نسخه به سطح پیشرفته در حوزه خود رسیده و برای نیازهای پیچیدهتر عاملها طراحی شده است.",
"qwen3-next-80b-a3b-instruct.description":"مدل متنباز نسل بعدی Qwen3 بدون قابلیت تفکر. نسبت به نسخه قبلی (Qwen3-235B-A22B-Instruct-2507)، درک زبان چینی بهتر، استدلال منطقی قویتر و تولید متن بهبود یافتهای دارد.",
"qwen3-next-80b-a3b-thinking.description":"Qwen3 Next 80B A3B Thinking نسخه پرچمدار مدل استدلال برای وظایف پیچیده است.",
"qwen3-omni-flash.description":"Qwen-Omni ورودیهای ترکیبی از متن، تصویر، صدا و ویدیو را میپذیرد و خروجی آن به صورت متن یا گفتار است. سبکهای صوتی طبیعی متعددی ارائه میدهد، از گفتار چندزبانه و گویشها پشتیبانی میکند و برای کاربردهایی مانند نوشتن، شناسایی بصری و دستیارهای صوتی مناسب است.",
"qwen3-vl-235b-a22b-instruct.description":"Qwen3 VL 235B A22B Instruct یک مدل چندرسانهای پرچمدار برای درک و تولید پیشرفته است.",
"qwen3-vl-235b-a22b-thinking.description":"Qwen3 VL 235B A22B Thinking نسخه پرچمدار تفکر برای استدلال و برنامهریزی چندرسانهای پیچیده است.",
"qwen3-vl-30b-a3b-instruct.description":"Qwen3 VL 30B A3B Instruct یک مدل چندرسانهای بزرگ است که بین دقت و عملکرد استدلال تعادل برقرار میکند.",
"qwen3-vl-32b-instruct.description":"Qwen3 VL 32B Instruct یک مدل چندرسانهای تنظیمشده با دستورالعمل برای پرسشوپاسخ تصویری-متنی با کیفیت بالا و تولید محتوا است.",
"qwen3-vl-32b-thinking.description":"Qwen3 VL 32B Thinking نسخه تفکر عمیق چندرسانهای برای استدلال پیچیده و تحلیل زنجیرهای طولانی است.",
"qwen3-vl-8b-instruct.description":"Qwen3 VL 8B Instruct یک مدل چندرسانهای سبک برای پرسشوپاسخ تصویری روزمره و یکپارچهسازی با برنامهها است.",
"qwen3-vl-8b-thinking.description":"Qwen3 VL 8B Thinking یک مدل زنجیره تفکر چندرسانهای برای استدلال بصری دقیق است.",
"qwen3-vl-flash.description":"Qwen3 VL Flash: نسخه سبک و پرسرعت برای استدلال در درخواستهای حساس به تأخیر یا با حجم بالا.",
"qwen3-vl-plus.description":"Qwen VL یک مدل تولید متن با درک بصری است. میتواند OCR انجام دهد و همچنین خلاصهسازی و استدلال کند، مانند استخراج ویژگیها از عکسهای محصول یا حل مسائل از روی تصاویر.",
"qwen3.description":"Qwen3 نسل بعدی مدل زبان بزرگ علیبابا است که عملکرد قدرتمندی در کاربردهای متنوع دارد.",
"qwq-32b-preview.description":"QwQ یک مدل تحقیقاتی آزمایشی از Qwen است که بر بهبود استدلال تمرکز دارد.",
"qwq-32b.description":"QwQ یک مدل استدلال در خانواده Qwen است. در مقایسه با مدلهای تنظیمشده با دستورالعمل استاندارد، توانایی تفکر و استدلال آن عملکرد پاییندستی را بهویژه در مسائل پیچیده بهطور قابل توجهی بهبود میبخشد. QwQ-32B یک مدل استدلال میانرده است که با مدلهای برتر مانند DeepSeek-R1 و o1-mini رقابت میکند.",
"qwq-plus.description":"مدل استدلال QwQ که بر پایه Qwen2.5 آموزش دیده و با استفاده از یادگیری تقویتی (RL) توانایی استدلال را بهطور چشمگیری بهبود داده است. در معیارهای اصلی ریاضی/کد (AIME 24/25، LiveCodeBench) و برخی معیارهای عمومی (IFEval، LiveBench) به سطح کامل DeepSeek-R1 رسیده است.",
"qwq.description":"QwQ یک مدل استدلال در خانواده Qwen است. در مقایسه با مدلهای تنظیمشده با دستورالعمل استاندارد، توانایی تفکر و استدلال آن عملکرد پاییندستی را بهویژه در مسائل دشوار بهطور قابل توجهی بهبود میبخشد. QwQ-32B یک مدل استدلال میانرده است که با مدلهای برتر مانند DeepSeek-R1 و o1-mini رقابت میکند.",
"qwq_32b.description":"مدل استدلال میانرده در خانواده Qwen. در مقایسه با مدلهای تنظیمشده با دستورالعمل استاندارد، توانایی تفکر و استدلال QwQ عملکرد پاییندستی را بهویژه در مسائل دشوار بهطور قابل توجهی بهبود میبخشد.",
"tencent/Hunyuan-A13B-Instruct.description":"Hunyuan-A13B-Instruct با استفاده از ۸۰ میلیارد پارامتر کلی و ۱۳ میلیارد پارامتر فعال، عملکردی همتراز با مدلهای بزرگتر ارائه میدهد. این مدل از استدلال ترکیبی سریع/کند، درک پایدار متون بلند و توانایی پیشرو در عاملها در آزمونهای BFCL-v3 و τ-Bench پشتیبانی میکند. فرمتهای GQA و چندکوانتیزهسازی، استنتاج کارآمد را ممکن میسازند.",
"tencent/Hunyuan-MT-7B.description":"مدل ترجمه Hunyuan شامل Hunyuan-MT-7B و مدل ترکیبی Hunyuan-MT-Chimera است. Hunyuan-MT-7B یک مدل ترجمه سبک با ۷ میلیارد پارامتر است که از ۳۳ زبان بهعلاوه ۵ زبان اقلیت چینی پشتیبانی میکند. در رقابت WMT25، در ۳۰ جفتزبان از ۳۱ مورد، رتبه اول را کسب کرد. Hunyuan از یک زنجیره کامل آموزش شامل پیشآموزش، SFT، تقویت یادگیری ترجمه و تقویت یادگیری ترکیبی استفاده میکند و با عملکردی پیشرو در اندازه خود، بهراحتی قابل استقرار است.",
"text-embedding-3-large.description":"قویترین مدل تعبیهسازی برای وظایف انگلیسی و غیرانگلیسی.",
"text-embedding-3-small.description":"مدل تعبیهسازی نسل جدید با کارایی بالا و مقرونبهصرفه برای بازیابی اطلاعات و سناریوهای RAG.",
"thudm/glm-4-32b.description":"GLM-4-32B-0414 یک مدل ۳۲ میلیارد پارامتری دوزبانه (چینی/انگلیسی) با وزنهای باز است که برای تولید کد، فراخوانی توابع و وظایف عامل بهینهسازی شده است. این مدل با ۱۵ ترابایت داده باکیفیت و متمرکز بر استدلال پیشآموزش دیده و با همراستاسازی ترجیحات انسانی، نمونهگیری ردشده و یادگیری تقویتی بهبود یافته است. در استدلال پیچیده، تولید محتوای ساختاریافته و خروجیهای منظم عملکردی در سطح GPT-4o و DeepSeek-V3-0324 دارد.",
"thudm/glm-4-32b:free.description":"GLM-4-32B-0414 یک مدل ۳۲ میلیارد پارامتری دوزبانه (چینی/انگلیسی) با وزنهای باز است که برای تولید کد، فراخوانی توابع و وظایف عامل بهینهسازی شده است. این مدل با ۱۵ ترابایت داده باکیفیت و متمرکز بر استدلال پیشآموزش دیده و با همراستاسازی ترجیحات انسانی، نمونهگیری ردشده و یادگیری تقویتی بهبود یافته است. در استدلال پیچیده، تولید محتوای ساختاریافته و خروجیهای منظم عملکردی در سطح GPT-4o و DeepSeek-V3-0324 دارد.",
"thudm/glm-4-9b-chat.description":"انتشار متنباز جدیدترین مدل پیشآموزش GLM-4 از Zhipu AI.",
"thudm/glm-z1-32b.description":"GLM-Z1-32B-0414 نسخهای تقویتشده از GLM-4-32B برای استدلال عمیق در ریاضیات، منطق و حل مسائل کدنویسی است. این مدل با استفاده از یادگیری تقویتی گسترده (ترجیحات جفتی خاص وظیفه و عمومی) برای بهبود وظایف چندمرحلهای پیچیده طراحی شده است. نسبت به GLM-4-32B، Z1 در استدلال ساختاریافته و توانایی در حوزههای رسمی بهطور قابلتوجهی بهتر عمل میکند.\n\nاین مدل از مهندسی اعلان برای تحمیل مراحل «تفکر»، انسجام بهتر در خروجیهای بلند، و بهینهسازی برای جریانهای کاری عامل با زمینه طولانی (از طریق YaRN)، فراخوانی ابزار JSON و نمونهگیری دقیق برای استدلال پایدار پشتیبانی میکند. مناسب برای موارد استفادهای است که نیاز به استنتاج چندمرحلهای دقیق یا استنتاج رسمی دارند.",
"thudm/glm-z1-rumination-32b.description":"GLM Z1 Rumination 32B یک مدل استدلال عمیق ۳۲ میلیارد پارامتری از سری GLM-4-Z1 است که برای وظایف پیچیده و باز با نیاز به تفکر طولانی بهینهسازی شده است. این مدل بر پایه glm-4-32b-0414 ساخته شده و مراحل یادگیری تقویتی اضافی و همراستاسازی چندمرحلهای را اضافه میکند تا قابلیت «تفکر عمیق» را شبیهسازی کند. این شامل استدلال تکراری، تحلیل چندمرحلهای و جریانهای کاری تقویتشده با ابزار مانند جستجو، بازیابی و ترکیب آگاه از منابع است.\n\nدر نگارش پژوهشی، تحلیل مقایسهای و پرسشوپاسخ پیچیده عملکردی عالی دارد. از فراخوانی توابع برای عملیات پایه جستجو/ناوبری (`search`، `click`، `open`، `finish`) در خطوط لوله عامل پشتیبانی میکند. رفتار تفکر عمیق از طریق حلقههای چندمرحلهای با شکلدهی پاداش مبتنی بر قواعد و مکانیزمهای تصمیمگیری تأخیری کنترل میشود و در برابر چارچوبهای پژوهشی عمیق مانند پشته همراستاسازی داخلی OpenAI ارزیابی شده است. این نسخه برای عمق بیشتر نسبت به سرعت طراحی شده است.",
"tngtech/deepseek-r1t-chimera:free.description":"DeepSeek-R1T-Chimera با ترکیب DeepSeek-R1 و DeepSeek-V3 (0324) ساخته شده و استدلال R1 را با کارایی توکنی V3 ترکیب میکند. این مدل بر پایه DeepSeek-MoE Transformer است و برای تولید متن عمومی بهینهسازی شده است.\n\nوزنهای پیشآموزشیافته را برای تعادل بین استدلال، کارایی و پیروی از دستورالعملها ترکیب میکند. تحت مجوز MIT برای استفاده پژوهشی و تجاری منتشر شده است.",
"togethercomputer/StripedHyena-Nous-7B.description":"StripedHyena Nous (7B) با بهرهگیری از معماری و استراتژی خود، بهرهوری محاسباتی بهبودیافتهای ارائه میدهد.",
"tts-1-hd.description":"جدیدترین مدل تبدیل متن به گفتار با بهینهسازی برای کیفیت بالا.",
"tts-1.description":"جدیدترین مدل تبدیل متن به گفتار با بهینهسازی برای سرعت در زمان واقعی.",
"upstage/SOLAR-10.7B-Instruct-v1.0.description":"Upstage SOLAR Instruct v1 (11B) برای انجام دقیق وظایف دستوری با عملکرد زبانی قوی تنظیم شده است.",
"us.anthropic.claude-3-5-sonnet-20241022-v2:0.description":"Claude 3.5 Sonnet استاندارد صنعت را ارتقا داده و در ارزیابیهای گسترده از رقبا و Claude 3 Opus پیشی میگیرد، در حالی که سرعت و هزینه متوسط را حفظ میکند.",
"us.anthropic.claude-3-7-sonnet-20250219-v1:0.description":"Claude 3.7 Sonnet سریعترین مدل نسل جدید Anthropic است. نسبت به Claude 3 Haiku در مهارتها بهبود یافته و در بسیاری از معیارهای هوش از پرچمدار قبلی Claude 3 Opus پیشی میگیرد.",
"us.anthropic.claude-haiku-4-5-20251001-v1:0.description":"Claude Haiku 4.5 سریعترین و هوشمندترین مدل Haiku از Anthropic است، با سرعتی برقآسا و توانایی تفکر گسترده.",
"us.anthropic.claude-sonnet-4-5-20250929-v1:0.description":"Claude Sonnet 4.5 هوشمندترین مدل Anthropic تا به امروز است.",
"v0-1.0-md.description":"v0-1.0-md یک مدل قدیمی است که از طریق API نسخه v0 ارائه میشود.",
"v0-1.5-lg.description":"v0-1.5-lg برای وظایف پیشرفته تفکر یا استدلال مناسب است.",
"v0-1.5-md.description":"v0-1.5-md برای وظایف روزمره و تولید رابط کاربری مناسب است.",
"vercel/v0-1.0-md.description":"به مدلهای پشت v0 دسترسی پیدا کنید تا برنامههای وب مدرن را با استدلال خاص فریمورک و دانش بهروز تولید، اصلاح و بهینهسازی کنید.",
"vercel/v0-1.5-md.description":"به مدلهای پشت v0 دسترسی پیدا کنید تا برنامههای وب مدرن را با استدلال خاص فریمورک و دانش بهروز تولید، اصلاح و بهینهسازی کنید.",
"volcengine/doubao-seed-code.description":"Doubao-Seed-Code مدل LLM شرکت ByteDance Volcano Engine است که برای برنامهنویسی عاملمحور بهینهسازی شده و در معیارهای برنامهنویسی و عامل با پشتیبانی از زمینه ۲۵۶K عملکرد قوی دارد.",
"wan2.2-t2i-flash.description":"Wanxiang 2.2 Speed جدیدترین مدل با ارتقاء در خلاقیت، پایداری و واقعگرایی است که تولید سریع و ارزش بالا را ارائه میدهد.",
"wan2.2-t2i-plus.description":"Wanxiang 2.2 Pro جدیدترین مدل با ارتقاء در خلاقیت، پایداری و واقعگرایی است که جزئیات غنیتری تولید میکند.",
"wanx-v1.description":"مدل پایه تبدیل متن به تصویر. معادل Tongyi Wanxiang 1.0 General.",
"wanx2.0-t2i-turbo.description":"در پرترههای بافتدار با سرعت متوسط و هزینه کمتر عملکرد عالی دارد. معادل Tongyi Wanxiang 2.0 Speed.",
"wanx2.1-t2i-plus.description":"نسخه کاملاً ارتقاءیافته با جزئیات تصویری غنیتر و سرعت کمی کمتر. معادل Tongyi Wanxiang 2.1 Pro.",
"wanx2.1-t2i-turbo.description":"نسخه کاملاً ارتقاءیافته با تولید سریع، کیفیت کلی قوی و ارزش بالا. معادل Tongyi Wanxiang 2.1 Speed.",
"whisper-1.description":"مدل عمومی تشخیص گفتار با پشتیبانی از ASR چندزبانه، ترجمه گفتار و شناسایی زبان.",
"wizardlm2.description":"WizardLM 2 مدل زبانی از Microsoft AI است که در گفتوگوی پیچیده، وظایف چندزبانه، استدلال و دستیارها عملکرد عالی دارد.",
"wizardlm2:8x22b.description":"WizardLM 2 مدل زبانی از Microsoft AI است که در گفتوگوی پیچیده، وظایف چندزبانه، استدلال و دستیارها عملکرد عالی دارد.",
"x-ai/grok-4-fast-non-reasoning.description":"Grok 4 Fast (بدون استدلال) مدل چندوجهی با توان عملیاتی بالا و هزینه پایین از xAI است (با پشتیبانی از پنجره زمینه ۲ میلیون توکن) که برای سناریوهای حساس به تأخیر و هزینه طراحی شده و نیازی به استدلال درونمدلی ندارد. این مدل در کنار نسخه استدلالی Grok 4 Fast قرار دارد و میتوان استدلال را از طریق پارامتر API فعال کرد. اعلانها و تکمیلها ممکن است توسط xAI یا OpenRouter برای بهبود مدلهای آینده استفاده شوند.",
"x-ai/grok-4-fast.description":"Grok 4 Fast مدل با توان عملیاتی بالا و هزینه پایین از xAI است (با پشتیبانی از پنجره زمینه ۲ میلیون توکن) که برای موارد استفاده با همزمانی بالا و زمینههای طولانی ایدهآل است.",
"x-ai/grok-4.1-fast-non-reasoning.description":"Grok 4 Fast (بدون استدلال) مدل چندوجهی با توان عملیاتی بالا و هزینه پایین از xAI است (با پشتیبانی از پنجره زمینه ۲ میلیون توکن) که برای سناریوهای حساس به تأخیر و هزینه طراحی شده و نیازی به استدلال درونمدلی ندارد. این مدل در کنار نسخه استدلالی Grok 4 Fast قرار دارد و میتوان استدلال را از طریق پارامتر API فعال کرد. اعلانها و تکمیلها ممکن است توسط xAI یا OpenRouter برای بهبود مدلهای آینده استفاده شوند.",
"x-ai/grok-4.1-fast.description":"Grok 4 Fast مدل با توان عملیاتی بالا و هزینه پایین از xAI است (با پشتیبانی از پنجره زمینه ۲ میلیون توکن) که برای موارد استفاده با همزمانی بالا و زمینههای طولانی ایدهآل است.",
"x-ai/grok-4.description":"Grok 4 مدل پرچمدار xAI با توانایی استدلال قوی و قابلیت چندوجهی است."