{ "01-ai/yi-1.5-34b-chat.description": "جدیدترین مدل متن‌باز و بهینه‌سازی‌شده 01.AI با ۳۴ میلیارد پارامتر، پشتیبانی از سناریوهای مختلف گفت‌وگو، آموزش‌دیده با داده‌های باکیفیت و هم‌راستا با ترجیحات انسانی.", "01-ai/yi-1.5-9b-chat.description": "جدیدترین مدل متن‌باز و بهینه‌سازی‌شده 01.AI با ۹ میلیارد پارامتر، پشتیبانی از سناریوهای مختلف گفت‌وگو، آموزش‌دیده با داده‌های باکیفیت و هم‌راستا با ترجیحات انسانی.", "360/deepseek-r1.description": "مدل DeepSeek-R1 که توسط 360 پیاده‌سازی شده، از یادگیری تقویتی در مقیاس وسیع در مرحله پس‌آموزش استفاده می‌کند تا توانایی استدلال را با حداقل داده‌های برچسب‌خورده به‌طور چشمگیری افزایش دهد. این مدل در وظایف استدلال ریاضی، کدنویسی و زبان طبیعی با مدل OpenAI o1 برابری می‌کند.", "360gpt-pro-trans.description": "مدلی تخصصی در ترجمه که به‌طور عمیق برای دستیابی به کیفیت پیشرو در ترجمه بهینه‌سازی شده است.", "360gpt-pro.description": "360GPT Pro یکی از مدل‌های کلیدی هوش مصنوعی 360 است که پردازش متنی کارآمد را برای سناریوهای متنوع NLP ارائه می‌دهد و از درک متون بلند و گفت‌وگوی چندمرحله‌ای پشتیبانی می‌کند.", "360gpt-turbo-responsibility-8k.description": "360GPT Turbo Responsibility 8K بر ایمنی معنایی و مسئولیت‌پذیری در کاربردهای حساس به محتوا تأکید دارد و تجربه‌ای دقیق و پایدار برای کاربران فراهم می‌کند.", "360gpt-turbo.description": "360GPT Turbo توان پردازشی و گفت‌وگویی بالایی را با درک معنایی عالی و کارایی بالا در تولید متن ارائه می‌دهد و گزینه‌ای ایده‌آل برای کسب‌وکارها و توسعه‌دهندگان است.", "360gpt2-o1.description": "360gpt2-o1 با استفاده از جست‌وجوی درختی و مکانیزم بازتاب و آموزش با یادگیری تقویتی، زنجیره تفکر را ایجاد می‌کند و قابلیت بازاندیشی و اصلاح خودکار را فراهم می‌سازد.", "360gpt2-pro.description": "360GPT2 Pro یک مدل NLP پیشرفته از 360 است که در تولید و درک متن عملکردی عالی دارد، به‌ویژه در وظایف خلاقانه، تبدیل‌های پیچیده و ایفای نقش.", "360zhinao2-o1.description": "360zhinao2-o1 با استفاده از جست‌وجوی درختی و مکانیزم بازتاب و آموزش با یادگیری تقویتی، زنجیره تفکر را ایجاد می‌کند و قابلیت بازاندیشی و اصلاح خودکار را فراهم می‌سازد.", "4.0Ultra.description": "Spark Ultra قدرتمندترین مدل در سری Spark است که درک متن و خلاصه‌سازی را بهبود می‌بخشد و جست‌وجوی وب را ارتقا می‌دهد. این مدل راه‌حلی جامع برای افزایش بهره‌وری در محیط کار و ارائه پاسخ‌های دقیق است و به‌عنوان محصولی هوشمند پیشرو شناخته می‌شود.", "AnimeSharp.description": "AnimeSharp (با نام قبلی \"4x-TextSharpV1\") یک مدل متن‌باز برای افزایش وضوح تصاویر به سبک انیمه است که بر پایه ESRGAN توسط Kim2091 توسعه یافته است. این مدل در ابتدا برای تصاویر متنی نیز طراحی شده بود اما به‌طور ویژه برای محتوای انیمه بهینه‌سازی شده است.", "Baichuan2-Turbo.description": "با استفاده از تقویت جست‌وجو، این مدل به دانش دامنه‌ای و وب متصل می‌شود. از بارگذاری فایل‌های PDF/Word و ورودی URL پشتیبانی می‌کند تا بازیابی اطلاعات به‌موقع و جامع و خروجی‌های حرفه‌ای و دقیق را فراهم سازد.", "Baichuan3-Turbo-128k.description": "با پنجره متنی فوق‌العاده بلند ۱۲۸ هزار توکن، این مدل برای سناریوهای پرتکرار سازمانی بهینه‌سازی شده و ارزش بالایی ارائه می‌دهد. در مقایسه با Baichuan2، تولید محتوا ۲۰٪، پرسش‌وپاسخ دانشی ۱۷٪ و ایفای نقش ۴۰٪ بهبود یافته است. عملکرد کلی آن بهتر از GPT-3.5 است.", "Baichuan3-Turbo.description": "برای سناریوهای پرتکرار سازمانی بهینه‌سازی شده و ارزش بالایی ارائه می‌دهد. در مقایسه با Baichuan2، تولید محتوا ۲۰٪، پرسش‌وپاسخ دانشی ۱۷٪ و ایفای نقش ۴۰٪ بهبود یافته است. عملکرد کلی آن بهتر از GPT-3.5 است.", "Baichuan4-Air.description": "مدلی پیشرو در چین که در وظایف زبان چینی مانند دانش، متون بلند و تولید خلاقانه از مدل‌های مطرح خارجی پیشی می‌گیرد. همچنین دارای قابلیت‌های چندوجهی پیشرفته با نتایج قوی در آزمون‌های معتبر است.", "Baichuan4-Turbo.description": "مدلی پیشرو در چین که در وظایف زبان چینی مانند دانش، متون بلند و تولید خلاقانه از مدل‌های مطرح خارجی پیشی می‌گیرد. همچنین دارای قابلیت‌های چندوجهی پیشرفته با نتایج قوی در آزمون‌های معتبر است.", "Baichuan4.description": "عملکرد برتر داخلی که در وظایف زبان چینی مانند دانش دایره‌المعارفی، متون بلند و تولید خلاقانه از مدل‌های مطرح خارجی پیشی می‌گیرد. همچنین دارای قابلیت‌های چندوجهی پیشرفته و نتایج قوی در آزمون‌های معیار است.", "ByteDance-Seed/Seed-OSS-36B-Instruct.description": "Seed-OSS مجموعه‌ای از مدل‌های متن‌باز LLM از ByteDance Seed است که برای مدیریت زمینه‌های بلند، استدلال، عامل‌ها و توانایی‌های عمومی طراحی شده‌اند. Seed-OSS-36B-Instruct یک مدل ۳۶ میلیارد پارامتری با تنظیمات دستوری است که به‌طور بومی از زمینه‌های بسیار بلند برای پردازش اسناد یا پایگاه‌های کد پشتیبانی می‌کند. این مدل برای استدلال، تولید کد و وظایف عامل (استفاده از ابزار) بهینه‌سازی شده و در عین حال توانایی عمومی قوی خود را حفظ کرده است. ویژگی کلیدی آن «بودجه تفکر» است که امکان تنظیم طول استدلال برای افزایش کارایی را فراهم می‌سازد.", "DeepSeek-R1-Distill-Llama-70B.description": "مدل DeepSeek R1 که بزرگ‌تر و هوشمندتر است، در معماری Llama 70B تقطیر شده است. آزمون‌های معیار و ارزیابی‌های انسانی نشان می‌دهند که این مدل از نسخه پایه Llama 70B هوشمندتر است، به‌ویژه در وظایف ریاضی و دقت اطلاعات.", "DeepSeek-R1-Distill-Qwen-1.5B.description": "مدلی تقطیرشده از DeepSeek-R1 بر پایه Qwen2.5-Math-1.5B. با استفاده از یادگیری تقویتی و داده‌های شروع سرد، عملکرد استدلال را بهینه کرده و معیارهای جدیدی برای مدل‌های متن‌باز در وظایف چندگانه تعیین کرده است.", "DeepSeek-R1-Distill-Qwen-14B.description": "مدل‌های DeepSeek-R1-Distill از مدل‌های متن‌باز با استفاده از داده‌های نمونه تولیدشده توسط DeepSeek-R1 به‌صورت دقیق تنظیم شده‌اند.", "DeepSeek-R1-Distill-Qwen-32B.description": "مدل‌های DeepSeek-R1-Distill از مدل‌های متن‌باز با استفاده از داده‌های نمونه تولیدشده توسط DeepSeek-R1 به‌صورت دقیق تنظیم شده‌اند.", "DeepSeek-R1-Distill-Qwen-7B.description": "مدلی تقطیرشده از DeepSeek-R1 بر پایه Qwen2.5-Math-7B. با استفاده از یادگیری تقویتی و داده‌های شروع سرد، عملکرد استدلال را بهینه کرده و معیارهای جدیدی برای مدل‌های متن‌باز در وظایف چندگانه تعیین کرده است.", "DeepSeek-R1.description": "DeepSeek-R1 در مرحله پس‌آموزش از یادگیری تقویتی در مقیاس وسیع استفاده می‌کند تا توانایی استدلال را با داده‌های بسیار کم برچسب‌خورده به‌طور چشمگیری افزایش دهد. این مدل در وظایف استدلال ریاضی، کدنویسی و زبان طبیعی با مدل تولیدی OpenAI o1 برابری می‌کند.", "DeepSeek-V3-1.description": "DeepSeek V3.1 یک مدل نسل جدید استدلال با بهبود در استدلال پیچیده و زنجیره تفکر است که برای وظایف تحلیلی عمیق مناسب است.", "DeepSeek-V3-Fast.description": "ارائه‌دهنده: sophnet. DeepSeek V3 Fast نسخه با نرخ پردازش بالا از DeepSeek V3 0324 است که با دقت کامل (بدون کوانتیزه‌سازی) عملکرد قوی‌تری در کدنویسی و ریاضی دارد و پاسخ‌های سریع‌تری ارائه می‌دهد.", "DeepSeek-V3.1-Fast.description": "DeepSeek V3.1 Fast نسخه سریع با نرخ پردازش بالا از DeepSeek V3.1 است. حالت تفکر ترکیبی: از طریق قالب‌های چت، یک مدل از هر دو حالت تفکر و غیرتفکر پشتیبانی می‌کند. استفاده هوشمندانه‌تر از ابزار: پس‌آموزش عملکرد وظایف ابزار و عامل را بهبود می‌بخشد.", "DeepSeek-V3.1-Think.description": "حالت تفکر DeepSeek-V3.1: یک مدل استدلال ترکیبی جدید با حالت‌های تفکر و غیرتفکر که کارآمدتر از DeepSeek-R1-0528 است. بهینه‌سازی‌های پس‌آموزش عملکرد استفاده از ابزار عامل و وظایف عامل را به‌طور قابل‌توجهی بهبود می‌بخشد.", "DeepSeek-V3.description": "DeepSeek-V3 یک مدل MoE توسعه‌یافته توسط DeepSeek است. این مدل در بسیاری از آزمون‌های معیار از مدل‌های متن‌باز دیگر مانند Qwen2.5-72B و Llama-3.1-405B پیشی می‌گیرد و با مدل‌های بسته پیشرو مانند GPT-4o و Claude 3.5 Sonnet رقابت می‌کند.", "Doubao-lite-128k.description": "Doubao-lite پاسخ‌های فوق‌العاده سریع و ارزش بالاتری ارائه می‌دهد و گزینه‌های انعطاف‌پذیری را در سناریوهای مختلف فراهم می‌سازد. از زمینه ۱۲۸ هزار توکن برای استنتاج و تنظیم دقیق پشتیبانی می‌کند.", "Doubao-lite-32k.description": "Doubao-lite پاسخ‌های فوق‌العاده سریع و ارزش بالاتری ارائه می‌دهد و گزینه‌های انعطاف‌پذیری را در سناریوهای مختلف فراهم می‌سازد. از زمینه ۳۲ هزار توکن برای استنتاج و تنظیم دقیق پشتیبانی می‌کند.", "Doubao-lite-4k.description": "Doubao-lite پاسخ‌های فوق‌العاده سریع و ارزش بالاتری ارائه می‌دهد و گزینه‌های انعطاف‌پذیری را در سناریوهای مختلف فراهم می‌سازد. از زمینه ۴ هزار توکن برای استنتاج و تنظیم دقیق پشتیبانی می‌کند.", "Doubao-pro-128k.description": "بهترین مدل پرچم‌دار برای وظایف پیچیده با عملکرد قوی در پرسش‌وپاسخ مرجع، خلاصه‌سازی، تولید محتوا، طبقه‌بندی و ایفای نقش. از زمینه ۱۲۸ هزار توکن برای استنتاج و تنظیم دقیق پشتیبانی می‌کند.", "Doubao-pro-32k.description": "بهترین مدل پرچم‌دار برای وظایف پیچیده با عملکرد قوی در پرسش‌وپاسخ مرجع، خلاصه‌سازی، تولید محتوا، طبقه‌بندی و ایفای نقش. از زمینه ۳۲ هزار توکن برای استنتاج و تنظیم دقیق پشتیبانی می‌کند.", "Doubao-pro-4k.description": "بهترین مدل پرچم‌دار برای وظایف پیچیده با عملکرد قوی در پرسش‌وپاسخ مرجع، خلاصه‌سازی، تولید محتوا، طبقه‌بندی و ایفای نقش. از زمینه ۴ هزار توکن برای استنتاج و تنظیم دقیق پشتیبانی می‌کند.", "DreamO.description": "DreamO یک مدل متن‌باز برای سفارشی‌سازی تصویر است که به‌طور مشترک توسط ByteDance و دانشگاه پکن توسعه یافته و از معماری یکپارچه برای پشتیبانی از تولید چندوظیفه‌ای تصویر استفاده می‌کند. این مدل با مدل‌سازی ترکیبی کارآمد، تصاویر سفارشی و منسجم را بر اساس هویت، موضوع، سبک، پس‌زمینه و شرایط دیگر مشخص‌شده توسط کاربر تولید می‌کند.", "ERNIE-3.5-128K.description": "مدل زبان بزرگ پرچم‌دار بایدو که با استفاده از حجم عظیمی از متون چینی و انگلیسی آموزش دیده و توانایی بالایی در گفتگو، تولید محتوا و استفاده از افزونه‌ها دارد؛ از ادغام خودکار افزونه جستجوی بایدو برای ارائه پاسخ‌های به‌روز پشتیبانی می‌کند.", "ERNIE-3.5-8K-Preview.description": "مدل زبان بزرگ پرچم‌دار بایدو که با استفاده از حجم عظیمی از متون چینی و انگلیسی آموزش دیده و توانایی بالایی در گفتگو، تولید محتوا و استفاده از افزونه‌ها دارد؛ از ادغام خودکار افزونه جستجوی بایدو برای ارائه پاسخ‌های به‌روز پشتیبانی می‌کند.", "ERNIE-3.5-8K.description": "مدل زبان بزرگ پرچم‌دار بایدو که با استفاده از حجم عظیمی از متون چینی و انگلیسی آموزش دیده و توانایی بالایی در گفتگو، تولید محتوا و استفاده از افزونه‌ها دارد؛ از ادغام خودکار افزونه جستجوی بایدو برای ارائه پاسخ‌های به‌روز پشتیبانی می‌کند.", "ERNIE-4.0-8K-Latest.description": "مدل زبان بسیار بزرگ پرچم‌دار بایدو با ارتقاءهای جامع نسبت به ERNIE 3.5، مناسب برای انجام وظایف پیچیده در حوزه‌های مختلف؛ از ادغام افزونه جستجوی بایدو برای ارائه پاسخ‌های به‌روز پشتیبانی می‌کند.", "ERNIE-4.0-8K-Preview.description": "مدل زبان بسیار بزرگ پرچم‌دار بایدو با ارتقاءهای جامع نسبت به ERNIE 3.5، مناسب برای انجام وظایف پیچیده در حوزه‌های مختلف؛ از ادغام افزونه جستجوی بایدو برای ارائه پاسخ‌های به‌روز پشتیبانی می‌کند.", "ERNIE-4.0-Turbo-8K-Latest.description": "مدل زبان بسیار بزرگ پرچم‌دار بایدو با عملکرد کلی قدرتمند برای وظایف پیچیده، همراه با ادغام افزونه جستجوی بایدو برای پاسخ‌های به‌روز. عملکرد آن از ERNIE 4.0 بهتر است.", "ERNIE-4.0-Turbo-8K-Preview.description": "مدل زبان بسیار بزرگ پرچم‌دار بایدو با عملکرد کلی قدرتمند برای وظایف پیچیده، همراه با ادغام افزونه جستجوی بایدو برای پاسخ‌های به‌روز. عملکرد آن از ERNIE 4.0 بهتر است.", "ERNIE-Character-8K.description": "مدل زبان تخصصی بایدو برای شخصیت‌های بازی، خدمات مشتری و نقش‌آفرینی، با ثبات بیشتر در شخصیت، پیروی بهتر از دستورات و استدلال قوی‌تر.", "ERNIE-Lite-Pro-128K.description": "مدل سبک بایدو با تعادل بین کیفیت و عملکرد استنتاج، بهتر از ERNIE Lite و مناسب برای شتاب‌دهنده‌های کم‌مصرف.", "ERNIE-Speed-128K.description": "جدیدترین مدل زبان با عملکرد بالا از بایدو (۲۰۲۴) با توانایی عمومی قوی، مناسب برای تنظیم دقیق در سناریوهای خاص، با عملکرد استدلال عالی.", "ERNIE-Speed-Pro-128K.description": "جدیدترین مدل زبان با عملکرد بالا از بایدو (۲۰۲۴) با توانایی عمومی قوی، بهتر از ERNIE Speed، مناسب برای تنظیم دقیق با عملکرد استدلال عالی.", "FLUX-1.1-pro.description": "FLUX.1.1 Pro", "FLUX.1-Kontext-dev.description": "FLUX.1-Kontext-dev یک مدل چندوجهی برای تولید و ویرایش تصویر از آزمایشگاه Black Forest است که بر پایه معماری Rectified Flow Transformer با ۱۲ میلیارد پارامتر ساخته شده است. این مدل بر تولید، بازسازی، بهبود یا ویرایش تصاویر در شرایط زمینه‌ای مشخص تمرکز دارد. با ترکیب قدرت تولید قابل کنترل مدل‌های انتشار با مدل‌سازی زمینه‌ای ترنسفورمر، خروجی‌های باکیفیتی برای وظایفی مانند inpainting، outpainting و بازسازی صحنه‌های بصری ارائه می‌دهد.", "FLUX.1-Kontext-pro.description": "FLUX.1 Kontext [pro]", "FLUX.1-dev.description": "FLUX.1-dev یک مدل زبان چندوجهی متن-تصویر متن‌باز از آزمایشگاه Black Forest است که برای وظایف درک و تولید تصویر/متن بهینه‌سازی شده است. این مدل بر پایه LLMهای پیشرفته (مانند Mistral-7B) ساخته شده و از رمزگذار بینایی طراحی‌شده و تنظیمات چندمرحله‌ای دستورالعمل بهره می‌برد تا هماهنگی چندوجهی و استدلال پیچیده را ممکن سازد.", "Gryphe/MythoMax-L2-13b.description": "MythoMax-L2 (13B) مدلی نوآورانه برای حوزه‌های متنوع و وظایف پیچیده است.", "HelloMeme.description": "HelloMeme یک ابزار هوش مصنوعی برای تولید میم، گیف یا ویدیوهای کوتاه از تصاویر یا حرکاتی است که ارائه می‌دهید. بدون نیاز به مهارت طراحی یا کدنویسی، تنها با یک تصویر مرجع، محتوایی سرگرم‌کننده، جذاب و از نظر سبک هماهنگ تولید می‌کند.", "HiDream-I1-Full.description": "HiDream-E1-Full یک مدل متن‌باز ویرایش تصویر چندوجهی از HiDream.ai است که بر پایه معماری پیشرفته Diffusion Transformer و درک زبانی قوی (با LLaMA 3.1-8B-Instruct داخلی) ساخته شده است. این مدل از تولید تصویر با زبان طبیعی، انتقال سبک، ویرایش‌های محلی و بازسازی پشتیبانی می‌کند و در درک و اجرای متن-تصویر عملکرد عالی دارد.", "HunyuanDiT-v1.2-Diffusers-Distilled.description": "hunyuandit-v1.2-distilled یک مدل سبک تبدیل متن به تصویر است که با استفاده از تقطیر بهینه‌سازی شده تا تصاویر باکیفیت را به‌سرعت تولید کند، به‌ویژه مناسب برای محیط‌های کم‌منبع و تولید بلادرنگ.", "InstantCharacter.description": "InstantCharacter مدلی برای تولید شخصیت شخصی‌سازی‌شده بدون نیاز به تنظیم است که توسط Tencent AI در سال ۲۰۲۵ عرضه شده است. این مدل با هدف تولید شخصیت‌هایی با دقت بالا و سازگاری در سناریوهای مختلف طراحی شده و می‌تواند تنها با یک تصویر مرجع، شخصیت را مدل‌سازی کرده و آن را در سبک‌ها، حرکات و پس‌زمینه‌های مختلف منتقل کند.", "InternVL2-8B.description": "InternVL2-8B یک مدل قدرتمند بینایی-زبان است که از پردازش چندوجهی تصویر-متن پشتیبانی می‌کند و محتوای تصویر را با دقت شناسایی کرده و توضیحات یا پاسخ‌های مرتبط تولید می‌کند.", "InternVL2.5-26B.description": "InternVL2.5-26B یک مدل قدرتمند بینایی-زبان است که از پردازش چندوجهی تصویر-متن پشتیبانی می‌کند و محتوای تصویر را با دقت شناسایی کرده و توضیحات یا پاسخ‌های مرتبط تولید می‌کند.", "Kolors.description": "Kolors یک مدل تبدیل متن به تصویر است که توسط تیم Kolors در Kuaishou توسعه یافته است. این مدل با میلیاردها پارامتر آموزش دیده و در کیفیت بصری، درک معنایی چینی و رندر متن عملکرد برجسته‌ای دارد.", "Kwai-Kolors/Kolors.description": "Kolors یک مدل بزرگ تبدیل متن به تصویر با انتشار نهفته است که توسط تیم Kolors در Kuaishou توسعه یافته است. این مدل با میلیاردها جفت متن-تصویر آموزش دیده و در کیفیت بصری، دقت معنایی پیچیده و رندر متن چینی/انگلیسی عملکرد عالی دارد و در درک و تولید محتوای چینی بسیار قوی است.", "Kwaipilot/KAT-Dev.description": "KAT-Dev (32B) یک مدل متن‌باز برای وظایف مهندسی نرم‌افزار است. این مدل با نرخ حل ۶۲.۴٪ در SWE-Bench Verified، در میان مدل‌های متن‌باز رتبه پنجم را دارد. با آموزش میانی، تنظیم با نظارت (SFT) و یادگیری تقویتی (RL) برای تکمیل کد، رفع اشکال و بازبینی کد بهینه‌سازی شده است.", "Llama-3.2-11B-Vision-Instruct.description": "استدلال تصویری قوی روی تصاویر با وضوح بالا، مناسب برای کاربردهای درک بصری.", "Llama-3.2-90B-Vision-Instruct\t.description": "استدلال تصویری پیشرفته برای کاربردهای عامل‌های درک بصری.", "Meta-Llama-3-3-70B-Instruct.description": "Llama 3.3 70B یک مدل ترنسفورمر همه‌کاره برای گفتگو و تولید محتوا است.", "Meta-Llama-3.1-405B-Instruct.description": "مدل متنی تنظیم‌شده Llama 3.1 برای دستورالعمل‌ها که برای گفتگوهای چندزبانه بهینه‌سازی شده و در میان مدل‌های باز و بسته در ارزیابی‌های صنعتی عملکرد قوی دارد.", "Meta-Llama-3.1-70B-Instruct.description": "مدل متنی تنظیم‌شده Llama 3.1 برای دستورالعمل‌ها که برای گفتگوهای چندزبانه بهینه‌سازی شده و در میان مدل‌های باز و بسته در ارزیابی‌های صنعتی عملکرد قوی دارد.", "Meta-Llama-3.1-8B-Instruct.description": "مدل متنی تنظیم‌شده Llama 3.1 برای دستورالعمل‌ها که برای گفتگوهای چندزبانه بهینه‌سازی شده و در میان مدل‌های باز و بسته در ارزیابی‌های صنعتی عملکرد قوی دارد.", "Meta-Llama-3.2-1B-Instruct.description": "مدل زبان کوچک پیشرفته با درک زبانی قوی، استدلال عالی و تولید متن باکیفیت.", "Meta-Llama-3.2-3B-Instruct.description": "مدل زبان کوچک پیشرفته با درک زبانی قوی، استدلال عالی و تولید متن باکیفیت.", "Meta-Llama-3.3-70B-Instruct.description": "Llama 3.3 پیشرفته‌ترین مدل چندزبانه متن‌باز Llama است که عملکردی نزدیک به مدل‌های ۴۰۵B با هزینه بسیار پایین ارائه می‌دهد. این مدل بر پایه ترنسفورمر ساخته شده و با SFT و RLHF برای کاربردپذیری و ایمنی بهبود یافته است. نسخه تنظیم‌شده برای گفتگوهای چندزبانه بهینه شده و در ارزیابی‌های صنعتی بسیاری از مدل‌های باز و بسته را پشت سر گذاشته است. تاریخ قطع دانش: دسامبر ۲۰۲۳.", "Meta-Llama-4-Maverick-17B-128E-Instruct-FP8.description": "Llama 4 Maverick یک مدل MoE بزرگ با فعال‌سازی کارآمد متخصصان برای عملکرد استدلالی قوی است.", "MiniMax-M1.description": "یک مدل استدلالی داخلی جدید با ۸۰ هزار زنجیره تفکر و ورودی ۱ میلیون توکن، با عملکردی در سطح مدل‌های برتر جهانی.", "MiniMax-M2-Stable.description": "طراحی‌شده برای کدنویسی کارآمد و جریان‌های کاری عامل‌محور، با هم‌زمانی بالاتر برای استفاده تجاری.", "MiniMax-M2.1-Lightning.description": "توانایی قدرتمند در برنامه‌نویسی چندزبانه، ارتقاء کامل تجربه کدنویسی. سریع‌تر و کارآمدتر.", "MiniMax-M2.1.description": "توانایی قدرتمند در برنامه‌نویسی چندزبانه، ارتقاء کامل تجربه کدنویسی", "MiniMax-M2.description": "طراحی‌شده برای کدنویسی کارآمد و جریان‌های کاری عامل‌محور", "MiniMax-Text-01.description": "MiniMax-01 توجه خطی در مقیاس بزرگ را فراتر از ترنسفورمرهای کلاسیک معرفی می‌کند، با ۴۵۶ میلیارد پارامتر و ۴۵.۹ میلیارد پارامتر فعال در هر عبور. این مدل عملکردی در سطح برتر ارائه می‌دهد و تا ۴ میلیون توکن زمینه را پشتیبانی می‌کند (۳۲ برابر GPT-4o، ۲۰ برابر Claude-3.5-Sonnet).", "MiniMaxAI/MiniMax-M1-80k.description": "MiniMax-M1 یک مدل استدلالی با وزن‌های باز و معماری توجه ترکیبی در مقیاس بزرگ است با ۴۵۶ میلیارد پارامتر کل و حدود ۴۵.۹ میلیارد پارامتر فعال در هر توکن. این مدل به‌صورت بومی از زمینه ۱ میلیون توکن پشتیبانی می‌کند و با استفاده از Flash Attention، مصرف FLOPs را در تولید ۱۰۰ هزار توکن تا ۷۵٪ نسبت به DeepSeek R1 کاهش می‌دهد. با معماری MoE به‌همراه CISPO و آموزش تقویتی با توجه ترکیبی، عملکردی پیشرو در استدلال ورودی‌های طولانی و وظایف واقعی مهندسی نرم‌افزار ارائه می‌دهد.", "MiniMaxAI/MiniMax-M2.description": "MiniMax-M2 کارایی عامل‌ها را بازتعریف می‌کند. این مدل MoE فشرده، سریع و مقرون‌به‌صرفه با ۲۳۰ میلیارد پارامتر کل و ۱۰ میلیارد پارامتر فعال است که برای وظایف کدنویسی و عامل‌های سطح بالا طراحی شده و در عین حال هوش عمومی قوی را حفظ می‌کند. با تنها ۱۰ میلیارد پارامتر فعال، با مدل‌های بسیار بزرگ‌تر رقابت می‌کند و برای کاربردهای با کارایی بالا ایده‌آل است.", "Moonshot-Kimi-K2-Instruct.description": "با ۱ تریلیون پارامتر کل و ۳۲ میلیارد فعال، در میان مدل‌های غیرتفکری، در دانش پیشرفته، ریاضی و کدنویسی در سطح برتر قرار دارد و در وظایف عمومی عامل‌ها نیز قوی‌تر است. برای بارهای کاری عامل‌ها بهینه شده و می‌تواند اقدام کند، نه فقط پاسخ دهد. برای چت عمومی، بداهه‌گویی و تجربه‌های عامل‌محور در سطح واکنشی بدون تفکر طولانی بهترین گزینه است.", "NousResearch/Nous-Hermes-2-Mixtral-8x7B-DPO.description": "Nous Hermes 2 - Mixtral 8x7B-DPO (۴۶.۷ میلیارد) یک مدل دستورالعمل‌محور با دقت بالا برای محاسبات پیچیده است.", "OmniConsistency.description": "OmniConsistency با معرفی ترنسفورمرهای انتشار در مقیاس بزرگ (DiTs) و داده‌های سبک‌دهی‌شده جفت‌شده، ثبات سبک و تعمیم‌پذیری را در وظایف تصویر به تصویر بهبود می‌بخشد و از تخریب سبک جلوگیری می‌کند.", "Phi-3-medium-128k-instruct.description": "همان مدل Phi-3-medium با پنجره زمینه بزرگ‌تر برای RAG یا نمونه‌های چندگانه.", "Phi-3-medium-4k-instruct.description": "مدلی با ۱۴ میلیارد پارامتر و کیفیت بالاتر نسبت به Phi-3-mini، متمرکز بر داده‌های با کیفیت و نیازمند استدلال.", "Phi-3-mini-128k-instruct.description": "همان مدل Phi-3-mini با پنجره زمینه بزرگ‌تر برای RAG یا نمونه‌های چندگانه.", "Phi-3-mini-4k-instruct.description": "کوچک‌ترین عضو خانواده Phi-3، بهینه‌شده برای کیفیت و تأخیر پایین.", "Phi-3-small-128k-instruct.description": "همان مدل Phi-3-small با پنجره زمینه بزرگ‌تر برای RAG یا نمونه‌های چندگانه.", "Phi-3-small-8k-instruct.description": "مدلی با ۷ میلیارد پارامتر و کیفیت بالاتر نسبت به Phi-3-mini، متمرکز بر داده‌های با کیفیت و نیازمند استدلال.", "Phi-3.5-mini-instruct.description": "نسخه به‌روزشده مدل Phi-3-mini.", "Phi-3.5-vision-instrust.description": "نسخه به‌روزشده مدل Phi-3-vision.", "Pro/Qwen/Qwen2-7B-Instruct.description": "Qwen2-7B-Instruct یک مدل LLM با ۷ میلیارد پارامتر در سری Qwen2 است که با معماری ترنسفورمر، SwiGLU، بایاس QKV توجه و توجه گروهی طراحی شده و ورودی‌های بزرگ را مدیریت می‌کند. این مدل در درک زبان، تولید، وظایف چندزبانه، کدنویسی، ریاضی و استدلال عملکرد قوی دارد و از بسیاری از مدل‌های باز پیشی می‌گیرد و با مدل‌های اختصاصی رقابت می‌کند. در چندین معیار از Qwen1.5-7B-Chat بهتر عمل می‌کند.", "Pro/Qwen/Qwen2.5-7B-Instruct.description": "Qwen2.5-7B-Instruct بخشی از جدیدترین سری LLM علی‌بابا کلود است. این مدل ۷ میلیاردی پیشرفت‌های قابل توجهی در کدنویسی و ریاضی دارد، از بیش از ۲۹ زبان پشتیبانی می‌کند و در پیروی از دستورالعمل‌ها، درک داده‌های ساختاریافته و تولید خروجی ساختاریافته (به‌ویژه JSON) بهبود یافته است.", "Pro/Qwen/Qwen2.5-Coder-7B-Instruct.description": "Qwen2.5-Coder-7B-Instruct جدیدترین مدل LLM متمرکز بر کد از علی‌بابا کلود است. بر پایه Qwen2.5 ساخته شده و با ۵.۵ تریلیون توکن آموزش دیده، تولید کد، استدلال و اصلاح را به‌طور قابل توجهی بهبود می‌بخشد و در عین حال توانایی‌های ریاضی و عمومی را حفظ می‌کند، و پایه‌ای قوی برای عامل‌های کدنویسی فراهم می‌کند.", "Pro/Qwen/Qwen2.5-VL-7B-Instruct.description": "Qwen2.5-VL یک مدل جدید زبان-بینایی از سری Qwen با درک بصری قوی است. این مدل متن، نمودارها و چیدمان‌ها را در تصاویر تحلیل می‌کند، ویدیوهای طولانی و رویدادها را درک می‌کند، از استدلال و استفاده از ابزار پشتیبانی می‌کند، اشیاء را در قالب‌های مختلف مکان‌یابی می‌کند و خروجی‌های ساختاریافته تولید می‌کند. همچنین وضوح پویا و نرخ فریم را برای درک ویدیو بهبود می‌بخشد و کارایی رمزگذار بینایی را افزایش می‌دهد.", "Pro/THUDM/GLM-4.1V-9B-Thinking.description": "GLM-4.1V-9B-Thinking یک مدل VLM متن‌باز از Zhipu AI و آزمایشگاه KEG دانشگاه Tsinghua است که برای شناخت چندوجهی پیچیده طراحی شده است. بر پایه GLM-4-9B-0414 ساخته شده و با افزودن زنجیره تفکر و یادگیری تقویتی، استدلال میان‌وجهی و پایداری را به‌طور قابل توجهی بهبود می‌بخشد.", "Pro/THUDM/glm-4-9b-chat.description": "GLM-4-9B-Chat مدل متن‌باز GLM-4 از Zhipu AI است. این مدل در معناشناسی، ریاضی، استدلال، کدنویسی و دانش عملکرد قوی دارد. فراتر از چت چندنوبتی، از مرور وب، اجرای کد، فراخوانی ابزارهای سفارشی و استدلال متون طولانی پشتیبانی می‌کند. از ۲۶ زبان (از جمله چینی، انگلیسی، ژاپنی، کره‌ای، آلمانی) پشتیبانی می‌کند. در معیارهایی مانند AlignBench-v2، MT-Bench، MMLU و C-Eval عملکرد خوبی دارد و تا ۱۲۸ هزار توکن زمینه را برای استفاده‌های علمی و تجاری پشتیبانی می‌کند.", "Pro/deepseek-ai/DeepSeek-R1-Distill-Qwen-7B.description": "DeepSeek-R1-Distill-Qwen-7B از Qwen2.5-Math-7B استخراج شده و بر روی ۸۰۰ هزار نمونه منتخب DeepSeek-R1 تنظیم دقیق شده است. این مدل عملکرد قوی دارد: ۹۲.۸٪ در MATH-500، ۵۵.۵٪ در AIME 2024 و امتیاز ۱۱۸۹ در CodeForces برای یک مدل ۷ میلیاردی.", "Pro/deepseek-ai/DeepSeek-R1.description": "DeepSeek-R1 یک مدل استدلالی مبتنی بر یادگیری تقویتی است که تکرار را کاهش داده و خوانایی را بهبود می‌بخشد. با استفاده از داده‌های شروع سرد پیش از RL، استدلال را بیشتر تقویت می‌کند، در وظایف ریاضی، کدنویسی و استدلال با OpenAI-o1 برابری می‌کند و با آموزش دقیق، نتایج کلی را بهبود می‌بخشد.", "Pro/deepseek-ai/DeepSeek-V3.1-Terminus.description": "DeepSeek-V3.1-Terminus نسخه به‌روزشده مدل V3.1 است که به‌عنوان یک LLM عامل ترکیبی طراحی شده است. مشکلات گزارش‌شده کاربران را رفع کرده، پایداری و سازگاری زبانی را بهبود داده و نویسه‌های غیرعادی و ترکیب چینی/انگلیسی را کاهش داده است. حالت‌های تفکری و غیرتفکری را با قالب‌های چت یکپارچه می‌کند تا امکان جابجایی انعطاف‌پذیر فراهم شود. همچنین عملکرد عامل کد و عامل جستجو را برای استفاده مطمئن‌تر از ابزارها و وظایف چندمرحله‌ای بهبود می‌بخشد.", "Pro/deepseek-ai/DeepSeek-V3.2-Exp.description": "DeepSeek-V3.2-Exp یک نسخه آزمایشی از V3.2 است که پلی به سوی معماری بعدی ایجاد می‌کند. با افزودن DeepSeek Sparse Attention (DSA) بر پایه V3.1-Terminus، کارایی آموزش و استنتاج در زمینه‌های طولانی را بهبود می‌بخشد و برای استفاده از ابزارها، درک اسناد طولانی و استدلال چندمرحله‌ای بهینه شده است. برای بررسی کارایی بالاتر استدلال با بودجه زمینه بزرگ ایده‌آل است.", "Pro/deepseek-ai/DeepSeek-V3.description": "DeepSeek-V3 یک مدل MoE با ۶۷۱ میلیارد پارامتر است که از MLA و DeepSeekMoE با تعادل بار بدون اتلاف برای استنتاج و آموزش کارآمد استفاده می‌کند. با پیش‌آموزش بر روی ۱۴.۸ تریلیون توکن با کیفیت بالا و تنظیم بیشتر با SFT و RL، از سایر مدل‌های باز پیشی می‌گیرد و به مدل‌های بسته پیشرو نزدیک می‌شود.", "Pro/moonshotai/Kimi-K2-Instruct-0905.description": "Kimi K2-Instruct-0905 جدیدترین و قدرتمندترین نسخه Kimi K2 است. این مدل MoE سطح بالا با ۱ تریلیون پارامتر کل و ۳۲ میلیارد پارامتر فعال است. ویژگی‌های کلیدی شامل هوش کدنویسی عامل‌محور قوی‌تر با پیشرفت‌های قابل توجه در معیارها و وظایف واقعی عامل‌ها، به‌علاوه زیبایی‌شناسی و قابلیت استفاده بهتر در کدنویسی رابط کاربری است.", "Pro/moonshotai/Kimi-K2-Thinking.description": "Kimi K2 Thinking Turbo نسخه توربو بهینه‌شده برای سرعت استدلال و توان عملیاتی است، در حالی که استدلال چندمرحله‌ای و استفاده از ابزار K2 Thinking را حفظ می‌کند. این مدل MoE با حدود ۱ تریلیون پارامتر کل، زمینه بومی ۲۵۶ هزار توکن و فراخوانی ابزار در مقیاس بزرگ پایدار برای سناریوهای تولیدی با نیازهای سخت‌گیرانه‌تر در تأخیر و هم‌زمانی است.", "Pro/zai-org/glm-4.7.description": "GLM-4.7 مدل پرچم‌دار نسل جدید شرکت Zhipu است که دارای ۳۵۵ میلیارد پارامتر کلی و ۳۲ میلیارد پارامتر فعال می‌باشد. این مدل در زمینه‌های گفت‌وگوی عمومی، استدلال و توانایی‌های عامل هوشمند به‌طور کامل ارتقاء یافته است. GLM-4.7 قابلیت Interleaved Thinking (تفکر درهم‌تنیده) را بهبود داده و مفاهیم Preserved Thinking (تفکر حفظ‌شده) و Turn-level Thinking (تفکر در سطح نوبت) را معرفی کرده است.", "QwQ-32B-Preview.description": "Qwen QwQ یک مدل تحقیقاتی آزمایشی است که بر بهبود توانایی استدلال تمرکز دارد.", "Qwen/QVQ-72B-Preview.description": "QVQ-72B-Preview یک مدل تحقیقاتی از Qwen است که بر استدلال بصری تمرکز دارد و در درک صحنه‌های پیچیده و حل مسائل ریاضی بصری توانمند است.", "Qwen/QwQ-32B-Preview.description": "Qwen QwQ یک مدل تحقیقاتی آزمایشی است که بر بهبود استدلال هوش مصنوعی تمرکز دارد.", "Qwen/QwQ-32B.description": "QwQ یک مدل استدلال از خانواده Qwen است. در مقایسه با مدل‌های استاندارد تنظیم‌شده با دستورالعمل، این مدل تفکر و استدلال را اضافه می‌کند که عملکرد مدل را در وظایف دشوار به‌طور قابل توجهی بهبود می‌بخشد. QwQ-32B یک مدل استدلال میان‌رده است که با مدل‌های برتر مانند DeepSeek-R1 و o1-mini رقابت می‌کند. این مدل از RoPE، SwiGLU، RMSNorm و بایاس QKV در توجه استفاده می‌کند و دارای ۶۴ لایه و ۴۰ سر توجه Q (با ۸ KV در GQA) است.", "Qwen/Qwen-Image-Edit-2509.description": "Qwen-Image-Edit-2509 جدیدترین نسخه ویرایش مدل Qwen-Image از تیم Qwen است. این مدل بر پایه Qwen-Image با ۲۰ میلیارد پارامتر ساخته شده و قابلیت رندر دقیق متن را به ویرایش تصویر گسترش می‌دهد. با استفاده از معماری کنترل دوگانه، ورودی‌ها را به Qwen2.5-VL برای کنترل معنایی و به رمزگذار VAE برای کنترل ظاهر ارسال می‌کند و امکان ویرایش در سطح معنا و ظاهر را فراهم می‌سازد. این مدل از ویرایش‌های محلی (افزودن/حذف/تغییر) و ویرایش‌های معنایی سطح بالا مانند خلق IP و انتقال سبک پشتیبانی می‌کند و در عین حال معنا را حفظ می‌نماید. این مدل در چندین معیار عملکرد پیشرفته‌ای (SOTA) دارد.", "Qwen/Qwen-Image.description": "Qwen-Image یک مدل پایه تولید تصویر با ۲۰ میلیارد پارامتر از تیم Qwen است. این مدل در رندر متن‌های پیچیده و ویرایش دقیق تصویر، به‌ویژه برای متون چینی/انگلیسی با وفاداری بالا، پیشرفت چشمگیری دارد. از چیدمان‌های چندخطی و پاراگرافی پشتیبانی می‌کند و انسجام تایپوگرافی را حفظ می‌نماید. فراتر از رندر متن، از سبک‌های متنوعی از واقع‌گرایانه تا انیمه پشتیبانی می‌کند و قابلیت‌هایی مانند انتقال سبک، افزودن/حذف اشیاء، افزایش جزئیات، ویرایش متن و کنترل حالت را ارائه می‌دهد و هدف آن تبدیل شدن به یک مدل پایه جامع برای خلق بصری است.", "Qwen/Qwen2-72B-Instruct.description": "Qwen 2 Instruct (72B) دستورالعمل‌ها را با دقت بالا برای بارهای کاری سازمانی دنبال می‌کند.", "Qwen/Qwen2-7B-Instruct.description": "Qwen2-7B-Instruct یک مدل ۷ میلیارد پارامتری تنظیم‌شده با دستورالعمل در سری Qwen2 است که از Transformer، SwiGLU، بایاس QKV و توجه با پرس‌وجوی گروهی استفاده می‌کند. این مدل ورودی‌های بزرگ را پردازش می‌کند و در معیارهای درک، تولید، چندزبانه، کدنویسی، ریاضی و استدلال عملکرد قوی دارد و از بیشتر مدل‌های باز پیشی می‌گیرد و در چندین ارزیابی از Qwen1.5-7B-Chat بهتر عمل می‌کند.", "Qwen/Qwen2-VL-72B-Instruct.description": "Qwen2-VL جدیدترین مدل Qwen-VL است که در معیارهای بینایی مانند MathVista، DocVQA، RealWorldQA و MTVQA به سطح پیشرفته (SOTA) رسیده است. این مدل توانایی درک ویدیوهای بیش از ۲۰ دقیقه را برای پرسش و پاسخ ویدیویی، گفت‌وگو و تولید محتوا دارد. همچنین از استدلال پیچیده و تصمیم‌گیری پشتیبانی می‌کند و با دستگاه‌ها/ربات‌ها برای اقدامات مبتنی بر بینایی یکپارچه می‌شود. فراتر از زبان‌های انگلیسی و چینی، این مدل می‌تواند متون را به زبان‌های مختلف از جمله بیشتر زبان‌های اروپایی، ژاپنی، کره‌ای، عربی و ویتنامی بخواند.", "Qwen/Qwen2.5-14B-Instruct.description": "Qwen2.5-14B-Instruct بخشی از جدیدترین سری مدل‌های زبانی بزرگ (LLM) علی‌بابا کلود است. این مدل ۱۴ میلیارد پارامتری پیشرفت‌های قابل توجهی در کدنویسی و ریاضی دارد، از بیش از ۲۹ زبان پشتیبانی می‌کند و در دنبال کردن دستورالعمل‌ها، درک داده‌های ساختاریافته و تولید خروجی ساختاریافته (به‌ویژه JSON) بهبود یافته است.", "Qwen/Qwen2.5-32B-Instruct.description": "Qwen2.5-32B-Instruct بخشی از جدیدترین سری مدل‌های زبانی بزرگ (LLM) علی‌بابا کلود است. این مدل ۳۲ میلیارد پارامتری پیشرفت‌های قابل توجهی در کدنویسی و ریاضی دارد، از بیش از ۲۹ زبان پشتیبانی می‌کند و در دنبال کردن دستورالعمل‌ها، درک داده‌های ساختاریافته و تولید خروجی ساختاریافته (به‌ویژه JSON) بهبود یافته است.", "Qwen/Qwen2.5-72B-Instruct-128K.description": "Qwen2.5-72B-Instruct بخشی از جدیدترین سری مدل‌های زبانی بزرگ (LLM) علی‌بابا کلود است. این مدل ۷۲ میلیارد پارامتری در کدنویسی و ریاضی بهبود یافته، از ورودی تا ۱۲۸ هزار توکن و خروجی بیش از ۸ هزار توکن پشتیبانی می‌کند، بیش از ۲۹ زبان را پوشش می‌دهد و در دنبال کردن دستورالعمل‌ها و تولید خروجی ساختاریافته (به‌ویژه JSON) عملکرد بهتری دارد.", "Qwen/Qwen2.5-72B-Instruct-Turbo.description": "Qwen2.5 یک خانواده جدید از مدل‌های زبانی بزرگ است که برای وظایف مبتنی بر دستورالعمل بهینه‌سازی شده است.", "Qwen/Qwen2.5-72B-Instruct.description": "Qwen2.5-72B-Instruct بخشی از جدیدترین سری مدل‌های زبانی بزرگ (LLM) علی‌بابا کلود است. این مدل ۷۲ میلیارد پارامتری پیشرفت‌های قابل توجهی در کدنویسی و ریاضی دارد، از بیش از ۲۹ زبان پشتیبانی می‌کند و در دنبال کردن دستورالعمل‌ها، درک داده‌های ساختاریافته و تولید خروجی ساختاریافته (به‌ویژه JSON) بهبود یافته است.", "Qwen/Qwen2.5-7B-Instruct-Turbo.description": "Qwen2.5 یک خانواده جدید از مدل‌های زبانی بزرگ است که برای وظایف مبتنی بر دستورالعمل بهینه‌سازی شده است.", "Qwen/Qwen2.5-7B-Instruct.description": "Qwen2.5-7B-Instruct بخشی از جدیدترین سری مدل‌های زبانی بزرگ (LLM) علی‌بابا کلود است. این مدل ۷ میلیارد پارامتری پیشرفت‌های قابل توجهی در کدنویسی و ریاضی دارد، از بیش از ۲۹ زبان پشتیبانی می‌کند و در دنبال کردن دستورالعمل‌ها، درک داده‌های ساختاریافته و تولید خروجی ساختاریافته (به‌ویژه JSON) بهبود یافته است.", "Qwen/Qwen2.5-Coder-32B-Instruct.description": "Qwen2.5 Coder 32B Instruct جدیدترین مدل کدنویسی علی‌بابا کلود است. این مدل بر پایه Qwen2.5 ساخته شده و با ۵.۵ تریلیون توکن آموزش دیده است. این مدل به‌طور قابل توجهی در تولید کد، استدلال و اصلاح کد بهبود یافته و در عین حال توانایی‌های ریاضی و عمومی خود را حفظ کرده است و پایه‌ای قوی برای عامل‌های کدنویسی فراهم می‌کند.", "Qwen/Qwen2.5-Coder-7B-Instruct.description": "Qwen2.5-Coder-7B-Instruct جدیدترین مدل کدنویسی علی‌بابا کلود است. این مدل بر پایه Qwen2.5 ساخته شده و با ۵.۵ تریلیون توکن آموزش دیده است. این مدل به‌طور قابل توجهی در تولید کد، استدلال و اصلاح کد بهبود یافته و در عین حال توانایی‌های ریاضی و عمومی خود را حفظ کرده است و پایه‌ای محکم برای عامل‌های کدنویسی فراهم می‌کند.", "Qwen/Qwen2.5-VL-32B-Instruct.description": "Qwen2.5-VL-32B-Instruct یک مدل چندوجهی از تیم Qwen است. این مدل اشیاء رایج را شناسایی کرده و متن، نمودارها، آیکون‌ها، گرافیک‌ها و چیدمان‌ها را تحلیل می‌کند. به‌عنوان یک عامل بصری، می‌تواند استدلال کند و ابزارها را به‌صورت پویا کنترل نماید، از جمله استفاده از رایانه و تلفن. این مدل اشیاء را با دقت مکان‌یابی کرده و خروجی‌های ساختاریافته برای فاکتورها و جداول تولید می‌کند. در مقایسه با Qwen2-VL، نسخه RL در ریاضی و حل مسئله بهبود یافته و پاسخ‌هایی با ترجیح انسانی بیشتری ارائه می‌دهد.", "Qwen/Qwen2.5-VL-72B-Instruct.description": "Qwen2.5-VL مدل بینایی-زبان در سری Qwen2.5 است که با ارتقاءهای عمده همراه است: درک بصری قوی‌تر برای اشیاء، متن، نمودارها و چیدمان‌ها؛ استدلال به‌عنوان یک عامل بصری با استفاده پویا از ابزارها؛ درک ویدیوهای بیش از ۱ ساعت و ثبت رویدادهای کلیدی؛ مکان‌یابی دقیق اشیاء از طریق جعبه‌ها یا نقاط؛ و خروجی‌های ساختاریافته برای داده‌های اسکن‌شده مانند فاکتورها و جداول.", "Qwen/Qwen3-14B.description": "Qwen3 یک مدل نسل جدید از خانواده Tongyi Qwen است که پیشرفت‌های چشمگیری در استدلال، توانایی عمومی، قابلیت‌های عامل‌محور و عملکرد چندزبانه دارد و از تغییر حالت‌های تفکر پشتیبانی می‌کند.", "Qwen/Qwen3-235B-A22B-Instruct-2507.description": "Qwen3-235B-A22B-Instruct-2507 یک مدل پرچم‌دار MoE از سری Qwen3 با ۲۳۵ میلیارد پارامتر کل و ۲۲ میلیارد پارامتر فعال است. این نسخه غیرتفکری به‌روزرسانی شده، بر بهبود پیروی از دستورالعمل‌ها، استدلال منطقی، درک متن، ریاضیات، علوم، برنامه‌نویسی و استفاده از ابزار تمرکز دارد. همچنین دانش چندزبانه در حوزه‌های کم‌کاربرد را گسترش داده و با ترجیحات کاربران در وظایف ذهنی و باز بهتر هم‌راستا می‌شود.", "Qwen/Qwen3-235B-A22B-Thinking-2507.description": "Qwen3-235B-A22B-Thinking-2507 یک مدل Qwen3 متمرکز بر استدلال پیچیده و دشوار است. این مدل از معماری MoE با ۲۳۵ میلیارد پارامتر کل و حدود ۲۲ میلیارد پارامتر فعال در هر توکن استفاده می‌کند تا بهره‌وری را افزایش دهد. به‌عنوان یک مدل تفکری اختصاصی، پیشرفت‌های چشمگیری در منطق، ریاضیات، علوم، برنامه‌نویسی و معیارهای دانشگاهی نشان می‌دهد و به عملکردی در سطح برتر در تفکر باز می‌رسد. همچنین پیروی از دستورالعمل‌ها، استفاده از ابزار و تولید متن را بهبود می‌بخشد و به‌صورت بومی از زمینه ۲۵۶ هزار توکن برای استدلال عمیق و اسناد طولانی پشتیبانی می‌کند.", "Qwen/Qwen3-235B-A22B.description": "Qwen3 یک مدل نسل جدید از خانواده Tongyi Qwen است که پیشرفت‌های چشمگیری در استدلال، توانایی عمومی، قابلیت‌های عامل‌محور و عملکرد چندزبانه دارد و از تغییر حالت‌های تفکر پشتیبانی می‌کند.", "Qwen/Qwen3-30B-A3B-Instruct-2507.description": "Qwen3-30B-A3B-Instruct-2507 نسخه غیرتفکری به‌روزرسانی‌شده Qwen3-30B-A3B است. این مدل MoE دارای ۳۰.۵ میلیارد پارامتر کل و ۳.۳ میلیارد پارامتر فعال است. این مدل به‌طور قابل‌توجهی پیروی از دستورالعمل‌ها، استدلال منطقی، درک متن، ریاضیات، علوم، برنامه‌نویسی و استفاده از ابزار را بهبود می‌بخشد، دانش چندزبانه در حوزه‌های کم‌کاربرد را گسترش می‌دهد و با ترجیحات کاربران در وظایف ذهنی باز بهتر هم‌راستا می‌شود. از زمینه ۲۵۶ هزار توکن پشتیبانی می‌کند. این مدل فقط در حالت غیرتفکری عمل می‌کند و تگ‌های `` تولید نمی‌کند.", "Qwen/Qwen3-30B-A3B-Thinking-2507.description": "Qwen3-30B-A3B-Thinking-2507 جدیدترین مدل تفکری در سری Qwen3 است. این مدل MoE با ۳۰.۵ میلیارد پارامتر کل و ۳.۳ میلیارد پارامتر فعال، بر وظایف پیچیده تمرکز دارد. پیشرفت‌های قابل‌توجهی در منطق، ریاضیات، علوم، برنامه‌نویسی و معیارهای دانشگاهی نشان می‌دهد و پیروی از دستورالعمل‌ها، استفاده از ابزار، تولید متن و هم‌راستایی با ترجیحات را بهبود می‌بخشد. به‌صورت بومی از زمینه ۲۵۶ هزار توکن پشتیبانی می‌کند و قابلیت گسترش تا ۱ میلیون توکن را دارد. این نسخه برای حالت تفکری طراحی شده و استدلال گام‌به‌گام دقیق و قابلیت‌های قوی عامل‌محور ارائه می‌دهد.", "Qwen/Qwen3-30B-A3B.description": "Qwen3 یک مدل نسل جدید از خانواده Tongyi Qwen است که پیشرفت‌های چشمگیری در استدلال، توانایی عمومی، قابلیت‌های عامل‌محور و عملکرد چندزبانه دارد و از تغییر حالت‌های تفکر پشتیبانی می‌کند.", "Qwen/Qwen3-32B.description": "Qwen3 یک مدل نسل جدید از خانواده Tongyi Qwen است که پیشرفت‌های چشمگیری در استدلال، توانایی عمومی، قابلیت‌های عامل‌محور و عملکرد چندزبانه دارد و از تغییر حالت‌های تفکر پشتیبانی می‌کند.", "Qwen/Qwen3-8B.description": "Qwen3 یک مدل نسل جدید از خانواده Tongyi Qwen است که پیشرفت‌های چشمگیری در استدلال، توانایی عمومی، قابلیت‌های عامل‌محور و عملکرد چندزبانه دارد و از تغییر حالت‌های تفکر پشتیبانی می‌کند.", "Qwen/Qwen3-Coder-30B-A3B-Instruct.description": "Qwen3-Coder-30B-A3B-Instruct یک مدل کدنویسی از تیم Qwen است. این مدل برای عملکرد بالا و بهره‌وری بهینه‌سازی شده و توانایی‌های کدنویسی را تقویت می‌کند. در کدنویسی عامل‌محور، عملیات خودکار مرورگر و استفاده از ابزار در میان مدل‌های باز عملکرد برجسته‌ای دارد. به‌صورت بومی از زمینه ۲۵۶ هزار توکن پشتیبانی می‌کند و می‌تواند تا ۱ میلیون توکن برای درک در سطح پایگاه کد گسترش یابد. این مدل کدنویسی عامل‌محور را در پلتفرم‌هایی مانند Qwen Code و CLINE با فرمت فراخوانی تابع اختصاصی پشتیبانی می‌کند.", "Qwen/Qwen3-Coder-480B-A35B-Instruct.description": "Qwen3-Coder-480B-A35B-Instruct پیشرفته‌ترین مدل کدنویسی عامل‌محور علی‌بابا تا به امروز است. این مدل MoE با ۴۸۰ میلیارد پارامتر کل و ۳۵ میلیارد پارامتر فعال، تعادلی بین بهره‌وری و عملکرد برقرار می‌کند. به‌صورت بومی از زمینه ۲۵۶ هزار توکن پشتیبانی می‌کند و از طریق YaRN تا ۱ میلیون توکن گسترش می‌یابد و امکان پردازش پایگاه‌های کد بزرگ را فراهم می‌سازد. برای جریان‌های کاری کدنویسی عامل‌محور طراحی شده و می‌تواند با ابزارها و محیط‌ها تعامل داشته باشد تا وظایف پیچیده برنامه‌نویسی را حل کند. در معیارهای کدنویسی و عامل‌محور در میان مدل‌های باز نتایج برتری دارد و با مدل‌های پیشرو مانند Claude Sonnet 4 قابل مقایسه است.", "Qwen/Qwen3-Next-80B-A3B-Instruct.description": "Qwen3-Next-80B-A3B-Instruct یک مدل پایه نسل جدید است که از معماری Qwen3-Next برای بهره‌وری شدید در آموزش و استنتاج استفاده می‌کند. این مدل ترکیبی از توجه ترکیبی (Gated DeltaNet + Gated Attention)، MoE بسیار پراکنده و بهینه‌سازی‌های پایداری آموزش را به‌کار می‌گیرد. با ۸۰ میلیارد پارامتر کل اما حدود ۳ میلیارد پارامتر فعال در زمان استنتاج، مصرف محاسباتی را کاهش داده و بیش از ۱۰ برابر بازدهی نسبت به Qwen3-32B در زمینه‌های بالای ۳۲ هزار توکن ارائه می‌دهد. این نسخه تنظیم‌شده برای دستورالعمل‌ها، وظایف عمومی را هدف قرار می‌دهد (بدون حالت تفکری). در برخی معیارها عملکردی مشابه Qwen3-235B دارد و در وظایف با زمینه بسیار طولانی مزایای قابل‌توجهی نشان می‌دهد.", "Qwen/Qwen3-Next-80B-A3B-Thinking.description": "Qwen3-Next-80B-A3B-Thinking یک مدل پایه نسل جدید برای استدلال پیچیده است. این مدل از معماری Qwen3-Next با توجه ترکیبی (Gated DeltaNet + Gated Attention) و MoE بسیار پراکنده برای بهره‌وری شدید در آموزش و استنتاج استفاده می‌کند. با ۸۰ میلیارد پارامتر کل اما حدود ۳ میلیارد پارامتر فعال در زمان استنتاج، مصرف محاسباتی را کاهش داده و بیش از ۱۰ برابر بازدهی نسبت به Qwen3-32B در زمینه‌های بالای ۳۲ هزار توکن ارائه می‌دهد. این نسخه تفکری وظایف چندمرحله‌ای مانند اثبات‌ها، ترکیب کد، تحلیل منطقی و برنامه‌ریزی را هدف قرار می‌دهد و زنجیره‌ای ساختاریافته از تفکر تولید می‌کند. از Qwen3-32B-Thinking عملکرد بهتری دارد و در چندین معیار از Gemini-2.5-Flash-Thinking پیشی می‌گیرد.", "Qwen/Qwen3-Omni-30B-A3B-Captioner.description": "Qwen3-Omni-30B-A3B-Captioner یک مدل VLM از سری Qwen3 است که برای تولید کپشن‌های تصویری با کیفیت بالا، دقیق و جزئی طراحی شده است. این مدل از معماری MoE با ۳۰ میلیارد پارامتر استفاده می‌کند تا تصاویر را به‌طور عمیق درک کرده و توصیف‌های روان تولید کند. در ثبت جزئیات، درک صحنه، شناسایی اشیاء و استدلال رابطه‌ای عملکرد برجسته‌ای دارد.", "Qwen/Qwen3-Omni-30B-A3B-Instruct.description": "Qwen3-Omni-30B-A3B-Instruct یک مدل MoE از سری Qwen3 با ۳۰ میلیارد پارامتر کل و ۳ میلیارد پارامتر فعال است که عملکرد قوی را با هزینه استنتاج پایین ارائه می‌دهد. این مدل با داده‌های چندمنبعی و چندزبانه با کیفیت بالا آموزش دیده و از ورودی‌های تمام‌مدال (متن، تصویر، صدا، ویدیو) و درک و تولید میان‌مدال پشتیبانی می‌کند.", "Qwen/Qwen3-Omni-30B-A3B-Thinking.description": "Qwen3-Omni-30B-A3B-Thinking هسته تفکری Qwen3-Omni است. این مدل ورودی‌های چندمدال (متن، صدا، تصویر، ویدیو) را پردازش کرده و استدلال زنجیره‌ای پیچیده انجام می‌دهد و ورودی‌ها را به نمایش مشترک برای درک عمیق میان‌مدال تبدیل می‌کند. این مدل MoE با ۳۰ میلیارد پارامتر کل و ۳ میلیارد پارامتر فعال است که تعادلی بین استدلال قوی و بهره‌وری محاسباتی برقرار می‌کند.", "Qwen/Qwen3-VL-235B-A22B-Instruct.description": "Qwen3-VL-235B-A22B-Instruct یک مدل بزرگ تنظیم‌شده با دستورالعمل از سری Qwen3-VL است که بر پایه MoE ساخته شده و درک و تولید چندمدال عالی ارائه می‌دهد. به‌صورت بومی از زمینه ۲۵۶ هزار توکن پشتیبانی می‌کند و برای خدمات تولیدی چندمدال با هم‌زمانی بالا مناسب است.", "Qwen/Qwen3-VL-235B-A22B-Thinking.description": "Qwen3-VL-235B-A22B-Thinking نسخه تفکری پرچم‌دار Qwen3-VL است که برای استدلال پیچیده چندمدال، استدلال با زمینه طولانی و تعامل عامل‌محور در سناریوهای سازمانی بهینه‌سازی شده است.", "Qwen/Qwen3-VL-30B-A3B-Instruct.description": "Qwen3-VL-30B-A3B-Instruct نسخه تنظیم‌شده با دستورالعمل از مدل Qwen3-VL است که درک و تولید زبان-تصویر قوی دارد. به‌صورت بومی از زمینه ۲۵۶ هزار توکن برای چت چندمدال و تولید مشروط بر تصویر پشتیبانی می‌کند.", "Qwen/Qwen3-VL-30B-A3B-Thinking.description": "Qwen3-VL-30B-A3B-Thinking نسخه تقویت‌شده برای استدلال از Qwen3-VL است که برای استدلال چندمدال، تبدیل تصویر به کد و درک بصری پیچیده بهینه‌سازی شده است. از زمینه ۲۵۶ هزار توکن با توانایی قوی در زنجیره تفکر پشتیبانی می‌کند.", "Qwen/Qwen3-VL-32B-Instruct.description": "Qwen3-VL-32B-Instruct یک مدل زبان-تصویر از تیم Qwen است که نتایج پیشرفته‌ای در چندین معیار VL دارد. از تصاویر با وضوح مگاپیکسل پشتیبانی می‌کند و درک بصری قوی، OCR چندزبانه، مکان‌یابی بصری دقیق و گفت‌وگوی تصویری ارائه می‌دهد. وظایف پیچیده چندمدال را مدیریت کرده و از فراخوانی ابزار و تکمیل پیشوند پشتیبانی می‌کند.", "Qwen/Qwen3-VL-32B-Thinking.description": "Qwen3-VL-32B-Thinking برای استدلال بصری پیچیده بهینه‌سازی شده است. این مدل دارای حالت تفکری داخلی است که مراحل استدلال میانی را قبل از پاسخ تولید می‌کند و منطق چندمرحله‌ای، برنامه‌ریزی و استدلال پیچیده را تقویت می‌کند. از تصاویر مگاپیکسلی، درک بصری قوی، OCR چندزبانه، مکان‌یابی دقیق، گفت‌وگوی تصویری، فراخوانی ابزار و تکمیل پیشوند پشتیبانی می‌کند.", "Qwen/Qwen3-VL-8B-Instruct.description": "Qwen3-VL-8B-Instruct یک مدل زبان-تصویر از سری Qwen3 است که بر پایه Qwen3-8B-Instruct ساخته شده و با داده‌های بزرگ تصویر-متن آموزش دیده است. در درک بصری عمومی، گفت‌وگوی متمرکز بر تصویر و شناسایی متن چندزبانه در تصاویر عملکرد برجسته‌ای دارد و برای پرسش‌وپاسخ بصری، کپشن‌نویسی، پیروی از دستورالعمل چندمدال و استفاده از ابزار مناسب است.", "Qwen/Qwen3-VL-8B-Thinking.description": "Qwen3-VL-8B-Thinking نسخه تفکری بصری Qwen3 است که برای استدلال پیچیده چندمرحله‌ای بهینه‌سازی شده است. این مدل زنجیره تفکر را قبل از پاسخ تولید می‌کند تا دقت را افزایش دهد و برای پرسش‌وپاسخ بصری عمیق و تحلیل دقیق تصویر ایده‌آل است.", "Qwen2-72B-Instruct.description": "Qwen2 جدیدترین مدل از سری Qwen است که از پنجره متنی ۱۲۸ هزار توکن پشتیبانی می‌کند. در مقایسه با بهترین مدل‌های متن‌باز امروزی، Qwen2-72B درک زبان طبیعی، دانش، کدنویسی، ریاضیات و توانایی‌های چندزبانه را به‌طور چشمگیری بهبود می‌بخشد.", "Qwen2-7B-Instruct.description": "Qwen2 جدیدترین مدل از سری Qwen است که از بهترین مدل‌های متن‌باز هم‌رده و حتی مدل‌های بزرگ‌تر پیشی می‌گیرد. Qwen2 7B در آزمون‌های مختلف، به‌ویژه در زمینه کدنویسی و درک زبان چینی، برتری قابل‌توجهی نشان می‌دهد.", "Qwen2-VL-72B.description": "Qwen2-VL-72B یک مدل قدرتمند بینایی-زبان است که از پردازش چندوجهی تصویر-متن پشتیبانی می‌کند و می‌تواند محتوای تصویر را با دقت تشخیص داده و توصیف‌ها یا پاسخ‌های مرتبط تولید کند.", "Qwen2.5-14B-Instruct.description": "Qwen2.5-14B-Instruct یک مدل زبانی با ۱۴ میلیارد پارامتر است که عملکرد بالایی دارد و برای سناریوهای چینی و چندزبانه بهینه‌سازی شده است. این مدل از پرسش‌وپاسخ هوشمند و تولید محتوا پشتیبانی می‌کند.", "Qwen2.5-32B-Instruct.description": "Qwen2.5-32B-Instruct یک مدل زبانی با ۳۲ میلیارد پارامتر است که عملکردی متعادل دارد و برای سناریوهای چینی و چندزبانه بهینه‌سازی شده است. این مدل از پرسش‌وپاسخ هوشمند و تولید محتوا پشتیبانی می‌کند.", "Qwen2.5-72B-Instruct.description": "مدل زبانی برای زبان‌های چینی و انگلیسی، تنظیم‌شده برای زبان، کدنویسی، ریاضیات و استدلال.", "Qwen2.5-7B-Instruct.description": "Qwen2.5-7B-Instruct یک مدل زبانی با ۷ میلیارد پارامتر است که از فراخوانی توابع و یکپارچه‌سازی با سیستم‌های خارجی پشتیبانی می‌کند و انعطاف‌پذیری و قابلیت گسترش را به‌طور چشمگیری افزایش می‌دهد. این مدل برای سناریوهای چینی و چندزبانه بهینه‌سازی شده و از پرسش‌وپاسخ هوشمند و تولید محتوا پشتیبانی می‌کند.", "Qwen2.5-Coder-14B-Instruct.description": "Qwen2.5-Coder-14B-Instruct یک مدل بزرگ آموزش‌دیده برای دستورالعمل‌های کدنویسی است که در درک و تولید کد عملکرد بالایی دارد. این مدل به‌طور مؤثر طیف گسترده‌ای از وظایف برنامه‌نویسی را انجام می‌دهد و برای کدنویسی هوشمند، تولید خودکار اسکریپت و پرسش‌وپاسخ برنامه‌نویسی ایده‌آل است.", "Qwen2.5-Coder-32B-Instruct.description": "مدل پیشرفته زبانی برای تولید کد، استدلال و رفع اشکال در زبان‌های برنامه‌نویسی اصلی.", "Qwen3-235B-A22B-Instruct-2507-FP8.description": "Qwen3 235B A22B Instruct 2507 برای استدلال پیشرفته و پیروی از دستورالعمل‌ها بهینه‌سازی شده است و با استفاده از معماری MoE، استدلال را در مقیاس بالا به‌صورت کارآمد انجام می‌دهد.", "Qwen3-235B.description": "Qwen3-235B-A22B یک مدل MoE است که حالت استدلال ترکیبی را معرفی می‌کند و به کاربران اجازه می‌دهد به‌صورت یکپارچه بین حالت‌های تفکر و غیرتفکر جابجا شوند. این مدل از درک و استدلال در ۱۱۹ زبان و گویش پشتیبانی می‌کند و توانایی بالایی در فراخوانی ابزارها دارد. در آزمون‌های توانایی عمومی، کدنویسی و ریاضی، قابلیت چندزبانه و استدلال دانشی با مدل‌های پیشرو مانند DeepSeek R1، OpenAI o1، o3-mini، Grok 3 و Google Gemini 2.5 Pro رقابت می‌کند.", "Qwen3-32B.description": "Qwen3-32B یک مدل متراکم است که حالت استدلال ترکیبی را معرفی می‌کند و به کاربران اجازه می‌دهد بین تفکر و غیرتفکر جابجا شوند. با بهبود معماری، داده‌های بیشتر و آموزش بهتر، عملکردی هم‌سطح با Qwen2.5-72B دارد.", "SenseChat-128K.description": "نسخه پایه V4 با پنجره متنی ۱۲۸ هزار توکن، قوی در درک و تولید متون بلند.", "SenseChat-32K.description": "نسخه پایه V4 با پنجره متنی ۳۲ هزار توکن، انعطاف‌پذیر برای سناریوهای مختلف.", "SenseChat-5-1202.description": "جدیدترین نسخه مبتنی بر V5.5 با پیشرفت‌های چشمگیر در مبانی چینی/انگلیسی، گفت‌وگو، دانش علوم پایه، علوم انسانی، نگارش، ریاضی/منطق و کنترل طول متن.", "SenseChat-5-Cantonese.description": "طراحی‌شده بر اساس عادات گفتاری، اصطلاحات عامیانه و دانش محلی هنگ‌کنگ؛ در درک زبان کانتونی از GPT-4 پیشی می‌گیرد و در دانش، استدلال، ریاضی و کدنویسی با GPT-4 Turbo رقابت می‌کند.", "SenseChat-5-beta.description": "در برخی عملکردها از SenseChat-5-1202 پیشی می‌گیرد.", "SenseChat-5.description": "نسخه V5.5 با پنجره متنی ۱۲۸ هزار توکن؛ پیشرفت‌های عمده در استدلال ریاضی، گفت‌وگوی انگلیسی، پیروی از دستورالعمل‌ها و درک متون بلند، قابل مقایسه با GPT-4o.", "SenseChat-Character-Pro.description": "مدل پیشرفته گفت‌وگوی شخصیتی با پنجره متنی ۳۲ هزار توکن، قابلیت‌های بهبود یافته و پشتیبانی از زبان‌های چینی و انگلیسی.", "SenseChat-Character.description": "مدل استاندارد گفت‌وگوی شخصیتی با پنجره متنی ۸ هزار توکن و سرعت پاسخ‌دهی بالا.", "SenseChat-Turbo-1202.description": "جدیدترین مدل سبک‌وزن که با هزینه استنتاج بسیار کمتر، به بیش از ۹۰٪ از توانایی مدل کامل دست می‌یابد.", "SenseChat-Turbo.description": "مناسب برای سناریوهای پرسش‌وپاسخ سریع و تنظیم دقیق مدل.", "SenseChat-Vision.description": "نسخه V5.5 با ورودی چندتصویری و بهبودهای گسترده در تشخیص ویژگی‌ها، روابط فضایی، شناسایی رویداد/عمل، درک صحنه، تشخیص احساسات، استدلال عقل سلیم و درک/تولید متن.", "SenseChat.description": "نسخه پایه V4 با پنجره متنی ۴ هزار توکن و توانایی عمومی قوی.", "SenseNova-V6-5-Pro.description": "با به‌روزرسانی‌های جامع در داده‌های چندوجهی، زبانی و استدلالی و بهینه‌سازی استراتژی آموزش، این مدل به‌طور چشمگیری استدلال چندوجهی و پیروی از دستورالعمل‌های عمومی را بهبود می‌بخشد، از پنجره متنی تا ۱۲۸ هزار توکن پشتیبانی می‌کند و در وظایف OCR و شناسایی IP گردشگری فرهنگی عملکرد برجسته‌ای دارد.", "SenseNova-V6-5-Turbo.description": "با به‌روزرسانی‌های جامع در داده‌های چندوجهی، زبانی و استدلالی و بهینه‌سازی استراتژی آموزش، این مدل به‌طور چشمگیری استدلال چندوجهی و پیروی از دستورالعمل‌های عمومی را بهبود می‌بخشد، از پنجره متنی تا ۱۲۸ هزار توکن پشتیبانی می‌کند و در وظایف OCR و شناسایی IP گردشگری فرهنگی عملکرد برجسته‌ای دارد.", "SenseNova-V6-Pro.description": "به‌صورت بومی تصویر، متن و ویدیو را یکپارچه می‌کند و مرزهای سنتی چندوجهی را می‌شکند؛ در OpenCompass و SuperCLUE رتبه‌های برتر را کسب کرده است.", "SenseNova-V6-Reasoner.description": "ترکیبی از استدلال عمیق بینایی و زبان، پشتیبانی از تفکر آهسته و زنجیره کامل تفکر.", "SenseNova-V6-Turbo.description": "به‌صورت بومی تصویر، متن و ویدیو را یکپارچه می‌کند و مرزهای سنتی چندوجهی را می‌شکند. در قابلیت‌های اصلی چندوجهی و زبانی پیشتاز است و در ارزیابی‌های متعدد در رده برتر قرار دارد.", "Skylark2-lite-8k.description": "مدل نسل دوم Skylark. نسخه Skylark2-lite پاسخ‌های سریعی برای سناریوهای بلادرنگ و حساس به هزینه با نیازهای دقت پایین‌تر ارائه می‌دهد و از پنجره متنی ۸ هزار توکن پشتیبانی می‌کند.", "Skylark2-pro-32k.description": "مدل نسل دوم Skylark. نسخه Skylark2-pro دقت بالاتری برای تولید متون پیچیده مانند نگارش حرفه‌ای، رمان‌نویسی و ترجمه با کیفیت بالا ارائه می‌دهد و از پنجره متنی ۳۲ هزار توکن پشتیبانی می‌کند.", "Skylark2-pro-4k.description": "مدل نسل دوم Skylark. نسخه Skylark2-pro دقت بالاتری برای تولید متون پیچیده مانند نگارش حرفه‌ای، رمان‌نویسی و ترجمه با کیفیت بالا ارائه می‌دهد و از پنجره متنی ۴ هزار توکن پشتیبانی می‌کند.", "Skylark2-pro-character-4k.description": "مدل نسل دوم Skylark. نسخه Skylark2-pro-character در ایفای نقش و گفت‌وگو عملکرد برجسته‌ای دارد و سبک‌های شخصیتی متمایز و گفت‌وگوی طبیعی را برای چت‌بات‌ها، دستیارهای مجازی و خدمات مشتری ارائه می‌دهد، با پاسخ‌دهی سریع.", "Skylark2-pro-turbo-8k.description": "مدل نسل دوم Skylark. نسخه Skylark2-pro-turbo-8k استنتاج سریع‌تری با هزینه کمتر ارائه می‌دهد و از پنجره متنی ۸ هزار توکن پشتیبانی می‌کند.", "THUDM/GLM-4-32B-0414.description": "GLM-4-32B-0414 یک مدل نسل جدید GLM با ۳۲ میلیارد پارامتر است که از نظر عملکرد با مدل‌های OpenAI GPT و سری DeepSeek V3/R1 قابل مقایسه است.", "THUDM/GLM-4-9B-0414.description": "GLM-4-9B-0414 یک مدل ۹ میلیاردی GLM است که تکنیک‌های GLM-4-32B را به ارث برده و در عین حال استقرار سبک‌تری را ارائه می‌دهد. این مدل در تولید کد، طراحی وب، تولید SVG و نگارش مبتنی بر جستجو عملکرد خوبی دارد.", "THUDM/GLM-4.1V-9B-Thinking.description": "GLM-4.1V-9B-Thinking یک مدل VLM متن‌باز از Zhipu AI و آزمایشگاه KEG دانشگاه Tsinghua است که برای درک پیچیده چندرسانه‌ای طراحی شده است. این مدل بر پایه GLM-4-9B-0414 ساخته شده و با افزودن زنجیره تفکر و یادگیری تقویتی، توانایی استدلال میان‌وجهی و پایداری را به‌طور قابل توجهی بهبود می‌بخشد.", "THUDM/GLM-Z1-32B-0414.description": "GLM-Z1-32B-0414 یک مدل استدلال عمیق است که بر پایه GLM-4-32B-0414 با داده‌های شروع سرد و یادگیری تقویتی گسترده ساخته شده و آموزش بیشتری در زمینه ریاضی، کدنویسی و منطق دیده است. این مدل توانایی حل مسائل پیچیده و ریاضی را نسبت به مدل پایه به‌طور چشمگیری افزایش می‌دهد.", "THUDM/GLM-Z1-9B-0414.description": "GLM-Z1-9B-0414 یک مدل GLM کوچک با ۹ میلیارد پارامتر است که در عین حفظ مزایای متن‌باز، عملکرد چشمگیری ارائه می‌دهد. این مدل در استدلال ریاضی و وظایف عمومی بسیار قوی عمل کرده و در میان مدل‌های هم‌رده خود پیشتاز است.", "THUDM/GLM-Z1-Rumination-32B-0414.description": "GLM-Z1-Rumination-32B-0414 یک مدل استدلال عمیق با قابلیت تفکر تأملی است (با مدل‌های تحقیق عمیق OpenAI مقایسه شده است). برخلاف مدل‌های معمول تفکر عمیق، این مدل زمان بیشتری را صرف تأمل می‌کند تا مسائل باز و پیچیده‌تری را حل کند.", "THUDM/glm-4-9b-chat.description": "GLM-4-9B-Chat مدل متن‌باز GLM-4 از Zhipu AI است. این مدل در زمینه‌های معناشناسی، ریاضی، استدلال، کدنویسی و دانش عملکرد قوی دارد. علاوه بر گفت‌وگوی چندمرحله‌ای، از مرور وب، اجرای کد، فراخوانی ابزارهای سفارشی و استدلال متون بلند پشتیبانی می‌کند. این مدل از ۲۶ زبان (از جمله چینی، انگلیسی، ژاپنی، کره‌ای و آلمانی) پشتیبانی می‌کند و در آزمون‌هایی مانند AlignBench-v2، MT-Bench، MMLU و C-Eval عملکرد خوبی دارد. همچنین تا ۱۲۸ هزار توکن زمینه را برای کاربردهای علمی و تجاری پشتیبانی می‌کند.", "Tongyi-Zhiwen/QwenLong-L1-32B.description": "QwenLong-L1-32B نخستین مدل استدلال با زمینه بلند (LRM) است که با یادگیری تقویتی آموزش دیده و برای استدلال متون بلند بهینه‌سازی شده است. یادگیری تقویتی با گسترش تدریجی زمینه، انتقال پایدار از زمینه‌های کوتاه به بلند را ممکن می‌سازد. این مدل در هفت معیار پرسش‌وپاسخ اسناد بلند از مدل‌هایی مانند OpenAI-o3-mini و Qwen3-235B-A22B پیشی گرفته و با Claude-3.7-Sonnet-Thinking رقابت می‌کند. در زمینه ریاضی، منطق و استدلال چندمرحله‌ای بسیار قوی عمل می‌کند.", "Yi-34B-Chat.description": "Yi-1.5-34B ضمن حفظ توانایی‌های زبانی قوی سری Yi، با آموزش افزایشی بر روی ۵۰۰ میلیارد توکن با کیفیت، توانایی‌های منطق ریاضی و کدنویسی را به‌طور قابل توجهی بهبود داده است.", "abab5.5-chat.description": "برای سناریوهای بهره‌وری طراحی شده است و توانایی انجام وظایف پیچیده و تولید متن کارآمد برای استفاده حرفه‌ای را دارد.", "abab5.5s-chat.description": "برای گفت‌وگوی شخصیت‌محور به زبان چینی طراحی شده و گفت‌وگوی با کیفیت بالا به زبان چینی را در کاربردهای مختلف ارائه می‌دهد.", "abab6.5g-chat.description": "برای گفت‌وگوی شخصیت‌محور چندزبانه طراحی شده و تولید گفت‌وگوی با کیفیت به زبان انگلیسی و سایر زبان‌ها را پشتیبانی می‌کند.", "abab6.5s-chat.description": "برای طیف گسترده‌ای از وظایف پردازش زبان طبیعی مناسب است، از جمله تولید متن و سیستم‌های گفت‌وگو.", "abab6.5t-chat.description": "برای گفت‌وگوی شخصیت‌محور به زبان چینی بهینه‌سازی شده و گفت‌وگویی روان و منطبق با عادات بیانی زبان چینی ارائه می‌دهد.", "accounts/fireworks/models/deepseek-r1.description": "DeepSeek-R1 یک مدل زبان بزرگ پیشرفته است که با یادگیری تقویتی و داده‌های شروع سرد بهینه‌سازی شده و عملکرد عالی در استدلال، ریاضی و کدنویسی دارد.", "accounts/fireworks/models/deepseek-v3.description": "مدلی قدرتمند از نوع Mixture-of-Experts (MoE) از DeepSeek با ۶۷۱ میلیارد پارامتر کل و ۳۷ میلیارد پارامتر فعال در هر توکن.", "accounts/fireworks/models/llama-v3-70b-instruct.description": "Meta سری مدل‌های Meta Llama 3 را توسعه داده و منتشر کرده است که شامل مدل‌های تولید متن پیش‌آموزش‌دیده و تنظیم‌شده برای دستورالعمل در اندازه‌های ۸B و ۷۰B می‌باشد. مدل‌های تنظیم‌شده برای دستورالعمل Llama 3 برای استفاده در گفت‌وگو بهینه‌سازی شده‌اند و در بسیاری از معیارهای صنعتی از مدل‌های متن‌باز موجود پیشی می‌گیرند.", "accounts/fireworks/models/llama-v3-8b-instruct-hf.description": "مدل‌های تنظیم‌شده برای دستورالعمل Meta Llama 3 برای استفاده در گفت‌وگو بهینه‌سازی شده‌اند و در بسیاری از معیارهای صنعتی از مدل‌های متن‌باز موجود پیشی می‌گیرند. Llama 3 8B Instruct (نسخه HF) نسخه اصلی FP16 از Llama 3 8B Instruct است و نتایج آن با پیاده‌سازی رسمی Hugging Face مطابقت دارد.", "accounts/fireworks/models/llama-v3-8b-instruct.description": "Meta سری مدل‌های Meta Llama 3 را توسعه داده و منتشر کرده است که شامل مدل‌های تولید متن پیش‌آموزش‌دیده و تنظیم‌شده برای دستورالعمل در اندازه‌های ۸B و ۷۰B می‌باشد. مدل‌های تنظیم‌شده برای دستورالعمل Llama 3 برای استفاده در گفت‌وگو بهینه‌سازی شده‌اند و در بسیاری از معیارهای صنعتی از مدل‌های متن‌باز موجود پیشی می‌گیرند.", "accounts/fireworks/models/llama-v3p1-405b-instruct.description": "Meta Llama 3.1 یک خانواده چندزبانه از مدل‌های زبان بزرگ است که شامل مدل‌های تولید متن پیش‌آموزش‌دیده و تنظیم‌شده برای دستورالعمل در اندازه‌های ۸B، ۷۰B و ۴۰۵B می‌باشد. مدل‌های تنظیم‌شده برای دستورالعمل برای گفت‌وگوی چندزبانه بهینه‌سازی شده‌اند و در بسیاری از معیارهای صنعتی از مدل‌های متن‌باز و بسته پیشی می‌گیرند. مدل ۴۰۵B قدرتمندترین مدل در خانواده Llama 3.1 است و از استنتاج FP8 استفاده می‌کند که با پیاده‌سازی مرجع مطابقت دارد.", "accounts/fireworks/models/llama-v3p1-70b-instruct.description": "Meta Llama 3.1 یک خانواده چندزبانه از مدل‌های زبان بزرگ است که شامل مدل‌های تولید متن پیش‌آموزش‌دیده و تنظیم‌شده برای دستورالعمل در اندازه‌های ۸B، ۷۰B و ۴۰۵B می‌باشد. مدل‌های تنظیم‌شده برای دستورالعمل برای گفت‌وگوی چندزبانه بهینه‌سازی شده‌اند و در بسیاری از معیارهای صنعتی از مدل‌های متن‌باز و بسته پیشی می‌گیرند.", "accounts/fireworks/models/llama-v3p1-8b-instruct.description": "Meta Llama 3.1 یک خانواده چندزبانه از مدل‌های زبان بزرگ است که شامل مدل‌های تولید متن پیش‌آموزش‌دیده و تنظیم‌شده برای دستورالعمل در اندازه‌های ۸B، ۷۰B و ۴۰۵B می‌باشد. مدل‌های تنظیم‌شده برای دستورالعمل برای گفت‌وگوی چندزبانه بهینه‌سازی شده‌اند و در بسیاری از معیارهای صنعتی از مدل‌های متن‌باز و بسته پیشی می‌گیرند.", "accounts/fireworks/models/llama-v3p2-11b-vision-instruct.description": "مدل استدلال تصویری تنظیم‌شده برای دستورالعمل از Meta با ۱۱ میلیارد پارامتر، بهینه‌سازی‌شده برای شناسایی بصری، استدلال تصویری، تولید کپشن و پرسش‌وپاسخ مرتبط با تصویر. این مدل داده‌های بصری مانند نمودارها و گراف‌ها را درک می‌کند و با تولید توصیف‌های متنی از جزئیات تصویر، بینایی و زبان را به هم پیوند می‌دهد.", "accounts/fireworks/models/llama-v3p2-3b-instruct.description": "Llama 3.2 3B Instruct یک مدل چندزبانه سبک از Meta است که برای زمان اجرای کارآمد طراحی شده و نسبت به مدل‌های بزرگ‌تر تأخیر و هزینه کمتری دارد. موارد استفاده معمول شامل بازنویسی پرس‌وجو/پرامپت و کمک به نگارش است.", "accounts/fireworks/models/llama-v3p2-90b-vision-instruct.description": "مدل استدلال تصویری تنظیم‌شده برای دستورالعمل از Meta با ۹۰ میلیارد پارامتر، بهینه‌سازی‌شده برای شناسایی بصری، استدلال تصویری، تولید کپشن و پرسش‌وپاسخ مرتبط با تصویر. این مدل داده‌های بصری مانند نمودارها و گراف‌ها را درک می‌کند و با تولید توصیف‌های متنی از جزئیات تصویر، بینایی و زبان را به هم پیوند می‌دهد. توجه: این مدل در حال حاضر به‌صورت آزمایشی به‌عنوان مدل بدون سرور ارائه می‌شود. برای استفاده در تولید، توجه داشته باشید که Fireworks ممکن است استقرار آن را به‌زودی متوقف کند.", "accounts/fireworks/models/llama-v3p3-70b-instruct.description": "Llama 3.3 70B Instruct به‌روزرسانی دسامبر برای Llama 3.1 70B است. این مدل استفاده از ابزار، پشتیبانی از متن چندزبانه، ریاضی و کدنویسی را نسبت به نسخه جولای ۲۰۲۴ بهبود می‌بخشد. عملکردی در سطح پیشرو در صنعت در استدلال، ریاضی و پیروی از دستورالعمل ارائه می‌دهد و عملکردی قابل مقایسه با 3.1 405B با مزایای قابل توجه در سرعت و هزینه دارد.", "accounts/fireworks/models/mistral-small-24b-instruct-2501.description": "مدلی با ۲۴ میلیارد پارامتر و توانایی پیشرفته که با مدل‌های بزرگ‌تر قابل مقایسه است.", "accounts/fireworks/models/mixtral-8x22b-instruct.description": "Mixtral MoE 8x22B Instruct v0.1 نسخه تنظیم‌شده برای دستورالعمل از Mixtral MoE 8x22B v0.1 است که API تکمیل گفت‌وگو در آن فعال شده است.", "accounts/fireworks/models/mixtral-8x7b-instruct.description": "Mixtral MoE 8x7B Instruct نسخه تنظیم‌شده برای دستورالعمل از Mixtral MoE 8x7B است که API تکمیل گفت‌وگو در آن فعال شده است.", "accounts/fireworks/models/mythomax-l2-13b.description": "نسخه بهبودیافته‌ای از MythoMix که احتمالاً شکل پالایش‌شده‌تری از آن است و با ترکیب MythoLogic-L2 و Huginn با تکنیک ادغام تنسور بسیار تجربی ساخته شده است. ماهیت منحصربه‌فرد آن را برای داستان‌سرایی و ایفای نقش عالی می‌سازد.", "accounts/fireworks/models/phi-3-vision-128k-instruct.description": "Phi-3-Vision-128K-Instruct یک مدل چندرسانه‌ای سبک و پیشرفته است که از داده‌های مصنوعی و مجموعه داده‌های عمومی وب انتخاب‌شده ساخته شده و بر داده‌های متنی و تصویری با کیفیت بالا و نیازمند استدلال تمرکز دارد. این مدل متعلق به خانواده Phi-3 است و نسخه چندرسانه‌ای آن از طول زمینه ۱۲۸ هزار توکن پشتیبانی می‌کند. این مدل تحت بهبودهای دقیق از جمله تنظیم نظارت‌شده و بهینه‌سازی مستقیم ترجیح قرار گرفته تا پیروی دقیق از دستورالعمل و اقدامات ایمنی قوی را تضمین کند.", "accounts/fireworks/models/qwen-qwq-32b-preview.description": "مدل Qwen QwQ بر پیشرفت در استدلال هوش مصنوعی تمرکز دارد و نشان می‌دهد که مدل‌های باز می‌توانند در استدلال با مدل‌های پیشرفته بسته رقابت کنند. QwQ-32B-Preview یک نسخه آزمایشی است که با o1 برابری می‌کند و در استدلال و تحلیل در آزمون‌های GPQA، AIME، MATH-500 و LiveCodeBench از GPT-4o و Claude 3.5 Sonnet پیشی می‌گیرد. توجه: این مدل در حال حاضر به‌صورت آزمایشی و بدون سرور ارائه می‌شود. برای استفاده در محیط تولید، توجه داشته باشید که Fireworks ممکن است این استقرار را بدون اطلاع قبلی متوقف کند.", "accounts/fireworks/models/qwen2-vl-72b-instruct.description": "مدل ۷۲B Qwen-VL جدیدترین نسخه از سوی علی‌بابا است که حاصل نزدیک به یک سال نوآوری می‌باشد.", "accounts/fireworks/models/qwen2p5-72b-instruct.description": "Qwen2.5 یک سری مدل زبانی بزرگ فقط رمزگشا است که توسط تیم Qwen و علی‌بابا کلاد توسعه یافته و در اندازه‌های 0.5B، 1.5B، 3B، 7B، 14B، 32B و 72B با نسخه‌های پایه و تنظیم‌شده برای دستورالعمل‌ها ارائه می‌شود.", "accounts/fireworks/models/qwen2p5-coder-32b-instruct.description": "Qwen2.5-Coder جدیدترین مدل زبانی بزرگ Qwen برای برنامه‌نویسی است (قبلاً با نام CodeQwen شناخته می‌شد). توجه: این مدل در حال حاضر به‌صورت آزمایشی و بدون سرور ارائه می‌شود. برای استفاده در محیط تولید، توجه داشته باشید که Fireworks ممکن است این استقرار را بدون اطلاع قبلی متوقف کند.", "accounts/yi-01-ai/models/yi-large.description": "Yi-Large یک مدل زبانی سطح بالا است که در رتبه‌بندی LMSYS درست پس از GPT-4، Gemini 1.5 Pro و Claude 3 Opus قرار دارد. این مدل در پشتیبانی از زبان‌های چندگانه، به‌ویژه اسپانیایی، چینی، ژاپنی، آلمانی و فرانسوی، عملکرد برجسته‌ای دارد. Yi-Large همچنین برای توسعه‌دهندگان مناسب است و از همان ساختار API مشابه OpenAI برای یکپارچه‌سازی آسان استفاده می‌کند.", "ai21-jamba-1.5-large.description": "مدلی چندزبانه با ۳۹۸ میلیارد پارامتر (۹۴ میلیارد فعال) با پنجره متنی ۲۵۶ هزار توکن، قابلیت فراخوانی توابع، خروجی ساختاریافته و تولید مبتنی بر داده‌های واقعی.", "ai21-jamba-1.5-mini.description": "مدلی چندزبانه با ۵۲ میلیارد پارامتر (۱۲ میلیارد فعال) با پنجره متنی ۲۵۶ هزار توکن، قابلیت فراخوانی توابع، خروجی ساختاریافته و تولید مبتنی بر داده‌های واقعی.", "ai21-labs/AI21-Jamba-1.5-Large.description": "مدلی چندزبانه با ۳۹۸ میلیارد پارامتر (۹۴ میلیارد فعال) با پنجره متنی ۲۵۶ هزار توکن، قابلیت فراخوانی توابع، خروجی ساختاریافته و تولید مبتنی بر داده‌های واقعی.", "ai21-labs/AI21-Jamba-1.5-Mini.description": "مدلی چندزبانه با ۵۲ میلیارد پارامتر (۱۲ میلیارد فعال) با پنجره متنی ۲۵۶ هزار توکن، قابلیت فراخوانی توابع، خروجی ساختاریافته و تولید مبتنی بر داده‌های واقعی.", "alibaba/qwen-3-14b.description": "Qwen3 جدیدترین نسل از سری Qwen است که مجموعه‌ای جامع از مدل‌های متراکم و MoE را ارائه می‌دهد. این مدل بر پایه آموزش گسترده ساخته شده و در زمینه‌های استدلال، پیروی از دستورالعمل‌ها، قابلیت‌های عامل‌محور و پشتیبانی چندزبانه پیشرفت‌های چشمگیری دارد.", "alibaba/qwen-3-235b.description": "Qwen3 جدیدترین نسل از سری Qwen است که مجموعه‌ای جامع از مدل‌های متراکم و MoE را ارائه می‌دهد. این مدل بر پایه آموزش گسترده ساخته شده و در زمینه‌های استدلال، پیروی از دستورالعمل‌ها، قابلیت‌های عامل‌محور و پشتیبانی چندزبانه پیشرفت‌های چشمگیری دارد.", "alibaba/qwen-3-30b.description": "Qwen3 جدیدترین نسل از سری Qwen است که مجموعه‌ای جامع از مدل‌های متراکم و MoE را ارائه می‌دهد. این مدل بر پایه آموزش گسترده ساخته شده و در زمینه‌های استدلال، پیروی از دستورالعمل‌ها، قابلیت‌های عامل‌محور و پشتیبانی چندزبانه پیشرفت‌های چشمگیری دارد.", "alibaba/qwen-3-32b.description": "Qwen3 جدیدترین نسل از سری Qwen است که مجموعه‌ای جامع از مدل‌های متراکم و MoE را ارائه می‌دهد. این مدل بر پایه آموزش گسترده ساخته شده و در زمینه‌های استدلال، پیروی از دستورالعمل‌ها، قابلیت‌های عامل‌محور و پشتیبانی چندزبانه پیشرفت‌های چشمگیری دارد.", "alibaba/qwen3-coder.description": "Qwen3-Coder-480B-A35B-Instruct پیشرفته‌ترین مدل برنامه‌نویسی Qwen است که در وظایف کدنویسی عامل‌محور، استفاده از مرورگر توسط عامل و سایر وظایف اصلی برنامه‌نویسی عملکردی قوی دارد و نتایجی در سطح Claude Sonnet ارائه می‌دهد.", "amazon/nova-lite.description": "مدلی چندوجهی با هزینه بسیار پایین که ورودی‌های تصویر، ویدیو و متن را با سرعت بسیار بالا پردازش می‌کند.", "amazon/nova-micro.description": "مدلی فقط متنی با تأخیر بسیار پایین و هزینه بسیار کم.", "amazon/nova-pro.description": "مدلی چندوجهی با قابلیت بالا که بهترین تعادل بین دقت، سرعت و هزینه را برای طیف گسترده‌ای از وظایف ارائه می‌دهد.", "amazon/titan-embed-text-v2.description": "Amazon Titan Text Embeddings V2 یک مدل جاسازی چندزبانه سبک و کارآمد است که از ابعاد ۱۰۲۴، ۵۱۲ و ۲۵۶ پشتیبانی می‌کند.", "anthropic.claude-3-5-sonnet-20240620-v1:0.description": "Claude 3.5 Sonnet استاندارد صنعت را ارتقا داده و در ارزیابی‌های گسترده از رقبا و Claude 3 Opus پیشی می‌گیرد، در حالی که سرعت و هزینه متوسط را حفظ می‌کند.", "anthropic.claude-3-5-sonnet-20241022-v2:0.description": "Claude 3.5 Sonnet استاندارد صنعت را ارتقا داده و در ارزیابی‌های گسترده از رقبا و Claude 3 Opus پیشی می‌گیرد، در حالی که سرعت و هزینه متوسط را حفظ می‌کند.", "anthropic.claude-3-haiku-20240307-v1:0.description": "Claude 3 Haiku سریع‌ترین و فشرده‌ترین مدل Anthropic است که پاسخ‌های تقریباً فوری برای پرسش‌های ساده ارائه می‌دهد. این مدل تجربه‌ای روان و شبیه انسان را فراهم کرده و از ورودی تصویری با پنجره متنی ۲۰۰ هزار توکن پشتیبانی می‌کند.", "anthropic.claude-3-opus-20240229-v1:0.description": "Claude 3 Opus قدرتمندترین مدل هوش مصنوعی Anthropic است که در وظایف بسیار پیچیده عملکردی در سطح پیشرفته دارد. این مدل درخواست‌های باز و سناریوهای جدید را با روانی و درک انسانی استثنایی مدیریت می‌کند و از ورودی تصویری با پنجره متنی ۲۰۰ هزار توکن پشتیبانی می‌کند.", "anthropic.claude-3-sonnet-20240229-v1:0.description": "Claude 3 Sonnet تعادلی بین هوش و سرعت برای بارهای کاری سازمانی فراهم می‌کند و ارزش بالایی را با هزینه کمتر ارائه می‌دهد. این مدل برای استقرار گسترده هوش مصنوعی طراحی شده و از ورودی تصویری با پنجره متنی ۲۰۰ هزار توکن پشتیبانی می‌کند.", "anthropic.claude-instant-v1.description": "مدلی سریع، اقتصادی و در عین حال توانمند برای چت روزمره، تحلیل متن، خلاصه‌سازی و پرسش و پاسخ اسناد.", "anthropic.claude-v2.description": "مدلی بسیار توانمند برای وظایف مختلف از گفت‌وگوی پیچیده و تولید خلاقانه تا پیروی دقیق از دستورالعمل‌ها.", "anthropic.claude-v2:1.description": "نسخه به‌روزشده Claude 2 با دو برابر پنجره متنی و بهبود در قابلیت اطمینان، کاهش توهمات و دقت مبتنی بر شواهد برای اسناد طولانی و بازیابی اطلاعات.", "anthropic/claude-3-haiku.description": "Claude 3 Haiku سریع‌ترین مدل Anthropic است که برای بارهای کاری سازمانی با درخواست‌های طولانی طراحی شده است. این مدل می‌تواند اسناد بزرگ مانند گزارش‌های فصلی، قراردادها یا پرونده‌های حقوقی را با نیمی از هزینه رقبا تحلیل کند.", "anthropic/claude-3-opus.description": "Claude 3 Opus هوشمندترین مدل Anthropic است که در وظایف بسیار پیچیده عملکردی در سطح بازار دارد و درخواست‌های باز و سناریوهای جدید را با روانی و درک انسانی استثنایی مدیریت می‌کند.", "anthropic/claude-3.5-haiku.description": "Claude 3.5 Haiku دارای سرعت بیشتر، دقت بالاتر در کدنویسی و استفاده از ابزارها است و برای سناریوهایی با نیازهای بالا به سرعت و تعامل با ابزارها مناسب است.", "anthropic/claude-3.5-sonnet.description": "Claude 3.5 Sonnet مدل سریع و کارآمد خانواده Sonnet است که عملکرد بهتری در کدنویسی و استدلال ارائه می‌دهد و برخی نسخه‌های آن به تدریج با Sonnet 3.7 و نسخه‌های بعدی جایگزین می‌شوند.", "anthropic/claude-3.7-sonnet.description": "Claude 3.7 Sonnet نسخه ارتقایافته مدل Sonnet با استدلال و کدنویسی قوی‌تر است که برای وظایف پیچیده در سطح سازمانی مناسب می‌باشد.", "anthropic/claude-haiku-4.5.description": "Claude Haiku 4.5 مدل سریع با عملکرد بالا از Anthropic است که تأخیر بسیار کم را در کنار دقت بالا ارائه می‌دهد.", "anthropic/claude-opus-4.1.description": "Opus 4.1 مدل سطح بالای Anthropic است که برای برنامه‌نویسی، استدلال پیچیده و وظایف طولانی بهینه‌سازی شده است.", "anthropic/claude-opus-4.5.description": "Claude Opus 4.5 مدل پرچم‌دار Anthropic است که هوش سطح بالا را با عملکرد مقیاس‌پذیر برای وظایف پیچیده و استدلال با کیفیت بالا ترکیب می‌کند.", "anthropic/claude-opus-4.description": "Opus 4 مدل پرچم‌دار Anthropic است که برای وظایف پیچیده و کاربردهای سازمانی طراحی شده است.", "anthropic/claude-sonnet-4.5.description": "Claude Sonnet 4.5 جدیدترین مدل استدلال ترکیبی Anthropic است که برای استدلال پیچیده و کدنویسی بهینه‌سازی شده است.", "anthropic/claude-sonnet-4.description": "Claude Sonnet 4 مدل استدلال ترکیبی Anthropic است که قابلیت تفکر و عدم تفکر را با هم ترکیب می‌کند.", "ascend-tribe/pangu-pro-moe.description": "Pangu-Pro-MoE 72B-A16B یک مدل زبانی پراکنده با ۷۲ میلیارد پارامتر کل و ۱۶ میلیارد پارامتر فعال است که بر پایه معماری MoE گروه‌بندی‌شده (MoGE) ساخته شده است. این مدل با گروه‌بندی متخصصان در زمان انتخاب و محدود کردن فعال‌سازی توکن‌ها به تعداد مساوی متخصص در هر گروه، تعادل بار را حفظ کرده و بهره‌وری استقرار را در پلتفرم Ascend بهبود می‌بخشد.", "aya.description": "Aya 23 مدل چندزبانه شرکت Cohere است که از ۲۳ زبان برای کاربردهای متنوع پشتیبانی می‌کند.", "aya:35b.description": "Aya 23 مدل چندزبانه شرکت Cohere است که از ۲۳ زبان برای کاربردهای متنوع پشتیبانی می‌کند.", "azure-DeepSeek-R1-0528.description": "این مدل توسط مایکروسافت استقرار یافته است؛ DeepSeek R1 به نسخه DeepSeek-R1-0528 ارتقا یافته است. این به‌روزرسانی با افزایش توان محاسباتی و بهینه‌سازی الگوریتم‌های پس‌آموزش، عمق استدلال و استنتاج را به‌طور چشمگیری بهبود می‌بخشد. عملکرد آن در آزمون‌های ریاضی، برنامه‌نویسی و منطق عمومی بسیار قوی است و به مدل‌های پیشرو مانند O3 و Gemini 2.5 Pro نزدیک می‌شود.", "baichuan-m2-32b.description": "Baichuan M2 32B یک مدل MoE از شرکت Baichuan Intelligence است که در استدلال عملکرد قدرتمندی دارد.", "baichuan/baichuan2-13b-chat.description": "Baichuan-13B یک مدل زبانی منبع‌باز با ۱۳ میلیارد پارامتر است که برای استفاده تجاری نیز مجاز است. این مدل در آزمون‌های معتبر چینی و انگلیسی، بهترین نتایج را در میان مدل‌های هم‌رده خود کسب کرده است.", "baidu/ERNIE-4.5-300B-A47B.description": "ERNIE-4.5-300B-A47B یک مدل MoE از شرکت Baidu با ۳۰۰ میلیارد پارامتر کل و ۴۷ میلیارد پارامتر فعال به ازای هر توکن است که تعادل بین عملکرد قوی و بهره‌وری محاسباتی را برقرار می‌کند. این مدل به‌عنوان هسته اصلی ERNIE 4.5 در درک، تولید، استدلال و برنامه‌نویسی بسیار توانمند است. با استفاده از روش پیش‌آموزش چندوجهی ناهمگن MoE و آموزش مشترک متن-تصویر، توانایی کلی خود را به‌ویژه در پیروی از دستورالعمل‌ها و دانش عمومی افزایش داده است.", "baidu/ernie-5.0-thinking-preview.description": "پیش‌نمایش مدل ERNIE 5.0 Thinking نسل بعدی مدل چندوجهی بومی شرکت Baidu است که در درک چندوجهی، پیروی از دستورالعمل‌ها، تولید محتوا، پرسش و پاسخ واقعی و استفاده از ابزارها عملکرد بسیار خوبی دارد.", "black-forest-labs/flux-1.1-pro.description": "FLUX 1.1 Pro نسخه سریع‌تر و بهبودیافته FLUX Pro است که کیفیت تصویر عالی و تبعیت دقیق از دستورات را ارائه می‌دهد.", "black-forest-labs/flux-dev.description": "FLUX Dev نسخه توسعه‌ای مدل FLUX برای استفاده غیرتجاری است.", "black-forest-labs/flux-pro.description": "FLUX Pro مدل حرفه‌ای FLUX برای تولید تصاویر با کیفیت بالا است.", "black-forest-labs/flux-schnell.description": "FLUX Schnell یک مدل تولید تصویر سریع است که برای سرعت بهینه‌سازی شده است.", "c4ai-aya-expanse-32b.description": "Aya Expanse یک مدل چندزبانه قدرتمند با ۳۲ میلیارد پارامتر است که با استفاده از تنظیمات دستوری، انتخاب داده، آموزش ترجیحی و ادغام مدل‌ها، عملکردی در حد مدل‌های تک‌زبانه ارائه می‌دهد. این مدل از ۲۳ زبان پشتیبانی می‌کند.", "c4ai-aya-expanse-8b.description": "Aya Expanse یک مدل چندزبانه قدرتمند با ۸ میلیارد پارامتر است که با استفاده از تنظیمات دستوری، انتخاب داده، آموزش ترجیحی و ادغام مدل‌ها، عملکردی در حد مدل‌های تک‌زبانه ارائه می‌دهد. این مدل از ۲۳ زبان پشتیبانی می‌کند.", "c4ai-aya-vision-32b.description": "Aya Vision یک مدل چندوجهی پیشرفته است که در آزمون‌های کلیدی زبان، متن و تصویر عملکرد بسیار خوبی دارد. این نسخه ۳۲ میلیاردی بر عملکرد چندزبانه سطح بالا تمرکز دارد و از ۲۳ زبان پشتیبانی می‌کند.", "c4ai-aya-vision-8b.description": "Aya Vision یک مدل چندوجهی پیشرفته است که در آزمون‌های کلیدی زبان، متن و تصویر عملکرد بسیار خوبی دارد. این نسخه ۸ میلیاردی بر تأخیر کم و عملکرد قوی تمرکز دارد.", "charglm-3.description": "CharGLM-3 برای نقش‌آفرینی و همراهی احساسی طراحی شده است و از حافظه چندنوبتی بسیار طولانی و گفت‌وگوی شخصی‌سازی‌شده پشتیبانی می‌کند.", "charglm-4.description": "CharGLM-4 برای نقش‌آفرینی و همراهی احساسی طراحی شده است و از حافظه چندنوبتی بسیار طولانی و گفت‌وگوی شخصی‌سازی‌شده پشتیبانی می‌کند.", "chatgpt-4o-latest.description": "ChatGPT-4o یک مدل پویا است که به‌صورت بلادرنگ به‌روزرسانی می‌شود و درک و تولید قوی را برای کاربردهای وسیع مانند پشتیبانی مشتری، آموزش و پشتیبانی فنی ترکیب می‌کند.", "claude-2.0.description": "Claude 2 بهبودهای کلیدی برای سازمان‌ها ارائه می‌دهد، از جمله زمینه ۲۰۰ هزار توکنی پیشرو، کاهش توهمات، دستورات سیستمی و ویژگی آزمایشی جدید: فراخوانی ابزار.", "claude-2.1.description": "Claude 2 بهبودهای کلیدی برای سازمان‌ها ارائه می‌دهد، از جمله زمینه ۲۰۰ هزار توکنی پیشرو، کاهش توهمات، دستورات سیستمی و ویژگی آزمایشی جدید: فراخوانی ابزار.", "claude-3-5-haiku-20241022.description": "Claude 3.5 Haiku سریع‌ترین مدل نسل جدید Anthropic است. در مقایسه با Claude 3 Haiku، در مهارت‌ها بهبود یافته و در بسیاری از معیارهای هوش از مدل بزرگ‌تر قبلی، Claude 3 Opus، پیشی می‌گیرد.", "claude-3-5-haiku-latest.description": "Claude 3.5 Haiku پاسخ‌های سریع برای وظایف سبک ارائه می‌دهد.", "claude-3-7-sonnet-20250219.description": "Claude 3.7 Sonnet هوشمندترین مدل Anthropic و نخستین مدل استدلال ترکیبی در بازار است. این مدل می‌تواند پاسخ‌های تقریباً فوری یا استدلال گام‌به‌گام و قابل مشاهده تولید کند. Sonnet به‌ویژه در برنامه‌نویسی، علم داده، بینایی رایانه‌ای و وظایف عامل‌ها بسیار قدرتمند است.", "claude-3-7-sonnet-latest.description": "Claude 3.7 Sonnet جدیدترین و توانمندترین مدل Anthropic برای وظایف بسیار پیچیده است که در عملکرد، هوش، روانی و درک زبان برتری دارد.", "claude-3-haiku-20240307.description": "Claude 3 Haiku سریع‌ترین و فشرده‌ترین مدل Anthropic است که برای پاسخ‌های تقریباً فوری با عملکرد سریع و دقیق طراحی شده است.", "claude-3-opus-20240229.description": "Claude 3 Opus قدرتمندترین مدل Anthropic برای وظایف بسیار پیچیده است که در عملکرد، هوش، روانی و درک زبان برتری دارد.", "claude-3-sonnet-20240229.description": "Claude 3 Sonnet تعادل بین هوش و سرعت را برای بارهای کاری سازمانی برقرار می‌کند و با هزینه کمتر، بهره‌وری بالا و استقرار قابل اعتماد در مقیاس وسیع را ارائه می‌دهد.", "claude-haiku-4-5-20251001.description": "Claude Haiku 4.5 سریع‌ترین و هوشمندترین مدل Haiku از Anthropic است که با سرعتی برق‌آسا و توانایی استدلال پیشرفته ارائه می‌شود.", "claude-opus-4-1-20250805-thinking.description": "Claude Opus 4.1 Thinking یک نسخه پیشرفته است که می‌تواند فرآیند استدلال خود را آشکار کند.", "claude-opus-4-1-20250805.description": "Claude Opus 4.1 جدیدترین و توانمندترین مدل Anthropic برای وظایف بسیار پیچیده است که در عملکرد، هوش، روانی و درک زبان برتری دارد.", "claude-opus-4-20250514.description": "Claude Opus 4 قدرتمندترین مدل Anthropic برای وظایف بسیار پیچیده است و در عملکرد، هوش، روانی و درک مطلب برتری دارد.", "claude-opus-4-5-20251101.description": "Claude Opus 4.5 مدل پرچم‌دار Anthropic است که هوش برجسته را با عملکرد مقیاس‌پذیر ترکیب می‌کند و برای وظایف پیچیده‌ای که نیاز به پاسخ‌های باکیفیت و استدلال دارند، ایده‌آل است.", "claude-sonnet-4-20250514-thinking.description": "Claude Sonnet 4 Thinking می‌تواند پاسخ‌های تقریباً فوری یا تفکر گام‌به‌گام طولانی با فرآیند قابل مشاهده تولید کند.", "claude-sonnet-4-20250514.description": "Claude Sonnet 4 می‌تواند پاسخ‌های تقریباً فوری یا تفکر گام‌به‌گام با فرآیند قابل مشاهده تولید کند.", "claude-sonnet-4-5-20250929.description": "Claude Sonnet 4.5 هوشمندترین مدل Anthropic تا به امروز است.", "codegeex-4.description": "CodeGeeX-4 یک دستیار هوش مصنوعی قدرتمند برای برنامه‌نویسی است که از پرسش و پاسخ چندزبانه و تکمیل کد پشتیبانی می‌کند تا بهره‌وری توسعه‌دهندگان را افزایش دهد.", "codegeex4-all-9b.description": "CodeGeeX4-ALL-9B یک مدل تولید کد چندزبانه است که از تکمیل و تولید کد، مفسر کد، جستجوی وب، فراخوانی توابع و پرسش و پاسخ در سطح مخزن پشتیبانی می‌کند و طیف گسترده‌ای از سناریوهای توسعه نرم‌افزار را پوشش می‌دهد. این مدل یکی از بهترین مدل‌های کد زیر ۱۰ میلیارد پارامتر است.", "codegemma.description": "CodeGemma یک مدل سبک برای وظایف متنوع برنامه‌نویسی است که امکان تکرار سریع و یکپارچه‌سازی آسان را فراهم می‌کند.", "codegemma:2b.description": "CodeGemma یک مدل سبک برای وظایف متنوع برنامه‌نویسی است که امکان تکرار سریع و یکپارچه‌سازی آسان را فراهم می‌کند.", "codellama.description": "Code Llama یک مدل زبانی بزرگ متمرکز بر تولید و بحث در مورد کد است که از زبان‌های مختلف برای جریان‌های کاری توسعه‌دهندگان پشتیبانی می‌کند.", "codellama/CodeLlama-34b-Instruct-hf.description": "Code Llama یک مدل زبانی بزرگ متمرکز بر تولید و بحث در مورد کد است که از زبان‌های مختلف برای جریان‌های کاری توسعه‌دهندگان پشتیبانی می‌کند.", "codellama:13b.description": "Code Llama یک مدل زبانی بزرگ متمرکز بر تولید و بحث در مورد کد است که از زبان‌های مختلف برای جریان‌های کاری توسعه‌دهندگان پشتیبانی می‌کند.", "codellama:34b.description": "Code Llama یک مدل زبانی بزرگ متمرکز بر تولید و بحث در مورد کد است که از زبان‌های مختلف برای جریان‌های کاری توسعه‌دهندگان پشتیبانی می‌کند.", "codellama:70b.description": "Code Llama یک مدل زبانی بزرگ متمرکز بر تولید و بحث در مورد کد است که از زبان‌های مختلف برای جریان‌های کاری توسعه‌دهندگان پشتیبانی می‌کند.", "codeqwen.description": "CodeQwen1.5 یک مدل زبانی بزرگ است که بر پایه داده‌های گسترده کد آموزش دیده و برای وظایف پیچیده برنامه‌نویسی طراحی شده است.", "codestral-latest.description": "Codestral پیشرفته‌ترین مدل کدنویسی ماست؛ نسخه v2 (ژانویه ۲۰۲۵) برای وظایف با تأخیر کم و فرکانس بالا مانند FIM، اصلاح کد و تولید تست بهینه شده است.", "codestral.description": "Codestral اولین مدل کدنویسی از Mistral AI است که پشتیبانی قوی برای تولید کد ارائه می‌دهد.", "codex-mini-latest.description": "codex-mini-latest نسخه تنظیم‌شده مدل o4-mini برای رابط خط فرمان Codex است. برای استفاده مستقیم از API، توصیه می‌شود با gpt-4.1 شروع کنید.", "cogito-2.1:671b.description": "Cogito v2.1 671B یک مدل زبان بازمتن آمریکایی است که برای استفاده تجاری رایگان است. این مدل عملکردی در حد مدل‌های برتر دارد، بازدهی بالای استدلال با توکن، زمینه طولانی ۱۲۸هزار توکنی و توانایی کلی قوی ارائه می‌دهد.", "cogview-4.description": "CogView-4 نخستین مدل متن به تصویر بازمتن Zhipu است که توانایی تولید نویسه‌های چینی را دارد. این مدل درک معنایی، کیفیت تصویر و رندر متن چینی/انگلیسی را بهبود می‌بخشد، از دستورات دو زبانه با طول دلخواه پشتیبانی می‌کند و می‌تواند تصاویر را در هر وضوحی در محدوده مشخص تولید کند.", "cohere-command-r-plus.description": "Command R+ یک مدل پیشرفته بهینه‌شده برای RAG است که برای بارهای کاری سازمانی طراحی شده است.", "cohere-command-r.description": "Command R یک مدل مولد مقیاس‌پذیر است که برای استفاده در RAG و ابزارها طراحی شده و هوش مصنوعی در سطح تولید را ممکن می‌سازد.", "cohere/Cohere-command-r-plus.description": "Command R+ یک مدل پیشرفته بهینه‌شده برای RAG است که برای بارهای کاری سازمانی طراحی شده است.", "cohere/Cohere-command-r.description": "Command R یک مدل مولد مقیاس‌پذیر است که برای استفاده در RAG و ابزارها طراحی شده و هوش مصنوعی در سطح تولید را ممکن می‌سازد.", "cohere/command-a.description": "Command A قوی‌ترین مدل Cohere تا به امروز است که در استفاده از ابزارها، عامل‌ها، RAG و کاربردهای چندزبانه برتری دارد. این مدل دارای طول زمینه ۲۵۶هزار توکن است، تنها با دو GPU اجرا می‌شود و ۱۵۰٪ بازدهی بالاتری نسبت به Command R+ 08-2024 دارد.", "cohere/command-r-plus.description": "Command R+ جدیدترین مدل زبان بزرگ Cohere است که برای چت و زمینه طولانی بهینه شده و عملکردی استثنایی ارائه می‌دهد تا شرکت‌ها بتوانند از نمونه‌سازی فراتر روند.", "cohere/command-r.description": "Command R برای وظایف چت و زمینه طولانی بهینه شده و به عنوان مدلی «مقیاس‌پذیر» معرفی می‌شود که تعادل بین عملکرد بالا و دقت را برقرار می‌کند تا شرکت‌ها بتوانند از نمونه‌سازی فراتر روند.", "cohere/embed-v4.0.description": "مدلی برای طبقه‌بندی یا تبدیل متن، تصویر یا محتوای ترکیبی به بردارهای تعبیه‌شده.", "comfyui/flux-dev.description": "FLUX.1 Dev یک مدل متن به تصویر با کیفیت بالا (۱۰ تا ۵۰ مرحله) است که برای خروجی‌های خلاقانه و هنری ممتاز ایده‌آل است.", "comfyui/flux-kontext-dev.description": "FLUX.1 Kontext-dev یک مدل ویرایش تصویر است که از ویرایش‌های هدایت‌شده با متن، از جمله ویرایش‌های محلی و انتقال سبک پشتیبانی می‌کند.", "comfyui/flux-krea-dev.description": "FLUX.1 Krea-dev یک مدل متن به تصویر با فیلترهای ایمنی داخلی است که با همکاری Krea توسعه یافته است.", "comfyui/flux-schnell.description": "FLUX.1 Schnell یک مدل متن به تصویر فوق‌سریع است که تصاویر با کیفیت بالا را در ۱ تا ۴ مرحله تولید می‌کند و برای استفاده بلادرنگ و نمونه‌سازی سریع ایده‌آل است.", "comfyui/stable-diffusion-15.description": "Stable Diffusion 1.5 یک مدل کلاسیک متن به تصویر با وضوح ۵۱۲x۵۱۲ است که برای نمونه‌سازی سریع و آزمایش‌های خلاقانه مناسب است.", "comfyui/stable-diffusion-35-inclclip.description": "Stable Diffusion 3.5 با رمزگذارهای داخلی CLIP/T5 نیازی به فایل‌های رمزگذار خارجی ندارد و برای مدل‌هایی مانند sd3.5_medium_incl_clips با مصرف منابع کمتر مناسب است.", "comfyui/stable-diffusion-35.description": "Stable Diffusion 3.5 یک مدل نسل جدید متن به تصویر است که در دو نسخه بزرگ و متوسط ارائه می‌شود. این مدل به فایل‌های رمزگذار CLIP خارجی نیاز دارد و کیفیت تصویر عالی و تبعیت دقیق از دستورات را ارائه می‌دهد.", "comfyui/stable-diffusion-custom-refiner.description": "مدل تصویر به تصویر SDXL سفارشی. از custom_sd_lobe.safetensors به عنوان نام فایل مدل استفاده کنید؛ اگر VAE دارید، از custom_sd_vae_lobe.safetensors استفاده کنید. فایل‌های مدل را در پوشه‌های مورد نیاز Comfy قرار دهید.", "comfyui/stable-diffusion-custom.description": "مدل متن به تصویر SD سفارشی. از custom_sd_lobe.safetensors به عنوان نام فایل مدل استفاده کنید؛ اگر VAE دارید، از custom_sd_vae_lobe.safetensors استفاده کنید. فایل‌های مدل را در پوشه‌های مورد نیاز Comfy قرار دهید.", "comfyui/stable-diffusion-refiner.description": "مدل تصویر به تصویر SDXL که تبدیل‌های با کیفیت بالا از تصاویر ورودی انجام می‌دهد و از انتقال سبک، بازسازی و تغییرات خلاقانه پشتیبانی می‌کند.", "comfyui/stable-diffusion-xl.description": "SDXL یک مدل متن به تصویر است که از تولید تصاویر با وضوح بالا ۱۰۲۴x۱۰۲۴ پشتیبانی می‌کند و کیفیت و جزئیات تصویر بهتری ارائه می‌دهد.", "command-a-03-2025.description": "Command A توانمندترین مدل ما تا به امروز است که در استفاده از ابزارها، عامل‌ها، RAG و سناریوهای چندزبانه برتری دارد. این مدل دارای پنجره زمینه ۲۵۶هزار توکن است، تنها با دو GPU اجرا می‌شود و ۱۵۰٪ بازدهی بالاتری نسبت به Command R+ 08-2024 دارد.", "command-light-nightly.description": "برای کاهش فاصله بین نسخه‌های اصلی، نسخه‌های شبانه Command را ارائه می‌دهیم. برای سری command-light، این نسخه command-light-nightly نام دارد. این نسخه جدیدترین و آزمایشی‌ترین (و احتمالاً ناپایدارترین) نسخه است که به‌طور منظم و بدون اطلاع به‌روزرسانی می‌شود، بنابراین برای استفاده در تولید توصیه نمی‌شود.", "command-light.description": "نسخه‌ای کوچک‌تر و سریع‌تر از Command که تقریباً به همان اندازه توانمند است اما سریع‌تر عمل می‌کند.", "command-nightly.description": "برای کاهش فاصله بین نسخه‌های اصلی، نسخه‌های شبانه Command را ارائه می‌دهیم. برای سری Command، این نسخه command-nightly نام دارد. این نسخه جدیدترین و آزمایشی‌ترین (و احتمالاً ناپایدارترین) نسخه است که به‌طور منظم و بدون اطلاع به‌روزرسانی می‌شود، بنابراین برای استفاده در تولید توصیه نمی‌شود.", "command-r-03-2024.description": "Command R یک مدل چت پیرو دستورالعمل است که کیفیت بالاتر، قابلیت اطمینان بیشتر و پنجره زمینه طولانی‌تری نسبت به مدل‌های قبلی دارد. این مدل از جریان‌های کاری پیچیده مانند تولید کد، RAG، استفاده از ابزار و عامل‌ها پشتیبانی می‌کند.", "command-r-08-2024.description": "command-r-08-2024 نسخه به‌روزرسانی‌شده مدل Command R است که در آگوست ۲۰۲۴ منتشر شده است.", "command-r-plus-04-2024.description": "command-r-plus نام مستعار command-r-plus-04-2024 است، بنابراین استفاده از command-r-plus در API به آن مدل اشاره دارد.", "command-r-plus-08-2024.description": "Command R+ یک مدل چت پیرو دستورالعمل است که کیفیت بالاتر، قابلیت اطمینان بیشتر و پنجره زمینه طولانی‌تری نسبت به مدل‌های قبلی دارد. این مدل برای جریان‌های کاری پیچیده RAG و استفاده چندمرحله‌ای از ابزارها بهترین گزینه است.", "command-r-plus.description": "Command R+ یک مدل زبان بزرگ با عملکرد بالا است که برای سناریوهای واقعی سازمانی و برنامه‌های پیچیده طراحی شده است.", "command-r.description": "Command R یک مدل زبان بزرگ بهینه‌شده برای چت و وظایف با زمینه طولانی است که برای تعامل پویا و مدیریت دانش ایده‌آل است.", "command-r7b-12-2024.description": "command-r7b-12-2024 یک به‌روزرسانی کوچک و کارآمد است که در دسامبر ۲۰۲۴ منتشر شده است. این مدل در RAG، استفاده از ابزار و وظایف عامل‌ها که نیاز به استدلال پیچیده و چندمرحله‌ای دارند، عملکرد عالی دارد.", "command.description": "مدل چت پیرو دستورالعمل که کیفیت و قابلیت اطمینان بالاتری در وظایف زبانی ارائه می‌دهد و پنجره زمینه طولانی‌تری نسبت به مدل‌های مولد پایه ما دارد.", "computer-use-preview.description": "computer-use-preview یک مدل تخصصی برای ابزار «استفاده از رایانه» است که برای درک و اجرای وظایف مرتبط با رایانه آموزش دیده است.", "dall-e-2.description": "مدل نسل دوم DALL·E با تولید تصاویر واقع‌گرایانه‌تر، دقیق‌تر و وضوحی ۴ برابر بیشتر از نسل اول.", "dall-e-3.description": "جدیدترین مدل DALL·E که در نوامبر ۲۰۲۳ منتشر شد و از تولید تصاویر واقع‌گرایانه‌تر، دقیق‌تر و با جزئیات قوی‌تر پشتیبانی می‌کند.", "meta.llama3-8b-instruct-v1:0.description": "متا لاما ۳ یک مدل زبان باز برای توسعه‌دهندگان، پژوهشگران و شرکت‌ها است که برای کمک به ساخت، آزمایش و گسترش مسئولانه ایده‌های هوش مصنوعی مولد طراحی شده است. این مدل به‌عنوان بخشی از زیرساخت نوآوری جامعه جهانی، برای محیط‌هایی با منابع محدود، دستگاه‌های لبه و زمان‌های آموزش سریع مناسب است.", "meta/Llama-3.2-11B-Vision-Instruct.description": "استدلال تصویری قوی بر روی تصاویر با وضوح بالا، مناسب برای برنامه‌های درک بصری.", "meta/Llama-3.2-90B-Vision-Instruct.description": "استدلال تصویری پیشرفته برای برنامه‌های عامل با قابلیت درک بصری.", "meta/Llama-3.3-70B-Instruct.description": "لاما ۳.۳ پیشرفته‌ترین مدل چندزبانه متن‌باز لاما است که عملکردی نزدیک به مدل‌های ۴۰۵ میلیارد پارامتری را با هزینه بسیار پایین ارائه می‌دهد. این مدل مبتنی بر ترنسفورمر بوده و با SFT و RLHF برای افزایش کارایی و ایمنی بهبود یافته است. نسخه تنظیم‌شده برای دستورالعمل‌ها برای چت چندزبانه بهینه شده و در بسیاری از معیارهای صنعتی از مدل‌های باز و بسته پیشی می‌گیرد. تاریخ قطع دانش: دسامبر ۲۰۲۳.", "meta/Meta-Llama-3-70B-Instruct.description": "مدلی قدرتمند با ۷۰ میلیارد پارامتر که در استدلال، برنامه‌نویسی و وظایف زبانی گسترده عملکرد بالایی دارد.", "meta/Meta-Llama-3-8B-Instruct.description": "مدلی همه‌کاره با ۸ میلیارد پارامتر که برای چت و تولید متن بهینه شده است.", "meta/Meta-Llama-3.1-405B-Instruct.description": "مدل متنی تنظیم‌شده لاما ۳.۱ برای چت چندزبانه، با عملکرد قوی در معیارهای صنعتی رایج در میان مدل‌های چت باز و بسته.", "meta/Meta-Llama-3.1-70B-Instruct.description": "مدل متنی تنظیم‌شده لاما ۳.۱ برای چت چندزبانه، با عملکرد قوی در معیارهای صنعتی رایج در میان مدل‌های چت باز و بسته.", "meta/Meta-Llama-3.1-8B-Instruct.description": "مدل متنی تنظیم‌شده لاما ۳.۱ برای چت چندزبانه، با عملکرد قوی در معیارهای صنعتی رایج در میان مدل‌های چت باز و بسته.", "meta/llama-3-70b.description": "مدلی متن‌باز با ۷۰ میلیارد پارامتر که توسط متا برای پیروی از دستورالعمل‌ها تنظیم شده و توسط Groq بر روی سخت‌افزار LPU برای استنتاج سریع و کارآمد ارائه می‌شود.", "meta/llama-3-8b.description": "مدلی متن‌باز با ۸ میلیارد پارامتر که توسط متا برای پیروی از دستورالعمل‌ها تنظیم شده و توسط Groq بر روی سخت‌افزار LPU برای استنتاج سریع و کارآمد ارائه می‌شود.", "meta/llama-3.1-405b-instruct.description": "مدلی پیشرفته برای تولید داده مصنوعی، تقطیر دانش و استدلال در چت‌بات‌ها، برنامه‌نویسی و وظایف تخصصی.", "meta/llama-3.1-70b-instruct.description": "طراحی‌شده برای گفت‌وگوهای پیچیده با درک عالی از زمینه، استدلال و تولید متن.", "meta/llama-3.1-70b.description": "نسخه به‌روزشده لاما ۳.۱ با ۷۰ میلیارد پارامتر، پشتیبانی از زمینه ۱۲۸ هزار توکن، پشتیبانی چندزبانه و استدلال بهبود یافته.", "meta/llama-3.1-8b-instruct.description": "مدلی پیشرفته با درک زبانی قوی، توانایی استدلال و تولید متن.", "meta/llama-3.1-8b.description": "لاما ۳.۱ با ۸ میلیارد پارامتر از پنجره زمینه ۱۲۸ هزار توکن پشتیبانی می‌کند، برای چت بلادرنگ و تحلیل داده‌ها ایده‌آل است و در مقایسه با مدل‌های بزرگ‌تر صرفه‌جویی قابل‌توجهی در هزینه دارد. توسط Groq بر روی سخت‌افزار LPU برای استنتاج سریع و کارآمد ارائه می‌شود.", "meta/llama-3.2-11b-vision-instruct.description": "مدلی پیشرفته در حوزه بینایی-زبان که در استدلال با کیفیت بالا از تصاویر عملکرد درخشانی دارد.", "meta/llama-3.2-11b.description": "مدل استدلال تصویری تنظیم‌شده برای دستورالعمل‌ها (ورودی متن+تصویر، خروجی متن) که برای شناسایی بصری، استدلال تصویری، زیرنویس‌گذاری و پرسش‌وپاسخ عمومی تصویری بهینه شده است.", "meta/llama-3.2-1b-instruct.description": "مدل زبانی کوچک و پیشرفته با درک قوی، توانایی استدلال و تولید متن.", "meta/llama-3.2-1b.description": "مدل فقط متنی برای استفاده در دستگاه‌هایی مانند بازیابی محلی چندزبانه، خلاصه‌سازی و بازنویسی.", "meta/llama-3.2-3b-instruct.description": "مدل زبانی کوچک و پیشرفته با درک قوی، توانایی استدلال و تولید متن.", "meta/llama-3.2-3b.description": "مدل فقط متنی تنظیم‌شده برای استفاده در دستگاه‌هایی مانند بازیابی محلی چندزبانه، خلاصه‌سازی و بازنویسی.", "meta/llama-3.2-90b-vision-instruct.description": "مدلی پیشرفته در حوزه بینایی-زبان که در استدلال با کیفیت بالا از تصاویر عملکرد درخشانی دارد.", "meta/llama-3.2-90b.description": "مدل استدلال تصویری تنظیم‌شده برای دستورالعمل‌ها (ورودی متن+تصویر، خروجی متن) که برای شناسایی بصری، استدلال تصویری، زیرنویس‌گذاری و پرسش‌وپاسخ عمومی تصویری بهینه شده است.", "meta/llama-3.3-70b-instruct.description": "مدلی پیشرفته با توانایی بالا در استدلال، ریاضی، منطق عمومی و فراخوانی توابع.", "meta/llama-3.3-70b.description": "ترکیبی ایده‌آل از عملکرد و بهره‌وری. طراحی‌شده برای هوش مصنوعی مکالمه‌ای با عملکرد بالا در تولید محتوا، برنامه‌های سازمانی و پژوهش، با درک زبانی قوی برای خلاصه‌سازی، طبقه‌بندی، تحلیل احساسات و تولید کد.", "meta/llama-4-maverick.description": "خانواده لاما ۴ مجموعه‌ای از مدل‌های بومی چندوجهی است که از متن و ورودی‌های چندرسانه‌ای پشتیبانی می‌کند و با استفاده از MoE درک پیشرفته‌ای از متن و تصویر ارائه می‌دهد. لاما ۴ ماوریک یک مدل ۱۷ میلیاردی با ۱۲۸ متخصص است که توسط DeepInfra ارائه می‌شود.", "meta/llama-4-scout.description": "خانواده لاما ۴ مجموعه‌ای از مدل‌های بومی چندوجهی است که از متن و ورودی‌های چندرسانه‌ای پشتیبانی می‌کند و با استفاده از MoE درک پیشرفته‌ای از متن و تصویر ارائه می‌دهد. لاما ۴ اسکات یک مدل ۱۷ میلیاردی با ۱۶ متخصص است که توسط DeepInfra ارائه می‌شود.", "moonshot-v1-128k-vision-preview.description": "مدل‌های بینایی Kimi (شامل moonshot-v1-8k-vision-preview/moonshot-v1-32k-vision-preview/moonshot-v1-128k-vision-preview) قادر به درک محتوای تصاویر مانند متن، رنگ‌ها و اشکال اشیاء هستند.", "moonshot-v1-128k.description": "Moonshot V1 128K با پشتیبانی از زمینه بسیار طولانی، امکان تولید متون بسیار بلند را فراهم می‌کند و تا ۱۲۸٬۰۰۰ توکن را برای سناریوهای پژوهشی، دانشگاهی و اسناد بزرگ مدیریت می‌کند.", "moonshot-v1-32k-vision-preview.description": "مدل‌های بینایی Kimi (شامل moonshot-v1-8k-vision-preview/moonshot-v1-32k-vision-preview/moonshot-v1-128k-vision-preview) قادر به درک محتوای تصاویر مانند متن، رنگ‌ها و اشکال اشیاء هستند.", "moonshot-v1-32k.description": "Moonshot V1 32K از ۳۲٬۷۶۸ توکن برای زمینه‌های متوسط پشتیبانی می‌کند و برای اسناد بلند و گفتگوهای پیچیده در تولید محتوا، گزارش‌ها و سامانه‌های چت ایده‌آل است.", "moonshot-v1-8k-vision-preview.description": "مدل‌های بینایی Kimi (شامل moonshot-v1-8k-vision-preview/moonshot-v1-32k-vision-preview/moonshot-v1-128k-vision-preview) قادر به درک محتوای تصاویر مانند متن، رنگ‌ها و اشکال اشیاء هستند.", "moonshot-v1-8k.description": "Moonshot V1 8K برای تولید متون کوتاه بهینه‌سازی شده و عملکردی کارآمد دارد. این مدل تا ۸٬۱۹۲ توکن را برای چت‌های کوتاه، یادداشت‌ها و محتوای سریع مدیریت می‌کند.", "moonshot-v1-auto.description": "Moonshot V1 Auto به‌طور خودکار مدل مناسب را بر اساس میزان استفاده از توکن‌های زمینه انتخاب می‌کند.", "moonshotai/Kimi-Dev-72B.description": "Kimi-Dev-72B یک مدل کد متن‌باز است که با یادگیری تقویتی در مقیاس بزرگ بهینه‌سازی شده و وصله‌های قابل‌اعتماد و آماده تولید ارائه می‌دهد. این مدل با امتیاز ۶۰.۴٪ در SWE-bench Verified، رکورد جدیدی را در میان مدل‌های متن‌باز برای وظایف مهندسی نرم‌افزار خودکار مانند رفع باگ و بازبینی کد ثبت کرده است.", "moonshotai/Kimi-K2-Instruct-0905.description": "Kimi K2-Instruct-0905 جدیدترین و قدرتمندترین نسخه Kimi K2 است. این مدل MoE سطح بالا با ۱ تریلیون پارامتر کل و ۳۲ میلیارد پارامتر فعال است. ویژگی‌های کلیدی آن شامل هوش برنامه‌نویسی عامل‌محور قوی‌تر، بهبود چشمگیر در آزمون‌ها و وظایف واقعی عامل‌ها، و کدنویسی ظاهری و کاربردی بهتر در رابط کاربری است.", "moonshotai/Kimi-K2-Thinking.description": "Kimi K2 Thinking جدیدترین و قدرتمندترین مدل متن‌باز برای تفکر است. این مدل عمق استدلال چندمرحله‌ای را به‌طور چشمگیری افزایش داده و استفاده پایدار از ابزارها را در ۲۰۰ تا ۳۰۰ فراخوانی متوالی حفظ می‌کند. این مدل در آزمون‌هایی مانند Humanity's Last Exam (HLE)، BrowseComp و سایر معیارها رکورد جدیدی ثبت کرده و در برنامه‌نویسی، ریاضی، منطق و سناریوهای عامل عملکرد درخشانی دارد. این مدل بر پایه معماری MoE با حدود ۱ تریلیون پارامتر ساخته شده و از پنجره زمینه ۲۵۶K و فراخوانی ابزار پشتیبانی می‌کند.", "moonshotai/kimi-k2-0711.description": "Kimi K2 0711 نسخه instruct از سری Kimi است که برای تولید کد با کیفیت بالا و استفاده از ابزارها مناسب است.", "moonshotai/kimi-k2-0905.description": "Kimi K2 0905 نسخه‌ای به‌روزشده است که عملکرد زمینه و استدلال را با بهینه‌سازی‌های برنامه‌نویسی گسترش می‌دهد.", "moonshotai/kimi-k2-instruct-0905.description": "مدل kimi-k2-0905-preview از پنجره زمینه ۲۵۶K پشتیبانی می‌کند و دارای برنامه‌نویسی عامل‌محور قوی‌تر، کد رابط کاربری زیباتر و کاربردی‌تر و درک بهتر زمینه است.", "moonshotai/kimi-k2-thinking-turbo.description": "Kimi K2 Thinking Turbo نسخه پرسرعت مدل Kimi K2 Thinking است که با حفظ عمق استدلال، تأخیر را به‌طور قابل‌توجهی کاهش می‌دهد.", "moonshotai/kimi-k2-thinking.description": "Kimi K2 Thinking مدل استدلال Moonshot است که برای وظایف استدلال عمیق بهینه‌سازی شده و قابلیت‌های عمومی عامل را داراست.", "moonshotai/kimi-k2.description": "Kimi K2 یک مدل بزرگ MoE از Moonshot AI با ۱ تریلیون پارامتر کل و ۳۲ میلیارد پارامتر فعال در هر عبور است که برای قابلیت‌های عامل از جمله استفاده پیشرفته از ابزار، استدلال و تولید کد بهینه‌سازی شده است.", "morph/morph-v3-fast.description": "Morph یک مدل تخصصی است که تغییرات کدی پیشنهادشده توسط مدل‌های پیشرفته (مانند Claude یا GPT-4o) را با سرعت بیش از ۴۵۰۰ توکن در ثانیه روی فایل‌های موجود شما اعمال می‌کند. این مدل مرحله نهایی در جریان کاری برنامه‌نویسی با هوش مصنوعی است و از ورودی/خروجی ۱۶K توکن پشتیبانی می‌کند.", "morph/morph-v3-large.description": "Morph یک مدل تخصصی است که تغییرات کدی پیشنهادشده توسط مدل‌های پیشرفته (مانند Claude یا GPT-4o) را با سرعت بیش از ۲۵۰۰ توکن در ثانیه روی فایل‌های موجود شما اعمال می‌کند. این مدل مرحله نهایی در جریان کاری برنامه‌نویسی با هوش مصنوعی است و از ورودی/خروجی ۱۶K توکن پشتیبانی می‌کند.", "nousresearch/hermes-2-pro-llama-3-8b.description": "Hermes 2 Pro Llama 3 8B نسخه به‌روزشده‌ای از Nous Hermes 2 است که با جدیدترین داده‌های داخلی توسعه یافته است.", "nvidia/Llama-3.1-Nemotron-70B-Instruct-HF.description": "Llama 3.1 Nemotron 70B یک مدل سفارشی‌شده توسط NVIDIA برای بهبود مفید بودن پاسخ‌های LLM است. این مدل در Arena Hard، AlpacaEval 2 LC و GPT-4-Turbo MT-Bench عملکرد قوی دارد و تا ۱ اکتبر ۲۰۲۴ در هر سه معیار هم‌ترازی خودکار رتبه اول را کسب کرده است. این مدل از Llama-3.1-70B-Instruct با استفاده از RLHF (REINFORCE)، Llama-3.1-Nemotron-70B-Reward و درخواست‌های HelpSteer2-Preference آموزش دیده است.", "nvidia/llama-3.1-nemotron-51b-instruct.description": "مدلی متمایز با دقت و کارایی استثنایی در پردازش زبان طبیعی.", "nvidia/llama-3.1-nemotron-70b-instruct.description": "Llama-3.1-Nemotron-70B-Instruct یک مدل سفارشی‌شده توسط NVIDIA است که برای بهبود مفید بودن پاسخ‌های LLM طراحی شده است.", "o1-mini.description": "کوچک‌تر و سریع‌تر از o1-preview، با ۸۰٪ هزینه کمتر، قوی در تولید کد و وظایف با زمینه کوتاه.", "o1-preview.description": "متمرکز بر استدلال پیشرفته و حل مسائل پیچیده، از جمله ریاضی و علوم. ایده‌آل برای برنامه‌هایی که نیاز به درک عمیق زمینه و جریان‌های کاری خودکار دارند.", "o1-pro.description": "سری o1 با یادگیری تقویتی آموزش دیده تا پیش از پاسخ‌دهی فکر کند و استدلال پیچیده را مدیریت کند. o1-pro از منابع محاسباتی بیشتری برای تفکر عمیق‌تر استفاده می‌کند و پاسخ‌هایی با کیفیت بالاتر به‌طور مداوم ارائه می‌دهد.", "o1.description": "o1 مدل جدید استدلال OpenAI با ورودی متن+تصویر و خروجی متنی است که برای وظایف پیچیده با نیاز به دانش گسترده مناسب است. این مدل دارای پنجره زمینه ۲۰۰K و تاریخ قطع دانش اکتبر ۲۰۲۳ است.", "o3-2025-04-16.description": "o3 مدل جدید استدلال OpenAI با ورودی متن+تصویر و خروجی متنی برای وظایف پیچیده با نیاز به دانش گسترده است.", "o3-deep-research.description": "o3-deep-research پیشرفته‌ترین مدل تحقیقاتی ما برای وظایف پیچیده چندمرحله‌ای است. این مدل می‌تواند در وب جستجو کند و به داده‌های شما از طریق اتصال‌دهنده‌های MCP دسترسی داشته باشد.", "o3-mini.description": "o3-mini جدیدترین مدل کوچک استدلال ماست که هوش بالاتری را با همان هزینه و تأخیر مدل o1-mini ارائه می‌دهد.", "o3-pro-2025-06-10.description": "o3 Pro مدل جدید استدلال OpenAI با ورودی متن+تصویر و خروجی متنی برای وظایف پیچیده با نیاز به دانش گسترده است.", "o3-pro.description": "o3-pro از منابع محاسباتی بیشتری برای تفکر عمیق‌تر استفاده می‌کند و به‌طور مداوم پاسخ‌های بهتری ارائه می‌دهد؛ فقط از طریق API پاسخ‌ها در دسترس است.", "o3.description": "o3 یک مدل قدرتمند همه‌جانبه است که استاندارد جدیدی در ریاضی، علوم، برنامه‌نویسی و استدلال بصری تعیین می‌کند. این مدل در نگارش فنی و پیروی از دستورالعمل‌ها عالی عمل می‌کند و می‌تواند متن، کد و تصاویر را برای حل مسائل چندمرحله‌ای تحلیل کند.", "pixtral-large-latest.description": "Pixtral Large یک مدل چندوجهی باز با ۱۲۴ میلیارد پارامتر است که بر پایه Mistral Large 2 ساخته شده و دومین مدل در خانواده چندوجهی ما با درک پیشرفته تصویر در سطح مرزی است.", "pro-128k.description": "Spark Pro 128K ظرفیت بسیار بالایی برای زمینه‌سازی دارد و تا ۱۲۸ هزار توکن را پشتیبانی می‌کند. این مدل برای اسناد بلند که نیاز به تحلیل کامل متن و انسجام بلندمدت دارند، ایده‌آل است و از منطق روان و ارجاع‌های متنوع در بحث‌های پیچیده پشتیبانی می‌کند.", "pro-deepseek-r1.description": "مدل خدمات اختصاصی سازمانی با هم‌زمانی بسته‌بندی‌شده.", "pro-deepseek-v3.description": "مدل خدمات اختصاصی سازمانی با هم‌زمانی بسته‌بندی‌شده.", "qianfan-70b.description": "Qianfan 70B یک مدل بزرگ چینی برای تولید با کیفیت بالا و استدلال پیچیده است.", "qianfan-8b.description": "Qianfan 8B یک مدل عمومی میان‌رده است که بین هزینه و کیفیت در تولید متن و پاسخ به پرسش‌ها تعادل برقرار می‌کند.", "qianfan-agent-intent-32k.description": "Qianfan Agent Intent 32K برای شناسایی نیت و هماهنگی عامل‌ها با پشتیبانی از زمینه طولانی طراحی شده است.", "qianfan-agent-lite-8k.description": "Qianfan Agent Lite 8K یک مدل سبک‌وزن برای گفت‌وگوی چندمرحله‌ای کم‌هزینه و جریان‌های کاری است.", "qianfan-agent-speed-32k.description": "Qianfan Agent Speed 32K یک مدل عامل با توان عملیاتی بالا برای برنامه‌های عامل چندوظیفه‌ای در مقیاس بزرگ است.", "qianfan-agent-speed-8k.description": "Qianfan Agent Speed 8K یک مدل عامل با هم‌زمانی بالا برای گفت‌وگوهای کوتاه تا متوسط و پاسخ‌دهی سریع است.", "qianfan-check-vl.description": "Qianfan Check VL یک مدل بازبینی محتوای چندوجهی برای تطابق تصویر-متن و وظایف شناسایی است.", "qianfan-composition.description": "Qianfan Composition یک مدل تولید چندوجهی برای درک و تولید ترکیبی تصویر و متن است.", "qianfan-engcard-vl.description": "Qianfan EngCard VL یک مدل شناسایی چندوجهی متمرکز بر سناریوهای انگلیسی است.", "qianfan-lightning-128b-a19b.description": "Qianfan Lightning 128B A19B یک مدل عمومی چینی با عملکرد بالا برای پرسش‌وپاسخ پیچیده و استدلال در مقیاس بزرگ است.", "qianfan-llama-vl-8b.description": "Qianfan Llama VL 8B یک مدل چندوجهی مبتنی بر Llama برای درک عمومی تصویر و متن است.", "qianfan-multipicocr.description": "Qianfan MultiPicOCR یک مدل OCR چندتصویری برای شناسایی و استخراج متن از تصاویر مختلف است.", "qianfan-qi-vl.description": "Qianfan QI VL یک مدل پرسش‌وپاسخ چندوجهی برای بازیابی دقیق و پاسخ‌دهی در سناریوهای پیچیده تصویر-متن است.", "qianfan-singlepicocr.description": "Qianfan SinglePicOCR یک مدل OCR تک‌تصویری با دقت بالا در شناسایی کاراکترها است.", "qianfan-vl-70b.description": "Qianfan VL 70B یک مدل بزرگ زبان-بینایی برای درک پیچیده تصویر و متن است.", "qianfan-vl-8b.description": "Qianfan VL 8B یک مدل سبک‌وزن زبان-بینایی برای پرسش‌وپاسخ روزمره تصویر-متن و تحلیل است.", "qvq-72b-preview.description": "QVQ-72B-Preview یک مدل تحقیقاتی آزمایشی از Qwen است که بر بهبود استدلال بصری تمرکز دارد.", "qvq-max.description": "مدل استدلال بصری Qwen QVQ از ورودی تصویری و خروجی زنجیره‌ای پشتیبانی می‌کند و عملکرد قوی‌تری در ریاضی، کدنویسی، تحلیل بصری، خلاقیت و وظایف عمومی دارد.", "qvq-plus.description": "مدل استدلال بصری با ورودی تصویری و خروجی زنجیره‌ای. سری qvq-plus پس از qvq-max عرضه شده و استدلال سریع‌تر با تعادل بهتر کیفیت-هزینه ارائه می‌دهد.", "qwen-3-32b.description": "Qwen 3 32B: قدرتمند در وظایف چندزبانه و کدنویسی، مناسب برای استفاده در مقیاس متوسط تولیدی.", "qwen-coder-plus.description": "مدل کدنویسی Qwen.", "qwen-coder-turbo-latest.description": "مدل کدنویسی Qwen.", "qwen-coder-turbo.description": "مدل کدنویسی Qwen.", "qwen-flash.description": "سریع‌ترین و کم‌هزینه‌ترین مدل Qwen، ایده‌آل برای وظایف ساده.", "qwen-image-edit.description": "Qwen Image Edit یک مدل تصویر به تصویر است که تصاویر را بر اساس ورودی تصویری و دستورات متنی ویرایش می‌کند و امکان تنظیمات دقیق و تغییرات خلاقانه را فراهم می‌سازد.", "qwen-image.description": "Qwen-Image یک مدل عمومی تولید تصویر است که از سبک‌های هنری مختلف و رندر پیچیده متن (به‌ویژه چینی و انگلیسی) پشتیبانی می‌کند. از چیدمان چندخطی، متن در سطح پاراگراف و جزئیات دقیق برای ترکیب‌های پیچیده متن-تصویر پشتیبانی می‌کند.", "qwen-long.description": "مدل Qwen فوق‌العاده بزرگ با پشتیبانی از زمینه طولانی و گفت‌وگو در سناریوهای چندسندی و چندسندی بلند.", "qwen-math-plus-latest.description": "Qwen Math یک مدل زبانی تخصصی برای حل مسائل ریاضی است.", "qwen-math-plus.description": "Qwen Math یک مدل زبانی تخصصی برای حل مسائل ریاضی است.", "qwen-math-turbo-latest.description": "Qwen Math یک مدل زبانی تخصصی برای حل مسائل ریاضی است.", "qwen-math-turbo.description": "Qwen Math یک مدل زبانی تخصصی برای حل مسائل ریاضی است.", "qwen-max.description": "مدل فوق‌العاده بزرگ Qwen در مقیاس صد میلیارد پارامتر که از زبان‌های چینی، انگلیسی و دیگر زبان‌ها پشتیبانی می‌کند؛ مدل API پشت محصولات فعلی Qwen2.5 است.", "qwen-omni-turbo.description": "مدل‌های Qwen-Omni از ورودی‌های چندوجهی (ویدیو، صدا، تصویر، متن) پشتیبانی می‌کنند و خروجی صوتی و متنی تولید می‌کنند.", "qwen-plus.description": "مدل Qwen فوق‌العاده بزرگ تقویت‌شده با پشتیبانی از زبان‌های چینی، انگلیسی و دیگر زبان‌ها.", "qwen-turbo.description": "Qwen Turbo دیگر به‌روزرسانی نخواهد شد؛ لطفاً از Qwen Flash استفاده کنید. مدل فوق‌العاده بزرگ Qwen با پشتیبانی از زبان‌های چینی، انگلیسی و دیگر زبان‌ها.", "qwen-vl-chat-v1.description": "Qwen VL از تعاملات انعطاف‌پذیر شامل ورودی چندتصویری، پرسش‌وپاسخ چندمرحله‌ای و وظایف خلاقانه پشتیبانی می‌کند.", "qwen-vl-max-latest.description": "مدل فوق‌العاده بزرگ زبان-بینایی Qwen. در مقایسه با نسخه تقویت‌شده، استدلال بصری و پیروی از دستورالعمل‌ها را برای درک و شناخت قوی‌تر بهبود می‌بخشد.", "qwen-vl-max.description": "مدل فوق‌العاده بزرگ زبان-بینایی Qwen. در مقایسه با نسخه تقویت‌شده، استدلال بصری و پیروی از دستورالعمل‌ها را برای درک و شناخت بصری قوی‌تر بهبود می‌بخشد.", "qwen-vl-ocr.description": "Qwen OCR یک مدل استخراج متن از اسناد، جداول، تصاویر آزمون و دست‌خط است. از زبان‌های چینی، انگلیسی، فرانسوی، ژاپنی، کره‌ای، آلمانی، روسی، ایتالیایی، ویتنامی و عربی پشتیبانی می‌کند.", "qwen-vl-plus-latest.description": "مدل تقویت‌شده زبان-بینایی Qwen در مقیاس بزرگ با بهبودهای عمده در شناسایی جزئیات و متن، پشتیبانی از وضوح بیش از یک مگاپیکسل و نسبت‌های ابعاد دلخواه.", "qwen-vl-plus.description": "مدل تقویت‌شده زبان-بینایی Qwen در مقیاس بزرگ با بهبودهای عمده در شناسایی جزئیات و متن، پشتیبانی از وضوح بیش از یک مگاپیکسل و نسبت‌های ابعاد دلخواه.", "qwen-vl-v1.description": "مدل پیش‌آموزش‌شده مبتنی بر Qwen-7B با ماژول بینایی افزوده و ورودی تصویری با وضوح ۴۴۸.", "qwen/qwen-2-7b-instruct.description": "Qwen2 نسل جدید مدل‌های زبانی Qwen است. Qwen2 7B یک مدل مبتنی بر ترنسفورمر است که در درک زبان، توانایی چندزبانه، برنامه‌نویسی، ریاضی و استدلال عملکرد بالایی دارد.", "qwen/qwen-2-7b-instruct:free.description": "Qwen2 یک خانواده جدید از مدل‌های زبانی بزرگ با درک و تولید قوی‌تر است.", "qwen/qwen-2-vl-72b-instruct.description": "Qwen2-VL جدیدترین نسخه Qwen-VL است که به عملکرد پیشرفته در بنچمارک‌های بینایی مانند MathVista، DocVQA، RealWorldQA و MTVQA دست یافته است. این مدل می‌تواند بیش از ۲۰ دقیقه ویدیو را برای پرسش‌وپاسخ، گفت‌وگو و تولید محتوا با کیفیت بالا درک کند. همچنین استدلال و تصمیم‌گیری پیچیده را انجام می‌دهد و با دستگاه‌های همراه و ربات‌ها برای اقدام بر اساس زمینه بصری و دستور متنی یکپارچه می‌شود. فراتر از زبان‌های انگلیسی و چینی، متن در تصاویر را به زبان‌های مختلف از جمله بیشتر زبان‌های اروپایی، ژاپنی، کره‌ای، عربی و ویتنامی می‌خواند.", "qwen2.5-omni-7b.description": "مدل‌های Qwen-Omni از ورودی‌های چندرسانه‌ای (ویدیو، صدا، تصویر، متن) پشتیبانی می‌کنند و خروجی آن‌ها به صورت صوتی و متنی است.", "qwen2.5-vl-32b-instruct.description": "Qwen2.5 VL 32B Instruct یک مدل چندرسانه‌ای متن‌باز است که برای استقرار خصوصی و استفاده در سناریوهای مختلف مناسب می‌باشد.", "qwen2.5-vl-72b-instruct.description": "بهبود در پیروی از دستورالعمل‌ها، ریاضیات، حل مسئله و برنامه‌نویسی، با توانایی قوی‌تر در شناسایی اشیاء عمومی. از مکان‌یابی دقیق عناصر بصری در قالب‌های مختلف، درک ویدیوهای طولانی (تا ۱۰ دقیقه) با زمان‌بندی رویداد در سطح ثانیه، ترتیب زمانی و درک سرعت، و عامل‌هایی که می‌توانند سیستم‌عامل یا موبایل را از طریق تجزیه و تحلیل و مکان‌یابی کنترل کنند، پشتیبانی می‌کند. استخراج اطلاعات کلیدی قوی و خروجی JSON. این نسخه ۷۲B، قوی‌ترین نسخه در این سری است.", "qwen2.5-vl-7b-instruct.description": "Qwen2.5 VL 7B Instruct یک مدل چندرسانه‌ای سبک است که بین هزینه استقرار و توانایی شناسایی تعادل برقرار می‌کند.", "qwen2.5-vl-instruct.description": "Qwen2.5-VL جدیدترین مدل زبان-بینایی در خانواده Qwen است.", "qwen2.5.description": "Qwen2.5 نسل بعدی مدل زبان بزرگ علی‌بابا است که عملکرد قدرتمندی در کاربردهای متنوع دارد.", "qwen2.5:0.5b.description": "Qwen2.5 نسل بعدی مدل زبان بزرگ علی‌بابا است که عملکرد قدرتمندی در کاربردهای متنوع دارد.", "qwen2.5:1.5b.description": "Qwen2.5 نسل بعدی مدل زبان بزرگ علی‌بابا است که عملکرد قدرتمندی در کاربردهای متنوع دارد.", "qwen2.5:72b.description": "Qwen2.5 نسل بعدی مدل زبان بزرگ علی‌بابا است که عملکرد قدرتمندی در کاربردهای متنوع دارد.", "qwen2.description": "Qwen2 نسل بعدی مدل زبان بزرگ علی‌بابا است که عملکرد قدرتمندی در کاربردهای متنوع دارد.", "qwen2:0.5b.description": "Qwen2 نسل بعدی مدل زبان بزرگ علی‌بابا است که عملکرد قدرتمندی در کاربردهای متنوع دارد.", "qwen2:1.5b.description": "Qwen2 نسل بعدی مدل زبان بزرگ علی‌بابا است که عملکرد قدرتمندی در کاربردهای متنوع دارد.", "qwen2:72b.description": "Qwen2 نسل بعدی مدل زبان بزرگ علی‌بابا است که عملکرد قدرتمندی در کاربردهای متنوع دارد.", "qwen3-0.6b.description": "Qwen3 0.6B یک مدل سطح ابتدایی برای استدلال ساده و محیط‌های بسیار محدود است.", "qwen3-1.7b.description": "Qwen3 1.7B یک مدل فوق‌سبک برای استقرار در لبه و دستگاه‌ها است.", "qwen3-14b.description": "Qwen3 14B یک مدل میان‌رده برای پرسش‌وپاسخ چندزبانه و تولید متن است.", "qwen3-235b-a22b-instruct-2507.description": "Qwen3 235B A22B Instruct یک مدل راهبردی برای طیف گسترده‌ای از وظایف تولید و استدلال است.", "qwen3-235b-a22b-thinking-2507.description": "Qwen3 235B A22B Thinking یک مدل بسیار بزرگ برای استدلال پیچیده است.", "qwen3-235b-a22b.description": "Qwen3 235B A22B یک مدل عمومی بزرگ برای وظایف پیچیده است.", "qwen3-30b-a3b-instruct-2507.description": "Qwen3 30B A3B Instruct یک مدل میان‌تا‌بزرگ برای تولید با کیفیت بالا و پرسش‌وپاسخ است.", "qwen3-30b-a3b-thinking-2507.description": "Qwen3 30B A3B Thinking یک مدل میان‌تا‌بزرگ برای استدلال است که بین دقت و هزینه تعادل برقرار می‌کند.", "qwen3-30b-a3b.description": "Qwen3 30B A3B یک مدل عمومی میان‌تا‌بزرگ است که بین هزینه و کیفیت تعادل برقرار می‌کند.", "qwen3-32b.description": "Qwen3 32B برای وظایف عمومی که نیاز به درک قوی‌تری دارند مناسب است.", "qwen3-4b.description": "Qwen3 4B برای برنامه‌های کوچک تا متوسط و استنتاج محلی مناسب است.", "qwen3-8b.description": "Qwen3 8B یک مدل سبک با قابلیت استقرار انعطاف‌پذیر برای بارهای کاری با هم‌زمانی بالا است.", "qwen3-coder-30b-a3b-instruct.description": "مدل کدنویسی متن‌باز Qwen. نسخه جدید qwen3-coder-30b-a3b-instruct بر پایه Qwen3 ساخته شده و توانایی‌های قوی در عامل‌های کدنویس، استفاده از ابزارها و تعامل با محیط برای برنامه‌نویسی خودکار دارد، با عملکرد عالی در کد و توانایی عمومی قوی.", "qwen3-coder-480b-a35b-instruct.description": "Qwen3 Coder 480B A35B Instruct یک مدل کدنویسی پیشرفته برای برنامه‌نویسی چندزبانه و درک کد پیچیده است.", "qwen3-coder-flash.description": "مدل کدنویسی Qwen. سری جدید Qwen3-Coder بر پایه Qwen3 ساخته شده و توانایی‌های قوی در عامل‌های کدنویس، استفاده از ابزارها و تعامل با محیط برای برنامه‌نویسی خودکار دارد، با عملکرد عالی در کد و توانایی عمومی قوی.", "qwen3-coder-plus.description": "مدل کدنویسی Qwen. سری جدید Qwen3-Coder بر پایه Qwen3 ساخته شده و توانایی‌های قوی در عامل‌های کدنویس، استفاده از ابزارها و تعامل با محیط برای برنامه‌نویسی خودکار دارد، با عملکرد عالی در کد و توانایی عمومی قوی.", "qwen3-coder:480b.description": "مدل با عملکرد بالا از علی‌بابا برای وظایف عامل و کدنویسی با پشتیبانی از زمینه طولانی.", "qwen3-max-preview.description": "بهترین مدل Qwen برای وظایف پیچیده و چندمرحله‌ای. نسخه پیش‌نمایش از تفکر پشتیبانی می‌کند.", "qwen3-max.description": "مدل‌های Qwen3 Max نسبت به سری 2.5 پیشرفت‌های چشمگیری در توانایی عمومی، درک زبان چینی/انگلیسی، پیروی از دستورالعمل‌های پیچیده، وظایف باز ذهنی، توانایی چندزبانه و استفاده از ابزار دارند، با کاهش خطاهای توهمی. نسخه جدید qwen3-max توانایی برنامه‌نویسی عامل‌محور و استفاده از ابزار را نسبت به qwen3-max-preview بهبود داده است. این نسخه به سطح پیشرفته در حوزه خود رسیده و برای نیازهای پیچیده‌تر عامل‌ها طراحی شده است.", "qwen3-next-80b-a3b-instruct.description": "مدل متن‌باز نسل بعدی Qwen3 بدون قابلیت تفکر. نسبت به نسخه قبلی (Qwen3-235B-A22B-Instruct-2507)، درک زبان چینی بهتر، استدلال منطقی قوی‌تر و تولید متن بهبود یافته‌ای دارد.", "qwen3-next-80b-a3b-thinking.description": "Qwen3 Next 80B A3B Thinking نسخه پرچم‌دار مدل استدلال برای وظایف پیچیده است.", "qwen3-omni-flash.description": "Qwen-Omni ورودی‌های ترکیبی از متن، تصویر، صدا و ویدیو را می‌پذیرد و خروجی آن به صورت متن یا گفتار است. سبک‌های صوتی طبیعی متعددی ارائه می‌دهد، از گفتار چندزبانه و گویش‌ها پشتیبانی می‌کند و برای کاربردهایی مانند نوشتن، شناسایی بصری و دستیارهای صوتی مناسب است.", "qwen3-vl-235b-a22b-instruct.description": "Qwen3 VL 235B A22B Instruct یک مدل چندرسانه‌ای پرچم‌دار برای درک و تولید پیشرفته است.", "qwen3-vl-235b-a22b-thinking.description": "Qwen3 VL 235B A22B Thinking نسخه پرچم‌دار تفکر برای استدلال و برنامه‌ریزی چندرسانه‌ای پیچیده است.", "qwen3-vl-30b-a3b-instruct.description": "Qwen3 VL 30B A3B Instruct یک مدل چندرسانه‌ای بزرگ است که بین دقت و عملکرد استدلال تعادل برقرار می‌کند.", "qwen3-vl-30b-a3b-thinking.description": "Qwen3 VL 30B A3B Thinking نسخه تفکر عمیق برای وظایف چندرسانه‌ای پیچیده است.", "qwen3-vl-32b-instruct.description": "Qwen3 VL 32B Instruct یک مدل چندرسانه‌ای تنظیم‌شده با دستورالعمل برای پرسش‌وپاسخ تصویری-متنی با کیفیت بالا و تولید محتوا است.", "qwen3-vl-32b-thinking.description": "Qwen3 VL 32B Thinking نسخه تفکر عمیق چندرسانه‌ای برای استدلال پیچیده و تحلیل زنجیره‌ای طولانی است.", "qwen3-vl-8b-instruct.description": "Qwen3 VL 8B Instruct یک مدل چندرسانه‌ای سبک برای پرسش‌وپاسخ تصویری روزمره و یکپارچه‌سازی با برنامه‌ها است.", "qwen3-vl-8b-thinking.description": "Qwen3 VL 8B Thinking یک مدل زنجیره تفکر چندرسانه‌ای برای استدلال بصری دقیق است.", "qwen3-vl-flash.description": "Qwen3 VL Flash: نسخه سبک و پرسرعت برای استدلال در درخواست‌های حساس به تأخیر یا با حجم بالا.", "qwen3-vl-plus.description": "Qwen VL یک مدل تولید متن با درک بصری است. می‌تواند OCR انجام دهد و همچنین خلاصه‌سازی و استدلال کند، مانند استخراج ویژگی‌ها از عکس‌های محصول یا حل مسائل از روی تصاویر.", "qwen3.description": "Qwen3 نسل بعدی مدل زبان بزرگ علی‌بابا است که عملکرد قدرتمندی در کاربردهای متنوع دارد.", "qwq-32b-preview.description": "QwQ یک مدل تحقیقاتی آزمایشی از Qwen است که بر بهبود استدلال تمرکز دارد.", "qwq-32b.description": "QwQ یک مدل استدلال در خانواده Qwen است. در مقایسه با مدل‌های تنظیم‌شده با دستورالعمل استاندارد، توانایی تفکر و استدلال آن عملکرد پایین‌دستی را به‌ویژه در مسائل پیچیده به‌طور قابل توجهی بهبود می‌بخشد. QwQ-32B یک مدل استدلال میان‌رده است که با مدل‌های برتر مانند DeepSeek-R1 و o1-mini رقابت می‌کند.", "qwq-plus.description": "مدل استدلال QwQ که بر پایه Qwen2.5 آموزش دیده و با استفاده از یادگیری تقویتی (RL) توانایی استدلال را به‌طور چشمگیری بهبود داده است. در معیارهای اصلی ریاضی/کد (AIME 24/25، LiveCodeBench) و برخی معیارهای عمومی (IFEval، LiveBench) به سطح کامل DeepSeek-R1 رسیده است.", "qwq.description": "QwQ یک مدل استدلال در خانواده Qwen است. در مقایسه با مدل‌های تنظیم‌شده با دستورالعمل استاندارد، توانایی تفکر و استدلال آن عملکرد پایین‌دستی را به‌ویژه در مسائل دشوار به‌طور قابل توجهی بهبود می‌بخشد. QwQ-32B یک مدل استدلال میان‌رده است که با مدل‌های برتر مانند DeepSeek-R1 و o1-mini رقابت می‌کند.", "qwq_32b.description": "مدل استدلال میان‌رده در خانواده Qwen. در مقایسه با مدل‌های تنظیم‌شده با دستورالعمل استاندارد، توانایی تفکر و استدلال QwQ عملکرد پایین‌دستی را به‌ویژه در مسائل دشوار به‌طور قابل توجهی بهبود می‌بخشد.", "tencent/Hunyuan-A13B-Instruct.description": "Hunyuan-A13B-Instruct با استفاده از ۸۰ میلیارد پارامتر کلی و ۱۳ میلیارد پارامتر فعال، عملکردی هم‌تراز با مدل‌های بزرگ‌تر ارائه می‌دهد. این مدل از استدلال ترکیبی سریع/کند، درک پایدار متون بلند و توانایی پیشرو در عامل‌ها در آزمون‌های BFCL-v3 و τ-Bench پشتیبانی می‌کند. فرمت‌های GQA و چندکوانتیزه‌سازی، استنتاج کارآمد را ممکن می‌سازند.", "tencent/Hunyuan-MT-7B.description": "مدل ترجمه Hunyuan شامل Hunyuan-MT-7B و مدل ترکیبی Hunyuan-MT-Chimera است. Hunyuan-MT-7B یک مدل ترجمه سبک با ۷ میلیارد پارامتر است که از ۳۳ زبان به‌علاوه ۵ زبان اقلیت چینی پشتیبانی می‌کند. در رقابت WMT25، در ۳۰ جفت‌زبان از ۳۱ مورد، رتبه اول را کسب کرد. Hunyuan از یک زنجیره کامل آموزش شامل پیش‌آموزش، SFT، تقویت یادگیری ترجمه و تقویت یادگیری ترکیبی استفاده می‌کند و با عملکردی پیشرو در اندازه خود، به‌راحتی قابل استقرار است.", "text-embedding-3-large.description": "قوی‌ترین مدل تعبیه‌سازی برای وظایف انگلیسی و غیرانگلیسی.", "text-embedding-3-small.description": "مدل تعبیه‌سازی نسل جدید با کارایی بالا و مقرون‌به‌صرفه برای بازیابی اطلاعات و سناریوهای RAG.", "thudm/glm-4-32b.description": "GLM-4-32B-0414 یک مدل ۳۲ میلیارد پارامتری دوزبانه (چینی/انگلیسی) با وزن‌های باز است که برای تولید کد، فراخوانی توابع و وظایف عامل بهینه‌سازی شده است. این مدل با ۱۵ ترابایت داده باکیفیت و متمرکز بر استدلال پیش‌آموزش دیده و با هم‌راستاسازی ترجیحات انسانی، نمونه‌گیری ردشده و یادگیری تقویتی بهبود یافته است. در استدلال پیچیده، تولید محتوای ساختاریافته و خروجی‌های منظم عملکردی در سطح GPT-4o و DeepSeek-V3-0324 دارد.", "thudm/glm-4-32b:free.description": "GLM-4-32B-0414 یک مدل ۳۲ میلیارد پارامتری دوزبانه (چینی/انگلیسی) با وزن‌های باز است که برای تولید کد، فراخوانی توابع و وظایف عامل بهینه‌سازی شده است. این مدل با ۱۵ ترابایت داده باکیفیت و متمرکز بر استدلال پیش‌آموزش دیده و با هم‌راستاسازی ترجیحات انسانی، نمونه‌گیری ردشده و یادگیری تقویتی بهبود یافته است. در استدلال پیچیده، تولید محتوای ساختاریافته و خروجی‌های منظم عملکردی در سطح GPT-4o و DeepSeek-V3-0324 دارد.", "thudm/glm-4-9b-chat.description": "انتشار متن‌باز جدیدترین مدل پیش‌آموزش GLM-4 از Zhipu AI.", "thudm/glm-z1-32b.description": "GLM-Z1-32B-0414 نسخه‌ای تقویت‌شده از GLM-4-32B برای استدلال عمیق در ریاضیات، منطق و حل مسائل کدنویسی است. این مدل با استفاده از یادگیری تقویتی گسترده (ترجیحات جفتی خاص وظیفه و عمومی) برای بهبود وظایف چندمرحله‌ای پیچیده طراحی شده است. نسبت به GLM-4-32B، Z1 در استدلال ساختاریافته و توانایی در حوزه‌های رسمی به‌طور قابل‌توجهی بهتر عمل می‌کند.\n\nاین مدل از مهندسی اعلان برای تحمیل مراحل «تفکر»، انسجام بهتر در خروجی‌های بلند، و بهینه‌سازی برای جریان‌های کاری عامل با زمینه طولانی (از طریق YaRN)، فراخوانی ابزار JSON و نمونه‌گیری دقیق برای استدلال پایدار پشتیبانی می‌کند. مناسب برای موارد استفاده‌ای است که نیاز به استنتاج چندمرحله‌ای دقیق یا استنتاج رسمی دارند.", "thudm/glm-z1-rumination-32b.description": "GLM Z1 Rumination 32B یک مدل استدلال عمیق ۳۲ میلیارد پارامتری از سری GLM-4-Z1 است که برای وظایف پیچیده و باز با نیاز به تفکر طولانی بهینه‌سازی شده است. این مدل بر پایه glm-4-32b-0414 ساخته شده و مراحل یادگیری تقویتی اضافی و هم‌راستاسازی چندمرحله‌ای را اضافه می‌کند تا قابلیت «تفکر عمیق» را شبیه‌سازی کند. این شامل استدلال تکراری، تحلیل چندمرحله‌ای و جریان‌های کاری تقویت‌شده با ابزار مانند جستجو، بازیابی و ترکیب آگاه از منابع است.\n\nدر نگارش پژوهشی، تحلیل مقایسه‌ای و پرسش‌وپاسخ پیچیده عملکردی عالی دارد. از فراخوانی توابع برای عملیات پایه جستجو/ناوبری (`search`، `click`، `open`، `finish`) در خطوط لوله عامل پشتیبانی می‌کند. رفتار تفکر عمیق از طریق حلقه‌های چندمرحله‌ای با شکل‌دهی پاداش مبتنی بر قواعد و مکانیزم‌های تصمیم‌گیری تأخیری کنترل می‌شود و در برابر چارچوب‌های پژوهشی عمیق مانند پشته هم‌راستاسازی داخلی OpenAI ارزیابی شده است. این نسخه برای عمق بیشتر نسبت به سرعت طراحی شده است.", "tngtech/deepseek-r1t-chimera:free.description": "DeepSeek-R1T-Chimera با ترکیب DeepSeek-R1 و DeepSeek-V3 (0324) ساخته شده و استدلال R1 را با کارایی توکنی V3 ترکیب می‌کند. این مدل بر پایه DeepSeek-MoE Transformer است و برای تولید متن عمومی بهینه‌سازی شده است.\n\nوزن‌های پیش‌آموزش‌یافته را برای تعادل بین استدلال، کارایی و پیروی از دستورالعمل‌ها ترکیب می‌کند. تحت مجوز MIT برای استفاده پژوهشی و تجاری منتشر شده است.", "togethercomputer/StripedHyena-Nous-7B.description": "StripedHyena Nous (7B) با بهره‌گیری از معماری و استراتژی خود، بهره‌وری محاسباتی بهبودیافته‌ای ارائه می‌دهد.", "tts-1-hd.description": "جدیدترین مدل تبدیل متن به گفتار با بهینه‌سازی برای کیفیت بالا.", "tts-1.description": "جدیدترین مدل تبدیل متن به گفتار با بهینه‌سازی برای سرعت در زمان واقعی.", "upstage/SOLAR-10.7B-Instruct-v1.0.description": "Upstage SOLAR Instruct v1 (11B) برای انجام دقیق وظایف دستوری با عملکرد زبانی قوی تنظیم شده است.", "us.anthropic.claude-3-5-sonnet-20241022-v2:0.description": "Claude 3.5 Sonnet استاندارد صنعت را ارتقا داده و در ارزیابی‌های گسترده از رقبا و Claude 3 Opus پیشی می‌گیرد، در حالی که سرعت و هزینه متوسط را حفظ می‌کند.", "us.anthropic.claude-3-7-sonnet-20250219-v1:0.description": "Claude 3.7 Sonnet سریع‌ترین مدل نسل جدید Anthropic است. نسبت به Claude 3 Haiku در مهارت‌ها بهبود یافته و در بسیاری از معیارهای هوش از پرچم‌دار قبلی Claude 3 Opus پیشی می‌گیرد.", "us.anthropic.claude-haiku-4-5-20251001-v1:0.description": "Claude Haiku 4.5 سریع‌ترین و هوشمندترین مدل Haiku از Anthropic است، با سرعتی برق‌آسا و توانایی تفکر گسترده.", "us.anthropic.claude-sonnet-4-5-20250929-v1:0.description": "Claude Sonnet 4.5 هوشمندترین مدل Anthropic تا به امروز است.", "v0-1.0-md.description": "v0-1.0-md یک مدل قدیمی است که از طریق API نسخه v0 ارائه می‌شود.", "v0-1.5-lg.description": "v0-1.5-lg برای وظایف پیشرفته تفکر یا استدلال مناسب است.", "v0-1.5-md.description": "v0-1.5-md برای وظایف روزمره و تولید رابط کاربری مناسب است.", "vercel/v0-1.0-md.description": "به مدل‌های پشت v0 دسترسی پیدا کنید تا برنامه‌های وب مدرن را با استدلال خاص فریم‌ورک و دانش به‌روز تولید، اصلاح و بهینه‌سازی کنید.", "vercel/v0-1.5-md.description": "به مدل‌های پشت v0 دسترسی پیدا کنید تا برنامه‌های وب مدرن را با استدلال خاص فریم‌ورک و دانش به‌روز تولید، اصلاح و بهینه‌سازی کنید.", "volcengine/doubao-seed-code.description": "Doubao-Seed-Code مدل LLM شرکت ByteDance Volcano Engine است که برای برنامه‌نویسی عامل‌محور بهینه‌سازی شده و در معیارهای برنامه‌نویسی و عامل با پشتیبانی از زمینه ۲۵۶K عملکرد قوی دارد.", "wan2.2-t2i-flash.description": "Wanxiang 2.2 Speed جدیدترین مدل با ارتقاء در خلاقیت، پایداری و واقع‌گرایی است که تولید سریع و ارزش بالا را ارائه می‌دهد.", "wan2.2-t2i-plus.description": "Wanxiang 2.2 Pro جدیدترین مدل با ارتقاء در خلاقیت، پایداری و واقع‌گرایی است که جزئیات غنی‌تری تولید می‌کند.", "wanx-v1.description": "مدل پایه تبدیل متن به تصویر. معادل Tongyi Wanxiang 1.0 General.", "wanx2.0-t2i-turbo.description": "در پرتره‌های بافت‌دار با سرعت متوسط و هزینه کمتر عملکرد عالی دارد. معادل Tongyi Wanxiang 2.0 Speed.", "wanx2.1-t2i-plus.description": "نسخه کاملاً ارتقاءیافته با جزئیات تصویری غنی‌تر و سرعت کمی کمتر. معادل Tongyi Wanxiang 2.1 Pro.", "wanx2.1-t2i-turbo.description": "نسخه کاملاً ارتقاءیافته با تولید سریع، کیفیت کلی قوی و ارزش بالا. معادل Tongyi Wanxiang 2.1 Speed.", "whisper-1.description": "مدل عمومی تشخیص گفتار با پشتیبانی از ASR چندزبانه، ترجمه گفتار و شناسایی زبان.", "wizardlm2.description": "WizardLM 2 مدل زبانی از Microsoft AI است که در گفت‌وگوی پیچیده، وظایف چندزبانه، استدلال و دستیارها عملکرد عالی دارد.", "wizardlm2:8x22b.description": "WizardLM 2 مدل زبانی از Microsoft AI است که در گفت‌وگوی پیچیده، وظایف چندزبانه، استدلال و دستیارها عملکرد عالی دارد.", "x-ai/grok-4-fast-non-reasoning.description": "Grok 4 Fast (بدون استدلال) مدل چندوجهی با توان عملیاتی بالا و هزینه پایین از xAI است (با پشتیبانی از پنجره زمینه ۲ میلیون توکن) که برای سناریوهای حساس به تأخیر و هزینه طراحی شده و نیازی به استدلال درون‌مدلی ندارد. این مدل در کنار نسخه استدلالی Grok 4 Fast قرار دارد و می‌توان استدلال را از طریق پارامتر API فعال کرد. اعلان‌ها و تکمیل‌ها ممکن است توسط xAI یا OpenRouter برای بهبود مدل‌های آینده استفاده شوند.", "x-ai/grok-4-fast.description": "Grok 4 Fast مدل با توان عملیاتی بالا و هزینه پایین از xAI است (با پشتیبانی از پنجره زمینه ۲ میلیون توکن) که برای موارد استفاده با هم‌زمانی بالا و زمینه‌های طولانی ایده‌آل است.", "x-ai/grok-4.1-fast-non-reasoning.description": "Grok 4 Fast (بدون استدلال) مدل چندوجهی با توان عملیاتی بالا و هزینه پایین از xAI است (با پشتیبانی از پنجره زمینه ۲ میلیون توکن) که برای سناریوهای حساس به تأخیر و هزینه طراحی شده و نیازی به استدلال درون‌مدلی ندارد. این مدل در کنار نسخه استدلالی Grok 4 Fast قرار دارد و می‌توان استدلال را از طریق پارامتر API فعال کرد. اعلان‌ها و تکمیل‌ها ممکن است توسط xAI یا OpenRouter برای بهبود مدل‌های آینده استفاده شوند.", "x-ai/grok-4.1-fast.description": "Grok 4 Fast مدل با توان عملیاتی بالا و هزینه پایین از xAI است (با پشتیبانی از پنجره زمینه ۲ میلیون توکن) که برای موارد استفاده با هم‌زمانی بالا و زمینه‌های طولانی ایده‌آل است.", "x-ai/grok-4.description": "Grok 4 مدل پرچم‌دار xAI با توانایی استدلال قوی و قابلیت چندوجهی است." }