Files
lobe-chat/locales/pl-PL/models.json
T
Arvin Xu d8deaddedd feat: add work path for local system (#11128)
*  feat: support to show working dir

* fix style

* update docs

* update topic

* refactor to use chat config

* inject working Directory

* update i18n

* fix tests
2026-01-03 16:22:22 +08:00

464 lines
118 KiB
JSON
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
{
"01-ai/yi-1.5-34b-chat.description": "Najnowszy otwartoźródłowy model 01.AI z 34 miliardami parametrów, dostrojony do różnych scenariuszy dialogowych, trenowany na wysokiej jakości danych i dostosowany do preferencji użytkowników.",
"01-ai/yi-1.5-9b-chat.description": "Najnowszy otwartoźródłowy model 01.AI z 9 miliardami parametrów, dostrojony do różnych scenariuszy dialogowych, trenowany na wysokiej jakości danych i dostosowany do preferencji użytkowników.",
"360/deepseek-r1.description": "DeepSeek-R1 wdrożony przez 360 wykorzystuje skalowane uczenie przez wzmocnienie (RL) w fazie post-treningowej, znacząco poprawiając zdolności rozumowania przy minimalnym oznakowaniu danych. Dorównuje modelowi OpenAI o1 w zadaniach z matematyki, programowania i rozumowania językowego.",
"360gpt-pro-trans.description": "Model wyspecjalizowany w tłumaczeniach, głęboko dostrojony w celu zapewnienia najwyższej jakości przekładów.",
"360gpt-pro.description": "360GPT Pro to kluczowy model AI od 360, oferujący wydajne przetwarzanie tekstu w różnorodnych scenariuszach NLP, z obsługą długich tekstów i dialogów wieloetapowych.",
"360gpt-turbo-responsibility-8k.description": "360GPT Turbo Responsibility 8K kładzie nacisk na bezpieczeństwo semantyczne i odpowiedzialność w aplikacjach wrażliwych na treść, zapewniając precyzyjne i niezawodne doświadczenia użytkownika.",
"360gpt-turbo.description": "360GPT Turbo oferuje wysoką wydajność obliczeniową i zdolności konwersacyjne, z doskonałym rozumieniem semantycznym i efektywnością generowania — idealny dla firm i deweloperów.",
"360gpt2-o1.description": "360gpt2-o1 buduje łańcuch rozumowania poprzez przeszukiwanie drzewa z mechanizmem refleksji i treningiem RL, umożliwiając samorefleksję i autokorektę.",
"360gpt2-pro.description": "360GPT2 Pro to zaawansowany model NLP od 360, wyróżniający się w generowaniu i rozumieniu tekstu, szczególnie w zadaniach kreatywnych, transformacjach i odgrywaniu ról.",
"360zhinao2-o1.description": "360zhinao2-o1 buduje łańcuch rozumowania poprzez przeszukiwanie drzewa z mechanizmem refleksji i treningiem RL, umożliwiając samorefleksję i autokorektę.",
"4.0Ultra.description": "Spark Ultra to najpotężniejszy model z serii Spark, ulepszający rozumienie tekstu i podsumowywanie oraz wzbogacający wyszukiwanie internetowe. Stanowi kompleksowe rozwiązanie zwiększające produktywność w pracy i precyzję odpowiedzi, pozycjonując się jako wiodący produkt inteligentny.",
"AnimeSharp.description": "AnimeSharp (znany również jako „4x-AnimeSharp”) to otwartoźródłowy model super-rozdzielczości oparty na ESRGAN autorstwa Kim2091, skoncentrowany na skalowaniu i wyostrzaniu obrazów w stylu anime. W lutym 2022 roku zmieniono jego nazwę z „4x-TextSharpV1”; pierwotnie służył również do obrazów tekstowych, ale został silnie zoptymalizowany pod kątem treści anime.",
"Baichuan2-Turbo.description": "Wykorzystuje rozszerzenie wyszukiwania do połączenia modelu z wiedzą dziedzinową i internetową. Obsługuje przesyłanie plików PDF/Word oraz wprowadzanie adresów URL w celu szybkiego i kompleksowego pozyskiwania informacji oraz generowania profesjonalnych i precyzyjnych odpowiedzi.",
"Baichuan3-Turbo-128k.description": "Dzięki ultradługiemu kontekstowi 128K, zoptymalizowany do intensywnych zastosowań biznesowych, oferuje znaczne korzyści i wysoką wartość. W porównaniu z Baichuan2, tworzenie treści wzrasta o 20%, pytania i odpowiedzi oparte na wiedzy o 17%, a odgrywanie ról o 40%. Ogólna wydajność przewyższa GPT-3.5.",
"Baichuan3-Turbo.description": "Zoptymalizowany do intensywnych zastosowań biznesowych, oferuje znaczne korzyści i wysoką wartość. W porównaniu z Baichuan2, tworzenie treści wzrasta o 20%, pytania i odpowiedzi oparte na wiedzy o 17%, a odgrywanie ról o 40%. Ogólna wydajność przewyższa GPT-3.5.",
"Baichuan4-Air.description": "Model o najwyższej wydajności w Chinach, przewyższający czołowe modele zagraniczne w zadaniach w języku chińskim, takich jak wiedza, długie teksty i generowanie kreatywne. Oferuje również wiodące w branży możliwości multimodalne z silnymi wynikami w autorytatywnych testach porównawczych.",
"Baichuan4-Turbo.description": "Model o najwyższej wydajności w Chinach, przewyższający czołowe modele zagraniczne w zadaniach w języku chińskim, takich jak wiedza, długie teksty i generowanie kreatywne. Oferuje również wiodące w branży możliwości multimodalne z silnymi wynikami w autorytatywnych testach porównawczych.",
"Baichuan4.description": "Najlepsza krajowa wydajność, przewyższająca czołowe modele zagraniczne w zadaniach w języku chińskim, takich jak wiedza encyklopedyczna, długie teksty i generowanie kreatywne. Oferuje również wiodące w branży możliwości multimodalne i silne wyniki w testach porównawczych.",
"ByteDance-Seed/Seed-OSS-36B-Instruct.description": "Seed-OSS to rodzina otwartoźródłowych modeli LLM od ByteDance Seed, zaprojektowana z myślą o obsłudze długiego kontekstu, rozumowaniu, zadaniach agentowych i ogólnych możliwościach. Seed-OSS-36B-Instruct to model z 36 miliardami parametrów dostrojony do instrukcji, z natywnym ultradługim kontekstem do przetwarzania dużych dokumentów lub baz kodu. Zoptymalizowany pod kątem rozumowania, generowania kodu i zadań agentowych (użycie narzędzi), zachowując przy tym silne ogólne zdolności. Kluczową cechą jest „Budżet Myślenia”, umożliwiający elastyczną długość rozumowania w celu zwiększenia efektywności.",
"DeepSeek-R1-Distill-Llama-70B.description": "DeepSeek R1, większy i inteligentniejszy model z rodziny DeepSeek, został zdestylowany do architektury Llama 70B. Testy porównawcze i oceny ludzkie pokazują, że przewyższa bazowy Llama 70B, szczególnie w zadaniach matematycznych i wymagających precyzji faktów.",
"DeepSeek-R1-Distill-Qwen-1.5B.description": "Model zdestylowany z DeepSeek-R1 na bazie Qwen2.5-Math-1.5B. Uczenie przez wzmocnienie i dane cold-start optymalizują wydajność rozumowania, ustanawiając nowe standardy dla otwartych modeli wielozadaniowych.",
"DeepSeek-R1-Distill-Qwen-14B.description": "Modele DeepSeek-R1-Distill są dostrajane z otwartoźródłowych modeli przy użyciu próbek danych generowanych przez DeepSeek-R1.",
"DeepSeek-R1-Distill-Qwen-32B.description": "Modele DeepSeek-R1-Distill są dostrajane z otwartoźródłowych modeli przy użyciu próbek danych generowanych przez DeepSeek-R1.",
"DeepSeek-R1-Distill-Qwen-7B.description": "Model zdestylowany z DeepSeek-R1 na bazie Qwen2.5-Math-7B. Uczenie przez wzmocnienie i dane cold-start optymalizują wydajność rozumowania, ustanawiając nowe standardy dla otwartych modeli wielozadaniowych.",
"DeepSeek-R1.description": "DeepSeek-R1 stosuje skalowane uczenie przez wzmocnienie w fazie post-treningowej, znacząco poprawiając zdolności rozumowania przy bardzo małej liczbie oznakowanych danych. Dorównuje produkcyjnemu modelowi OpenAI o1 w zadaniach z matematyki, programowania i rozumowania językowego.",
"DeepSeek-V3-1.description": "DeepSeek V3.1 to model nowej generacji do rozumowania, z ulepszonym rozumowaniem złożonym i łańcuchowym, odpowiedni do zadań wymagających głębokiej analizy.",
"DeepSeek-V3-Fast.description": "Dostawca: sophnet. DeepSeek V3 Fast to wersja o wysokim TPS modelu DeepSeek V3 0324, w pełnej precyzji (bez kwantyzacji), z lepszymi wynikami w kodzie i matematyce oraz szybszymi odpowiedziami.",
"DeepSeek-V3.1-Fast.description": "DeepSeek V3.1 Fast to szybka wersja modelu DeepSeek V3.1 o wysokim TPS. Tryb hybrydowego myślenia: dzięki szablonom czatu jeden model obsługuje zarówno tryb myślący, jak i niemyslący. Inteligentniejsze użycie narzędzi: optymalizacje po treningu poprawiają wydajność zadań agentowych i użycia narzędzi.",
"DeepSeek-V3.1-Think.description": "Tryb myślenia DeepSeek-V3.1: nowy hybrydowy model rozumowania z trybami myślącym i niemyslącym, bardziej wydajny niż DeepSeek-R1-0528. Optymalizacje po treningu znacząco poprawiają użycie narzędzi agentowych i wydajność zadań agentowych.",
"DeepSeek-V3.description": "DeepSeek-V3 to model MoE opracowany przez DeepSeek. Przewyższa inne otwarte modele, takie jak Qwen2.5-72B i Llama-3.1-405B w wielu testach porównawczych i konkuruje z czołowymi zamkniętymi modelami, takimi jak GPT-4o i Claude 3.5 Sonnet.",
"Doubao-lite-128k.description": "Doubao-lite oferuje ultraszybkie odpowiedzi i lepszy stosunek jakości do ceny, z elastycznymi opcjami dla różnych scenariuszy. Obsługuje kontekst 128K do wnioskowania i dostrajania.",
"Doubao-lite-32k.description": "Doubao-lite oferuje ultraszybkie odpowiedzi i lepszy stosunek jakości do ceny, z elastycznymi opcjami dla różnych scenariuszy. Obsługuje kontekst 32K do wnioskowania i dostrajania.",
"Doubao-lite-4k.description": "Doubao-lite oferuje ultraszybkie odpowiedzi i lepszy stosunek jakości do ceny, z elastycznymi opcjami dla różnych scenariuszy. Obsługuje kontekst 4K do wnioskowania i dostrajania.",
"Doubao-pro-128k.description": "Najlepszy model flagowy do złożonych zadań, doskonały w zadaniach typu QA z odniesieniami, streszczaniu, tworzeniu treści, klasyfikacji i odgrywaniu ról. Obsługuje kontekst 128K do wnioskowania i dostrajania.",
"Doubao-pro-32k.description": "Najlepszy model flagowy do złożonych zadań, doskonały w zadaniach typu QA z odniesieniami, streszczaniu, tworzeniu treści, klasyfikacji i odgrywaniu ról. Obsługuje kontekst 32K do wnioskowania i dostrajania.",
"Doubao-pro-4k.description": "Najlepszy model flagowy do złożonych zadań, doskonały w zadaniach typu QA z odniesieniami, streszczaniu, tworzeniu treści, klasyfikacji i odgrywaniu ról. Obsługuje kontekst 4K do wnioskowania i dostrajania.",
"DreamO.description": "DreamO to otwartoźródłowy model personalizacji obrazów opracowany wspólnie przez ByteDance i Uniwersytet Pekiński, wykorzystujący zunifikowaną architekturę do obsługi wielozadaniowego generowania obrazów. Wykorzystuje wydajne modelowanie kompozycyjne do generowania spójnych, dostosowanych obrazów na podstawie tożsamości, tematu, stylu, tła i innych warunków określonych przez użytkownika.",
"ERNIE-3.5-128K.description": "Flagowy model LLM Baidu, wytrenowany na ogromnych korpusach chińsko-angielskich, o silnych ogólnych możliwościach w zakresie czatu, tworzenia treści i korzystania z wtyczek; obsługuje automatyczną integrację z wtyczką Baidu Search dla aktualnych odpowiedzi.",
"ERNIE-3.5-8K-Preview.description": "Flagowy model LLM Baidu, wytrenowany na ogromnych korpusach chińsko-angielskich, o silnych ogólnych możliwościach w zakresie czatu, tworzenia treści i korzystania z wtyczek; obsługuje automatyczną integrację z wtyczką Baidu Search dla aktualnych odpowiedzi.",
"ERNIE-3.5-8K.description": "Flagowy model LLM Baidu, wytrenowany na ogromnych korpusach chińsko-angielskich, o silnych ogólnych możliwościach w zakresie czatu, tworzenia treści i korzystania z wtyczek; obsługuje automatyczną integrację z wtyczką Baidu Search dla aktualnych odpowiedzi.",
"ERNIE-4.0-8K-Latest.description": "Flagowy ultraduży model LLM Baidu z kompleksowymi ulepszeniami względem ERNIE 3.5, odpowiedni do złożonych zadań w różnych dziedzinach; obsługuje integrację z wtyczką Baidu Search dla aktualnych odpowiedzi.",
"ERNIE-4.0-8K-Preview.description": "Flagowy ultraduży model LLM Baidu z kompleksowymi ulepszeniami względem ERNIE 3.5, odpowiedni do złożonych zadań w różnych dziedzinach; obsługuje integrację z wtyczką Baidu Search dla aktualnych odpowiedzi.",
"ERNIE-4.0-Turbo-8K-Latest.description": "Flagowy ultraduży model LLM Baidu o wysokiej wydajności ogólnej do złożonych zadań, z integracją wtyczki Baidu Search dla aktualnych odpowiedzi. Przewyższa ERNIE 4.0.",
"ERNIE-4.0-Turbo-8K-Preview.description": "Flagowy ultraduży model LLM Baidu o wysokiej wydajności ogólnej do złożonych zadań, z integracją wtyczki Baidu Search dla aktualnych odpowiedzi. Przewyższa ERNIE 4.0.",
"ERNIE-Character-8K.description": "Model LLM Baidu dla domen wertykalnych, takich jak NPC w grach, obsługa klienta i odgrywanie ról, z lepszą spójnością postaci, silniejszym podążaniem za instrukcjami i lepszym rozumowaniem.",
"ERNIE-Lite-Pro-128K.description": "Lekki model LLM Baidu, łączący jakość i wydajność wnioskowania, lepszy niż ERNIE Lite i odpowiedni dla akceleratorów o niskiej mocy obliczeniowej.",
"ERNIE-Speed-128K.description": "Najnowszy model LLM Baidu o wysokiej wydajności (2024), o silnych ogólnych możliwościach, odpowiedni jako baza do dostrajania w celu obsługi konkretnych scenariuszy, z doskonałą wydajnością rozumowania.",
"ERNIE-Speed-Pro-128K.description": "Najnowszy model LLM Baidu o wysokiej wydajności (2024), o silnych ogólnych możliwościach, lepszy niż ERNIE Speed, odpowiedni jako baza do dostrajania z doskonałą wydajnością rozumowania.",
"FLUX-1.1-pro.description": "FLUX.1.1 Pro",
"FLUX.1-Kontext-dev.description": "FLUX.1-Kontext-dev to multimodalny model generowania i edycji obrazów od Black Forest Labs, oparty na architekturze Rectified Flow Transformer z 12 miliardami parametrów. Skupia się na generowaniu, rekonstrukcji, ulepszaniu lub edytowaniu obrazów w określonym kontekście. Łączy kontrolowaną generację modeli dyfuzyjnych z modelowaniem kontekstu przez Transformery, wspierając wysokiej jakości wyniki w zadaniach takich jak inpainting, outpainting i rekonstrukcja scen wizualnych.",
"FLUX.1-Kontext-pro.description": "FLUX.1 Kontext [pro]",
"FLUX.1-dev.description": "FLUX.1-dev to otwartoźródłowy multimodalny model językowy (MLLM) od Black Forest Labs, zoptymalizowany do zadań obraz-tekst, łączący rozumienie i generowanie obrazów/tekstu. Zbudowany na zaawansowanych LLM (np. Mistral-7B), wykorzystuje starannie zaprojektowany enkoder wizji i wieloetapowe dostrajanie instrukcji, umożliwiając multimodalną koordynację i złożone rozumowanie.",
"Gryphe/MythoMax-L2-13b.description": "MythoMax-L2 (13B) to innowacyjny model do różnorodnych dziedzin i złożonych zadań.",
"HelloMeme.description": "HelloMeme to narzędzie AI do generowania memów, GIF-ów lub krótkich filmów z dostarczonych obrazów lub ruchów. Nie wymaga umiejętności rysowania ani kodowania — wystarczy obraz referencyjny, aby stworzyć zabawne, atrakcyjne i stylistycznie spójne treści.",
"HiDream-I1-Full.description": "HiDream-E1-Full to otwartoźródłowy multimodalny model edycji obrazów od HiDream.ai, oparty na zaawansowanej architekturze Diffusion Transformer i silnym rozumieniu języka (wbudowany LLaMA 3.1-8B-Instruct). Obsługuje generowanie obrazów sterowane językiem naturalnym, transfer stylu, lokalne edycje i przemalowywanie, z doskonałym rozumieniem i wykonaniem obraz-tekst.",
"HunyuanDiT-v1.2-Diffusers-Distilled.description": "hunyuandit-v1.2-distilled to lekki model tekst-na-obraz zoptymalizowany przez destylację do szybkiego generowania wysokiej jakości obrazów, szczególnie odpowiedni dla środowisk o ograniczonych zasobach i generowania w czasie rzeczywistym.",
"InstantCharacter.description": "InstantCharacter to model generowania spersonalizowanych postaci bez potrzeby dostrajania, wydany przez Tencent AI w 2025 roku, mający na celu wierne i spójne generowanie postaci w różnych scenariuszach. Może modelować postać na podstawie jednego obrazu referencyjnego i elastycznie przenosić ją między stylami, działaniami i tłami.",
"InternVL2-8B.description": "InternVL2-8B to potężny model wizja-język obsługujący multimodalne przetwarzanie obraz-tekst, dokładnie rozpoznający zawartość obrazu i generujący odpowiednie opisy lub odpowiedzi.",
"InternVL2.5-26B.description": "InternVL2.5-26B to potężny model wizja-język obsługujący multimodalne przetwarzanie obraz-tekst, dokładnie rozpoznający zawartość obrazu i generujący odpowiednie opisy lub odpowiedzi.",
"Kolors.description": "Kolors to model tekst-na-obraz opracowany przez zespół Kuaishou Kolors. Wytrenowany na miliardach parametrów, wyróżnia się jakością wizualną, rozumieniem semantyki chińskiej i renderowaniem tekstu.",
"Kwai-Kolors/Kolors.description": "Kolors to wielkoskalowy model latent-diffusion tekst-na-obraz od zespołu Kuaishou Kolors. Wytrenowany na miliardach par tekst-obraz, wyróżnia się jakością wizualną, dokładnością semantyczną i renderowaniem tekstu w języku chińskim/angielskim, z silnym rozumieniem i generowaniem treści w języku chińskim.",
"Kwaipilot/KAT-Dev.description": "KAT-Dev (32B) to otwartoźródłowy model 32B do zadań inżynierii oprogramowania. Osiąga 62,4% skuteczności na SWE-Bench Verified, zajmując 5. miejsce wśród otwartych modeli. Zoptymalizowany przez mid-training, SFT i RL do uzupełniania kodu, naprawy błędów i przeglądu kodu.",
"Llama-3.2-11B-Vision-Instruct.description": "Silne rozumowanie obrazowe na obrazach wysokiej rozdzielczości, odpowiednie do zastosowań wymagających rozumienia wizualnego.",
"Llama-3.2-90B-Vision-Instruct\t.description": "Zaawansowane rozumowanie obrazowe dla aplikacji agentów rozumiejących wizję.",
"Meta-Llama-3-3-70B-Instruct.description": "Llama 3.3 70B to wszechstronny model Transformer do zadań czatu i generowania treści.",
"Meta-Llama-3.1-405B-Instruct.description": "Model tekstowy Llama 3.1 dostrojony do instrukcji, zoptymalizowany do czatu wielojęzycznego, osiągający wysokie wyniki w branżowych benchmarkach wśród modeli otwartych i zamkniętych.",
"Meta-Llama-3.1-70B-Instruct.description": "Model tekstowy Llama 3.1 dostrojony do instrukcji, zoptymalizowany do czatu wielojęzycznego, osiągający wysokie wyniki w branżowych benchmarkach wśród modeli otwartych i zamkniętych.",
"Meta-Llama-3.1-8B-Instruct.description": "Model tekstowy Llama 3.1 dostrojony do instrukcji, zoptymalizowany do czatu wielojęzycznego, osiągający wysokie wyniki w branżowych benchmarkach wśród modeli otwartych i zamkniętych.",
"Meta-Llama-3.2-1B-Instruct.description": "Nowoczesny mały model językowy o silnym rozumieniu języka, doskonałym rozumowaniu i generowaniu tekstu.",
"Meta-Llama-3.2-3B-Instruct.description": "Nowoczesny mały model językowy o silnym rozumieniu języka, doskonałym rozumowaniu i generowaniu tekstu.",
"Meta-Llama-3.3-70B-Instruct.description": "Llama 3.3 to najbardziej zaawansowany wielojęzyczny otwartoźródłowy model Llama, oferujący wydajność zbliżoną do 405B przy bardzo niskim koszcie. Opiera się na architekturze Transformer i został ulepszony za pomocą SFT i RLHF dla użyteczności i bezpieczeństwa. Wersja dostrojona do instrukcji jest zoptymalizowana do czatu wielojęzycznego i przewyższa wiele modeli otwartych i zamkniętych w branżowych benchmarkach. Data odcięcia wiedzy: grudzień 2023.",
"Meta-Llama-4-Maverick-17B-128E-Instruct-FP8.description": "Llama 4 Maverick to duży model MoE z efektywną aktywacją ekspertów, zapewniający wysoką wydajność rozumowania.",
"MiniMax-M1.description": "Nowy wewnętrzny model rozumowania z 80 tys. łańcuchów myślowych i 1 mln tokenów wejściowych, oferujący wydajność porównywalną z czołowymi modelami światowymi.",
"MiniMax-M2-Stable.description": "Zaprojektowany z myślą o wydajnym kodowaniu i przepływach pracy agentów, z większą równoległością dla zastosowań komercyjnych.",
"MiniMax-M2.1-Lightning.description": "Potężne możliwości programowania w wielu językach kompleksowe ulepszenie doświadczenia kodowania. Szybciej i wydajniej.",
"MiniMax-M2.1.description": "Potężne możliwości programowania w wielu językach kompleksowe ulepszenie doświadczenia kodowania",
"MiniMax-M2.description": "Stworzony z myślą o wydajnym kodowaniu i przepływach pracy agentów",
"MiniMax-Text-01.description": "MiniMax-01 wprowadza dużą skalę uwagi liniowej wykraczającą poza klasyczne Transformatory, z 456 mld parametrów i 45,9 mld aktywowanych na przebieg. Osiąga najwyższą wydajność i obsługuje do 4 mln tokenów kontekstu (32× GPT-4o, 20× Claude-3.5-Sonnet).",
"MiniMaxAI/MiniMax-M1-80k.description": "MiniMax-M1 to model rozumowania o otwartych wagach, oparty na hybrydowej uwadze, z 456 mld parametrów ogółem i ~45,9 mld aktywnych na token. Natywnie obsługuje kontekst 1 mln tokenów i wykorzystuje Flash Attention, redukując FLOPs o 75% przy generowaniu 100 tys. tokenów w porównaniu do DeepSeek R1. Dzięki architekturze MoE, CISPO i treningowi RL z hybrydową uwagą, osiąga czołowe wyniki w zadaniach rozumowania z długim wejściem i rzeczywistym inżynierii oprogramowania.",
"MiniMaxAI/MiniMax-M2.description": "MiniMax-M2 redefiniuje efektywność agentów. To kompaktowy, szybki i opłacalny model MoE z 230 mld parametrów ogółem i 10 mld aktywnych, zaprojektowany do zadań kodowania i agentowych najwyższej klasy, przy zachowaniu silnej inteligencji ogólnej. Dzięki tylko 10 mld aktywnych parametrów dorównuje znacznie większym modelom, co czyni go idealnym do zastosowań wymagających wysokiej wydajności.",
"Moonshot-Kimi-K2-Instruct.description": "1 bln parametrów ogółem, z 32 mld aktywnych. Wśród modeli bez trybu myślenia, wyróżnia się w wiedzy czołowej, matematyce i kodowaniu, a także w zadaniach ogólnych agentów. Optymalizowany pod kątem obciążeń agentowych potrafi podejmować działania, a nie tylko odpowiadać. Najlepszy do improwizowanych rozmów, ogólnego czatu i doświadczeń agentowych jako model reagujący bez długiego namysłu.",
"NousResearch/Nous-Hermes-2-Mixtral-8x7B-DPO.description": "Nous Hermes 2 - Mixtral 8x7B-DPO (46,7 mld) to model instrukcyjny o wysokiej precyzji do złożonych obliczeń.",
"OmniConsistency.description": "OmniConsistency poprawia spójność stylu i uogólnianie w zadaniach obraz-do-obrazu, wprowadzając duże Transformatory Dyfuzyjne (DiTs) i sparowane dane stylizowane, unikając degradacji stylu.",
"Phi-3-medium-128k-instruct.description": "Ten sam model Phi-3-medium z większym oknem kontekstu do zadań RAG lub few-shot.",
"Phi-3-medium-4k-instruct.description": "Model z 14 mld parametrów, o wyższej jakości niż Phi-3-mini, skoncentrowany na danych wymagających intensywnego rozumowania.",
"Phi-3-mini-128k-instruct.description": "Ten sam model Phi-3-mini z większym oknem kontekstu do zadań RAG lub few-shot.",
"Phi-3-mini-4k-instruct.description": "Najmniejszy członek rodziny Phi-3, zoptymalizowany pod kątem jakości i niskich opóźnień.",
"Phi-3-small-128k-instruct.description": "Ten sam model Phi-3-small z większym oknem kontekstu do zadań RAG lub few-shot.",
"Phi-3-small-8k-instruct.description": "Model z 7 mld parametrów, o wyższej jakości niż Phi-3-mini, skoncentrowany na danych wymagających intensywnego rozumowania.",
"Phi-3.5-mini-instruct.description": "Zaktualizowana wersja modelu Phi-3-mini.",
"Phi-3.5-vision-instrust.description": "Zaktualizowana wersja modelu Phi-3-vision.",
"Pro/Qwen/Qwen2-7B-Instruct.description": "Qwen2-7B-Instruct to 7-miliardowy model LLM z serii Qwen2, dostrojony do instrukcji. Wykorzystuje architekturę Transformera z SwiGLU, biasem QKV i grupowaną uwagę zapytań, obsługuje duże wejścia. Wyróżnia się w rozumieniu języka, generowaniu, zadaniach wielojęzycznych, kodowaniu, matematyce i rozumowaniu, przewyższając większość modeli otwartych i konkurując z zamkniętymi. Przewyższa Qwen1.5-7B-Chat w wielu testach.",
"Pro/Qwen/Qwen2.5-7B-Instruct.description": "Qwen2.5-7B-Instruct to część najnowszej serii LLM Alibaba Cloud. Model 7B przynosi znaczące ulepszenia w kodowaniu i matematyce, obsługuje ponad 29 języków i poprawia wykonywanie instrukcji, rozumienie danych strukturalnych i generowanie strukturalnych wyników (szczególnie JSON).",
"Pro/Qwen/Qwen2.5-Coder-7B-Instruct.description": "Qwen2.5-Coder-7B-Instruct to najnowszy model LLM Alibaba Cloud skoncentrowany na kodzie. Zbudowany na bazie Qwen2.5 i wytrenowany na 5,5 bln tokenów, znacząco poprawia generowanie kodu, rozumowanie i naprawę, zachowując mocne strony w matematyce i ogólnych zadaniach, stanowiąc solidną bazę dla agentów kodujących.",
"Pro/Qwen/Qwen2.5-VL-7B-Instruct.description": "Qwen2.5-VL to nowy model językowo-wizualny Qwen z silnym rozumieniem wizualnym. Analizuje tekst, wykresy i układy na obrazach, rozumie długie filmy i zdarzenia, wspiera rozumowanie i użycie narzędzi, uziemienie obiektów w wielu formatach i strukturalne wyniki. Poprawia rozdzielczość dynamiczną i trening z różnymi klatkami dla lepszego rozumienia wideo oraz zwiększa efektywność enkodera wizji.",
"Pro/THUDM/GLM-4.1V-9B-Thinking.description": "GLM-4.1V-9B-Thinking to otwartoźródłowy model VLM od Zhipu AI i laboratorium KEG Uniwersytetu Tsinghua, zaprojektowany do złożonego poznania multimodalnego. Zbudowany na bazie GLM-4-9B-0414, dodaje rozumowanie łańcuchowe i RL, znacząco poprawiając rozumowanie między modalnościami i stabilność.",
"Pro/THUDM/glm-4-9b-chat.description": "GLM-4-9B-Chat to otwartoźródłowy model GLM-4 od Zhipu AI. Wyróżnia się w semantyce, matematyce, rozumowaniu, kodzie i wiedzy. Poza wieloetapowym czatem obsługuje przeglądanie sieci, wykonywanie kodu, niestandardowe wywołania narzędzi i rozumowanie długich tekstów. Obsługuje 26 języków (w tym chiński, angielski, japoński, koreański, niemiecki). Osiąga dobre wyniki w AlignBench-v2, MT-Bench, MMLU i C-Eval, obsługuje do 128 tys. tokenów kontekstu do zastosowań akademickich i biznesowych.",
"Pro/deepseek-ai/DeepSeek-R1-Distill-Qwen-7B.description": "DeepSeek-R1-Distill-Qwen-7B to model zdestylowany z Qwen2.5-Math-7B i dostrojony na 800 tys. starannie dobranych próbkach DeepSeek-R1. Osiąga wysokie wyniki: 92,8% na MATH-500, 55,5% na AIME 2024 i ocenę 1189 na CodeForces dla modelu 7B.",
"Pro/deepseek-ai/DeepSeek-R1.description": "DeepSeek-R1 to model rozumowania oparty na RL, który redukuje powtórzenia i poprawia czytelność. Wykorzystuje dane cold-start przed RL, by dodatkowo zwiększyć zdolności rozumowania, dorównuje OpenAI-o1 w zadaniach matematycznych, kodowych i rozumowania, a dzięki starannemu treningowi poprawia ogólne wyniki.",
"Pro/deepseek-ai/DeepSeek-V3.1-Terminus.description": "DeepSeek-V3.1-Terminus to zaktualizowany model V3.1, pozycjonowany jako hybrydowy agent LLM. Naprawia zgłoszone przez użytkowników problemy, poprawia stabilność, spójność językową i redukuje mieszane znaki chińskie/angielskie oraz nieprawidłowe znaki. Integruje tryby myślenia i nie-myślenia z szablonami czatu dla elastycznego przełączania. Poprawia również wydajność agentów kodu i wyszukiwania dla bardziej niezawodnego użycia narzędzi i zadań wieloetapowych.",
"Pro/deepseek-ai/DeepSeek-V3.2-Exp.description": "DeepSeek-V3.2-Exp to eksperymentalne wydanie V3.2, łączące się z nową architekturą. Dodaje DeepSeek Sparse Attention (DSA) do V3.1-Terminus, poprawiając efektywność treningu i wnioskowania w długim kontekście, z optymalizacjami dla użycia narzędzi, rozumienia długich dokumentów i rozumowania wieloetapowego. Idealny do eksploracji wyższej efektywności rozumowania przy dużych budżetach kontekstu.",
"Pro/deepseek-ai/DeepSeek-V3.description": "DeepSeek-V3 to model MoE z 671 mld parametrów, wykorzystujący MLA i DeepSeekMoE z równoważeniem obciążenia bez strat, zapewniający efektywne wnioskowanie i trening. Wstępnie wytrenowany na 14,8 bln wysokiej jakości tokenów i dalej dostrojony za pomocą SFT i RL, przewyższa inne modele otwarte i zbliża się do czołowych modeli zamkniętych.",
"Pro/moonshotai/Kimi-K2-Instruct-0905.description": "Kimi K2-Instruct-0905 to najnowsza i najpotężniejsza wersja Kimi K2. Jest to model MoE najwyższej klasy z 1T łącznych i 32B aktywnych parametrów. Kluczowe cechy to silniejsza inteligencja kodowania agentowego z istotnymi poprawami w testach porównawczych i zadaniach agentowych w rzeczywistych warunkach, a także ulepszona estetyka i użyteczność kodowania frontendowego.",
"Pro/moonshotai/Kimi-K2-Thinking.description": "Kimi K2 Thinking Turbo to wariant Turbo zoptymalizowany pod kątem szybkości rozumowania i przepustowości, zachowując jednocześnie wieloetapowe rozumowanie i obsługę narzędzi znane z K2 Thinking. Jest to model MoE z około 1T łącznych parametrów, natywnym kontekstem 256K i stabilnym wywoływaniem narzędzi na dużą skalę, przeznaczony do zastosowań produkcyjnych z rygorystycznymi wymaganiami dotyczącymi opóźnień i współbieżności.",
"Pro/zai-org/glm-4.7.description": "GLM-4.7 to najnowszy flagowy model Zhipu, zaprojektowany z myślą o scenariuszach Agentic Coding. Wzmacnia zdolności kodowania, planowania zadań długoterminowych i współpracy z narzędziami, osiągając czołowe wyniki wśród modeli open-source w wielu aktualnych rankingach. Ulepszono ogólne możliwości modelu — odpowiedzi są bardziej zwięzłe i naturalne, a teksty pisane bardziej immersyjne. W realizacji złożonych zadań agentowych model lepiej przestrzega instrukcji podczas wywoływania narzędzi, a estetyka interfejsu Artifacts i efektywność realizacji długich zadań w Agentic Coding zostały znacznie poprawione.",
"QwQ-32B-Preview.description": "Qwen QwQ to eksperymentalny model badawczy skoncentrowany na ulepszaniu zdolności rozumowania.",
"Qwen/QVQ-72B-Preview.description": "QVQ-72B-Preview to model badawczy od Qwen, skoncentrowany na rozumowaniu wizualnym, wyróżniający się w złożonym rozumieniu scen i problemach matematycznych opartych na obrazie.",
"Qwen/QwQ-32B-Preview.description": "Qwen QwQ to eksperymentalny model badawczy skoncentrowany na ulepszonym rozumowaniu sztucznej inteligencji.",
"Qwen/QwQ-32B.description": "QwQ to model rozumowania z rodziny Qwen. W porównaniu do standardowych modeli dostrojonych do instrukcji, dodaje warstwę myślenia i rozumowania, co znacząco poprawia wydajność w zadaniach końcowych, szczególnie w trudnych problemach. QwQ-32B to model średniej wielkości konkurujący z czołowymi modelami rozumowania, takimi jak DeepSeek-R1 i o1-mini. Wykorzystuje RoPE, SwiGLU, RMSNorm i bias QKV w mechanizmie uwagi, z 64 warstwami i 40 głowicami uwagi Q (8 KV w GQA).",
"Qwen/Qwen-Image-Edit-2509.description": "Qwen-Image-Edit-2509 to najnowsza wersja edycyjna Qwen-Image od zespołu Qwen. Bazując na modelu Qwen-Image 20B, rozszerza możliwości renderowania tekstu na edycję obrazów, umożliwiając precyzyjne modyfikacje tekstowe. Wykorzystuje architekturę podwójnej kontroli, przesyłając dane wejściowe do Qwen2.5-VL w celu kontroli semantycznej oraz do kodera VAE w celu kontroli wyglądu, co umożliwia edycję zarówno na poziomie semantycznym, jak i wizualnym. Obsługuje lokalne zmiany (dodawanie/usuwanie/modyfikacja) oraz edycje semantyczne wyższego poziomu, takie jak tworzenie IP i transfer stylu, zachowując przy tym znaczenie. Osiąga najlepsze wyniki w wielu testach porównawczych.",
"Qwen/Qwen-Image.description": "Qwen-Image to bazowy model generowania obrazów o 20 miliardach parametrów od zespołu Qwen. Oferuje znaczące postępy w renderowaniu złożonego tekstu i precyzyjnej edycji obrazów, szczególnie w przypadku tekstu chińskiego i angielskiego o wysokiej wierności. Obsługuje układy wieloliniowe i akapity, zachowując spójność typograficzną. Poza renderowaniem tekstu, wspiera szeroki zakres stylów od fotorealistycznych po anime oraz zaawansowane techniki edycji, takie jak transfer stylu, dodawanie/usuwanie obiektów, poprawa szczegółów, edycja tekstu i kontrola pozycji, dążąc do bycia kompleksową bazą do tworzenia wizualnego.",
"Qwen/Qwen2-72B-Instruct.description": "Qwen 2 Instruct (72B) zapewnia precyzyjne wykonywanie instrukcji dla zastosowań korporacyjnych.",
"Qwen/Qwen2-7B-Instruct.description": "Qwen2-7B-Instruct to model o 7 miliardach parametrów z serii Qwen2, dostrojony do instrukcji, wykorzystujący architekturę Transformer, SwiGLU, bias QKV i grupowaną uwagę zapytań. Obsługuje duże dane wejściowe i osiąga wysokie wyniki w testach rozumienia, generowania, wielojęzyczności, kodowania, matematyki i rozumowania, przewyższając większość otwartych modeli i wyprzedzając Qwen1.5-7B-Chat w wielu ocenach.",
"Qwen/Qwen2-VL-72B-Instruct.description": "Qwen2-VL to najnowszy model Qwen-VL, osiągający najlepsze wyniki w testach wizualnych, takich jak MathVista, DocVQA, RealWorldQA i MTVQA. Potrafi rozumieć filmy trwające ponad 20 minut w kontekście pytań wideo, dialogów i tworzenia treści. Obsługuje również złożone rozumowanie i podejmowanie decyzji, integrując się z urządzeniami/robotami do działań opartych na wizji. Poza językiem angielskim i chińskim, potrafi czytać tekst w wielu językach, w tym większości języków europejskich, japońskim, koreańskim, arabskim i wietnamskim.",
"Qwen/Qwen2.5-14B-Instruct.description": "Qwen2.5-14B-Instruct to część najnowszej serii LLM Alibaba Cloud. Model 14B przynosi znaczące postępy w kodowaniu i matematyce, obsługuje ponad 29 języków i poprawia wykonywanie instrukcji, rozumienie danych strukturalnych oraz generowanie danych strukturalnych (szczególnie JSON).",
"Qwen/Qwen2.5-32B-Instruct.description": "Qwen2.5-32B-Instruct to część najnowszej serii LLM Alibaba Cloud. Model 32B przynosi znaczące postępy w kodowaniu i matematyce, obsługuje ponad 29 języków i poprawia wykonywanie instrukcji, rozumienie danych strukturalnych oraz generowanie danych strukturalnych (szczególnie JSON).",
"Qwen/Qwen2.5-72B-Instruct-128K.description": "Qwen2.5-72B-Instruct to część najnowszej serii LLM Alibaba Cloud. Model 72B poprawia kodowanie i matematykę, obsługuje do 128K danych wejściowych i ponad 8K danych wyjściowych, oferuje wsparcie dla ponad 29 języków oraz ulepsza wykonywanie instrukcji i generowanie danych strukturalnych (szczególnie JSON).",
"Qwen/Qwen2.5-72B-Instruct-Turbo.description": "Qwen2.5 to nowa rodzina LLM zoptymalizowana pod kątem zadań w stylu instrukcji.",
"Qwen/Qwen2.5-72B-Instruct.description": "Qwen2.5-72B-Instruct to część najnowszej serii LLM Alibaba Cloud. Model 72B przynosi znaczące postępy w kodowaniu i matematyce, obsługuje ponad 29 języków i poprawia wykonywanie instrukcji, rozumienie danych strukturalnych oraz generowanie danych strukturalnych (szczególnie JSON).",
"Qwen/Qwen2.5-7B-Instruct-Turbo.description": "Qwen2.5 to nowa rodzina LLM zoptymalizowana pod kątem zadań w stylu instrukcji.",
"Qwen/Qwen2.5-7B-Instruct.description": "Qwen2.5-7B-Instruct to część najnowszej serii LLM Alibaba Cloud. Model 7B przynosi znaczące postępy w kodowaniu i matematyce, obsługuje ponad 29 języków i poprawia wykonywanie instrukcji, rozumienie danych strukturalnych oraz generowanie danych strukturalnych (szczególnie JSON).",
"Qwen/Qwen2.5-Coder-32B-Instruct.description": "Qwen2.5 Coder 32B Instruct to najnowszy model LLM Alibaba Cloud skoncentrowany na kodzie. Zbudowany na bazie Qwen2.5 i wytrenowany na 5,5T tokenów, znacząco poprawia generowanie kodu, rozumowanie i naprawę błędów, zachowując przy tym mocne strony w matematyce i ogólnych zadaniach, stanowiąc solidną bazę dla agentów kodujących.",
"Qwen/Qwen2.5-Coder-7B-Instruct.description": "Qwen2.5-Coder-7B-Instruct to najnowszy model LLM Alibaba Cloud skoncentrowany na kodzie. Zbudowany na bazie Qwen2.5 i wytrenowany na 5,5T tokenów, znacząco poprawia generowanie kodu, rozumowanie i naprawę błędów, zachowując przy tym mocne strony w matematyce i ogólnych zadaniach, stanowiąc solidną bazę dla agentów kodujących.",
"Qwen/Qwen2.5-VL-32B-Instruct.description": "Qwen2.5-VL-32B-Instruct to model multimodalny od zespołu Qwen. Rozpoznaje powszechne obiekty i analizuje tekst, wykresy, ikony, grafiki i układy. Jako agent wizualny potrafi rozumować i dynamicznie kontrolować narzędzia, w tym korzystanie z komputera i telefonu. Precyzyjnie lokalizuje obiekty i generuje dane strukturalne dla faktur i tabel. W porównaniu do Qwen2-VL, RL dodatkowo poprawia matematykę i rozwiązywanie problemów, oferując bardziej preferowane przez ludzi odpowiedzi.",
"Qwen/Qwen2.5-VL-72B-Instruct.description": "Qwen2.5-VL to model językowo-wizualny z serii Qwen2.5 z dużymi ulepszeniami: silniejsze rozumienie wizualne obiektów, tekstu, wykresów i układów; rozumowanie jako agent wizualny z dynamicznym użyciem narzędzi; rozumienie filmów trwających ponad godzinę i wychwytywanie kluczowych wydarzeń; precyzyjne lokalizowanie obiektów za pomocą ramek lub punktów; oraz generowanie danych strukturalnych dla zeskanowanych danych, takich jak faktury i tabele.",
"Qwen/Qwen3-14B.description": "Qwen3 to nowej generacji model Tongyi Qwen, oferujący znaczne ulepszenia w zakresie rozumowania, ogólnych zdolności, możliwości działania jako agent oraz wydajności wielojęzycznej. Obsługuje przełączanie trybów myślenia.",
"Qwen/Qwen3-235B-A22B-Instruct-2507.description": "Qwen3-235B-A22B-Instruct-2507 to flagowy model Qwen3 MoE z 235 miliardami parametrów ogólnych i 22 miliardami aktywnych. Jest to zaktualizowana wersja bez trybu myślenia, skoncentrowana na poprawie wykonywania instrukcji, rozumowania logicznego, rozumienia tekstu, matematyki, nauk ścisłych, programowania i obsługi narzędzi. Rozszerza również wiedzę długiego ogona w wielu językach i lepiej dopasowuje się do preferencji użytkowników w zadaniach subiektywnych i otwartych.",
"Qwen/Qwen3-235B-A22B-Thinking-2507.description": "Qwen3-235B-A22B-Thinking-2507 to model Qwen3 skoncentrowany na złożonym rozumowaniu. Wykorzystuje architekturę MoE z 235 miliardami parametrów ogólnych i około 22 miliardami aktywnych na token, co zwiększa efektywność. Jako dedykowany model myślący, osiąga znaczne postępy w logice, matematyce, naukach ścisłych, programowaniu i testach akademickich, osiągając najwyższy poziom otwartego rozumowania. Poprawia również wykonywanie instrukcji, obsługę narzędzi i generowanie tekstu, a także natywnie obsługuje kontekst 256K dla głębokiego rozumowania i długich dokumentów.",
"Qwen/Qwen3-235B-A22B.description": "Qwen3 to nowej generacji model Tongyi Qwen, oferujący znaczne ulepszenia w zakresie rozumowania, ogólnych zdolności, możliwości działania jako agent oraz wydajności wielojęzycznej. Obsługuje przełączanie trybów myślenia.",
"Qwen/Qwen3-30B-A3B-Instruct-2507.description": "Qwen3-30B-A3B-Instruct-2507 to zaktualizowana wersja modelu Qwen3-30B-A3B bez trybu myślenia. Jest to model MoE z 30,5 miliardami parametrów ogólnych i 3,3 miliardami aktywnych. Znacząco poprawia wykonywanie instrukcji, rozumowanie logiczne, rozumienie tekstu, matematykę, nauki ścisłe, programowanie i obsługę narzędzi, rozszerza wiedzę długiego ogona w wielu językach i lepiej dopasowuje się do preferencji użytkowników w zadaniach subiektywnych. Obsługuje kontekst 256K. Ten model działa wyłącznie w trybie bez myślenia i nie generuje znaczników `<think></think>`.",
"Qwen/Qwen3-30B-A3B-Thinking-2507.description": "Qwen3-30B-A3B-Thinking-2507 to najnowszy model myślący z serii Qwen3. Jest to model MoE z 30,5 miliardami parametrów ogólnych i 3,3 miliardami aktywnych, skoncentrowany na złożonych zadaniach. Osiąga znaczące postępy w logice, matematyce, naukach ścisłych, programowaniu i testach akademickich, a także poprawia wykonywanie instrukcji, obsługę narzędzi, generowanie tekstu i dopasowanie do preferencji. Natywnie obsługuje kontekst 256K i może zostać rozszerzony do 1 miliona tokenów. Ta wersja została zaprojektowana do trybu myślenia z dokładnym rozumowaniem krok po kroku i silnymi możliwościami agenta.",
"Qwen/Qwen3-30B-A3B.description": "Qwen3 to nowej generacji model Tongyi Qwen, oferujący znaczne ulepszenia w zakresie rozumowania, ogólnych zdolności, możliwości działania jako agent oraz wydajności wielojęzycznej. Obsługuje przełączanie trybów myślenia.",
"Qwen/Qwen3-32B.description": "Qwen3 to nowej generacji model Tongyi Qwen, oferujący znaczne ulepszenia w zakresie rozumowania, ogólnych zdolności, możliwości działania jako agent oraz wydajności wielojęzycznej. Obsługuje przełączanie trybów myślenia.",
"Qwen/Qwen3-8B.description": "Qwen3 to nowej generacji model Tongyi Qwen, oferujący znaczne ulepszenia w zakresie rozumowania, ogólnych zdolności, możliwości działania jako agent oraz wydajności wielojęzycznej. Obsługuje przełączanie trybów myślenia.",
"Qwen/Qwen3-Coder-30B-A3B-Instruct.description": "Qwen3-Coder-30B-A3B-Instruct to model kodowania z serii Qwen3 opracowany przez zespół Qwen. Został zoptymalizowany pod kątem wysokiej wydajności i efektywności, jednocześnie zwiększając możliwości kodowania. Wyróżnia się w kodowaniu agentowym, automatyzacji przeglądarki i obsłudze narzędzi wśród modeli otwartych. Natywnie obsługuje kontekst 256K i może zostać rozszerzony do 1 miliona tokenów dla zrozumienia na poziomie całej bazy kodu. Obsługuje kodowanie agentowe na platformach takich jak Qwen Code i CLINE z dedykowanym formatem wywoływania funkcji.",
"Qwen/Qwen3-Coder-480B-A35B-Instruct.description": "Qwen3-Coder-480B-A35B-Instruct to najbardziej zaawansowany model kodowania agentowego firmy Alibaba. Jest to model MoE z 480 miliardami parametrów ogólnych i 35 miliardami aktywnych, łączący efektywność z wydajnością. Natywnie obsługuje kontekst 256K i może zostać rozszerzony do 1 miliona tokenów za pomocą YaRN, umożliwiając obsługę dużych baz kodu. Zaprojektowany do przepływów pracy kodowania agentowego, potrafi współdziałać z narzędziami i środowiskami w celu rozwiązywania złożonych zadań programistycznych. Osiąga najlepsze wyniki wśród modeli otwartych w testach kodowania i agentów, porównywalne z wiodącymi modelami, takimi jak Claude Sonnet 4.",
"Qwen/Qwen3-Next-80B-A3B-Instruct.description": "Qwen3-Next-80B-A3B-Instruct to nowej generacji model bazowy oparty na architekturze Qwen3-Next, zaprojektowany z myślą o ekstremalnej wydajności trenowania i wnioskowania. Łączy hybrydową uwagę (Gated DeltaNet + Gated Attention), silnie rozrzedzoną architekturę MoE oraz optymalizacje stabilności treningu. Choć posiada 80 miliardów parametrów, podczas wnioskowania aktywnych jest jedynie około 3 miliardów, co znacząco redukuje zapotrzebowanie na zasoby obliczeniowe i zapewnia ponad 10-krotnie większą przepustowość niż Qwen3-32B przy kontekstach >32K. Wersja dostrojona do instrukcji jest przeznaczona do ogólnych zadań (bez trybu myślenia). Osiąga porównywalne wyniki z Qwen3-235B w niektórych testach i wykazuje wyraźną przewagę w zadaniach z ultradługim kontekstem.",
"Qwen/Qwen3-Next-80B-A3B-Thinking.description": "Qwen3-Next-80B-A3B-Thinking to nowej generacji model bazowy przeznaczony do złożonego rozumowania. Wykorzystuje architekturę Qwen3-Next z hybrydową uwagą (Gated DeltaNet + Gated Attention) oraz silnie rozrzedzoną architekturę MoE, zapewniając ekstremalną wydajność trenowania i wnioskowania. Choć posiada 80 miliardów parametrów, podczas wnioskowania aktywnych jest jedynie około 3 miliardów, co znacząco redukuje zapotrzebowanie na zasoby obliczeniowe i zapewnia ponad 10-krotnie większą przepustowość niż Qwen3-32B przy kontekstach >32K. Wersja Thinking jest zoptymalizowana pod kątem zadań wieloetapowych, takich jak dowodzenie, synteza kodu, analiza logiczna i planowanie, generując uporządkowany łańcuch myślowy. Przewyższa Qwen3-32B-Thinking i pokonuje Gemini-2.5-Flash-Thinking w wielu testach porównawczych.",
"Qwen/Qwen3-Omni-30B-A3B-Captioner.description": "Qwen3-Omni-30B-A3B-Captioner to model VLM z serii Qwen3, stworzony do generowania wysokiej jakości, szczegółowych i precyzyjnych opisów obrazów. Wykorzystuje architekturę MoE z 30 miliardami parametrów, aby dogłębnie analizować obrazy i tworzyć płynne opisy, wyróżniając się w uchwyceniu detali, rozumieniu scen, rozpoznawaniu obiektów i relacyjnym rozumowaniu.",
"Qwen/Qwen3-Omni-30B-A3B-Instruct.description": "Qwen3-Omni-30B-A3B-Instruct to model MoE z serii Qwen3, posiadający 30 miliardów parametrów ogółem i 3 miliardy aktywnych, oferujący wysoką wydajność przy niskim koszcie wnioskowania. Trenowany na wysokiej jakości danych wielojęzycznych z wielu źródeł, obsługuje pełne wejścia modalne (tekst, obrazy, dźwięk, wideo) oraz rozumienie i generowanie między modalnościami.",
"Qwen/Qwen3-Omni-30B-A3B-Thinking.description": "Qwen3-Omni-30B-A3B-Thinking to kluczowy komponent „Myślący” w Qwen3-Omni. Przetwarza dane multimodalne (tekst, dźwięk, obrazy, wideo) i wykonuje złożone rozumowanie łańcuchowe, łącząc dane wejściowe w jedną reprezentację dla głębokiego rozumienia między modalnościami. Jest to model MoE z 30 miliardami parametrów ogółem i 3 miliardami aktywnych, łączący silne zdolności rozumowania z efektywnością obliczeniową.",
"Qwen/Qwen3-VL-235B-A22B-Instruct.description": "Qwen3-VL-235B-A22B-Instruct to duży model Qwen3-VL dostrojony do instrukcji, oparty na architekturze MoE, zapewniający doskonałe rozumienie i generowanie multimodalne. Obsługuje natywnie kontekst 256K i nadaje się do produkcyjnych usług multimodalnych o wysokiej współbieżności.",
"Qwen/Qwen3-VL-235B-A22B-Thinking.description": "Qwen3-VL-235B-A22B-Thinking to flagowa wersja myśląca modelu Qwen3-VL, zoptymalizowana pod kątem złożonego rozumowania multimodalnego, rozumowania w długim kontekście oraz interakcji agentów w zastosowaniach korporacyjnych.",
"Qwen/Qwen3-VL-30B-A3B-Instruct.description": "Qwen3-VL-30B-A3B-Instruct to model Qwen3-VL dostrojony do instrukcji, oferujący silne rozumienie i generowanie wizualno-językowe. Obsługuje natywnie kontekst 256K dla czatu multimodalnego i generowania warunkowanego obrazem.",
"Qwen/Qwen3-VL-30B-A3B-Thinking.description": "Qwen3-VL-30B-A3B-Thinking to wersja modelu Qwen3-VL wzbogacona o zdolności rozumowania, zoptymalizowana pod kątem rozumowania multimodalnego, konwersji obrazu na kod oraz złożonego rozumienia wizualnego. Obsługuje kontekst 256K z silniejszymi zdolnościami łańcucha myślowego.",
"Qwen/Qwen3-VL-32B-Instruct.description": "Qwen3-VL-32B-Instruct to model wizualno-językowy zespołu Qwen, osiągający czołowe wyniki SOTA w wielu testach VL. Obsługuje obrazy w rozdzielczości megapikselowej i oferuje silne rozumienie wizualne, wielojęzyczne OCR, precyzyjne osadzanie wizualne oraz dialog wizualny. Radzi sobie ze złożonymi zadaniami multimodalnymi i obsługuje wywoływanie narzędzi oraz uzupełnianie prefiksów.",
"Qwen/Qwen3-VL-32B-Thinking.description": "Qwen3-VL-32B-Thinking jest zoptymalizowany do złożonego rozumowania wizualnego. Zawiera wbudowany tryb myślenia, który generuje pośrednie kroki rozumowania przed odpowiedziami, zwiększając logikę wieloetapową, planowanie i złożone rozumowanie. Obsługuje obrazy megapikselowe, silne rozumienie wizualne, wielojęzyczne OCR, precyzyjne osadzanie, dialog wizualny, wywoływanie narzędzi i uzupełnianie prefiksów.",
"Qwen/Qwen3-VL-8B-Instruct.description": "Qwen3-VL-8B-Instruct to model wizualno-językowy Qwen3 oparty na Qwen3-8B-Instruct, trenowany na dużych zbiorach danych obraz-tekst. Wyróżnia się w ogólnym rozumieniu wizualnym, dialogu skoncentrowanym na obrazie oraz wielojęzycznym rozpoznawaniu tekstu w obrazach, odpowiedni do wizualnego QA, opisywania, multimodalnego podążania za instrukcjami i użycia narzędzi.",
"Qwen/Qwen3-VL-8B-Thinking.description": "Qwen3-VL-8B-Thinking to wizualna wersja myśląca Qwen3, zoptymalizowana do złożonego rozumowania wieloetapowego. Generuje łańcuch myślowy przed odpowiedziami, aby poprawić dokładność, idealna do głębokiego wizualnego QA i szczegółowej analizy obrazów.",
"Qwen2-72B-Instruct.description": "Qwen2 to najnowsza seria Qwen, obsługująca okno kontekstu 128k. W porównaniu z najlepszymi obecnie otwartymi modelami, Qwen2-72B znacznie przewyższa czołowe modele w zakresie rozumienia języka naturalnego, wiedzy, kodu, matematyki i możliwości wielojęzycznych.",
"Qwen2-7B-Instruct.description": "Qwen2 to najnowsza seria Qwen, przewyższająca najlepsze otwarte modele o podobnej wielkości, a nawet większe. Qwen2 7B wykazuje znaczną przewagę w wielu testach, szczególnie w zakresie kodu i rozumienia języka chińskiego.",
"Qwen2-VL-72B.description": "Qwen2-VL-72B to potężny model wizualno-językowy obsługujący przetwarzanie multimodalne obraz-tekst, dokładnie rozpoznający zawartość obrazów i generujący odpowiednie opisy lub odpowiedzi.",
"Qwen2.5-14B-Instruct.description": "Qwen2.5-14B-Instruct to model językowy LLM z 14 miliardami parametrów, oferujący wysoką wydajność, zoptymalizowany pod kątem scenariuszy chińskich i wielojęzycznych, wspierający inteligentne pytania i odpowiedzi oraz generowanie treści.",
"Qwen2.5-32B-Instruct.description": "Qwen2.5-32B-Instruct to model językowy LLM z 32 miliardami parametrów, oferujący zrównoważoną wydajność, zoptymalizowany pod kątem scenariuszy chińskich i wielojęzycznych, wspierający inteligentne pytania i odpowiedzi oraz generowanie treści.",
"Qwen2.5-72B-Instruct.description": "Model LLM dla języka chińskiego i angielskiego, dostrojony do języka, kodowania, matematyki i rozumowania.",
"Qwen2.5-7B-Instruct.description": "Qwen2.5-7B-Instruct to model językowy LLM z 7 miliardami parametrów, obsługujący wywoływanie funkcji i płynną integrację z systemami zewnętrznymi, znacznie zwiększając elastyczność i rozszerzalność. Zoptymalizowany pod kątem scenariuszy chińskich i wielojęzycznych, wspierający inteligentne pytania i odpowiedzi oraz generowanie treści.",
"Qwen2.5-Coder-14B-Instruct.description": "Qwen2.5-Coder-14B-Instruct to duży model kodowania dostrojony do instrukcji, oferujący silne rozumienie i generowanie kodu. Skutecznie obsługuje szeroki zakres zadań programistycznych, idealny do inteligentnego kodowania, automatycznego generowania skryptów i pytań i odpowiedzi związanych z programowaniem.",
"Qwen2.5-Coder-32B-Instruct.description": "Zaawansowany model LLM do generowania kodu, rozumowania i naprawy błędów w głównych językach programowania.",
"Qwen3-235B-A22B-Instruct-2507-FP8.description": "Qwen3 235B A22B Instruct 2507 jest zoptymalizowany pod kątem zaawansowanego rozumowania i podążania za instrukcjami, wykorzystując architekturę MoE, aby zapewnić efektywność rozumowania w dużej skali.",
"Qwen3-235B.description": "Qwen3-235B-A22B to model MoE, który wprowadza hybrydowy tryb rozumowania, umożliwiając użytkownikom płynne przełączanie się między trybem myślenia i niemyslenia. Obsługuje rozumienie i rozumowanie w 119 językach i dialektach oraz posiada silne możliwości wywoływania narzędzi, konkurując z głównymi modelami, takimi jak DeepSeek R1, OpenAI o1, o3-mini, Grok 3 i Google Gemini 2.5 Pro w testach ogólnych, kodowania i matematyki, możliwości wielojęzycznych oraz rozumowania wiedzy.",
"Qwen3-32B.description": "Qwen3-32B to gęsty model, który wprowadza hybrydowy tryb rozumowania, umożliwiając użytkownikom przełączanie się między trybem myślenia i niemyslenia. Dzięki ulepszeniom architektury, większej ilości danych i lepszemu treningowi, osiąga wydajność porównywalną z Qwen2.5-72B.",
"SenseChat-128K.description": "Wersja bazowa V4 z kontekstem 128K, doskonała w rozumieniu i generowaniu długich tekstów.",
"SenseChat-32K.description": "Wersja bazowa V4 z kontekstem 32K, elastyczna w wielu zastosowaniach.",
"SenseChat-5-1202.description": "Najnowsza wersja oparta na V5.5, z istotnymi ulepszeniami w zakresie podstaw języka chińskiego/angielskiego, rozmów, wiedzy STEM, nauk humanistycznych, pisania, matematyki/logiki oraz kontroli długości.",
"SenseChat-5-Cantonese.description": "Dostosowana do zwyczajów językowych Hongkongu, slangu i wiedzy lokalnej; przewyższa GPT-4 w rozumieniu kantońskiego i dorównuje GPT-4 Turbo w wiedzy, rozumowaniu, matematyce i programowaniu.",
"SenseChat-5-beta.description": "W niektórych aspektach przewyższa SenseChat-5-1202.",
"SenseChat-5.description": "Najnowsza wersja V5.5 z kontekstem 128K; znaczne postępy w rozumowaniu matematycznym, rozmowach po angielsku, wykonywaniu poleceń i rozumieniu długich tekstów, porównywalna z GPT-4o.",
"SenseChat-Character-Pro.description": "Zaawansowany model rozmów z postaciami z kontekstem 32K, ulepszoną funkcjonalnością i wsparciem dla języka chińskiego/angielskiego.",
"SenseChat-Character.description": "Standardowy model rozmów z postaciami z kontekstem 8K i wysoką szybkością odpowiedzi.",
"SenseChat-Turbo-1202.description": "Najnowszy lekki model osiągający ponad 90% możliwości pełnego modelu przy znacznie niższych kosztach wnioskowania.",
"SenseChat-Turbo.description": "Odpowiedni do szybkich pytań i odpowiedzi oraz scenariuszy dostrajania modeli.",
"SenseChat-Vision.description": "Najnowsza wersja V5.5 z obsługą wielu obrazów i szerokimi ulepszeniami w rozpoznawaniu atrybutów, relacjach przestrzennych, wykrywaniu działań/zdarzeń, rozumieniu scen, rozpoznawaniu emocji, rozumowaniu zdroworozsądkowemu oraz rozumieniu/generowaniu tekstu.",
"SenseChat.description": "Wersja bazowa V4 z kontekstem 4K i silnymi ogólnymi możliwościami.",
"SenseNova-V6-5-Pro.description": "Dzięki kompleksowym aktualizacjom danych multimodalnych, językowych i logicznych oraz optymalizacji strategii treningowej, nowy model znacząco poprawia rozumowanie multimodalne i ogólne podążanie za instrukcjami, obsługuje kontekst do 128 tys. tokenów i wyróżnia się w zadaniach OCR oraz rozpoznawania IP w turystyce kulturowej.",
"SenseNova-V6-5-Turbo.description": "Dzięki kompleksowym aktualizacjom danych multimodalnych, językowych i logicznych oraz optymalizacji strategii treningowej, nowy model znacząco poprawia rozumowanie multimodalne i ogólne podążanie za instrukcjami, obsługuje kontekst do 128 tys. tokenów i wyróżnia się w zadaniach OCR oraz rozpoznawania IP w turystyce kulturowej.",
"SenseNova-V6-Pro.description": "Model natywnie integruje obraz, tekst i wideo, przełamując tradycyjne bariery multimodalne; zdobywa czołowe miejsca w rankingach OpenCompass i SuperCLUE.",
"SenseNova-V6-Reasoner.description": "Łączy głębokie rozumowanie wizualne i językowe, wspierając powolne myślenie i pełny łańcuch rozumowania.",
"SenseNova-V6-Turbo.description": "Model natywnie integruje obraz, tekst i wideo, przełamując tradycyjne bariery multimodalne. Przoduje w kluczowych możliwościach multimodalnych i językowych, zajmując czołowe miejsca w wielu ocenach.",
"Skylark2-lite-8k.description": "Model drugiej generacji Skylark. Skylark2-lite zapewnia szybkie odpowiedzi w scenariuszach czasu rzeczywistego i wrażliwych na koszty, gdzie wymagana jest mniejsza dokładność, z kontekstem do 8 tys. tokenów.",
"Skylark2-pro-32k.description": "Model drugiej generacji Skylark. Skylark2-pro oferuje wyższą dokładność w złożonym generowaniu tekstu, takim jak profesjonalne copywriting, pisanie powieści i wysokiej jakości tłumaczenia, z kontekstem do 32 tys. tokenów.",
"Skylark2-pro-4k.description": "Model drugiej generacji Skylark. Skylark2-pro oferuje wyższą dokładność w złożonym generowaniu tekstu, takim jak profesjonalne copywriting, pisanie powieści i wysokiej jakości tłumaczenia, z kontekstem do 4 tys. tokenów.",
"Skylark2-pro-character-4k.description": "Model drugiej generacji Skylark. Skylark2-pro-character doskonale sprawdza się w odgrywaniu ról i rozmowach, dopasowując odpowiedzi do unikalnych stylów osobowości i naturalnego dialogu — idealny dla chatbotów, wirtualnych asystentów i obsługi klienta, z szybkimi odpowiedziami.",
"Skylark2-pro-turbo-8k.description": "Model drugiej generacji Skylark. Skylark2-pro-turbo-8k oferuje szybsze wnioskowanie przy niższych kosztach, z kontekstem do 8 tys. tokenów.",
"THUDM/GLM-4-32B-0414.description": "GLM-4-32B-0414 to nowej generacji otwarty model GLM z 32 miliardami parametrów, porównywalny pod względem wydajności z OpenAI GPT i serią DeepSeek V3/R1.",
"THUDM/GLM-4-9B-0414.description": "GLM-4-9B-0414 to model GLM z 9 miliardami parametrów, który dziedziczy techniki GLM-4-32B, oferując jednocześnie lżejsze wdrożenie. Sprawdza się w generowaniu kodu, projektowaniu stron internetowych, tworzeniu grafiki SVG i pisaniu opartym na wyszukiwaniu.",
"THUDM/GLM-4.1V-9B-Thinking.description": "GLM-4.1V-9B-Thinking to otwartoźródłowy model VLM od Zhipu AI i laboratorium KEG Uniwersytetu Tsinghua, zaprojektowany do złożonego poznania multimodalnego. Bazując na GLM-4-9B-0414, dodaje rozumowanie łańcuchowe i uczenie przez wzmocnienie (RL), znacząco poprawiając rozumowanie między modalnościami i stabilność.",
"THUDM/GLM-Z1-32B-0414.description": "GLM-Z1-32B-0414 to model głębokiego rozumowania oparty na GLM-4-32B-0414, wzbogacony o dane cold-start i rozszerzone RL, dodatkowo trenowany na matematyce, kodzie i logice. Znacząco poprawia zdolności matematyczne i rozwiązywanie złożonych zadań w porównaniu z modelem bazowym.",
"THUDM/GLM-Z1-9B-0414.description": "GLM-Z1-9B-0414 to kompaktowy model GLM z 9 miliardami parametrów, który zachowuje zalety otwartego źródła, oferując jednocześnie imponujące możliwości. Wyróżnia się w rozumowaniu matematycznym i zadaniach ogólnych, przewodząc w swojej klasie rozmiarowej wśród modeli otwartych.",
"THUDM/GLM-Z1-Rumination-32B-0414.description": "GLM-Z1-Rumination-32B-0414 to model głębokiego rozumowania z funkcją refleksji (porównywany z OpenAI Deep Research). W przeciwieństwie do typowych modeli głębokiego myślenia, poświęca więcej czasu na rozważania, aby rozwiązywać bardziej otwarte i złożone problemy.",
"THUDM/glm-4-9b-chat.description": "GLM-4-9B-Chat to otwartoźródłowy model GLM-4 od Zhipu AI. Wyróżnia się w semantyce, matematyce, rozumowaniu, kodzie i wiedzy. Poza wieloetapową rozmową obsługuje przeglądanie stron internetowych, wykonywanie kodu, wywoływanie niestandardowych narzędzi i rozumowanie długich tekstów. Obsługuje 26 języków (w tym chiński, angielski, japoński, koreański, niemiecki). Osiąga dobre wyniki w AlignBench-v2, MT-Bench, MMLU i C-Eval oraz obsługuje kontekst do 128 tys. tokenów do zastosowań akademickich i biznesowych.",
"Tongyi-Zhiwen/QwenLong-L1-32B.description": "QwenLong-L1-32B to pierwszy model rozumowania z długim kontekstem (LRM) trenowany z użyciem RL, zoptymalizowany pod kątem rozumowania długich tekstów. Jego progresywne RL rozszerzające kontekst umożliwia stabilne przejście od krótkiego do długiego kontekstu. Przewyższa OpenAI-o3-mini i Qwen3-235B-A22B w siedmiu benchmarkach QA dokumentów z długim kontekstem, dorównując Claude-3.7-Sonnet-Thinking. Szczególnie dobrze radzi sobie z matematyką, logiką i rozumowaniem wieloetapowym.",
"Yi-34B-Chat.description": "Yi-1.5-34B zachowuje silne ogólne zdolności językowe serii, a dzięki inkrementalnemu treningowi na 500 miliardach wysokiej jakości tokenów znacząco poprawia logikę matematyczną i kodowanie.",
"abab5.5-chat.description": "Zaprojektowany do scenariuszy zwiększających produktywność, obsługuje złożone zadania i efektywne generowanie tekstu do zastosowań profesjonalnych.",
"abab5.5s-chat.description": "Zaprojektowany do rozmów z chińską osobowością, zapewnia wysokiej jakości dialogi w języku chińskim do różnych zastosowań.",
"abab6.5g-chat.description": "Zaprojektowany do wielojęzycznych rozmów z osobowością, wspiera generowanie wysokiej jakości dialogów w języku angielskim i innych językach.",
"abab6.5s-chat.description": "Odpowiedni do szerokiego zakresu zadań NLP, w tym generowania tekstu i systemów dialogowych.",
"abab6.5t-chat.description": "Zoptymalizowany do rozmów z chińską osobowością, zapewnia płynny dialog zgodny z chińskimi zwyczajami językowymi.",
"accounts/fireworks/models/deepseek-r1.description": "DeepSeek-R1 to nowoczesny model językowy zoptymalizowany za pomocą uczenia przez wzmocnienie i danych cold-start, oferujący doskonałe rozumowanie, matematykę i wydajność kodowania.",
"accounts/fireworks/models/deepseek-v3.description": "Potężny model językowy typu Mixture-of-Experts (MoE) od DeepSeek z 671 miliardami parametrów ogółem i 37 miliardami aktywnymi na token.",
"accounts/fireworks/models/llama-v3-70b-instruct.description": "Meta opracowała i udostępniła serię modeli językowych Meta Llama 3, obejmującą modele do generowania tekstu w wersjach wstępnie wytrenowanych i dostrojonych do instrukcji o rozmiarach 8B i 70B. Modele Llama 3 dostrojone do instrukcji są zoptymalizowane pod kątem zastosowań konwersacyjnych i przewyższają wiele istniejących otwartych modeli czatu w powszechnie stosowanych branżowych testach porównawczych.",
"accounts/fireworks/models/llama-v3-8b-instruct-hf.description": "Modele Llama 3 dostrojone do instrukcji są zoptymalizowane pod kątem zastosowań konwersacyjnych i przewyższają wiele istniejących otwartych modeli czatu w powszechnie stosowanych branżowych testach porównawczych. Llama 3 8B Instruct (wersja HF) to oryginalna wersja FP16 modelu Llama 3 8B Instruct, której wyniki odpowiadają oficjalnej implementacji Hugging Face.",
"accounts/fireworks/models/llama-v3-8b-instruct.description": "Meta opracowała i udostępniła serię modeli językowych Meta Llama 3, obejmującą modele do generowania tekstu w wersjach wstępnie wytrenowanych i dostrojonych do instrukcji o rozmiarach 8B i 70B. Modele Llama 3 dostrojone do instrukcji są zoptymalizowane pod kątem zastosowań konwersacyjnych i przewyższają wiele istniejących otwartych modeli czatu w powszechnie stosowanych branżowych testach porównawczych.",
"accounts/fireworks/models/llama-v3p1-405b-instruct.description": "Meta Llama 3.1 to wielojęzyczna rodzina modeli językowych z modelami do generowania tekstu w wersjach wstępnie wytrenowanych i dostrojonych do instrukcji o rozmiarach 8B, 70B i 405B. Modele dostrojone do instrukcji są zoptymalizowane pod kątem wielojęzycznego dialogu i przewyższają wiele istniejących otwartych i zamkniętych modeli czatu w powszechnie stosowanych testach branżowych. Model 405B to najbardziej zaawansowany model z rodziny Llama 3.1, wykorzystujący wnioskowanie FP8, które ściśle odpowiada implementacji referencyjnej.",
"accounts/fireworks/models/llama-v3p1-70b-instruct.description": "Meta Llama 3.1 to wielojęzyczna rodzina modeli językowych z modelami do generowania tekstu w wersjach wstępnie wytrenowanych i dostrojonych do instrukcji o rozmiarach 8B, 70B i 405B. Modele dostrojone do instrukcji są zoptymalizowane pod kątem wielojęzycznego dialogu i przewyższają wiele istniejących otwartych i zamkniętych modeli czatu w powszechnie stosowanych testach branżowych.",
"accounts/fireworks/models/llama-v3p1-8b-instruct.description": "Meta Llama 3.1 to wielojęzyczna rodzina modeli językowych z modelami do generowania tekstu w wersjach wstępnie wytrenowanych i dostrojonych do instrukcji o rozmiarach 8B, 70B i 405B. Modele dostrojone do instrukcji są zoptymalizowane pod kątem wielojęzycznego dialogu i przewyższają wiele istniejących otwartych i zamkniętych modeli czatu w powszechnie stosowanych testach branżowych.",
"accounts/fireworks/models/llama-v3p2-11b-vision-instruct.description": "Model do rozumowania wizualnego dostrojony do instrukcji od Meta, zawierający 11 miliardów parametrów, zoptymalizowany pod kątem rozpoznawania obrazów, rozumowania wizualnego, opisywania obrazów i pytań związanych z obrazami. Rozumie dane wizualne, takie jak wykresy i diagramy, i łączy wizję z językiem, generując tekstowe opisy szczegółów obrazu.",
"accounts/fireworks/models/llama-v3p2-3b-instruct.description": "Llama 3.2 3B Instruct to lekki, wielojęzyczny model od Meta, zaprojektowany z myślą o wydajnym działaniu, oferujący znaczące korzyści w zakresie opóźnień i kosztów w porównaniu do większych modeli. Typowe zastosowania obejmują przekształcanie zapytań/poleceń oraz pomoc w pisaniu.",
"accounts/fireworks/models/llama-v3p2-90b-vision-instruct.description": "Model do rozumowania wizualnego dostrojony do instrukcji od Meta, zawierający 90 miliardów parametrów, zoptymalizowany pod kątem rozpoznawania obrazów, rozumowania wizualnego, opisywania obrazów i pytań związanych z obrazami. Rozumie dane wizualne, takie jak wykresy i diagramy, i łączy wizję z językiem, generując tekstowe opisy szczegółów obrazu. Uwaga: model ten jest obecnie udostępniany eksperymentalnie jako model bezserwerowy. W przypadku zastosowań produkcyjnych należy pamiętać, że Fireworks może wycofać wdrożenie w krótkim czasie.",
"accounts/fireworks/models/llama-v3p3-70b-instruct.description": "Llama 3.3 70B Instruct to grudniowa aktualizacja modelu Llama 3.1 70B. Ulepsza korzystanie z narzędzi, obsługę tekstu wielojęzycznego, matematykę i programowanie w porównaniu do wersji z lipca 2024. Osiąga wiodącą w branży wydajność w zakresie rozumowania, matematyki i podążania za instrukcjami, oferując wydajność porównywalną z modelem 3.1 405B przy znacznie większej szybkości i niższych kosztach.",
"accounts/fireworks/models/mistral-small-24b-instruct-2501.description": "Model o 24 miliardach parametrów, oferujący najnowocześniejsze możliwości porównywalne z większymi modelami.",
"accounts/fireworks/models/mixtral-8x22b-instruct.description": "Mixtral MoE 8x22B Instruct v0.1 to wersja modelu Mixtral MoE 8x22B v0.1 dostrojona do instrukcji, z włączonym interfejsem API do uzupełniania czatu.",
"accounts/fireworks/models/mixtral-8x7b-instruct.description": "Mixtral MoE 8x7B Instruct to wersja modelu Mixtral MoE 8x7B dostrojona do instrukcji, z włączonym interfejsem API do uzupełniania czatu.",
"accounts/fireworks/models/mythomax-l2-13b.description": "Ulepszona wersja MythoMix, prawdopodobnie jego bardziej dopracowana forma, łącząca MythoLogic-L2 i Huginn za pomocą wysoce eksperymentalnej techniki łączenia typów tensorów. Dzięki swojej unikalnej naturze doskonale nadaje się do opowiadania historii i odgrywania ról.",
"accounts/fireworks/models/phi-3-vision-128k-instruct.description": "Phi-3-Vision-128K-Instruct to lekki, nowoczesny otwarty model multimodalny zbudowany na danych syntetycznych i starannie dobranych publicznych zbiorach danych z sieci, koncentrujący się na wysokiej jakości danych tekstowych i wizualnych wymagających rozumowania. Należy do rodziny Phi-3 i obsługuje multimodalność z długością kontekstu do 128K tokenów. Model przechodzi rygorystyczne ulepszenia, w tym nadzorowane dostrajanie i bezpośrednią optymalizację preferencji, aby zapewnić dokładne podążanie za instrukcjami i silne środki bezpieczeństwa.",
"accounts/fireworks/models/qwen-qwq-32b-preview.description": "Model Qwen QwQ koncentruje się na rozwoju rozumowania AI, pokazując, że otwarte modele mogą dorównywać zamkniętym modelom czołowym w zakresie rozumowania. QwQ-32B-Preview to wersja eksperymentalna, która dorównuje o1 i przewyższa GPT-4o oraz Claude 3.5 Sonnet w zakresie rozumowania i analizy w testach GPQA, AIME, MATH-500 i LiveCodeBench. Uwaga: model ten jest obecnie udostępniany eksperymentalnie jako model bezserwerowy. W przypadku zastosowań produkcyjnych należy pamiętać, że Fireworks może wycofać wdrożenie w krótkim czasie.",
"accounts/fireworks/models/qwen2-vl-72b-instruct.description": "Model Qwen-VL 72B to najnowsza wersja modelu od Alibaba, odzwierciedlająca niemal rok innowacji.",
"accounts/fireworks/models/qwen2p5-72b-instruct.description": "Qwen2.5 to seria modeli językowych typu decoder-only opracowana przez zespół Qwen i Alibaba Cloud, dostępna w rozmiarach 0.5B, 1.5B, 3B, 7B, 14B, 32B i 72B, zarówno w wersjach bazowych, jak i dostrojonych do instrukcji.",
"accounts/fireworks/models/qwen2p5-coder-32b-instruct.description": "Qwen2.5-Coder to najnowszy model językowy Qwen zaprojektowany do programowania (wcześniej CodeQwen). Uwaga: model ten jest obecnie udostępniany eksperymentalnie jako model bezserwerowy. W przypadku zastosowań produkcyjnych należy pamiętać, że Fireworks może wycofać wdrożenie w krótkim czasie.",
"accounts/yi-01-ai/models/yi-large.description": "Yi-Large to najwyższej klasy model językowy, który plasuje się tuż za GPT-4, Gemini 1.5 Pro i Claude 3 Opus w rankingu LMSYS. Wyróżnia się zdolnościami wielojęzycznymi, szczególnie w językach hiszpańskim, chińskim, japońskim, niemieckim i francuskim. Yi-Large jest również przyjazny dla programistów, korzystając z tego samego schematu API co OpenAI, co ułatwia integrację.",
"ai21-jamba-1.5-large.description": "Wielojęzyczny model z 398 miliardami parametrów (94 miliardy aktywnych), oferujący okno kontekstowe 256K, wywoływanie funkcji, uporządkowane dane wyjściowe i generowanie oparte na faktach.",
"ai21-jamba-1.5-mini.description": "Wielojęzyczny model z 52 miliardami parametrów (12 miliardów aktywnych), oferujący okno kontekstowe 256K, wywoływanie funkcji, uporządkowane dane wyjściowe i generowanie oparte na faktach.",
"ai21-labs/AI21-Jamba-1.5-Large.description": "Wielojęzyczny model z 398 miliardami parametrów (94 miliardy aktywnych), oferujący okno kontekstowe 256K, wywoływanie funkcji, uporządkowane dane wyjściowe i generowanie oparte na faktach.",
"ai21-labs/AI21-Jamba-1.5-Mini.description": "Wielojęzyczny model z 52 miliardami parametrów (12 miliardów aktywnych), oferujący okno kontekstowe 256K, wywoływanie funkcji, uporządkowane dane wyjściowe i generowanie oparte na faktach.",
"alibaba/qwen-3-14b.description": "Qwen3 to najnowsza generacja w serii Qwen, oferująca kompleksowy zestaw modeli gęstych i MoE. Dzięki zaawansowanemu treningowi model osiąga przełomowe wyniki w rozumowaniu, podążaniu za instrukcjami, zdolnościach agentowych i obsłudze wielu języków.",
"alibaba/qwen-3-235b.description": "Qwen3 to najnowsza generacja w serii Qwen, oferująca kompleksowy zestaw modeli gęstych i MoE. Dzięki zaawansowanemu treningowi model osiąga przełomowe wyniki w rozumowaniu, podążaniu za instrukcjami, zdolnościach agentowych i obsłudze wielu języków.",
"alibaba/qwen-3-30b.description": "Qwen3 to najnowsza generacja w serii Qwen, oferująca kompleksowy zestaw modeli gęstych i MoE. Dzięki zaawansowanemu treningowi model osiąga przełomowe wyniki w rozumowaniu, podążaniu za instrukcjami, zdolnościach agentowych i obsłudze wielu języków.",
"alibaba/qwen-3-32b.description": "Qwen3 to najnowsza generacja w serii Qwen, oferująca kompleksowy zestaw modeli gęstych i MoE. Dzięki zaawansowanemu treningowi model osiąga przełomowe wyniki w rozumowaniu, podążaniu za instrukcjami, zdolnościach agentowych i obsłudze wielu języków.",
"alibaba/qwen3-coder.description": "Qwen3-Coder-480B-A35B-Instruct to najbardziej zaawansowany model kodujący Qwen, osiągający wysokie wyniki w kodowaniu agentowym, korzystaniu z przeglądarki i innych kluczowych zadaniach programistycznych, dorównując poziomowi Claude Sonnet.",
"amazon/nova-lite.description": "Bardzo tani model multimodalny o wyjątkowo szybkim przetwarzaniu obrazów, wideo i tekstu.",
"amazon/nova-micro.description": "Model tekstowy oferujący ultra-niskie opóźnienia przy bardzo niskim koszcie.",
"amazon/nova-pro.description": "Wysoce wydajny model multimodalny zapewniający najlepszy balans między dokładnością, szybkością i kosztem w szerokim zakresie zadań.",
"amazon/titan-embed-text-v2.description": "Amazon Titan Text Embeddings V2 to lekki, wydajny model osadzania tekstu obsługujący wiele języków i oferujący wymiary 1024, 512 i 256.",
"anthropic.claude-3-5-sonnet-20240620-v1:0.description": "Claude 3.5 Sonnet ustanawia nowy standard branżowy, przewyższając konkurencję i Claude 3 Opus w szerokich testach, zachowując przy tym średni poziom kosztów i szybkości.",
"anthropic.claude-3-5-sonnet-20241022-v2:0.description": "Claude 3.5 Sonnet ustanawia nowy standard branżowy, przewyższając konkurencję i Claude 3 Opus w szerokich testach, zachowując przy tym średni poziom kosztów i szybkości.",
"anthropic.claude-3-haiku-20240307-v1:0.description": "Claude 3 Haiku to najszybszy i najbardziej kompaktowy model Anthropic, zapewniający niemal natychmiastowe odpowiedzi na proste zapytania. Umożliwia płynne, naturalne interakcje z AI i obsługuje wejście obrazowe z oknem kontekstowym 200K.",
"anthropic.claude-3-opus-20240229-v1:0.description": "Claude 3 Opus to najpotężniejszy model AI od Anthropic, oferujący najwyższy poziom wydajności w złożonych zadaniach. Radzi sobie z otwartymi zapytaniami i nowymi scenariuszami z wyjątkową płynnością i zrozumieniem na poziomie ludzkim, obsługując wejście obrazowe z oknem kontekstowym 200K.",
"anthropic.claude-3-sonnet-20240229-v1:0.description": "Claude 3 Sonnet łączy inteligencję i szybkość dla zastosowań korporacyjnych, oferując wysoką wartość przy niższych kosztach. Zaprojektowany jako niezawodny model do wdrożeń na dużą skalę, obsługuje wejście obrazowe z oknem kontekstowym 200K.",
"anthropic.claude-instant-v1.description": "Szybki, ekonomiczny, a jednocześnie wydajny model do codziennych rozmów, analizy tekstu, podsumowań i pytań do dokumentów.",
"anthropic.claude-v2.description": "Wysoce wydajny model do zadań od złożonego dialogu i kreatywnego generowania po szczegółowe podążanie za instrukcjami.",
"anthropic.claude-v2:1.description": "Zaktualizowany Claude 2 z podwojonym oknem kontekstowym i poprawioną niezawodnością, mniejszą halucynacją i większą dokładnością opartą na dowodach dla długich dokumentów i RAG.",
"anthropic/claude-3-haiku.description": "Claude 3 Haiku to najszybszy model Anthropic, zaprojektowany do zastosowań korporacyjnych z dłuższymi zapytaniami. Szybko analizuje duże dokumenty, takie jak raporty kwartalne, umowy czy sprawy prawne, przy połowie kosztów konkurencji.",
"anthropic/claude-3-opus.description": "Claude 3 Opus to najbardziej inteligentny model Anthropic z wiodącą wydajnością w złożonych zadaniach, radzący sobie z otwartymi zapytaniami i nowymi scenariuszami z wyjątkową płynnością i zrozumieniem na poziomie ludzkim.",
"anthropic/claude-3.5-haiku.description": "Claude 3.5 Haiku oferuje zwiększoną szybkość, dokładność kodowania i obsługę narzędzi, odpowiedni do scenariuszy wymagających szybkiej interakcji i integracji z narzędziami.",
"anthropic/claude-3.5-sonnet.description": "Claude 3.5 Sonnet to szybki, wydajny model z rodziny Sonnet, oferujący lepsze kodowanie i rozumowanie, z niektórymi wersjami stopniowo zastępowanymi przez Sonnet 3.7 i nowsze.",
"anthropic/claude-3.7-sonnet.description": "Claude 3.7 Sonnet to ulepszony model Sonnet z silniejszym rozumowaniem i kodowaniem, odpowiedni do złożonych zadań na poziomie korporacyjnym.",
"anthropic/claude-haiku-4.5.description": "Claude Haiku 4.5 to szybki model o wysokiej wydajności od Anthropic, oferujący bardzo niskie opóźnienia przy zachowaniu wysokiej dokładności.",
"anthropic/claude-opus-4.1.description": "Opus 4.1 to zaawansowany model Anthropic zoptymalizowany pod kątem programowania, złożonego rozumowania i długotrwałych zadań.",
"anthropic/claude-opus-4.5.description": "Claude Opus 4.5 to flagowy model Anthropic, łączący najwyższą inteligencję z możliwością skalowania dla złożonych zadań wymagających wysokiej jakości rozumowania.",
"anthropic/claude-opus-4.description": "Opus 4 to flagowy model Anthropic zaprojektowany do złożonych zadań i zastosowań korporacyjnych.",
"anthropic/claude-sonnet-4.5.description": "Claude Sonnet 4.5 to najnowszy hybrydowy model rozumowania od Anthropic, zoptymalizowany pod kątem złożonego rozumowania i kodowania.",
"anthropic/claude-sonnet-4.description": "Claude Sonnet 4 to hybrydowy model rozumowania Anthropic z mieszanym trybem myślenia i działania bez myślenia.",
"meta.llama3-8b-instruct-v1:0.description": "Meta Llama 3 to otwarty model językowy (LLM) stworzony z myślą o programistach, naukowcach i przedsiębiorstwach, zaprojektowany, by wspierać ich w budowaniu, eksperymentowaniu i odpowiedzialnym skalowaniu pomysłów z zakresu generatywnej sztucznej inteligencji. Jako fundament globalnej innowacji społecznościowej, doskonale sprawdza się przy ograniczonych zasobach obliczeniowych, na urządzeniach brzegowych oraz przy szybszym czasie trenowania.",
"meta/Llama-3.2-11B-Vision-Instruct.description": "Zaawansowane rozumowanie obrazów w wysokiej rozdzielczości, idealne do aplikacji zrozumienia wizualnego.",
"meta/Llama-3.2-90B-Vision-Instruct.description": "Zaawansowane rozumowanie obrazów dla aplikacji agentów opartych na zrozumieniu wizualnym.",
"meta/Llama-3.3-70B-Instruct.description": "Llama 3.3 to najbardziej zaawansowany wielojęzyczny otwartoźródłowy model Llama, oferujący wydajność zbliżoną do modeli 405B przy bardzo niskim koszcie. Opiera się na architekturze Transformer i został udoskonalony za pomocą SFT i RLHF, by zwiększyć jego użyteczność i bezpieczeństwo. Wersja dostrojona do instrukcji została zoptymalizowana pod kątem wielojęzycznych rozmów i przewyższa wiele otwartych i zamkniętych modeli konwersacyjnych w branżowych testach. Data odcięcia wiedzy: grudzień 2023.",
"meta/Meta-Llama-3-70B-Instruct.description": "Potężny model z 70 miliardami parametrów, doskonały w rozumowaniu, programowaniu i szerokim zakresie zadań językowych.",
"meta/Meta-Llama-3-8B-Instruct.description": "Wszechstronny model z 8 miliardami parametrów, zoptymalizowany do rozmów i generowania tekstu.",
"meta/Meta-Llama-3.1-405B-Instruct.description": "Model tekstowy Llama 3.1 dostrojony do instrukcji, zoptymalizowany pod kątem wielojęzycznych rozmów, osiągający wysokie wyniki w branżowych testach porównawczych wśród modeli otwartych i zamkniętych.",
"meta/Meta-Llama-3.1-70B-Instruct.description": "Model tekstowy Llama 3.1 dostrojony do instrukcji, zoptymalizowany pod kątem wielojęzycznych rozmów, osiągający wysokie wyniki w branżowych testach porównawczych wśród modeli otwartych i zamkniętych.",
"meta/Meta-Llama-3.1-8B-Instruct.description": "Model tekstowy Llama 3.1 dostrojony do instrukcji, zoptymalizowany pod kątem wielojęzycznych rozmów, osiągający wysokie wyniki w branżowych testach porównawczych wśród modeli otwartych i zamkniętych.",
"meta/llama-3-70b.description": "Otwarty model z 70 miliardami parametrów, dostrojony przez Meta do podążania za instrukcjami, udostępniany przez Groq na sprzęcie LPU dla szybkiego i wydajnego wnioskowania.",
"meta/llama-3-8b.description": "Otwarty model z 8 miliardami parametrów, dostrojony przez Meta do podążania za instrukcjami, udostępniany przez Groq na sprzęcie LPU dla szybkiego i wydajnego wnioskowania.",
"meta/llama-3.1-405b-instruct.description": "Zaawansowany model LLM wspierający generowanie danych syntetycznych, destylację wiedzy i rozumowanie w chatbotach, programowaniu i zadaniach dziedzinowych.",
"meta/llama-3.1-70b-instruct.description": "Zaprojektowany do złożonych dialogów z doskonałym rozumieniem kontekstu, rozumowaniem i generowaniem tekstu.",
"meta/llama-3.1-70b.description": "Zaktualizowany model Meta Llama 3 70B Instruct z kontekstem 128K, wsparciem wielojęzycznym i ulepszonym rozumowaniem.",
"meta/llama-3.1-8b-instruct.description": "Nowoczesny model z silnym rozumieniem języka, rozumowaniem i generowaniem tekstu.",
"meta/llama-3.1-8b.description": "Llama 3.1 8B obsługuje okno kontekstu 128K, idealne do rozmów w czasie rzeczywistym i analizy danych, oferując znaczne oszczędności kosztów w porównaniu do większych modeli. Udostępniany przez Groq na sprzęcie LPU dla szybkiego i wydajnego wnioskowania.",
"meta/llama-3.2-11b-vision-instruct.description": "Nowatorski model językowo-wizualny, który wyróżnia się wysokiej jakości rozumowaniem na podstawie obrazów.",
"meta/llama-3.2-11b.description": "Model dostrojony do instrukcji w zakresie rozumowania obrazów (wejście: tekst + obraz, wyjście: tekst), zoptymalizowany do rozpoznawania wizualnego, rozumowania obrazów, opisywania i ogólnego QA obrazów.",
"meta/llama-3.2-1b-instruct.description": "Nowoczesny mały model językowy z silnym rozumieniem, rozumowaniem i generowaniem tekstu.",
"meta/llama-3.2-1b.description": "Model tylko tekstowy do zastosowań na urządzeniach, takich jak lokalne wyszukiwanie wielojęzyczne, streszczanie i przepisywanie.",
"meta/llama-3.2-3b-instruct.description": "Nowoczesny mały model językowy z silnym rozumieniem, rozumowaniem i generowaniem tekstu.",
"meta/llama-3.2-3b.description": "Model tylko tekstowy dostrojony do zastosowań na urządzeniach, takich jak lokalne wyszukiwanie wielojęzyczne, streszczanie i przepisywanie.",
"meta/llama-3.2-90b-vision-instruct.description": "Nowatorski model językowo-wizualny, który wyróżnia się wysokiej jakości rozumowaniem na podstawie obrazów.",
"meta/llama-3.2-90b.description": "Model dostrojony do instrukcji w zakresie rozumowania obrazów (wejście: tekst + obraz, wyjście: tekst), zoptymalizowany do rozpoznawania wizualnego, rozumowania obrazów, opisywania i ogólnego QA obrazów.",
"meta/llama-3.3-70b-instruct.description": "Zaawansowany model LLM, silny w rozumowaniu, matematyce, zdrowym rozsądku i wywoływaniu funkcji.",
"meta/llama-3.3-70b.description": "Idealne połączenie wydajności i efektywności. Zbudowany z myślą o wysokowydajnej konwersacyjnej AI w tworzeniu treści, aplikacjach biznesowych i badaniach, z silnym rozumieniem języka do streszczania, klasyfikacji, analizy sentymentu i generowania kodu.",
"meta/llama-4-maverick.description": "Rodzina Llama 4 to natywne modele multimodalne wspierające tekst i doświadczenia multimodalne, wykorzystujące MoE do wiodącego rozumienia tekstu i obrazu. Llama 4 Maverick to model 17B z 128 ekspertami, udostępniany przez DeepInfra.",
"meta/llama-4-scout.description": "Rodzina Llama 4 to natywne modele multimodalne wspierające tekst i doświadczenia multimodalne, wykorzystujące MoE do wiodącego rozumienia tekstu i obrazu. Llama 4 Scout to model 17B z 16 ekspertami, udostępniany przez DeepInfra.",
"mistralai/Mistral-7B-v0.1.description": "Mistral 7B to kompaktowy, ale wydajny model, doskonały do przetwarzania wsadowego i prostych zadań, takich jak klasyfikacja i generowanie tekstu, z solidnym rozumowaniem.",
"mistralai/Mixtral-8x22B-Instruct-v0.1.description": "Mixtral-8x22B Instruct (141B) to bardzo duży model językowy przeznaczony do obsługi wymagających obciążeń.",
"mistralai/Mixtral-8x7B-Instruct-v0.1.description": "Mixtral-8x7B Instruct (46,7B) oferuje wysoką wydajność w przetwarzaniu danych na dużą skalę.",
"mistralai/Mixtral-8x7B-v0.1.description": "Mixtral 8x7B to rzadki model MoE, który przyspiesza wnioskowanie i nadaje się do zadań wielojęzycznych oraz generowania kodu.",
"mistralai/mistral-nemo.description": "Mistral Nemo to model 7,3B z obsługą wielu języków i silną wydajnością w programowaniu.",
"mixtral-8x7b-32768.description": "Mixtral 8x7B zapewnia odporną na błędy równoległą moc obliczeniową do złożonych zadań.",
"mixtral.description": "Mixtral to model MoE od Mistral AI z otwartymi wagami, wspierający generowanie kodu i rozumienie języka.",
"mixtral:8x22b.description": "Mixtral to model MoE od Mistral AI z otwartymi wagami, wspierający generowanie kodu i rozumienie języka.",
"moonshot-v1-128k-vision-preview.description": "Modele wizji Kimi (w tym moonshot-v1-8k-vision-preview/moonshot-v1-32k-vision-preview/moonshot-v1-128k-vision-preview) potrafią rozumieć zawartość obrazów, taką jak tekst, kolory i kształty obiektów.",
"moonshot-v1-128k.description": "Moonshot V1 128K oferuje bardzo długi kontekst do generowania długich tekstów, obsługując do 128 000 tokenów w scenariuszach badawczych, akademickich i dokumentacyjnych.",
"moonshot-v1-32k-vision-preview.description": "Modele wizji Kimi (w tym moonshot-v1-8k-vision-preview/moonshot-v1-32k-vision-preview/moonshot-v1-128k-vision-preview) potrafią rozumieć zawartość obrazów, taką jak tekst, kolory i kształty obiektów.",
"moonshot-v1-32k.description": "Moonshot V1 32K obsługuje 32 768 tokenów dla średniej długości kontekstu, idealny do długich dokumentów i złożonych dialogów w tworzeniu treści, raportach i systemach czatu.",
"moonshot-v1-8k-vision-preview.description": "Modele wizji Kimi (w tym moonshot-v1-8k-vision-preview/moonshot-v1-32k-vision-preview/moonshot-v1-128k-vision-preview) potrafią rozumieć zawartość obrazów, taką jak tekst, kolory i kształty obiektów.",
"moonshot-v1-8k.description": "Moonshot V1 8K jest zoptymalizowany do generowania krótkich tekstów z wydajną pracą, obsługując 8192 tokeny do krótkich rozmów, notatek i szybkich treści.",
"moonshot-v1-auto.description": "Moonshot V1 Auto automatycznie wybiera odpowiedni model na podstawie bieżącego użycia tokenów kontekstu.",
"moonshotai/Kimi-Dev-72B.description": "Kimi-Dev-72B to otwartoźródłowy model kodu LLM zoptymalizowany za pomocą RL na dużą skalę, generujący solidne, gotowe do produkcji poprawki. Osiąga wynik 60,4% w SWE-bench Verified, ustanawiając nowy rekord wśród otwartych modeli dla zadań inżynierii oprogramowania, takich jak naprawa błędów i przegląd kodu.",
"moonshotai/Kimi-K2-Instruct-0905.description": "Kimi K2-Instruct-0905 to najnowszy i najpotężniejszy model Kimi K2. To model MoE najwyższej klasy z 1T łącznych i 32B aktywnych parametrów. Kluczowe cechy to silniejsza inteligencja agentowa w kodowaniu, znaczne postępy w testach i zadaniach agentowych, a także ulepszona estetyka i użyteczność kodu frontendowego.",
"moonshotai/Kimi-K2-Thinking.description": "Kimi K2 Thinking to najnowszy i najpotężniejszy otwartoźródłowy model myślenia. Znacznie zwiększa głębokość rozumowania wieloetapowego i utrzymuje stabilne użycie narzędzi przez 200300 kolejnych wywołań, ustanawiając nowe rekordy w Humanity's Last Exam (HLE), BrowseComp i innych testach. Doskonale sprawdza się w kodowaniu, matematyce, logice i scenariuszach agentowych. Zbudowany na architekturze MoE z ~1T parametrów, obsługuje okno kontekstu 256K i wywoływanie narzędzi.",
"moonshotai/kimi-k2-0711.description": "Kimi K2 0711 to wariant instruct z serii Kimi, odpowiedni do wysokiej jakości kodu i użycia narzędzi.",
"moonshotai/kimi-k2-0905.description": "Kimi K2 0905 to aktualizacja rozszerzająca kontekst i wydajność rozumowania z optymalizacjami kodu.",
"moonshotai/kimi-k2-instruct-0905.description": "Model kimi-k2-0905-preview obsługuje okno kontekstu 256K, z silniejszym kodowaniem agentowym, bardziej dopracowanym i praktycznym kodem frontendowym oraz lepszym rozumieniem kontekstu.",
"moonshotai/kimi-k2-thinking-turbo.description": "Kimi K2 Thinking Turbo to szybka wersja Kimi K2 Thinking, znacznie zmniejszająca opóźnienia przy zachowaniu głębokiego rozumowania.",
"moonshotai/kimi-k2-thinking.description": "Kimi K2 Thinking to model rozumowania Moonshot zoptymalizowany do zadań wymagających głębokiego rozumowania, z ogólnymi możliwościami agentowymi.",
"moonshotai/kimi-k2.description": "Kimi K2 to duży model MoE od Moonshot AI z 1T łącznych parametrów i 32B aktywnych na przebieg, zoptymalizowany pod kątem możliwości agentowych, w tym zaawansowanego użycia narzędzi, rozumowania i syntezy kodu.",
"morph/morph-v3-fast.description": "Morph to wyspecjalizowany model do stosowania zmian w kodzie sugerowanych przez czołowe modele (np. Claude lub GPT-4o) w istniejących plikach z prędkością 4500+ tokenów/sek. To końcowy etap w przepływie pracy AI w kodowaniu i obsługuje 16k tokenów wejścia/wyjścia.",
"morph/morph-v3-large.description": "Morph to wyspecjalizowany model do stosowania zmian w kodzie sugerowanych przez czołowe modele (np. Claude lub GPT-4o) w istniejących plikach z prędkością 2500+ tokenów/sek. To końcowy etap w przepływie pracy AI w kodowaniu i obsługuje 16k tokenów wejścia/wyjścia.",
"nousresearch/hermes-2-pro-llama-3-8b.description": "Hermes 2 Pro Llama 3 8B to zaktualizowana wersja Nous Hermes 2 z najnowszymi wewnętrznie opracowanymi zbiorami danych.",
"nvidia/Llama-3.1-Nemotron-70B-Instruct-HF.description": "Llama 3.1 Nemotron 70B to dostosowany przez NVIDIA model LLM poprawiający pomocność. Osiąga najwyższe wyniki w Arena Hard, AlpacaEval 2 LC i GPT-4-Turbo MT-Bench, zajmując 1. miejsce we wszystkich trzech testach auto-alignment na dzień 1 października 2024. Trening oparty na Llama-3.1-70B-Instruct z użyciem RLHF (REINFORCE), Llama-3.1-Nemotron-70B-Reward i HelpSteer2-Preference prompts.",
"nvidia/llama-3.1-nemotron-51b-instruct.description": "Wyjątkowy model językowy zapewniający doskonałą dokładność i wydajność.",
"nvidia/llama-3.1-nemotron-70b-instruct.description": "Llama-3.1-Nemotron-70B-Instruct to dostosowany model NVIDIA zaprojektowany w celu poprawy pomocności odpowiedzi LLM.",
"pixtral-12b-2409.description": "Pixtral doskonale radzi sobie z analizą wykresów i obrazów, odpowiadaniem na pytania dotyczące dokumentów, rozumowaniem multimodalnym oraz wykonywaniem poleceń. Obsługuje obrazy w natywnej rozdzielczości i proporcjach oraz dowolną liczbę obrazów w kontekście do 128K.",
"pixtral-large-latest.description": "Pixtral Large to otwarty model multimodalny z 124 miliardami parametrów, oparty na Mistral Large 2 drugiej generacji naszej rodziny modeli multimodalnych, oferujący zaawansowane rozumienie obrazów.",
"pro-128k.description": "Spark Pro 128K oferuje bardzo dużą pojemność kontekstu do 128K, idealną do analizy długich dokumentów wymagających pełnej analizy tekstu i spójności logicznej, z płynnym rozumowaniem i wsparciem dla różnorodnych cytowań w złożonych dyskusjach.",
"pro-deepseek-r1.description": "Dedykowany model usługowy dla przedsiębiorstw z wbudowaną obsługą współbieżności.",
"pro-deepseek-v3.description": "Dedykowany model usługowy dla przedsiębiorstw z wbudowaną obsługą współbieżności.",
"qianfan-70b.description": "Qianfan 70B to duży chiński model do generowania wysokiej jakości treści i złożonego rozumowania.",
"qianfan-8b.description": "Qianfan 8B to średniej wielkości model ogólnego przeznaczenia, łączący niskie koszty z wysoką jakością generowania tekstu i odpowiadania na pytania.",
"qianfan-agent-intent-32k.description": "Qianfan Agent Intent 32K koncentruje się na rozpoznawaniu intencji i orkiestracji agentów z obsługą długiego kontekstu.",
"qianfan-agent-lite-8k.description": "Qianfan Agent Lite 8K to lekki model agenta do tanich dialogów wieloetapowych i przepływów pracy.",
"qianfan-agent-speed-32k.description": "Qianfan Agent Speed 32K to model agenta o wysokiej przepustowości, przeznaczony do aplikacji wielozadaniowych na dużą skalę.",
"qianfan-agent-speed-8k.description": "Qianfan Agent Speed 8K to model agenta o wysokiej współbieżności, przeznaczony do krótkich i średnich rozmów z szybką odpowiedzią.",
"qianfan-check-vl.description": "Qianfan Check VL to multimodalny model do przeglądu treści, oceniający zgodność obrazów i tekstów oraz wykonujący zadania rozpoznawania.",
"qianfan-composition.description": "Qianfan Composition to multimodalny model twórczy do zrozumienia i generowania treści łączących obrazy i tekst.",
"qianfan-engcard-vl.description": "Qianfan EngCard VL to multimodalny model rozpoznawania skoncentrowany na scenariuszach w języku angielskim.",
"qianfan-lightning-128b-a19b.description": "Qianfan Lightning 128B A19B to wysokowydajny chiński model ogólnego przeznaczenia do złożonego odpowiadania na pytania i rozumowania na dużą skalę.",
"qianfan-llama-vl-8b.description": "Qianfan Llama VL 8B to multimodalny model oparty na Llama, przeznaczony do ogólnego zrozumienia obrazów i tekstu.",
"qianfan-multipicocr.description": "Qianfan MultiPicOCR to model OCR do wielu obrazów, wykrywający i rozpoznający tekst na różnych obrazach.",
"qianfan-qi-vl.description": "Qianfan QI VL to multimodalny model QA do precyzyjnego wyszukiwania i odpowiadania na pytania w złożonych scenariuszach obraz-tekst.",
"qianfan-singlepicocr.description": "Qianfan SinglePicOCR to model OCR do pojedynczych obrazów z wysoką dokładnością rozpoznawania znaków.",
"qianfan-vl-70b.description": "Qianfan VL 70B to duży model językowo-wizualny do złożonego zrozumienia obrazów i tekstu.",
"qianfan-vl-8b.description": "Qianfan VL 8B to lekki model językowo-wizualny do codziennego QA obraz-tekst i analizy.",
"qvq-72b-preview.description": "QVQ-72B-Preview to eksperymentalny model badawczy od Qwen, skoncentrowany na ulepszonym rozumowaniu wizualnym.",
"qvq-max.description": "Model rozumowania wizualnego Qwen QVQ obsługuje wejścia wizualne i wyjścia w formie łańcucha myśli, oferując lepsze wyniki w matematyce, kodowaniu, analizie wizualnej, twórczości i zadaniach ogólnych.",
"qvq-plus.description": "Model rozumowania wizualnego z wejściem wizualnym i wyjściem w formie łańcucha myśli. Seria qvq-plus kontynuuje qvq-max, oferując szybsze rozumowanie przy lepszym stosunku jakości do kosztu.",
"qwen-3-32b.description": "Qwen 3 32B: silny w zadaniach wielojęzycznych i programistycznych, odpowiedni do średnioskalowej produkcji.",
"qwen-coder-plus.description": "Model kodowania Qwen.",
"qwen-coder-turbo-latest.description": "Model kodowania Qwen.",
"qwen-coder-turbo.description": "Model kodowania Qwen.",
"qwen-flash.description": "Najszybszy i najtańszy model Qwen, idealny do prostych zadań.",
"qwen-image-edit.description": "Qwen Image Edit to model obraz-do-obrazu, który edytuje obrazy na podstawie wejściowych obrazów i tekstowych poleceń, umożliwiając precyzyjne korekty i twórcze przekształcenia.",
"qwen-image.description": "Qwen-Image to ogólny model generowania obrazów, obsługujący wiele stylów artystycznych i zaawansowane renderowanie złożonego tekstu, szczególnie w języku chińskim i angielskim. Obsługuje układy wieloliniowe, tekst na poziomie akapitu i drobne szczegóły w złożonych układach tekst-obraz.",
"qwen-long.description": "Ultraduży model Qwen z długim kontekstem i możliwością prowadzenia rozmów obejmujących wiele dokumentów.",
"qwen-math-plus-latest.description": "Qwen Math to model językowy wyspecjalizowany w rozwiązywaniu problemów matematycznych.",
"qwen-math-plus.description": "Qwen Math to model językowy wyspecjalizowany w rozwiązywaniu problemów matematycznych.",
"qwen-math-turbo-latest.description": "Qwen Math to model językowy wyspecjalizowany w rozwiązywaniu problemów matematycznych.",
"qwen-math-turbo.description": "Qwen Math to model językowy wyspecjalizowany w rozwiązywaniu problemów matematycznych.",
"qwen-max.description": "Model Qwen w skali setek miliardów parametrów, obsługujący język chiński, angielski i inne; model API wykorzystywany w produktach Qwen2.5.",
"qwen-omni-turbo.description": "Modele Qwen-Omni obsługują wejścia multimodalne (wideo, audio, obrazy, tekst) i generują wyjścia w formie dźwięku i tekstu.",
"qwen-plus.description": "Ulepszony ultraduży model Qwen obsługujący język chiński, angielski i inne języki.",
"qwen-turbo.description": "Qwen Turbo nie będzie już aktualizowany; zalecana jest migracja do Qwen Flash. Ultraduży model Qwen obsługujący język chiński, angielski i inne języki.",
"qwen-vl-chat-v1.description": "Qwen VL obsługuje elastyczne interakcje, w tym wejścia z wielu obrazów, wieloetapowe QA i zadania twórcze.",
"qwen-vl-max-latest.description": "Ultraduży model językowo-wizualny Qwen. W porównaniu do wersji ulepszonej oferuje lepsze rozumowanie wizualne i wykonywanie poleceń, zapewniając silniejsze postrzeganie i poznanie.",
"qwen-vl-max.description": "Ultraduży model językowo-wizualny Qwen. W porównaniu do wersji ulepszonej oferuje lepsze rozumowanie wizualne i wykonywanie poleceń, zapewniając silniejsze postrzeganie wizualne i poznanie.",
"qwen-vl-ocr.description": "Qwen OCR to model ekstrakcji tekstu z dokumentów, tabel, obrazów egzaminacyjnych i rękopisów. Obsługuje język chiński, angielski, francuski, japoński, koreański, niemiecki, rosyjski, włoski, wietnamski i arabski.",
"qwen-vl-plus-latest.description": "Ulepszony model językowo-wizualny Qwen na dużą skalę z dużym postępem w rozpoznawaniu szczegółów i tekstu, obsługujący rozdzielczość powyżej jednego megapiksela i dowolne proporcje obrazu.",
"qwen-vl-plus.description": "Ulepszony model językowo-wizualny Qwen na dużą skalę z dużym postępem w rozpoznawaniu szczegółów i tekstu, obsługujący rozdzielczość powyżej jednego megapiksela i dowolne proporcje obrazu.",
"qwen-vl-v1.description": "Model wstępnie wytrenowany na bazie Qwen-7B z dodanym modułem wizualnym i wejściem obrazu o rozdzielczości 448.",
"qwen/qwen-2-7b-instruct.description": "Qwen2 to nowa seria dużych modeli językowych Qwen. Qwen2 7B to model oparty na transformatorze, który wyróżnia się w rozumieniu języka, wielojęzyczności, programowaniu, matematyce i rozumowaniu.",
"qwen/qwen-2-7b-instruct:free.description": "Qwen2 to nowa rodzina dużych modeli językowych o lepszym rozumieniu i generowaniu treści.",
"qwen2.5-7b-instruct.description": "Qwen2.5 7B Instruct to dojrzały, otwartoźródłowy model instrukcyjny do rozmów i generowania treści w różnych scenariuszach.",
"qwen2.5-coder-1.5b-instruct.description": "Otwartoźródłowy model kodujący Qwen.",
"qwen2.5-coder-14b-instruct.description": "Otwartoźródłowy model kodujący Qwen.",
"qwen2.5-coder-32b-instruct.description": "Otwartoźródłowy model kodujący Qwen.",
"qwen2.5-coder-7b-instruct.description": "Otwartoźródłowy model kodujący Qwen.",
"qwen2.5-coder-instruct.description": "Qwen2.5-Coder to najnowszy model LLM z rodziny Qwen skoncentrowany na kodzie (wcześniej CodeQwen).",
"qwen2.5-instruct.description": "Qwen2.5 to najnowsza seria modeli językowych Qwen, obejmująca modele bazowe i dostrojone instrukcyjnie od 0.5B do 72B parametrów.",
"qwen2.5-math-1.5b-instruct.description": "Qwen-Math zapewnia wysoką skuteczność w rozwiązywaniu zadań matematycznych.",
"qwen2.5-math-72b-instruct.description": "Qwen-Math zapewnia wysoką skuteczność w rozwiązywaniu zadań matematycznych.",
"qwen2.5-math-7b-instruct.description": "Qwen-Math zapewnia wysoką skuteczność w rozwiązywaniu zadań matematycznych.",
"qwen2.5-omni-7b.description": "Modele Qwen-Omni obsługują wejścia multimodalne (wideo, audio, obrazy, tekst) i generują wyjścia w formie dźwięku lub tekstu.",
"qwen2.5-vl-32b-instruct.description": "Qwen2.5 VL 32B Instruct to otwartoźródłowy model multimodalny odpowiedni do prywatnego wdrożenia i zastosowań w różnych scenariuszach.",
"qwen2.5-vl-72b-instruct.description": "Ulepszone podążanie za instrukcjami, matematyka, rozwiązywanie problemów i kodowanie, z lepszym rozpoznawaniem obiektów. Obsługuje precyzyjną lokalizację elementów wizualnych w różnych formatach, rozumienie długich filmów (do 10 minut) z dokładnością do sekundy, porządkowanie czasowe i rozumienie prędkości, a także agentów sterujących systemem operacyjnym lub urządzeniami mobilnymi poprzez analizę i lokalizację. Silne wydobywanie kluczowych informacji i generowanie danych w formacie JSON. To wersja 72B najmocniejsza w serii.",
"qwen2.5-vl-7b-instruct.description": "Qwen2.5 VL 7B Instruct to lekki model multimodalny łączący niskie koszty wdrożenia z dobrą zdolnością rozpoznawania.",
"qwen2.5-vl-instruct.description": "Qwen2.5-VL to najnowszy model językowo-wizualny z rodziny Qwen.",
"qwen2.5.description": "Qwen2.5 to nowej generacji duży model językowy Alibaba o wysokiej wydajności w różnych zastosowaniach.",
"qwen2.5:0.5b.description": "Qwen2.5 to nowej generacji duży model językowy Alibaba o wysokiej wydajności w różnych zastosowaniach.",
"qwen2.5:1.5b.description": "Qwen2.5 to nowej generacji duży model językowy Alibaba o wysokiej wydajności w różnych zastosowaniach.",
"qwen2.5:72b.description": "Qwen2.5 to nowej generacji duży model językowy Alibaba o wysokiej wydajności w różnych zastosowaniach.",
"qwen2.description": "Qwen2 to nowej generacji duży model językowy Alibaba o wysokiej wydajności w różnych zastosowaniach.",
"qwen2:0.5b.description": "Qwen2 to nowej generacji duży model językowy Alibaba o wysokiej wydajności w różnych zastosowaniach.",
"qwen2:1.5b.description": "Qwen2 to nowej generacji duży model językowy Alibaba o wysokiej wydajności w różnych zastosowaniach.",
"qwen2:72b.description": "Qwen2 to nowej generacji duży model językowy Alibaba o wysokiej wydajności w różnych zastosowaniach.",
"qwen3-0.6b.description": "Qwen3 0.6B to model podstawowy do prostego rozumowania i bardzo ograniczonych środowisk.",
"qwen3-1.7b.description": "Qwen3 1.7B to ultralekki model do wdrożeń na urządzeniach brzegowych.",
"qwen3-14b.description": "Qwen3 14B to średniej wielkości model do wielojęzycznego QA i generowania tekstu.",
"qwen3-235b-a22b-instruct-2507.description": "Qwen3 235B A22B Instruct 2507 to flagowy model instrukcyjny do szerokiego zakresu zadań generacyjnych i rozumowania.",
"qwen3-235b-a22b-thinking-2507.description": "Qwen3 235B A22B Thinking 2507 to ultraduży model myślący do trudnych zadań wymagających rozumowania.",
"qwen3-235b-a22b.description": "Qwen3 235B A22B to ogólny duży model do złożonych zadań.",
"qwen3-30b-a3b-instruct-2507.description": "Qwen3 30B A3B Instruct 2507 to średnio-duży model instrukcyjny do wysokiej jakości generowania i QA.",
"qwen3-30b-a3b-thinking-2507.description": "Qwen3 30B A3B Thinking 2507 to średnio-duży model myślący, łączący dokładność i efektywność kosztową.",
"qwen3-30b-a3b.description": "Qwen3 30B A3B to średnio-duży model ogólny, równoważący koszty i jakość.",
"qwen3-32b.description": "Qwen3 32B nadaje się do ogólnych zadań wymagających lepszego rozumienia.",
"qwen3-4b.description": "Qwen3 4B nadaje się do małych i średnich aplikacji oraz lokalnego wnioskowania.",
"qwen3-8b.description": "Qwen3 8B to lekki model z elastycznym wdrożeniem do obciążeń o wysokiej równoczesności.",
"qwen3-coder-30b-a3b-instruct.description": "Otwartoźródłowy model kodujący Qwen. Najnowszy qwen3-coder-30b-a3b-instruct oparty jest na Qwen3 i oferuje zaawansowane możliwości agenta kodującego, korzystania z narzędzi i interakcji ze środowiskiem do autonomicznego programowania, z doskonałą wydajnością kodu i solidnymi zdolnościami ogólnymi.",
"qwen3-coder-480b-a35b-instruct.description": "Qwen3 Coder 480B A35B Instruct to flagowy model kodujący do programowania wielojęzycznego i złożonego rozumienia kodu.",
"qwen3-coder-flash.description": "Model kodujący Qwen. Najnowsza seria Qwen3-Coder oparta jest na Qwen3 i oferuje zaawansowane możliwości agenta kodującego, korzystania z narzędzi i interakcji ze środowiskiem do autonomicznego programowania, z doskonałą wydajnością kodu i solidnymi zdolnościami ogólnymi.",
"qwen3-coder-plus.description": "Model kodujący Qwen. Najnowsza seria Qwen3-Coder oparta jest na Qwen3 i oferuje zaawansowane możliwości agenta kodującego, korzystania z narzędzi i interakcji ze środowiskiem do autonomicznego programowania, z doskonałą wydajnością kodu i solidnymi zdolnościami ogólnymi.",
"qwen3-coder:480b.description": "Wysokowydajny model Alibaba do zadań agenta i kodowania z długim kontekstem.",
"qwen3-max-preview.description": "Najlepszy model Qwen do złożonych, wieloetapowych zadań. Wersja podglądowa obsługuje myślenie.",
"qwen3-max.description": "Modele Qwen3 Max oferują znaczne ulepszenia względem serii 2.5 w zakresie ogólnych zdolności, rozumienia chińskiego/angielskiego, złożonych instrukcji, zadań otwartych, wielojęzyczności i korzystania z narzędzi, z mniejszą liczbą halucynacji. Najnowszy qwen3-max poprawia programowanie agentowe i korzystanie z narzędzi względem qwen3-max-preview. Wersja ta osiąga SOTA w swojej klasie i jest przeznaczona do bardziej złożonych potrzeb agentów.",
"qwen3-next-80b-a3b-instruct.description": "Nowej generacji otwartoźródłowy model Qwen3 bez myślenia. W porównaniu do poprzedniej wersji (Qwen3-235B-A22B-Instruct-2507) oferuje lepsze rozumienie chińskiego, silniejsze rozumowanie logiczne i ulepszone generowanie tekstu.",
"qwen3-next-80b-a3b-thinking.description": "Qwen3 Next 80B A3B Thinking to flagowa wersja modelu rozumującego do złożonych zadań.",
"qwen3-omni-flash.description": "Qwen-Omni przyjmuje połączone dane wejściowe z tekstu, obrazów, dźwięku i wideo, a generuje tekst lub mowę. Oferuje wiele naturalnych stylów głosu, obsługuje mowę wielojęzyczną i dialektyczną, i nadaje się do zastosowań takich jak pisanie, rozpoznawanie wizji i asystenci głosowi.",
"qwen3-vl-235b-a22b-instruct.description": "Qwen3 VL 235B A22B Instruct to flagowy model multimodalny do wymagających zadań rozumienia i tworzenia treści.",
"qwen3-vl-235b-a22b-thinking.description": "Qwen3 VL 235B A22B Thinking to flagowa wersja myśląca do złożonego multimodalnego rozumowania i planowania.",
"qwen3-vl-30b-a3b-instruct.description": "Qwen3 VL 30B A3B Instruct to duży model multimodalny równoważący dokładność i wydajność rozumowania.",
"qwen3-vl-30b-a3b-thinking.description": "Qwen3 VL 30B A3B Thinking to wersja głęboko rozumująca do złożonych zadań multimodalnych.",
"qwen3-vl-32b-instruct.description": "Qwen3 VL 32B Instruct to multimodalny model dostrojony instrukcyjnie do wysokiej jakości QA obraz-tekst i tworzenia treści.",
"qwen3-vl-32b-thinking.description": "Qwen3 VL 32B Thinking to głęboko rozumująca wersja multimodalna do złożonego rozumowania i analizy łańcuchowej.",
"qwen3-vl-8b-instruct.description": "Qwen3 VL 8B Instruct to lekki model multimodalny do codziennego QA wizualnego i integracji z aplikacjami.",
"qwen3-vl-8b-thinking.description": "Qwen3 VL 8B Thinking to multimodalny model łańcucha myśli do szczegółowego rozumowania wizualnego.",
"qwen3-vl-flash.description": "Qwen3 VL Flash: lekka, szybka wersja rozumująca do zadań wrażliwych na opóźnienia lub o dużym wolumenie.",
"qwen3-vl-plus.description": "Qwen VL to model generowania tekstu z rozumieniem wizji. Potrafi wykonywać OCR, podsumowywać i rozumować, np. wyodrębniać atrybuty ze zdjęć produktów lub rozwiązywać problemy na podstawie obrazów.",
"qwen3.description": "Qwen3 to nowej generacji duży model językowy Alibaba o wysokiej wydajności w różnych zastosowaniach.",
"taichu_o1.description": "taichu_o1 to nowej generacji model rozumowania, który wykorzystuje interakcję multimodalną i uczenie przez wzmacnianie do osiągnięcia ludzkiego łańcucha myślowego. Obsługuje symulację złożonych decyzji, ujawnia ścieżki rozumowania przy zachowaniu wysokiej dokładności wyników, idealny do analizy strategicznej i głębokiego myślenia.",
"taichu_vl.description": "Łączy rozumienie obrazu, transfer wiedzy i logiczną atrybucję, wyróżniając się w zadaniach pytanie-odpowiedź obraz-tekst.",
"tencent/Hunyuan-A13B-Instruct.description": "Hunyuan-A13B-Instruct wykorzystuje 80 miliardów parametrów całkowitych, z czego 13 miliardów aktywnych, aby dorównać większym modelom. Obsługuje hybrydowe rozumowanie szybkie/wolne, stabilne rozumienie długich tekstów i wiodące możliwości agenta w BFCL-v3 i τ-Bench. GQA i formaty wielokrotnej kwantyzacji umożliwiają wydajne wnioskowanie.",
"tencent/Hunyuan-MT-7B.description": "Model tłumaczeniowy Hunyuan obejmuje Hunyuan-MT-7B oraz zespół Hunyuan-MT-Chimera. Hunyuan-MT-7B to lekki model tłumaczeniowy o 7 miliardach parametrów, obsługujący 33 języki oraz 5 języków mniejszości chińskich. W WMT25 zdobył 30 pierwszych miejsc w 31 parach językowych. Tencent Hunyuan wykorzystuje pełny cykl treningowy od pretreningu przez SFT po RL tłumaczeniowe i zespołowe, osiągając wiodącą wydajność przy łatwym wdrożeniu.",
"text-embedding-3-large.description": "Najbardziej zaawansowany model osadzania tekstu dla zadań w języku angielskim i innych.",
"text-embedding-3-small.description": "Wydajny, opłacalny model osadzania nowej generacji do wyszukiwania i scenariuszy RAG.",
"thudm/glm-4-32b.description": "GLM-4-32B-0414 to 32-miliardowy model dwujęzyczny (chiński/angielski) z otwartymi wagami, zoptymalizowany do generowania kodu, wywoływania funkcji i zadań agenta. Trenowany na 15T wysokiej jakości danych z naciskiem na rozumowanie, udoskonalony przez dopasowanie do preferencji użytkownika, próbkowanie odrzuceń i RL. Wyróżnia się w złożonym rozumowaniu, generowaniu artefaktów i strukturze wyjściowej, osiągając poziom GPT-4o i DeepSeek-V3-0324 w wielu benchmarkach.",
"thudm/glm-4-32b:free.description": "GLM-4-32B-0414 to 32-miliardowy model dwujęzyczny (chiński/angielski) z otwartymi wagami, zoptymalizowany do generowania kodu, wywoływania funkcji i zadań agenta. Trenowany na 15T wysokiej jakości danych z naciskiem na rozumowanie, udoskonalony przez dopasowanie do preferencji użytkownika, próbkowanie odrzuceń i RL. Wyróżnia się w złożonym rozumowaniu, generowaniu artefaktów i strukturze wyjściowej, osiągając poziom GPT-4o i DeepSeek-V3-0324 w wielu benchmarkach.",
"thudm/glm-4-9b-chat.description": "Wersja open-source najnowszego modelu pretreningowego GLM-4 od Zhipu AI.",
"thudm/glm-z1-32b.description": "GLM-Z1-32B-0414 to ulepszona wersja rozumowania modelu GLM-4-32B, stworzona do głębokiego rozwiązywania problemów matematycznych, logicznych i kodowych. Wykorzystuje rozszerzone RL (specyficzne dla zadań i ogólne preferencje parowe), aby poprawić złożone zadania wieloetapowe. W porównaniu do GLM-4-32B, Z1 znacząco poprawia rozumowanie strukturalne i zdolności w formalnych dziedzinach.\n\nObsługuje wymuszanie kroków „myślenia” przez inżynierię promptów, poprawioną spójność długich odpowiedzi i jest zoptymalizowany do przepływów pracy agentów z długim kontekstem (przez YaRN), wywoływaniem narzędzi JSON i precyzyjnym próbkowaniem dla stabilnego rozumowania. Idealny do przypadków wymagających starannego rozumowania wieloetapowego lub formalnych wyprowadzeń.",
"thudm/glm-z1-rumination-32b.description": "GLM Z1 Rumination 32B to 32-miliardowy model głębokiego rozumowania z serii GLM-4-Z1, zoptymalizowany do złożonych, otwartych zadań wymagających długiego myślenia. Bazując na glm-4-32b-0414, dodaje dodatkowe etapy RL i wieloetapowe dopasowanie, wprowadzając zdolność „rozmyślania”, która symuluje rozszerzone przetwarzanie poznawcze. Obejmuje to iteracyjne rozumowanie, analizę wieloetapową i przepływy pracy wspomagane narzędziami, takie jak wyszukiwanie, pobieranie i synteza z uwzględnieniem cytowań.\n\nWyróżnia się w pisaniu naukowym, analizie porównawczej i złożonych pytaniach. Obsługuje wywoływanie funkcji dla prymitywów wyszukiwania/nawigacji (`search`, `click`, `open`, `finish`) w pipeline'ach agentów. Zachowanie rozmyślania jest kontrolowane przez pętle wieloetapowe z kształtowaniem nagród opartym na regułach i opóźnionymi decyzjami, testowane w porównaniu do głębokich frameworków badawczych, takich jak wewnętrzny stos dopasowania OpenAI. Ta wersja stawia na głębię zamiast szybkości.",
"tngtech/deepseek-r1t-chimera:free.description": "DeepSeek-R1T-Chimera powstał przez połączenie DeepSeek-R1 i DeepSeek-V3 (0324), łącząc rozumowanie R1 z efektywnością tokenów V3. Bazuje na transformatorze DeepSeek-MoE i jest zoptymalizowany do ogólnej generacji tekstu.\n\nŁączy wagi pretrenowane, aby zrównoważyć rozumowanie, wydajność i podążanie za instrukcjami. Wydany na licencji MIT do użytku badawczego i komercyjnego.",
"togethercomputer/StripedHyena-Nous-7B.description": "StripedHyena Nous (7B) zapewnia zwiększoną wydajność obliczeniową dzięki swojej architekturze i strategii.",
"tts-1-hd.description": "Najnowszy model tekst-na-mowę zoptymalizowany pod kątem jakości.",
"tts-1.description": "Najnowszy model tekst-na-mowę zoptymalizowany pod kątem szybkości działania w czasie rzeczywistym.",
"upstage/SOLAR-10.7B-Instruct-v1.0.description": "Upstage SOLAR Instruct v1 (11B) jest dostrojony do precyzyjnych zadań instrukcyjnych z silną wydajnością językową.",
"us.anthropic.claude-3-5-sonnet-20241022-v2:0.description": "Claude 3.5 Sonnet podnosi standard branżowy, przewyższając konkurencję i Claude 3 Opus w szerokich ocenach, zachowując jednocześnie średni poziom szybkości i kosztów.",
"us.anthropic.claude-3-7-sonnet-20250219-v1:0.description": "Claude 3.7 Sonnet to najszybszy model nowej generacji od Anthropic. W porównaniu do Claude 3 Haiku poprawia się we wszystkich umiejętnościach i przewyższa poprzedni flagowy model Claude 3 Opus w wielu benchmarkach inteligencji.",
"us.anthropic.claude-haiku-4-5-20251001-v1:0.description": "Claude Haiku 4.5 to najszybszy i najbardziej inteligentny model Haiku od Anthropic, oferujący błyskawiczną szybkość i rozszerzone myślenie.",
"us.anthropic.claude-sonnet-4-5-20250929-v1:0.description": "Claude Sonnet 4.5 to najbardziej inteligentny model Anthropic do tej pory.",
"v0-1.0-md.description": "v0-1.0-md to model starszej generacji udostępniany przez API v0.",
"v0-1.5-lg.description": "v0-1.5-lg jest odpowiedni do zaawansowanych zadań myślowych i rozumowania.",
"v0-1.5-md.description": "v0-1.5-md jest odpowiedni do codziennych zadań i generowania interfejsów użytkownika.",
"vercel/v0-1.0-md.description": "Uzyskaj dostęp do modeli stojących za v0, aby generować, naprawiać i optymalizować nowoczesne aplikacje webowe z rozumowaniem specyficznym dla frameworków i aktualną wiedzą.",
"vercel/v0-1.5-md.description": "Uzyskaj dostęp do modeli stojących za v0, aby generować, naprawiać i optymalizować nowoczesne aplikacje webowe z rozumowaniem specyficznym dla frameworków i aktualną wiedzą.",
"volcengine/doubao-seed-code.description": "Doubao-Seed-Code to model LLM od ByteDance Volcano Engine zoptymalizowany do programowania agentowego, osiągający wysokie wyniki w benchmarkach programistycznych i agentowych z obsługą kontekstu 256K.",
"wan2.2-t2i-flash.description": "Wanxiang 2.2 Speed to najnowszy model z ulepszeniami w zakresie kreatywności, stabilności i realizmu, oferujący szybkie generowanie i wysoką wartość.",
"wan2.2-t2i-plus.description": "Wanxiang 2.2 Pro to najnowszy model z ulepszeniami w zakresie kreatywności, stabilności i realizmu, generujący bogatsze detale.",
"wanx-v1.description": "Bazowy model tekst-na-obraz. Odpowiada Tongyi Wanxiang 1.0 General.",
"wanx2.0-t2i-turbo.description": "Wyróżnia się w portretach z teksturą przy umiarkowanej szybkości i niższym koszcie. Odpowiada Tongyi Wanxiang 2.0 Speed.",
"wanx2.1-t2i-plus.description": "W pełni zaktualizowana wersja z bogatszymi detalami obrazu i nieco wolniejszą szybkością. Odpowiada Tongyi Wanxiang 2.1 Pro.",
"wanx2.1-t2i-turbo.description": "W pełni zaktualizowana wersja z szybkim generowaniem, wysoką jakością ogólną i dużą wartością. Odpowiada Tongyi Wanxiang 2.1 Speed.",
"whisper-1.description": "Ogólny model rozpoznawania mowy obsługujący wielojęzyczne ASR, tłumaczenie mowy i identyfikację języka.",
"wizardlm2.description": "WizardLM 2 to model językowy od Microsoft AI, który wyróżnia się w złożonych dialogach, zadaniach wielojęzycznych, rozumowaniu i asystentach.",
"wizardlm2:8x22b.description": "WizardLM 2 to model językowy od Microsoft AI, który wyróżnia się w złożonych dialogach, zadaniach wielojęzycznych, rozumowaniu i asystentach.",
"z-ai/glm-4.5-air.description": "GLM 4.5 Air to lekka wersja GLM 4.5 przeznaczona do scenariuszy wrażliwych na koszty, zachowująca jednocześnie wysoką jakość rozumowania.",
"z-ai/glm-4.5.description": "GLM 4.5 to flagowy model Z.AI z hybrydowym rozumowaniem, zoptymalizowany do zadań inżynieryjnych i pracy z długim kontekstem.",
"z-ai/glm-4.6.description": "GLM 4.6 to flagowy model Z.AI z rozszerzoną długością kontekstu i zaawansowanymi możliwościami kodowania.",
"zai-glm-4.6.description": "Osiąga wysokie wyniki w zadaniach związanych z kodowaniem i rozumowaniem, obsługuje strumieniowanie i wywołania narzędzi, idealnie nadaje się do kodowania agentowego i złożonego rozumowania.",
"zai-org/GLM-4.5-Air.description": "GLM-4.5-Air to bazowy model dla aplikacji agentowych, oparty na architekturze Mixture-of-Experts. Zoptymalizowany do korzystania z narzędzi, przeglądania internetu, inżynierii oprogramowania i kodowania frontendowego. Integruje się z agentami kodu, takimi jak Claude Code i Roo Code. Wykorzystuje hybrydowe rozumowanie do obsługi zarówno złożonych, jak i codziennych scenariuszy.",
"zai-org/GLM-4.5.description": "GLM-4.5 to bazowy model stworzony dla aplikacji agentowych, oparty na architekturze Mixture-of-Experts. Głęboko zoptymalizowany do korzystania z narzędzi, przeglądania internetu, inżynierii oprogramowania i kodowania frontendowego. Integruje się z agentami kodu, takimi jak Claude Code i Roo Code. Wykorzystuje hybrydowe rozumowanie do obsługi zarówno złożonych, jak i codziennych scenariuszy.",
"zai-org/GLM-4.5V.description": "GLM-4.5V to najnowszy VLM Zhipu AI, oparty na flagowym modelu tekstowym GLM-4.5-Air (106B parametrów ogółem, 12B aktywnych) z architekturą MoE zapewniającą wysoką wydajność przy niższych kosztach. Podąża ścieżką GLM-4.1V-Thinking i dodaje 3D-RoPE dla lepszego rozumienia przestrzeni 3D. Zoptymalizowany poprzez pretrening, SFT i RL, obsługuje obrazy, wideo i długie dokumenty, zajmując czołowe miejsca wśród otwartych modeli w 41 publicznych benchmarkach multimodalnych. Przełącznik trybu Thinking pozwala użytkownikom balansować między szybkością a głębokością analizy.",
"zai-org/GLM-4.6.description": "W porównaniu do GLM-4.5, GLM-4.6 rozszerza kontekst z 128K do 200K, umożliwiając realizację bardziej złożonych zadań agentowych. Osiąga lepsze wyniki w benchmarkach kodu i wykazuje wyższą skuteczność w aplikacjach takich jak Claude Code, Cline, Roo Code i Kilo Code, w tym lepsze generowanie stron frontendowych. Ulepszono rozumowanie oraz obsługę narzędzi w trakcie rozumowania, co wzmacnia ogólne możliwości. Lepsza integracja z frameworkami agentowymi, usprawnione działanie agentów narzędziowych i wyszukiwawczych oraz bardziej naturalny styl pisania i odgrywania ról preferowany przez użytkowników.",
"zai/glm-4.5-air.description": "GLM-4.5 i GLM-4.5-Air to nasze najnowsze flagowe modele dla aplikacji agentowych, oba oparte na architekturze MoE. GLM-4.5 ma 355B parametrów ogółem i 32B aktywnych na jedno przejście; GLM-4.5-Air jest lżejszy 106B ogółem i 12B aktywnych.",
"zai/glm-4.5.description": "Seria GLM-4.5 została zaprojektowana z myślą o agentach. Flagowy model GLM-4.5 łączy rozumowanie, kodowanie i umiejętności agentowe, posiada 355B parametrów ogółem (32B aktywnych) i oferuje dwa tryby działania jako system hybrydowego rozumowania.",
"zai/glm-4.5v.description": "GLM-4.5V bazuje na GLM-4.5-Air, dziedzicząc sprawdzone techniki GLM-4.1V-Thinking i skalując się dzięki silnej architekturze MoE z 106 miliardami parametrów.",
"zenmux/auto.description": "Automatyczne trasowanie ZenMux wybiera najlepiej wyceniony i najbardziej wydajny model spośród obsługiwanych opcji na podstawie Twojego zapytania."
}