mirror of
https://github.com/lobehub/lobe-chat.git
synced 2026-06-15 04:00:09 +00:00
Compare commits
87 Commits
| Author | SHA1 | Date | |
|---|---|---|---|
| 1eaf28e498 | |||
| 5bfb876340 | |||
| 273e0277d1 | |||
| 4fb18ac6a8 | |||
| 74c8ef2686 | |||
| e35e3787c0 | |||
| c0e5a1d6e3 | |||
| abba6a9eff | |||
| 4ea45b18d0 | |||
| a21e71833b | |||
| dd9bbdc362 | |||
| 1a443e8d8a | |||
| 4a00672f9b | |||
| 3db2a39585 | |||
| 9a4939cca9 | |||
| 5c8b48efee | |||
| 6d3e5d1a80 | |||
| 67401c07aa | |||
| cf81abc909 | |||
| 13e936fbe0 | |||
| 8636fe45e3 | |||
| 1a77d9f9c6 | |||
| 8616977253 | |||
| 1e17da19d9 | |||
| 4349ad955d | |||
| 7d619cc0c1 | |||
| af003c5efa | |||
| d54113036a | |||
| 652e0ff415 | |||
| 800528d459 | |||
| b050bd7b9f | |||
| 0719f18af1 | |||
| c2dfed6f7b | |||
| 02566b1a95 | |||
| 8f9464acf8 | |||
| a21472724b | |||
| 20ef12443d | |||
| 4a24df9155 | |||
| dbec6b6776 | |||
| d9a4361994 | |||
| 1251548120 | |||
| 6b0f8eddb5 | |||
| 18e4c04fb9 | |||
| 785d5d7647 | |||
| c665646534 | |||
| ebd924c371 | |||
| b52183cdbf | |||
| 78a2f9e874 | |||
| 8f274aeba9 | |||
| 9146362c9b | |||
| 1c61b21133 | |||
| c14d165124 | |||
| 69817182a0 | |||
| 4099dfd955 | |||
| 48ad272f90 | |||
| 9352a9c80e | |||
| f02d43b8d3 | |||
| 6808099ce9 | |||
| 08347bbe01 | |||
| 47ec2d81dc | |||
| 541d0f46b2 | |||
| af3daa4022 | |||
| 58d34ff53f | |||
| b5389e44a2 | |||
| e827f286e6 | |||
| 7f60544950 | |||
| 116af84640 | |||
| 764fd4fa78 | |||
| f37ec1d4c2 | |||
| a94e8810a3 | |||
| 45b7a43170 | |||
| 7dc000e10c | |||
| f25fda6de2 | |||
| d2ff75cc05 | |||
| 8de927a419 | |||
| fe9d4afa05 | |||
| 54704b1247 | |||
| 65d2c0c2ea | |||
| 9f99b0bc2a | |||
| a78fc1fd24 | |||
| 4e0e99e503 | |||
| a0074fc280 | |||
| 6c01f21cec | |||
| 8f4a98fed0 | |||
| 70f52a3c1f | |||
| 8711ea244c | |||
| 255a89c9f3 |
@@ -0,0 +1,35 @@
|
||||
---
|
||||
description: Explain how group chat works in LobeHub (Multi-agent orchestratoin)
|
||||
globs:
|
||||
alwaysApply: false
|
||||
---
|
||||
|
||||
This rule explains how group chat (multi-agent orchestration) works. Not confused with session group, which is a organization method to manage session.
|
||||
|
||||
## Key points
|
||||
|
||||
- A supervisor will devide who and how will speak next
|
||||
- Each agent will speak just like in single chat (if was asked to speak)
|
||||
- Not coufused with session group
|
||||
|
||||
## Related Files
|
||||
|
||||
- src/store/chat/slices/message/supervisor.ts
|
||||
- src/store/chat/slices/aiChat/actions/generateAIGroupChat.ts
|
||||
- src/prompts/groupChat/index.ts (All prompts here)
|
||||
|
||||
## Snippets
|
||||
|
||||
```tsx
|
||||
// Detect whether in group chat
|
||||
const isGroupSession = useSessionStore(sessionSelectors.isCurrentSessionGroupSession);
|
||||
|
||||
// Member actions
|
||||
const addAgentsToGroup = useChatGroupStore((s) => s.addAgentsToGroup);
|
||||
const removeAgentFromGroup = useChatGroupStore((s) => s.removeAgentFromGroup);
|
||||
const persistReorder = useChatGroupStore((s) => s.reorderGroupMembers);
|
||||
|
||||
// Get group info
|
||||
const groupConfig = useChatGroupStore(chatGroupSelectors.currentGroupConfig);
|
||||
const currentGroupMemebers = useSessionStore(sessionSelectors.currentGroupAgents);
|
||||
```
|
||||
@@ -1,6 +1,7 @@
|
||||
{
|
||||
"image": "mcr.microsoft.com/devcontainers/typescript-node",
|
||||
"features": {
|
||||
"ghcr.io/devcontainer-community/devcontainer-features/bun.sh:1": {}
|
||||
}
|
||||
"ghcr.io/devcontainer-community/devcontainer-features/bun.sh:1": {},
|
||||
"ghcr.io/devcontainers/features/docker-outside-of-docker:1": {}
|
||||
},
|
||||
"image": "mcr.microsoft.com/devcontainers/typescript-node"
|
||||
}
|
||||
|
||||
+530
@@ -2,6 +2,536 @@
|
||||
|
||||
# Changelog
|
||||
|
||||
### [Version 1.132.15](https://github.com/lobehub/lobe-chat/compare/v1.132.14...v1.132.15)
|
||||
|
||||
<sup>Released on **2025-09-25**</sup>
|
||||
|
||||
#### 🐛 Bug Fixes
|
||||
|
||||
- **misc**: Add proxyUrl configuration for NEW API provider.
|
||||
|
||||
<br/>
|
||||
|
||||
<details>
|
||||
<summary><kbd>Improvements and Fixes</kbd></summary>
|
||||
|
||||
#### What's fixed
|
||||
|
||||
- **misc**: Add proxyUrl configuration for NEW API provider, closes [#9426](https://github.com/lobehub/lobe-chat/issues/9426) [#9420](https://github.com/lobehub/lobe-chat/issues/9420) ([e35e378](https://github.com/lobehub/lobe-chat/commit/e35e378))
|
||||
|
||||
</details>
|
||||
|
||||
<div align="right">
|
||||
|
||||
[](#readme-top)
|
||||
|
||||
</div>
|
||||
|
||||
### [Version 1.132.14](https://github.com/lobehub/lobe-chat/compare/v1.132.13...v1.132.14)
|
||||
|
||||
<sup>Released on **2025-09-25**</sup>
|
||||
|
||||
#### 💄 Styles
|
||||
|
||||
- **misc**: Update i18n.
|
||||
|
||||
<br/>
|
||||
|
||||
<details>
|
||||
<summary><kbd>Improvements and Fixes</kbd></summary>
|
||||
|
||||
#### Styles
|
||||
|
||||
- **misc**: Update i18n, closes [#9413](https://github.com/lobehub/lobe-chat/issues/9413) ([4ea45b1](https://github.com/lobehub/lobe-chat/commit/4ea45b1))
|
||||
|
||||
</details>
|
||||
|
||||
<div align="right">
|
||||
|
||||
[](#readme-top)
|
||||
|
||||
</div>
|
||||
|
||||
### [Version 1.132.13](https://github.com/lobehub/lobe-chat/compare/v1.132.12...v1.132.13)
|
||||
|
||||
<sup>Released on **2025-09-25**</sup>
|
||||
|
||||
<br/>
|
||||
|
||||
<details>
|
||||
<summary><kbd>Improvements and Fixes</kbd></summary>
|
||||
|
||||
</details>
|
||||
|
||||
<div align="right">
|
||||
|
||||
[](#readme-top)
|
||||
|
||||
</div>
|
||||
|
||||
### [Version 1.132.12](https://github.com/lobehub/lobe-chat/compare/v1.132.11...v1.132.12)
|
||||
|
||||
<sup>Released on **2025-09-25**</sup>
|
||||
|
||||
#### 🐛 Bug Fixes
|
||||
|
||||
- **misc**: Slove setting proxy page with style error.
|
||||
|
||||
<br/>
|
||||
|
||||
<details>
|
||||
<summary><kbd>Improvements and Fixes</kbd></summary>
|
||||
|
||||
#### What's fixed
|
||||
|
||||
- **misc**: Slove setting proxy page with style error, closes [#9417](https://github.com/lobehub/lobe-chat/issues/9417) ([6d3e5d1](https://github.com/lobehub/lobe-chat/commit/6d3e5d1))
|
||||
|
||||
</details>
|
||||
|
||||
<div align="right">
|
||||
|
||||
[](#readme-top)
|
||||
|
||||
</div>
|
||||
|
||||
### [Version 1.132.11](https://github.com/lobehub/lobe-chat/compare/v1.132.10...v1.132.11)
|
||||
|
||||
<sup>Released on **2025-09-24**</sup>
|
||||
|
||||
#### 💄 Styles
|
||||
|
||||
- **misc**: Enhanced Nvidia NIM chat experience, OpenAI models in AiHubMix use Responses API.
|
||||
|
||||
<br/>
|
||||
|
||||
<details>
|
||||
<summary><kbd>Improvements and Fixes</kbd></summary>
|
||||
|
||||
#### Styles
|
||||
|
||||
- **misc**: Enhanced Nvidia NIM chat experience, closes [#9408](https://github.com/lobehub/lobe-chat/issues/9408) ([13e936f](https://github.com/lobehub/lobe-chat/commit/13e936f))
|
||||
- **misc**: OpenAI models in AiHubMix use Responses API, closes [#9251](https://github.com/lobehub/lobe-chat/issues/9251) ([8636fe4](https://github.com/lobehub/lobe-chat/commit/8636fe4))
|
||||
|
||||
</details>
|
||||
|
||||
<div align="right">
|
||||
|
||||
[](#readme-top)
|
||||
|
||||
</div>
|
||||
|
||||
### [Version 1.132.10](https://github.com/lobehub/lobe-chat/compare/v1.132.9...v1.132.10)
|
||||
|
||||
<sup>Released on **2025-09-24**</sup>
|
||||
|
||||
#### 🐛 Bug Fixes
|
||||
|
||||
- **misc**: Macos desktop sign.
|
||||
|
||||
<br/>
|
||||
|
||||
<details>
|
||||
<summary><kbd>Improvements and Fixes</kbd></summary>
|
||||
|
||||
#### What's fixed
|
||||
|
||||
- **misc**: Macos desktop sign, closes [#9400](https://github.com/lobehub/lobe-chat/issues/9400) ([4349ad9](https://github.com/lobehub/lobe-chat/commit/4349ad9))
|
||||
|
||||
</details>
|
||||
|
||||
<div align="right">
|
||||
|
||||
[](#readme-top)
|
||||
|
||||
</div>
|
||||
|
||||
### [Version 1.132.9](https://github.com/lobehub/lobe-chat/compare/v1.132.8...v1.132.9)
|
||||
|
||||
<sup>Released on **2025-09-23**</sup>
|
||||
|
||||
<br/>
|
||||
|
||||
<details>
|
||||
<summary><kbd>Improvements and Fixes</kbd></summary>
|
||||
|
||||
</details>
|
||||
|
||||
<div align="right">
|
||||
|
||||
[](#readme-top)
|
||||
|
||||
</div>
|
||||
|
||||
### [Version 1.132.8](https://github.com/lobehub/lobe-chat/compare/v1.132.7...v1.132.8)
|
||||
|
||||
<sup>Released on **2025-09-23**</sup>
|
||||
|
||||
#### ♻ Code Refactoring
|
||||
|
||||
- **misc**: Refactor all `@/types` in model runtime to `@lobechat/types`.
|
||||
|
||||
<br/>
|
||||
|
||||
<details>
|
||||
<summary><kbd>Improvements and Fixes</kbd></summary>
|
||||
|
||||
#### Code refactoring
|
||||
|
||||
- **misc**: Refactor all `@/types` in model runtime to `@lobechat/types`, closes [#9383](https://github.com/lobehub/lobe-chat/issues/9383) ([b050bd7](https://github.com/lobehub/lobe-chat/commit/b050bd7))
|
||||
|
||||
</details>
|
||||
|
||||
<div align="right">
|
||||
|
||||
[](#readme-top)
|
||||
|
||||
</div>
|
||||
|
||||
### [Version 1.132.7](https://github.com/lobehub/lobe-chat/compare/v1.132.6...v1.132.7)
|
||||
|
||||
<sup>Released on **2025-09-23**</sup>
|
||||
|
||||
<br/>
|
||||
|
||||
<details>
|
||||
<summary><kbd>Improvements and Fixes</kbd></summary>
|
||||
|
||||
</details>
|
||||
|
||||
<div align="right">
|
||||
|
||||
[](#readme-top)
|
||||
|
||||
</div>
|
||||
|
||||
### [Version 1.132.6](https://github.com/lobehub/lobe-chat/compare/v1.132.5...v1.132.6)
|
||||
|
||||
<sup>Released on **2025-09-23**</sup>
|
||||
|
||||
<br/>
|
||||
|
||||
<details>
|
||||
<summary><kbd>Improvements and Fixes</kbd></summary>
|
||||
|
||||
</details>
|
||||
|
||||
<div align="right">
|
||||
|
||||
[](#readme-top)
|
||||
|
||||
</div>
|
||||
|
||||
### [Version 1.132.5](https://github.com/lobehub/lobe-chat/compare/v1.132.4...v1.132.5)
|
||||
|
||||
<sup>Released on **2025-09-22**</sup>
|
||||
|
||||
#### ♻ Code Refactoring
|
||||
|
||||
- **misc**: Move the ModelProvider to model-bank.
|
||||
|
||||
<br/>
|
||||
|
||||
<details>
|
||||
<summary><kbd>Improvements and Fixes</kbd></summary>
|
||||
|
||||
#### Code refactoring
|
||||
|
||||
- **misc**: Move the ModelProvider to model-bank, closes [#9374](https://github.com/lobehub/lobe-chat/issues/9374) ([d9a4361](https://github.com/lobehub/lobe-chat/commit/d9a4361))
|
||||
|
||||
</details>
|
||||
|
||||
<div align="right">
|
||||
|
||||
[](#readme-top)
|
||||
|
||||
</div>
|
||||
|
||||
### [Version 1.132.4](https://github.com/lobehub/lobe-chat/compare/v1.132.3...v1.132.4)
|
||||
|
||||
<sup>Released on **2025-09-22**</sup>
|
||||
|
||||
#### 💄 Styles
|
||||
|
||||
- **misc**: Enable thinkingBudget control for Vertex Gemini 2.5 models, update i18n.
|
||||
|
||||
<br/>
|
||||
|
||||
<details>
|
||||
<summary><kbd>Improvements and Fixes</kbd></summary>
|
||||
|
||||
#### Styles
|
||||
|
||||
- **misc**: Enable thinkingBudget control for Vertex Gemini 2.5 models, closes [#8223](https://github.com/lobehub/lobe-chat/issues/8223) ([c665646](https://github.com/lobehub/lobe-chat/commit/c665646))
|
||||
- **misc**: Update i18n, closes [#9363](https://github.com/lobehub/lobe-chat/issues/9363) ([785d5d7](https://github.com/lobehub/lobe-chat/commit/785d5d7))
|
||||
|
||||
</details>
|
||||
|
||||
<div align="right">
|
||||
|
||||
[](#readme-top)
|
||||
|
||||
</div>
|
||||
|
||||
### [Version 1.132.3](https://github.com/lobehub/lobe-chat/compare/v1.132.2...v1.132.3)
|
||||
|
||||
<sup>Released on **2025-09-21**</sup>
|
||||
|
||||
#### 💄 Styles
|
||||
|
||||
- **misc**: Added `AUTH_MICROSOFT_ENTRA_ID_BASE_URL` routing.
|
||||
|
||||
<br/>
|
||||
|
||||
<details>
|
||||
<summary><kbd>Improvements and Fixes</kbd></summary>
|
||||
|
||||
#### Styles
|
||||
|
||||
- **misc**: Added `AUTH_MICROSOFT_ENTRA_ID_BASE_URL` routing, closes [#9293](https://github.com/lobehub/lobe-chat/issues/9293) ([78a2f9e](https://github.com/lobehub/lobe-chat/commit/78a2f9e))
|
||||
|
||||
</details>
|
||||
|
||||
<div align="right">
|
||||
|
||||
[](#readme-top)
|
||||
|
||||
</div>
|
||||
|
||||
### [Version 1.132.2](https://github.com/lobehub/lobe-chat/compare/v1.132.1...v1.132.2)
|
||||
|
||||
<sup>Released on **2025-09-21**</sup>
|
||||
|
||||
#### 🐛 Bug Fixes
|
||||
|
||||
- **misc**: Fix non stream mode in OpenAI Response API.
|
||||
|
||||
<br/>
|
||||
|
||||
<details>
|
||||
<summary><kbd>Improvements and Fixes</kbd></summary>
|
||||
|
||||
#### What's fixed
|
||||
|
||||
- **misc**: Fix non stream mode in OpenAI Response API, closes [#9360](https://github.com/lobehub/lobe-chat/issues/9360) ([1c61b21](https://github.com/lobehub/lobe-chat/commit/1c61b21))
|
||||
|
||||
</details>
|
||||
|
||||
<div align="right">
|
||||
|
||||
[](#readme-top)
|
||||
|
||||
</div>
|
||||
|
||||
### [Version 1.132.1](https://github.com/lobehub/lobe-chat/compare/v1.132.0...v1.132.1)
|
||||
|
||||
<sup>Released on **2025-09-21**</sup>
|
||||
|
||||
#### 🐛 Bug Fixes
|
||||
|
||||
- **misc**: Fix missing provider in server message.
|
||||
|
||||
<br/>
|
||||
|
||||
<details>
|
||||
<summary><kbd>Improvements and Fixes</kbd></summary>
|
||||
|
||||
#### What's fixed
|
||||
|
||||
- **misc**: Fix missing provider in server message, closes [#9361](https://github.com/lobehub/lobe-chat/issues/9361) ([4099dfd](https://github.com/lobehub/lobe-chat/commit/4099dfd))
|
||||
|
||||
</details>
|
||||
|
||||
<div align="right">
|
||||
|
||||
[](#readme-top)
|
||||
|
||||
</div>
|
||||
|
||||
## [Version 1.132.0](https://github.com/lobehub/lobe-chat/compare/v1.131.4...v1.132.0)
|
||||
|
||||
<sup>Released on **2025-09-21**</sup>
|
||||
|
||||
#### ✨ Features
|
||||
|
||||
- **misc**: Support google video understanding.
|
||||
|
||||
<br/>
|
||||
|
||||
<details>
|
||||
<summary><kbd>Improvements and Fixes</kbd></summary>
|
||||
|
||||
#### What's improved
|
||||
|
||||
- **misc**: Support google video understanding, closes [#8761](https://github.com/lobehub/lobe-chat/issues/8761) ([f02d43b](https://github.com/lobehub/lobe-chat/commit/f02d43b))
|
||||
|
||||
</details>
|
||||
|
||||
<div align="right">
|
||||
|
||||
[](#readme-top)
|
||||
|
||||
</div>
|
||||
|
||||
### [Version 1.131.4](https://github.com/lobehub/lobe-chat/compare/v1.131.3...v1.131.4)
|
||||
|
||||
<sup>Released on **2025-09-21**</sup>
|
||||
|
||||
#### 💄 Styles
|
||||
|
||||
- **misc**: Enhanced AkashChat experience.
|
||||
|
||||
<br/>
|
||||
|
||||
<details>
|
||||
<summary><kbd>Improvements and Fixes</kbd></summary>
|
||||
|
||||
#### Styles
|
||||
|
||||
- **misc**: Enhanced AkashChat experience, closes [#9330](https://github.com/lobehub/lobe-chat/issues/9330) ([47ec2d8](https://github.com/lobehub/lobe-chat/commit/47ec2d8))
|
||||
|
||||
</details>
|
||||
|
||||
<div align="right">
|
||||
|
||||
[](#readme-top)
|
||||
|
||||
</div>
|
||||
|
||||
### [Version 1.131.3](https://github.com/lobehub/lobe-chat/compare/v1.131.2...v1.131.3)
|
||||
|
||||
<sup>Released on **2025-09-21**</sup>
|
||||
|
||||
#### 🐛 Bug Fixes
|
||||
|
||||
- **misc**: Update Responses search tool to web_search.
|
||||
|
||||
<br/>
|
||||
|
||||
<details>
|
||||
<summary><kbd>Improvements and Fixes</kbd></summary>
|
||||
|
||||
#### What's fixed
|
||||
|
||||
- **misc**: Update Responses search tool to web_search, closes [#9354](https://github.com/lobehub/lobe-chat/issues/9354) ([58d34ff](https://github.com/lobehub/lobe-chat/commit/58d34ff))
|
||||
|
||||
</details>
|
||||
|
||||
<div align="right">
|
||||
|
||||
[](#readme-top)
|
||||
|
||||
</div>
|
||||
|
||||
### [Version 1.131.2](https://github.com/lobehub/lobe-chat/compare/v1.131.1...v1.131.2)
|
||||
|
||||
<sup>Released on **2025-09-21**</sup>
|
||||
|
||||
#### 💄 Styles
|
||||
|
||||
- **misc**: Use ID as name if provider name is empty.
|
||||
|
||||
<br/>
|
||||
|
||||
<details>
|
||||
<summary><kbd>Improvements and Fixes</kbd></summary>
|
||||
|
||||
#### Styles
|
||||
|
||||
- **misc**: Use ID as name if provider name is empty, closes [#9356](https://github.com/lobehub/lobe-chat/issues/9356) ([7f60544](https://github.com/lobehub/lobe-chat/commit/7f60544))
|
||||
|
||||
</details>
|
||||
|
||||
<div align="right">
|
||||
|
||||
[](#readme-top)
|
||||
|
||||
</div>
|
||||
|
||||
### [Version 1.131.1](https://github.com/lobehub/lobe-chat/compare/v1.131.0...v1.131.1)
|
||||
|
||||
<sup>Released on **2025-09-21**</sup>
|
||||
|
||||
#### ♻ Code Refactoring
|
||||
|
||||
- **misc**: Improve codebase.
|
||||
|
||||
#### 💄 Styles
|
||||
|
||||
- **misc**: Extend custom provider runtime options, Optimized modelFetch for Vercel AI Gateway, update i18n.
|
||||
|
||||
<br/>
|
||||
|
||||
<details>
|
||||
<summary><kbd>Improvements and Fixes</kbd></summary>
|
||||
|
||||
#### Code refactoring
|
||||
|
||||
- **misc**: Improve codebase, closes [#9353](https://github.com/lobehub/lobe-chat/issues/9353) ([7dc000e](https://github.com/lobehub/lobe-chat/commit/7dc000e))
|
||||
|
||||
#### Styles
|
||||
|
||||
- **misc**: Extend custom provider runtime options, closes [#9278](https://github.com/lobehub/lobe-chat/issues/9278) ([a94e881](https://github.com/lobehub/lobe-chat/commit/a94e881))
|
||||
- **misc**: Optimized modelFetch for Vercel AI Gateway, closes [#9342](https://github.com/lobehub/lobe-chat/issues/9342) ([45b7a43](https://github.com/lobehub/lobe-chat/commit/45b7a43))
|
||||
- **misc**: Update i18n, closes [#9338](https://github.com/lobehub/lobe-chat/issues/9338) ([d2ff75c](https://github.com/lobehub/lobe-chat/commit/d2ff75c))
|
||||
|
||||
</details>
|
||||
|
||||
<div align="right">
|
||||
|
||||
[](#readme-top)
|
||||
|
||||
</div>
|
||||
|
||||
## [Version 1.131.0](https://github.com/lobehub/lobe-chat/compare/v1.130.1...v1.131.0)
|
||||
|
||||
<sup>Released on **2025-09-19**</sup>
|
||||
|
||||
#### ✨ Features
|
||||
|
||||
- **misc**: Qwen provider add qwen-image-edit model support.
|
||||
|
||||
<br/>
|
||||
|
||||
<details>
|
||||
<summary><kbd>Improvements and Fixes</kbd></summary>
|
||||
|
||||
#### What's improved
|
||||
|
||||
- **misc**: Qwen provider add qwen-image-edit model support, closes [#9311](https://github.com/lobehub/lobe-chat/issues/9311) ([a0074fc](https://github.com/lobehub/lobe-chat/commit/a0074fc))
|
||||
|
||||
</details>
|
||||
|
||||
<div align="right">
|
||||
|
||||
[](#readme-top)
|
||||
|
||||
</div>
|
||||
|
||||
### [Version 1.130.1](https://github.com/lobehub/lobe-chat/compare/v1.130.0...v1.130.1)
|
||||
|
||||
<sup>Released on **2025-09-18**</sup>
|
||||
|
||||
#### 🐛 Bug Fixes
|
||||
|
||||
- **misc**: Fix oidc open direct issue.
|
||||
|
||||
<br/>
|
||||
|
||||
<details>
|
||||
<summary><kbd>Improvements and Fixes</kbd></summary>
|
||||
|
||||
#### What's fixed
|
||||
|
||||
- **misc**: Fix oidc open direct issue, closes [#9315](https://github.com/lobehub/lobe-chat/issues/9315) ([70f52a3](https://github.com/lobehub/lobe-chat/commit/70f52a3))
|
||||
|
||||
</details>
|
||||
|
||||
<div align="right">
|
||||
|
||||
[](#readme-top)
|
||||
|
||||
</div>
|
||||
|
||||
## [Version 1.130.0](https://github.com/lobehub/lobe-chat/compare/v1.129.4...v1.130.0)
|
||||
|
||||
<sup>Released on **2025-09-18**</sup>
|
||||
|
||||
+2
-2
@@ -1,5 +1,5 @@
|
||||
## Set global build ENV
|
||||
ARG NODEJS_VERSION="22"
|
||||
ARG NODEJS_VERSION="24"
|
||||
|
||||
## Base image for all building stages
|
||||
FROM node:${NODEJS_VERSION}-slim AS base
|
||||
@@ -126,7 +126,7 @@ ENV NODE_ENV="production" \
|
||||
NODE_OPTIONS="--dns-result-order=ipv4first --use-openssl-ca" \
|
||||
NODE_EXTRA_CA_CERTS="" \
|
||||
NODE_TLS_REJECT_UNAUTHORIZED="" \
|
||||
SSL_CERT_DIR="/etc/ssl/certs/ca-certificates.crt"
|
||||
SSL_CERT_FILE="/etc/ssl/certs/ca-certificates.crt"
|
||||
|
||||
# Make the middleware rewrite through local as default
|
||||
# refs: https://github.com/lobehub/lobe-chat/issues/5876
|
||||
|
||||
+2
-2
@@ -1,5 +1,5 @@
|
||||
## Set global build ENV
|
||||
ARG NODEJS_VERSION="22"
|
||||
ARG NODEJS_VERSION="24"
|
||||
|
||||
## Base image for all building stages
|
||||
FROM node:${NODEJS_VERSION}-slim AS base
|
||||
@@ -149,7 +149,7 @@ ENV NODE_ENV="production" \
|
||||
NODE_OPTIONS="--dns-result-order=ipv4first --use-openssl-ca" \
|
||||
NODE_EXTRA_CA_CERTS="" \
|
||||
NODE_TLS_REJECT_UNAUTHORIZED="" \
|
||||
SSL_CERT_DIR="/etc/ssl/certs/ca-certificates.crt"
|
||||
SSL_CERT_FILE="/etc/ssl/certs/ca-certificates.crt"
|
||||
|
||||
# Make the middleware rewrite through local as default
|
||||
# refs: https://github.com/lobehub/lobe-chat/issues/5876
|
||||
|
||||
+2
-2
@@ -1,5 +1,5 @@
|
||||
## Set global build ENV
|
||||
ARG NODEJS_VERSION="22"
|
||||
ARG NODEJS_VERSION="24"
|
||||
|
||||
## Base image for all building stages
|
||||
FROM node:${NODEJS_VERSION}-slim AS base
|
||||
@@ -128,7 +128,7 @@ ENV NODE_ENV="production" \
|
||||
NODE_OPTIONS="--dns-result-order=ipv4first --use-openssl-ca" \
|
||||
NODE_EXTRA_CA_CERTS="" \
|
||||
NODE_TLS_REJECT_UNAUTHORIZED="" \
|
||||
SSL_CERT_DIR="/etc/ssl/certs/ca-certificates.crt"
|
||||
SSL_CERT_FILE="/etc/ssl/certs/ca-certificates.crt"
|
||||
|
||||
# Make the middleware rewrite through local as default
|
||||
# refs: https://github.com/lobehub/lobe-chat/issues/5876
|
||||
|
||||
@@ -1,10 +1,10 @@
|
||||
Apache License Version 2.0
|
||||
LobeHub Community License
|
||||
|
||||
Copyright (c) 2024/06/17 - current LobeHub LLC. All rights reserved.
|
||||
|
||||
----------
|
||||
|
||||
From 1.0, LobeChat is licensed under the Apache License 2.0, with the following additional conditions:
|
||||
From 1.0, LobeChat is licensed under the LobeHub Community License, based on Apache License 2.0 with the following additional conditions:
|
||||
|
||||
1. The commercial usage of LobeChat:
|
||||
|
||||
@@ -22,17 +22,3 @@ Please contact hello@lobehub.com by email to inquire about licensing matters.
|
||||
b. Your contributed code may be used for commercial purposes, including but not limited to its cloud edition.
|
||||
|
||||
Apart from the specific conditions mentioned above, all other rights and restrictions follow the Apache License 2.0. Detailed information about the Apache License 2.0 can be found at http://www.apache.org/licenses/LICENSE-2.0.
|
||||
|
||||
----------
|
||||
|
||||
Licensed under the Apache License, Version 2.0 (the "License");
|
||||
you may not use this file except in compliance with the License.
|
||||
You may obtain a copy of the License at
|
||||
|
||||
http://www.apache.org/licenses/LICENSE-2.0
|
||||
|
||||
Unless required by applicable law or agreed to in writing, software
|
||||
distributed under the License is distributed on an "AS IS" BASIS,
|
||||
WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
|
||||
See the License for the specific language governing permissions and
|
||||
limitations under the License.
|
||||
|
||||
@@ -382,14 +382,14 @@ In addition, these plugins are not limited to news aggregation, but can also ext
|
||||
|
||||
<!-- PLUGIN LIST -->
|
||||
|
||||
| Recent Submits | Description |
|
||||
| ---------------------------------------------------------------------------------------------------------------------------- | ----------------------------------------------------------------------------------------------------------------------- |
|
||||
| [PortfolioMeta](https://lobechat.com/discover/plugin/StockData)<br/><sup>By **portfoliometa** on **2025-07-21**</sup> | Analyze stocks and get comprehensive real-time investment data and analytics.<br/>`stock` |
|
||||
| [Web](https://lobechat.com/discover/plugin/web)<br/><sup>By **Proghit** on **2025-01-24**</sup> | Smart web search that reads and analyzes pages to deliver comprehensive answers from Google results.<br/>`web` `search` |
|
||||
| [Bing_websearch](https://lobechat.com/discover/plugin/Bingsearch-identifier)<br/><sup>By **FineHow** on **2024-12-22**</sup> | Search for information from the internet base BingApi<br/>`bingsearch` |
|
||||
| [Google CSE](https://lobechat.com/discover/plugin/google-cse)<br/><sup>By **vsnthdev** on **2024-12-02**</sup> | Searches Google through their official CSE API.<br/>`web` `search` |
|
||||
| Recent Submits | Description |
|
||||
| ----------------------------------------------------------------------------------------------------------------------------------------- | -------------------------------------------------------------------------------------------------------------------------- |
|
||||
| [Web](https://lobechat.com/discover/plugin/web)<br/><sup>By **Proghit** on **2025-01-24**</sup> | Smart web search that reads and analyzes pages to deliver comprehensive answers from Google results.<br/>`web` `search` |
|
||||
| [Bing_websearch](https://lobechat.com/discover/plugin/Bingsearch-identifier)<br/><sup>By **FineHow** on **2024-12-22**</sup> | Search for information from the internet base BingApi<br/>`bingsearch` |
|
||||
| [Google CSE](https://lobechat.com/discover/plugin/google-cse)<br/><sup>By **vsnthdev** on **2024-12-02**</sup> | Searches Google through their official CSE API.<br/>`web` `search` |
|
||||
| [Tongyi wanxiang Image Generator](https://lobechat.com/discover/plugin/alps-tongyi-image)<br/><sup>By **YoungTx** on **2024-08-09**</sup> | This plugin uses Alibaba's Tongyi Wanxiang model to generate images based on text prompts.<br/>`image` `tongyi` `wanxiang` |
|
||||
|
||||
> 📊 Total plugins: [<kbd>**42**</kbd>](https://lobechat.com/discover/plugins)
|
||||
> 📊 Total plugins: [<kbd>**41**</kbd>](https://lobechat.com/discover/plugins)
|
||||
|
||||
<!-- PLUGIN LIST -->
|
||||
|
||||
@@ -819,7 +819,7 @@ Every bit counts and your one-time donation sparkles in our galaxy of support! Y
|
||||
</details>
|
||||
|
||||
Copyright © 2025 [LobeHub][profile-link]. <br />
|
||||
This project is [Apache 2.0](./LICENSE) licensed.
|
||||
This project is [LobeHub Community License](./LICENSE) licensed.
|
||||
|
||||
<!-- LINK GROUP -->
|
||||
|
||||
|
||||
+8
-8
@@ -375,14 +375,14 @@ LobeChat 的插件生态系统是其核心功能的重要扩展,它极大地
|
||||
|
||||
<!-- PLUGIN LIST -->
|
||||
|
||||
| 最近新增 | 描述 |
|
||||
| -------------------------------------------------------------------------------------------------------------------------- | ---------------------------------------------------------------------------------- |
|
||||
| [PortfolioMeta](https://lobechat.com/discover/plugin/StockData)<br/><sup>By **portfoliometa** on **2025-07-21**</sup> | 分析股票并获取全面的实时投资数据和分析。<br/>`股票` |
|
||||
| [网页](https://lobechat.com/discover/plugin/web)<br/><sup>By **Proghit** on **2025-01-24**</sup> | 智能网页搜索,读取和分析页面,以提供来自 Google 结果的全面答案。<br/>`网页` `搜索` |
|
||||
| [必应网页搜索](https://lobechat.com/discover/plugin/Bingsearch-identifier)<br/><sup>By **FineHow** on **2024-12-22**</sup> | 通过 BingApi 搜索互联网上的信息<br/>`bingsearch` |
|
||||
| [谷歌自定义搜索引擎](https://lobechat.com/discover/plugin/google-cse)<br/><sup>By **vsnthdev** on **2024-12-02**</sup> | 通过他们的官方自定义搜索引擎 API 搜索谷歌。<br/>`网络` `搜索` |
|
||||
| 最近新增 | 描述 |
|
||||
| ---------------------------------------------------------------------------------------------------------------------------- | ---------------------------------------------------------------------------------- |
|
||||
| [网页](https://lobechat.com/discover/plugin/web)<br/><sup>By **Proghit** on **2025-01-24**</sup> | 智能网页搜索,读取和分析页面,以提供来自 Google 结果的全面答案。<br/>`网页` `搜索` |
|
||||
| [必应网页搜索](https://lobechat.com/discover/plugin/Bingsearch-identifier)<br/><sup>By **FineHow** on **2024-12-22**</sup> | 通过 BingApi 搜索互联网上的信息<br/>`bingsearch` |
|
||||
| [谷歌自定义搜索引擎](https://lobechat.com/discover/plugin/google-cse)<br/><sup>By **vsnthdev** on **2024-12-02**</sup> | 通过他们的官方自定义搜索引擎 API 搜索谷歌。<br/>`网络` `搜索` |
|
||||
| [通义万象图像生成器](https://lobechat.com/discover/plugin/alps-tongyi-image)<br/><sup>By **YoungTx** on **2024-08-09**</sup> | 此插件使用阿里巴巴的通义万象模型根据文本提示生成图像。<br/>`图像` `通义` `万象` |
|
||||
|
||||
> 📊 Total plugins: [<kbd>**42**</kbd>](https://lobechat.com/discover/plugins)
|
||||
> 📊 Total plugins: [<kbd>**41**</kbd>](https://lobechat.com/discover/plugins)
|
||||
|
||||
<!-- PLUGIN LIST -->
|
||||
|
||||
@@ -840,7 +840,7 @@ $ pnpm run dev
|
||||
</details>
|
||||
|
||||
Copyright © 2025 [LobeHub][profile-link]. <br />
|
||||
This project is [Apache 2.0](./LICENSE) licensed.
|
||||
This project is [LobeHub Community License](./LICENSE) licensed.
|
||||
|
||||
<!-- LINK GROUP -->
|
||||
|
||||
|
||||
@@ -7,6 +7,7 @@ const packageJSON = require('./package.json');
|
||||
|
||||
const channel = process.env.UPDATE_CHANNEL;
|
||||
const arch = os.arch();
|
||||
const hasAppleCertificate = Boolean(process.env.CSC_LINK);
|
||||
|
||||
console.log(`🚄 Build Version ${packageJSON.version}, Channel: ${channel}`);
|
||||
console.log(`🏗️ Building for architecture: ${arch}`);
|
||||
@@ -14,6 +15,13 @@ console.log(`🏗️ Building for architecture: ${arch}`);
|
||||
const isNightly = channel === 'nightly';
|
||||
const isBeta = packageJSON.name.includes('beta');
|
||||
|
||||
// https://www.electron.build/code-signing-mac#how-to-disable-code-signing-during-the-build-process-on-macos
|
||||
if (!hasAppleCertificate) {
|
||||
// Disable auto discovery to keep electron-builder from searching unavailable signing identities
|
||||
process.env.CSC_IDENTITY_AUTO_DISCOVERY = 'false';
|
||||
console.log('⚠️ Apple certificate link not found, macOS artifacts will be unsigned.');
|
||||
}
|
||||
|
||||
// 根据版本类型确定协议 scheme
|
||||
const getProtocolScheme = () => {
|
||||
if (isNightly) return 'lobehub-nightly';
|
||||
@@ -87,8 +95,9 @@ const config = {
|
||||
NSMicrophoneUsageDescription: "Application requests access to the device's microphone.",
|
||||
},
|
||||
gatekeeperAssess: false,
|
||||
hardenedRuntime: true,
|
||||
notarize: true,
|
||||
hardenedRuntime: hasAppleCertificate,
|
||||
notarize: hasAppleCertificate,
|
||||
...(hasAppleCertificate ? {} : { identity: null }),
|
||||
target:
|
||||
// 降低构建时间,nightly 只打 dmg
|
||||
// 根据当前机器架构只构建对应架构的包
|
||||
|
||||
@@ -1,9 +1,9 @@
|
||||
import { beforeEach, describe, expect, it, vi, Mock } from 'vitest';
|
||||
import { InterceptRouteParams } from '@lobechat/electron-client-ipc';
|
||||
import { Mock, beforeEach, describe, expect, it, vi } from 'vitest';
|
||||
|
||||
import { AppBrowsersIdentifiers, BrowsersIdentifiers } from '@/appBrowsers';
|
||||
import type { App } from '@/core/App';
|
||||
import type { IpcClientEventSender } from '@/types/ipcClientEvent';
|
||||
import { BrowsersIdentifiers, AppBrowsersIdentifiers } from '@/appBrowsers';
|
||||
|
||||
import BrowserWindowsCtr from '../BrowserWindowsCtr';
|
||||
|
||||
@@ -33,12 +33,14 @@ const mockApp = {
|
||||
closeWindow: mockCloseWindow,
|
||||
minimizeWindow: mockMinimizeWindow,
|
||||
maximizeWindow: mockMaximizeWindow,
|
||||
retrieveByIdentifier: mockRetrieveByIdentifier.mockImplementation((identifier: AppBrowsersIdentifiers | string) => {
|
||||
if (identifier === BrowsersIdentifiers.settings || identifier === 'some-other-window') {
|
||||
return { show: mockShow };
|
||||
}
|
||||
return { show: mockShow }; // Default mock for other identifiers
|
||||
}),
|
||||
retrieveByIdentifier: mockRetrieveByIdentifier.mockImplementation(
|
||||
(identifier: AppBrowsersIdentifiers | string) => {
|
||||
if (identifier === BrowsersIdentifiers.settings || identifier === 'some-other-window') {
|
||||
return { show: mockShow };
|
||||
}
|
||||
return { show: mockShow }; // Default mock for other identifiers
|
||||
},
|
||||
),
|
||||
},
|
||||
} as unknown as App;
|
||||
|
||||
@@ -104,7 +106,11 @@ describe('BrowserWindowsCtr', () => {
|
||||
const baseParams = { source: 'link-click' as const };
|
||||
|
||||
it('should not intercept if no matching route is found', async () => {
|
||||
const params: InterceptRouteParams = { ...baseParams, path: '/unknown/route', url: 'app://host/unknown/route' };
|
||||
const params: InterceptRouteParams = {
|
||||
...baseParams,
|
||||
path: '/unknown/route',
|
||||
url: 'app://host/unknown/route',
|
||||
};
|
||||
(findMatchingRoute as Mock).mockReturnValue(undefined);
|
||||
const result = await browserWindowsCtr.interceptRoute(params);
|
||||
expect(findMatchingRoute).toHaveBeenCalledWith(params.path);
|
||||
@@ -112,7 +118,11 @@ describe('BrowserWindowsCtr', () => {
|
||||
});
|
||||
|
||||
it('should show settings window if matched route target is settings', async () => {
|
||||
const params: InterceptRouteParams = { ...baseParams, path: '/settings/common', url: 'app://host/settings/common' };
|
||||
const params: InterceptRouteParams = {
|
||||
...baseParams,
|
||||
path: '/settings?active=common',
|
||||
url: 'app://host/settings?active=common',
|
||||
};
|
||||
const matchedRoute = { targetWindow: BrowsersIdentifiers.settings, pathPrefix: '/settings' };
|
||||
const subPath = 'common';
|
||||
(findMatchingRoute as Mock).mockReturnValue(matchedRoute);
|
||||
@@ -134,7 +144,11 @@ describe('BrowserWindowsCtr', () => {
|
||||
});
|
||||
|
||||
it('should open target window if matched route target is not settings', async () => {
|
||||
const params: InterceptRouteParams = { ...baseParams, path: '/other/page', url: 'app://host/other/page' };
|
||||
const params: InterceptRouteParams = {
|
||||
...baseParams,
|
||||
path: '/other/page',
|
||||
url: 'app://host/other/page',
|
||||
};
|
||||
const targetWindowIdentifier = 'some-other-window' as AppBrowsersIdentifiers;
|
||||
const matchedRoute = { targetWindow: targetWindowIdentifier, pathPrefix: '/other' };
|
||||
(findMatchingRoute as Mock).mockReturnValue(matchedRoute);
|
||||
@@ -154,7 +168,11 @@ describe('BrowserWindowsCtr', () => {
|
||||
});
|
||||
|
||||
it('should return error if processing route interception fails for settings', async () => {
|
||||
const params: InterceptRouteParams = { ...baseParams, path: '/settings/general', url: 'app://host/settings/general' };
|
||||
const params: InterceptRouteParams = {
|
||||
...baseParams,
|
||||
path: '/settings?active=general',
|
||||
url: 'app://host/settings?active=general',
|
||||
};
|
||||
const matchedRoute = { targetWindow: BrowsersIdentifiers.settings, pathPrefix: '/settings' };
|
||||
const subPath = 'general';
|
||||
const errorMessage = 'Processing error for settings';
|
||||
@@ -173,7 +191,11 @@ describe('BrowserWindowsCtr', () => {
|
||||
});
|
||||
|
||||
it('should return error if processing route interception fails for other window', async () => {
|
||||
const params: InterceptRouteParams = { ...baseParams, path: '/another/custom', url: 'app://host/another/custom' };
|
||||
const params: InterceptRouteParams = {
|
||||
...baseParams,
|
||||
path: '/another/custom',
|
||||
url: 'app://host/another/custom',
|
||||
};
|
||||
const targetWindowIdentifier = 'another-custom-window' as AppBrowsersIdentifiers;
|
||||
const matchedRoute = { targetWindow: targetWindowIdentifier, pathPrefix: '/another' };
|
||||
const errorMessage = 'Processing error for other window';
|
||||
@@ -192,4 +214,4 @@ describe('BrowserWindowsCtr', () => {
|
||||
});
|
||||
});
|
||||
});
|
||||
});
|
||||
});
|
||||
|
||||
@@ -1,4 +1,161 @@
|
||||
[
|
||||
{
|
||||
"children": {
|
||||
"fixes": ["Add proxyUrl configuration for NEW API provider."]
|
||||
},
|
||||
"date": "2025-09-25",
|
||||
"version": "1.132.15"
|
||||
},
|
||||
{
|
||||
"children": {
|
||||
"improvements": ["Update i18n."]
|
||||
},
|
||||
"date": "2025-09-25",
|
||||
"version": "1.132.14"
|
||||
},
|
||||
{
|
||||
"children": {},
|
||||
"date": "2025-09-25",
|
||||
"version": "1.132.13"
|
||||
},
|
||||
{
|
||||
"children": {
|
||||
"fixes": ["Slove setting proxy page with style error."]
|
||||
},
|
||||
"date": "2025-09-25",
|
||||
"version": "1.132.12"
|
||||
},
|
||||
{
|
||||
"children": {
|
||||
"improvements": [
|
||||
"Enhanced Nvidia NIM chat experience, OpenAI models in AiHubMix use Responses API."
|
||||
]
|
||||
},
|
||||
"date": "2025-09-24",
|
||||
"version": "1.132.11"
|
||||
},
|
||||
{
|
||||
"children": {
|
||||
"fixes": ["Macos desktop sign."]
|
||||
},
|
||||
"date": "2025-09-24",
|
||||
"version": "1.132.10"
|
||||
},
|
||||
{
|
||||
"children": {},
|
||||
"date": "2025-09-23",
|
||||
"version": "1.132.9"
|
||||
},
|
||||
{
|
||||
"children": {
|
||||
"improvements": ["Refactor all @/types in model runtime to @lobechat/types."]
|
||||
},
|
||||
"date": "2025-09-23",
|
||||
"version": "1.132.8"
|
||||
},
|
||||
{
|
||||
"children": {},
|
||||
"date": "2025-09-23",
|
||||
"version": "1.132.7"
|
||||
},
|
||||
{
|
||||
"children": {},
|
||||
"date": "2025-09-23",
|
||||
"version": "1.132.6"
|
||||
},
|
||||
{
|
||||
"children": {
|
||||
"improvements": ["Move the ModelProvider to model-bank."]
|
||||
},
|
||||
"date": "2025-09-22",
|
||||
"version": "1.132.5"
|
||||
},
|
||||
{
|
||||
"children": {
|
||||
"improvements": ["Enable thinkingBudget control for Vertex Gemini 2.5 models, update i18n."]
|
||||
},
|
||||
"date": "2025-09-22",
|
||||
"version": "1.132.4"
|
||||
},
|
||||
{
|
||||
"children": {
|
||||
"improvements": ["Added AUTH_MICROSOFT_ENTRA_ID_BASE_URL routing."]
|
||||
},
|
||||
"date": "2025-09-21",
|
||||
"version": "1.132.3"
|
||||
},
|
||||
{
|
||||
"children": {
|
||||
"fixes": ["Fix non stream mode in OpenAI Response API."]
|
||||
},
|
||||
"date": "2025-09-21",
|
||||
"version": "1.132.2"
|
||||
},
|
||||
{
|
||||
"children": {
|
||||
"fixes": ["Fix missing provider in server message."]
|
||||
},
|
||||
"date": "2025-09-21",
|
||||
"version": "1.132.1"
|
||||
},
|
||||
{
|
||||
"children": {
|
||||
"features": ["Support google video understanding."]
|
||||
},
|
||||
"date": "2025-09-21",
|
||||
"version": "1.132.0"
|
||||
},
|
||||
{
|
||||
"children": {
|
||||
"improvements": ["Enhanced AkashChat experience."]
|
||||
},
|
||||
"date": "2025-09-21",
|
||||
"version": "1.131.4"
|
||||
},
|
||||
{
|
||||
"children": {
|
||||
"fixes": ["Update Responses search tool to web_search."]
|
||||
},
|
||||
"date": "2025-09-21",
|
||||
"version": "1.131.3"
|
||||
},
|
||||
{
|
||||
"children": {
|
||||
"improvements": ["Use ID as name if provider name is empty."]
|
||||
},
|
||||
"date": "2025-09-21",
|
||||
"version": "1.131.2"
|
||||
},
|
||||
{
|
||||
"children": {
|
||||
"improvements": [
|
||||
"Extend custom provider runtime options, Optimized modelFetch for Vercel AI Gateway, update i18n."
|
||||
]
|
||||
},
|
||||
"date": "2025-09-21",
|
||||
"version": "1.131.1"
|
||||
},
|
||||
{
|
||||
"children": {
|
||||
"features": ["Qwen provider add qwen-image-edit model support."]
|
||||
},
|
||||
"date": "2025-09-19",
|
||||
"version": "1.131.0"
|
||||
},
|
||||
{
|
||||
"children": {
|
||||
"fixes": ["Fix oidc open direct issue."]
|
||||
},
|
||||
"date": "2025-09-18",
|
||||
"version": "1.130.1"
|
||||
},
|
||||
{
|
||||
"children": {
|
||||
"features": ["Add scroll support for pinned assistants using ScrollShadow."]
|
||||
},
|
||||
"date": "2025-09-18",
|
||||
"version": "1.130.0"
|
||||
},
|
||||
{
|
||||
"children": {
|
||||
"fixes": ["Fix svg xss issue."]
|
||||
|
||||
@@ -35,7 +35,7 @@ exporters:
|
||||
service:
|
||||
pipelines:
|
||||
metrics:
|
||||
receivers: [prometheus]
|
||||
receivers: [prometheus, otlp]
|
||||
exporters: [prometheusremotewrite]
|
||||
traces:
|
||||
receivers: [otlp]
|
||||
|
||||
@@ -138,6 +138,7 @@ table chat_groups {
|
||||
config jsonb
|
||||
client_id text
|
||||
user_id text [not null]
|
||||
group_id text
|
||||
pinned boolean [default: false]
|
||||
accessed_at "timestamp with time zone" [not null, default: `now()`]
|
||||
created_at "timestamp with time zone" [not null, default: `now()`]
|
||||
@@ -387,7 +388,7 @@ table message_translates {
|
||||
|
||||
table messages {
|
||||
id text [pk, not null]
|
||||
role text [not null]
|
||||
role varchar(255) [not null]
|
||||
content text
|
||||
reasoning jsonb
|
||||
search jsonb
|
||||
|
||||
@@ -34,15 +34,15 @@ CRAWLER_IMPLS="native,search1api"
|
||||
|
||||
Supported crawler types are listed below:
|
||||
|
||||
| Value | Description | Environment Variable |
|
||||
| ------------- | ------------------------------------------------------------------------------------------------------------------- | -------------------------- |
|
||||
| `browserless` | Headless browser crawler based on [Browserless](https://www.browserless.io/), suitable for rendering complex pages. | `BROWSERLESS_TOKEN` |
|
||||
| `exa` | Crawler capabilities provided by [Exa](https://exa.ai/), API required. | `EXA_API_KEY` |
|
||||
| `firecrawl` | [Firecrawl](https://firecrawl.dev/) headless browser API, ideal for modern websites. | `FIRECRAWL_API_KEY` |
|
||||
| `jina` | Crawler service from [Jina AI](https://jina.ai/), supports fast content summarization. | `JINA_READER_API_KEY` |
|
||||
| `native` | Built-in general-purpose crawler for standard web structures. | |
|
||||
| `search1api` | Page crawling capabilities from [Search1API](https://www.search1api.com), great for structured content extraction. | `SEARCH1API_CRAWL_API_KEY` |
|
||||
| `tavily` | Web scraping and summarization API from [Tavily](https://www.tavily.com/). | `TAVILY_API_KEY` |
|
||||
| Value | Description | Environment Variable |
|
||||
| ------------- | ------------------------------------------------------------------------------------------------------------------- | ---------------------------------------------------------------------------- |
|
||||
| `browserless` | Headless browser crawler based on [Browserless](https://www.browserless.io/), suitable for rendering complex pages. | `BROWSERLESS_TOKEN` |
|
||||
| `exa` | Crawler capabilities provided by [Exa](https://exa.ai/), API required. | `EXA_API_KEY` |
|
||||
| `firecrawl` | [Firecrawl](https://firecrawl.dev/) headless browser API, ideal for modern websites. | `FIRECRAWL_API_KEY` |
|
||||
| `jina` | Crawler service from [Jina AI](https://jina.ai/), supports fast content summarization. | `JINA_READER_API_KEY` |
|
||||
| `native` | Built-in general-purpose crawler for standard web structures. | |
|
||||
| `search1api` | Page crawling capabilities from [Search1API](https://www.search1api.com), great for structured content extraction. | `SEARCH1API_API_KEY` `SEARCH1API_CRAWL_API_KEY` `SEARCH1API_SEARCH_API_KEY` |
|
||||
| `tavily` | Web scraping and summarization API from [Tavily](https://www.tavily.com/). | `TAVILY_API_KEY` |
|
||||
|
||||
> 💡 Setting multiple crawlers increases success rate; the system will try different ones based on priority.
|
||||
|
||||
@@ -58,19 +58,19 @@ SEARCH_PROVIDERS="searxng"
|
||||
|
||||
Supported search engines include:
|
||||
|
||||
| Value | Description | Environment Variable |
|
||||
| ------------ | --------------------------------------------------------------------------------------- | ------------------------------------------- |
|
||||
| `anspire` | Search service provided by [Anspire](https://anspire.ai/). | `ANSPIRE_API_KEY` |
|
||||
| `bocha` | Search service from [Bocha](https://open.bochaai.com/). | `BOCHA_API_KEY` |
|
||||
| `brave` | [Brave](https://search.brave.com/help/api), a privacy-friendly search source. | `BRAVE_API_KEY` |
|
||||
| `exa` | [Exa](https://exa.ai/), a search API designed for AI. | `EXA_API_KEY` |
|
||||
| `firecrawl` | Search capabilities via [Firecrawl](https://firecrawl.dev/). | `FIRECRAWL_API_KEY` |
|
||||
| `google` | Uses [Google Programmable Search Engine](https://programmablesearchengine.google.com/). | `GOOGLE_PSE_API_KEY` `GOOGLE_PSE_ENGINE_ID` |
|
||||
| `jina` | Semantic search provided by [Jina AI](https://jina.ai/). | `JINA_READER_API_KEY` |
|
||||
| `kagi` | Premium search API by [Kagi](https://kagi.com/), requires a subscription key. | `KAGI_API_KEY` |
|
||||
| `search1api` | Aggregated search capabilities from [Search1API](https://www.search1api.com). | `SEARCH1API_CRAWL_API_KEY` |
|
||||
| `searxng` | Use a self-hosted or public [SearXNG](https://searx.space/) instance. | `SEARXNG_URL` |
|
||||
| `tavily` | [Tavily](https://www.tavily.com/), offers fast web summaries and answers. | `TAVILY_API_KEY` |
|
||||
| Value | Description | Environment Variable |
|
||||
| ------------ | --------------------------------------------------------------------------------------- | ---------------------------------------------------------------------------- |
|
||||
| `anspire` | Search service provided by [Anspire](https://anspire.ai/). | `ANSPIRE_API_KEY` |
|
||||
| `bocha` | Search service from [Bocha](https://open.bochaai.com/). | `BOCHA_API_KEY` |
|
||||
| `brave` | [Brave](https://search.brave.com/help/api), a privacy-friendly search source. | `BRAVE_API_KEY` |
|
||||
| `exa` | [Exa](https://exa.ai/), a search API designed for AI. | `EXA_API_KEY` |
|
||||
| `firecrawl` | Search capabilities via [Firecrawl](https://firecrawl.dev/). | `FIRECRAWL_API_KEY` |
|
||||
| `google` | Uses [Google Programmable Search Engine](https://programmablesearchengine.google.com/). | `GOOGLE_PSE_API_KEY` `GOOGLE_PSE_ENGINE_ID` |
|
||||
| `jina` | Semantic search provided by [Jina AI](https://jina.ai/). | `JINA_READER_API_KEY` |
|
||||
| `kagi` | Premium search API by [Kagi](https://kagi.com/), requires a subscription key. | `KAGI_API_KEY` |
|
||||
| `search1api` | Aggregated search capabilities from [Search1API](https://www.search1api.com). | `SEARCH1API_API_KEY` `SEARCH1API_CRAWL_API_KEY` `SEARCH1API_SEARCH_API_KEY` |
|
||||
| `searxng` | Use a self-hosted or public [SearXNG](https://searx.space/) instance. | `SEARXNG_URL` |
|
||||
| `tavily` | [Tavily](https://www.tavily.com/), offers fast web summaries and answers. | `TAVILY_API_KEY` |
|
||||
|
||||
> ⚠️ Some search providers require you to apply for an API Key and configure it in your `.env` file.
|
||||
|
||||
|
||||
@@ -37,7 +37,7 @@ CRAWLER_IMPLS="native,search1api"
|
||||
| `firecrawl` | [Firecrawl](https://firecrawl.dev/) 无头浏览器 API,适合现代网站抓取。 | `FIRECRAWL_API_KEY` |
|
||||
| `jina` | 使用 [Jina AI](https://jina.ai/) 的爬虫服务,支持快速提取摘要信息。 | `JINA_READER_API_KEY` |
|
||||
| `native` | 内置通用爬虫,适用于标准网页结构。 | |
|
||||
| `search1api` | 利用 [Search1API](https://www.search1api.com) 提供的页面抓取能力,适合结构化内容提取。 | `SEARCH1API_CRAWL_API_KEY` |
|
||||
| `search1api` | 利用 [Search1API](https://www.search1api.com) 提供的页面抓取能力,适合结构化内容提取。 | `SEARCH1API_API_KEY` `SEARCH1API_CRAWL_API_KEY` `SEARCH1API_SEARCH_API_KEY` |
|
||||
| `tavily` | 使用 [Tavily](https://www.tavily.com/) 的网页抓取与摘要 API。 | `TAVILY_API_KEY` |
|
||||
|
||||
> 💡 设置多个爬虫可提升成功率,系统将根据优先级尝试不同爬虫。
|
||||
@@ -64,7 +64,7 @@ SEARCH_PROVIDERS="searxng"
|
||||
| `google` | 使用 [Google Programmable Search Engine](https://programmablesearchengine.google.com/)。 | `GOOGLE_PSE_API_KEY` `GOOGLE_PSE_ENGINE_ID` |
|
||||
| `jina` | 使用 [Jina AI](https://jina.ai/) 提供的语义搜索服务。 | `JINA_READER_API_KEY` |
|
||||
| `kagi` | [Kagi](https://kagi.com/) 提供的高级搜索 API,需订阅 Key。 | `KAGI_API_KEY` |
|
||||
| `search1api` | 使用 [Search1API](https://www.search1api.com) 聚合搜索能力。 | `SEARCH1API_CRAWL_API_KEY` |
|
||||
| `search1api` | 使用 [Search1API](https://www.search1api.com) 聚合搜索能力。 | `SEARCH1API_API_KEY` `SEARCH1API_CRAWL_API_KEY` `SEARCH1API_SEARCH_API_KEY` |
|
||||
| `searxng` | 使用自托管或公共 [SearXNG](https://searx.space/) 实例。 | `SEARXNG_URL` |
|
||||
| `tavily` | [Tavily](https://www.tavily.com/),快速网页摘要与答案返回。 | `TAVILY_API_KEY` |
|
||||
|
||||
|
||||
@@ -205,6 +205,13 @@ LobeChat provides a complete authentication service capability when deployed. Th
|
||||
|
||||
### Microsoft Entra ID
|
||||
|
||||
#### `AUTH_MICROSOFT_ENTRA_ID_BASE_URL`
|
||||
|
||||
- Type: Required
|
||||
- Description: - Description: Base URL for Azure login. Use when authenticating against other Microsoft sovereignty clouds like Azure US Government.
|
||||
- Default: `https://login.microsoftonline.com`
|
||||
- Example: `https://login.microsoftonline.us`
|
||||
|
||||
#### `AUTH_AZURE_AD_ID`
|
||||
|
||||
- Type: Required
|
||||
|
||||
@@ -145,6 +145,13 @@ For specific content, please refer to the [Feature Flags](/docs/self-hosting/adv
|
||||
- Default: `0`
|
||||
- Example: `1` or `0`
|
||||
|
||||
### `NEXT_PUBLIC_ASSET_PREFIX`
|
||||
|
||||
- Type: Optional
|
||||
- Description: The path access prefix for static resources can be set to the URL for CDN access. For more details, please refer to: [assetPrefix](https://nextjs.org/docs/app/api-reference/config/next-config-js/assetPrefix)
|
||||
- Default: -
|
||||
- Example: `https://cdn.example.com`
|
||||
|
||||
## Plugin Service
|
||||
|
||||
### `PLUGINS_INDEX_URL`
|
||||
|
||||
@@ -141,6 +141,13 @@ LobeChat 在部署时提供了一些额外的配置项,你可以使用环境
|
||||
- 默认值:`0`
|
||||
- 示例:`1` 或 `0`
|
||||
|
||||
### `NEXT_PUBLIC_ASSET_PREFIX`
|
||||
|
||||
- 类型:可选
|
||||
- 描述:静态资源的路径访问前缀,你可以设置为 CDN 访问的 URL,具体可参考: [assetPrefix](https://nextjs.org/docs/app/api-reference/config/next-config-js/assetPrefix)
|
||||
- 默认值:-
|
||||
- 示例:`https://cdn.example.com`
|
||||
|
||||
## 插件服务
|
||||
|
||||
### `PLUGINS_INDEX_URL`
|
||||
|
||||
@@ -281,6 +281,7 @@
|
||||
"actionFiletip": "رفع ملف",
|
||||
"actionTooltip": "رفع",
|
||||
"disabled": "النموذج الحالي لا يدعم التعرف على الصور وتحليل الملفات، يرجى تغيير النموذج لاستخدامه",
|
||||
"fileNotSupported": "وضع المتصفح لا يدعم تحميل الملفات حاليًا، يدعم الصور فقط",
|
||||
"visionNotSupported": "النموذج الحالي لا يدعم التعرف البصري، يرجى تبديل النموذج لاستخدام هذه الميزة"
|
||||
},
|
||||
"preview": {
|
||||
@@ -289,6 +290,9 @@
|
||||
"pending": "يتم التحضير للتحميل...",
|
||||
"processing": "يتم معالجة الملف..."
|
||||
}
|
||||
},
|
||||
"validation": {
|
||||
"videoSizeExceeded": "لا يمكن أن يتجاوز حجم ملف الفيديو 20 ميغابايت، حجم الملف الحالي هو {{actualSize}}"
|
||||
}
|
||||
},
|
||||
"zenMode": "وضع التركيز"
|
||||
|
||||
@@ -114,6 +114,7 @@
|
||||
"reasoning": "يدعم هذا النموذج التفكير العميق",
|
||||
"search": "يدعم هذا النموذج البحث عبر الإنترنت",
|
||||
"tokens": "يدعم هذا النموذج حتى {{tokens}} رمزًا في جلسة واحدة",
|
||||
"video": "هذا النموذج يدعم التعرف على الفيديو",
|
||||
"vision": "يدعم هذا النموذج التعرف البصري"
|
||||
},
|
||||
"removed": "هذا النموذج لم يعد متوفر في القائمة، سيتم إزالته تلقائيًا إذا تم إلغاء تحديده"
|
||||
|
||||
+53
-20
@@ -287,9 +287,6 @@
|
||||
"Pro/deepseek-ai/DeepSeek-V3.1": {
|
||||
"description": "DeepSeek-V3.1 هو نموذج لغة كبير بنمط هجين أصدرته DeepSeek AI، وقد شهد ترقيات مهمة متعددة مقارنة بالإصدارات السابقة. من الابتكارات الرئيسية في هذا النموذج دمج \"وضع التفكير\" و\"وضع عدم التفكير\" في نموذج واحد، حيث يمكن للمستخدمين التبديل بينهما بسهولة عبر تعديل قالب المحادثة لتلبية متطلبات المهام المختلفة. من خلال تحسينات ما بعد التدريب المخصصة، تم تعزيز أداء V3.1 في استدعاء الأدوات ومهام الوكيل بشكل ملحوظ، مما يمكنه من دعم أدوات البحث الخارجية وتنفيذ مهام معقدة متعددة الخطوات بشكل أفضل. يعتمد النموذج على DeepSeek-V3.1-Base مع تدريب إضافي، حيث تم توسيع حجم بيانات التدريب بشكل كبير عبر طريقة التوسيع النصي الطويل على مرحلتين، مما يحسن أدائه في معالجة المستندات الطويلة والرموز البرمجية الطويلة. كنموذج مفتوح المصدر، يظهر DeepSeek-V3.1 قدرة تنافسية مع أفضل النماذج المغلقة في مجالات الترميز والرياضيات والاستدلال، وبفضل هيكله المختلط للخبراء (MoE)، يحافظ على سعة نموذج ضخمة مع تقليل تكلفة الاستدلال بفعالية."
|
||||
},
|
||||
"Pro/moonshotai/Kimi-K2-Instruct": {
|
||||
"description": "Kimi K2 هو نموذج أساسي يعتمد على بنية MoE مع قدرات قوية في البرمجة والوكيل، يحتوي على 1 تريليون معلمة و32 مليار معلمة مفعلة. يتفوق نموذج K2 في اختبارات الأداء الأساسية في مجالات المعرفة العامة، البرمجة، الرياضيات والوكيل مقارنة بالنماذج المفتوحة المصدر الأخرى."
|
||||
},
|
||||
"Pro/moonshotai/Kimi-K2-Instruct-0905": {
|
||||
"description": "Kimi K2-Instruct-0905 هو أحدث وأقوى إصدار من Kimi K2. إنه نموذج لغوي من نوع الخبراء المختلطين (MoE) من الطراز الأول، يحتوي على تريليون معلمة إجمالية و32 مليار معلمة مفعلة. تشمل الميزات الرئيسية للنموذج: تعزيز ذكاء التكويد للوكيل، مع تحسينات ملحوظة في الأداء في اختبارات المعيار المفتوحة ومهام التكويد الواقعية للوكيل؛ تحسين تجربة التكويد في الواجهة الأمامية، مع تقدم في الجمالية والعملية في برمجة الواجهة الأمامية."
|
||||
},
|
||||
@@ -380,6 +377,12 @@
|
||||
"Qwen/Qwen3-Coder-480B-A35B-Instruct": {
|
||||
"description": "Qwen3-Coder-480B-A35B-Instruct هو نموذج برمجي أطلقته شركة علي بابا، ويعد حتى الآن الأكثر قدرةً على العمل كوكيل (Agentic). إنه نموذج مختلط الخبراء (Mixture-of-Experts, MoE) يضم 480 مليار معامل إجماليًا و35 مليار معامل نشط، محققًا توازنًا بين الكفاءة والأداء. يدعم النموذج بشكل أصلي طول سياق يصل إلى 256K (حوالي 260 ألف) توكن، ويمكن توسيعه عبر طرق استطراد مثل YaRN إلى مليون توكن، ممّا يمكّنه من التعامل مع مستودعات شفرة ضخمة ومهام برمجية معقّدة. صُمم Qwen3-Coder لسير عمل ترميز يعتمد على الوكلاء؛ فهو لا يولّد الشفرة فحسب، بل يتفاعل بشكلٍ مستقل مع أدوات وبيئات التطوير لحل مشكلات برمجية معقّدة. في اختبارات معيارية متعددة لمهام التكويد والوكالة، حقق النموذج مستوى متقدمًا بين النماذج مفتوحة المصدر، ويمكن أن ينافس نماذج رائدة مثل Claude Sonnet 4."
|
||||
},
|
||||
"Qwen/Qwen3-Next-80B-A3B-Instruct": {
|
||||
"description": "Qwen3-Next-80B-A3B-Instruct هو نموذج أساسي من الجيل التالي أصدره فريق Tongyi Qianwen في علي بابا. يعتمد على بنية Qwen3-Next الجديدة كليًا، ويهدف إلى تحقيق أقصى كفاءة في التدريب والاستدلال. يستخدم النموذج آلية انتباه هجينة مبتكرة (Gated DeltaNet و Gated Attention)، وهيكل خبراء مختلط عالي التشتت (MoE)، بالإضافة إلى تحسينات متعددة لاستقرار التدريب. كنموذج متناثر يحتوي على 80 مليار معلمة إجمالية، فإنه ينشط حوالي 3 مليارات معلمة فقط أثناء الاستدلال، مما يقلل بشكل كبير من تكلفة الحوسبة، وعند معالجة مهام سياق طويل تتجاوز 32 ألف رمز، فإن معدل الاستدلال يتفوق على نموذج Qwen3-32B بأكثر من 10 أضعاف. هذا النموذج هو نسخة موجهة للتعليمات، مصمم للمهام العامة، ولا يدعم وضع سلسلة التفكير (Thinking). من حيث الأداء، فإنه يعادل نموذج Tongyi Qianwen الرائد Qwen3-235B في بعض الاختبارات المعيارية، مع تفوق واضح في مهام السياق الطويل جدًا."
|
||||
},
|
||||
"Qwen/Qwen3-Next-80B-A3B-Thinking": {
|
||||
"description": "Qwen3-Next-80B-A3B-Thinking هو نموذج أساسي من الجيل التالي أصدره فريق Tongyi Qianwen في علي بابا، مصمم خصيصًا لمهام الاستدلال المعقدة. يعتمد على بنية Qwen3-Next المبتكرة التي تدمج آلية انتباه هجينة (Gated DeltaNet و Gated Attention) وهيكل خبراء مختلط عالي التشتت (MoE)، بهدف تحقيق أقصى كفاءة في التدريب والاستدلال. كنموذج متناثر يحتوي على 80 مليار معلمة إجمالية، فإنه ينشط حوالي 3 مليارات معلمة فقط أثناء الاستدلال، مما يقلل بشكل كبير من تكلفة الحوسبة، وعند معالجة مهام سياق طويل تتجاوز 32 ألف رمز، فإن معدل الاستدلال يتفوق على نموذج Qwen3-32B بأكثر من 10 أضعاف. نسخة \"Thinking\" هذه مخصصة لتنفيذ مهام متعددة الخطوات عالية الصعوبة مثل الإثباتات الرياضية، توليف الشيفرة، التحليل المنطقي والتخطيط، وتخرج عملية الاستدلال بشكل افتراضي في شكل \"سلسلة تفكير\" منظمة. من حيث الأداء، يتفوق هذا النموذج ليس فقط على نماذج ذات تكلفة أعلى مثل Qwen3-32B-Thinking، بل يتفوق أيضًا في عدة اختبارات معيارية على Gemini-2.5-Flash-Thinking."
|
||||
},
|
||||
"Qwen2-72B-Instruct": {
|
||||
"description": "Qwen2 هو أحدث سلسلة من نموذج Qwen، ويدعم سياقًا يصل إلى 128 ألف، مقارنةً بأفضل النماذج مفتوحة المصدر الحالية، يتفوق Qwen2-72B بشكل ملحوظ في فهم اللغة الطبيعية والمعرفة والترميز والرياضيات والقدرات متعددة اللغات."
|
||||
},
|
||||
@@ -809,9 +812,6 @@
|
||||
"codex-mini-latest": {
|
||||
"description": "codex-mini-latest هو نسخة محسنة من o4-mini، مخصصة لـ Codex CLI. بالنسبة للاستخدام المباشر عبر API، نوصي بالبدء من gpt-4.1."
|
||||
},
|
||||
"cognitivecomputations/dolphin-mixtral-8x22b": {
|
||||
"description": "Dolphin Mixtral 8x22B هو نموذج مصمم للامتثال للتعليمات، والحوار، والبرمجة."
|
||||
},
|
||||
"cogview-4": {
|
||||
"description": "CogView-4 هو أول نموذج مفتوح المصدر من Zhipu يدعم توليد الحروف الصينية، مع تحسينات شاملة في فهم المعاني، وجودة توليد الصور، وقدرات توليد النصوص باللغتين الصينية والإنجليزية، ويدعم إدخال ثنائي اللغة بأي طول، وقادر على توليد صور بأي دقة ضمن النطاق المحدد."
|
||||
},
|
||||
@@ -926,6 +926,9 @@
|
||||
"deepseek-ai/deepseek-r1": {
|
||||
"description": "نموذج لغوي متقدم وفعال، بارع في الاستدلال، والرياضيات، والبرمجة."
|
||||
},
|
||||
"deepseek-ai/deepseek-v3.1": {
|
||||
"description": "DeepSeek V3.1: نموذج استدلال من الجيل التالي يعزز القدرات على الاستدلال المعقد والتفكير التسلسلي، مناسب للمهام التي تتطلب تحليلاً عميقًا."
|
||||
},
|
||||
"deepseek-ai/deepseek-vl2": {
|
||||
"description": "DeepSeek-VL2 هو نموذج لغوي بصري مختلط الخبراء (MoE) تم تطويره بناءً على DeepSeekMoE-27B، يستخدم بنية MoE ذات تفعيل نادر، محققًا أداءً ممتازًا مع تفعيل 4.5 مليار معلمة فقط. يقدم هذا النموذج أداءً ممتازًا في مهام مثل الأسئلة البصرية، التعرف الضوئي على الأحرف، فهم الوثائق/الجداول/الرسوم البيانية، وتحديد المواقع البصرية."
|
||||
},
|
||||
@@ -1007,6 +1010,9 @@
|
||||
"deepseek-v3.1": {
|
||||
"description": "DeepSeek-V3.1 هو نموذج استدلال هجين جديد أطلقته DeepSeek، يدعم وضعين للاستدلال: التفكير وعدم التفكير، مع كفاءة تفكير أعلى مقارنة بـ DeepSeek-R1-0528. بعد تحسين ما بعد التدريب، تم تعزيز استخدام أدوات الوكيل وأداء مهام الوكيل بشكل كبير. يدعم نافذة سياق تصل إلى 128 ألف، وطول إخراج يصل إلى 64 ألف رمز."
|
||||
},
|
||||
"deepseek-v3.1:671b": {
|
||||
"description": "DeepSeek V3.1: نموذج استدلال من الجيل التالي يعزز القدرات على الاستدلال المعقد والتفكير التسلسلي، مناسب للمهام التي تتطلب تحليلاً عميقًا."
|
||||
},
|
||||
"deepseek/deepseek-chat-v3-0324": {
|
||||
"description": "DeepSeek V3 هو نموذج مختلط خبير يحتوي على 685B من المعلمات، وهو أحدث إصدار من سلسلة نماذج الدردشة الرائدة لفريق DeepSeek.\n\nيستفيد من نموذج [DeepSeek V3](/deepseek/deepseek-chat-v3) ويظهر أداءً ممتازًا في مجموعة متنوعة من المهام."
|
||||
},
|
||||
@@ -1626,7 +1632,7 @@
|
||||
"description": "تشات جي بي تي-4o هو نموذج ديناميكي يتم تحديثه في الوقت الفعلي للحفاظ على أحدث إصدار. يجمع بين الفهم اللغوي القوي وقدرة التوليد، مما يجعله مناسبًا لتطبيقات واسعة النطاق، بما في ذلك خدمة العملاء والتعليم والدعم الفني."
|
||||
},
|
||||
"gpt-4o-audio-preview": {
|
||||
"description": "نموذج GPT-4o Audio، يدعم إدخال وإخراج الصوت."
|
||||
"description": "نموذج معاينة صوتية GPT-4o يدعم إدخال وإخراج الصوت."
|
||||
},
|
||||
"gpt-4o-mini": {
|
||||
"description": "نموذج GPT-4o mini هو أحدث نموذج أطلقته OpenAI بعد GPT-4 Omni، ويدعم إدخال الصور والنصوص وإخراج النصوص. كأحد نماذجهم المتقدمة الصغيرة، فهو أرخص بكثير من النماذج الرائدة الأخرى في الآونة الأخيرة، وأرخص بأكثر من 60% من GPT-3.5 Turbo. يحتفظ بذكاء متقدم مع قيمة ممتازة. حصل GPT-4o mini على 82% في اختبار MMLU، وهو حاليًا يتفوق على GPT-4 في تفضيلات الدردشة."
|
||||
@@ -1667,24 +1673,33 @@
|
||||
"gpt-5-chat-latest": {
|
||||
"description": "نموذج GPT-5 المستخدم في ChatGPT. يجمع بين قدرات قوية في فهم اللغة وتوليدها، مناسب لتطبيقات التفاعل الحواري."
|
||||
},
|
||||
"gpt-5-codex": {
|
||||
"description": "GPT-5 Codex هو نسخة من GPT-5 محسنة لمهام الترميز في بيئات Codex أو ما يشابهها."
|
||||
},
|
||||
"gpt-5-mini": {
|
||||
"description": "نسخة أسرع وأكثر اقتصادية من GPT-5، مناسبة للمهام المحددة بوضوح. توفر استجابة أسرع مع الحفاظ على جودة عالية."
|
||||
},
|
||||
"gpt-5-nano": {
|
||||
"description": "أسرع وأكفأ نسخة من GPT-5 من حيث التكلفة. مثالية للتطبيقات التي تتطلب استجابة سريعة وحساسة للتكلفة."
|
||||
},
|
||||
"gpt-audio": {
|
||||
"description": "GPT Audio هو نموذج دردشة عام موجه لإدخال وإخراج الصوت، ويدعم استخدام الصوت في واجهة برمجة تطبيقات Chat Completions."
|
||||
},
|
||||
"gpt-image-1": {
|
||||
"description": "نموذج توليد الصور متعدد الوسائط الأصلي من ChatGPT"
|
||||
},
|
||||
"gpt-oss": {
|
||||
"description": "GPT-OSS 20B هو نموذج لغة كبير مفتوح المصدر أصدرته OpenAI، يستخدم تقنية التكميم MXFP4، ومناسب للتشغيل على وحدات معالجة الرسومات الاستهلاكية المتقدمة أو أجهزة Mac بمعالج Apple Silicon. يتميز هذا النموذج بأداء ممتاز في توليد المحادثات، وكتابة الأكواد، ومهام الاستدلال، ويدعم استدعاء الدوال واستخدام الأدوات."
|
||||
},
|
||||
"gpt-oss-120b": {
|
||||
"description": "GPT-OSS-120B MXFP4: هيكل Transformer محسّن بالكمية، يحافظ على أداء قوي حتى في ظل محدودية الموارد."
|
||||
},
|
||||
"gpt-oss:120b": {
|
||||
"description": "GPT-OSS 120B هو نموذج لغة كبير مفتوح المصدر أصدرته OpenAI، يستخدم تقنية التكميم MXFP4، ويعتبر نموذجًا رائدًا. يتطلب تشغيله بيئة متعددة وحدات معالجة الرسومات أو محطة عمل عالية الأداء، ويتميز بأداء متفوق في الاستدلال المعقد، وتوليد الأكواد، ومعالجة اللغات المتعددة، ويدعم استدعاء الدوال المتقدمة وتكامل الأدوات."
|
||||
},
|
||||
"gpt-oss:20b": {
|
||||
"description": "GPT-OSS 20B هو نموذج لغة كبير مفتوح المصدر أصدرته OpenAI، يستخدم تقنية التكميم MXFP4، مناسب للتشغيل على وحدات معالجة الرسومات الاستهلاكية المتقدمة أو أجهزة Apple Silicon Mac. يتميز النموذج بأداء ممتاز في توليد المحادثات، كتابة الشيفرة، ومهام الاستدلال، ويدعم استدعاء الدوال واستخدام الأدوات."
|
||||
},
|
||||
"gpt-realtime": {
|
||||
"description": "نموذج عام في الوقت الحقيقي يدعم الإدخال والإخراج النصي والصوتي، ويدعم أيضًا إدخال الصور."
|
||||
},
|
||||
"grok-2-1212": {
|
||||
"description": "لقد تم تحسين هذا النموذج في الدقة، والامتثال للتعليمات، والقدرة على التعامل مع لغات متعددة."
|
||||
},
|
||||
@@ -1712,6 +1727,12 @@
|
||||
"grok-4-0709": {
|
||||
"description": "Grok 4 من xAI، يتمتع بقدرات استدلال قوية."
|
||||
},
|
||||
"grok-4-fast-non-reasoning": {
|
||||
"description": "نحن سعداء بإصدار Grok 4 Fast، وهو أحدث تقدم لدينا في نماذج الاستدلال ذات التكلفة الفعالة."
|
||||
},
|
||||
"grok-4-fast-reasoning": {
|
||||
"description": "نحن سعداء بإصدار Grok 4 Fast، وهو أحدث تقدم لدينا في نماذج الاستدلال ذات التكلفة الفعالة."
|
||||
},
|
||||
"grok-code-fast-1": {
|
||||
"description": "نحن سعداء بإطلاق grok-code-fast-1، وهو نموذج استدلال سريع وفعال من حيث التكلفة، يتميز بأداء ممتاز في ترميز الوكلاء."
|
||||
},
|
||||
@@ -1847,8 +1868,14 @@
|
||||
"inception/mercury-coder-small": {
|
||||
"description": "Mercury Coder Small هو الخيار المثالي لمهام توليد الكود، وتصحيح الأخطاء، وإعادة الهيكلة، مع أدنى تأخير."
|
||||
},
|
||||
"inclusionAI/Ling-flash-2.0": {
|
||||
"description": "Ling-flash-2.0 هو النموذج الثالث في سلسلة بنية Ling 2.0 التي أصدرها فريق Bailing في مجموعة Ant. هو نموذج خبراء مختلط (MoE) بحجم إجمالي 100 مليار معلمة، لكنه ينشط فقط 6.1 مليار معلمة لكل رمز (غير متضمنة تمثيلات الكلمات 4.8 مليار). كنموذج خفيف الوزن، أظهر Ling-flash-2.0 أداءً يضاهي أو يتفوق على نماذج كثيفة بحجم 40 مليار معلمة ونماذج MoE أكبر في عدة تقييمات موثوقة. يهدف النموذج إلى استكشاف مسارات عالية الكفاءة من خلال تصميم معماري واستراتيجيات تدريب متقدمة، في ظل القناعة بأن \"النموذج الكبير يعني معلمات كثيرة\"."
|
||||
},
|
||||
"inclusionAI/Ling-mini-2.0": {
|
||||
"description": "Ling-mini-2.0 هو نموذج لغوي كبير عالي الأداء بحجم صغير يعتمد على بنية MoE. يحتوي على 16 مليار معلمة إجمالية، لكن يتم تفعيل 1.4 مليار فقط لكل رمز (789 مليون غير مضمن)، مما يحقق سرعة توليد عالية جداً. بفضل تصميم MoE الفعال وبيانات التدريب عالية الجودة وعلى نطاق واسع، بالرغم من أن المعلمات المفعلة تبلغ فقط 1.4 مليار، إلا أن Ling-mini-2.0 يظهر أداءً رفيع المستوى في المهام اللاحقة يمكن مقارنته بنماذج LLM الكثيفة التي تقل عن 10 مليارات والمع نماذج MoE الأكبر حجماً."
|
||||
"description": "Ling-mini-2.0 هو نموذج لغة كبير صغير الحجم وعالي الأداء مبني على بنية MoE. يحتوي على 16 مليار معلمة إجمالية، لكنه ينشط فقط 1.4 مليار معلمة لكل رمز (غير متضمنة التضمين 789 مليون)، مما يحقق سرعة توليد عالية جدًا. بفضل تصميم MoE الفعال وبيانات تدريب ضخمة وعالية الجودة، رغم تنشيط معلمات قليلة، يظهر Ling-mini-2.0 أداءً متقدمًا في المهام اللاحقة يضاهي نماذج LLM كثيفة أقل من 10 مليارات معلمة ونماذج MoE أكبر."
|
||||
},
|
||||
"inclusionAI/Ring-flash-2.0": {
|
||||
"description": "Ring-flash-2.0 هو نموذج تفكير عالي الأداء محسّن بعمق بناءً على Ling-flash-2.0-base. يستخدم بنية خبراء مختلط (MoE) بحجم إجمالي 100 مليار معلمة، لكنه ينشط فقط 6.1 مليار معلمة في كل استدلال. يحل النموذج من خلال خوارزمية icepop المبتكرة مشكلة عدم استقرار نماذج MoE الكبيرة في تدريب التعلم المعزز (RL)، مما يسمح بتحسين مستمر لقدرات الاستدلال المعقدة خلال التدريب طويل الأمد. حقق Ring-flash-2.0 تقدمًا ملحوظًا في مسابقات الرياضيات، توليد الشيفرة، والاستدلال المنطقي، متفوقًا على أفضل النماذج الكثيفة التي تقل عن 40 مليار معلمة، وقريبًا من نماذج MoE مفتوحة المصدر الأكبر ونماذج التفكير عالية الأداء المغلقة المصدر. رغم تركيزه على الاستدلال المعقد، يظهر أداءً ممتازًا في مهام الكتابة الإبداعية. بالإضافة إلى ذلك، وبفضل تصميمه المعماري الفعال، يوفر Ring-flash-2.0 أداءً قويًا مع استدلال عالي السرعة، مما يقلل بشكل كبير من تكلفة نشر نماذج التفكير في بيئات ذات حمل عالٍ."
|
||||
},
|
||||
"internlm/internlm2_5-7b-chat": {
|
||||
"description": "InternLM2.5 يوفر حلول حوار ذكية في عدة سيناريوهات."
|
||||
@@ -1974,7 +2001,10 @@
|
||||
"description": "LLaVA هو نموذج متعدد الوسائط يجمع بين مشفرات بصرية وVicuna، يستخدم لفهم بصري ولغوي قوي."
|
||||
},
|
||||
"magistral-medium-latest": {
|
||||
"description": "Magistral Medium 1.1 هو نموذج استدلال رائد أطلقته Mistral AI في يوليو 2025."
|
||||
"description": "Magistral Medium 1.2 هو نموذج استدلال متقدم مع دعم بصري، أطلقته Mistral AI في سبتمبر 2025."
|
||||
},
|
||||
"magistral-small-2509": {
|
||||
"description": "Magistral Small 1.2 هو نموذج استدلال صغير مفتوح المصدر مع دعم بصري، أطلقته Mistral AI في سبتمبر 2025."
|
||||
},
|
||||
"mathstral": {
|
||||
"description": "MathΣtral مصمم للبحث العلمي والاستدلال الرياضي، يوفر قدرة حسابية فعالة وتفسير النتائج."
|
||||
@@ -2282,9 +2312,6 @@
|
||||
"mistral/mistral-large": {
|
||||
"description": "Mistral Large هو الخيار المثالي للمهام المعقدة التي تتطلب قدرات استدلال كبيرة أو تخصص عالي مثل توليد النصوص المركبة، توليد الكود، RAG أو الوكالة."
|
||||
},
|
||||
"mistral/mistral-saba-24b": {
|
||||
"description": "Mistral Saba 24B هو نموذج مفتوح المصدر مكون من 24 مليار معلمة طورته Mistral.ai. Saba هو نموذج متخصص مدرب لأداء متميز في اللغات العربية، الفارسية، الأردية، العبرية، واللغات الهندية. يتم تشغيله بواسطة Groq باستخدام وحدة معالجة اللغة المخصصة (LPU) لتوفير استدلال سريع وفعال."
|
||||
},
|
||||
"mistral/mistral-small": {
|
||||
"description": "Mistral Small هو الخيار المثالي للمهام البسيطة التي يمكن تنفيذها دفعة واحدة مثل التصنيف، دعم العملاء، أو توليد النصوص. يقدم أداءً ممتازًا بسعر معقول."
|
||||
},
|
||||
@@ -2357,9 +2384,6 @@
|
||||
"moonshotai/Kimi-Dev-72B": {
|
||||
"description": "Kimi-Dev-72B هو نموذج مفتوح المصدر للبرمجة، تم تحسينه عبر تعلم معزز واسع النطاق، قادر على إنتاج تصحيحات مستقرة وجاهزة للإنتاج مباشرة. حقق هذا النموذج نتيجة قياسية جديدة بنسبة 60.4% على SWE-bench Verified، محطماً الأرقام القياسية للنماذج المفتوحة المصدر في مهام هندسة البرمجيات الآلية مثل إصلاح العيوب ومراجعة الشيفرة."
|
||||
},
|
||||
"moonshotai/Kimi-K2-Instruct": {
|
||||
"description": "Kimi K2 هو نموذج أساسي يعتمد على بنية MoE يتمتع بقدرات قوية في البرمجة والوكيل، يحتوي على 1 تريليون معلمة و32 مليار معلمة مفعلة. يتفوق نموذج K2 في اختبارات الأداء الأساسية في مجالات المعرفة العامة، البرمجة، الرياضيات والوكيل مقارنة بالنماذج المفتوحة المصدر الأخرى."
|
||||
},
|
||||
"moonshotai/Kimi-K2-Instruct-0905": {
|
||||
"description": "Kimi K2-Instruct-0905 هو أحدث وأقوى إصدار من Kimi K2. إنه نموذج لغوي من نوع الخبراء المختلطين (MoE) من الطراز الأول، يحتوي على تريليون معلمة إجمالية و32 مليار معلمة مفعلة. تشمل الميزات الرئيسية للنموذج: تعزيز ذكاء التكويد للوكيل، مع تحسينات ملحوظة في الأداء في اختبارات المعيار المفتوحة ومهام التكويد الواقعية للوكيل؛ تحسين تجربة التكويد في الواجهة الأمامية، مع تقدم في الجمالية والعملية في برمجة الواجهة الأمامية."
|
||||
},
|
||||
@@ -2570,6 +2594,9 @@
|
||||
"qwen-image": {
|
||||
"description": "Qwen-Image هي نموذج عام لتوليد الصور يدعم أنماطًا فنية متعددة، ويتميز بقدرته على عرض النصوص المعقدة، خصوصًا النصوص بالصينية والإنجليزية. يدعم النموذج تخطيطات متعددة الأسطر، وتوليد نص على مستوى الفقرات، وتمثيل التفاصيل الدقيقة، مما يتيح إنشاء تصميمات معقدة تمزج بين النص والصورة."
|
||||
},
|
||||
"qwen-image-edit": {
|
||||
"description": "Qwen Image Edit هو نموذج تحويل الصور إلى صور، يدعم تحرير وتعديل الصور بناءً على الصورة المدخلة والتعليمات النصية، ويستطيع إجراء تعديلات دقيقة وتحويلات إبداعية على الصورة الأصلية وفقًا لاحتياجات المستخدم."
|
||||
},
|
||||
"qwen-long": {
|
||||
"description": "نموذج Qwen العملاق للغة، يدعم سياقات نصية طويلة، بالإضافة إلى وظائف الحوار المستندة إلى الوثائق الطويلة والعديد من الوثائق."
|
||||
},
|
||||
@@ -2804,8 +2831,11 @@
|
||||
"qwen3-coder-plus": {
|
||||
"description": "نموذج كود Tongyi Qianwen. أحدث سلسلة نماذج Qwen3-Coder مبنية على Qwen3 لتوليد الأكواد، تتمتع بقدرات وكيل ترميز قوية، بارعة في استدعاء الأدوات والتفاعل مع البيئة، قادرة على البرمجة الذاتية، وتجمع بين مهارات برمجية ممتازة وقدرات عامة."
|
||||
},
|
||||
"qwen3-max-preview": {
|
||||
"description": "نسخة المعاينة لنموذج Qwen 3 Max من سلسلة Tongyi Qianwen، مع تحسينات كبيرة في القدرات العامة مقارنة بسلسلة 2.5، بما في ذلك فهم النصوص العامة باللغتين الصينية والإنجليزية، الالتزام بالتعليمات المعقدة، المهام المفتوحة الذاتية، القدرات متعددة اللغات، واستدعاء الأدوات؛ مع تقليل الأوهام المعرفية للنموذج."
|
||||
"qwen3-coder:480b": {
|
||||
"description": "نموذج عالي الأداء من علي بابا مخصص لمهام الوكيل والترميز مع سياق طويل."
|
||||
},
|
||||
"qwen3-max": {
|
||||
"description": "سلسلة نماذج Tongyi Qianwen 3 Max، التي تحسنت بشكل كبير مقارنة بسلسلة 2.5 في القدرات العامة، فهم النصوص باللغتين الصينية والإنجليزية، اتباع التعليمات المعقدة، المهام المفتوحة الذاتية، القدرات متعددة اللغات، واستدعاء الأدوات؛ مع تقليل الأوهام المعرفية للنموذج. النسخة الأحدث من qwen3-max: مقارنةً بنسخة qwen3-max-preview، تم ترقية خاصة في برمجة الوكلاء واستدعاء الأدوات. النسخة الرسمية المنشورة وصلت إلى مستوى SOTA في المجال، وتلبي احتياجات الوكلاء في سيناريوهات أكثر تعقيدًا."
|
||||
},
|
||||
"qwen3-next-80b-a3b-instruct": {
|
||||
"description": "نموذج مفتوح المصدر من الجيل الجديد لوضع عدم التفكير مبني على Qwen3، يتميز بفهم أفضل للنصوص الصينية مقارنة بالإصدار السابق (Tongyi Qianwen 3-235B-A22B-Instruct-2507)، مع تعزيز في قدرات الاستدلال المنطقي وأداء أفضل في مهام توليد النصوص."
|
||||
@@ -2813,6 +2843,9 @@
|
||||
"qwen3-next-80b-a3b-thinking": {
|
||||
"description": "نموذج مفتوح المصدر من الجيل الجديد لوضع التفكير مبني على Qwen3، يتميز بتحسين في الالتزام بالتعليمات مقارنة بالإصدار السابق (Tongyi Qianwen 3-235B-A22B-Thinking-2507)، مع ردود ملخصة وأكثر إيجازًا من النموذج."
|
||||
},
|
||||
"qwen3-vl-plus": {
|
||||
"description": "Tongyi Qianwen VL هو نموذج توليد نصوص يمتلك قدرات فهم بصرية (صور)، لا يقتصر على التعرف الضوئي على الحروف (OCR)، بل يمكنه أيضًا التلخيص والاستدلال، مثل استخراج خصائص من صور المنتجات، وحل المسائل بناءً على صور التمارين."
|
||||
},
|
||||
"qwq": {
|
||||
"description": "QwQ هو نموذج بحث تجريبي يركز على تحسين قدرات الاستدلال للذكاء الاصطناعي."
|
||||
},
|
||||
|
||||
@@ -281,6 +281,7 @@
|
||||
"actionFiletip": "Качване на файл",
|
||||
"actionTooltip": "Качване",
|
||||
"disabled": "Текущият модел не поддържа визуално разпознаване и анализ на файлове, моля, превключете модела и опитайте отново",
|
||||
"fileNotSupported": "Режимът на браузъра не поддържа качване на файлове, поддържат се само изображения",
|
||||
"visionNotSupported": "Текущият модел не поддържа визуално разпознаване, моля, превключете на друг модел, за да използвате тази функция"
|
||||
},
|
||||
"preview": {
|
||||
@@ -289,6 +290,9 @@
|
||||
"pending": "Подготовка за качване...",
|
||||
"processing": "Обработка на файла..."
|
||||
}
|
||||
},
|
||||
"validation": {
|
||||
"videoSizeExceeded": "Размерът на видео файла не може да надвишава 20MB, текущият размер е {{actualSize}}"
|
||||
}
|
||||
},
|
||||
"zenMode": "Режим на фокус"
|
||||
|
||||
@@ -114,6 +114,7 @@
|
||||
"reasoning": "Този модел поддържа дълбочинно мислене",
|
||||
"search": "Този модел поддържа търсене в мрежата",
|
||||
"tokens": "Този модел поддържа до {{tokens}} токена за една сесия",
|
||||
"video": "Този модел поддържа разпознаване на видео",
|
||||
"vision": "Този модел поддържа визуално разпознаване"
|
||||
},
|
||||
"removed": "Този модел не се намира в списъка. Ако бъде отменен изборът, той ще бъде автоматично премахнат."
|
||||
|
||||
+53
-20
@@ -287,9 +287,6 @@
|
||||
"Pro/deepseek-ai/DeepSeek-V3.1": {
|
||||
"description": "DeepSeek-V3.1 е хибриден голям езиков модел, пуснат от DeepSeek AI, който включва множество важни подобрения спрямо предишните версии. Основната иновация на модела е интеграцията на „режим на мислене“ (Thinking Mode) и „режим без мислене“ (Non-thinking Mode), които потребителите могат гъвкаво да превключват чрез настройка на чат шаблони, за да отговарят на различни задачи. След специална пост-тренировка, V3.1 значително подобрява производителността при използване на инструменти и задачи на агенти, като по-добре поддържа външни търсачки и изпълнение на сложни многостъпкови задачи. Моделът е дообучен върху DeepSeek-V3.1-Base чрез двуфазен метод за разширяване на дълги текстове, което значително увеличава обема на тренировъчните данни и подобрява работата с дълги документи и кодове. Като отворен модел, DeepSeek-V3.1 демонстрира способности, сравними с водещи затворени модели в области като кодиране, математика и разсъждение, като същевременно с хибридната си експертна (MoE) архитектура поддържа голям капацитет на модела и ефективно намалява разходите за изчисления."
|
||||
},
|
||||
"Pro/moonshotai/Kimi-K2-Instruct": {
|
||||
"description": "Kimi K2 е базов модел с MoE архитектура с изключителни кодови и агентски способности, с общо 1 трилион параметри и 32 милиарда активирани параметри. В бенчмаркове за общо знание, програмиране, математика и агентски задачи моделът K2 превъзхожда други водещи отворени модели."
|
||||
},
|
||||
"Pro/moonshotai/Kimi-K2-Instruct-0905": {
|
||||
"description": "Kimi K2-Instruct-0905 е най-новата и най-мощна версия на Kimi K2. Това е водещ езиков модел с хибридна експертна архитектура (MoE), с общо 1 трилион параметри и 32 милиарда активни параметри. Основните характеристики на модела включват: подобрена интелигентност при кодиране на агенти, с изразително подобрение в производителността при публични бенчмаркове и реални задачи за кодиране на агенти; усъвършенстван опит при фронтенд кодиране, с напредък както в естетиката, така и в практичността на фронтенд програмирането."
|
||||
},
|
||||
@@ -380,6 +377,12 @@
|
||||
"Qwen/Qwen3-Coder-480B-A35B-Instruct": {
|
||||
"description": "Qwen3-Coder-480B-A35B-Instruct е публикуван от Alibaba и до момента е един от най-агентно ориентираните (agentic) кодови модели. Това е смесен експертен (MoE) модел с общо 480 милиарда параметри и 35 милиарда активни параметри, който постига баланс между ефективност и производителност. Моделът поддържа родно контекстна дължина от 256K (прибл. 260 000) токена и може да бъде екстраполиран чрез методи като YaRN до 1 милион токена, което му позволява да обработва големи кодови бази и сложни програмистки задачи. Qwen3-Coder е специално проектиран за агентно ориентирани (agentic) кодови работни потоци — той не само генерира код, но може и автономно да взаимодейства с инструменти и среди за разработка, за да решава сложни програмистки проблеми. В множество бенчмаркове за кодиране и агентни задачи моделът постига водещи резултати сред отворените модели и неговата производителност е сравнима с тази на водещи модели като Claude Sonnet 4."
|
||||
},
|
||||
"Qwen/Qwen3-Next-80B-A3B-Instruct": {
|
||||
"description": "Qwen3-Next-80B-A3B-Instruct е следващото поколение основен модел, публикуван от екипа на Alibaba Tongyi Qianwen. Той е базиран на новата архитектура Qwen3-Next и е проектиран за постигане на изключителна ефективност при обучение и извод. Моделът използва иновативен хибриден механизъм за внимание (Gated DeltaNet и Gated Attention), структура с висока степен на разреждане на смесени експерти (MoE) и множество оптимизации за стабилност на обучението. Като разреден модел с общо 80 милиарда параметри, при извод активира само около 3 милиарда параметри, което значително намалява изчислителните разходи. При обработка на задачи с дълъг контекст над 32K токена, пропускателната способност при извод е над 10 пъти по-висока в сравнение с модела Qwen3-32B. Този модел е версия за фина настройка с инструкции, предназначена за общи задачи и не поддържа режим „мисловна верига“ (Thinking). По отношение на производителността, той се представя наравно с флагманския модел Qwen3-235B на Tongyi Qianwen в някои бенчмаркове, като особено се отличава при задачи с много дълъг контекст."
|
||||
},
|
||||
"Qwen/Qwen3-Next-80B-A3B-Thinking": {
|
||||
"description": "Qwen3-Next-80B-A3B-Thinking е следващото поколение основен модел, публикуван от екипа на Alibaba Tongyi Qianwen, специално проектиран за сложни задачи за разсъждение. Той е базиран на иновативната архитектура Qwen3-Next, която комбинира хибриден механизъм за внимание (Gated DeltaNet и Gated Attention) и структура с висока степен на разреждане на смесени експерти (MoE), с цел постигане на изключителна ефективност при обучение и извод. Като разреден модел с общо 80 милиарда параметри, при извод активира само около 3 милиарда параметри, което значително намалява изчислителните разходи. При обработка на задачи с дълъг контекст над 32K токена, пропускателната способност при извод е над 10 пъти по-висока в сравнение с модела Qwen3-32B. Тази „Thinking“ версия е оптимизирана за изпълнение на сложни многостъпкови задачи като математически доказателства, синтез на код, логически анализ и планиране, като по подразбиране изходът на разсъжденията е във формата на структурирана „мисловна верига“. По отношение на производителността, тя не само превъзхожда модели с по-високи разходи като Qwen3-32B-Thinking, но и превъзхожда Gemini-2.5-Flash-Thinking в множество бенчмаркове."
|
||||
},
|
||||
"Qwen2-72B-Instruct": {
|
||||
"description": "Qwen2 е най-новата серия на модела Qwen, поддържаща 128k контекст. В сравнение с текущите най-добри отворени модели, Qwen2-72B значително надминава водещите модели в области като разбиране на естествен език, знания, код, математика и многоезичност."
|
||||
},
|
||||
@@ -809,9 +812,6 @@
|
||||
"codex-mini-latest": {
|
||||
"description": "codex-mini-latest е фина настройка на o4-mini, специално предназначена за Codex CLI. За директна употреба чрез API препоръчваме да започнете с gpt-4.1."
|
||||
},
|
||||
"cognitivecomputations/dolphin-mixtral-8x22b": {
|
||||
"description": "Dolphin Mixtral 8x22B е модел, проектиран за следване на инструкции, диалози и програмиране."
|
||||
},
|
||||
"cogview-4": {
|
||||
"description": "CogView-4 е първият отворен модел за генериране на изображения с текст на китайски, разработен от Zhipu, който значително подобрява разбирането на семантиката, качеството на генериране на изображения и способността за генериране на текст на китайски и английски език. Поддържа двуезичен вход на произволна дължина на китайски и английски и може да генерира изображения с произволна резолюция в зададения диапазон."
|
||||
},
|
||||
@@ -926,6 +926,9 @@
|
||||
"deepseek-ai/deepseek-r1": {
|
||||
"description": "Най-съвременен ефективен LLM, специализиран в разсъждения, математика и програмиране."
|
||||
},
|
||||
"deepseek-ai/deepseek-v3.1": {
|
||||
"description": "DeepSeek V3.1: следващо поколение модел за разсъждение, подобряващ способностите за сложни разсъждения и свързано мислене, подходящ за задачи, изискващи задълбочен анализ."
|
||||
},
|
||||
"deepseek-ai/deepseek-vl2": {
|
||||
"description": "DeepSeek-VL2 е визуален езиков модел, разработен на базата на DeepSeekMoE-27B, който използва архитектура на смесени експерти (MoE) с рядка активация, постигайки изключителна производителност с активирани само 4.5B параметри. Моделът показва отлични резултати в множество задачи, включително визуални въпроси и отговори, оптично разпознаване на символи, разбиране на документи/таблици/графики и визуална локализация."
|
||||
},
|
||||
@@ -1007,6 +1010,9 @@
|
||||
"deepseek-v3.1": {
|
||||
"description": "DeepSeek-V3.1 е новият хибриден модел за разсъждение на DeepSeek, който поддържа два режима на разсъждение: мислене и немислене, с по-висока ефективност на мислене в сравнение с DeepSeek-R1-0528. След оптимизация чрез пост-тренировка, използването на агентски инструменти и изпълнението на задачи от интелигентни агенти са значително подобрени. Поддържа контекстен прозорец до 128k и максимална дължина на изхода до 64k токена."
|
||||
},
|
||||
"deepseek-v3.1:671b": {
|
||||
"description": "DeepSeek V3.1: следващо поколение модел за разсъждение, подобряващ способностите за сложни разсъждения и свързано мислене, подходящ за задачи, изискващи задълбочен анализ."
|
||||
},
|
||||
"deepseek/deepseek-chat-v3-0324": {
|
||||
"description": "DeepSeek V3 е експертен смесен модел с 685B параметри, последната итерация на флагманската серия чат модели на екипа DeepSeek.\n\nТой наследява модела [DeepSeek V3](/deepseek/deepseek-chat-v3) и показва отлични резултати в различни задачи."
|
||||
},
|
||||
@@ -1626,7 +1632,7 @@
|
||||
"description": "ChatGPT-4o е динамичен модел, който се актуализира в реално време, за да поддържа най-новата версия. Той съчетава мощно разбиране и генериране на език и е подходящ за мащабни приложения, включително обслужване на клиенти, образование и техническа поддръжка."
|
||||
},
|
||||
"gpt-4o-audio-preview": {
|
||||
"description": "Модел GPT-4o Audio, поддържащ вход и изход на аудио."
|
||||
"description": "GPT-4o Audio Preview модел, поддържащ аудио вход и изход."
|
||||
},
|
||||
"gpt-4o-mini": {
|
||||
"description": "GPT-4o mini е най-новият модел на OpenAI, след GPT-4 Omni, който поддържа текстово и визуално въвеждане и генерира текст. Като най-напредналият им малък модел, той е значително по-евтин от другите нови модели и е с над 60% по-евтин от GPT-3.5 Turbo. Запазва най-съвременната интелигентност, като същевременно предлага значителна стойност за парите. GPT-4o mini получи 82% на теста MMLU и в момента е с по-висок рейтинг от GPT-4 по предпочитания за чат."
|
||||
@@ -1667,24 +1673,33 @@
|
||||
"gpt-5-chat-latest": {
|
||||
"description": "Моделът GPT-5, използван в ChatGPT. Комбинира мощно разбиране и генериране на език, подходящ за диалогови приложения."
|
||||
},
|
||||
"gpt-5-codex": {
|
||||
"description": "GPT-5 Codex е версия на GPT-5, оптимизирана за задачи с агентско кодиране в Codex или подобни среди."
|
||||
},
|
||||
"gpt-5-mini": {
|
||||
"description": "По-бърза и по-икономична версия на GPT-5, подходяща за ясно дефинирани задачи. Осигурява по-бърз отговор, като същевременно поддържа високо качество на изхода."
|
||||
},
|
||||
"gpt-5-nano": {
|
||||
"description": "Най-бързата и най-икономична версия на GPT-5. Отлично подходяща за приложения, изискващи бърз отговор и чувствителни към разходите."
|
||||
},
|
||||
"gpt-audio": {
|
||||
"description": "GPT Audio е универсален чат модел, ориентиран към аудио вход и изход, поддържащ използване на аудио I/O в Chat Completions API."
|
||||
},
|
||||
"gpt-image-1": {
|
||||
"description": "Роден мултимодален модел за генериране на изображения ChatGPT."
|
||||
},
|
||||
"gpt-oss": {
|
||||
"description": "GPT-OSS 20B е отворен голям езиков модел, публикуван от OpenAI, използващ технологията за квантуване MXFP4, подходящ за работа на висок клас потребителски GPU или Apple Silicon Mac. Този модел се отличава с отлични резултати в генерирането на диалози, писането на код и задачи за разсъждение, като поддържа извикване на функции и използване на инструменти."
|
||||
},
|
||||
"gpt-oss-120b": {
|
||||
"description": "GPT-OSS-120B MXFP4 квантизиран трансформър модел, който запазва силна производителност при ограничени ресурси."
|
||||
},
|
||||
"gpt-oss:120b": {
|
||||
"description": "GPT-OSS 120B е голям отворен езиков модел, публикуван от OpenAI, използващ технологията за квантуване MXFP4, предназначен за флагмански клас модели. Изисква многократни GPU или високопроизводителна работна станция за работа, с изключителни възможности в сложни разсъждения, генериране на код и многоезична обработка, поддържайки усъвършенствано извикване на функции и интеграция на инструменти."
|
||||
},
|
||||
"gpt-oss:20b": {
|
||||
"description": "GPT-OSS 20B е отворен голям езиков модел, публикуван от OpenAI, използващ MXFP4 квантова технология, подходящ за работа на висок клас потребителски GPU или Apple Silicon Mac. Моделът се представя отлично в задачи за генериране на диалог, писане на код и разсъждения, поддържа извикване на функции и използване на инструменти."
|
||||
},
|
||||
"gpt-realtime": {
|
||||
"description": "Универсален модел в реално време, поддържащ текстов и аудио вход и изход, както и вход на изображения."
|
||||
},
|
||||
"grok-2-1212": {
|
||||
"description": "Този модел е подобрен по отношение на точност, спазване на инструкции и многоезични способности."
|
||||
},
|
||||
@@ -1712,6 +1727,12 @@
|
||||
"grok-4-0709": {
|
||||
"description": "Grok 4 от xAI, с мощни способности за разсъждение."
|
||||
},
|
||||
"grok-4-fast-non-reasoning": {
|
||||
"description": "С удоволствие представяме Grok 4 Fast, нашият най-нов напредък в модели за разсъждение с висока ефективност на разходите."
|
||||
},
|
||||
"grok-4-fast-reasoning": {
|
||||
"description": "С удоволствие представяме Grok 4 Fast, нашият най-нов напредък в модели за разсъждение с висока ефективност на разходите."
|
||||
},
|
||||
"grok-code-fast-1": {
|
||||
"description": "С удоволствие представяме grok-code-fast-1, бърз и икономичен модел за извод, който се отличава с отлични резултати при кодиране на агенти."
|
||||
},
|
||||
@@ -1847,8 +1868,14 @@
|
||||
"inception/mercury-coder-small": {
|
||||
"description": "Mercury Coder Small е идеален за задачи по генериране, отстраняване на грешки и рефакториране на код с минимална латентност."
|
||||
},
|
||||
"inclusionAI/Ling-flash-2.0": {
|
||||
"description": "Ling-flash-2.0 е третият модел от серията Ling 2.0 архитектури, публикуван от екипа на Ant Group Bailing. Това е модел с хибридни експерти (MoE) с общо 100 милиарда параметри, но при всеки токен активира само 6.1 милиарда параметри (без вграждания – 4.8 милиарда). Като леко конфигуриран модел, Ling-flash-2.0 показва в множество авторитетни оценки производителност, сравнима или дори превъзхождаща плътни (Dense) модели с 40 милиарда параметри и по-големи MoE модели. Моделът е предназначен да изследва пътища за висока ефективност чрез изключителен дизайн на архитектурата и стратегии за обучение, в контекста на общоприетото схващане, че „големият модел е равен на големи параметри“."
|
||||
},
|
||||
"inclusionAI/Ling-mini-2.0": {
|
||||
"description": "Ling-mini-2.0 е малък, високопроизводителен голям езиков модел, базиран на MoE архитектура. Той разполага с 16 милиарда общи параметри, но за всеки токен се активират само 1.4 милиарда (без вграждания 789 милиона), което осигурява изключително висока скорост на генериране. Благодарение на ефективния MoE дизайн и големия обем висококачествени тренировъчни данни, въпреки че активните параметри са само 1.4 милиарда, Ling-mini-2.0 демонстрира водещи резултати в задачи надолу по веригата, сравними с плътни LLM с по-малко от 10 милиарда параметри и по-големи MoE модели."
|
||||
"description": "Ling-mini-2.0 е малък, но високопроизводителен голям езиков модел, базиран на MoE архитектура. Той има общо 16 милиарда параметри, но при всеки токен активира само 1.4 милиарда (без вграждания – 789 милиона), което осигурява изключително бърза генерация. Благодарение на ефективния MoE дизайн и големия обем висококачествени тренировъчни данни, въпреки че активираните параметри са само 1.4 милиарда, Ling-mini-2.0 демонстрира върхова производителност в downstream задачи, сравнима с плътни LLM под 10 милиарда параметри и по-големи MoE модели."
|
||||
},
|
||||
"inclusionAI/Ring-flash-2.0": {
|
||||
"description": "Ring-flash-2.0 е високопроизводителен мисловен модел, дълбоко оптимизиран на базата на Ling-flash-2.0-base. Той използва MoE архитектура с общо 100 милиарда параметри, но при всяко извод активира само 6.1 милиарда параметри. Моделът решава нестабилността на големите MoE модели при обучение с подсилено учене (RL) чрез уникалния алгоритъм icepop, което позволява непрекъснато подобряване на сложните разсъждения при дългосрочно обучение. Ring-flash-2.0 постига значителни пробиви в множество трудни бенчмаркове като математически състезания, генериране на код и логически разсъждения. Неговата производителност не само превъзхожда топ плътни модели с по-малко от 40 милиарда параметри, но и се сравнява с по-големи отворени MoE модели и затворени високопроизводителни мисловни модели. Въпреки че е фокусиран върху сложни разсъждения, моделът се представя отлично и в творческо писане. Благодарение на ефективния си архитектурен дизайн, Ring-flash-2.0 осигурява висока производителност и бърз извод, значително намалявайки разходите за внедряване на мисловни модели при висока паралелност."
|
||||
},
|
||||
"internlm/internlm2_5-7b-chat": {
|
||||
"description": "InternLM2.5 предлага интелигентни решения за диалог в множество сценарии."
|
||||
@@ -1974,7 +2001,10 @@
|
||||
"description": "LLaVA е многомодален модел, комбиниращ визуален кодер и Vicuna, предназначен за мощно визуално и езиково разбиране."
|
||||
},
|
||||
"magistral-medium-latest": {
|
||||
"description": "Magistral Medium 1.1 е водещ модел за инференция, публикуван от Mistral AI през юли 2025 г."
|
||||
"description": "Magistral Medium 1.2 е водещ модел за изводи с визуална поддръжка, пуснат от Mistral AI през септември 2025 г."
|
||||
},
|
||||
"magistral-small-2509": {
|
||||
"description": "Magistral Small 1.2 е отворен малък модел за изводи с визуална поддръжка, пуснат от Mistral AI през септември 2025 г."
|
||||
},
|
||||
"mathstral": {
|
||||
"description": "MathΣtral е проектиран за научни изследвания и математически разсъждения, предоставяйки ефективни изчислителни способности и интерпретация на резултати."
|
||||
@@ -2282,9 +2312,6 @@
|
||||
"mistral/mistral-large": {
|
||||
"description": "Mistral Large е идеален за сложни задачи, изискващи големи разсъдъчни способности или висока специализация — като синтетично генериране на текст, генериране на код, RAG или агенти."
|
||||
},
|
||||
"mistral/mistral-saba-24b": {
|
||||
"description": "Mistral Saba 24B е 24-милиарден параметров отворен модел, разработен от Mistral.ai. Saba е специализиран модел, обучен да се представя отлично на арабски, персийски, урду, иврит и индийски езици. Обслужва се от Groq с техния персонализиран хардуер за езикова обработка (LPU) за бързо и ефективно разсъждение."
|
||||
},
|
||||
"mistral/mistral-small": {
|
||||
"description": "Mistral Small е идеален за прости задачи, които могат да се обработват на партиди — като класификация, клиентска поддръжка или генериране на текст. Предлага отлична производителност на достъпна цена."
|
||||
},
|
||||
@@ -2357,9 +2384,6 @@
|
||||
"moonshotai/Kimi-Dev-72B": {
|
||||
"description": "Kimi-Dev-72B е голям отворен модел за код, оптимизиран чрез мащабно подсилено обучение, способен да генерира стабилни и директно приложими пачове. Този модел постига нов рекорд от 60,4 % на SWE-bench Verified, подобрявайки резултатите на отворени модели в автоматизирани задачи за софтуерно инженерство като поправка на дефекти и преглед на код."
|
||||
},
|
||||
"moonshotai/Kimi-K2-Instruct": {
|
||||
"description": "Kimi K2 е базов модел с MoE архитектура, с изключителни кодови и агентски способности, общо 1 трилион параметри и 32 милиарда активирани параметри. В бенчмаркове за общо знание, програмиране, математика и агентски задачи моделът K2 превъзхожда други водещи отворени модели."
|
||||
},
|
||||
"moonshotai/Kimi-K2-Instruct-0905": {
|
||||
"description": "Kimi K2-Instruct-0905 е най-новата и най-мощна версия на Kimi K2. Това е водещ езиков модел с хибридна експертна архитектура (MoE), с общо 1 трилион параметри и 32 милиарда активни параметри. Основните характеристики на модела включват: подобрена интелигентност при кодиране на агенти, с изразително подобрение в производителността при публични бенчмаркове и реални задачи за кодиране на агенти; усъвършенстван опит при фронтенд кодиране, с напредък както в естетиката, така и в практичността на фронтенд програмирането."
|
||||
},
|
||||
@@ -2570,6 +2594,9 @@
|
||||
"qwen-image": {
|
||||
"description": "Qwen-Image е универсален модел за генериране на изображения, който поддържа множество художествени стилове и е особено добър в рендериране на сложни текстове, включително на китайски и английски. Моделът поддържа многоредови оформления, генериране на текст на ниво абзац и изобразяване на детайли с висока прецизност, позволявайки създаване на сложни комбинирани оформления от изображение и текст."
|
||||
},
|
||||
"qwen-image-edit": {
|
||||
"description": "Qwen Image Edit е модел за генериране на изображения, който поддържа редактиране и модификация на изображения въз основа на входни изображения и текстови подсказки, като може да извършва прецизни корекции и креативни трансформации на оригиналното изображение според нуждите на потребителя."
|
||||
},
|
||||
"qwen-long": {
|
||||
"description": "Qwen е мащабен езиков модел, който поддържа дълги текстови контексти и диалогови функции, базирани на дълги документи и множество документи."
|
||||
},
|
||||
@@ -2804,8 +2831,11 @@
|
||||
"qwen3-coder-plus": {
|
||||
"description": "Кодиращ модел на Tongyi Qianwen. Най-новата серия модели Qwen3-Coder е базирана на Qwen3 и е модел за генериране на код с мощни възможности на Coding Agent, умеещ да използва инструменти и да взаимодейства с околната среда, способен на автономно програмиране, с изключителни кодови умения и същевременно общи способности."
|
||||
},
|
||||
"qwen3-max-preview": {
|
||||
"description": "Preview версия на Max модела от серията Qwen 3, с голямо подобрение спрямо серия 2.5 в общите универсални способности, разбиране на текст на китайски и английски, следване на сложни инструкции, субективни отворени задачи, многоезични способности и използване на инструменти; моделът има по-малко халюцинации на знания."
|
||||
"qwen3-coder:480b": {
|
||||
"description": "Високопроизводителен модел с дълъг контекст, разработен от Alibaba за агентски и кодиращи задачи."
|
||||
},
|
||||
"qwen3-max": {
|
||||
"description": "Серията Max на Tongyi Qianwen 3 предлага значително подобрена обща способност в сравнение с серия 2.5, с подобрено разбиране на текст на китайски и английски, способност за следване на сложни инструкции, умения за субективни отворени задачи, многоезични възможности и повишена способност за извикване на инструменти; моделът демонстрира по-малко халюцинации на знания. Последният модел qwen3-max включва специални подобрения в програмирането на агенти и извикването на инструменти в сравнение с версията qwen3-max-preview. Официалната версия, публикувана сега, достига SOTA ниво в своята област и е адаптирана за по-сложни изисквания на интелигентни агенти."
|
||||
},
|
||||
"qwen3-next-80b-a3b-instruct": {
|
||||
"description": "Базирано на Qwen3, ново поколение отворен модел без мисловен режим, който предлага по-добро разбиране на китайски текстове, подобрени логически умения и по-добри резултати при задачи за генериране на текст в сравнение с предишната версия (Tongyi Qianwen 3-235B-A22B-Instruct-2507)."
|
||||
@@ -2813,6 +2843,9 @@
|
||||
"qwen3-next-80b-a3b-thinking": {
|
||||
"description": "Базирано на Qwen3, ново поколение отворен модел с мисловен режим, който подобрява спазването на инструкции и предоставя по-кратки и точни обобщения в сравнение с предишната версия (Tongyi Qianwen 3-235B-A22B-Thinking-2507)."
|
||||
},
|
||||
"qwen3-vl-plus": {
|
||||
"description": "Tongyi Qianwen VL е текстов генеративен модел с визуални (изображения) разбирания, който не само може да извършва OCR (разпознаване на текст в изображения), но и да обобщава и прави изводи, например извличане на атрибути от снимки на продукти или решаване на задачи по математика от изображения."
|
||||
},
|
||||
"qwq": {
|
||||
"description": "QwQ е експериментален изследователски модел, който се фокусира върху подобряване на AI разсъдъчните способности."
|
||||
},
|
||||
|
||||
@@ -281,6 +281,7 @@
|
||||
"actionFiletip": "Datei hochladen",
|
||||
"actionTooltip": "Hochladen",
|
||||
"disabled": "Das aktuelle Modell unterstützt keine visuelle Erkennung und Dateianalyse. Bitte wechseln Sie das Modell, um diese Funktionen zu nutzen.",
|
||||
"fileNotSupported": "Im Browser-Modus wird das Hochladen von Dateien derzeit nicht unterstützt, nur Bilder sind erlaubt",
|
||||
"visionNotSupported": "Das aktuelle Modell unterstützt keine visuelle Erkennung. Bitte wechseln Sie das Modell, um diese Funktion zu nutzen."
|
||||
},
|
||||
"preview": {
|
||||
@@ -289,6 +290,9 @@
|
||||
"pending": "Vorbereitung des Uploads...",
|
||||
"processing": "Datei wird verarbeitet..."
|
||||
}
|
||||
},
|
||||
"validation": {
|
||||
"videoSizeExceeded": "Die Videodatei darf nicht größer als 20 MB sein, die aktuelle Dateigröße beträgt {{actualSize}}"
|
||||
}
|
||||
},
|
||||
"zenMode": "Fokusmodus"
|
||||
|
||||
@@ -114,6 +114,7 @@
|
||||
"reasoning": "Dieses Modell unterstützt tiefes Denken",
|
||||
"search": "Dieses Modell unterstützt die Online-Suche",
|
||||
"tokens": "Dieses Modell unterstützt maximal {{tokens}} Tokens pro Sitzung.",
|
||||
"video": "Dieses Modell unterstützt die Videoerkennung",
|
||||
"vision": "Dieses Modell unterstützt die visuelle Erkennung."
|
||||
},
|
||||
"removed": "Das Modell wurde aus der Liste entfernt. Wenn Sie die Auswahl aufheben, wird es automatisch entfernt."
|
||||
|
||||
+53
-20
@@ -287,9 +287,6 @@
|
||||
"Pro/deepseek-ai/DeepSeek-V3.1": {
|
||||
"description": "DeepSeek-V3.1 ist ein hybrides großes Sprachmodell, das von DeepSeek AI veröffentlicht wurde und auf dem Vorgängermodell in vielerlei Hinsicht bedeutende Verbesserungen aufweist. Eine wesentliche Innovation dieses Modells ist die Integration des „Denkmodus“ und des „Nicht-Denkmodus“ in einem System, wobei Nutzer durch Anpassung der Chat-Vorlagen flexibel zwischen den Modi wechseln können, um unterschiedlichen Aufgabenanforderungen gerecht zu werden. Durch spezielles Post-Training wurde die Leistung von V3.1 bei Tool-Aufrufen und Agentenaufgaben deutlich gesteigert, was eine bessere Unterstützung externer Suchwerkzeuge und die Ausführung komplexer mehrstufiger Aufgaben ermöglicht. Das Modell basiert auf DeepSeek-V3.1-Base und wurde durch eine zweistufige Langtext-Erweiterungsmethode nachtrainiert, wodurch das Trainingsdatenvolumen erheblich erhöht wurde und es sich besonders bei der Verarbeitung langer Dokumente und umfangreicher Codes bewährt. Als Open-Source-Modell zeigt DeepSeek-V3.1 in Benchmarks zu Codierung, Mathematik und logischem Denken Fähigkeiten, die mit führenden Closed-Source-Modellen vergleichbar sind. Gleichzeitig senkt seine hybride Expertenarchitektur (MoE) die Inferenzkosten bei gleichzeitiger Beibehaltung einer enormen Modellkapazität."
|
||||
},
|
||||
"Pro/moonshotai/Kimi-K2-Instruct": {
|
||||
"description": "Kimi K2 ist ein MoE-Architektur-Basis-Modell mit herausragenden Code- und Agentenfähigkeiten, insgesamt 1 Billion Parameter und 32 Milliarden aktivierten Parametern. In Benchmark-Tests zu allgemeinem Wissen, Programmierung, Mathematik und Agentenaufgaben übertrifft das K2-Modell andere führende Open-Source-Modelle."
|
||||
},
|
||||
"Pro/moonshotai/Kimi-K2-Instruct-0905": {
|
||||
"description": "Kimi K2-Instruct-0905 ist die neueste und leistungsstärkste Version von Kimi K2. Es handelt sich um ein erstklassiges Mixture-of-Experts (MoE) Sprachmodell mit insgesamt 1 Billion Parametern und 32 Milliarden aktivierten Parametern. Die Hauptmerkmale dieses Modells umfassen: verbesserte Agenten-Codierungsintelligenz, die in öffentlichen Benchmark-Tests und realen Agenten-Codierungsaufgaben eine signifikante Leistungssteigerung zeigt; verbesserte Frontend-Codierungserfahrung mit Fortschritten in Ästhetik und Praktikabilität der Frontend-Programmierung."
|
||||
},
|
||||
@@ -380,6 +377,12 @@
|
||||
"Qwen/Qwen3-Coder-480B-A35B-Instruct": {
|
||||
"description": "Qwen3-Coder-480B-A35B-Instruct wurde von Alibaba veröffentlicht und ist bislang das agentischste Code-Modell. Es ist ein Mixture-of-Experts-(MoE)-Modell mit 480 Milliarden Gesamtparametern und 35 Milliarden aktivierten Parametern, das ein ausgewogenes Verhältnis von Effizienz und Leistung bietet. Das Modell unterstützt nativ eine Kontextlänge von 256K (≈260.000) Token und lässt sich mittels Extrapolationsverfahren wie YaRN auf bis zu 1.000.000 Token erweitern, sodass es große Codebasen und komplexe Programmieraufgaben verarbeiten kann. Qwen3-Coder wurde für agentenbasierte Coding-Workflows entwickelt: Es generiert nicht nur Code, sondern kann auch eigenständig mit Entwicklungswerkzeugen und -umgebungen interagieren, um komplexe Programmierprobleme zu lösen. In mehreren Benchmarks zu Coding- und Agentenaufgaben gehört das Modell zu den Spitzenreitern unter Open-Source-Modellen und erreicht eine Leistungsfähigkeit, die mit führenden Modellen wie Claude Sonnet 4 vergleichbar ist."
|
||||
},
|
||||
"Qwen/Qwen3-Next-80B-A3B-Instruct": {
|
||||
"description": "Qwen3-Next-80B-A3B-Instruct ist ein von Alibaba Tongyi Qianwen Team veröffentlichtes nächstes Generation Basis-Modell. Es basiert auf der neuen Qwen3-Next-Architektur und zielt darauf ab, höchste Trainings- und Inferenz-Effizienz zu erreichen. Das Modell verwendet einen innovativen hybriden Aufmerksamkeitsmechanismus (Gated DeltaNet und Gated Attention), eine hochgradig spärliche Mixture-of-Experts (MoE)-Struktur sowie mehrere Optimierungen zur Trainingsstabilität. Als ein spärliches Modell mit insgesamt 80 Milliarden Parametern werden bei der Inferenz nur etwa 3 Milliarden Parameter aktiviert, was die Rechenkosten erheblich senkt. Bei der Verarbeitung von Langkontextaufgaben mit über 32K Tokens übertrifft der Durchsatz das Qwen3-32B-Modell um das Zehnfache. Dieses Modell ist eine instruktionsfeinabgestimmte Version, die für allgemeine Aufgaben konzipiert ist und den Thinking-Modus nicht unterstützt. In puncto Leistung ist es in einigen Benchmarks vergleichbar mit dem Flaggschiff-Modell Qwen3-235B von Tongyi Qianwen, insbesondere zeigt es bei sehr langen Kontexten deutliche Vorteile."
|
||||
},
|
||||
"Qwen/Qwen3-Next-80B-A3B-Thinking": {
|
||||
"description": "Qwen3-Next-80B-A3B-Thinking ist ein von Alibaba Tongyi Qianwen Team veröffentlichtes nächstes Generation Basis-Modell, das speziell für komplexe Inferenzaufgaben entwickelt wurde. Es basiert auf der innovativen Qwen3-Next-Architektur, die hybride Aufmerksamkeitsmechanismen (Gated DeltaNet und Gated Attention) mit einer hochgradig spärlichen Mixture-of-Experts (MoE)-Struktur kombiniert, um höchste Trainings- und Inferenz-Effizienz zu gewährleisten. Als spärliches Modell mit insgesamt 80 Milliarden Parametern werden bei der Inferenz nur etwa 3 Milliarden Parameter aktiviert, was die Rechenkosten stark reduziert. Bei der Verarbeitung von Langkontextaufgaben mit über 32K Tokens übertrifft der Durchsatz das Qwen3-32B-Modell um das Zehnfache. Diese „Thinking“-Version ist für anspruchsvolle mehrstufige Aufgaben wie mathematische Beweise, Code-Synthese, logische Analyse und Planung optimiert und gibt den Inferenzprozess standardmäßig in strukturierter „Denkketten“-Form aus. In der Leistung übertrifft es nicht nur kostenintensivere Modelle wie Qwen3-32B-Thinking, sondern auch in mehreren Benchmarks das Gemini-2.5-Flash-Thinking."
|
||||
},
|
||||
"Qwen2-72B-Instruct": {
|
||||
"description": "Qwen2 ist die neueste Reihe des Qwen-Modells, das 128k Kontext unterstützt. Im Vergleich zu den derzeit besten Open-Source-Modellen übertrifft Qwen2-72B in den Bereichen natürliche Sprachverständnis, Wissen, Code, Mathematik und Mehrsprachigkeit deutlich die führenden Modelle."
|
||||
},
|
||||
@@ -809,9 +812,6 @@
|
||||
"codex-mini-latest": {
|
||||
"description": "codex-mini-latest ist eine feinabgestimmte Version von o4-mini, speziell für Codex CLI entwickelt. Für die direkte Nutzung über die API empfehlen wir den Start mit gpt-4.1."
|
||||
},
|
||||
"cognitivecomputations/dolphin-mixtral-8x22b": {
|
||||
"description": "Dolphin Mixtral 8x22B ist ein Modell, das für die Befolgung von Anweisungen, Dialoge und Programmierung entwickelt wurde."
|
||||
},
|
||||
"cogview-4": {
|
||||
"description": "CogView-4 ist das erste von Zhipu entwickelte Open-Source-Text-zu-Bild-Modell, das die Generierung chinesischer Schriftzeichen unterstützt. Es bietet umfassende Verbesserungen in den Bereichen semantisches Verständnis, Bildgenerierungsqualität und die Fähigkeit, chinesische und englische Schriftzeichen zu erzeugen. Es unterstützt mehrsprachige Eingaben beliebiger Länge in Chinesisch und Englisch und kann Bilder in beliebiger Auflösung innerhalb eines vorgegebenen Bereichs erzeugen."
|
||||
},
|
||||
@@ -926,6 +926,9 @@
|
||||
"deepseek-ai/deepseek-r1": {
|
||||
"description": "Hochmodernes, effizientes LLM, das auf Schlussfolgern, Mathematik und Programmierung spezialisiert ist."
|
||||
},
|
||||
"deepseek-ai/deepseek-v3.1": {
|
||||
"description": "DeepSeek V3.1: Ein Inferenzmodell der nächsten Generation, das komplexe Schlussfolgerungen und verknüpfte Denkfähigkeiten verbessert und sich für Aufgaben eignet, die tiefgehende Analysen erfordern."
|
||||
},
|
||||
"deepseek-ai/deepseek-vl2": {
|
||||
"description": "DeepSeek-VL2 ist ein hybrides Expertenmodell (MoE) für visuelle Sprache, das auf DeepSeekMoE-27B basiert und eine spärliche Aktivierung der MoE-Architektur verwendet, um außergewöhnliche Leistungen bei der Aktivierung von nur 4,5 Milliarden Parametern zu erzielen. Dieses Modell zeigt hervorragende Leistungen in mehreren Aufgaben, darunter visuelle Fragenbeantwortung, optische Zeichenerkennung, Dokument-/Tabellen-/Diagrammverständnis und visuelle Lokalisierung."
|
||||
},
|
||||
@@ -1007,6 +1010,9 @@
|
||||
"deepseek-v3.1": {
|
||||
"description": "DeepSeek-V3.1 ist ein neu eingeführtes hybrides Inferenzmodell von DeepSeek, das zwei Inferenzmodi unterstützt: Denkmodus und Nicht-Denkmodus. Es ist effizienter im Denkprozess als DeepSeek-R1-0528. Durch Post-Training-Optimierung wurden die Nutzung von Agenten-Tools und die Leistung bei Agentenaufgaben erheblich verbessert. Unterstützt ein Kontextfenster von 128k und eine maximale Ausgabelänge von 64k Tokens."
|
||||
},
|
||||
"deepseek-v3.1:671b": {
|
||||
"description": "DeepSeek V3.1: Ein Inferenzmodell der nächsten Generation, das komplexe Schlussfolgerungen und verknüpfte Denkfähigkeiten verbessert und sich für Aufgaben eignet, die tiefgehende Analysen erfordern."
|
||||
},
|
||||
"deepseek/deepseek-chat-v3-0324": {
|
||||
"description": "DeepSeek V3 ist ein Experten-Mischmodell mit 685B Parametern und die neueste Iteration der Flaggschiff-Chatmodellreihe des DeepSeek-Teams.\n\nEs erbt das [DeepSeek V3](/deepseek/deepseek-chat-v3) Modell und zeigt hervorragende Leistungen in verschiedenen Aufgaben."
|
||||
},
|
||||
@@ -1626,7 +1632,7 @@
|
||||
"description": "ChatGPT-4o ist ein dynamisches Modell, das in Echtzeit aktualisiert wird, um die neueste Version zu gewährleisten. Es kombiniert starke Sprachverständnis- und Generierungsfähigkeiten und eignet sich für großangelegte Anwendungsbereiche, einschließlich Kundenservice, Bildung und technischen Support."
|
||||
},
|
||||
"gpt-4o-audio-preview": {
|
||||
"description": "GPT-4o Audio-Modell, unterstützt Audioeingabe und -ausgabe."
|
||||
"description": "GPT-4o Audio Preview Modell, unterstützt Audioeingabe und -ausgabe."
|
||||
},
|
||||
"gpt-4o-mini": {
|
||||
"description": "GPT-4o mini ist das neueste Modell von OpenAI, das nach GPT-4 Omni veröffentlicht wurde und sowohl Text- als auch Bildinput unterstützt. Als ihr fortschrittlichstes kleines Modell ist es viel günstiger als andere neueste Modelle und kostet über 60 % weniger als GPT-3.5 Turbo. Es behält die fortschrittliche Intelligenz bei und bietet gleichzeitig ein hervorragendes Preis-Leistungs-Verhältnis. GPT-4o mini erzielte 82 % im MMLU-Test und rangiert derzeit in den Chat-Präferenzen über GPT-4."
|
||||
@@ -1667,24 +1673,33 @@
|
||||
"gpt-5-chat-latest": {
|
||||
"description": "Das in ChatGPT verwendete GPT-5 Modell. Vereint starke Sprachverständnis- und Generierungsfähigkeiten, ideal für dialogorientierte Anwendungen."
|
||||
},
|
||||
"gpt-5-codex": {
|
||||
"description": "GPT-5 Codex ist eine für Codex oder ähnliche Umgebungen optimierte GPT-5-Version für Agenten-Codierungsaufgaben."
|
||||
},
|
||||
"gpt-5-mini": {
|
||||
"description": "Eine schnellere und kosteneffizientere Version von GPT-5, geeignet für klar definierte Aufgaben. Bietet schnellere Reaktionszeiten bei gleichbleibend hoher Ausgabequalität."
|
||||
},
|
||||
"gpt-5-nano": {
|
||||
"description": "Die schnellste und kostengünstigste Version von GPT-5. Besonders geeignet für Anwendungen, die schnelle Reaktionen und Kostenbewusstsein erfordern."
|
||||
},
|
||||
"gpt-audio": {
|
||||
"description": "GPT Audio ist ein universelles Chatmodell für Audioeingabe und -ausgabe, das Audio-I/O in der Chat Completions API unterstützt."
|
||||
},
|
||||
"gpt-image-1": {
|
||||
"description": "ChatGPT natives multimodales Bildgenerierungsmodell"
|
||||
},
|
||||
"gpt-oss": {
|
||||
"description": "GPT-OSS 20B ist ein von OpenAI veröffentlichtes Open-Source-Sprachmodell, das die MXFP4-Quantisierungstechnologie verwendet und sich für den Einsatz auf High-End-Consumer-GPUs oder Apple Silicon Macs eignet. Dieses Modell zeigt hervorragende Leistungen bei der Dialoggenerierung, Codeerstellung und bei Inferenzaufgaben und unterstützt Funktionsaufrufe sowie die Nutzung von Werkzeugen."
|
||||
},
|
||||
"gpt-oss-120b": {
|
||||
"description": "GPT-OSS-120B MXFP4 quantisierte Transformer-Struktur, die auch bei begrenzten Ressourcen starke Leistung beibehält."
|
||||
},
|
||||
"gpt-oss:120b": {
|
||||
"description": "GPT-OSS 120B ist ein von OpenAI veröffentlichtes großes Open-Source-Sprachmodell, das die MXFP4-Quantisierungstechnologie verwendet und als Flaggschiff-Modell gilt. Es erfordert den Betrieb auf Multi-GPU- oder Hochleistungs-Workstation-Umgebungen und bietet herausragende Leistungen bei komplexen Inferenzaufgaben, Codegenerierung und mehrsprachiger Verarbeitung. Es unterstützt fortgeschrittene Funktionsaufrufe und die Integration von Werkzeugen."
|
||||
},
|
||||
"gpt-oss:20b": {
|
||||
"description": "GPT-OSS 20B ist ein von OpenAI veröffentlichtes Open-Source-Sprachmodell, das MXFP4-Quantisierung verwendet und für den Einsatz auf High-End-Consumer-GPUs oder Apple Silicon Macs geeignet ist. Das Modell zeigt hervorragende Leistungen bei Dialoggenerierung, Codeerstellung und Inferenzaufgaben und unterstützt Funktionsaufrufe sowie Tool-Nutzung."
|
||||
},
|
||||
"gpt-realtime": {
|
||||
"description": "Universelles Echtzeitmodell, das Echtzeit-Text- und Audioeingabe/-ausgabe unterstützt und zudem Bildinput ermöglicht."
|
||||
},
|
||||
"grok-2-1212": {
|
||||
"description": "Dieses Modell hat Verbesserungen in Bezug auf Genauigkeit, Befolgung von Anweisungen und Mehrsprachigkeit erfahren."
|
||||
},
|
||||
@@ -1712,6 +1727,12 @@
|
||||
"grok-4-0709": {
|
||||
"description": "xAI's Grok 4 mit starker Schlussfolgerungsfähigkeit."
|
||||
},
|
||||
"grok-4-fast-non-reasoning": {
|
||||
"description": "Wir freuen uns, Grok 4 Fast vorzustellen, unseren neuesten Fortschritt bei kosteneffizienten Inferenzmodellen."
|
||||
},
|
||||
"grok-4-fast-reasoning": {
|
||||
"description": "Wir freuen uns, Grok 4 Fast vorzustellen, unseren neuesten Fortschritt bei kosteneffizienten Inferenzmodellen."
|
||||
},
|
||||
"grok-code-fast-1": {
|
||||
"description": "Wir freuen uns, grok-code-fast-1 vorzustellen, ein schnelles und kosteneffizientes Inferenzmodell, das sich durch hervorragende Leistung bei der Agentencodierung auszeichnet."
|
||||
},
|
||||
@@ -1847,8 +1868,14 @@
|
||||
"inception/mercury-coder-small": {
|
||||
"description": "Mercury Coder Small ist ideal für Codegenerierung, Debugging und Refactoring-Aufgaben mit minimaler Latenz."
|
||||
},
|
||||
"inclusionAI/Ling-flash-2.0": {
|
||||
"description": "Ling-flash-2.0 ist das dritte Modell der Ling 2.0 Architekturserie, veröffentlicht vom Ant Group Bailing Team. Es handelt sich um ein Mixture-of-Experts (MoE)-Modell mit insgesamt 100 Milliarden Parametern, wobei pro Token nur 6,1 Milliarden Parameter aktiviert werden (ohne Wortvektoren 4,8 Milliarden). Als leichtgewichtige Konfiguration zeigt Ling-flash-2.0 in mehreren renommierten Benchmarks Leistungen, die mit 40-Milliarden-Dense-Modellen und größeren MoE-Modellen vergleichbar oder überlegen sind. Das Modell zielt darauf ab, durch exzellentes Architekturdesign und Trainingsstrategien effiziente Wege zu erforschen, um die gängige Annahme „großes Modell = viele Parameter“ zu hinterfragen."
|
||||
},
|
||||
"inclusionAI/Ling-mini-2.0": {
|
||||
"description": "Ling-mini-2.0 ist ein kleines, leistungsstarkes großes Sprachmodell basierend auf der MoE-Architektur. Es verfügt über 16 Milliarden Gesamtparameter, aktiviert jedoch pro Token nur 1,4 Milliarden (nicht-Embedding 789 Millionen), was eine extrem hohe Generierungsgeschwindigkeit ermöglicht. Dank des effizienten MoE-Designs und umfangreicher, qualitativ hochwertiger Trainingsdaten zeigt Ling-mini-2.0 trotz nur 1,4 Milliarden aktivierter Parameter Spitzenleistungen bei nachgelagerten Aufgaben, die mit dichten LLMs unter 10 Milliarden und größeren MoE-Modellen vergleichbar sind."
|
||||
"description": "Ling-mini-2.0 ist ein kleines, leistungsstarkes Sprachmodell basierend auf der MoE-Architektur. Es verfügt über 16 Milliarden Gesamtparameter, aktiviert jedoch pro Token nur 1,4 Milliarden (ohne Einbettungen 789 Millionen), was eine sehr hohe Generierungsgeschwindigkeit ermöglicht. Dank effizientem MoE-Design und großem, hochwertigem Trainingsdatensatz zeigt Ling-mini-2.0 trotz der geringen aktivierten Parameter eine Spitzenleistung, die mit dichten LLMs unter 10 Milliarden und größeren MoE-Modellen in nachgelagerten Aufgaben vergleichbar ist."
|
||||
},
|
||||
"inclusionAI/Ring-flash-2.0": {
|
||||
"description": "Ring-flash-2.0 ist ein hochleistungsfähiges Denkmodell, das auf Ling-flash-2.0-base tief optimiert wurde. Es verwendet eine Mixture-of-Experts (MoE)-Architektur mit insgesamt 100 Milliarden Parametern, aktiviert jedoch bei jeder Inferenz nur 6,1 Milliarden Parameter. Durch den innovativen Icepop-Algorithmus löst es die Instabilitätsprobleme großer MoE-Modelle im Reinforcement Learning (RL) Training und verbessert kontinuierlich seine komplexen Inferenzfähigkeiten über lange Trainingszyklen. Ring-flash-2.0 erzielt bedeutende Durchbrüche in anspruchsvollen Benchmarks wie Mathematikwettbewerben, Codegenerierung und logischem Schließen. Seine Leistung übertrifft nicht nur dichte Spitzenmodelle unter 40 Milliarden Parametern, sondern ist auch vergleichbar mit größeren Open-Source-MoE-Modellen und proprietären Hochleistungs-Denkmodellen. Obwohl es auf komplexe Inferenz spezialisiert ist, zeigt es auch bei kreativen Schreibaufgaben hervorragende Ergebnisse. Dank seiner effizienten Architektur bietet Ring-flash-2.0 starke Leistung bei gleichzeitig hoher Inferenzgeschwindigkeit und senkt deutlich die Bereitstellungskosten in hochparallelen Szenarien."
|
||||
},
|
||||
"internlm/internlm2_5-7b-chat": {
|
||||
"description": "InternLM2.5 bietet intelligente Dialoglösungen in mehreren Szenarien."
|
||||
@@ -1974,7 +2001,10 @@
|
||||
"description": "LLaVA ist ein multimodales Modell, das visuelle Encoder und Vicuna kombiniert und für starke visuelle und sprachliche Verständnisse sorgt."
|
||||
},
|
||||
"magistral-medium-latest": {
|
||||
"description": "Magistral Medium 1.1 ist ein fortschrittliches Inferenzmodell, das Mistral AI im Juli 2025 veröffentlicht hat."
|
||||
"description": "Magistral Medium 1.2 ist ein fortschrittliches Inferenzmodell mit visueller Unterstützung, das von Mistral AI im September 2025 veröffentlicht wurde."
|
||||
},
|
||||
"magistral-small-2509": {
|
||||
"description": "Magistral Small 1.2 ist ein Open-Source-Kleinmodell für Inferenz mit visueller Unterstützung, das von Mistral AI im September 2025 veröffentlicht wurde."
|
||||
},
|
||||
"mathstral": {
|
||||
"description": "MathΣtral ist für wissenschaftliche Forschung und mathematische Schlussfolgerungen konzipiert und bietet effektive Rechenfähigkeiten und Ergebnisinterpretationen."
|
||||
@@ -2282,9 +2312,6 @@
|
||||
"mistral/mistral-large": {
|
||||
"description": "Mistral Large ist ideal für komplexe Aufgaben, die große Inferenzkapazitäten oder hohe Spezialisierung erfordern – wie synthetische Textgenerierung, Codegenerierung, RAG oder Agenten."
|
||||
},
|
||||
"mistral/mistral-saba-24b": {
|
||||
"description": "Mistral Saba 24B ist ein 24 Milliarden Parameter Open-Source-Modell von Mistral.ai. Saba ist ein spezialisiertes Modell, das für herausragende Leistungen in Arabisch, Persisch, Urdu, Hebräisch und indischen Sprachen trainiert wurde. Betrieben von Groq mit deren maßgeschneiderter Language Processing Unit (LPU) Hardware für schnelle und effiziente Inferenz."
|
||||
},
|
||||
"mistral/mistral-small": {
|
||||
"description": "Mistral Small ist ideal für einfache Aufgaben, die in großen Mengen ausgeführt werden können – wie Klassifikation, Kundensupport oder Textgenerierung. Es bietet hervorragende Leistung zu einem erschwinglichen Preis."
|
||||
},
|
||||
@@ -2357,9 +2384,6 @@
|
||||
"moonshotai/Kimi-Dev-72B": {
|
||||
"description": "Kimi-Dev-72B ist ein Open-Source-Großmodell für Quellcode, das durch umfangreiche Verstärkungslernoptimierung robuste und direkt produktionsreife Patches erzeugen kann. Dieses Modell erreichte auf SWE-bench Verified eine neue Höchstpunktzahl von 60,4 % und stellte damit einen Rekord für Open-Source-Modelle bei automatisierten Software-Engineering-Aufgaben wie Fehlerbehebung und Code-Review auf."
|
||||
},
|
||||
"moonshotai/Kimi-K2-Instruct": {
|
||||
"description": "Kimi K2 ist ein MoE-Basis-Modell mit herausragenden Code- und Agentenfähigkeiten, insgesamt 1 Billion Parameter und 32 Milliarden aktivierten Parametern. In Benchmark-Tests zu allgemeinem Wissen, Programmierung, Mathematik und Agentenaufgaben übertrifft das K2-Modell andere führende Open-Source-Modelle."
|
||||
},
|
||||
"moonshotai/Kimi-K2-Instruct-0905": {
|
||||
"description": "Kimi K2-Instruct-0905 ist die neueste und leistungsstärkste Version von Kimi K2. Es handelt sich um ein erstklassiges Mixture-of-Experts (MoE) Sprachmodell mit insgesamt 1 Billion Parametern und 32 Milliarden aktivierten Parametern. Die Hauptmerkmale dieses Modells umfassen: verbesserte Agenten-Codierungsintelligenz, die in öffentlichen Benchmark-Tests und realen Agenten-Codierungsaufgaben eine signifikante Leistungssteigerung zeigt; verbesserte Frontend-Codierungserfahrung mit Fortschritten in Ästhetik und Praktikabilität der Frontend-Programmierung."
|
||||
},
|
||||
@@ -2570,6 +2594,9 @@
|
||||
"qwen-image": {
|
||||
"description": "Qwen-Image ist ein universelles Bildgenerierungsmodell, das zahlreiche Kunststile unterstützt und sich besonders bei der Wiedergabe komplexer Texte auszeichnet, insbesondere bei chinesischen und englischen Schriftzügen. Das Modell unterstützt mehrzeilige Layouts, absatzweises Textgenerieren sowie die präzise Darstellung feiner Details und ermöglicht die Erstellung komplexer Bild-Text-Kombinationen."
|
||||
},
|
||||
"qwen-image-edit": {
|
||||
"description": "Qwen Image Edit ist ein Bild-zu-Bild-Modell, das die Bearbeitung und Modifikation von Bildern basierend auf Eingabebildern und Textanweisungen unterstützt. Es ermöglicht präzise Anpassungen und kreative Umgestaltungen des Originalbildes entsprechend den Anforderungen der Nutzer."
|
||||
},
|
||||
"qwen-long": {
|
||||
"description": "Qwen ist ein groß angelegtes Sprachmodell, das lange Textkontexte unterstützt und Dialogfunktionen für verschiedene Szenarien wie lange Dokumente und mehrere Dokumente bietet."
|
||||
},
|
||||
@@ -2804,8 +2831,11 @@
|
||||
"qwen3-coder-plus": {
|
||||
"description": "Tongyi Qianwen Code-Modell. Die neueste Qwen3-Coder Modellreihe basiert auf Qwen3 und ist ein Code-Generierungsmodell mit starker Coding-Agent-Fähigkeit, spezialisiert auf Werkzeugaufrufe und Umgebungsinteraktion, das selbstständiges Programmieren ermöglicht und neben hervorragenden Code-Fähigkeiten auch allgemeine Kompetenzen besitzt."
|
||||
},
|
||||
"qwen3-max-preview": {
|
||||
"description": "Die Preview-Version des Max-Modells der Tongyi Qianwen 3-Serie zeigt im Vergleich zur 2.5-Serie eine deutliche Steigerung der allgemeinen Fähigkeiten, einschließlich verbesserter chinesisch- und englischsprachiger Textverständnisfähigkeiten, komplexer Befolgung von Anweisungen, subjektiver offener Aufgaben, Mehrsprachigkeit und Werkzeugaufruf-Fähigkeiten; das Modell zeigt weniger Wissenshalluzinationen."
|
||||
"qwen3-coder:480b": {
|
||||
"description": "Alibaba's leistungsstarkes Langkontextmodell für Agenten- und Codierungsaufgaben."
|
||||
},
|
||||
"qwen3-max": {
|
||||
"description": "Tongyi Qianwen 3 Max Modellserie, die im Vergleich zur 2.5 Serie eine deutliche Verbesserung der allgemeinen Fähigkeiten bietet, einschließlich verbesserter Textverständnisfähigkeiten in Chinesisch und Englisch, komplexer Befolgung von Anweisungen, subjektiver offener Aufgaben, Mehrsprachigkeit und Tool-Integration; das Modell zeigt weniger Wissenshalluzinationen. Die neueste qwen3-max Version wurde speziell im Bereich Agentenprogrammierung und Tool-Integration weiterentwickelt. Die offizielle Veröffentlichung erreicht SOTA-Niveau in Fachgebieten und ist für komplexere Agentenanforderungen optimiert."
|
||||
},
|
||||
"qwen3-next-80b-a3b-instruct": {
|
||||
"description": "Ein neues Open-Source-Modell der nächsten Generation im Nicht-Denk-Modus basierend auf Qwen3. Im Vergleich zur vorherigen Version (Tongyi Qianwen 3-235B-A22B-Instruct-2507) bietet es eine verbesserte chinesische Textverständnisfähigkeit, verstärkte logische Schlussfolgerungen und bessere Leistung bei textgenerierenden Aufgaben."
|
||||
@@ -2813,6 +2843,9 @@
|
||||
"qwen3-next-80b-a3b-thinking": {
|
||||
"description": "Ein neues Open-Source-Modell der nächsten Generation im Denkmodus basierend auf Qwen3. Im Vergleich zur vorherigen Version (Tongyi Qianwen 3-235B-A22B-Thinking-2507) wurde die Befehlsbefolgung verbessert und die Modellantworten sind prägnanter zusammengefasst."
|
||||
},
|
||||
"qwen3-vl-plus": {
|
||||
"description": "Tongyi Qianwen VL ist ein Textgenerierungsmodell mit visuellen (Bild-)Verständnisfähigkeiten. Es kann nicht nur OCR (Texterkennung in Bildern) durchführen, sondern auch weiterführende Zusammenfassungen und Schlussfolgerungen ziehen, z. B. Attribute aus Produktfotos extrahieren oder Aufgaben anhand von Übungsbildern lösen."
|
||||
},
|
||||
"qwq": {
|
||||
"description": "QwQ ist ein experimentelles Forschungsmodell, das sich auf die Verbesserung der KI-Inferenzfähigkeiten konzentriert."
|
||||
},
|
||||
|
||||
@@ -281,6 +281,7 @@
|
||||
"actionFiletip": "Upload File",
|
||||
"actionTooltip": "Upload",
|
||||
"disabled": "The current model does not support visual recognition and file analysis. Please switch models to use this feature.",
|
||||
"fileNotSupported": "File uploads are not supported in browser mode; only images are allowed.",
|
||||
"visionNotSupported": "The current model does not support visual recognition. Please switch to a different model to use this feature."
|
||||
},
|
||||
"preview": {
|
||||
@@ -289,6 +290,9 @@
|
||||
"pending": "Preparing to upload...",
|
||||
"processing": "Processing file..."
|
||||
}
|
||||
},
|
||||
"validation": {
|
||||
"videoSizeExceeded": "Video file size must not exceed 20MB. Current file size is {{actualSize}}."
|
||||
}
|
||||
},
|
||||
"zenMode": "Zen Mode"
|
||||
|
||||
@@ -114,6 +114,7 @@
|
||||
"reasoning": "This model supports deep thinking.",
|
||||
"search": "This model supports online search.",
|
||||
"tokens": "This model supports up to {{tokens}} tokens in a single session.",
|
||||
"video": "This model supports video recognition",
|
||||
"vision": "This model supports visual recognition."
|
||||
},
|
||||
"removed": "The model is not in the list. It will be automatically removed if deselected."
|
||||
|
||||
+53
-20
@@ -287,9 +287,6 @@
|
||||
"Pro/deepseek-ai/DeepSeek-V3.1": {
|
||||
"description": "DeepSeek-V3.1 is a hybrid large language model released by DeepSeek AI, featuring multiple significant upgrades over its predecessor. A key innovation of this model is the integration of both \"Thinking Mode\" and \"Non-thinking Mode,\" allowing users to flexibly switch between modes by adjusting chat templates to suit different task requirements. Through dedicated post-training optimization, V3.1 significantly enhances performance in tool invocation and Agent tasks, better supporting external search tools and executing complex multi-step tasks. Based on DeepSeek-V3.1-Base, it employs a two-stage long-text extension method to greatly increase training data volume, improving its handling of long documents and extensive code. As an open-source model, DeepSeek-V3.1 demonstrates capabilities comparable to top closed-source models across benchmarks in coding, mathematics, and reasoning. Its Mixture of Experts (MoE) architecture maintains a massive model capacity while effectively reducing inference costs."
|
||||
},
|
||||
"Pro/moonshotai/Kimi-K2-Instruct": {
|
||||
"description": "Kimi K2 is a MoE architecture base model with exceptional coding and agent capabilities, featuring 1 trillion total parameters and 32 billion activated parameters. In benchmark tests across general knowledge reasoning, programming, mathematics, and agent tasks, the K2 model outperforms other mainstream open-source models."
|
||||
},
|
||||
"Pro/moonshotai/Kimi-K2-Instruct-0905": {
|
||||
"description": "Kimi K2-Instruct-0905 is the latest and most powerful version of Kimi K2. It is a top-tier Mixture of Experts (MoE) language model with a total of 1 trillion parameters and 32 billion activated parameters. Key features of this model include enhanced agent coding intelligence, demonstrating significant performance improvements in public benchmark tests and real-world agent coding tasks; and an improved frontend coding experience, with advancements in both aesthetics and practicality for frontend programming."
|
||||
},
|
||||
@@ -380,6 +377,12 @@
|
||||
"Qwen/Qwen3-Coder-480B-A35B-Instruct": {
|
||||
"description": "Qwen3-Coder-480B-A35B-Instruct, released by Alibaba, is the most agentic code model to date. It is a mixture-of-experts (MoE) model with 480 billion total parameters and 35 billion active parameters, striking a balance between efficiency and performance. The model natively supports a 256K (~260k) token context window and can be extended to 1,000,000 tokens through extrapolation methods such as YaRN, enabling it to handle large codebases and complex programming tasks. Qwen3-Coder is designed for agent-style coding workflows: it not only generates code but can autonomously interact with development tools and environments to solve complex programming problems. On multiple benchmarks for coding and agent tasks, this model achieves top-tier results among open-source models, with performance comparable to leading models like Claude Sonnet 4."
|
||||
},
|
||||
"Qwen/Qwen3-Next-80B-A3B-Instruct": {
|
||||
"description": "Qwen3-Next-80B-A3B-Instruct is the next-generation foundational model released by Alibaba's Tongyi Qianwen team. It is based on the brand-new Qwen3-Next architecture, designed to achieve ultimate training and inference efficiency. The model employs an innovative hybrid attention mechanism (Gated DeltaNet and Gated Attention), a highly sparse mixture-of-experts (MoE) structure, and multiple training stability optimizations. As a sparse model with a total of 80 billion parameters, it activates only about 3 billion parameters during inference, significantly reducing computational costs. When handling long-context tasks exceeding 32K tokens, its inference throughput is more than 10 times higher than the Qwen3-32B model. This model is an instruction-tuned version designed for general tasks and does not support the Thinking mode. In terms of performance, it is comparable to Tongyi Qianwen's flagship Qwen3-235B model on some benchmarks, especially demonstrating clear advantages in ultra-long context tasks."
|
||||
},
|
||||
"Qwen/Qwen3-Next-80B-A3B-Thinking": {
|
||||
"description": "Qwen3-Next-80B-A3B-Thinking is the next-generation foundational model released by Alibaba's Tongyi Qianwen team, specifically designed for complex reasoning tasks. It is based on the innovative Qwen3-Next architecture, which integrates a hybrid attention mechanism (Gated DeltaNet and Gated Attention) and a highly sparse mixture-of-experts (MoE) structure, aiming for ultimate training and inference efficiency. As a sparse model with a total of 80 billion parameters, it activates only about 3 billion parameters during inference, greatly reducing computational costs. When processing long-context tasks exceeding 32K tokens, its throughput is more than 10 times higher than the Qwen3-32B model. This \"Thinking\" version is optimized for executing challenging multi-step tasks such as mathematical proofs, code synthesis, logical analysis, and planning, and by default outputs the reasoning process in a structured \"chain-of-thought\" format. In terms of performance, it not only surpasses higher-cost models like Qwen3-32B-Thinking but also outperforms Gemini-2.5-Flash-Thinking on multiple benchmarks."
|
||||
},
|
||||
"Qwen2-72B-Instruct": {
|
||||
"description": "Qwen2 is the latest series of the Qwen model, supporting 128k context. Compared to the current best open-source models, Qwen2-72B significantly surpasses leading models in natural language understanding, knowledge, coding, mathematics, and multilingual capabilities."
|
||||
},
|
||||
@@ -809,9 +812,6 @@
|
||||
"codex-mini-latest": {
|
||||
"description": "codex-mini-latest is a fine-tuned version of o4-mini, specifically designed for Codex CLI. For direct API usage, we recommend starting with gpt-4.1."
|
||||
},
|
||||
"cognitivecomputations/dolphin-mixtral-8x22b": {
|
||||
"description": "Dolphin Mixtral 8x22B is a model designed for instruction following, dialogue, and programming."
|
||||
},
|
||||
"cogview-4": {
|
||||
"description": "CogView-4 is Zhipu's first open-source text-to-image model supporting Chinese character generation. It offers comprehensive improvements in semantic understanding, image generation quality, and bilingual Chinese-English text generation capabilities. It supports bilingual input of any length and can generate images at any resolution within a specified range."
|
||||
},
|
||||
@@ -926,6 +926,9 @@
|
||||
"deepseek-ai/deepseek-r1": {
|
||||
"description": "A state-of-the-art efficient LLM skilled in reasoning, mathematics, and programming."
|
||||
},
|
||||
"deepseek-ai/deepseek-v3.1": {
|
||||
"description": "DeepSeek V3.1: The next-generation reasoning model that enhances complex reasoning and chain-of-thought capabilities, suitable for tasks requiring in-depth analysis."
|
||||
},
|
||||
"deepseek-ai/deepseek-vl2": {
|
||||
"description": "DeepSeek-VL2 is a mixture of experts (MoE) visual language model developed based on DeepSeekMoE-27B, employing a sparsely activated MoE architecture that achieves outstanding performance while activating only 4.5 billion parameters. This model excels in various tasks, including visual question answering, optical character recognition, document/table/chart understanding, and visual localization."
|
||||
},
|
||||
@@ -1007,6 +1010,9 @@
|
||||
"deepseek-v3.1": {
|
||||
"description": "DeepSeek-V3.1 is a newly launched hybrid reasoning model by DeepSeek, supporting two reasoning modes: thinking and non-thinking. It offers higher thinking efficiency compared to DeepSeek-R1-0528. With post-training optimization, the use of Agent tools and agent task performance have been significantly enhanced. It supports a 128k context window and an output length of up to 64k tokens."
|
||||
},
|
||||
"deepseek-v3.1:671b": {
|
||||
"description": "DeepSeek V3.1: The next-generation reasoning model that enhances complex reasoning and chain-of-thought capabilities, suitable for tasks requiring in-depth analysis."
|
||||
},
|
||||
"deepseek/deepseek-chat-v3-0324": {
|
||||
"description": "DeepSeek V3 is a 685B parameter expert mixture model, the latest iteration in the DeepSeek team's flagship chat model series.\n\nIt inherits from the [DeepSeek V3](/deepseek/deepseek-chat-v3) model and performs excellently across various tasks."
|
||||
},
|
||||
@@ -1626,7 +1632,7 @@
|
||||
"description": "ChatGPT-4o is a dynamic model that updates in real-time to maintain the latest version. It combines powerful language understanding and generation capabilities, making it suitable for large-scale applications including customer service, education, and technical support."
|
||||
},
|
||||
"gpt-4o-audio-preview": {
|
||||
"description": "GPT-4o Audio model, supporting audio input and output."
|
||||
"description": "GPT-4o Audio Preview model, supporting audio input and output."
|
||||
},
|
||||
"gpt-4o-mini": {
|
||||
"description": "GPT-4o mini is the latest model released by OpenAI after GPT-4 Omni, supporting both image and text input while outputting text. As their most advanced small model, it is significantly cheaper than other recent cutting-edge models, costing over 60% less than GPT-3.5 Turbo. It maintains state-of-the-art intelligence while offering remarkable cost-effectiveness. GPT-4o mini scored 82% on the MMLU test and currently ranks higher than GPT-4 in chat preferences."
|
||||
@@ -1667,24 +1673,33 @@
|
||||
"gpt-5-chat-latest": {
|
||||
"description": "The GPT-5 model used in ChatGPT. Combines powerful language understanding and generation capabilities, ideal for conversational interaction applications."
|
||||
},
|
||||
"gpt-5-codex": {
|
||||
"description": "GPT-5 Codex is a GPT-5 variant optimized for agent coding tasks in Codex or similar environments."
|
||||
},
|
||||
"gpt-5-mini": {
|
||||
"description": "A faster, more cost-effective version of GPT-5, suitable for well-defined tasks. Provides quicker response times while maintaining high-quality output."
|
||||
},
|
||||
"gpt-5-nano": {
|
||||
"description": "The fastest and most cost-efficient version of GPT-5. Perfectly suited for applications requiring rapid responses and cost sensitivity."
|
||||
},
|
||||
"gpt-audio": {
|
||||
"description": "GPT Audio is a general-purpose chat model designed for audio input and output, supporting audio I/O in the Chat Completions API."
|
||||
},
|
||||
"gpt-image-1": {
|
||||
"description": "ChatGPT native multimodal image generation model."
|
||||
},
|
||||
"gpt-oss": {
|
||||
"description": "GPT-OSS 20B is an open-source large language model released by OpenAI, utilizing MXFP4 quantization technology. It is suitable for running on high-end consumer GPUs or Apple Silicon Macs. This model excels in dialogue generation, code writing, and reasoning tasks, supporting function calls and tool usage."
|
||||
},
|
||||
"gpt-oss-120b": {
|
||||
"description": "GPT-OSS-120B MXFP4 quantized Transformer architecture, delivering strong performance even under resource constraints."
|
||||
},
|
||||
"gpt-oss:120b": {
|
||||
"description": "GPT-OSS 120B is a large open-source language model released by OpenAI, employing MXFP4 quantization technology as a flagship model. It requires multi-GPU or high-performance workstation environments to operate and delivers outstanding performance in complex reasoning, code generation, and multilingual processing, supporting advanced function calls and tool integration."
|
||||
},
|
||||
"gpt-oss:20b": {
|
||||
"description": "GPT-OSS 20B is an open-source large language model released by OpenAI, utilizing MXFP4 quantization technology, suitable for running on high-end consumer GPUs or Apple Silicon Macs. This model excels in dialogue generation, code writing, and reasoning tasks, supporting function calls and tool usage."
|
||||
},
|
||||
"gpt-realtime": {
|
||||
"description": "A general-purpose real-time model supporting real-time text and audio input/output, as well as image input."
|
||||
},
|
||||
"grok-2-1212": {
|
||||
"description": "This model has improved in accuracy, instruction adherence, and multilingual capabilities."
|
||||
},
|
||||
@@ -1712,6 +1727,12 @@
|
||||
"grok-4-0709": {
|
||||
"description": "xAI's Grok 4, featuring strong reasoning capabilities."
|
||||
},
|
||||
"grok-4-fast-non-reasoning": {
|
||||
"description": "We are excited to release Grok 4 Fast, our latest advancement in cost-effective reasoning models."
|
||||
},
|
||||
"grok-4-fast-reasoning": {
|
||||
"description": "We are excited to release Grok 4 Fast, our latest advancement in cost-effective reasoning models."
|
||||
},
|
||||
"grok-code-fast-1": {
|
||||
"description": "We are excited to introduce grok-code-fast-1, a fast and cost-effective inference model that excels in agent coding."
|
||||
},
|
||||
@@ -1847,8 +1868,14 @@
|
||||
"inception/mercury-coder-small": {
|
||||
"description": "Mercury Coder Small is ideal for code generation, debugging, and refactoring tasks, offering minimal latency."
|
||||
},
|
||||
"inclusionAI/Ling-flash-2.0": {
|
||||
"description": "Ling-flash-2.0 is the third model in the Ling 2.0 architecture series released by Ant Group's Bailing team. It is a mixture-of-experts (MoE) model with a total of 100 billion parameters, but activates only 6.1 billion parameters per token (4.8 billion non-embedding). As a lightweight configuration model, Ling-flash-2.0 demonstrates performance comparable to or surpassing 40-billion-parameter dense models and larger MoE models across multiple authoritative benchmarks. The model aims to explore efficient pathways under the consensus that \"large models equal large parameters\" through extreme architectural design and training strategies."
|
||||
},
|
||||
"inclusionAI/Ling-mini-2.0": {
|
||||
"description": "Ling-mini-2.0 is a compact, high-performance large language model based on the MoE architecture. It has 16 billion total parameters, but only activates 1.4 billion per token (non-embedding 789 million), enabling extremely fast generation speeds. Thanks to its efficient MoE design and large-scale, high-quality training data, Ling-mini-2.0 delivers top-tier performance on downstream tasks comparable to dense LLMs under 10 billion parameters and even larger MoE models, despite having only 1.4 billion activated parameters."
|
||||
"description": "Ling-mini-2.0 is a small-sized, high-performance large language model based on the MoE architecture. It has 16 billion total parameters but activates only 1.4 billion per token (789 million non-embedding), achieving extremely high generation speed. Thanks to the efficient MoE design and large-scale high-quality training data, despite activating only 1.4 billion parameters, Ling-mini-2.0 still delivers top-tier performance comparable to dense LLMs under 10 billion parameters and larger MoE models on downstream tasks."
|
||||
},
|
||||
"inclusionAI/Ring-flash-2.0": {
|
||||
"description": "Ring-flash-2.0 is a high-performance reasoning model deeply optimized based on Ling-flash-2.0-base. It employs a mixture-of-experts (MoE) architecture with a total of 100 billion parameters but activates only 6.1 billion parameters per inference. The model uses the proprietary icepop algorithm to solve the instability issues of MoE large models during reinforcement learning (RL) training, enabling continuous improvement of complex reasoning capabilities over long training cycles. Ring-flash-2.0 has achieved significant breakthroughs in challenging benchmarks such as math competitions, code generation, and logical reasoning. Its performance not only surpasses top dense models under 40 billion parameters but also rivals larger open-source MoE models and closed-source high-performance reasoning models. Although focused on complex reasoning, it also performs well in creative writing tasks. Additionally, thanks to its efficient architecture, Ring-flash-2.0 delivers strong performance with high-speed inference, significantly reducing deployment costs for reasoning models in high-concurrency scenarios."
|
||||
},
|
||||
"internlm/internlm2_5-7b-chat": {
|
||||
"description": "InternLM2.5 offers intelligent dialogue solutions across multiple scenarios."
|
||||
@@ -1974,7 +2001,10 @@
|
||||
"description": "LLaVA is a multimodal model that combines a visual encoder with Vicuna for powerful visual and language understanding."
|
||||
},
|
||||
"magistral-medium-latest": {
|
||||
"description": "Magistral Medium 1.1 is a state-of-the-art inference model released by Mistral AI in July 2025."
|
||||
"description": "Magistral Medium 1.2 is a cutting-edge inference model with visual support, released by Mistral AI in September 2025."
|
||||
},
|
||||
"magistral-small-2509": {
|
||||
"description": "Magistral Small 1.2 is an open-source compact inference model with visual support, released by Mistral AI in September 2025."
|
||||
},
|
||||
"mathstral": {
|
||||
"description": "MathΣtral is designed for scientific research and mathematical reasoning, providing effective computational capabilities and result interpretation."
|
||||
@@ -2282,9 +2312,6 @@
|
||||
"mistral/mistral-large": {
|
||||
"description": "Mistral Large is ideal for complex tasks requiring large-scale reasoning capabilities or high specialization—such as synthetic text generation, code generation, RAG, or agents."
|
||||
},
|
||||
"mistral/mistral-saba-24b": {
|
||||
"description": "Mistral Saba 24B is a 24 billion parameter open-source model developed by Mistral.ai. Saba is a specialized model trained to excel in Arabic, Persian, Urdu, Hebrew, and Indian languages. Served by Groq using its custom Language Processing Unit (LPU) hardware for fast, efficient inference."
|
||||
},
|
||||
"mistral/mistral-small": {
|
||||
"description": "Mistral Small is ideal for simple tasks that can be batched—such as classification, customer support, or text generation. It delivers excellent performance at an affordable price point."
|
||||
},
|
||||
@@ -2357,9 +2384,6 @@
|
||||
"moonshotai/Kimi-Dev-72B": {
|
||||
"description": "Kimi-Dev-72B is an open-source large code model optimized through extensive reinforcement learning, capable of producing robust, production-ready patches. This model achieved a new high score of 60.4% on SWE-bench Verified, setting a record for open-source models in automated software engineering tasks such as defect repair and code review."
|
||||
},
|
||||
"moonshotai/Kimi-K2-Instruct": {
|
||||
"description": "Kimi K2 is a MoE architecture base model with exceptional coding and agent capabilities, featuring 1 trillion total parameters and 32 billion activated parameters. In benchmark tests across general knowledge reasoning, programming, mathematics, and agent tasks, the K2 model outperforms other mainstream open-source models."
|
||||
},
|
||||
"moonshotai/Kimi-K2-Instruct-0905": {
|
||||
"description": "Kimi K2-Instruct-0905 is the latest and most powerful version of Kimi K2. It is a top-tier Mixture of Experts (MoE) language model with a total of 1 trillion parameters and 32 billion activated parameters. Key features of this model include enhanced agent coding intelligence, demonstrating significant performance improvements in public benchmark tests and real-world agent coding tasks; and an improved frontend coding experience, with advancements in both aesthetics and practicality for frontend programming."
|
||||
},
|
||||
@@ -2570,6 +2594,9 @@
|
||||
"qwen-image": {
|
||||
"description": "Qwen-Image is a general-purpose image generation model that supports a wide range of artistic styles and is particularly adept at rendering complex text, especially Chinese and English. The model supports multi-line layouts, paragraph-level text generation, and fine-grained detail rendering, enabling complex mixed text-and-image layout designs."
|
||||
},
|
||||
"qwen-image-edit": {
|
||||
"description": "Qwen Image Edit is an image-to-image model that supports editing and modifying images based on input images and text prompts, enabling precise adjustments and creative transformations of the original image according to user needs."
|
||||
},
|
||||
"qwen-long": {
|
||||
"description": "Qwen is a large-scale language model that supports long text contexts and dialogue capabilities based on long documents and multiple documents."
|
||||
},
|
||||
@@ -2804,8 +2831,11 @@
|
||||
"qwen3-coder-plus": {
|
||||
"description": "Tongyi Qianwen code model. The latest Qwen3-Coder series models are code generation models based on Qwen3, equipped with powerful Coding Agent capabilities, proficient in tool invocation and environment interaction, enabling autonomous programming with excellent coding skills alongside general capabilities."
|
||||
},
|
||||
"qwen3-max-preview": {
|
||||
"description": "The Qwen 3 series Max model preview version shows a significant overall improvement compared to the 2.5 series in general capabilities, including Chinese and English text understanding, complex instruction adherence, subjective open tasks, multilingual capabilities, and tool invocation. The model also exhibits fewer knowledge hallucinations."
|
||||
"qwen3-coder:480b": {
|
||||
"description": "Alibaba's high-performance long-context model tailored for agent and coding tasks."
|
||||
},
|
||||
"qwen3-max": {
|
||||
"description": "Tongyi Qianwen 3 series Max model, which shows significant overall improvements compared to the 2.5 series, including enhanced bilingual (Chinese and English) text understanding, complex instruction following, subjective open-domain task capabilities, multilingual support, and tool invocation abilities; the model also exhibits fewer hallucinations. The latest qwen3-max model features specialized upgrades in agent programming and tool invocation compared to the qwen3-max-preview version. The officially released model achieves state-of-the-art performance in its domain and is adapted to more complex agent scenarios."
|
||||
},
|
||||
"qwen3-next-80b-a3b-instruct": {
|
||||
"description": "A new generation of non-thinking mode open-source model based on Qwen3. Compared to the previous version (Tongyi Qianwen 3-235B-A22B-Instruct-2507), it offers better Chinese text comprehension, enhanced logical reasoning abilities, and improved performance in text generation tasks."
|
||||
@@ -2813,6 +2843,9 @@
|
||||
"qwen3-next-80b-a3b-thinking": {
|
||||
"description": "A new generation of thinking mode open-source model based on Qwen3. Compared to the previous version (Tongyi Qianwen 3-235B-A22B-Thinking-2507), it features improved instruction-following capabilities and more concise model-generated summaries."
|
||||
},
|
||||
"qwen3-vl-plus": {
|
||||
"description": "Tongyi Qianwen VL is a text generation model with visual (image) understanding capabilities. It can perform OCR (image text recognition) and further summarize and reason, such as extracting attributes from product photos or solving problems based on exercise images."
|
||||
},
|
||||
"qwq": {
|
||||
"description": "QwQ is an experimental research model focused on improving AI reasoning capabilities."
|
||||
},
|
||||
|
||||
@@ -281,6 +281,7 @@
|
||||
"actionFiletip": "Subir archivo",
|
||||
"actionTooltip": "Subir",
|
||||
"disabled": "El modelo actual no soporta reconocimiento visual ni análisis de archivos, por favor cambie de modelo para usar esta función",
|
||||
"fileNotSupported": "La carga de archivos no está soportada en el modo navegador, solo se permiten imágenes",
|
||||
"visionNotSupported": "El modelo actual no admite reconocimiento visual, por favor cambie de modelo para usar esta función"
|
||||
},
|
||||
"preview": {
|
||||
@@ -289,6 +290,9 @@
|
||||
"pending": "Preparando para subir...",
|
||||
"processing": "Procesando archivo..."
|
||||
}
|
||||
},
|
||||
"validation": {
|
||||
"videoSizeExceeded": "El tamaño del archivo de video no puede superar los 20 MB, el tamaño actual es {{actualSize}}"
|
||||
}
|
||||
},
|
||||
"zenMode": "Modo de concentración"
|
||||
|
||||
@@ -114,6 +114,7 @@
|
||||
"reasoning": "Este modelo admite un pensamiento profundo",
|
||||
"search": "Este modelo admite búsqueda en línea",
|
||||
"tokens": "Este modelo admite un máximo de {{tokens}} tokens por sesión.",
|
||||
"video": "Este modelo admite reconocimiento de video",
|
||||
"vision": "Este modelo admite el reconocimiento visual."
|
||||
},
|
||||
"removed": "El modelo no está en la lista, se eliminará automáticamente si se cancela la selección"
|
||||
|
||||
+53
-20
@@ -287,9 +287,6 @@
|
||||
"Pro/deepseek-ai/DeepSeek-V3.1": {
|
||||
"description": "DeepSeek-V3.1 es un modelo de lenguaje grande híbrido lanzado por DeepSeek AI, que incorpora múltiples mejoras importantes sobre su predecesor. Una innovación clave es la integración de los modos \"Pensamiento\" y \"No pensamiento\" en un solo modelo, permitiendo a los usuarios alternar flexiblemente mediante la configuración de plantillas de chat para adaptarse a diferentes tareas. Gracias a una optimización post-entrenamiento especializada, V3.1 mejora significativamente el rendimiento en llamadas a herramientas y tareas Agent, soportando mejor herramientas de búsqueda externas y la ejecución de tareas complejas en múltiples pasos. Basado en DeepSeek-V3.1-Base, se amplió considerablemente la cantidad de datos de entrenamiento mediante un método de extensión de texto largo en dos fases, mejorando su desempeño en documentos extensos y código largo. Como modelo de código abierto, DeepSeek-V3.1 demuestra capacidades comparables a los mejores modelos cerrados en benchmarks de codificación, matemáticas y razonamiento, y gracias a su arquitectura de expertos mixtos (MoE), mantiene una gran capacidad de modelo mientras reduce eficazmente los costos de inferencia."
|
||||
},
|
||||
"Pro/moonshotai/Kimi-K2-Instruct": {
|
||||
"description": "Kimi K2 es un modelo base con arquitectura MoE que posee capacidades avanzadas de codificación y agentes, con un total de 1 billón de parámetros y 32 mil millones de parámetros activados. En pruebas de referencia en categorías principales como razonamiento general, programación, matemáticas y agentes, el rendimiento del modelo K2 supera a otros modelos de código abierto populares."
|
||||
},
|
||||
"Pro/moonshotai/Kimi-K2-Instruct-0905": {
|
||||
"description": "Kimi K2-Instruct-0905 es la versión más reciente y potente de Kimi K2. Es un modelo de lenguaje de expertos mixtos (MoE) de primer nivel, con un total de un billón de parámetros y 32 mil millones de parámetros activados. Las principales características de este modelo incluyen: inteligencia mejorada para agentes de codificación, mostrando un rendimiento notable en pruebas de referencia públicas y en tareas reales de agentes de codificación; y una experiencia mejorada en la codificación frontend, con avances tanto en la estética como en la funcionalidad de la programación frontend."
|
||||
},
|
||||
@@ -380,6 +377,12 @@
|
||||
"Qwen/Qwen3-Coder-480B-A35B-Instruct": {
|
||||
"description": "Qwen3-Coder-480B-A35B-Instruct es un modelo de código publicado por Alibaba, hasta la fecha el más capaz en términos de agencia (agentic). Es un modelo de expertos mixtos (MoE) con 480 000 millones de parámetros en total y 35 000 millones de parámetros de activación, que logra un equilibrio entre eficiencia y rendimiento. El modelo admite de forma nativa una longitud de contexto de 256K (aprox. 260 000) tokens y puede ampliarse hasta 1 000 000 tokens mediante métodos de extrapolación como YaRN, lo que le permite manejar bases de código a gran escala y tareas de programación complejas. Qwen3-Coder está diseñado para flujos de trabajo de codificación orientados a agentes: no solo genera código, sino que puede interactuar de forma autónoma con herramientas y entornos de desarrollo para resolver problemas de programación complejos. En múltiples pruebas de referencia de tareas de codificación y de agente, este modelo ha alcanzado un nivel superior entre los modelos de código abierto, y su rendimiento puede compararse con el de modelos líderes como Claude Sonnet 4."
|
||||
},
|
||||
"Qwen/Qwen3-Next-80B-A3B-Instruct": {
|
||||
"description": "Qwen3-Next-80B-A3B-Instruct es un modelo base de próxima generación lanzado por el equipo Tongyi Qianwen de Alibaba. Está basado en la nueva arquitectura Qwen3-Next, diseñada para lograr una eficiencia extrema en entrenamiento e inferencia. Este modelo utiliza un innovador mecanismo de atención híbrida (Gated DeltaNet y Gated Attention), una estructura de expertos mixtos altamente dispersos (MoE) y múltiples optimizaciones para la estabilidad del entrenamiento. Como un modelo disperso con un total de 80 mil millones de parámetros, solo activa alrededor de 3 mil millones durante la inferencia, reduciendo significativamente el costo computacional. En tareas de contexto largo que superan los 32K tokens, su rendimiento de inferencia es más de 10 veces superior al modelo Qwen3-32B. Esta versión está afinada para instrucciones, diseñada para tareas generales y no soporta el modo de cadena de pensamiento (Thinking). En cuanto a rendimiento, es comparable al modelo insignia Qwen3-235B en algunas pruebas de referencia, mostrando ventajas claras en tareas de contexto ultra largo."
|
||||
},
|
||||
"Qwen/Qwen3-Next-80B-A3B-Thinking": {
|
||||
"description": "Qwen3-Next-80B-A3B-Thinking es un modelo base de próxima generación lanzado por el equipo Tongyi Qianwen de Alibaba, diseñado específicamente para tareas complejas de razonamiento. Basado en la innovadora arquitectura Qwen3-Next, que integra mecanismos de atención híbrida (Gated DeltaNet y Gated Attention) y una estructura de expertos mixtos altamente dispersos (MoE), busca alcanzar una eficiencia extrema en entrenamiento e inferencia. Como modelo disperso con 80 mil millones de parámetros totales, solo activa alrededor de 3 mil millones durante la inferencia, reduciendo considerablemente el costo computacional. En tareas de contexto largo que superan los 32K tokens, su rendimiento es más de 10 veces superior al modelo Qwen3-32B. Esta versión “Thinking” está optimizada para ejecutar tareas complejas de múltiples pasos como demostraciones matemáticas, síntesis de código, análisis lógico y planificación, y por defecto produce el proceso de razonamiento en forma estructurada de “cadena de pensamiento”. En rendimiento, supera no solo a modelos más costosos como Qwen3-32B-Thinking, sino también a Gemini-2.5-Flash-Thinking en múltiples benchmarks."
|
||||
},
|
||||
"Qwen2-72B-Instruct": {
|
||||
"description": "Qwen2 es la última serie del modelo Qwen, que admite un contexto de 128k. En comparación con los modelos de código abierto más óptimos actuales, Qwen2-72B supera significativamente a los modelos líderes actuales en comprensión del lenguaje natural, conocimiento, código, matemáticas y capacidades multilingües."
|
||||
},
|
||||
@@ -809,9 +812,6 @@
|
||||
"codex-mini-latest": {
|
||||
"description": "codex-mini-latest es una versión ajustada de o4-mini, diseñada específicamente para Codex CLI. Para uso directo a través de la API, recomendamos comenzar con gpt-4.1."
|
||||
},
|
||||
"cognitivecomputations/dolphin-mixtral-8x22b": {
|
||||
"description": "Dolphin Mixtral 8x22B es un modelo diseñado para seguir instrucciones, diálogos y programación."
|
||||
},
|
||||
"cogview-4": {
|
||||
"description": "CogView-4 es el primer modelo de generación de imágenes a partir de texto de código abierto de Zhipu que admite la generación de caracteres chinos. Ofrece mejoras integrales en la comprensión semántica, la calidad de generación de imágenes y la capacidad de generar texto en chino e inglés. Soporta entradas bilingües en chino e inglés de cualquier longitud y puede generar imágenes en cualquier resolución dentro del rango especificado."
|
||||
},
|
||||
@@ -926,6 +926,9 @@
|
||||
"deepseek-ai/deepseek-r1": {
|
||||
"description": "LLM eficiente de última generación, experto en razonamiento, matemáticas y programación."
|
||||
},
|
||||
"deepseek-ai/deepseek-v3.1": {
|
||||
"description": "DeepSeek V3.1: modelo de inferencia de próxima generación que mejora las capacidades de razonamiento complejo y pensamiento en cadena, ideal para tareas que requieren análisis profundo."
|
||||
},
|
||||
"deepseek-ai/deepseek-vl2": {
|
||||
"description": "DeepSeek-VL2 es un modelo de lenguaje visual de expertos mixtos (MoE) desarrollado sobre DeepSeekMoE-27B, que utiliza una arquitectura MoE de activación dispersa, logrando un rendimiento excepcional al activar solo 4.5B de parámetros. Este modelo destaca en múltiples tareas como preguntas visuales, reconocimiento óptico de caracteres, comprensión de documentos/tablas/gráficos y localización visual."
|
||||
},
|
||||
@@ -1007,6 +1010,9 @@
|
||||
"deepseek-v3.1": {
|
||||
"description": "DeepSeek-V3.1 es un nuevo modelo híbrido de razonamiento lanzado por DeepSeek, que soporta dos modos de razonamiento: con pensamiento y sin pensamiento, con una eficiencia de pensamiento superior a DeepSeek-R1-0528. Tras una optimización post-entrenamiento, el uso de herramientas Agent y el rendimiento en tareas inteligentes han mejorado significativamente. Soporta una ventana de contexto de 128k y una longitud máxima de salida de 64k tokens."
|
||||
},
|
||||
"deepseek-v3.1:671b": {
|
||||
"description": "DeepSeek V3.1: modelo de inferencia de próxima generación que mejora las capacidades de razonamiento complejo y pensamiento en cadena, ideal para tareas que requieren análisis profundo."
|
||||
},
|
||||
"deepseek/deepseek-chat-v3-0324": {
|
||||
"description": "DeepSeek V3 es un modelo experto de mezcla de 685B parámetros, la última iteración de la serie de modelos de chat insignia del equipo de DeepSeek.\n\nHereda el modelo [DeepSeek V3](/deepseek/deepseek-chat-v3) y se desempeña excepcionalmente en diversas tareas."
|
||||
},
|
||||
@@ -1626,7 +1632,7 @@
|
||||
"description": "ChatGPT-4o es un modelo dinámico que se actualiza en tiempo real para mantener la versión más reciente. Combina una poderosa comprensión del lenguaje con habilidades de generación, adecuada para escenarios de aplicación a gran escala, incluidos servicio al cliente, educación y soporte técnico."
|
||||
},
|
||||
"gpt-4o-audio-preview": {
|
||||
"description": "Modelo de audio GPT-4o, que admite entrada y salida de audio."
|
||||
"description": "Modelo GPT-4o Audio Preview, compatible con entrada y salida de audio."
|
||||
},
|
||||
"gpt-4o-mini": {
|
||||
"description": "GPT-4o mini es el último modelo lanzado por OpenAI después de GPT-4 Omni, que admite entradas de texto e imagen y genera texto como salida. Como su modelo más avanzado de menor tamaño, es mucho más económico que otros modelos de vanguardia recientes y es más de un 60% más barato que GPT-3.5 Turbo. Mantiene una inteligencia de vanguardia mientras ofrece una relación calidad-precio significativa. GPT-4o mini obtuvo un puntaje del 82% en la prueba MMLU y actualmente se clasifica por encima de GPT-4 en preferencias de chat."
|
||||
@@ -1667,24 +1673,33 @@
|
||||
"gpt-5-chat-latest": {
|
||||
"description": "Modelo GPT-5 utilizado en ChatGPT. Combina una potente comprensión y generación del lenguaje, ideal para aplicaciones de interacción conversacional."
|
||||
},
|
||||
"gpt-5-codex": {
|
||||
"description": "GPT-5 Codex es una versión optimizada de GPT-5 para tareas de codificación de agentes en entornos Codex o similares."
|
||||
},
|
||||
"gpt-5-mini": {
|
||||
"description": "Versión más rápida y económica de GPT-5, adecuada para tareas bien definidas. Ofrece respuestas más rápidas manteniendo una salida de alta calidad."
|
||||
},
|
||||
"gpt-5-nano": {
|
||||
"description": "Versión más rápida y económica de GPT-5. Perfecta para escenarios que requieren respuestas rápidas y son sensibles al costo."
|
||||
},
|
||||
"gpt-audio": {
|
||||
"description": "GPT Audio es un modelo de chat general para entrada y salida de audio, compatible con el uso de audio I/O en la API de Chat Completions."
|
||||
},
|
||||
"gpt-image-1": {
|
||||
"description": "Modelo nativo multimodal de generación de imágenes de ChatGPT."
|
||||
},
|
||||
"gpt-oss": {
|
||||
"description": "GPT-OSS 20B es un modelo de lenguaje abierto lanzado por OpenAI, que utiliza la tecnología de cuantificación MXFP4, adecuado para ejecutarse en GPU de consumo de alta gama o en Mac con Apple Silicon. Este modelo destaca en la generación de diálogos, escritura de código y tareas de razonamiento, y soporta llamadas a funciones y uso de herramientas."
|
||||
},
|
||||
"gpt-oss-120b": {
|
||||
"description": "GPT-OSS-120B MXFP4: estructura Transformer cuantificada que mantiene un rendimiento sólido incluso con recursos limitados."
|
||||
},
|
||||
"gpt-oss:120b": {
|
||||
"description": "GPT-OSS 120B es un modelo de lenguaje abierto de gran escala lanzado por OpenAI, que emplea la tecnología de cuantificación MXFP4, siendo un modelo insignia. Requiere múltiples GPU o estaciones de trabajo de alto rendimiento para su ejecución, y ofrece un rendimiento sobresaliente en razonamiento complejo, generación de código y procesamiento multilingüe, soportando llamadas avanzadas a funciones e integración de herramientas."
|
||||
},
|
||||
"gpt-oss:20b": {
|
||||
"description": "GPT-OSS 20B es un modelo de lenguaje grande de código abierto lanzado por OpenAI, que utiliza la tecnología de cuantificación MXFP4, adecuado para ejecutarse en GPUs de consumo de alta gama o Macs con Apple Silicon. Este modelo destaca en generación de diálogos, escritura de código y tareas de razonamiento, soportando llamadas a funciones y uso de herramientas."
|
||||
},
|
||||
"gpt-realtime": {
|
||||
"description": "Modelo universal en tiempo real que soporta entrada y salida de texto y audio, además de entrada de imágenes."
|
||||
},
|
||||
"grok-2-1212": {
|
||||
"description": "Este modelo ha mejorado en precisión, cumplimiento de instrucciones y capacidades multilingües."
|
||||
},
|
||||
@@ -1712,6 +1727,12 @@
|
||||
"grok-4-0709": {
|
||||
"description": "Grok 4 de xAI, con potentes capacidades de razonamiento."
|
||||
},
|
||||
"grok-4-fast-non-reasoning": {
|
||||
"description": "Nos complace anunciar Grok 4 Fast, nuestro último avance en modelos de inferencia con alta relación costo-beneficio."
|
||||
},
|
||||
"grok-4-fast-reasoning": {
|
||||
"description": "Nos complace anunciar Grok 4 Fast, nuestro último avance en modelos de inferencia con alta relación costo-beneficio."
|
||||
},
|
||||
"grok-code-fast-1": {
|
||||
"description": "Nos complace presentar grok-code-fast-1, un modelo de inferencia rápido y económico que destaca en la codificación de agentes."
|
||||
},
|
||||
@@ -1847,8 +1868,14 @@
|
||||
"inception/mercury-coder-small": {
|
||||
"description": "Mercury Coder Small es la opción ideal para tareas de generación, depuración y refactorización de código, con latencia mínima."
|
||||
},
|
||||
"inclusionAI/Ling-flash-2.0": {
|
||||
"description": "Ling-flash-2.0 es el tercer modelo de la serie Ling 2.0 basado en la arquitectura MoE, lanzado por el equipo Bailing de Ant Group. Cuenta con 100 mil millones de parámetros totales, pero solo activa 6.1 mil millones por token (4.8 mil millones sin incluir embeddings). Como un modelo de configuración ligera, Ling-flash-2.0 demuestra en múltiples evaluaciones oficiales un rendimiento comparable o superior a modelos densos de 40 mil millones y a modelos MoE de mayor escala. Este modelo busca explorar caminos eficientes bajo el consenso de que un modelo grande equivale a muchos parámetros, mediante un diseño arquitectónico y estrategias de entrenamiento extremas."
|
||||
},
|
||||
"inclusionAI/Ling-mini-2.0": {
|
||||
"description": "Ling-mini-2.0 es un modelo de lenguaje grande de alto rendimiento y tamaño pequeño basado en la arquitectura MoE. Cuenta con 16 mil millones de parámetros totales, pero solo activa 1.4 mil millones por token (no embedding 789 millones), lo que permite una velocidad de generación extremadamente alta. Gracias al diseño eficiente de MoE y a un entrenamiento a gran escala con datos de alta calidad, a pesar de tener solo 1.4 mil millones de parámetros activados, Ling-mini-2.0 demuestra un rendimiento de primer nivel en tareas downstream, comparable a modelos densos de menos de 10 mil millones de parámetros y a modelos MoE de mayor escala."
|
||||
"description": "Ling-mini-2.0 es un modelo de lenguaje grande de alto rendimiento y tamaño reducido basado en arquitectura MoE. Cuenta con 16 mil millones de parámetros totales, pero solo activa 1.4 mil millones por token (789 millones sin incluir embeddings), logrando una velocidad de generación muy alta. Gracias a un diseño MoE eficiente y a un entrenamiento masivo con datos de alta calidad, Ling-mini-2.0 ofrece un rendimiento de primer nivel en tareas downstream, comparable a modelos densos de menos de 10 mil millones y a modelos MoE de mayor escala."
|
||||
},
|
||||
"inclusionAI/Ring-flash-2.0": {
|
||||
"description": "Ring-flash-2.0 es un modelo de pensamiento de alto rendimiento profundamente optimizado basado en Ling-flash-2.0-base. Utiliza arquitectura MoE con 100 mil millones de parámetros totales, pero solo activa 6.1 mil millones en cada inferencia. Gracias al algoritmo innovador icepop, resuelve la inestabilidad de los grandes modelos MoE en entrenamiento por refuerzo (RL), mejorando continuamente su capacidad de razonamiento complejo en entrenamientos prolongados. Ring-flash-2.0 ha logrado avances significativos en competencias matemáticas, generación de código y razonamiento lógico, superando modelos densos de hasta 40 mil millones de parámetros y equiparándose a modelos MoE de mayor escala y modelos de pensamiento de alto rendimiento cerrados. Aunque está enfocado en razonamiento complejo, también destaca en tareas creativas de escritura. Además, su diseño eficiente permite un rendimiento rápido y reduce significativamente los costos de despliegue en escenarios de alta concurrencia."
|
||||
},
|
||||
"internlm/internlm2_5-7b-chat": {
|
||||
"description": "InternLM2.5 ofrece soluciones de diálogo inteligente en múltiples escenarios."
|
||||
@@ -1974,7 +2001,10 @@
|
||||
"description": "LLaVA es un modelo multimodal que combina un codificador visual y Vicuna, utilizado para una poderosa comprensión visual y lingüística."
|
||||
},
|
||||
"magistral-medium-latest": {
|
||||
"description": "Magistral Medium 1.1 es un modelo de inferencia de última generación lanzado por Mistral AI en julio de 2025."
|
||||
"description": "Magistral Medium 1.2 es un modelo de inferencia de vanguardia con soporte visual, lanzado por Mistral AI en septiembre de 2025."
|
||||
},
|
||||
"magistral-small-2509": {
|
||||
"description": "Magistral Small 1.2 es un modelo de inferencia pequeño y de código abierto con soporte visual, lanzado por Mistral AI en septiembre de 2025."
|
||||
},
|
||||
"mathstral": {
|
||||
"description": "MathΣtral está diseñado para la investigación científica y el razonamiento matemático, proporcionando capacidades de cálculo efectivas y explicación de resultados."
|
||||
@@ -2282,9 +2312,6 @@
|
||||
"mistral/mistral-large": {
|
||||
"description": "Mistral Large es ideal para tareas complejas que requieren capacidades de inferencia grandes o altamente especializadas, como generación de texto sintético, generación de código, RAG o agentes."
|
||||
},
|
||||
"mistral/mistral-saba-24b": {
|
||||
"description": "Mistral Saba 24B es un modelo de código abierto de 24 mil millones de parámetros desarrollado por Mistral.ai. Saba es un modelo especializado entrenado para un rendimiento sobresaliente en árabe, persa, urdu, hebreo y lenguas indias. Operado por Groq con su hardware personalizado de unidad de procesamiento de lenguaje (LPU) para ofrecer inferencia rápida y eficiente."
|
||||
},
|
||||
"mistral/mistral-small": {
|
||||
"description": "Mistral Small es ideal para tareas simples que pueden procesarse en lotes, como clasificación, soporte al cliente o generación de texto. Ofrece un rendimiento excelente a un precio asequible."
|
||||
},
|
||||
@@ -2357,9 +2384,6 @@
|
||||
"moonshotai/Kimi-Dev-72B": {
|
||||
"description": "Kimi-Dev-72B es un modelo de código abierto de gran escala, optimizado mediante aprendizaje reforzado a gran escala, capaz de generar parches robustos y listos para producción. Este modelo alcanzó un nuevo récord del 60.4 % en SWE-bench Verified, estableciendo un nuevo estándar para modelos de código abierto en tareas automatizadas de ingeniería de software como la corrección de errores y la revisión de código."
|
||||
},
|
||||
"moonshotai/Kimi-K2-Instruct": {
|
||||
"description": "Kimi K2 es un modelo base con arquitectura MoE que posee capacidades avanzadas de codificación y agentes, con un total de 1 billón de parámetros y 32 mil millones de parámetros activados. En pruebas de referencia en categorías principales como razonamiento general, programación, matemáticas y agentes, el rendimiento del modelo K2 supera a otros modelos de código abierto populares."
|
||||
},
|
||||
"moonshotai/Kimi-K2-Instruct-0905": {
|
||||
"description": "Kimi K2-Instruct-0905 es la versión más reciente y potente de Kimi K2. Es un modelo de lenguaje de expertos mixtos (MoE) de primer nivel, con un total de un billón de parámetros y 32 mil millones de parámetros activados. Las principales características de este modelo incluyen: inteligencia mejorada para agentes de codificación, mostrando un rendimiento notable en pruebas de referencia públicas y en tareas reales de agentes de codificación; y una experiencia mejorada en la codificación frontend, con avances tanto en la estética como en la funcionalidad de la programación frontend."
|
||||
},
|
||||
@@ -2570,6 +2594,9 @@
|
||||
"qwen-image": {
|
||||
"description": "Qwen-Image es un modelo de generación de imágenes de uso general que admite diversos estilos artísticos y destaca por su capacidad para renderizar textos complejos, especialmente textos en chino e inglés. El modelo soporta maquetación en varias líneas, generación de texto a nivel de párrafo y representación de detalles finos, lo que permite crear diseños complejos que combinan texto e imagen."
|
||||
},
|
||||
"qwen-image-edit": {
|
||||
"description": "Qwen Image Edit es un modelo de generación de imágenes que permite la edición y modificación de imágenes basándose en una imagen de entrada y un texto indicativo, capaz de realizar ajustes precisos y transformaciones creativas en la imagen original según las necesidades del usuario."
|
||||
},
|
||||
"qwen-long": {
|
||||
"description": "Qwen es un modelo de lenguaje a gran escala que admite contextos de texto largos y funciones de conversación basadas en documentos largos y múltiples."
|
||||
},
|
||||
@@ -2804,8 +2831,11 @@
|
||||
"qwen3-coder-plus": {
|
||||
"description": "Modelo de código Tongyi Qianwen. La última serie de modelos Qwen3-Coder está basada en Qwen3 para generación de código, con una potente capacidad de agente de codificación, experta en llamadas a herramientas e interacción con el entorno, capaz de programación autónoma, combinando una excelente habilidad en código con capacidades generales."
|
||||
},
|
||||
"qwen3-max-preview": {
|
||||
"description": "Versión preliminar del modelo Max de la serie Qwen 3, que presenta una mejora significativa en la capacidad general en comparación con la serie 2.5, incluyendo comprensión de texto en chino e inglés, cumplimiento de instrucciones complejas, tareas abiertas subjetivas, capacidades multilingües y llamadas a herramientas; además, reduce notablemente las alucinaciones de conocimiento del modelo."
|
||||
"qwen3-coder:480b": {
|
||||
"description": "Modelo de contexto largo de alto rendimiento de Alibaba, optimizado para tareas de agentes y codificación."
|
||||
},
|
||||
"qwen3-max": {
|
||||
"description": "La serie Max de Tongyi Qianwen 3 representa una mejora significativa en la capacidad general respecto a la serie 2.5, con habilidades mejoradas en comprensión de texto en chino e inglés, seguimiento de instrucciones complejas, tareas abiertas subjetivas, multilingüismo y llamadas a herramientas; además, reduce las alucinaciones de conocimiento del modelo. La última versión qwen3-max ha sido especialmente mejorada en programación de agentes y llamadas a herramientas respecto a la versión previa qwen3-max-preview. El modelo oficial lanzado alcanza un nivel SOTA en su campo, adaptándose a demandas más complejas de agentes."
|
||||
},
|
||||
"qwen3-next-80b-a3b-instruct": {
|
||||
"description": "Modelo de código abierto de nueva generación basado en Qwen3 en modo no reflexivo, que ofrece una mejor comprensión del texto en chino, mayor capacidad de razonamiento lógico y un mejor desempeño en tareas de generación de texto en comparación con la versión anterior (Tongyi Qianwen 3-235B-A22B-Instruct-2507)."
|
||||
@@ -2813,6 +2843,9 @@
|
||||
"qwen3-next-80b-a3b-thinking": {
|
||||
"description": "Modelo de código abierto de nueva generación basado en Qwen3 en modo reflexivo, que mejora la capacidad de seguir instrucciones y ofrece respuestas más concisas en comparación con la versión anterior (Tongyi Qianwen 3-235B-A22B-Thinking-2507)."
|
||||
},
|
||||
"qwen3-vl-plus": {
|
||||
"description": "Tongyi Qianwen VL es un modelo generativo de texto con capacidad de comprensión visual (imágenes). No solo puede realizar OCR (reconocimiento de texto en imágenes), sino también resumir y razonar, por ejemplo, extrayendo atributos de fotos de productos o resolviendo problemas a partir de imágenes de ejercicios."
|
||||
},
|
||||
"qwq": {
|
||||
"description": "QwQ es un modelo de investigación experimental que se centra en mejorar la capacidad de razonamiento de la IA."
|
||||
},
|
||||
|
||||
@@ -281,6 +281,7 @@
|
||||
"actionFiletip": "بارگذاری فایل",
|
||||
"actionTooltip": "بارگذاری",
|
||||
"disabled": "مدل فعلی از تشخیص بصری و تحلیل فایل پشتیبانی نمیکند، لطفاً مدل را تغییر دهید و دوباره امتحان کنید",
|
||||
"fileNotSupported": "در حالت مرورگر، بارگذاری فایل پشتیبانی نمیشود و فقط تصاویر قابل بارگذاری هستند",
|
||||
"visionNotSupported": "مدل فعلی از شناسایی بصری پشتیبانی نمیکند، لطفاً مدل را تغییر دهید و دوباره امتحان کنید"
|
||||
},
|
||||
"preview": {
|
||||
@@ -289,6 +290,9 @@
|
||||
"pending": "آماده برای بارگذاری...",
|
||||
"processing": "در حال پردازش فایل..."
|
||||
}
|
||||
},
|
||||
"validation": {
|
||||
"videoSizeExceeded": "حجم فایل ویدئویی نباید از ۲۰ مگابایت بیشتر باشد، حجم فعلی فایل {{actualSize}} است"
|
||||
}
|
||||
},
|
||||
"zenMode": "حالت تمرکز"
|
||||
|
||||
@@ -114,6 +114,7 @@
|
||||
"reasoning": "این مدل از تفکر عمیق پشتیبانی میکند",
|
||||
"search": "این مدل از جستجوی آنلاین پشتیبانی میکند",
|
||||
"tokens": "این مدل در هر جلسه حداکثر از {{tokens}} توکن پشتیبانی میکند",
|
||||
"video": "این مدل از شناسایی ویدئو پشتیبانی میکند",
|
||||
"vision": "این مدل از تشخیص بصری پشتیبانی میکند"
|
||||
},
|
||||
"removed": "این مدل دیگر در فهرست نیست، در صورت لغو انتخاب بهطور خودکار حذف خواهد شد"
|
||||
|
||||
+53
-20
@@ -287,9 +287,6 @@
|
||||
"Pro/deepseek-ai/DeepSeek-V3.1": {
|
||||
"description": "DeepSeek-V3.1 یک مدل زبان بزرگ با حالت ترکیبی است که توسط DeepSeek AI منتشر شده و در مقایسه با نسخههای قبلی خود بهروزرسانیهای مهمی را تجربه کرده است. نوآوری اصلی این مدل ادغام «حالت تفکر» و «حالت غیرتفکر» در یک مدل است که کاربران میتوانند با تنظیم قالب گفتگو به صورت انعطافپذیر بین آنها جابجا شوند تا نیازهای مختلف وظایف را برآورده کنند. با بهینهسازی پس از آموزش تخصصی، عملکرد V3.1 در فراخوانی ابزارها و وظایف Agent به طور قابل توجهی افزایش یافته و پشتیبانی بهتری از ابزارهای جستجوی خارجی و اجرای وظایف پیچیده چندمرحلهای ارائه میدهد. این مدل بر پایه DeepSeek-V3.1-Base آموزش داده شده و با روش توسعه متن بلند دو مرحلهای، حجم دادههای آموزشی را به طور چشمگیری افزایش داده است که باعث بهبود عملکرد در پردازش اسناد طولانی و کدهای بلند میشود. به عنوان یک مدل متنباز، DeepSeek-V3.1 در آزمونهای معیار مختلفی مانند کدنویسی، ریاضیات و استدلال تواناییهایی در حد مدلهای بسته پیشرفته نشان میدهد و با معماری متخصص ترکیبی (MoE) خود، ضمن حفظ ظرفیت عظیم مدل، هزینههای استدلال را به طور موثری کاهش میدهد."
|
||||
},
|
||||
"Pro/moonshotai/Kimi-K2-Instruct": {
|
||||
"description": "Kimi K2 یک مدل پایه با معماری MoE است که دارای تواناییهای بسیار قوی در کدنویسی و عامل است، با 1 تریلیون پارامتر کل و 32 میلیارد پارامتر فعال. در آزمونهای معیار عملکرد در حوزههای دانش عمومی، برنامهنویسی، ریاضیات و عامل، مدل K2 عملکردی فراتر از سایر مدلهای متنباز اصلی دارد."
|
||||
},
|
||||
"Pro/moonshotai/Kimi-K2-Instruct-0905": {
|
||||
"description": "Kimi K2-Instruct-0905 جدیدترین و قدرتمندترین نسخه Kimi K2 است. این مدل یک مدل زبان برتر با معماری متخصص ترکیبی (MoE) است که دارای ۱ تریلیون پارامتر کل و ۳۲ میلیارد پارامتر فعال میباشد. ویژگیهای اصلی این مدل شامل: هوش کدگذاری عامل بهبود یافته که در آزمونهای معیار عمومی و وظایف واقعی کدگذاری عامل عملکرد قابل توجهی نشان میدهد؛ تجربه کدگذاری فرانتاند بهبود یافته که از نظر زیبایی و کاربردی بودن برنامهنویسی فرانتاند پیشرفت داشته است."
|
||||
},
|
||||
@@ -380,6 +377,12 @@
|
||||
"Qwen/Qwen3-Coder-480B-A35B-Instruct": {
|
||||
"description": "Qwen3-Coder-480B-A35B-Instruct مدلی برای برنامهنویسی است که توسط علیبابا منتشر شده و تا کنون بیشترین قابلیتهای عاملمحور (Agentic) را داراست. این مدل یک مدل ترکیب متخصصان (Mixture of Experts - MoE) با حدود 480 میلیارد پارامتر کل و 35 میلیارد پارامتر فعال است که تعادلی میان کارایی و عملکرد برقرار میکند. این مدل بهصورت بومی از طول زمینه 256K (حدود 260 هزار) توکن پشتیبانی میکند و با استفاده از روشهای برونیابی مانند YaRN میتواند تا 1,000,000 توکن گسترش یابد، که آن را قادر میسازد مخازن کد بزرگ و وظایف پیچیده برنامهنویسی را پردازش کند. Qwen3-Coder برای جریانهای کاری کدنویسی عاملمحور طراحی شده است؛ نه تنها میتواند کد تولید کند، بلکه قادر است بهصورت خودکار با ابزارها و محیطهای توسعه تعامل نماید تا مسائل پیچیده برنامهنویسی را حل کند. در چندین بنچمارک مربوط به کدنویسی و وظایف عامل، این مدل در میان مدلهای متنباز در سطح برتر قرار گرفته و عملکرد آن با مدلهای پیشرو مانند Claude Sonnet 4 قابل مقایسه است."
|
||||
},
|
||||
"Qwen/Qwen3-Next-80B-A3B-Instruct": {
|
||||
"description": "Qwen3-Next-80B-A3B-Instruct مدلی پایه نسل بعدی است که توسط تیم Tongyi Qianwen شرکت علیبابا منتشر شده است. این مدل بر اساس معماری جدید Qwen3-Next طراحی شده و هدف آن دستیابی به بالاترین کارایی در آموزش و استنتاج است. این مدل از مکانیزم توجه ترکیبی نوآورانه (Gated DeltaNet و Gated Attention)، ساختار متخصص ترکیبی با پراکندگی بالا (MoE) و چندین بهینهسازی برای پایداری آموزش بهره میبرد. به عنوان یک مدل پراکنده با ۸۰ میلیارد پارامتر کل، در زمان استنتاج تنها حدود ۳ میلیارد پارامتر فعال میشوند که به طور قابل توجهی هزینه محاسباتی را کاهش میدهد و در پردازش وظایف با زمینه طولانی بیش از ۳۲ هزار توکن، توان عملیاتی استنتاج آن بیش از ۱۰ برابر مدل Qwen3-32B است. این مدل نسخه تنظیم شده برای دستورالعملها است و برای وظایف عمومی طراحی شده و از حالت زنجیره فکری (Thinking) پشتیبانی نمیکند. از نظر عملکرد، در برخی بنچمارکها با مدل پرچمدار Tongyi Qianwen یعنی Qwen3-235B برابری میکند و به ویژه در وظایف با زمینه بسیار طولانی برتری قابل توجهی دارد."
|
||||
},
|
||||
"Qwen/Qwen3-Next-80B-A3B-Thinking": {
|
||||
"description": "Qwen3-Next-80B-A3B-Thinking مدلی پایه نسل بعدی است که توسط تیم Tongyi Qianwen شرکت علیبابا برای وظایف استنتاج پیچیده طراحی شده است. این مدل بر اساس معماری نوآورانه Qwen3-Next ساخته شده که مکانیزم توجه ترکیبی (Gated DeltaNet و Gated Attention) و ساختار متخصص ترکیبی با پراکندگی بالا (MoE) را ادغام میکند تا به بالاترین کارایی در آموزش و استنتاج دست یابد. به عنوان یک مدل پراکنده با ۸۰ میلیارد پارامتر کل، در زمان استنتاج تنها حدود ۳ میلیارد پارامتر فعال میشوند که هزینه محاسباتی را به طور چشمگیری کاهش میدهد و در پردازش وظایف با زمینه طولانی بیش از ۳۲ هزار توکن، توان عملیاتی آن بیش از ۱۰ برابر مدل Qwen3-32B است. این نسخه «Thinking» به طور خاص برای انجام وظایف چندمرحلهای دشوار مانند اثبات ریاضی، ترکیب کد، تحلیل منطقی و برنامهریزی بهینه شده و به طور پیشفرض فرایند استنتاج را به صورت ساختاریافته و در قالب «زنجیره فکری» ارائه میدهد. از نظر عملکرد، این مدل نه تنها از مدلهای پرهزینهتر مانند Qwen3-32B-Thinking پیشی گرفته، بلکه در چندین بنچمارک از Gemini-2.5-Flash-Thinking نیز بهتر عمل میکند."
|
||||
},
|
||||
"Qwen2-72B-Instruct": {
|
||||
"description": "Qwen2 جدیدترین سری مدلهای Qwen است که از 128k زمینه پشتیبانی میکند. در مقایسه با بهترین مدلهای متنباز فعلی، Qwen2-72B در درک زبان طبیعی، دانش، کد، ریاضی و چندزبانگی به طور قابل توجهی از مدلهای پیشرو فعلی فراتر رفته است."
|
||||
},
|
||||
@@ -809,9 +812,6 @@
|
||||
"codex-mini-latest": {
|
||||
"description": "codex-mini-latest نسخهای تنظیمشده از o4-mini است که بهطور خاص برای Codex CLI طراحی شده است. برای استفاده مستقیم از طریق API، ما توصیه میکنیم از gpt-4.1 شروع کنید."
|
||||
},
|
||||
"cognitivecomputations/dolphin-mixtral-8x22b": {
|
||||
"description": "Dolphin Mixtral 8x22B یک مدل طراحی شده برای پیروی از دستورات، مکالمه و برنامهنویسی است."
|
||||
},
|
||||
"cogview-4": {
|
||||
"description": "CogView-4 نخستین مدل متن به تصویر متنباز Zhizhu است که از تولید حروف چینی پشتیبانی میکند. این مدل در درک معنایی، کیفیت تولید تصویر و توانایی تولید متون چینی و انگلیسی به طور جامع بهبود یافته است، از ورودی دوزبانه چینی و انگلیسی با طول دلخواه پشتیبانی میکند و قادر است تصاویر با هر وضوحی در محدوده داده شده تولید کند."
|
||||
},
|
||||
@@ -926,6 +926,9 @@
|
||||
"deepseek-ai/deepseek-r1": {
|
||||
"description": "مدل LLM پیشرفته و کارآمد که در استدلال، ریاضیات و برنامهنویسی مهارت دارد."
|
||||
},
|
||||
"deepseek-ai/deepseek-v3.1": {
|
||||
"description": "DeepSeek V3.1: مدل استنتاج نسل بعدی که تواناییهای استنتاج پیچیده و تفکر زنجیرهای را بهبود بخشیده و برای وظایفی که نیاز به تحلیل عمیق دارند مناسب است."
|
||||
},
|
||||
"deepseek-ai/deepseek-vl2": {
|
||||
"description": "DeepSeek-VL2 یک مدل زبانی بصری مبتنی بر DeepSeekMoE-27B است که از معماری MoE با فعالسازی پراکنده استفاده میکند و در حالی که تنها 4.5 میلیارد پارامتر فعال است، عملکرد فوقالعادهای را ارائه میدهد. این مدل در چندین وظیفه از جمله پرسش و پاسخ بصری، شناسایی کاراکتر نوری، درک اسناد/جدولها/نمودارها و مکانیابی بصری عملکرد عالی دارد."
|
||||
},
|
||||
@@ -1007,6 +1010,9 @@
|
||||
"deepseek-v3.1": {
|
||||
"description": "DeepSeek-V3.1 یک مدل استدلال ترکیبی جدید از DeepSeek است که از دو حالت استدلال تفکری و غیرتفکری پشتیبانی میکند و نسبت به DeepSeek-R1-0528 در حالت تفکری کارایی بالاتری دارد. پس از آموزش تکمیلی، استفاده از ابزارهای Agent و عملکرد وظایف هوشمند به طور قابل توجهی بهبود یافته است. پشتیبانی از پنجره متنی 128k و طول خروجی تا 64k توکن."
|
||||
},
|
||||
"deepseek-v3.1:671b": {
|
||||
"description": "DeepSeek V3.1: مدل استنتاج نسل بعدی که تواناییهای استنتاج پیچیده و تفکر زنجیرهای را بهبود بخشیده و برای وظایفی که نیاز به تحلیل عمیق دارند مناسب است."
|
||||
},
|
||||
"deepseek/deepseek-chat-v3-0324": {
|
||||
"description": "DeepSeek V3 یک مدل ترکیبی متخصص با 685B پارامتر است و جدیدترین نسخه از سری مدلهای چت پرچمدار تیم DeepSeek میباشد.\n\nاین مدل از [DeepSeek V3](/deepseek/deepseek-chat-v3) به ارث برده و در انواع وظایف عملکرد عالی از خود نشان میدهد."
|
||||
},
|
||||
@@ -1626,7 +1632,7 @@
|
||||
"description": "ChatGPT-4o یک مدل پویا است که به طور مداوم بهروز رسانی میشود تا نسخه فعلی و جدیدی را حفظ کند. این مدل قدرت فهم و تولید زبان را ترکیب کرده و مناسب برای کاربردهای مقیاس بزرگ مانند خدمات مشتری، آموزش و پشتیبانی فنی است."
|
||||
},
|
||||
"gpt-4o-audio-preview": {
|
||||
"description": "مدل صوتی GPT-4o، پشتیبانی از ورودی و خروجی صوتی."
|
||||
"description": "مدل پیشنمایش صوتی GPT-4o که از ورودی و خروجی صوتی پشتیبانی میکند."
|
||||
},
|
||||
"gpt-4o-mini": {
|
||||
"description": "یک راهحل هوش مصنوعی مقرونبهصرفه که برای انواع وظایف متنی و تصویری مناسب است."
|
||||
@@ -1667,24 +1673,33 @@
|
||||
"gpt-5-chat-latest": {
|
||||
"description": "مدل GPT-5 استفاده شده در ChatGPT. ترکیبی از درک و تولید زبان قدرتمند، مناسب برای برنامههای تعاملی گفتگو محور."
|
||||
},
|
||||
"gpt-5-codex": {
|
||||
"description": "GPT-5 Codex نسخهای از GPT-5 است که برای وظایف کدنویسی نمایندگی در محیطهای Codex یا مشابه بهینه شده است."
|
||||
},
|
||||
"gpt-5-mini": {
|
||||
"description": "نسخهای سریعتر و اقتصادیتر از GPT-5، مناسب برای وظایف با تعریف واضح. در حالی که کیفیت خروجی بالا حفظ میشود، پاسخگویی سریعتری ارائه میدهد."
|
||||
},
|
||||
"gpt-5-nano": {
|
||||
"description": "سریعترین و اقتصادیترین نسخه GPT-5. بسیار مناسب برای کاربردهایی که نیاز به پاسخ سریع و حساسیت به هزینه دارند."
|
||||
},
|
||||
"gpt-audio": {
|
||||
"description": "GPT Audio مدلی عمومی برای چت با ورودی و خروجی صوتی است که از استفاده از ورودی/خروجی صوتی در API تکمیل چت پشتیبانی میکند."
|
||||
},
|
||||
"gpt-image-1": {
|
||||
"description": "مدل تولید تصویر چندرسانهای بومی ChatGPT"
|
||||
},
|
||||
"gpt-oss": {
|
||||
"description": "GPT-OSS 20B یک مدل زبان بزرگ متنباز منتشر شده توسط OpenAI است که از فناوری کوانتیزاسیون MXFP4 استفاده میکند و برای اجرا روی GPUهای مصرفی پیشرفته یا مکهای Apple Silicon مناسب است. این مدل در تولید گفتگو، نوشتن کد و وظایف استدلال عملکرد برجستهای دارد و از فراخوانی توابع و استفاده از ابزارها پشتیبانی میکند."
|
||||
},
|
||||
"gpt-oss-120b": {
|
||||
"description": "GPT-OSS-120B MXFP4: ساختار ترنسفورمر کوانتیزه شده که حتی در منابع محدود عملکرد قوی خود را حفظ میکند."
|
||||
},
|
||||
"gpt-oss:120b": {
|
||||
"description": "GPT-OSS 120B یک مدل زبان بزرگ متنباز منتشر شده توسط OpenAI است که از فناوری کوانتیزاسیون MXFP4 بهره میبرد و به عنوان مدل پرچمدار شناخته میشود. این مدل نیازمند محیطی با چند GPU یا ایستگاه کاری با عملکرد بالا برای اجرا است و در استدلال پیچیده، تولید کد و پردازش چندزبانه عملکردی برجسته دارد و از فراخوانی توابع پیشرفته و یکپارچهسازی ابزارها پشتیبانی میکند."
|
||||
},
|
||||
"gpt-oss:20b": {
|
||||
"description": "GPT-OSS 20B مدل زبان بزرگ متنباز منتشر شده توسط OpenAI است که از تکنولوژی کوانتیزاسیون MXFP4 بهره میبرد و برای اجرا روی GPUهای مصرفی پیشرفته یا مکهای مجهز به Apple Silicon مناسب است. این مدل در تولید گفتگو، کدنویسی و وظایف استنتاج عملکرد برجستهای دارد و از فراخوانی توابع و استفاده از ابزارها پشتیبانی میکند."
|
||||
},
|
||||
"gpt-realtime": {
|
||||
"description": "مدل عمومی زمان واقعی که از ورودی و خروجی متنی و صوتی به صورت زنده پشتیبانی میکند و همچنین ورودی تصویر را نیز قبول میکند."
|
||||
},
|
||||
"grok-2-1212": {
|
||||
"description": "این مدل در دقت، پیروی از دستورات و توانایی چند زبانه بهبود یافته است."
|
||||
},
|
||||
@@ -1712,6 +1727,12 @@
|
||||
"grok-4-0709": {
|
||||
"description": "Grok 4 از xAI با توانایی استدلال قدرتمند."
|
||||
},
|
||||
"grok-4-fast-non-reasoning": {
|
||||
"description": "خوشحالیم که Grok 4 Fast را منتشر میکنیم، که جدیدترین پیشرفت ما در زمینه مدلهای استنتاج با صرفهجویی در هزینه است."
|
||||
},
|
||||
"grok-4-fast-reasoning": {
|
||||
"description": "خوشحالیم که Grok 4 Fast را منتشر میکنیم، که جدیدترین پیشرفت ما در زمینه مدلهای استنتاج با صرفهجویی در هزینه است."
|
||||
},
|
||||
"grok-code-fast-1": {
|
||||
"description": "ما خوشحالیم که grok-code-fast-1 را معرفی کنیم، مدلی سریع و مقرونبهصرفه برای استنتاج که در کدگذاری نماینده عملکرد برجستهای دارد."
|
||||
},
|
||||
@@ -1847,8 +1868,14 @@
|
||||
"inception/mercury-coder-small": {
|
||||
"description": "Mercury Coder Small انتخاب ایدهآل برای تولید، اشکالزدایی و بازسازی کد با کمترین تأخیر است."
|
||||
},
|
||||
"inclusionAI/Ling-flash-2.0": {
|
||||
"description": "Ling-flash-2.0 سومین مدل از سری معماری Ling 2.0 است که توسط تیم Bailing شرکت Ant Group منتشر شده است. این مدل یک مدل متخصص ترکیبی (MoE) با ۱۰۰ میلیارد پارامتر کل است که در هر توکن تنها ۶.۱ میلیارد پارامتر فعال میشوند (۴.۸ میلیارد غیر بردار کلمه). به عنوان یک مدل با پیکربندی سبک، Ling-flash-2.0 در چندین ارزیابی معتبر عملکردی برابر یا حتی فراتر از مدلهای متراکم ۴۰ میلیارد پارامتری و مدلهای MoE بزرگتر نشان داده است. هدف این مدل کشف مسیرهای کارآمد در چارچوب «مدل بزرگ برابر است با پارامتر بزرگ» از طریق طراحی معماری و استراتژیهای آموزش بهینه است."
|
||||
},
|
||||
"inclusionAI/Ling-mini-2.0": {
|
||||
"description": "Ling-mini-2.0 یک مدل زبان بزرگ کوچکحجم و با عملکرد بالا مبتنی بر معماری MoE است. این مدل دارای ۱۶ میلیارد پارامتر کل است، اما برای هر توکن تنها ۱.۴ میلیارد پارامتر فعال (بدون در نظر گرفتن تعبیه ۷۸۹ میلیون) فعال میشود، که منجر به سرعت تولید بسیار بالا میشود. به لطف طراحی کارآمد MoE و دادههای آموزشی بزرگ و با کیفیت، با وجود پارامترهای فعال تنها ۱.۴ میلیارد، Ling-mini-2.0 در وظایف پاییندستی عملکردی در حد مدلهای LLM متراکم زیر ۱۰ میلیارد و مدلهای MoE بزرگتر ارائه میدهد."
|
||||
"description": "Ling-mini-2.0 یک مدل زبان بزرگ کوچکحجم و با عملکرد بالا مبتنی بر معماری MoE است. این مدل دارای ۱۶ میلیارد پارامتر کل است اما در هر توکن تنها ۱.۴ میلیارد پارامتر فعال میشوند (۷۸۹ میلیون غیر بردار کلمه)، که سرعت تولید بسیار بالایی را فراهم میکند. به لطف طراحی کارآمد MoE و دادههای آموزشی بزرگ و با کیفیت، با وجود فعال بودن تنها ۱.۴ میلیارد پارامتر، Ling-mini-2.0 در وظایف پاییندستی عملکردی در سطح مدلهای متراکم زیر ۱۰ میلیارد و مدلهای MoE بزرگتر ارائه میدهد."
|
||||
},
|
||||
"inclusionAI/Ring-flash-2.0": {
|
||||
"description": "Ring-flash-2.0 مدلی با عملکرد بالا برای تفکر است که بر پایه Ling-flash-2.0-base بهینهسازی عمیق شده است. این مدل از معماری متخصص ترکیبی (MoE) با ۱۰۰ میلیارد پارامتر کل بهره میبرد اما در هر استنتاج تنها ۶.۱ میلیارد پارامتر فعال میشوند. این مدل با الگوریتم ابتکاری icepop مشکل ناپایداری مدلهای بزرگ MoE در آموزش تقویتی (RL) را حل کرده و توانایی استنتاج پیچیده آن در طول آموزشهای بلندمدت بهبود مییابد. Ring-flash-2.0 در مسابقات ریاضی، تولید کد و استدلال منطقی در چندین بنچمارک دشوار پیشرفت قابل توجهی داشته است و عملکرد آن نه تنها از مدلهای متراکم برتر زیر ۴۰ میلیارد پارامتر فراتر رفته، بلکه با مدلهای MoE متنباز بزرگتر و مدلهای تفکر با عملکرد بالا و بسته رقابت میکند. اگرچه این مدل بر استنتاج پیچیده تمرکز دارد، در وظایف خلاقانه نوشتاری نیز عملکرد خوبی دارد. علاوه بر این، به لطف طراحی معماری کارآمد، Ring-flash-2.0 ضمن ارائه عملکرد قدرتمند، استنتاج سریع را ممکن ساخته و هزینه استقرار مدلهای تفکر در شرایط بار بالا را به طور قابل توجهی کاهش میدهد."
|
||||
},
|
||||
"internlm/internlm2_5-7b-chat": {
|
||||
"description": "InternLM2.5 راهحلهای گفتگوی هوشمند در چندین سناریو ارائه میدهد."
|
||||
@@ -1974,7 +2001,10 @@
|
||||
"description": "LLaVA یک مدل چندوجهی است که رمزگذار بصری و Vicuna را برای درک قدرتمند زبان و تصویر ترکیب میکند."
|
||||
},
|
||||
"magistral-medium-latest": {
|
||||
"description": "Magistral Medium 1.1 یک مدل استنتاج پیشرفته است که توسط Mistral AI در ژوئیهٔ ۲۰۲۵ منتشر شد."
|
||||
"description": "Magistral Medium 1.2 یک مدل استنتاج پیشرفته است که توسط Mistral AI در سپتامبر ۲۰۲۵ منتشر شده و از قابلیت پشتیبانی بصری برخوردار است."
|
||||
},
|
||||
"magistral-small-2509": {
|
||||
"description": "Magistral Small 1.2 یک مدل استنتاج کوچک متنباز است که توسط Mistral AI در سپتامبر ۲۰۲۵ منتشر شده و از قابلیت پشتیبانی بصری برخوردار است."
|
||||
},
|
||||
"mathstral": {
|
||||
"description": "MathΣtral بهطور ویژه برای تحقیقات علمی و استدلالهای ریاضی طراحی شده است و توانایی محاسباتی مؤثر و تفسیر نتایج را ارائه میدهد."
|
||||
@@ -2282,9 +2312,6 @@
|
||||
"mistral/mistral-large": {
|
||||
"description": "Mistral Large انتخاب ایدهآل برای وظایف پیچیده است که نیازمند توان استدلال بزرگ یا تخصص بالا هستند — مانند تولید متن ترکیبی، تولید کد، RAG یا نمایندگی."
|
||||
},
|
||||
"mistral/mistral-saba-24b": {
|
||||
"description": "Mistral Saba 24B مدل متنباز 24 میلیارد پارامتری توسعه یافته توسط Mistral.ai است. Saba مدلی تخصصی است که برای عملکرد برجسته در زبانهای عربی، فارسی، اردو، عبری و زبانهای هندی آموزش دیده است. توسط Groq با استفاده از سختافزار واحد پردازش زبان سفارشی (LPU) ارائه میشود تا استدلال سریع و کارآمد فراهم کند."
|
||||
},
|
||||
"mistral/mistral-small": {
|
||||
"description": "Mistral Small انتخاب ایدهآل برای وظایف سادهای است که میتوانند به صورت دستهای انجام شوند — مانند دستهبندی، پشتیبانی مشتری یا تولید متن. این مدل عملکرد عالی را با قیمت مقرونبهصرفه ارائه میدهد."
|
||||
},
|
||||
@@ -2357,9 +2384,6 @@
|
||||
"moonshotai/Kimi-Dev-72B": {
|
||||
"description": "Kimi-Dev-72B یک مدل بزرگ کد منبع باز است که با یادگیری تقویتی گسترده بهینه شده است و قادر به تولید پچهای پایدار و قابل استفاده مستقیم در تولید میباشد. این مدل در SWE-bench Verified امتیاز جدید ۶۰.۴٪ را کسب کرده و رکورد مدلهای منبع باز را در وظایف مهندسی نرمافزار خودکار مانند رفع اشکال و بازبینی کد شکسته است."
|
||||
},
|
||||
"moonshotai/Kimi-K2-Instruct": {
|
||||
"description": "Kimi K2 یک مدل پایه با معماری MoE است که دارای تواناییهای بسیار قوی در کدنویسی و عامل است، با 1 تریلیون پارامتر کل و 32 میلیارد پارامتر فعال. در آزمونهای معیار عملکرد در حوزههای دانش عمومی، برنامهنویسی، ریاضیات و عامل، مدل K2 عملکردی فراتر از سایر مدلهای متنباز اصلی دارد."
|
||||
},
|
||||
"moonshotai/Kimi-K2-Instruct-0905": {
|
||||
"description": "Kimi K2-Instruct-0905 جدیدترین و قدرتمندترین نسخه Kimi K2 است. این مدل یک مدل زبان برتر با معماری متخصص ترکیبی (MoE) است که دارای ۱ تریلیون پارامتر کل و ۳۲ میلیارد پارامتر فعال میباشد. ویژگیهای اصلی این مدل شامل: هوش کدگذاری عامل بهبود یافته که در آزمونهای معیار عمومی و وظایف واقعی کدگذاری عامل عملکرد قابل توجهی نشان میدهد؛ تجربه کدگذاری فرانتاند بهبود یافته که از نظر زیبایی و کاربردی بودن برنامهنویسی فرانتاند پیشرفت داشته است."
|
||||
},
|
||||
@@ -2570,6 +2594,9 @@
|
||||
"qwen-image": {
|
||||
"description": "Qwen-Image یک مدل عمومی تولید تصویر است که از سبکهای هنری متنوعی پشتیبانی میکند و بهویژه در رندر متنهای پیچیده تبحر دارد، بهخصوص رندر متنهای چینی و انگلیسی. این مدل از چینش چندخطی، تولید متن در سطح پاراگراف و بازنمایی جزئیات ریز پشتیبانی میکند و قادر است طراحیهای پیچیده ترکیبی متن و تصویر را تحقق بخشد."
|
||||
},
|
||||
"qwen-image-edit": {
|
||||
"description": "Qwen Image Edit یک مدل تصویر به تصویر است که از ویرایش و اصلاح تصویر بر اساس تصویر ورودی و راهنمای متنی پشتیبانی میکند و قادر است بر اساس نیازهای کاربر، تصویر اصلی را به دقت تنظیم و به صورت خلاقانه تغییر دهد."
|
||||
},
|
||||
"qwen-long": {
|
||||
"description": "مدل زبانی بسیار بزرگ Tongyi Qianwen که از متنهای طولانی و همچنین قابلیت مکالمه در چندین سناریو مانند اسناد طولانی و چندین سند پشتیبانی میکند."
|
||||
},
|
||||
@@ -2804,8 +2831,11 @@
|
||||
"qwen3-coder-plus": {
|
||||
"description": "مدل کد نویسی Tongyi Qianwen. جدیدترین مدلهای سری Qwen3-Coder بر پایه Qwen3 ساخته شدهاند و دارای تواناییهای قدرتمند Coding Agent هستند، در فراخوانی ابزارها و تعامل با محیط مهارت دارند، قادر به برنامهنویسی خودکار هستند و در کنار تواناییهای کدنویسی برجسته، قابلیتهای عمومی نیز دارند."
|
||||
},
|
||||
"qwen3-max-preview": {
|
||||
"description": "نسخه پیشنمایش مدل Max از سری Qwen 3، نسبت به سری 2.5 بهبود قابل توجهی در تواناییهای عمومی، درک متنهای چندزبانه چینی و انگلیسی، پیروی از دستورات پیچیده، انجام وظایف باز و ذهنی، پشتیبانی چندزبانه و فراخوانی ابزارها دارد؛ همچنین خطاهای دانش مدل کاهش یافته است."
|
||||
"qwen3-coder:480b": {
|
||||
"description": "مدل با عملکرد بالا و زمینه طولانی طراحی شده توسط علیبابا برای وظایف نمایندگی و کدنویسی."
|
||||
},
|
||||
"qwen3-max": {
|
||||
"description": "مدل سری Qwen3-Max از Tongyi Qianwen 3 که نسبت به سری 2.5 به طور کلی تواناییهای عمومی بهبود یافتهای دارد؛ شامل درک متن دو زبانه چینی و انگلیسی، پیروی از دستورالعملهای پیچیده، توانایی انجام وظایف باز و ذهنی، پشتیبانی چندزبانه و فراخوانی ابزارها که همه به طور قابل توجهی تقویت شدهاند؛ خطاهای دانش مدل نیز کاهش یافته است. جدیدترین مدل Qwen3-Max نسبت به نسخه پیشنمایش Qwen3-Max در زمینه برنامهنویسی هوشمند و فراخوانی ابزارها بهروزرسانیهای ویژهای داشته است. نسخه رسمی منتشر شده به سطح SOTA حوزه رسیده و برای نیازهای پیچیدهتر هوش مصنوعی تطبیق یافته است."
|
||||
},
|
||||
"qwen3-next-80b-a3b-instruct": {
|
||||
"description": "مدل متنباز نسل جدید بدون حالت تفکر مبتنی بر Qwen3، که نسبت به نسخه قبلی (Tongyi Qianwen 3-235B-A22B-Instruct-2507) در درک متنهای چینی بهتر است، توانایی استدلال منطقی بهبود یافته و عملکرد بهتری در وظایف تولید متن دارد."
|
||||
@@ -2813,6 +2843,9 @@
|
||||
"qwen3-next-80b-a3b-thinking": {
|
||||
"description": "مدل متنباز نسل جدید با حالت تفکر مبتنی بر Qwen3، که نسبت به نسخه قبلی (Tongyi Qianwen 3-235B-A22B-Thinking-2507) در پیروی از دستورات پیشرفت داشته و پاسخهای مدل خلاصهتر شدهاند."
|
||||
},
|
||||
"qwen3-vl-plus": {
|
||||
"description": "Tongyi Qianwen VL مدلی برای تولید متن با قابلیت درک بصری (تصویر) است که نه تنها میتواند OCR (تشخیص متن در تصویر) انجام دهد، بلکه قادر به خلاصهسازی و استنتاج بیشتر نیز هست، مانند استخراج ویژگیها از عکس محصولات یا حل مسائل بر اساس تصاویر تمرین."
|
||||
},
|
||||
"qwq": {
|
||||
"description": "QwQ یک مدل تحقیقاتی تجربی است که بر بهبود توانایی استدلال AI تمرکز دارد."
|
||||
},
|
||||
|
||||
@@ -281,6 +281,7 @@
|
||||
"actionFiletip": "Télécharger un fichier",
|
||||
"actionTooltip": "Télécharger",
|
||||
"disabled": "Le modèle actuel ne prend pas en charge la reconnaissance visuelle et l'analyse de fichiers, veuillez changer de modèle pour l'utiliser",
|
||||
"fileNotSupported": "Le mode navigateur ne prend pas en charge le téléchargement de fichiers, seules les images sont autorisées",
|
||||
"visionNotSupported": "Le modèle actuel ne prend pas en charge la reconnaissance visuelle, veuillez changer de modèle pour l'utiliser"
|
||||
},
|
||||
"preview": {
|
||||
@@ -289,6 +290,9 @@
|
||||
"pending": "Préparation du téléchargement...",
|
||||
"processing": "Traitement du fichier..."
|
||||
}
|
||||
},
|
||||
"validation": {
|
||||
"videoSizeExceeded": "La taille du fichier vidéo ne peut pas dépasser 20 Mo, la taille actuelle est de {{actualSize}}"
|
||||
}
|
||||
},
|
||||
"zenMode": "Mode de concentration"
|
||||
|
||||
@@ -114,6 +114,7 @@
|
||||
"reasoning": "Ce modèle prend en charge une réflexion approfondie",
|
||||
"search": "Ce modèle prend en charge la recherche en ligne",
|
||||
"tokens": "Ce modèle prend en charge jusqu'à {{tokens}} jetons par session.",
|
||||
"video": "Ce modèle prend en charge la reconnaissance vidéo",
|
||||
"vision": "Ce modèle prend en charge la reconnaissance visuelle."
|
||||
},
|
||||
"removed": "Le modèle n'est pas dans la liste, il sera automatiquement supprimé si vous annulez la sélection"
|
||||
|
||||
+53
-20
@@ -287,9 +287,6 @@
|
||||
"Pro/deepseek-ai/DeepSeek-V3.1": {
|
||||
"description": "DeepSeek-V3.1 est un grand modèle de langage hybride publié par DeepSeek AI, intégrant de nombreuses améliorations majeures par rapport à la génération précédente. Une innovation clé de ce modèle est l'intégration des modes « réflexion » (Thinking Mode) et « non-réflexion » (Non-thinking Mode), permettant aux utilisateurs de basculer facilement entre eux via des modèles de conversation adaptés aux différents besoins. Grâce à une optimisation post-entraînement spécifique, la version V3.1 améliore significativement les performances dans l'appel d'outils et les tâches d'agent, supportant mieux les outils de recherche externes et l'exécution de tâches complexes en plusieurs étapes. Basé sur DeepSeek-V3.1-Base, il bénéficie d'un entraînement supplémentaire avec une méthode d'extension de texte long en deux phases, augmentant considérablement la quantité de données d'entraînement pour une meilleure gestion des documents longs et des codes étendus. En tant que modèle open source, DeepSeek-V3.1 démontre des capacités comparables aux meilleurs modèles propriétaires dans plusieurs benchmarks en codage, mathématiques et raisonnement, tout en réduisant efficacement les coûts d'inférence grâce à son architecture à experts mixtes (MoE) qui maintient une grande capacité de modèle."
|
||||
},
|
||||
"Pro/moonshotai/Kimi-K2-Instruct": {
|
||||
"description": "Kimi K2 est un modèle de base à architecture MoE doté de capacités exceptionnelles en codage et agents, avec 1 000 milliards de paramètres au total et 32 milliards activés. Il surpasse les autres modèles open source majeurs dans les tests de performance sur les connaissances générales, la programmation, les mathématiques et les agents."
|
||||
},
|
||||
"Pro/moonshotai/Kimi-K2-Instruct-0905": {
|
||||
"description": "Kimi K2-Instruct-0905 est la version la plus récente et la plus puissante de Kimi K2. Il s'agit d'un modèle linguistique de pointe à experts mixtes (MoE), avec un total de 1 000 milliards de paramètres et 32 milliards de paramètres activés. Les principales caractéristiques de ce modèle incluent : une intelligence de codage d'agents améliorée, démontrant des performances significatives dans les tests de référence publics et les tâches réelles d'agents de codage ; une expérience de codage frontale améliorée, avec des progrès tant en esthétique qu'en praticité pour la programmation frontale."
|
||||
},
|
||||
@@ -380,6 +377,12 @@
|
||||
"Qwen/Qwen3-Coder-480B-A35B-Instruct": {
|
||||
"description": "Qwen3-Coder-480B-A35B-Instruct est un modèle de code publié par Alibaba, et à ce jour le plus avancé en termes de capacités d'agent (agentic). Il s'agit d'un modèle MoE (Mixture-of-Experts) disposant de 480 milliards de paramètres au total et de 35 milliards de paramètres activés, offrant un équilibre entre efficacité et performance. Le modèle prend en charge nativement une longueur de contexte de 256K (environ 260 000) tokens et peut être étendu jusqu'à 1 million de tokens via des méthodes d'extrapolation telles que YaRN, ce qui lui permet de traiter de vastes bases de code et des tâches de programmation complexes. Qwen3-Coder a été conçu pour des flux de travail de codage pilotés par des agents : il ne se contente pas de générer du code, il peut aussi interagir de manière autonome avec les outils et environnements de développement pour résoudre des problèmes de programmation complexes. Sur plusieurs benchmarks de codage et de tâches agent, ce modèle atteint un niveau de premier plan parmi les modèles open source, ses performances rivalisant avec celles de modèles de pointe comme Claude Sonnet 4."
|
||||
},
|
||||
"Qwen/Qwen3-Next-80B-A3B-Instruct": {
|
||||
"description": "Qwen3-Next-80B-A3B-Instruct est un modèle de base de nouvelle génération publié par l'équipe Tongyi Qianwen d'Alibaba. Il est basé sur la toute nouvelle architecture Qwen3-Next, visant à atteindre une efficacité extrême en entraînement et en inférence. Ce modèle utilise un mécanisme d'attention hybride innovant (Gated DeltaNet et Gated Attention), une structure d'experts mixtes à haute sparsité (MoE) ainsi que plusieurs optimisations pour la stabilité de l'entraînement. En tant que modèle sparse avec un total de 80 milliards de paramètres, il n'active qu'environ 3 milliards de paramètres lors de l'inférence, réduisant ainsi considérablement les coûts de calcul. Lors de tâches avec un contexte long dépassant 32K tokens, son débit d'inférence est plus de 10 fois supérieur à celui du modèle Qwen3-32B. Ce modèle est une version fine-tunée pour les instructions, conçue pour des tâches générales, et ne supporte pas le mode chaîne de pensée (Thinking). En termes de performance, il est comparable au modèle phare Tongyi Qianwen Qwen3-235B sur certains benchmarks, montrant un avantage marqué sur les tâches à contexte très long."
|
||||
},
|
||||
"Qwen/Qwen3-Next-80B-A3B-Thinking": {
|
||||
"description": "Qwen3-Next-80B-A3B-Thinking est un modèle de base de nouvelle génération publié par l'équipe Tongyi Qianwen d'Alibaba, spécialement conçu pour les tâches de raisonnement complexes. Il repose sur l'architecture innovante Qwen3-Next, qui intègre un mécanisme d'attention hybride (Gated DeltaNet et Gated Attention) et une structure d'experts mixtes à haute sparsité (MoE), visant une efficacité extrême en entraînement et inférence. En tant que modèle sparse totalisant 80 milliards de paramètres, il n'active qu'environ 3 milliards de paramètres lors de l'inférence, réduisant significativement les coûts de calcul. Pour les tâches à contexte long dépassant 32K tokens, son débit est plus de 10 fois supérieur à celui du modèle Qwen3-32B. Cette version « Thinking » est optimisée pour exécuter des tâches complexes à étapes multiples telles que preuves mathématiques, synthèse de code, analyse logique et planification, et produit par défaut le processus de raisonnement sous forme structurée de « chaîne de pensée ». En termes de performance, il dépasse non seulement des modèles plus coûteux comme Qwen3-32B-Thinking, mais surpasse également Gemini-2.5-Flash-Thinking sur plusieurs benchmarks."
|
||||
},
|
||||
"Qwen2-72B-Instruct": {
|
||||
"description": "Qwen2 est la dernière série du modèle Qwen, prenant en charge un contexte de 128k. Comparé aux meilleurs modèles open source actuels, Qwen2-72B surpasse de manière significative les modèles leaders dans des domaines tels que la compréhension du langage naturel, les connaissances, le code, les mathématiques et le multilinguisme."
|
||||
},
|
||||
@@ -809,9 +812,6 @@
|
||||
"codex-mini-latest": {
|
||||
"description": "codex-mini-latest est une version affinée de o4-mini, spécialement conçue pour Codex CLI. Pour une utilisation directe via l'API, nous recommandons de commencer par gpt-4.1."
|
||||
},
|
||||
"cognitivecomputations/dolphin-mixtral-8x22b": {
|
||||
"description": "Dolphin Mixtral 8x22B est un modèle conçu pour le suivi des instructions, le dialogue et la programmation."
|
||||
},
|
||||
"cogview-4": {
|
||||
"description": "CogView-4 est le premier modèle open source de génération d'images à partir de texte de Zhizhu, prenant en charge la génération de caractères chinois. Il offre une amélioration globale en compréhension sémantique, qualité de génération d'images, et capacité de génération de textes en chinois et en anglais. Il supporte une entrée bilingue chinois-anglais de longueur arbitraire et peut générer des images à n'importe quelle résolution dans une plage donnée."
|
||||
},
|
||||
@@ -926,6 +926,9 @@
|
||||
"deepseek-ai/deepseek-r1": {
|
||||
"description": "LLM avancé et efficace, spécialisé dans le raisonnement, les mathématiques et la programmation."
|
||||
},
|
||||
"deepseek-ai/deepseek-v3.1": {
|
||||
"description": "DeepSeek V3.1 : modèle de raisonnement de nouvelle génération, améliorant les capacités de raisonnement complexe et de réflexion en chaîne, adapté aux tâches nécessitant une analyse approfondie."
|
||||
},
|
||||
"deepseek-ai/deepseek-vl2": {
|
||||
"description": "DeepSeek-VL2 est un modèle de langage visuel à experts mixtes (MoE) développé sur la base de DeepSeekMoE-27B, utilisant une architecture MoE à activation sparse, réalisant des performances exceptionnelles tout en n'activant que 4,5 milliards de paramètres. Ce modèle excelle dans plusieurs tâches telles que la question-réponse visuelle, la reconnaissance optique de caractères, la compréhension de documents/tableaux/graphes et le positionnement visuel."
|
||||
},
|
||||
@@ -1007,6 +1010,9 @@
|
||||
"deepseek-v3.1": {
|
||||
"description": "DeepSeek-V3.1 est un nouveau modèle d'inférence hybride lancé par DeepSeek, prenant en charge deux modes d'inférence : réfléchi et non réfléchi, avec une efficacité de réflexion supérieure à celle de DeepSeek-R1-0528. Optimisé par post-entraînement, l'utilisation des outils Agent et les performances des tâches des agents ont été grandement améliorées. Supporte une fenêtre contextuelle de 128k et une longueur de sortie maximale de 64k tokens."
|
||||
},
|
||||
"deepseek-v3.1:671b": {
|
||||
"description": "DeepSeek V3.1 : modèle de raisonnement de nouvelle génération, améliorant les capacités de raisonnement complexe et de réflexion en chaîne, adapté aux tâches nécessitant une analyse approfondie."
|
||||
},
|
||||
"deepseek/deepseek-chat-v3-0324": {
|
||||
"description": "DeepSeek V3 est un modèle hybride d'experts avec 685B de paramètres, représentant la dernière itération de la série de modèles de chat phare de l'équipe DeepSeek.\n\nIl hérite du modèle [DeepSeek V3](/deepseek/deepseek-chat-v3) et excelle dans diverses tâches."
|
||||
},
|
||||
@@ -1626,7 +1632,7 @@
|
||||
"description": "ChatGPT-4o est un modèle dynamique, mis à jour en temps réel pour rester à jour avec la dernière version. Il combine une compréhension linguistique puissante et des capacités de génération, adapté aux scénarios d'application à grande échelle, y compris le service client, l'éducation et le support technique."
|
||||
},
|
||||
"gpt-4o-audio-preview": {
|
||||
"description": "Modèle audio GPT-4o, prenant en charge les entrées et sorties audio."
|
||||
"description": "Modèle GPT-4o Audio Preview, supportant l'entrée et la sortie audio."
|
||||
},
|
||||
"gpt-4o-mini": {
|
||||
"description": "GPT-4o mini est le dernier modèle lancé par OpenAI après le GPT-4 Omni, prenant en charge les entrées multimodales et produisant des sorties textuelles. En tant que leur modèle compact le plus avancé, il est beaucoup moins cher que d'autres modèles de pointe récents et coûte plus de 60 % de moins que le GPT-3.5 Turbo. Il maintient une intelligence de pointe tout en offrant un rapport qualité-prix significatif. Le GPT-4o mini a obtenu un score de 82 % au test MMLU et se classe actuellement au-dessus du GPT-4 en termes de préférences de chat."
|
||||
@@ -1667,24 +1673,33 @@
|
||||
"gpt-5-chat-latest": {
|
||||
"description": "Modèle GPT-5 utilisé dans ChatGPT. Allie une compréhension et une génération linguistique puissantes, idéal pour les applications d'interaction conversationnelle."
|
||||
},
|
||||
"gpt-5-codex": {
|
||||
"description": "GPT-5 Codex est une version optimisée de GPT-5 pour les tâches d'encodage d'agents dans Codex ou environnements similaires."
|
||||
},
|
||||
"gpt-5-mini": {
|
||||
"description": "Version plus rapide et économique de GPT-5, adaptée aux tâches bien définies. Offre une réponse plus rapide tout en maintenant une sortie de haute qualité."
|
||||
},
|
||||
"gpt-5-nano": {
|
||||
"description": "Version la plus rapide et la plus économique de GPT-5. Parfaitement adaptée aux scénarios nécessitant une réponse rapide et sensibles aux coûts."
|
||||
},
|
||||
"gpt-audio": {
|
||||
"description": "GPT Audio est un modèle de chat universel orienté vers l'entrée et la sortie audio, supportant l'utilisation d'entrées/sorties audio dans l'API Chat Completions."
|
||||
},
|
||||
"gpt-image-1": {
|
||||
"description": "Modèle natif multimodal de génération d'images de ChatGPT."
|
||||
},
|
||||
"gpt-oss": {
|
||||
"description": "GPT-OSS 20B est un grand modèle de langage open source publié par OpenAI, utilisant la technologie de quantification MXFP4, adapté pour fonctionner sur des GPU grand public haut de gamme ou des Mac Apple Silicon. Ce modèle excelle dans la génération de dialogues, la rédaction de code et les tâches de raisonnement, avec prise en charge des appels de fonctions et de l'utilisation d'outils."
|
||||
},
|
||||
"gpt-oss-120b": {
|
||||
"description": "GPT-OSS-120B MXFP4 : architecture Transformer quantifiée, offrant des performances solides même en ressources limitées."
|
||||
},
|
||||
"gpt-oss:120b": {
|
||||
"description": "GPT-OSS 120B est un grand modèle de langage open source publié par OpenAI, utilisant la technologie de quantification MXFP4, conçu comme un modèle phare. Il nécessite un environnement multi-GPU ou une station de travail haute performance, offrant des performances exceptionnelles en raisonnement complexe, génération de code et traitement multilingue, avec prise en charge avancée des appels de fonctions et de l'intégration d'outils."
|
||||
},
|
||||
"gpt-oss:20b": {
|
||||
"description": "GPT-OSS 20B est un grand modèle de langage open source publié par OpenAI, utilisant la quantification MXFP4, adapté pour fonctionner sur des GPU grand public haut de gamme ou sur Mac Apple Silicon. Ce modèle excelle dans la génération de dialogues, la rédaction de code et les tâches de raisonnement, supportant les appels de fonctions et l'utilisation d'outils."
|
||||
},
|
||||
"gpt-realtime": {
|
||||
"description": "Modèle universel en temps réel, supportant les entrées et sorties textuelles et audio en temps réel, ainsi que les entrées d'images."
|
||||
},
|
||||
"grok-2-1212": {
|
||||
"description": "Ce modèle a été amélioré en termes de précision, de respect des instructions et de capacités multilingues."
|
||||
},
|
||||
@@ -1712,6 +1727,12 @@
|
||||
"grok-4-0709": {
|
||||
"description": "Grok 4 de xAI, doté de puissantes capacités de raisonnement."
|
||||
},
|
||||
"grok-4-fast-non-reasoning": {
|
||||
"description": "Nous sommes ravis de présenter Grok 4 Fast, notre dernière avancée dans les modèles de raisonnement à rapport coût-efficacité optimisé."
|
||||
},
|
||||
"grok-4-fast-reasoning": {
|
||||
"description": "Nous sommes ravis de présenter Grok 4 Fast, notre dernière avancée dans les modèles de raisonnement à rapport coût-efficacité optimisé."
|
||||
},
|
||||
"grok-code-fast-1": {
|
||||
"description": "Nous sommes ravis de présenter grok-code-fast-1, un modèle d'inférence rapide et économique, excellent dans le codage des agents."
|
||||
},
|
||||
@@ -1847,8 +1868,14 @@
|
||||
"inception/mercury-coder-small": {
|
||||
"description": "Mercury Coder Small est idéal pour les tâches de génération, débogage et refactorisation de code, avec une latence minimale."
|
||||
},
|
||||
"inclusionAI/Ling-flash-2.0": {
|
||||
"description": "Ling-flash-2.0 est le troisième modèle de la série d'architectures Ling 2.0 publié par l'équipe Bailing du groupe Ant. C'est un modèle d'experts mixtes (MoE) avec un total de 100 milliards de paramètres, mais n'activant que 6,1 milliards de paramètres par token (dont 4,8 milliards hors embeddings). En tant que modèle léger, Ling-flash-2.0 affiche des performances comparables voire supérieures à celles des modèles denses de 40 milliards de paramètres et des modèles MoE de plus grande taille dans plusieurs évaluations de référence reconnues. Ce modèle vise à explorer des voies d'efficacité sous le consensus « grand modèle = grand nombre de paramètres » grâce à une conception d'architecture et des stratégies d'entraînement optimales."
|
||||
},
|
||||
"inclusionAI/Ling-mini-2.0": {
|
||||
"description": "Ling-mini-2.0 est un modèle linguistique de grande taille à haute performance et petite taille basé sur l'architecture MoE. Il possède 16 milliards de paramètres au total, mais n'active que 1,4 milliard par token (789 millions hors embeddings), ce qui permet une vitesse de génération extrêmement élevée. Grâce à une conception MoE efficace et à un entraînement à grande échelle avec des données de haute qualité, malgré seulement 1,4 milliard de paramètres activés, Ling-mini-2.0 affiche des performances de pointe comparables à celles des modèles denses de moins de 10 milliards de paramètres et des modèles MoE de plus grande taille dans les tâches en aval."
|
||||
"description": "Ling-mini-2.0 est un modèle de langage de grande taille compact et performant basé sur l'architecture MoE. Il possède 16 milliards de paramètres au total, mais n'active que 1,4 milliard par token (789 millions hors embeddings), permettant une vitesse de génération très élevée. Grâce à une conception MoE efficace et à un entraînement massif sur des données de haute qualité, Ling-mini-2.0 offre des performances de pointe sur les tâches en aval, comparables à celles des modèles denses de moins de 10 milliards de paramètres et des modèles MoE plus grands."
|
||||
},
|
||||
"inclusionAI/Ring-flash-2.0": {
|
||||
"description": "Ring-flash-2.0 est un modèle de réflexion haute performance profondément optimisé à partir de Ling-flash-2.0-base. Il utilise une architecture d'experts mixtes (MoE) avec un total de 100 milliards de paramètres, mais n'active que 6,1 milliards de paramètres à chaque inférence. Ce modèle résout, grâce à l'algorithme innovant icepop, l'instabilité des grands modèles MoE lors de l'entraînement par apprentissage par renforcement (RL), permettant une amélioration continue des capacités de raisonnement complexe sur de longues périodes d'entraînement. Ring-flash-2.0 a réalisé des avancées significatives dans plusieurs benchmarks difficiles tels que les compétitions mathématiques, la génération de code et le raisonnement logique. Ses performances surpassent non seulement les meilleurs modèles denses de moins de 40 milliards de paramètres, mais rivalisent aussi avec des modèles MoE open source plus grands et des modèles de réflexion propriétaires haute performance. Bien que focalisé sur le raisonnement complexe, il excelle également dans les tâches de création littéraire. De plus, grâce à sa conception efficace, Ring-flash-2.0 offre des performances puissantes tout en assurant une inférence rapide, réduisant considérablement les coûts de déploiement dans des scénarios à forte concurrence."
|
||||
},
|
||||
"internlm/internlm2_5-7b-chat": {
|
||||
"description": "InternLM2.5 fournit des solutions de dialogue intelligent dans divers scénarios."
|
||||
@@ -1974,7 +2001,10 @@
|
||||
"description": "LLaVA est un modèle multimodal combinant un encodeur visuel et Vicuna, utilisé pour une compréhension puissante du visuel et du langage."
|
||||
},
|
||||
"magistral-medium-latest": {
|
||||
"description": "Magistral Medium 1.1 est un modèle d'inférence de pointe publié par Mistral AI en juillet 2025."
|
||||
"description": "Magistral Medium 1.2 est un modèle d'inférence de pointe avec support visuel, publié par Mistral AI en septembre 2025."
|
||||
},
|
||||
"magistral-small-2509": {
|
||||
"description": "Magistral Small 1.2 est un modèle d'inférence open source compact avec support visuel, publié par Mistral AI en septembre 2025."
|
||||
},
|
||||
"mathstral": {
|
||||
"description": "MathΣtral est conçu pour la recherche scientifique et le raisonnement mathématique, offrant des capacités de calcul efficaces et des interprétations de résultats."
|
||||
@@ -2282,9 +2312,6 @@
|
||||
"mistral/mistral-large": {
|
||||
"description": "Mistral Large est idéal pour les tâches complexes nécessitant une grande capacité de raisonnement ou une spécialisation élevée, telles que la génération de texte synthétique, le codage, le RAG ou les agents."
|
||||
},
|
||||
"mistral/mistral-saba-24b": {
|
||||
"description": "Mistral Saba 24B est un modèle open source de 24 milliards de paramètres développé par Mistral.ai. Saba est un modèle spécialisé entraîné pour exceller en arabe, persan, ourdou, hébreu et langues indiennes. Servi par Groq avec son matériel personnalisé LPU pour un raisonnement rapide et efficace."
|
||||
},
|
||||
"mistral/mistral-small": {
|
||||
"description": "Mistral Small est idéal pour les tâches simples pouvant être traitées en lots, telles que la classification, le support client ou la génération de texte. Il offre d'excellentes performances à un prix abordable."
|
||||
},
|
||||
@@ -2357,9 +2384,6 @@
|
||||
"moonshotai/Kimi-Dev-72B": {
|
||||
"description": "Kimi-Dev-72B est un grand modèle de code open source, optimisé par un apprentissage par renforcement à grande échelle, capable de générer des correctifs robustes et directement exploitables en production. Ce modèle a atteint un nouveau score record de 60,4 % sur SWE-bench Verified, établissant un nouveau standard pour les modèles open source dans les tâches d'ingénierie logicielle automatisée telles que la correction de bugs et la revue de code."
|
||||
},
|
||||
"moonshotai/Kimi-K2-Instruct": {
|
||||
"description": "Kimi K2 est un modèle de base à architecture MoE doté de capacités exceptionnelles en codage et agents, avec 1 000 milliards de paramètres au total et 32 milliards activés. Il surpasse les autres modèles open source majeurs dans les tests de performance sur les connaissances générales, la programmation, les mathématiques et les agents."
|
||||
},
|
||||
"moonshotai/Kimi-K2-Instruct-0905": {
|
||||
"description": "Kimi K2-Instruct-0905 est la version la plus récente et la plus puissante de Kimi K2. Il s'agit d'un modèle linguistique de pointe à experts mixtes (MoE), avec un total de 1 000 milliards de paramètres et 32 milliards de paramètres activés. Les principales caractéristiques de ce modèle incluent : une intelligence de codage d'agents améliorée, démontrant des performances significatives dans les tests de référence publics et les tâches réelles d'agents de codage ; une expérience de codage frontale améliorée, avec des progrès tant en esthétique qu'en praticité pour la programmation frontale."
|
||||
},
|
||||
@@ -2570,6 +2594,9 @@
|
||||
"qwen-image": {
|
||||
"description": "Qwen-Image est un modèle polyvalent de génération d'images, prenant en charge de nombreux styles artistiques et excelling particulièrement dans le rendu de textes complexes, notamment en chinois et en anglais. Le modèle gère les mises en page multi‑lignes, la génération de texte au niveau des paragraphes et le rendu de détails fins, permettant de créer des compositions complexes mêlant texte et image."
|
||||
},
|
||||
"qwen-image-edit": {
|
||||
"description": "Qwen Image Edit est un modèle de génération d'images à partir d'images, permettant l'édition et la modification d'images basées sur une image d'entrée et des indications textuelles. Il peut ajuster précisément et transformer de manière créative l'image originale selon les besoins de l'utilisateur."
|
||||
},
|
||||
"qwen-long": {
|
||||
"description": "Qwen est un modèle de langage à grande échelle, prenant en charge un contexte de texte long, ainsi que des fonctionnalités de dialogue basées sur des documents longs et multiples."
|
||||
},
|
||||
@@ -2804,8 +2831,11 @@
|
||||
"qwen3-coder-plus": {
|
||||
"description": "Modèle de code Tongyi Qianwen. La dernière série de modèles Qwen3-Coder est basée sur Qwen3 pour la génération de code, avec une puissante capacité d'agent de codage, maîtrisant l'appel d'outils et l'interaction avec l'environnement, capable de programmation autonome, alliant excellence en codage et polyvalence."
|
||||
},
|
||||
"qwen3-max-preview": {
|
||||
"description": "Version Preview du modèle Max de la série Qwen 3, avec une amélioration significative des capacités générales par rapport à la série 2.5, notamment en compréhension de texte général bilingue (chinois et anglais), respect des instructions complexes, tâches ouvertes subjectives, capacités multilingues et appels d'outils ; le modèle présente également moins d'hallucinations de connaissances."
|
||||
"qwen3-coder:480b": {
|
||||
"description": "Modèle à contexte long haute performance d'Alibaba, conçu pour les tâches d'agents et de codage."
|
||||
},
|
||||
"qwen3-max": {
|
||||
"description": "La série Max de Tongyi Qianwen 3 offre une amélioration significative par rapport à la série 2.5 en termes de capacités générales. Elle renforce notablement la compréhension du texte en chinois et en anglais, la capacité à suivre des instructions complexes, les tâches ouvertes subjectives, les compétences multilingues et l'appel d'outils ; le modèle présente également moins d'hallucinations de connaissances. La dernière version du modèle qwen3-max, comparée à la version preview, a bénéficié d'une mise à niveau spécifique en programmation d'agents et en appel d'outils. La version officielle publiée atteint un niveau SOTA dans son domaine, adaptée aux besoins plus complexes des agents intelligents."
|
||||
},
|
||||
"qwen3-next-80b-a3b-instruct": {
|
||||
"description": "Modèle open source de nouvelle génération en mode non réflexif basé sur Qwen3, offrant une meilleure compréhension du texte en chinois, des capacités de raisonnement logique renforcées et de meilleures performances dans les tâches de génération de texte par rapport à la version précédente (Tongyi Qianwen 3-235B-A22B-Instruct-2507)."
|
||||
@@ -2813,6 +2843,9 @@
|
||||
"qwen3-next-80b-a3b-thinking": {
|
||||
"description": "Modèle open source de nouvelle génération en mode réflexif basé sur Qwen3, avec une meilleure conformité aux instructions et des réponses plus concises dans les résumés par rapport à la version précédente (Tongyi Qianwen 3-235B-A22B-Thinking-2507)."
|
||||
},
|
||||
"qwen3-vl-plus": {
|
||||
"description": "Tongyi Qianwen VL est un modèle de génération de texte doté de capacités de compréhension visuelle (images). Il peut non seulement effectuer de l'OCR (reconnaissance de texte sur images), mais aussi résumer et raisonner davantage, par exemple extraire des attributs à partir de photos de produits ou résoudre des exercices à partir d'images."
|
||||
},
|
||||
"qwq": {
|
||||
"description": "QwQ est un modèle de recherche expérimental, axé sur l'amélioration des capacités de raisonnement de l'IA."
|
||||
},
|
||||
|
||||
@@ -281,6 +281,7 @@
|
||||
"actionFiletip": "Carica file",
|
||||
"actionTooltip": "Carica",
|
||||
"disabled": "Il modello attuale non supporta il riconoscimento visivo e l'analisi dei file, si prega di cambiare modello per utilizzare questa funzione",
|
||||
"fileNotSupported": "La modalità browser non supporta il caricamento di file, è consentito solo il caricamento di immagini",
|
||||
"visionNotSupported": "Il modello attuale non supporta il riconoscimento visivo, si prega di cambiare modello per utilizzare questa funzione"
|
||||
},
|
||||
"preview": {
|
||||
@@ -289,6 +290,9 @@
|
||||
"pending": "Preparazione al caricamento...",
|
||||
"processing": "Elaborazione del file..."
|
||||
}
|
||||
},
|
||||
"validation": {
|
||||
"videoSizeExceeded": "La dimensione del file video non può superare i 20MB, la dimensione attuale del file è {{actualSize}}"
|
||||
}
|
||||
},
|
||||
"zenMode": "Modalità di concentrazione"
|
||||
|
||||
@@ -114,6 +114,7 @@
|
||||
"reasoning": "Questo modello supporta un pensiero profondo",
|
||||
"search": "Questo modello supporta la ricerca online",
|
||||
"tokens": "Questo modello supporta un massimo di {{tokens}} token per sessione.",
|
||||
"video": "Questo modello supporta il riconoscimento video",
|
||||
"vision": "Questo modello supporta il riconoscimento visivo."
|
||||
},
|
||||
"removed": "Il modello non è più nella lista, verrà rimosso automaticamente se deselezionato"
|
||||
|
||||
+53
-20
@@ -287,9 +287,6 @@
|
||||
"Pro/deepseek-ai/DeepSeek-V3.1": {
|
||||
"description": "DeepSeek-V3.1 è un modello linguistico di grandi dimensioni a modalità mista rilasciato da DeepSeek AI, che presenta numerosi aggiornamenti significativi rispetto alla generazione precedente. Una delle innovazioni principali è l'integrazione delle modalità “Thinking Mode” e “Non-thinking Mode” in un unico modello, permettendo agli utenti di passare agevolmente da una modalità all'altra modificando il template di chat, per adattarsi a diverse esigenze di compito. Grazie a un'ottimizzazione post-addestramento dedicata, la versione V3.1 ha migliorato significativamente le prestazioni nell'uso degli strumenti e nelle attività degli agenti, supportando meglio strumenti di ricerca esterni e l'esecuzione di compiti complessi a più fasi. Basato su DeepSeek-V3.1-Base, il modello è stato ulteriormente addestrato con un metodo di estensione in due fasi per testi lunghi, aumentando notevolmente la quantità di dati di addestramento e migliorando la gestione di documenti lunghi e codice esteso. Essendo un modello open source, DeepSeek-V3.1 dimostra capacità comparabili ai migliori modelli proprietari in benchmark di codifica, matematica e ragionamento, e grazie alla sua architettura a esperti misti (MoE), mantiene una grande capacità del modello riducendo efficacemente i costi di inferenza."
|
||||
},
|
||||
"Pro/moonshotai/Kimi-K2-Instruct": {
|
||||
"description": "Kimi K2 è un modello base con architettura MoE dotato di potenti capacità di codice e agenti, con 1 trilione di parametri totali e 32 miliardi di parametri attivi. Nei test di benchmark su ragionamento generale, programmazione, matematica e agenti, il modello K2 supera altri modelli open source principali."
|
||||
},
|
||||
"Pro/moonshotai/Kimi-K2-Instruct-0905": {
|
||||
"description": "Kimi K2-Instruct-0905 è l'ultima e più potente versione di Kimi K2. Si tratta di un modello linguistico di esperti misti (MoE) all'avanguardia, con un totale di 1 trilione di parametri e 32 miliardi di parametri attivi. Le caratteristiche principali del modello includono: intelligenza potenziata per la codifica degli agenti, con miglioramenti significativi nelle prestazioni sia nei test di riferimento pubblici sia nelle attività di codifica degli agenti nel mondo reale; esperienza di codifica frontend migliorata, con progressi sia nell'estetica che nella praticità della programmazione frontend."
|
||||
},
|
||||
@@ -380,6 +377,12 @@
|
||||
"Qwen/Qwen3-Coder-480B-A35B-Instruct": {
|
||||
"description": "Qwen3-Coder-480B-A35B-Instruct è un modello di codice rilasciato da Alibaba, finora il più dotato di capacità agentiche. Si tratta di un modello Mixture-of-Experts (MoE) con 480 miliardi di parametri totali e 35 miliardi di parametri attivi, che bilancia efficienza e prestazioni. Il modello supporta nativamente una lunghezza di contesto di 256K (circa 260.000) token e può essere esteso fino a 1 milione di token tramite metodi di estrapolazione come YaRN, permettendogli di gestire codebase di grandi dimensioni e compiti di programmazione complessi. Qwen3-Coder è progettato per flussi di lavoro di codifica basati su agenti: non solo genera codice, ma può anche interagire autonomamente con strumenti e ambienti di sviluppo per risolvere problemi di programmazione complessi. In diversi benchmark su compiti di codifica e agent, il modello si colloca ai vertici tra i modelli open source, con prestazioni comparabili a quelle di modelli di riferimento come Claude Sonnet 4."
|
||||
},
|
||||
"Qwen/Qwen3-Next-80B-A3B-Instruct": {
|
||||
"description": "Qwen3-Next-80B-A3B-Instruct è un modello di base di nuova generazione rilasciato dal team Tongyi Qianwen di Alibaba. Basato sulla nuova architettura Qwen3-Next, mira a raggiungere un'efficienza estrema in addestramento e inferenza. Il modello utilizza un innovativo meccanismo di attenzione ibrida (Gated DeltaNet e Gated Attention), una struttura di esperti misti ad alta sparsità (MoE) e numerose ottimizzazioni per la stabilità dell'addestramento. Come modello sparso con un totale di 80 miliardi di parametri, attiva solo circa 3 miliardi di parametri durante l'inferenza, riducendo significativamente i costi computazionali. Nelle attività con contesti lunghi oltre 32K token, la sua capacità di throughput supera di oltre 10 volte quella del modello Qwen3-32B. Questa versione è ottimizzata per l'istruzione e progettata per compiti generali, senza supporto per la modalità catena di pensiero (Thinking). In termini di prestazioni, si comporta in modo comparabile al modello di punta Tongyi Qianwen Qwen3-235B in alcuni benchmark, mostrando un vantaggio evidente nelle attività con contesti ultra lunghi."
|
||||
},
|
||||
"Qwen/Qwen3-Next-80B-A3B-Thinking": {
|
||||
"description": "Qwen3-Next-80B-A3B-Thinking è un modello di base di nuova generazione rilasciato dal team Tongyi Qianwen di Alibaba, progettato specificamente per compiti di ragionamento complesso. Basato sull'innovativa architettura Qwen3-Next, che integra un meccanismo di attenzione ibrida (Gated DeltaNet e Gated Attention) e una struttura di esperti misti ad alta sparsità (MoE), mira a massimizzare l'efficienza di addestramento e inferenza. Come modello sparso con un totale di 80 miliardi di parametri, attiva solo circa 3 miliardi di parametri durante l'inferenza, riducendo notevolmente i costi computazionali. Nelle attività con contesti lunghi oltre 32K token, il throughput supera di oltre 10 volte quello del modello Qwen3-32B. Questa versione “Thinking” è ottimizzata per eseguire compiti multi-step complessi come dimostrazioni matematiche, sintesi di codice, analisi logica e pianificazione, e produce di default il processo di ragionamento in forma strutturata di “catena di pensiero”. In termini di prestazioni, supera non solo modelli più costosi come Qwen3-32B-Thinking, ma anche Gemini-2.5-Flash-Thinking in diversi benchmark."
|
||||
},
|
||||
"Qwen2-72B-Instruct": {
|
||||
"description": "Qwen2 è l'ultima serie del modello Qwen, supporta un contesto di 128k, e rispetto ai modelli open source attualmente migliori, Qwen2-72B supera significativamente i modelli leader attuali in comprensione del linguaggio naturale, conoscenza, codice, matematica e capacità multilingue."
|
||||
},
|
||||
@@ -809,9 +812,6 @@
|
||||
"codex-mini-latest": {
|
||||
"description": "codex-mini-latest è una versione ottimizzata di o4-mini, progettata specificamente per Codex CLI. Per l'uso diretto tramite API, consigliamo di iniziare con gpt-4.1."
|
||||
},
|
||||
"cognitivecomputations/dolphin-mixtral-8x22b": {
|
||||
"description": "Dolphin Mixtral 8x22B è un modello progettato per seguire istruzioni, dialogo e programmazione."
|
||||
},
|
||||
"cogview-4": {
|
||||
"description": "CogView-4 è il primo modello open source di Zhipu che supporta la generazione di caratteri cinesi, con miglioramenti completi nella comprensione semantica, nella qualità della generazione delle immagini e nella capacità di generare testi in cinese e inglese. Supporta input bilingue cinese-inglese di qualsiasi lunghezza e può generare immagini a risoluzione arbitraria entro un intervallo specificato."
|
||||
},
|
||||
@@ -926,6 +926,9 @@
|
||||
"deepseek-ai/deepseek-r1": {
|
||||
"description": "LLM altamente efficiente, specializzato in ragionamento, matematica e programmazione."
|
||||
},
|
||||
"deepseek-ai/deepseek-v3.1": {
|
||||
"description": "DeepSeek V3.1: modello di inferenza di nuova generazione che migliora le capacità di ragionamento complesso e di pensiero a catena, adatto a compiti che richiedono analisi approfondite."
|
||||
},
|
||||
"deepseek-ai/deepseek-vl2": {
|
||||
"description": "DeepSeek-VL2 è un modello linguistico visivo a esperti misti (MoE) sviluppato sulla base di DeepSeekMoE-27B, che utilizza un'architettura MoE con attivazione sparsa, raggiungendo prestazioni eccezionali attivando solo 4,5 miliardi di parametri. Questo modello eccelle in vari compiti, tra cui domande visive, riconoscimento ottico dei caratteri, comprensione di documenti/tabelle/grafici e localizzazione visiva."
|
||||
},
|
||||
@@ -1007,6 +1010,9 @@
|
||||
"deepseek-v3.1": {
|
||||
"description": "DeepSeek-V3.1 è il nuovo modello di ragionamento ibrido lanciato da DeepSeek, che supporta due modalità di ragionamento: con pensiero e senza pensiero, con un'efficienza di pensiero superiore rispetto a DeepSeek-R1-0528. Ottimizzato tramite post-addestramento, l'uso degli strumenti Agent e le prestazioni nelle attività degli agenti sono notevolmente migliorate. Supporta una finestra contestuale di 128k e una lunghezza massima di output di 64k token."
|
||||
},
|
||||
"deepseek-v3.1:671b": {
|
||||
"description": "DeepSeek V3.1: modello di inferenza di nuova generazione che migliora le capacità di ragionamento complesso e di pensiero a catena, adatto a compiti che richiedono analisi approfondite."
|
||||
},
|
||||
"deepseek/deepseek-chat-v3-0324": {
|
||||
"description": "DeepSeek V3 è un modello misto esperto con 685B di parametri, l'ultima iterazione della serie di modelli di chat di punta del team DeepSeek.\n\nEredita il modello [DeepSeek V3](/deepseek/deepseek-chat-v3) e si comporta eccezionalmente in vari compiti."
|
||||
},
|
||||
@@ -1626,7 +1632,7 @@
|
||||
"description": "ChatGPT-4o è un modello dinamico che si aggiorna in tempo reale per mantenere sempre l'ultima versione. Combina una potente comprensione del linguaggio e capacità di generazione, rendendolo adatto a scenari di applicazione su larga scala, inclusi assistenza clienti, istruzione e supporto tecnico."
|
||||
},
|
||||
"gpt-4o-audio-preview": {
|
||||
"description": "Modello GPT-4o Audio, supporta input e output audio."
|
||||
"description": "Modello GPT-4o Audio Preview, supporta input e output audio."
|
||||
},
|
||||
"gpt-4o-mini": {
|
||||
"description": "GPT-4o mini è il modello più recente lanciato da OpenAI dopo il GPT-4 Omni, supporta input visivi e testuali e produce output testuali. Come il loro modello di punta in formato ridotto, è molto più economico rispetto ad altri modelli all'avanguardia recenti e costa oltre il 60% in meno rispetto a GPT-3.5 Turbo. Mantiene un'intelligenza all'avanguardia, offrendo un rapporto qualità-prezzo significativo. GPT-4o mini ha ottenuto un punteggio dell'82% nel test MMLU e attualmente è classificato più in alto di GPT-4 per preferenze di chat."
|
||||
@@ -1667,24 +1673,33 @@
|
||||
"gpt-5-chat-latest": {
|
||||
"description": "Modello GPT-5 utilizzato in ChatGPT. Combina potenti capacità di comprensione e generazione del linguaggio, ideale per applicazioni di interazione conversazionale."
|
||||
},
|
||||
"gpt-5-codex": {
|
||||
"description": "GPT-5 Codex è una versione di GPT-5 ottimizzata per compiti di codifica agenti in ambienti Codex o simili."
|
||||
},
|
||||
"gpt-5-mini": {
|
||||
"description": "Versione più veloce ed economica di GPT-5, adatta a compiti ben definiti. Offre risposte più rapide mantenendo un output di alta qualità."
|
||||
},
|
||||
"gpt-5-nano": {
|
||||
"description": "Versione più veloce ed economica di GPT-5. Perfetta per scenari applicativi che richiedono risposte rapide e sono sensibili ai costi."
|
||||
},
|
||||
"gpt-audio": {
|
||||
"description": "GPT Audio è un modello di chat universale per input e output audio, supporta l'uso di I/O audio nell'API Chat Completions."
|
||||
},
|
||||
"gpt-image-1": {
|
||||
"description": "Modello nativo multimodale di generazione immagini di ChatGPT"
|
||||
},
|
||||
"gpt-oss": {
|
||||
"description": "GPT-OSS 20B è un modello linguistico open source rilasciato da OpenAI, che utilizza la tecnologia di quantizzazione MXFP4, adatto per l'esecuzione su GPU di fascia alta per consumatori o su Mac con Apple Silicon. Questo modello eccelle nella generazione di dialoghi, nella scrittura di codice e nei compiti di ragionamento, supportando chiamate di funzione e l'uso di strumenti."
|
||||
},
|
||||
"gpt-oss-120b": {
|
||||
"description": "GPT-OSS-120B MXFP4: struttura Transformer quantizzata, mantiene prestazioni elevate anche con risorse limitate."
|
||||
},
|
||||
"gpt-oss:120b": {
|
||||
"description": "GPT-OSS 120B è un modello linguistico open source di grandi dimensioni rilasciato da OpenAI, che utilizza la tecnologia di quantizzazione MXFP4, rappresentando un modello di punta. Richiede un ambiente con più GPU o una workstation ad alte prestazioni per l'esecuzione, offrendo prestazioni eccellenti in ragionamenti complessi, generazione di codice e gestione multilingue, supportando chiamate di funzione avanzate e integrazione di strumenti."
|
||||
},
|
||||
"gpt-oss:20b": {
|
||||
"description": "GPT-OSS 20B è un modello di linguaggio di grandi dimensioni open source rilasciato da OpenAI, che utilizza la tecnologia di quantizzazione MXFP4, adatto per l'esecuzione su GPU consumer di fascia alta o Mac Apple Silicon. Il modello eccelle in generazione di dialoghi, scrittura di codice e compiti di ragionamento, supportando chiamate di funzione e uso di strumenti."
|
||||
},
|
||||
"gpt-realtime": {
|
||||
"description": "Modello universale in tempo reale, supporta input e output testuali e audio in tempo reale, oltre a input di immagini."
|
||||
},
|
||||
"grok-2-1212": {
|
||||
"description": "Questo modello ha migliorato l'accuratezza, il rispetto delle istruzioni e le capacità multilingue."
|
||||
},
|
||||
@@ -1712,6 +1727,12 @@
|
||||
"grok-4-0709": {
|
||||
"description": "Grok 4 di xAI, dotato di potenti capacità di ragionamento."
|
||||
},
|
||||
"grok-4-fast-non-reasoning": {
|
||||
"description": "Siamo lieti di annunciare Grok 4 Fast, il nostro ultimo progresso nei modelli di inferenza con ottimo rapporto costo-efficacia."
|
||||
},
|
||||
"grok-4-fast-reasoning": {
|
||||
"description": "Siamo lieti di annunciare Grok 4 Fast, il nostro ultimo progresso nei modelli di inferenza con ottimo rapporto costo-efficacia."
|
||||
},
|
||||
"grok-code-fast-1": {
|
||||
"description": "Siamo lieti di presentare grok-code-fast-1, un modello di inferenza rapido ed economico, eccellente nella codifica degli agenti."
|
||||
},
|
||||
@@ -1847,8 +1868,14 @@
|
||||
"inception/mercury-coder-small": {
|
||||
"description": "Mercury Coder Small è la scelta ideale per compiti di generazione, debug e refactoring di codice, con latenza minima."
|
||||
},
|
||||
"inclusionAI/Ling-flash-2.0": {
|
||||
"description": "Ling-flash-2.0 è il terzo modello della serie basata sull'architettura Ling 2.0 rilasciato dal team Bailing di Ant Group. È un modello di esperti misti (MoE) con un totale di 100 miliardi di parametri, ma attiva solo 6,1 miliardi di parametri per token (4,8 miliardi non embedding). Come modello leggero, Ling-flash-2.0 dimostra prestazioni paragonabili o superiori a modelli densi da 40 miliardi e a modelli MoE di scala maggiore in molte valutazioni autorevoli. Il modello esplora un percorso efficiente attraverso un design architetturale e strategie di addestramento estreme, sfidando il consenso che “modello grande equivale a molti parametri”."
|
||||
},
|
||||
"inclusionAI/Ling-mini-2.0": {
|
||||
"description": "Ling-mini-2.0 è un modello linguistico di grandi dimensioni ad alte prestazioni e di piccole dimensioni basato sull'architettura MoE. Possiede 16 miliardi di parametri totali, ma per ogni token ne attiva solo 1,4 miliardi (non embedding 789 milioni), consentendo così una velocità di generazione estremamente elevata. Grazie a un design MoE efficiente e a dati di addestramento di alta qualità su larga scala, nonostante i soli 1,4 miliardi di parametri attivi, Ling-mini-2.0 dimostra prestazioni di punta in compiti downstream comparabili a modelli LLM densi sotto i 10 miliardi e a modelli MoE di dimensioni maggiori."
|
||||
"description": "Ling-mini-2.0 è un modello di linguaggio di grandi dimensioni ad alte prestazioni e dimensioni ridotte basato sull'architettura MoE. Ha 16 miliardi di parametri totali, ma attiva solo 1,4 miliardi per token (789 milioni non embedding), raggiungendo così velocità di generazione molto elevate. Grazie al design efficiente MoE e a dati di addestramento di grande scala e alta qualità, Ling-mini-2.0 mostra prestazioni di punta in compiti downstream, comparabili a modelli densi sotto i 10 miliardi e a modelli MoE di scala maggiore."
|
||||
},
|
||||
"inclusionAI/Ring-flash-2.0": {
|
||||
"description": "Ring-flash-2.0 è un modello di pensiero ad alte prestazioni profondamente ottimizzato basato su Ling-flash-2.0-base. Utilizza un'architettura di esperti misti (MoE) con 100 miliardi di parametri totali, ma attiva solo 6,1 miliardi di parametri per inferenza. Il modello risolve l'instabilità dell'addestramento RL nei grandi modelli MoE grazie all'algoritmo innovativo icepop, migliorando continuamente le capacità di ragionamento complesso durante l'addestramento a lungo termine. Ring-flash-2.0 ha raggiunto risultati significativi in competizioni matematiche, generazione di codice e ragionamento logico, superando modelli densi di punta sotto i 40 miliardi di parametri e competendo con modelli MoE open source di scala maggiore e modelli di pensiero ad alte prestazioni closed source. Pur focalizzato sul ragionamento complesso, eccelle anche in compiti di scrittura creativa. Inoltre, grazie al design architetturale efficiente, Ring-flash-2.0 offre prestazioni elevate con inferenza veloce, riducendo significativamente i costi di deployment in scenari ad alta concorrenza."
|
||||
},
|
||||
"internlm/internlm2_5-7b-chat": {
|
||||
"description": "InternLM2.5 offre soluzioni di dialogo intelligente in vari scenari."
|
||||
@@ -1974,7 +2001,10 @@
|
||||
"description": "LLaVA è un modello multimodale che combina un codificatore visivo e Vicuna, per una potente comprensione visiva e linguistica."
|
||||
},
|
||||
"magistral-medium-latest": {
|
||||
"description": "Magistral Medium 1.1 è un modello di inferenza all'avanguardia rilasciato da Mistral AI a luglio 2025."
|
||||
"description": "Magistral Medium 1.2 è un modello di inferenza all'avanguardia con supporto visivo, rilasciato da Mistral AI a settembre 2025."
|
||||
},
|
||||
"magistral-small-2509": {
|
||||
"description": "Magistral Small 1.2 è un modello di inferenza open source di piccole dimensioni con supporto visivo, rilasciato da Mistral AI a settembre 2025."
|
||||
},
|
||||
"mathstral": {
|
||||
"description": "MathΣtral è progettato per la ricerca scientifica e il ragionamento matematico, offre capacità di calcolo efficaci e interpretazione dei risultati."
|
||||
@@ -2282,9 +2312,6 @@
|
||||
"mistral/mistral-large": {
|
||||
"description": "Mistral Large è la scelta ideale per compiti complessi che richiedono grandi capacità di ragionamento o alta specializzazione, come generazione di testo sintetico, generazione di codice, RAG o agenti."
|
||||
},
|
||||
"mistral/mistral-saba-24b": {
|
||||
"description": "Mistral Saba 24B è un modello open source da 24 miliardi di parametri sviluppato da Mistral.ai. Saba è un modello specializzato addestrato per eccellere in arabo, persiano, urdu, ebraico e lingue indiane. Servito da Groq con il suo hardware personalizzato Language Processing Unit (LPU) per inferenze rapide ed efficienti."
|
||||
},
|
||||
"mistral/mistral-small": {
|
||||
"description": "Mistral Small è la scelta ideale per compiti semplici che possono essere eseguiti in batch, come classificazione, supporto clienti o generazione di testo. Offre ottime prestazioni a un prezzo accessibile."
|
||||
},
|
||||
@@ -2357,9 +2384,6 @@
|
||||
"moonshotai/Kimi-Dev-72B": {
|
||||
"description": "Kimi-Dev-72B è un modello open source di grandi dimensioni per il codice, ottimizzato tramite apprendimento rinforzato su larga scala, capace di generare patch robuste e pronte per la produzione. Questo modello ha raggiunto un nuovo record del 60,4% su SWE-bench Verified, superando tutti i modelli open source nelle attività di ingegneria del software automatizzata come la correzione di difetti e la revisione del codice."
|
||||
},
|
||||
"moonshotai/Kimi-K2-Instruct": {
|
||||
"description": "Kimi K2 è un modello base con architettura MoE dotato di potenti capacità di codice e agenti, con 1 trilione di parametri totali e 32 miliardi di parametri attivi. Nei test di benchmark su ragionamento generale, programmazione, matematica e agenti, il modello K2 supera altri modelli open source principali."
|
||||
},
|
||||
"moonshotai/Kimi-K2-Instruct-0905": {
|
||||
"description": "Kimi K2-Instruct-0905 è l'ultima e più potente versione di Kimi K2. Si tratta di un modello linguistico di esperti misti (MoE) all'avanguardia, con un totale di 1 trilione di parametri e 32 miliardi di parametri attivi. Le caratteristiche principali del modello includono: intelligenza potenziata per la codifica degli agenti, con miglioramenti significativi nelle prestazioni sia nei test di riferimento pubblici sia nelle attività di codifica degli agenti nel mondo reale; esperienza di codifica frontend migliorata, con progressi sia nell'estetica che nella praticità della programmazione frontend."
|
||||
},
|
||||
@@ -2570,6 +2594,9 @@
|
||||
"qwen-image": {
|
||||
"description": "Qwen-Image è un modello universale per la generazione di immagini che supporta molteplici stili artistici ed è particolarmente efficace nel rendering di testi complessi, in particolare nella resa di testi in cinese e in inglese. Il modello supporta layout a più righe, generazione di testo a livello di paragrafo e rappresentazione di dettagli ad alta precisione, permettendo la realizzazione di layout misti e design complessi che integrano testo e immagini."
|
||||
},
|
||||
"qwen-image-edit": {
|
||||
"description": "Qwen Image Edit è un modello di generazione di immagini che supporta la modifica e l'editing delle immagini basati su input di immagini e suggerimenti testuali, in grado di effettuare regolazioni precise e trasformazioni creative dell'immagine originale secondo le esigenze dell'utente."
|
||||
},
|
||||
"qwen-long": {
|
||||
"description": "Qwen è un modello di linguaggio su larga scala che supporta contesti di testo lunghi e funzionalità di dialogo basate su documenti lunghi e multipli."
|
||||
},
|
||||
@@ -2804,8 +2831,11 @@
|
||||
"qwen3-coder-plus": {
|
||||
"description": "Modello di codice Tongyi Qianwen. L'ultima serie di modelli Qwen3-Coder si basa su Qwen3 per la generazione di codice, con potenti capacità di Coding Agent, eccellente nell'invocazione di strumenti e interazione con l'ambiente, in grado di programmare autonomamente, con capacità di codice eccezionali e abilità generali."
|
||||
},
|
||||
"qwen3-max-preview": {
|
||||
"description": "Versione preview del modello Max della serie Qwen 3, che presenta un miglioramento significativo rispetto alla serie 2.5 nelle capacità generali, comprensione del testo in cinese e inglese, rispetto di istruzioni complesse, compiti soggettivi aperti, capacità multilingue e chiamata di strumenti; il modello presenta meno allucinazioni di conoscenza."
|
||||
"qwen3-coder:480b": {
|
||||
"description": "Modello ad alte prestazioni di Alibaba per compiti di agenti e codifica con contesti lunghi."
|
||||
},
|
||||
"qwen3-max": {
|
||||
"description": "La serie Max di Tongyi Qianwen 3 rappresenta un significativo miglioramento rispetto alla serie 2.5 in termini di capacità generali. Le capacità di comprensione del testo in cinese e inglese, l'aderenza a istruzioni complesse, la gestione di compiti soggettivi aperti, le capacità multilingue e l'invocazione di strumenti sono tutte notevolmente potenziate; il modello presenta meno allucinazioni di conoscenza. L'ultima versione qwen3-max ha effettuato aggiornamenti specifici in programmazione intelligente e invocazione di strumenti rispetto alla versione preview. Il modello ufficiale rilasciato raggiunge livelli SOTA nel settore, adattandosi a scenari più complessi per agenti intelligenti."
|
||||
},
|
||||
"qwen3-next-80b-a3b-instruct": {
|
||||
"description": "Modello open source di nuova generazione basato su Qwen3 in modalità non riflessiva, con una migliore comprensione del testo in cinese rispetto alla versione precedente (Tongyi Qianwen 3-235B-A22B-Instruct-2507), capacità di ragionamento logico potenziate e prestazioni superiori nelle attività di generazione di testo."
|
||||
@@ -2813,6 +2843,9 @@
|
||||
"qwen3-next-80b-a3b-thinking": {
|
||||
"description": "Modello open source di nuova generazione basato su Qwen3 in modalità riflessiva, con migliorata capacità di seguire le istruzioni rispetto alla versione precedente (Tongyi Qianwen 3-235B-A22B-Thinking-2507) e risposte di sintesi più concise."
|
||||
},
|
||||
"qwen3-vl-plus": {
|
||||
"description": "Tongyi Qianwen VL è un modello di generazione testuale con capacità di comprensione visiva (immagini). Non solo può eseguire OCR (riconoscimento del testo nelle immagini), ma anche riassumere e ragionare ulteriormente, ad esempio estraendo attributi da foto di prodotti o risolvendo problemi basati su immagini di esercizi."
|
||||
},
|
||||
"qwq": {
|
||||
"description": "QwQ è un modello di ricerca sperimentale, focalizzato sul miglioramento delle capacità di ragionamento dell'IA."
|
||||
},
|
||||
|
||||
@@ -281,6 +281,7 @@
|
||||
"actionFiletip": "ファイルをアップロード",
|
||||
"actionTooltip": "アップロード",
|
||||
"disabled": "現在のモデルは視覚認識とファイル分析をサポートしていません。モデルを切り替えてから使用してください。",
|
||||
"fileNotSupported": "ブラウザモードではファイルのアップロードはサポートされておらず、画像のみ対応しています",
|
||||
"visionNotSupported": "現在のモデルはビジョン認識をサポートしていません。モデルを切り替えてからご利用ください。"
|
||||
},
|
||||
"preview": {
|
||||
@@ -289,6 +290,9 @@
|
||||
"pending": "アップロードの準備中...",
|
||||
"processing": "ファイル処理中..."
|
||||
}
|
||||
},
|
||||
"validation": {
|
||||
"videoSizeExceeded": "動画ファイルのサイズは20MBを超えることはできません。現在のファイルサイズは{{actualSize}}です"
|
||||
}
|
||||
},
|
||||
"zenMode": "集中モード"
|
||||
|
||||
@@ -114,6 +114,7 @@
|
||||
"reasoning": "このモデルは深い思考をサポートしています",
|
||||
"search": "このモデルはオンライン検索をサポートしています",
|
||||
"tokens": "このモデルは1つのセッションあたり最大{{tokens}}トークンをサポートしています。",
|
||||
"video": "このモデルは動画認識に対応しています",
|
||||
"vision": "このモデルはビジョン認識をサポートしています。"
|
||||
},
|
||||
"removed": "選択されたモデルはリストから削除されました。選択を解除すると自動的に削除されます。"
|
||||
|
||||
+53
-20
@@ -287,9 +287,6 @@
|
||||
"Pro/deepseek-ai/DeepSeek-V3.1": {
|
||||
"description": "DeepSeek-V3.1 は DeepSeek AI によってリリースされたハイブリッドモードの大規模言語モデルで、前世代モデルを基に多方面で重要なアップグレードが施されています。このモデルの大きな革新は「思考モード」と「非思考モード」を統合しており、ユーザーはチャットテンプレートを調整することで柔軟に切り替え、異なるタスクのニーズに対応できます。専用のポストトレーニング最適化により、V3.1 はツール呼び出しやエージェントタスクの性能が著しく向上し、外部検索ツールのサポートや多段階の複雑なタスクの実行がより効果的になりました。このモデルは DeepSeek-V3.1-Base をベースにポストトレーニングされ、2段階の長文拡張手法によりトレーニングデータ量を大幅に増加させ、長文ドキュメントや長大なコードの処理能力が向上しています。オープンソースモデルとして、DeepSeek-V3.1 はコーディング、数学、推論など複数のベンチマークでトップクラスのクローズドモデルに匹敵する能力を示し、混合エキスパート(MoE)アーキテクチャにより巨大なモデル容量を維持しつつ推論コストを効果的に削減しています。"
|
||||
},
|
||||
"Pro/moonshotai/Kimi-K2-Instruct": {
|
||||
"description": "Kimi K2は超強力なコードおよびエージェント能力を持つMoEアーキテクチャの基盤モデルで、総パラメータ数1兆、活性化パラメータ320億です。汎用知識推論、プログラミング、数学、エージェントなど主要カテゴリのベンチマーク性能で他の主流オープンソースモデルを上回っています。"
|
||||
},
|
||||
"Pro/moonshotai/Kimi-K2-Instruct-0905": {
|
||||
"description": "Kimi K2-Instruct-0905 は Kimi K2 の最新かつ最強のバージョンです。これはトップクラスの混合専門家(MoE)言語モデルであり、総パラメータ数は1兆、活性化パラメータ数は320億を誇ります。このモデルの主な特徴は、強化されたエージェントのコーディング知能であり、公開ベンチマークテストおよび実世界のエージェントコーディングタスクで顕著な性能向上を示しています。また、フロントエンドのコーディング体験も改善され、フロントエンドプログラミングの美観と実用性の両面で進歩しています。"
|
||||
},
|
||||
@@ -380,6 +377,12 @@
|
||||
"Qwen/Qwen3-Coder-480B-A35B-Instruct": {
|
||||
"description": "Qwen3-Coder-480B-A35B-Instruct はアリババが公開した、これまでで最もエージェント(Agentic)能力に優れたコードモデルです。合計4,800億の総パラメータと350億のアクティベーションパラメータを持つ混合エキスパート(MoE)モデルで、効率性と性能のバランスを実現しています。本モデルはネイティブに256K(約26万)トークンのコンテキスト長をサポートし、YaRNなどの外挿手法により最大100万トークンまで拡張可能で、大規模なコードベースや複雑なプログラミングタスクの処理が可能です。Qwen3-Coderはエージェント型のコーディングワークフロー向けに設計されており、コードを生成するだけでなく、開発ツールや環境と自律的に相互作用して複雑なプログラミング課題を解決します。複数のコーディングおよびエージェントタスクのベンチマークにおいて、本モデルはオープンソースモデルの中でトップクラスの性能を示しており、その性能はClaude Sonnet 4などの先進モデルと比肩するものです。"
|
||||
},
|
||||
"Qwen/Qwen3-Next-80B-A3B-Instruct": {
|
||||
"description": "Qwen3-Next-80B-A3B-Instructは、アリババのTongyi Qianwenチームによってリリースされた次世代基盤モデルです。新しいQwen3-Nextアーキテクチャに基づき、極限のトレーニングと推論効率を実現することを目的としています。このモデルは革新的なハイブリッド注意機構(Gated DeltaNetとGated Attention)、高いスパース性を持つ混合エキスパート(MoE)構造、および複数のトレーニング安定化最適化を採用しています。総パラメータ数800億のスパースモデルとして、推論時には約30億パラメータのみを活性化し、計算コストを大幅に削減しています。32Kトークンを超える長文コンテキストタスクの処理においては、Qwen3-32Bモデルと比較して推論スループットが10倍以上向上しています。本モデルは指示微調整版であり、汎用タスク向けに設計されており、思考チェーン(Thinking)モードはサポートしていません。性能面では、Tongyi QianwenのフラッグシップモデルQwen3-235Bと一部ベンチマークで同等のパフォーマンスを示し、特に超長文コンテキストタスクで顕著な優位性を発揮します。"
|
||||
},
|
||||
"Qwen/Qwen3-Next-80B-A3B-Thinking": {
|
||||
"description": "Qwen3-Next-80B-A3B-Thinkingは、アリババのTongyi Qianwenチームによってリリースされた、複雑な推論タスク向けに設計された次世代基盤モデルです。革新的なQwen3-Nextアーキテクチャに基づき、ハイブリッド注意機構(Gated DeltaNetとGated Attention)と高スパース性混合エキスパート(MoE)構造を融合し、極限のトレーニングおよび推論効率を実現しています。総パラメータ数800億のスパースモデルとして、推論時には約30億パラメータのみを活性化し、計算コストを大幅に削減しています。32Kトークンを超える長文コンテキストタスクの処理においては、Qwen3-32Bモデルと比較してスループットが10倍以上向上しています。この「Thinking」バージョンは、数学的証明、コード合成、論理分析、計画などの高難度多段階タスクの実行に最適化されており、推論過程を構造化された「思考チェーン」形式で出力することをデフォルトとしています。性能面では、Qwen3-32B-Thinkingなどのコストの高いモデルを凌駕し、複数のベンチマークでGemini-2.5-Flash-Thinkingを上回る結果を示しています。"
|
||||
},
|
||||
"Qwen2-72B-Instruct": {
|
||||
"description": "Qwen2はQwenモデルの最新シリーズで、128kのコンテキストをサポートしています。現在の最適なオープンソースモデルと比較して、Qwen2-72Bは自然言語理解、知識、コード、数学、そして多言語などの能力において、現在のリーディングモデルを大幅に上回っています。"
|
||||
},
|
||||
@@ -809,9 +812,6 @@
|
||||
"codex-mini-latest": {
|
||||
"description": "codex-mini-latest は o4-mini の微調整バージョンで、Codex CLI 専用に設計されています。API を直接使用する場合は、gpt-4.1 から始めることを推奨します。"
|
||||
},
|
||||
"cognitivecomputations/dolphin-mixtral-8x22b": {
|
||||
"description": "Dolphin Mixtral 8x22Bは指示遵守、対話、プログラミングのために設計されたモデルです。"
|
||||
},
|
||||
"cogview-4": {
|
||||
"description": "CogView-4 は智譜が初めて開発した漢字生成対応のオープンソーステキストから画像生成モデルであり、意味理解、画像生成の品質、中英文字生成能力の全方位的な向上を実現しています。任意の長さの中英バイリンガル入力に対応し、指定された範囲内で任意の解像度の画像を生成することが可能です。"
|
||||
},
|
||||
@@ -926,6 +926,9 @@
|
||||
"deepseek-ai/deepseek-r1": {
|
||||
"description": "最先端の効率的なLLMで、推論、数学、プログラミングに優れています。"
|
||||
},
|
||||
"deepseek-ai/deepseek-v3.1": {
|
||||
"description": "DeepSeek V3.1:次世代推論モデルで、複雑な推論と連鎖的思考能力を向上させ、深い分析を必要とするタスクに適しています。"
|
||||
},
|
||||
"deepseek-ai/deepseek-vl2": {
|
||||
"description": "DeepSeek-VL2は、DeepSeekMoE-27Bに基づいて開発された混合専門家(MoE)視覚言語モデルであり、スパースアクティベーションのMoEアーキテクチャを採用し、わずか4.5Bパラメータを活性化することで卓越した性能を実現しています。このモデルは、視覚的質問応答、光学文字認識、文書/表/グラフ理解、視覚的定位などの複数のタスクで優れたパフォーマンスを発揮します。"
|
||||
},
|
||||
@@ -1007,6 +1010,9 @@
|
||||
"deepseek-v3.1": {
|
||||
"description": "DeepSeek-V3.1 は DeepSeek が新たにリリースしたハイブリッド推論モデルで、思考モードと非思考モードの2つの推論モードをサポートし、DeepSeek-R1-0528 よりも思考効率が向上しています。ポストトレーニングによる最適化により、エージェントツールの使用とインテリジェントタスクのパフォーマンスが大幅に向上しました。128k のコンテキストウィンドウをサポートし、最大64kトークンの出力長に対応しています。"
|
||||
},
|
||||
"deepseek-v3.1:671b": {
|
||||
"description": "DeepSeek V3.1:次世代推論モデルで、複雑な推論と連鎖的思考能力を向上させ、深い分析を必要とするタスクに適しています。"
|
||||
},
|
||||
"deepseek/deepseek-chat-v3-0324": {
|
||||
"description": "DeepSeek V3は、685Bパラメータの専門的な混合モデルであり、DeepSeekチームのフラッグシップチャットモデルシリーズの最新のイテレーションです。\n\nこれは、[DeepSeek V3](/deepseek/deepseek-chat-v3)モデルを継承し、さまざまなタスクで優れたパフォーマンスを発揮します。"
|
||||
},
|
||||
@@ -1626,7 +1632,7 @@
|
||||
"description": "ChatGPT-4oは動的モデルで、リアルタイムで更新され、常に最新バージョンを保持します。 powerfulな言語理解と生成能力を組み合わせており、カスタマーサービス、教育、技術サポートなどの大規模なアプリケーションに適しています。"
|
||||
},
|
||||
"gpt-4o-audio-preview": {
|
||||
"description": "GPT-4o Audio モデル、音声の入力と出力をサポート"
|
||||
"description": "GPT-4o Audio Previewモデルは、音声の入力と出力に対応しています。"
|
||||
},
|
||||
"gpt-4o-mini": {
|
||||
"description": "GPT-4o miniは、OpenAIがGPT-4 Omniの後に発表した最新のモデルで、画像とテキストの入力をサポートし、テキストを出力します。最先端の小型モデルとして、最近の他の先進モデルよりもはるかに安価で、GPT-3.5 Turboよりも60%以上安価です。最先端の知能を維持しつつ、コストパフォーマンスが大幅に向上しています。GPT-4o miniはMMLUテストで82%のスコアを獲得し、現在チャットの好みではGPT-4よりも高い評価を得ています。"
|
||||
@@ -1667,24 +1673,33 @@
|
||||
"gpt-5-chat-latest": {
|
||||
"description": "ChatGPTで使用されているGPT-5モデル。強力な言語理解と生成能力を兼ね備え、対話型インタラクションに適しています。"
|
||||
},
|
||||
"gpt-5-codex": {
|
||||
"description": "GPT-5 Codexは、Codexまたは類似環境におけるエージェントコーディングタスクに最適化されたGPT-5のバージョンです。"
|
||||
},
|
||||
"gpt-5-mini": {
|
||||
"description": "より高速でコスト効率の高いGPT-5のバージョンで、明確に定義されたタスクに適しています。高品質な出力を維持しつつ、より速い応答速度を提供します。"
|
||||
},
|
||||
"gpt-5-nano": {
|
||||
"description": "最も高速かつコスト効率の高いGPT-5のバージョン。迅速な応答が求められ、コストに敏感なアプリケーションに非常に適しています。"
|
||||
},
|
||||
"gpt-audio": {
|
||||
"description": "GPT Audioは音声の入出力に対応した汎用チャットモデルで、Chat Completions APIでの音声I/O利用をサポートしています。"
|
||||
},
|
||||
"gpt-image-1": {
|
||||
"description": "ChatGPT ネイティブのマルチモーダル画像生成モデル"
|
||||
},
|
||||
"gpt-oss": {
|
||||
"description": "GPT-OSS 20B は OpenAI が公開したオープンソースの大規模言語モデルで、MXFP4 量子化技術を採用しており、高性能なコンシューマー向けGPUやApple Silicon搭載Macでの動作に適しています。このモデルは対話生成、コード作成、推論タスクに優れており、関数呼び出しやツールの使用をサポートしています。"
|
||||
},
|
||||
"gpt-oss-120b": {
|
||||
"description": "GPT-OSS-120B MXFP4量子化Transformer構造で、リソース制限下でも高い性能を維持します。"
|
||||
},
|
||||
"gpt-oss:120b": {
|
||||
"description": "GPT-OSS 120B は OpenAI が公開した大型のオープンソース言語モデルで、MXFP4 量子化技術を採用したフラッグシップモデルです。複数GPUや高性能ワークステーション環境での動作が必要で、複雑な推論、コード生成、多言語処理において卓越した性能を発揮し、高度な関数呼び出しやツール統合をサポートしています。"
|
||||
},
|
||||
"gpt-oss:20b": {
|
||||
"description": "GPT-OSS 20BはOpenAIがリリースしたオープンソースの大規模言語モデルで、MXFP4量子化技術を採用し、高性能なコンシューマーGPUやApple Silicon Macでの動作に適しています。このモデルは対話生成、コード作成、推論タスクで優れた性能を発揮し、関数呼び出しやツール利用をサポートしています。"
|
||||
},
|
||||
"gpt-realtime": {
|
||||
"description": "汎用リアルタイムモデルで、テキストと音声のリアルタイム入出力に対応し、画像入力もサポートしています。"
|
||||
},
|
||||
"grok-2-1212": {
|
||||
"description": "このモデルは、精度、指示の遵守、そして多言語能力において改善されています。"
|
||||
},
|
||||
@@ -1712,6 +1727,12 @@
|
||||
"grok-4-0709": {
|
||||
"description": "xAI の Grok 4 は強力な推論能力を備えています。"
|
||||
},
|
||||
"grok-4-fast-non-reasoning": {
|
||||
"description": "コスト効率の高い推論モデルにおける最新の進展として、Grok 4 Fastをリリースできることを嬉しく思います。"
|
||||
},
|
||||
"grok-4-fast-reasoning": {
|
||||
"description": "コスト効率の高い推論モデルにおける最新の進展として、Grok 4 Fastをリリースできることを嬉しく思います。"
|
||||
},
|
||||
"grok-code-fast-1": {
|
||||
"description": "私たちは、迅速かつ経済的な推論モデルであるgrok-code-fast-1を発表できることを嬉しく思います。このモデルはエージェントのコーディングに優れた性能を発揮します。"
|
||||
},
|
||||
@@ -1847,8 +1868,14 @@
|
||||
"inception/mercury-coder-small": {
|
||||
"description": "Mercury Coder Small はコード生成、デバッグ、リファクタリングタスクに最適で、最小遅延を実現します。"
|
||||
},
|
||||
"inclusionAI/Ling-flash-2.0": {
|
||||
"description": "Ling-flash-2.0は、Ant GroupのBailingチームがリリースしたLing 2.0アーキテクチャシリーズの第3弾モデルです。混合エキスパート(MoE)モデルで、総パラメータ数は1000億に達しますが、1トークンあたりの活性化パラメータは61億(非埋め込みは48億)に抑えられています。軽量構成のモデルとして、複数の権威ある評価で400億規模の密モデルやより大規模なMoEモデルに匹敵またはそれを超える性能を示しています。本モデルは「大きなモデル=大きなパラメータ」という共通認識のもと、効率的な性能向上の道を探求するために極限のアーキテクチャ設計とトレーニング戦略を採用しています。"
|
||||
},
|
||||
"inclusionAI/Ling-mini-2.0": {
|
||||
"description": "Ling-mini-2.0 は MoE アーキテクチャに基づく小型高性能大規模言語モデルです。総パラメータ数は16Bですが、各トークンあたりの活性化パラメータはわずか1.4B(非埋め込み部分は789M)であり、非常に高速な生成速度を実現しています。効率的な MoE 設計と大規模かつ高品質なトレーニングデータのおかげで、活性化パラメータが1.4Bに過ぎないにもかかわらず、Ling-mini-2.0 は下流タスクにおいて10B以下のデンスLLMやより大規模なMoEモデルに匹敵するトップクラスの性能を発揮します。"
|
||||
"description": "Ling-mini-2.0はMoEアーキテクチャに基づく小型高性能大規模言語モデルです。総パラメータ数は16Bですが、1トークンあたりの活性化パラメータは1.4B(非埋め込みは789M)に抑えられており、非常に高速な生成を実現しています。効率的なMoE設計と大規模高品質トレーニングデータのおかげで、活性化パラメータが1.4Bに過ぎないにもかかわらず、下流タスクにおいて10B未満の密モデルやより大規模なMoEモデルに匹敵するトップクラスの性能を発揮します。"
|
||||
},
|
||||
"inclusionAI/Ring-flash-2.0": {
|
||||
"description": "Ring-flash-2.0はLing-flash-2.0-baseを深く最適化した高性能思考モデルです。混合エキスパート(MoE)アーキテクチャを採用し、総パラメータ数は100Bですが、推論時には6.1Bパラメータのみを活性化します。独自のicepopアルゴリズムにより、MoE大規模モデルの強化学習(RL)トレーニングにおける不安定性問題を解決し、長期トレーニングでの複雑推論能力の持続的向上を実現しました。Ring-flash-2.0は数学コンテスト、コード生成、論理推論などの高難度ベンチマークで顕著な成果を挙げており、40Bパラメータ未満のトップ密モデルを凌駕し、より大規模なオープンソースMoEモデルやクローズドソースの高性能思考モデルに匹敵します。複雑推論に特化しつつも、創造的な文章作成タスクでも優れた性能を示します。さらに、高効率なアーキテクチャ設計により、強力な性能を提供しつつ高速推論を実現し、高負荷環境での思考モデルの展開コストを大幅に削減しています。"
|
||||
},
|
||||
"internlm/internlm2_5-7b-chat": {
|
||||
"description": "InternLM2.5は多様なシーンでのインテリジェントな対話ソリューションを提供します。"
|
||||
@@ -1974,7 +2001,10 @@
|
||||
"description": "LLaVAは、視覚エンコーダーとVicunaを組み合わせたマルチモーダルモデルであり、強力な視覚と言語理解を提供します。"
|
||||
},
|
||||
"magistral-medium-latest": {
|
||||
"description": "Magistral Medium 1.1 は Mistral AI が2025年7月に発表した最先端の推論モデルです。"
|
||||
"description": "Magistral Medium 1.2 は、Mistral AI が2025年9月にリリースした最先端の推論モデルで、視覚サポートを備えています。"
|
||||
},
|
||||
"magistral-small-2509": {
|
||||
"description": "Magistral Small 1.2 は、Mistral AI が2025年9月にリリースしたオープンソースの小型推論モデルで、視覚サポートを備えています。"
|
||||
},
|
||||
"mathstral": {
|
||||
"description": "MathΣtralは、科学研究と数学推論のために設計されており、効果的な計算能力と結果の解釈を提供します。"
|
||||
@@ -2282,9 +2312,6 @@
|
||||
"mistral/mistral-large": {
|
||||
"description": "大規模推論能力や高度な専門性を必要とする複雑なタスクに最適なモデルで、合成テキスト生成、コード生成、RAG、エージェントに適しています。"
|
||||
},
|
||||
"mistral/mistral-saba-24b": {
|
||||
"description": "Mistral Saba 24B は Mistral.ai による240億パラメータのオープンソースモデルです。Saba はアラビア語、ペルシャ語、ウルドゥー語、ヘブライ語、インド言語での優れた性能を目指して特別に訓練されたモデルです。Groq のカスタム言語処理ユニット(LPU)ハードウェアでサービス提供され、高速かつ効率的な推論を実現します。"
|
||||
},
|
||||
"mistral/mistral-small": {
|
||||
"description": "Mistral Small は分類、カスタマーサポート、テキスト生成などのバッチ処理可能なシンプルなタスクに最適で、手頃な価格で優れた性能を提供します。"
|
||||
},
|
||||
@@ -2357,9 +2384,6 @@
|
||||
"moonshotai/Kimi-Dev-72B": {
|
||||
"description": "Kimi-Dev-72B はオープンソースの大規模コードモデルであり、大規模な強化学習によって最適化されており、堅牢で直接本番投入可能なパッチを出力できます。このモデルは SWE-bench Verified で 60.4% の新記録を達成し、欠陥修正やコードレビューなどの自動化ソフトウェア工学タスクにおけるオープンソースモデルの記録を更新しました。"
|
||||
},
|
||||
"moonshotai/Kimi-K2-Instruct": {
|
||||
"description": "Kimi K2は超強力なコードおよびエージェント能力を持つMoEアーキテクチャ基盤モデルで、総パラメータ1兆、活性化パラメータ320億。汎用知識推論、プログラミング、数学、エージェントなど主要カテゴリのベンチマーク性能で他の主流オープンソースモデルを上回っています。"
|
||||
},
|
||||
"moonshotai/Kimi-K2-Instruct-0905": {
|
||||
"description": "Kimi K2-Instruct-0905 は Kimi K2 の最新かつ最強のバージョンです。これはトップクラスの混合専門家(MoE)言語モデルであり、総パラメータ数は1兆、活性化パラメータ数は320億を誇ります。このモデルの主な特徴は、強化されたエージェントのコーディング知能であり、公開ベンチマークテストおよび実世界のエージェントコーディングタスクで顕著な性能向上を示しています。また、フロントエンドのコーディング体験も改善され、フロントエンドプログラミングの美観と実用性の両面で進歩しています。"
|
||||
},
|
||||
@@ -2570,6 +2594,9 @@
|
||||
"qwen-image": {
|
||||
"description": "Qwen-Image は汎用の画像生成モデルで、さまざまなアートスタイルに対応します。とりわけ複雑なテキストのレンダリング、特に中国語と英語のテキストレンダリングに優れています。モデルは複数行レイアウトや段落レベルのテキスト生成、細かなディテール表現をサポートし、複雑な画像とテキストの混在したレイアウト設計を実現します。"
|
||||
},
|
||||
"qwen-image-edit": {
|
||||
"description": "Qwen Image Edit は、入力画像とテキストのプロンプトに基づいて画像の編集や修正を行うことができる画像生成モデルです。ユーザーのニーズに応じて元の画像を正確に調整し、創造的に改変することが可能です。"
|
||||
},
|
||||
"qwen-long": {
|
||||
"description": "通義千問超大規模言語モデルで、長文コンテキストや長文書、複数文書に基づく対話機能をサポートしています。"
|
||||
},
|
||||
@@ -2804,8 +2831,11 @@
|
||||
"qwen3-coder-plus": {
|
||||
"description": "通義千問コードモデル。最新のQwen3-CoderシリーズモデルはQwen3をベースにしたコード生成モデルで、強力なコーディングエージェント能力を持ち、ツール呼び出しや環境とのインタラクションに長けています。自主的なプログラミングが可能で、コード能力に優れると同時に汎用能力も兼ね備えています。"
|
||||
},
|
||||
"qwen3-max-preview": {
|
||||
"description": "通義千問3シリーズMaxモデルのプレビュー版で、2.5シリーズに比べて全体的な汎用能力が大幅に向上し、中日両言語の汎用テキスト理解能力、複雑な指示遵守能力、主観的なオープンタスク能力、多言語能力、ツール呼び出し能力が著しく強化されました。モデルの知識幻覚も減少しています。"
|
||||
"qwen3-coder:480b": {
|
||||
"description": "アリババによるエージェントおよびコーディングタスク向けの高性能長文コンテキストモデルです。"
|
||||
},
|
||||
"qwen3-max": {
|
||||
"description": "Tongyi Qianwen 3シリーズのMaxモデルは、2.5シリーズに比べて全体的な汎用能力が大幅に向上しており、中国語・英語のテキスト理解能力、複雑な指示遵守能力、主観的なオープンタスク能力、多言語能力、ツール呼び出し能力が著しく強化されています。モデルの知識幻覚も減少しています。最新のqwen3-maxモデルは、qwen3-max-previewバージョンに比べて、エージェントプログラミングとツール呼び出しの方向で特別なアップグレードが施されています。今回リリースされた正式版モデルは、ドメインのSOTAレベルに達しており、より複雑なエージェントニーズに対応可能です。"
|
||||
},
|
||||
"qwen3-next-80b-a3b-instruct": {
|
||||
"description": "Qwen3に基づく次世代の非思考モードのオープンソースモデルで、前バージョン(通義千問3-235B-A22B-Instruct-2507)と比べて中国語テキストの理解能力が向上し、論理推論能力が強化され、テキスト生成タスクのパフォーマンスがより優れています。"
|
||||
@@ -2813,6 +2843,9 @@
|
||||
"qwen3-next-80b-a3b-thinking": {
|
||||
"description": "Qwen3に基づく次世代の思考モードのオープンソースモデルで、前バージョン(通義千問3-235B-A22B-Thinking-2507)と比べて指示遵守能力が向上し、モデルの要約応答がより簡潔になっています。"
|
||||
},
|
||||
"qwen3-vl-plus": {
|
||||
"description": "Tongyi Qianwen VLは視覚(画像)理解能力を備えたテキスト生成モデルで、OCR(画像文字認識)だけでなく、商品写真から属性を抽出したり、問題図から解答を導くなどの要約や推論も可能です。"
|
||||
},
|
||||
"qwq": {
|
||||
"description": "QwQはAIの推論能力を向上させることに特化した実験的研究モデルです。"
|
||||
},
|
||||
|
||||
@@ -281,6 +281,7 @@
|
||||
"actionFiletip": "파일 업로드",
|
||||
"actionTooltip": "업로드",
|
||||
"disabled": "현재 모델은 시각 인식 및 파일 분석을 지원하지 않습니다. 모델을 변경한 후 사용하세요.",
|
||||
"fileNotSupported": "브라우저 모드에서는 파일 업로드를 지원하지 않으며, 이미지 업로드만 가능합니다",
|
||||
"visionNotSupported": "현재 모델은 시각 인식을 지원하지 않습니다. 모델을 변경한 후 사용해 주세요"
|
||||
},
|
||||
"preview": {
|
||||
@@ -289,6 +290,9 @@
|
||||
"pending": "업로드 준비 중...",
|
||||
"processing": "파일 처리 중..."
|
||||
}
|
||||
},
|
||||
"validation": {
|
||||
"videoSizeExceeded": "비디오 파일 크기는 20MB를 초과할 수 없습니다. 현재 파일 크기: {{actualSize}}"
|
||||
}
|
||||
},
|
||||
"zenMode": "집중 모드"
|
||||
|
||||
@@ -114,6 +114,7 @@
|
||||
"reasoning": "이 모델은 깊이 있는 사고를 지원합니다.",
|
||||
"search": "이 모델은 온라인 검색을 지원합니다.",
|
||||
"tokens": "이 모델은 단일 세션당 최대 {{tokens}} 토큰을 지원합니다",
|
||||
"video": "이 모델은 비디오 인식을 지원합니다",
|
||||
"vision": "이 모델은 시각 인식을 지원합니다"
|
||||
},
|
||||
"removed": "모델이 목록에서 제거되었습니다. 선택이 취소되면 자동으로 제거됩니다."
|
||||
|
||||
+53
-20
@@ -287,9 +287,6 @@
|
||||
"Pro/deepseek-ai/DeepSeek-V3.1": {
|
||||
"description": "DeepSeek-V3.1은 DeepSeek AI에서 발표한 하이브리드 모드 대형 언어 모델로, 이전 모델을 기반으로 다방면에서 중요한 업그레이드를 이루었습니다. 이 모델의 주요 혁신은 '사고 모드'(Thinking Mode)와 '비사고 모드'(Non-thinking Mode)를 통합하여 사용자가 채팅 템플릿을 조정해 다양한 작업 요구에 유연하게 대응할 수 있다는 점입니다. 전용 사후 학습 최적화를 통해 V3.1은 도구 호출과 에이전트 작업 성능이 크게 향상되어 외부 검색 도구 지원과 다단계 복잡 작업 수행에 뛰어납니다. 이 모델은 DeepSeek-V3.1-Base를 기반으로 사후 학습되었으며, 2단계 장문 확장 방식을 통해 학습 데이터 양을 대폭 늘려 긴 문서와 장문의 코드 처리에 우수한 성능을 보입니다. 오픈소스 모델로서 DeepSeek-V3.1은 코딩, 수학, 추론 등 여러 벤치마크에서 최상위 폐쇄형 모델과 견줄 만한 능력을 보여주며, 혼합 전문가(MoE) 아키텍처 덕분에 대규모 모델 용량을 유지하면서도 추론 비용을 효과적으로 낮췄습니다."
|
||||
},
|
||||
"Pro/moonshotai/Kimi-K2-Instruct": {
|
||||
"description": "Kimi K2는 초강력 코드 및 에이전트 능력을 갖춘 MoE 아키텍처 기반 모델로, 총 파라미터 1조, 활성화 파라미터 320억입니다. 범용 지식 추론, 프로그래밍, 수학, 에이전트 등 주요 분야 벤치마크에서 K2 모델은 다른 주류 오픈 소스 모델을 능가하는 성능을 보입니다."
|
||||
},
|
||||
"Pro/moonshotai/Kimi-K2-Instruct-0905": {
|
||||
"description": "Kimi K2-Instruct-0905는 Kimi K2의 최신이자 가장 강력한 버전입니다. 이 모델은 총 1조 개의 파라미터와 320억 개의 활성화 파라미터를 가진 최첨단 혼합 전문가(MoE) 언어 모델입니다. 주요 특징으로는 향상된 에이전트 코딩 지능으로, 공개 벤치마크 테스트와 실제 코딩 에이전트 작업에서 뛰어난 성능 향상을 보였으며, 프론트엔드 코딩 경험이 개선되어 프론트엔드 프로그래밍의 미적 측면과 실용성 모두에서 진전을 이루었습니다."
|
||||
},
|
||||
@@ -380,6 +377,12 @@
|
||||
"Qwen/Qwen3-Coder-480B-A35B-Instruct": {
|
||||
"description": "Qwen3-Coder-480B-A35B-Instruct는 알리바바가 발표한, 현재까지 에이전트(Agentic) 역량이 가장 뛰어난 코드 모델입니다. 이 모델은 총 4,800억 개의 파라미터와 350억 개의 활성 파라미터를 갖춘 혼합 전문가(MoE) 모델로서 효율성과 성능 사이의 균형을 이루고 있습니다. 기본적으로 256K(약 26만) 토큰의 컨텍스트 길이를 지원하며 YaRN 등의 외삽 기법을 통해 최대 100만 토큰까지 확장할 수 있어 대규모 코드베이스와 복잡한 프로그래밍 과제를 처리할 수 있습니다. Qwen3-Coder는 에이전트형 코딩 워크플로우를 위해 설계되어 코드 생성뿐만 아니라 개발 도구 및 환경과 스스로 상호작용하여 복잡한 문제를 해결할 수 있습니다. 여러 코딩 및 에이전트 과제의 벤치마크에서 이 모델은 오픈소스 모델 중 최상위권 성능을 보였으며, 그 성능은 Claude Sonnet 4 등 선도 모델과 견줄 만합니다."
|
||||
},
|
||||
"Qwen/Qwen3-Next-80B-A3B-Instruct": {
|
||||
"description": "Qwen3-Next-80B-A3B-Instruct는 알리바바 통의천문 팀이 발표한 차세대 기본 모델입니다. 이 모델은 새로운 Qwen3-Next 아키텍처를 기반으로 하여 극대화된 학습 및 추론 효율성을 목표로 합니다. 혁신적인 혼합 주의 메커니즘(Gated DeltaNet 및 Gated Attention), 고희소성 혼합 전문가(MoE) 구조와 여러 학습 안정성 최적화를 채택했습니다. 총 800억 개의 파라미터를 가진 희소 모델로, 추론 시 약 30억 개의 파라미터만 활성화하여 계산 비용을 크게 줄였으며, 32K 토큰 이상의 긴 문맥 작업 처리 시 Qwen3-32B 모델보다 추론 처리량이 10배 이상 높습니다. 이 모델은 지시 미세 조정 버전으로 범용 작업에 최적화되어 있으며, 사고 체인(Thinking) 모드를 지원하지 않습니다. 성능 면에서는 통의천문의 플래그십 모델 Qwen3-235B와 일부 벤치마크 테스트에서 동등한 성능을 보이며, 특히 초장문 문맥 작업에서 뚜렷한 우위를 나타냅니다."
|
||||
},
|
||||
"Qwen/Qwen3-Next-80B-A3B-Thinking": {
|
||||
"description": "Qwen3-Next-80B-A3B-Thinking은 알리바바 통의천문 팀이 발표한 복잡한 추론 작업에 특화된 차세대 기본 모델입니다. 혁신적인 Qwen3-Next 아키텍처를 기반으로 하며, 혼합 주의 메커니즘(Gated DeltaNet 및 Gated Attention)과 고희소성 혼합 전문가(MoE) 구조를 융합하여 극대화된 학습 및 추론 효율성을 실현합니다. 총 800억 개의 파라미터를 가진 희소 모델로, 추론 시 약 30억 개의 파라미터만 활성화하여 계산 비용을 크게 줄였으며, 32K 토큰 이상의 긴 문맥 작업 처리 시 Qwen3-32B 모델보다 처리량이 10배 이상 높습니다. 이 'Thinking' 버전은 수학 증명, 코드 합성, 논리 분석 및 계획 등 고난도 다단계 작업 수행에 최적화되어 있으며, 기본적으로 구조화된 '사고 체인' 형태로 추론 과정을 출력합니다. 성능 면에서는 Qwen3-32B-Thinking 등 비용이 더 높은 모델을 능가하며, 여러 벤치마크 테스트에서 Gemini-2.5-Flash-Thinking보다 우수한 성능을 보입니다."
|
||||
},
|
||||
"Qwen2-72B-Instruct": {
|
||||
"description": "Qwen2는 Qwen 모델의 최신 시리즈로, 128k 컨텍스트를 지원합니다. 현재 최상의 오픈 소스 모델과 비교할 때, Qwen2-72B는 자연어 이해, 지식, 코드, 수학 및 다국어 등 여러 능력에서 현재 선도하는 모델을 현저히 초월합니다."
|
||||
},
|
||||
@@ -809,9 +812,6 @@
|
||||
"codex-mini-latest": {
|
||||
"description": "codex-mini-latest는 o4-mini의 미세 조정 버전으로, Codex CLI 전용입니다. API를 통해 직접 사용하려면 gpt-4.1부터 시작하는 것을 권장합니다."
|
||||
},
|
||||
"cognitivecomputations/dolphin-mixtral-8x22b": {
|
||||
"description": "Dolphin Mixtral 8x22B는 지시 준수, 대화 및 프로그래밍을 위해 설계된 모델입니다."
|
||||
},
|
||||
"cogview-4": {
|
||||
"description": "CogView-4는 지푸가 처음으로 한자 생성을 지원하는 오픈 소스 텍스트-이미지 생성 모델로, 의미 이해, 이미지 생성 품질, 중영 문자 생성 능력 등 여러 측면에서 전면적으로 향상되었으며, 임의 길이의 중영 이중 언어 입력을 지원하고 주어진 범위 내에서 임의 해상도의 이미지를 생성할 수 있습니다."
|
||||
},
|
||||
@@ -926,6 +926,9 @@
|
||||
"deepseek-ai/deepseek-r1": {
|
||||
"description": "추론, 수학 및 프로그래밍에 능숙한 최첨단 효율 LLM입니다."
|
||||
},
|
||||
"deepseek-ai/deepseek-v3.1": {
|
||||
"description": "DeepSeek V3.1: 차세대 추론 모델로, 복잡한 추론 및 연쇄 사고 능력을 향상시켜 심층 분석이 필요한 작업에 적합합니다."
|
||||
},
|
||||
"deepseek-ai/deepseek-vl2": {
|
||||
"description": "DeepSeek-VL2는 DeepSeekMoE-27B를 기반으로 개발된 혼합 전문가(MoE) 비주얼 언어 모델로, 희소 활성화 MoE 아키텍처를 사용하여 4.5B 매개변수만 활성화된 상태에서 뛰어난 성능을 발휘합니다. 이 모델은 비주얼 질문 응답, 광학 문자 인식, 문서/표/차트 이해 및 비주얼 위치 지정 등 여러 작업에서 우수한 성과를 보입니다."
|
||||
},
|
||||
@@ -1007,6 +1010,9 @@
|
||||
"deepseek-v3.1": {
|
||||
"description": "DeepSeek-V3.1은 DeepSeek에서 새롭게 출시한 하이브리드 추론 모델로, 사고 모드와 비사고 모드 두 가지 추론 방식을 지원하며 DeepSeek-R1-0528보다 사고 효율이 더 뛰어납니다. 사후 학습 최적화를 거쳐 에이전트 도구 사용과 지능형 작업 성능이 크게 향상되었습니다. 128k 컨텍스트 윈도우를 지원하며, 출력 길이는 최대 64k 토큰까지 가능합니다."
|
||||
},
|
||||
"deepseek-v3.1:671b": {
|
||||
"description": "DeepSeek V3.1: 차세대 추론 모델로, 복잡한 추론 및 연쇄 사고 능력을 향상시켜 심층 분석이 필요한 작업에 적합합니다."
|
||||
},
|
||||
"deepseek/deepseek-chat-v3-0324": {
|
||||
"description": "DeepSeek V3는 685B 매개변수를 가진 전문가 혼합 모델로, DeepSeek 팀의 플래그십 채팅 모델 시리즈의 최신 반복입니다.\n\n이 모델은 [DeepSeek V3](/deepseek/deepseek-chat-v3) 모델을 계승하며 다양한 작업에서 뛰어난 성능을 보입니다."
|
||||
},
|
||||
@@ -1626,7 +1632,7 @@
|
||||
"description": "ChatGPT-4o는 동적 모델로, 최신 버전을 유지하기 위해 실시간으로 업데이트됩니다. 강력한 언어 이해 및 생성 능력을 결합하여 고객 서비스, 교육 및 기술 지원을 포함한 대규모 애플리케이션에 적합합니다."
|
||||
},
|
||||
"gpt-4o-audio-preview": {
|
||||
"description": "GPT-4o 오디오 모델로, 오디오 입력 및 출력을 지원합니다."
|
||||
"description": "GPT-4o Audio Preview 모델로, 오디오 입력 및 출력을 지원합니다."
|
||||
},
|
||||
"gpt-4o-mini": {
|
||||
"description": "GPT-4o mini는 OpenAI가 GPT-4 Omni 이후에 출시한 최신 모델로, 텍스트와 이미지를 입력받아 텍스트를 출력합니다. 이 모델은 최신의 소형 모델로, 최근의 다른 최첨단 모델보다 훨씬 저렴하며, GPT-3.5 Turbo보다 60% 이상 저렴합니다. 최첨단의 지능을 유지하면서도 뛰어난 가성비를 자랑합니다. GPT-4o mini는 MMLU 테스트에서 82%의 점수를 기록했으며, 현재 채팅 선호도에서 GPT-4보다 높은 순위를 차지하고 있습니다."
|
||||
@@ -1667,24 +1673,33 @@
|
||||
"gpt-5-chat-latest": {
|
||||
"description": "ChatGPT에 사용되는 GPT-5 모델로, 강력한 언어 이해 및 생성 능력을 결합하여 대화형 상호작용에 적합합니다."
|
||||
},
|
||||
"gpt-5-codex": {
|
||||
"description": "GPT-5 Codex는 Codex 또는 유사 환경에서의 에이전트 코딩 작업에 최적화된 GPT-5 버전입니다."
|
||||
},
|
||||
"gpt-5-mini": {
|
||||
"description": "더 빠르고 경제적인 GPT-5 버전으로, 명확하게 정의된 작업에 적합합니다. 높은 품질의 출력을 유지하면서 더 빠른 응답 속도를 제공합니다."
|
||||
},
|
||||
"gpt-5-nano": {
|
||||
"description": "가장 빠르고 경제적인 GPT-5 버전으로, 빠른 응답과 비용 효율성이 중요한 애플리케이션에 매우 적합합니다."
|
||||
},
|
||||
"gpt-audio": {
|
||||
"description": "GPT Audio는 오디오 입출력을 위한 범용 대화 모델로, Chat Completions API에서 오디오 I/O 사용을 지원합니다."
|
||||
},
|
||||
"gpt-image-1": {
|
||||
"description": "ChatGPT 네이티브 멀티모달 이미지 생성 모델"
|
||||
},
|
||||
"gpt-oss": {
|
||||
"description": "GPT-OSS 20B는 OpenAI에서 발표한 오픈 소스 대형 언어 모델로, MXFP4 양자화 기술을 사용하여 고급 소비자용 GPU 또는 Apple Silicon Mac에서 실행하기에 적합합니다. 이 모델은 대화 생성, 코드 작성 및 추론 작업에서 뛰어난 성능을 보이며, 함수 호출과 도구 사용을 지원합니다."
|
||||
},
|
||||
"gpt-oss-120b": {
|
||||
"description": "GPT-OSS-120B MXFP4 양자화된 Transformer 구조로, 자원이 제한된 환경에서도 강력한 성능을 유지합니다."
|
||||
},
|
||||
"gpt-oss:120b": {
|
||||
"description": "GPT-OSS 120B는 OpenAI에서 발표한 대형 오픈 소스 언어 모델로, MXFP4 양자화 기술을 적용한 플래그십 모델입니다. 다중 GPU 또는 고성능 워크스테이션 환경에서 실행해야 하며, 복잡한 추론, 코드 생성 및 다국어 처리에서 탁월한 성능을 발휘하고 고급 함수 호출과 도구 통합을 지원합니다."
|
||||
},
|
||||
"gpt-oss:20b": {
|
||||
"description": "GPT-OSS 20B는 OpenAI가 발표한 오픈소스 대형 언어 모델로, MXFP4 양자화 기술을 사용하여 고급 소비자용 GPU 또는 Apple Silicon Mac에서 실행하기 적합합니다. 이 모델은 대화 생성, 코드 작성 및 추론 작업에서 뛰어난 성능을 보이며, 함수 호출과 도구 사용을 지원합니다."
|
||||
},
|
||||
"gpt-realtime": {
|
||||
"description": "범용 실시간 모델로, 텍스트 및 오디오의 실시간 입출력을 지원하며 이미지 입력도 지원합니다."
|
||||
},
|
||||
"grok-2-1212": {
|
||||
"description": "이 모델은 정확성, 지시 준수 및 다국어 능력에서 개선되었습니다."
|
||||
},
|
||||
@@ -1712,6 +1727,12 @@
|
||||
"grok-4-0709": {
|
||||
"description": "xAI의 Grok 4로, 강력한 추론 능력을 갖추고 있습니다."
|
||||
},
|
||||
"grok-4-fast-non-reasoning": {
|
||||
"description": "비용 효율적인 추론 모델 분야에서의 최신 진전인 Grok 4 Fast를 발표하게 되어 기쁩니다."
|
||||
},
|
||||
"grok-4-fast-reasoning": {
|
||||
"description": "비용 효율적인 추론 모델 분야에서의 최신 진전인 Grok 4 Fast를 발표하게 되어 기쁩니다."
|
||||
},
|
||||
"grok-code-fast-1": {
|
||||
"description": "우리는 에이전트 코딩에 탁월한 빠르고 경제적인 추론 모델인 grok-code-fast-1을 출시하게 되어 기쁩니다."
|
||||
},
|
||||
@@ -1847,8 +1868,14 @@
|
||||
"inception/mercury-coder-small": {
|
||||
"description": "Mercury Coder Small은 코드 생성, 디버깅 및 리팩토링 작업에 이상적이며, 최소 지연 시간을 자랑합니다."
|
||||
},
|
||||
"inclusionAI/Ling-flash-2.0": {
|
||||
"description": "Ling-flash-2.0은 앤트 그룹 백령 팀이 발표한 Ling 2.0 아키텍처 시리즈의 세 번째 모델입니다. 혼합 전문가(MoE) 모델로 총 파라미터 수는 1000억에 달하지만, 각 토큰당 61억 파라미터만 활성화(비임베딩 48억)됩니다. 경량 구성 모델로서 여러 권위 있는 평가에서 400억 규모의 밀집(Dense) 모델 및 더 큰 규모의 MoE 모델과 견줄 만한 성능을 보여줍니다. 이 모델은 '대형 모델 = 대형 파라미터'라는 공감대 하에 극대화된 아키텍처 설계와 학습 전략을 통해 고효율 경로를 탐색하는 것을 목표로 합니다."
|
||||
},
|
||||
"inclusionAI/Ling-mini-2.0": {
|
||||
"description": "Ling-mini-2.0은 MoE 아키텍처 기반의 소형 고성능 대형 언어 모델입니다. 총 160억 개의 파라미터를 보유하고 있지만, 각 토큰당 활성화되는 파라미터는 14억(비임베딩 7억 8,900만)으로 매우 높은 생성 속도를 자랑합니다. 효율적인 MoE 설계와 대규모 고품질 학습 데이터 덕분에, 활성화 파라미터가 14억에 불과함에도 불구하고 Ling-mini-2.0은 하위 작업에서 100억 이하의 dense LLM 및 더 큰 규모의 MoE 모델과 견줄 만한 최상위 성능을 보여줍니다."
|
||||
"description": "Ling-mini-2.0은 MoE 아키텍처 기반의 소형 고성능 대형 언어 모델입니다. 총 160억 파라미터를 보유하지만 각 토큰당 14억(비임베딩 7억 8천 9백만) 파라미터만 활성화하여 매우 빠른 생성 속도를 실현합니다. 효율적인 MoE 설계와 대규모 고품질 학습 데이터 덕분에, 활성화 파라미터가 14억에 불과함에도 불구하고 Ling-mini-2.0은 하위 작업에서 100억 이하의 밀집 LLM 및 더 큰 규모의 MoE 모델과 견줄 수 있는 최상위 성능을 보여줍니다."
|
||||
},
|
||||
"inclusionAI/Ring-flash-2.0": {
|
||||
"description": "Ring-flash-2.0은 Ling-flash-2.0-base를 기반으로 깊이 최적화된 고성능 사고 모델입니다. 혼합 전문가(MoE) 아키텍처를 채택하여 총 1000억 파라미터를 보유하지만, 추론 시에는 61억 파라미터만 활성화합니다. 독창적인 icepop 알고리즘을 통해 MoE 대형 모델의 강화 학습(RL) 훈련 중 불안정성 문제를 해결하여 복잡한 추론 능력을 장기 훈련 동안 지속적으로 향상시켰습니다. 수학 경시대회, 코드 생성, 논리 추론 등 여러 고난도 벤치마크에서 뛰어난 성과를 거두었으며, 400억 파라미터 이하의 최상위 밀집 모델을 능가하고 더 큰 규모의 오픈소스 MoE 모델 및 폐쇄형 고성능 사고 모델과 견줄 만한 성능을 자랑합니다. 복잡한 추론에 집중하면서도 창의적 글쓰기 작업에서도 우수한 성능을 보입니다. 또한 효율적인 아키텍처 설계 덕분에 강력한 성능과 함께 고속 추론을 실현하여 고부하 환경에서 사고 모델의 배포 비용을 크게 절감합니다."
|
||||
},
|
||||
"internlm/internlm2_5-7b-chat": {
|
||||
"description": "InternLM2.5는 다양한 시나리오에서 스마트 대화 솔루션을 제공합니다."
|
||||
@@ -1974,7 +2001,10 @@
|
||||
"description": "LLaVA는 시각 인코더와 Vicuna를 결합한 다중 모달 모델로, 강력한 시각 및 언어 이해를 제공합니다."
|
||||
},
|
||||
"magistral-medium-latest": {
|
||||
"description": "Magistral Medium 1.1은 Mistral AI가 2025년 7월에 공개한 최첨단 추론 모델입니다."
|
||||
"description": "Magistral Medium 1.2는 Mistral AI가 2025년 9월에 발표한 최첨단 추론 모델로, 시각 지원 기능을 갖추고 있습니다."
|
||||
},
|
||||
"magistral-small-2509": {
|
||||
"description": "Magistral Small 1.2는 Mistral AI가 2025년 9월에 발표한 오픈 소스 소형 추론 모델로, 시각 지원 기능을 갖추고 있습니다."
|
||||
},
|
||||
"mathstral": {
|
||||
"description": "MathΣtral은 과학 연구 및 수학 추론을 위해 설계되었으며, 효과적인 계산 능력과 결과 해석을 제공합니다."
|
||||
@@ -2282,9 +2312,6 @@
|
||||
"mistral/mistral-large": {
|
||||
"description": "Mistral Large는 대규모 추론 능력이나 고도로 전문화된 작업에 이상적이며, 합성 텍스트 생성, 코드 생성, RAG 또는 에이전트 작업에 적합합니다."
|
||||
},
|
||||
"mistral/mistral-saba-24b": {
|
||||
"description": "Mistral Saba 24B는 Mistral.ai가 개발한 240억 매개변수 오픈소스 모델입니다. Saba는 아랍어, 페르시아어, 우르두어, 히브리어 및 인도 언어에서 뛰어난 성능을 발휘하도록 특별히 훈련된 전문 모델입니다. Groq의 맞춤형 언어 처리 유닛(LPU) 하드웨어를 사용하여 빠르고 효율적인 추론을 제공합니다."
|
||||
},
|
||||
"mistral/mistral-small": {
|
||||
"description": "Mistral Small은 분류, 고객 지원 또는 텍스트 생성과 같이 대량 처리 가능한 간단한 작업에 이상적입니다. 합리적인 가격대에 뛰어난 성능을 제공합니다."
|
||||
},
|
||||
@@ -2357,9 +2384,6 @@
|
||||
"moonshotai/Kimi-Dev-72B": {
|
||||
"description": "Kimi-Dev-72B는 대규모 강화 학습 최적화를 거친 오픈소스 코드 대형 모델로, 안정적이고 바로 생산에 투입 가능한 패치를 출력할 수 있습니다. 이 모델은 SWE-bench Verified에서 60.4%의 신기록을 세우며, 결함 수정, 코드 리뷰 등 자동화 소프트웨어 엔지니어링 작업에서 오픈소스 모델의 기록을 경신했습니다."
|
||||
},
|
||||
"moonshotai/Kimi-K2-Instruct": {
|
||||
"description": "Kimi K2는 초강력 코드 및 에이전트 능력을 갖춘 MoE 아키텍처 기반 모델로, 총 파라미터 1조, 활성화 파라미터 320억입니다. 범용 지식 추론, 프로그래밍, 수학, 에이전트 등 주요 분야 벤치마크에서 K2 모델은 다른 주류 오픈 소스 모델을 능가하는 성능을 보입니다."
|
||||
},
|
||||
"moonshotai/Kimi-K2-Instruct-0905": {
|
||||
"description": "Kimi K2-Instruct-0905는 Kimi K2의 최신이자 가장 강력한 버전입니다. 이 모델은 총 1조 개의 파라미터와 320억 개의 활성화 파라미터를 가진 최첨단 혼합 전문가(MoE) 언어 모델입니다. 주요 특징으로는 향상된 에이전트 코딩 지능으로, 공개 벤치마크 테스트와 실제 코딩 에이전트 작업에서 뛰어난 성능 향상을 보였으며, 프론트엔드 코딩 경험이 개선되어 프론트엔드 프로그래밍의 미적 측면과 실용성 모두에서 진전을 이루었습니다."
|
||||
},
|
||||
@@ -2570,6 +2594,9 @@
|
||||
"qwen-image": {
|
||||
"description": "Qwen-Image는 범용 이미지 생성 모델로, 다양한 예술적 스타일을 지원하며 특히 복잡한 텍스트 렌더링, 그중에서도 중국어와 영어 텍스트 렌더링에 뛰어납니다. 모델은 다중 행 레이아웃, 문단 단위 텍스트 생성 및 세밀한 디테일 묘사를 지원하여 복잡한 이미지-텍스트 혼합 레이아웃 디자인을 구현할 수 있습니다."
|
||||
},
|
||||
"qwen-image-edit": {
|
||||
"description": "Qwen Image Edit는 입력 이미지와 텍스트 프롬프트를 기반으로 이미지 편집 및 수정을 지원하는 이미지 생성 모델로, 사용자의 요구에 따라 원본 이미지를 정밀하게 조정하고 창의적으로 변형할 수 있습니다."
|
||||
},
|
||||
"qwen-long": {
|
||||
"description": "통의천문 초대규모 언어 모델로, 긴 텍스트 컨텍스트를 지원하며, 긴 문서 및 다수의 문서에 기반한 대화 기능을 제공합니다."
|
||||
},
|
||||
@@ -2804,8 +2831,11 @@
|
||||
"qwen3-coder-plus": {
|
||||
"description": "통의천문 코드 모델입니다. 최신 Qwen3-Coder 시리즈 모델은 Qwen3 기반의 코드 생성 모델로, 강력한 코딩 에이전트 능력을 보유하고 있으며 도구 호출과 환경 상호작용에 능숙하여 자율 프로그래밍이 가능하며, 뛰어난 코드 능력과 함께 범용 능력도 겸비하고 있습니다."
|
||||
},
|
||||
"qwen3-max-preview": {
|
||||
"description": "통의천문3 시리즈 Max 모델 프리뷰 버전으로, 2.5 시리즈에 비해 전반적인 범용 능력이 크게 향상되었으며, 중영문 범용 텍스트 이해 능력, 복잡한 지시 준수 능력, 주관적 개방형 작업 능력, 다국어 능력, 도구 호출 능력이 모두 크게 강화되었습니다. 모델의 지식 환각도 감소하였습니다."
|
||||
"qwen3-coder:480b": {
|
||||
"description": "알리바바가 에이전트 및 코딩 작업을 위해 개발한 고성능 장문맥 모델입니다."
|
||||
},
|
||||
"qwen3-max": {
|
||||
"description": "통의천문3 시리즈 Max 모델로, 2.5 시리즈에 비해 전반적인 범용 능력이 크게 향상되었습니다. 중영문 범용 텍스트 이해 능력, 복잡한 지시 준수 능력, 주관적 개방형 작업 능력, 다국어 능력, 도구 호출 능력이 모두 크게 강화되었으며, 모델의 지식 환각 현상이 줄어들었습니다. 최신 qwen3-max 모델은 qwen3-max-preview 버전에 비해 에이전트 프로그래밍 및 도구 호출 방향에서 특별 업그레이드를 거쳤습니다. 이번 정식 버전 모델은 분야별 SOTA 수준에 도달했으며, 더욱 복잡한 에이전트 요구에 적합한 환경에 맞춰졌습니다."
|
||||
},
|
||||
"qwen3-next-80b-a3b-instruct": {
|
||||
"description": "Qwen3 기반의 차세대 비사고 모드 오픈 소스 모델로, 이전 버전(통의천문3-235B-A22B-Instruct-2507)과 비교하여 중국어 텍스트 이해 능력이 향상되었고, 논리 추론 능력이 강화되었으며, 텍스트 생성 작업에서 더 우수한 성능을 보입니다."
|
||||
@@ -2813,6 +2843,9 @@
|
||||
"qwen3-next-80b-a3b-thinking": {
|
||||
"description": "Qwen3 기반의 차세대 사고 모드 오픈 소스 모델로, 이전 버전(통의천문3-235B-A22B-Thinking-2507)과 비교하여 명령 준수 능력이 향상되었고, 모델의 요약 응답이 더욱 간결해졌습니다."
|
||||
},
|
||||
"qwen3-vl-plus": {
|
||||
"description": "통의천문 VL은 시각(이미지) 이해 능력을 갖춘 텍스트 생성 모델로, OCR(이미지 내 문자 인식)뿐만 아니라 상품 사진에서 속성 추출, 문제 그림을 통한 문제 해결 등 요약 및 추론 작업도 수행할 수 있습니다."
|
||||
},
|
||||
"qwq": {
|
||||
"description": "QwQ는 AI 추론 능력을 향상시키는 데 중점을 둔 실험 연구 모델입니다."
|
||||
},
|
||||
|
||||
@@ -281,6 +281,7 @@
|
||||
"actionFiletip": "Bestand uploaden",
|
||||
"actionTooltip": "Uploaden",
|
||||
"disabled": "Dit model ondersteunt momenteel geen visuele herkenning en bestandanalyse, schakel alstublieft naar een ander model.",
|
||||
"fileNotSupported": "Bestand uploaden wordt momenteel niet ondersteund in de browsermodus, alleen afbeeldingen zijn toegestaan",
|
||||
"visionNotSupported": "Het huidige model ondersteunt geen visuele herkenning, schakel over naar een ander model om deze functie te gebruiken"
|
||||
},
|
||||
"preview": {
|
||||
@@ -289,6 +290,9 @@
|
||||
"pending": "Voorbereiden om te uploaden...",
|
||||
"processing": "Bestand wordt verwerkt..."
|
||||
}
|
||||
},
|
||||
"validation": {
|
||||
"videoSizeExceeded": "De grootte van het videobestand mag niet groter zijn dan 20MB, de huidige bestandsgrootte is {{actualSize}}"
|
||||
}
|
||||
},
|
||||
"zenMode": "Focusmodus"
|
||||
|
||||
@@ -114,6 +114,7 @@
|
||||
"reasoning": "Dit model ondersteunt diepgaand denken",
|
||||
"search": "Dit model ondersteunt online zoeken",
|
||||
"tokens": "This model supports up to {{tokens}} tokens in a single session.",
|
||||
"video": "Dit model ondersteunt videoherkenning",
|
||||
"vision": "This model supports visual recognition."
|
||||
},
|
||||
"removed": "Dit model staat niet meer in de lijst. Als je het deselecteert, wordt het automatisch verwijderd."
|
||||
|
||||
+53
-20
@@ -287,9 +287,6 @@
|
||||
"Pro/deepseek-ai/DeepSeek-V3.1": {
|
||||
"description": "DeepSeek-V3.1 is een hybride groot taalmodel uitgebracht door DeepSeek AI, met belangrijke upgrades ten opzichte van eerdere modellen. Een belangrijke innovatie is de integratie van een 'denkenmodus' en een 'niet-denkenmodus', die gebruikers flexibel kunnen wisselen via aanpasbare chattemplates om aan verschillende taakvereisten te voldoen. Dankzij speciale post-training optimalisaties is de prestatie bij toolaanroepen en agenttaken aanzienlijk verbeterd, waardoor het beter externe zoektools ondersteunt en complexe meerstaps taken kan uitvoeren. Het model is gebaseerd op DeepSeek-V3.1-Base en uitgebreid met een tweefasige lange-tekst uitbreidingsmethode, wat de hoeveelheid trainingsdata sterk vergroot en betere prestaties levert bij het verwerken van lange documenten en uitgebreide code. Als open source model toont DeepSeek-V3.1 vergelijkbare capaciteiten als toonaangevende gesloten modellen in benchmarks voor codering, wiskunde en redeneren. Dankzij de hybride expertarchitectuur (MoE) behoudt het een enorme modelcapaciteit terwijl de redeneerkosten effectief worden verlaagd."
|
||||
},
|
||||
"Pro/moonshotai/Kimi-K2-Instruct": {
|
||||
"description": "Kimi K2 is een MoE-architectuurbasis model met krachtige codeer- en agentcapaciteiten, met in totaal 1 biljoen parameters en 32 miljard geactiveerde parameters. In benchmarktests voor algemene kennisredenering, programmeren, wiskunde en agenttaken overtreft het K2-model andere toonaangevende open-source modellen."
|
||||
},
|
||||
"Pro/moonshotai/Kimi-K2-Instruct-0905": {
|
||||
"description": "Kimi K2-Instruct-0905 is de nieuwste en krachtigste versie van Kimi K2. Het is een toonaangevend hybride expert (MoE) taalmodel met in totaal 1 biljoen parameters en 32 miljard geactiveerde parameters. De belangrijkste kenmerken van dit model zijn: verbeterde agent-coderingsintelligentie, met aanzienlijke prestatieverbeteringen in openbare benchmarktests en echte agent-coderingsopdrachten; verbeterde front-end coderingservaring, met vooruitgang in zowel esthetiek als bruikbaarheid van front-end programmeren."
|
||||
},
|
||||
@@ -380,6 +377,12 @@
|
||||
"Qwen/Qwen3-Coder-480B-A35B-Instruct": {
|
||||
"description": "Qwen3-Coder-480B-A35B-Instruct is uitgebracht door Alibaba en beschikt tot nu toe over de meest geavanceerde agentische mogelijkheden van alle codemodellen. Het is een Mixture-of-Experts (MoE)-model met 480 miljard totale parameters en 35 miljard actieve parameters, dat een balans vindt tussen efficiëntie en prestaties. Het model ondersteunt van nature een contextlengte van 256K (ongeveer 260.000) tokens en kan via extrapolatiemethoden zoals YaRN worden opgeschaald tot 1 miljoen tokens, waardoor het omvangrijke codebases en complexe programmeertaken aankan. Qwen3-Coder is ontworpen voor agentachtige codeerworkflows: het kan niet alleen code genereren, maar ook autonoom interacteren met ontwikkeltools en -omgevingen om complexe programmeerproblemen op te lossen. In diverse benchmarks voor codering en agenttaken behaalt dit model topresultaten onder open-source modellen en zijn de prestaties vergelijkbaar met toonaangevende modellen zoals Claude Sonnet 4."
|
||||
},
|
||||
"Qwen/Qwen3-Next-80B-A3B-Instruct": {
|
||||
"description": "Qwen3-Next-80B-A3B-Instruct is een volgende generatie basis model uitgebracht door het Tongyi Qianwen-team van Alibaba. Het is gebaseerd op de geheel nieuwe Qwen3-Next architectuur en is ontworpen voor ultieme trainings- en inferentie-efficiëntie. Dit model maakt gebruik van een innovatieve hybride aandachtmechanisme (Gated DeltaNet en Gated Attention), een hoog-sparsity Mixture of Experts (MoE) structuur en diverse optimalisaties voor trainingsstabiliteit. Als een sparsity model met in totaal 80 miljard parameters, activeert het tijdens inferentie slechts ongeveer 3 miljard parameters, wat de rekenkosten aanzienlijk verlaagt. Bij het verwerken van lange contexttaken van meer dan 32K tokens is de inferentiedoorvoer meer dan 10 keer hoger dan die van het Qwen3-32B model. Dit model is een instructie-fijngestemde versie, speciaal ontworpen voor algemene taken en ondersteunt geen Thinking-modus."
|
||||
},
|
||||
"Qwen/Qwen3-Next-80B-A3B-Thinking": {
|
||||
"description": "Qwen3-Next-80B-A3B-Thinking is een volgende generatie basis model uitgebracht door het Tongyi Qianwen-team van Alibaba, speciaal ontworpen voor complexe redeneertaken. Het is gebaseerd op de innovatieve Qwen3-Next architectuur, die een hybride aandachtmechanisme (Gated DeltaNet en Gated Attention) en een hoog-sparsity Mixture of Experts (MoE) structuur combineert, met als doel ultieme trainings- en inferentie-efficiëntie te bereiken. Als een sparsity model met in totaal 80 miljard parameters, activeert het tijdens inferentie slechts ongeveer 3 miljard parameters, wat de rekenkosten aanzienlijk verlaagt. Bij het verwerken van lange contexttaken van meer dan 32K tokens is de doorvoer meer dan 10 keer hoger dan die van het Qwen3-32B model. Deze \"Thinking\" versie is geoptimaliseerd voor het uitvoeren van wiskundige bewijzen, code synthese, logische analyse en planning, en geeft standaard de redeneerprocessen gestructureerd weer in de vorm van een \"denk-keten\". Qua prestaties overtreft het niet alleen modellen met hogere kosten zoals Qwen3-32B-Thinking, maar presteert het ook beter dan Gemini-2.5-Flash-Thinking in meerdere benchmarktests."
|
||||
},
|
||||
"Qwen2-72B-Instruct": {
|
||||
"description": "Qwen2 is de nieuwste serie van het Qwen-model, dat 128k context ondersteunt. In vergelijking met de huidige beste open-source modellen, overtreft Qwen2-72B op het gebied van natuurlijke taalbegrip, kennis, code, wiskunde en meertaligheid aanzienlijk de huidige toonaangevende modellen."
|
||||
},
|
||||
@@ -809,9 +812,6 @@
|
||||
"codex-mini-latest": {
|
||||
"description": "codex-mini-latest is een fijn afgestemde versie van o4-mini, speciaal ontworpen voor Codex CLI. Voor direct gebruik via de API raden we aan te beginnen met gpt-4.1."
|
||||
},
|
||||
"cognitivecomputations/dolphin-mixtral-8x22b": {
|
||||
"description": "Dolphin Mixtral 8x22B is een model ontworpen voor instructievolging, gesprekken en programmeren."
|
||||
},
|
||||
"cogview-4": {
|
||||
"description": "CogView-4 is het eerste open-source tekst-naar-beeldmodel van Zhipu dat Chinese karakters ondersteunt. Het biedt een algehele verbetering in semantisch begrip, beeldgeneratiekwaliteit en de mogelijkheid om zowel Chinese als Engelse teksten te genereren. Het ondersteunt tweetalige invoer van willekeurige lengte in het Chinees en Engels en kan afbeeldingen genereren met elke resolutie binnen het opgegeven bereik."
|
||||
},
|
||||
@@ -926,6 +926,9 @@
|
||||
"deepseek-ai/deepseek-r1": {
|
||||
"description": "Geavanceerd efficiënt LLM, gespecialiseerd in redeneren, wiskunde en programmeren."
|
||||
},
|
||||
"deepseek-ai/deepseek-v3.1": {
|
||||
"description": "DeepSeek V3.1: een volgende generatie redeneermodel dat verbeterde complexe redeneer- en ketendenkvaardigheden biedt, geschikt voor taken die diepgaande analyse vereisen."
|
||||
},
|
||||
"deepseek-ai/deepseek-vl2": {
|
||||
"description": "DeepSeek-VL2 is een hybride expert (MoE) visueel taalmodel dat is ontwikkeld op basis van DeepSeekMoE-27B, met een MoE-architectuur met spaarzame activatie, die uitstekende prestaties levert met slechts 4,5 miljard geactiveerde parameters. Dit model presteert uitstekend in verschillende taken, waaronder visuele vraag-antwoord, optische tekenherkenning, document/tabel/grafiekbegrip en visuele positionering."
|
||||
},
|
||||
@@ -1007,6 +1010,9 @@
|
||||
"deepseek-v3.1": {
|
||||
"description": "DeepSeek-V3.1 is het nieuwe hybride redeneermodel van DeepSeek, dat twee redeneermodi ondersteunt: denken en niet-denken. Het is efficiënter in denken dan DeepSeek-R1-0528. Dankzij post-training optimalisatie is het gebruik van agenttools en de prestaties bij agenttaken aanzienlijk verbeterd. Ondersteunt een contextvenster van 128k en een maximale outputlengte van 64k tokens."
|
||||
},
|
||||
"deepseek-v3.1:671b": {
|
||||
"description": "DeepSeek V3.1: een volgende generatie redeneermodel dat verbeterde complexe redeneer- en ketendenkvaardigheden biedt, geschikt voor taken die diepgaande analyse vereisen."
|
||||
},
|
||||
"deepseek/deepseek-chat-v3-0324": {
|
||||
"description": "DeepSeek V3 is een expert gemengd model met 685B parameters, de nieuwste iteratie van de vlaggenschip chatmodelreeks van het DeepSeek-team.\n\nHet is een opvolger van het [DeepSeek V3](/deepseek/deepseek-chat-v3) model en presteert uitstekend in verschillende taken."
|
||||
},
|
||||
@@ -1626,7 +1632,7 @@
|
||||
"description": "ChatGPT-4o is een dynamisch model dat in real-time wordt bijgewerkt om de meest actuele versie te behouden. Het combineert krachtige taalbegrip en generatiemogelijkheden, geschikt voor grootschalige toepassingen zoals klantenservice, onderwijs en technische ondersteuning."
|
||||
},
|
||||
"gpt-4o-audio-preview": {
|
||||
"description": "GPT-4o Audio model, ondersteunt audio-invoer en -uitvoer."
|
||||
"description": "GPT-4o Audio Preview model, ondersteunt audio-invoer en -uitvoer."
|
||||
},
|
||||
"gpt-4o-mini": {
|
||||
"description": "GPT-4o mini is het nieuwste model van OpenAI, gelanceerd na GPT-4 Omni, en ondersteunt zowel tekst- als beeldinvoer met tekstuitvoer. Als hun meest geavanceerde kleine model is het veel goedkoper dan andere recente toonaangevende modellen en meer dan 60% goedkoper dan GPT-3.5 Turbo. Het behoudt de meest geavanceerde intelligentie met een aanzienlijke prijs-kwaliteitverhouding. GPT-4o mini behaalde 82% op de MMLU-test en staat momenteel hoger in chatvoorkeuren dan GPT-4."
|
||||
@@ -1667,24 +1673,33 @@
|
||||
"gpt-5-chat-latest": {
|
||||
"description": "Het GPT-5-model gebruikt in ChatGPT. Combineert krachtige taalbegrip en generatie, geschikt voor interactieve dialoogtoepassingen."
|
||||
},
|
||||
"gpt-5-codex": {
|
||||
"description": "GPT-5 Codex is een GPT-5 versie geoptimaliseerd voor agent-gebaseerde codeertaken in Codex of vergelijkbare omgevingen."
|
||||
},
|
||||
"gpt-5-mini": {
|
||||
"description": "Een snellere en kostenefficiëntere versie van GPT-5, geschikt voor duidelijk gedefinieerde taken. Biedt snellere reactietijden met behoud van hoge outputkwaliteit."
|
||||
},
|
||||
"gpt-5-nano": {
|
||||
"description": "De snelste en meest kostenefficiënte versie van GPT-5. Uitstekend geschikt voor toepassingen die snelle reacties en kostenbewustzijn vereisen."
|
||||
},
|
||||
"gpt-audio": {
|
||||
"description": "GPT Audio is een universeel chatmodel gericht op audio-invoer en -uitvoer, ondersteund in de Chat Completions API met audio I/O."
|
||||
},
|
||||
"gpt-image-1": {
|
||||
"description": "ChatGPT native multimodaal afbeeldingsgeneratiemodel"
|
||||
},
|
||||
"gpt-oss": {
|
||||
"description": "GPT-OSS 20B is een open-source groot taalmodel uitgebracht door OpenAI, dat gebruikmaakt van MXFP4-kwantisatietechnologie en geschikt is voor gebruik op high-end consumentengpu's of Apple Silicon Macs. Dit model presteert uitstekend bij dialooggeneratie, code schrijven en redeneertaken, en ondersteunt functieverzoeken en het gebruik van tools."
|
||||
},
|
||||
"gpt-oss-120b": {
|
||||
"description": "GPT-OSS-120B MXFP4-gekwantificeerd Transformer-structuur, behoudt sterke prestaties zelfs bij beperkte middelen."
|
||||
},
|
||||
"gpt-oss:120b": {
|
||||
"description": "GPT-OSS 120B is een groot open-source taalmodel uitgebracht door OpenAI, dat gebruikmaakt van MXFP4-kwantisatietechnologie en als vlaggenschipmodel fungeert. Het vereist een multi-gpu- of high-performance workstation-omgeving en levert uitstekende prestaties bij complexe redenering, codegeneratie en meertalige verwerking, met ondersteuning voor geavanceerde functieverzoeken en toolintegratie."
|
||||
},
|
||||
"gpt-oss:20b": {
|
||||
"description": "GPT-OSS 20B is een open-source groot taalmodel uitgebracht door OpenAI, gebruikmakend van MXFP4-kwantisatietechnologie, geschikt voor high-end consumenten GPU's of Apple Silicon Macs. Dit model presteert uitstekend in dialooggeneratie, code schrijven en redeneertaken, en ondersteunt functieaanroepen en het gebruik van tools."
|
||||
},
|
||||
"gpt-realtime": {
|
||||
"description": "Universeel realtime model dat realtime tekst- en audio-invoer en -uitvoer ondersteunt, evenals beeldinvoer."
|
||||
},
|
||||
"grok-2-1212": {
|
||||
"description": "Dit model heeft verbeteringen aangebracht in nauwkeurigheid, instructievolging en meertalige capaciteiten."
|
||||
},
|
||||
@@ -1712,6 +1727,12 @@
|
||||
"grok-4-0709": {
|
||||
"description": "Grok 4 van xAI, met krachtige redeneervaardigheden."
|
||||
},
|
||||
"grok-4-fast-non-reasoning": {
|
||||
"description": "We zijn verheugd Grok 4 Fast te introduceren, onze nieuwste vooruitgang in kosteneffectieve redeneermodellen."
|
||||
},
|
||||
"grok-4-fast-reasoning": {
|
||||
"description": "We zijn verheugd Grok 4 Fast te introduceren, onze nieuwste vooruitgang in kosteneffectieve redeneermodellen."
|
||||
},
|
||||
"grok-code-fast-1": {
|
||||
"description": "We zijn verheugd om grok-code-fast-1 te introduceren, een snel en kostenefficiënt inferentiemodel dat uitblinkt in agentcodering."
|
||||
},
|
||||
@@ -1847,8 +1868,14 @@
|
||||
"inception/mercury-coder-small": {
|
||||
"description": "Mercury Coder Small is ideaal voor codegeneratie, debugging en refactoring taken met minimale latentie."
|
||||
},
|
||||
"inclusionAI/Ling-flash-2.0": {
|
||||
"description": "Ling-flash-2.0 is het derde model in de Ling 2.0 architectuurserie uitgebracht door het Bailing-team van Ant Group. Het is een Mixture of Experts (MoE) model met in totaal 100 miljard parameters, maar activeert slechts 6,1 miljard parameters per token (waarvan 4,8 miljard niet-embedding). Als een lichtgewicht configuratie toont Ling-flash-2.0 in meerdere gezaghebbende evaluaties prestaties die vergelijkbaar zijn met of beter dan 40 miljard dense modellen en grotere MoE modellen. Dit model is ontworpen om via ultieme architectuurontwerpen en trainingsstrategieën een efficiënte weg te verkennen binnen de consensus dat grote modellen gelijkstaan aan veel parameters."
|
||||
},
|
||||
"inclusionAI/Ling-mini-2.0": {
|
||||
"description": "Ling-mini-2.0 is een klein, hoogwaardig groot taalmodel gebaseerd op de MoE-architectuur. Het heeft in totaal 16 miljard parameters, maar activeert slechts 1,4 miljard per token (non-embedding 789 miljoen), wat zorgt voor een extreem hoge generatie snelheid. Dankzij het efficiënte MoE-ontwerp en grootschalige, hoogwaardige trainingsdata levert Ling-mini-2.0, ondanks slechts 1,4 miljard geactiveerde parameters, toch topprestaties die vergelijkbaar zijn met dense LLM's onder de 10 miljard en grotere MoE-modellen in downstream taken."
|
||||
"description": "Ling-mini-2.0 is een klein maar hoogpresterend groot taalmodel gebaseerd op de MoE-architectuur. Het heeft 16 miljard totale parameters, maar activeert slechts 1,4 miljard per token (789 miljoen niet-embedding), wat een zeer hoge generatie snelheid mogelijk maakt. Dankzij het efficiënte MoE-ontwerp en grootschalige hoogwaardige trainingsdata levert Ling-mini-2.0, ondanks de beperkte geactiveerde parameters, topprestaties die vergelijkbaar zijn met dense LLM's onder 10 miljard en grotere MoE modellen in downstream taken."
|
||||
},
|
||||
"inclusionAI/Ring-flash-2.0": {
|
||||
"description": "Ring-flash-2.0 is een diep geoptimaliseerd hoogpresterend denkmodel gebaseerd op Ling-flash-2.0-base. Het gebruikt een Mixture of Experts (MoE) architectuur met in totaal 100 miljard parameters, maar activeert slechts 6,1 miljard parameters per inferentie. Dit model lost met het unieke icepop-algoritme de instabiliteitsproblemen van grote MoE modellen tijdens reinforcement learning (RL) training op, waardoor de complexe redeneercapaciteit continu verbetert bij langdurige training. Ring-flash-2.0 behaalde significante doorbraken in uitdagende benchmarks zoals wiskundewedstrijden, codegeneratie en logische redenering. Het presteert niet alleen beter dan top dense modellen onder 40 miljard parameters, maar kan ook concurreren met grotere open-source MoE modellen en gesloten hoogpresterende denkmodellen. Hoewel het model zich richt op complexe redenering, presteert het ook uitstekend in creatieve schrijfopdrachten. Dankzij het efficiënte architectuurontwerp biedt Ring-flash-2.0 krachtige prestaties met hoge inferentiesnelheid, wat de implementatiekosten in scenario's met hoge gelijktijdigheid aanzienlijk verlaagt."
|
||||
},
|
||||
"internlm/internlm2_5-7b-chat": {
|
||||
"description": "InternLM2.5 biedt intelligente gespreksoplossingen voor meerdere scenario's."
|
||||
@@ -1974,7 +2001,10 @@
|
||||
"description": "LLaVA is een multimodaal model dat visuele encoder en Vicuna combineert, voor krachtige visuele en taalbegrip."
|
||||
},
|
||||
"magistral-medium-latest": {
|
||||
"description": "Magistral Medium 1.1 is een toonaangevend inferentiemodel dat door Mistral AI in juli 2025 is uitgebracht."
|
||||
"description": "Magistral Medium 1.2 is een geavanceerd inferentiemodel met visuele ondersteuning, uitgebracht door Mistral AI in september 2025."
|
||||
},
|
||||
"magistral-small-2509": {
|
||||
"description": "Magistral Small 1.2 is een open-source compact inferentiemodel met visuele ondersteuning, uitgebracht door Mistral AI in september 2025."
|
||||
},
|
||||
"mathstral": {
|
||||
"description": "MathΣtral is ontworpen voor wetenschappelijk onderzoek en wiskundige inferentie, biedt effectieve rekencapaciteiten en resultaatinterpretatie."
|
||||
@@ -2282,9 +2312,6 @@
|
||||
"mistral/mistral-large": {
|
||||
"description": "Mistral Large is ideaal voor complexe taken die grote redeneercapaciteit of hoge specialisatie vereisen, zoals synthetische tekstgeneratie, codegeneratie, RAG of agenten."
|
||||
},
|
||||
"mistral/mistral-saba-24b": {
|
||||
"description": "Mistral Saba 24B is een open-source model met 24 miljard parameters ontwikkeld door Mistral.ai. Saba is een gespecialiseerd model dat is getraind om uit te blinken in Arabisch, Perzisch, Urdu, Hebreeuws en Indiase talen. Gehost door Groq met hun aangepaste Language Processing Unit (LPU) hardware voor snelle en efficiënte inferentie."
|
||||
},
|
||||
"mistral/mistral-small": {
|
||||
"description": "Mistral Small is ideaal voor eenvoudige taken die in bulk kunnen worden uitgevoerd, zoals classificatie, klantenondersteuning of tekstgeneratie. Het biedt uitstekende prestaties tegen een betaalbare prijs."
|
||||
},
|
||||
@@ -2357,9 +2384,6 @@
|
||||
"moonshotai/Kimi-Dev-72B": {
|
||||
"description": "Kimi-Dev-72B is een open source code groot model, geoptimaliseerd door grootschalige versterkte leerprocessen, dat robuuste en direct inzetbare patches kan genereren. Dit model behaalde een nieuwe recordscore van 60,4% op SWE-bench Verified en vestigde daarmee een nieuw hoogtepunt voor open source modellen bij geautomatiseerde software engineering taken zoals defectherstel en code review."
|
||||
},
|
||||
"moonshotai/Kimi-K2-Instruct": {
|
||||
"description": "Kimi K2 is een MoE-architectuurbasis model met krachtige codeer- en agentcapaciteiten, met in totaal 1 biljoen parameters en 32 miljard geactiveerde parameters. In benchmarktests voor algemene kennisredenering, programmeren, wiskunde en agenttaken overtreft het K2-model andere toonaangevende open-source modellen."
|
||||
},
|
||||
"moonshotai/Kimi-K2-Instruct-0905": {
|
||||
"description": "Kimi K2-Instruct-0905 is de nieuwste en krachtigste versie van Kimi K2. Het is een toonaangevend hybride expert (MoE) taalmodel met in totaal 1 biljoen parameters en 32 miljard geactiveerde parameters. De belangrijkste kenmerken van dit model zijn: verbeterde agent-coderingsintelligentie, met aanzienlijke prestatieverbeteringen in openbare benchmarktests en echte agent-coderingsopdrachten; verbeterde front-end coderingservaring, met vooruitgang in zowel esthetiek als bruikbaarheid van front-end programmeren."
|
||||
},
|
||||
@@ -2570,6 +2594,9 @@
|
||||
"qwen-image": {
|
||||
"description": "Qwen-Image is een veelzijdig beeldgeneratiemodel dat meerdere kunststijlen ondersteunt en uitblinkt in het renderen van complexe tekst, met name het weergeven van Chinese en Engelse tekst. Het model ondersteunt meerregelige lay-outs, tekstgeneratie op paragraafniveau en fijne detaillering, en maakt complexe gemengde tekst-beeldlay-outs mogelijk."
|
||||
},
|
||||
"qwen-image-edit": {
|
||||
"description": "Qwen Image Edit is een beeld-naar-beeld model dat beeldbewerking en aanpassing ondersteunt op basis van ingevoerde afbeeldingen en tekstuele aanwijzingen. Het kan de originele afbeelding nauwkeurig aanpassen en creatief transformeren volgens de wensen van de gebruiker."
|
||||
},
|
||||
"qwen-long": {
|
||||
"description": "Qwen is een grootschalig taalmodel dat lange tekstcontexten ondersteunt, evenals dialoogfunctionaliteit op basis van lange documenten en meerdere documenten."
|
||||
},
|
||||
@@ -2804,8 +2831,11 @@
|
||||
"qwen3-coder-plus": {
|
||||
"description": "Tongyi Qianwen codeermodel. De nieuwste Qwen3-Coder-serie is gebaseerd op Qwen3 en is een codegeneratiemodel met krachtige Coding Agent-capaciteiten, bedreven in het aanroepen van tools en interactie met omgevingen, in staat tot autonoom programmeren, met uitstekende codeervaardigheden en tevens algemene capaciteiten."
|
||||
},
|
||||
"qwen3-max-preview": {
|
||||
"description": "Previewversie van het Qwen 3 Max-model uit de Tongyi Qianwen 3-serie, met aanzienlijke verbeteringen ten opzichte van de 2.5-serie in algemene capaciteiten, tweetalig tekstbegrip (Chinees en Engels), complexe instructienaleving, subjectieve open taken, meertalige vaardigheden en toolaanroepen; het model vertoont minder kennisillusies."
|
||||
"qwen3-coder:480b": {
|
||||
"description": "Een hoogpresterend lang-context model van Alibaba, gericht op agent- en codeertaken."
|
||||
},
|
||||
"qwen3-max": {
|
||||
"description": "De Tongyi Qianwen 3-serie Max modellen bieden een aanzienlijke verbetering ten opzichte van de 2.5-serie in algemene capaciteiten, waaronder meertalige tekstbegrip in het Chinees en Engels, complexe instructienaleving, open subjectieve taken, meertalige ondersteuning en tool-integratie; het model vertoont minder kennishallucinaties. De nieuwste qwen3-max modellen zijn, vergeleken met de qwen3-max-preview versie, speciaal geüpgraded op het gebied van agent programmering en tool-integratie. De officiële release van dit model bereikt SOTA-niveau in het domein en is geschikt voor complexere agentbehoeften."
|
||||
},
|
||||
"qwen3-next-80b-a3b-instruct": {
|
||||
"description": "Een nieuwe generatie open-source model zonder denkmodus gebaseerd op Qwen3, met verbeterde Chinese tekstbegrip, versterkte logische redeneervaardigheden en betere prestaties bij tekstgeneratietaken vergeleken met de vorige versie (Tongyi Qianwen 3-235B-A22B-Instruct-2507)."
|
||||
@@ -2813,6 +2843,9 @@
|
||||
"qwen3-next-80b-a3b-thinking": {
|
||||
"description": "Een nieuwe generatie open-source model met denkmodus gebaseerd op Qwen3, met verbeterde instructienaleving en meer beknopte samenvattende antwoorden vergeleken met de vorige versie (Tongyi Qianwen 3-235B-A22B-Thinking-2507)."
|
||||
},
|
||||
"qwen3-vl-plus": {
|
||||
"description": "Tongyi Qianwen VL is een tekstgeneratiemodel met visuele (beeld) begripscapaciteiten. Het kan niet alleen OCR (tekstherkenning in afbeeldingen) uitvoeren, maar ook samenvatten en redeneren, bijvoorbeeld het extraheren van attributen uit productfoto's en het oplossen van problemen op basis van oefenplaatjes."
|
||||
},
|
||||
"qwq": {
|
||||
"description": "QwQ is een experimenteel onderzoeksmodel dat zich richt op het verbeteren van de AI-redeneringscapaciteiten."
|
||||
},
|
||||
|
||||
@@ -281,6 +281,7 @@
|
||||
"actionFiletip": "Prześlij plik",
|
||||
"actionTooltip": "Prześlij",
|
||||
"disabled": "Aktualny model nie obsługuje rozpoznawania wizualnego i analizy plików, przełącz się na inny model, aby użyć tej funkcji",
|
||||
"fileNotSupported": "Tryb przeglądarki nie obsługuje przesyłania plików, obsługiwane są tylko obrazy",
|
||||
"visionNotSupported": "Obecny model nie obsługuje rozpoznawania wizualnego, proszę przełączyć model i spróbować ponownie"
|
||||
},
|
||||
"preview": {
|
||||
@@ -289,6 +290,9 @@
|
||||
"pending": "Przygotowywanie do przesłania...",
|
||||
"processing": "Przetwarzanie pliku..."
|
||||
}
|
||||
},
|
||||
"validation": {
|
||||
"videoSizeExceeded": "Rozmiar pliku wideo nie może przekraczać 20MB, aktualny rozmiar pliku to {{actualSize}}"
|
||||
}
|
||||
},
|
||||
"zenMode": "Tryb skupienia"
|
||||
|
||||
@@ -114,6 +114,7 @@
|
||||
"reasoning": "Ten model wspiera głębokie myślenie",
|
||||
"search": "Ten model wspiera wyszukiwanie w sieci",
|
||||
"tokens": "Ten model obsługuje maksymalnie {{tokens}} tokenów w pojedynczej sesji.",
|
||||
"video": "Ten model obsługuje rozpoznawanie wideo",
|
||||
"vision": "Ten model obsługuje rozpoznawanie wizualne."
|
||||
},
|
||||
"removed": "Ten model nie znajduje się na liście, jeśli zostanie odznaczony, zostanie automatycznie usunięty"
|
||||
|
||||
+53
-20
@@ -287,9 +287,6 @@
|
||||
"Pro/deepseek-ai/DeepSeek-V3.1": {
|
||||
"description": "DeepSeek-V3.1 to hybrydowy duży model językowy wydany przez DeepSeek AI, który wprowadza wiele istotnych ulepszeń w stosunku do poprzednich wersji. Jedną z innowacji jest integracja trybu myślenia (Thinking Mode) i trybu bezmyślnego (Non-thinking Mode), które użytkownik może elastycznie przełączać, dostosowując szablony rozmów do różnych zadań. Dzięki specjalnej optymalizacji po treningu, wersja V3.1 znacznie poprawiła wydajność w wywoływaniu narzędzi i zadaniach agenta, lepiej wspierając zewnętrzne narzędzia wyszukiwania oraz realizację wieloetapowych, złożonych zadań. Model bazuje na DeepSeek-V3.1-Base i został poddany dalszemu treningowi z zastosowaniem dwufazowej metody rozszerzania długich tekstów, co znacznie zwiększyło ilość danych treningowych i poprawiło działanie na długich dokumentach oraz rozbudowanym kodzie. Jako model open source, DeepSeek-V3.1 wykazuje zdolności porównywalne z najlepszymi zamkniętymi modelami w benchmarkach kodowania, matematyki i wnioskowania, a dzięki architekturze hybrydowych ekspertów (MoE) utrzymuje ogromną pojemność modelu przy jednoczesnym efektywnym obniżeniu kosztów wnioskowania."
|
||||
},
|
||||
"Pro/moonshotai/Kimi-K2-Instruct": {
|
||||
"description": "Kimi K2 to podstawowy model architektury MoE o potężnych zdolnościach kodowania i agenta, z łączną liczbą parametrów 1 biliona i 32 miliardami aktywowanych parametrów. W testach wydajności w zakresie ogólnej wiedzy, programowania, matematyki i zadań agenta model K2 przewyższa inne popularne otwarte modele."
|
||||
},
|
||||
"Pro/moonshotai/Kimi-K2-Instruct-0905": {
|
||||
"description": "Kimi K2-Instruct-0905 to najnowsza i najpotężniejsza wersja Kimi K2. Jest to zaawansowany model językowy typu Mixture of Experts (MoE) z 1 bilionem parametrów ogółem i 32 miliardami aktywowanych parametrów. Główne cechy modelu to: wzmocniona inteligencja kodowania agentów, która wykazuje znaczącą poprawę wydajności w publicznych testach porównawczych oraz w rzeczywistych zadaniach kodowania agentów; ulepszone doświadczenie kodowania front-end, z postępami zarówno w estetyce, jak i funkcjonalności programowania front-endowego."
|
||||
},
|
||||
@@ -380,6 +377,12 @@
|
||||
"Qwen/Qwen3-Coder-480B-A35B-Instruct": {
|
||||
"description": "Qwen3-Coder-480B-A35B-Instruct został wydany przez Alibaba i jest jak dotąd modelem kodowania o największych zdolnościach agentskich (agentic). Jest to model typu Mixture-of-Experts (MoE) z 480 miliardami parametrów ogółem i 35 miliardami parametrów aktywacyjnych, osiągający równowagę między wydajnością a efektywnością. Model natywnie obsługuje kontekst o długości 256K (około 260 tys.) tokenów i może być rozszerzony do 1 miliona tokenów za pomocą metod ekstrapolacji, takich jak YaRN, co pozwala mu przetwarzać duże repozytoria kodu i złożone zadania programistyczne. Qwen3-Coder został zaprojektowany pod kątem agentowego przepływu pracy kodowania — nie tylko generuje kod, ale również potrafi autonomicznie współdziałać z narzędziami i środowiskami deweloperskimi, aby rozwiązywać złożone problemy programistyczne. W wielu benchmarkach dotyczących zadań kodowania i agentowych model osiągnął czołowe wyniki wśród modeli open-source, a jego wydajność dorównuje wiodącym modelom, takim jak Claude Sonnet 4."
|
||||
},
|
||||
"Qwen/Qwen3-Next-80B-A3B-Instruct": {
|
||||
"description": "Qwen3-Next-80B-A3B-Instruct to kolejna generacja modelu bazowego wydanego przez zespół Tongyi Qianwen z Alibaba. Opiera się na nowej architekturze Qwen3-Next, zaprojektowanej w celu osiągnięcia maksymalnej efektywności treningu i inferencji. Model wykorzystuje innowacyjny hybrydowy mechanizm uwagi (Gated DeltaNet i Gated Attention), wysoko rzadką strukturę ekspertów mieszanych (MoE) oraz liczne optymalizacje stabilności treningu. Jako model rzadki z 80 miliardami parametrów, podczas inferencji aktywuje jedynie około 3 miliardów parametrów, co znacznie obniża koszty obliczeniowe. Przy zadaniach z bardzo długim kontekstem przekraczającym 32 tysiące tokenów, przepustowość inferencji jest ponad 10 razy wyższa niż w modelu Qwen3-32B. Ten model jest wersją dostrojoną pod kątem instrukcji, zaprojektowaną do zadań ogólnego przeznaczenia i nie obsługuje trybu łańcucha myślenia (Thinking). Pod względem wydajności dorównuje flagowemu modelowi Tongyi Qianwen Qwen3-235B w niektórych benchmarkach, szczególnie wykazując wyraźną przewagę w zadaniach z bardzo długim kontekstem."
|
||||
},
|
||||
"Qwen/Qwen3-Next-80B-A3B-Thinking": {
|
||||
"description": "Qwen3-Next-80B-A3B-Thinking to kolejna generacja modelu bazowego wydanego przez zespół Tongyi Qianwen z Alibaba, specjalnie zaprojektowana do złożonych zadań wnioskowania. Opiera się na innowacyjnej architekturze Qwen3-Next, która łączy hybrydowy mechanizm uwagi (Gated DeltaNet i Gated Attention) oraz wysoko rzadką strukturę ekspertów mieszanych (MoE), dążąc do maksymalnej efektywności treningu i inferencji. Jako model rzadki z 80 miliardami parametrów, podczas inferencji aktywuje jedynie około 3 miliardów parametrów, co znacznie obniża koszty obliczeniowe. Przy zadaniach z bardzo długim kontekstem przekraczającym 32 tysiące tokenów, przepustowość jest ponad 10 razy wyższa niż w modelu Qwen3-32B. Wersja „Thinking” jest zoptymalizowana do wykonywania złożonych, wieloetapowych zadań takich jak dowody matematyczne, synteza kodu, analiza logiczna i planowanie, domyślnie generując proces wnioskowania w ustrukturyzowanej formie łańcucha myślenia. Pod względem wydajności przewyższa modele o wyższych kosztach, takie jak Qwen3-32B-Thinking, a także w wielu benchmarkach jest lepszy od Gemini-2.5-Flash-Thinking."
|
||||
},
|
||||
"Qwen2-72B-Instruct": {
|
||||
"description": "Qwen2 to najnowsza seria modeli Qwen, obsługująca kontekst 128k. W porównaniu do obecnie najlepszych modeli open source, Qwen2-72B znacznie przewyższa w zakresie rozumienia języka naturalnego, wiedzy, kodowania, matematyki i wielu języków."
|
||||
},
|
||||
@@ -809,9 +812,6 @@
|
||||
"codex-mini-latest": {
|
||||
"description": "codex-mini-latest to wersja dostrojona o4-mini, specjalnie zaprojektowana do Codex CLI. Do bezpośredniego użycia przez API zalecamy rozpoczęcie od gpt-4.1."
|
||||
},
|
||||
"cognitivecomputations/dolphin-mixtral-8x22b": {
|
||||
"description": "Dolphin Mixtral 8x22B to model zaprojektowany do przestrzegania instrukcji, dialogów i programowania."
|
||||
},
|
||||
"cogview-4": {
|
||||
"description": "CogView-4 to pierwszy otwartoźródłowy model generowania obrazów tekstowych firmy Zhipu, który obsługuje generowanie znaków chińskich. Model oferuje kompleksowe ulepszenia w zakresie rozumienia semantycznego, jakości generowanych obrazów oraz zdolności generowania tekstu w języku chińskim i angielskim. Obsługuje dwujęzyczne wejście w dowolnej długości i potrafi generować obrazy o dowolnej rozdzielczości w określonym zakresie."
|
||||
},
|
||||
@@ -926,6 +926,9 @@
|
||||
"deepseek-ai/deepseek-r1": {
|
||||
"description": "Najnowocześniejszy, wydajny LLM, specjalizujący się w wnioskowaniu, matematyce i programowaniu."
|
||||
},
|
||||
"deepseek-ai/deepseek-v3.1": {
|
||||
"description": "DeepSeek V3.1: kolejna generacja modelu inferencyjnego, poprawiająca zdolności do złożonego wnioskowania i łańcuchowego myślenia, odpowiednia do zadań wymagających dogłębnej analizy."
|
||||
},
|
||||
"deepseek-ai/deepseek-vl2": {
|
||||
"description": "DeepSeek-VL2 to model wizualno-językowy oparty na DeepSeekMoE-27B, wykorzystujący architekturę MoE z rzadką aktywacją, osiągający doskonałe wyniki przy aktywacji jedynie 4,5 miliarda parametrów. Model ten wyróżnia się w wielu zadaniach, takich jak wizualne pytania i odpowiedzi, optyczne rozpoznawanie znaków, zrozumienie dokumentów/tabel/wykresów oraz lokalizacja wizualna."
|
||||
},
|
||||
@@ -1007,6 +1010,9 @@
|
||||
"deepseek-v3.1": {
|
||||
"description": "DeepSeek-V3.1 to nowy hybrydowy model wnioskowania opracowany przez DeepSeek, obsługujący dwa tryby wnioskowania: myślenia i bezmyślny, z wyższą efektywnością myślenia niż DeepSeek-R1-0528. Dzięki optymalizacji po treningu, wykorzystanie narzędzi agenta i wydajność zadań inteligentnych agentów zostały znacznie poprawione. Obsługuje okno kontekstowe do 128k oraz maksymalną długość wyjścia do 64k tokenów."
|
||||
},
|
||||
"deepseek-v3.1:671b": {
|
||||
"description": "DeepSeek V3.1: kolejna generacja modelu inferencyjnego, poprawiająca zdolności do złożonego wnioskowania i łańcuchowego myślenia, odpowiednia do zadań wymagających dogłębnej analizy."
|
||||
},
|
||||
"deepseek/deepseek-chat-v3-0324": {
|
||||
"description": "DeepSeek V3 to model mieszany z 685B parametrami, będący najnowszą iteracją flagowej serii modeli czatu zespołu DeepSeek.\n\nDziedziczy po modelu [DeepSeek V3](/deepseek/deepseek-chat-v3) i wykazuje doskonałe wyniki w różnych zadaniach."
|
||||
},
|
||||
@@ -1626,7 +1632,7 @@
|
||||
"description": "ChatGPT-4o to dynamiczny model, aktualizowany w czasie rzeczywistym, aby być zawsze na bieżąco z najnowszą wersją. Łączy potężne zdolności rozumienia i generowania języka, idealny do zastosowań w dużej skali, w tym obsłudze klienta, edukacji i wsparciu technicznym."
|
||||
},
|
||||
"gpt-4o-audio-preview": {
|
||||
"description": "Model audio GPT-4o, obsługujący wejście i wyjście audio."
|
||||
"description": "Model GPT-4o Audio Preview, obsługujący wejście i wyjście audio."
|
||||
},
|
||||
"gpt-4o-mini": {
|
||||
"description": "GPT-4o mini to najnowszy model OpenAI, wprowadzony po GPT-4 Omni, obsługujący wejścia tekstowe i wizualne oraz generujący tekst. Jako ich najnowocześniejszy model w małej skali, jest znacznie tańszy niż inne niedawno wprowadzone modele, a jego cena jest o ponad 60% niższa niż GPT-3.5 Turbo. Utrzymuje najnowocześniejszą inteligencję, jednocześnie oferując znaczną wartość za pieniądze. GPT-4o mini uzyskał wynik 82% w teście MMLU i obecnie zajmuje wyższą pozycję w preferencjach czatu niż GPT-4."
|
||||
@@ -1667,24 +1673,33 @@
|
||||
"gpt-5-chat-latest": {
|
||||
"description": "Model GPT-5 używany w ChatGPT. Łączy potężne zdolności rozumienia i generowania języka, idealny do interakcji konwersacyjnych."
|
||||
},
|
||||
"gpt-5-codex": {
|
||||
"description": "GPT-5 Codex to wersja GPT-5 zoptymalizowana pod kątem zadań kodowania w środowiskach Codex lub podobnych."
|
||||
},
|
||||
"gpt-5-mini": {
|
||||
"description": "Szybsza i bardziej ekonomiczna wersja GPT-5, przeznaczona do jasno określonych zadań. Zapewnia szybszą reakcję przy zachowaniu wysokiej jakości wyników."
|
||||
},
|
||||
"gpt-5-nano": {
|
||||
"description": "Najszybsza i najbardziej ekonomiczna wersja GPT-5. Doskonała do zastosowań wymagających szybkiej odpowiedzi i wrażliwych na koszty."
|
||||
},
|
||||
"gpt-audio": {
|
||||
"description": "GPT Audio to uniwersalny model konwersacyjny obsługujący wejście i wyjście audio, dostępny w API Chat Completions z obsługą audio I/O."
|
||||
},
|
||||
"gpt-image-1": {
|
||||
"description": "Natywny multimodalny model generowania obrazów ChatGPT."
|
||||
},
|
||||
"gpt-oss": {
|
||||
"description": "GPT-OSS 20B to otwarty model językowy wydany przez OpenAI, wykorzystujący technologię kwantyzacji MXFP4, odpowiedni do uruchamiania na wysokiej klasy konsumenckich GPU lub komputerach Apple Silicon Mac. Model ten doskonale sprawdza się w generowaniu dialogów, pisaniu kodu oraz zadaniach wnioskowania, obsługując wywołania funkcji i korzystanie z narzędzi."
|
||||
},
|
||||
"gpt-oss-120b": {
|
||||
"description": "GPT-OSS-120B MXFP4: skwantowany model Transformer, który zachowuje wysoką wydajność nawet przy ograniczonych zasobach."
|
||||
},
|
||||
"gpt-oss:120b": {
|
||||
"description": "GPT-OSS 120B to duży otwarty model językowy wydany przez OpenAI, wykorzystujący technologię kwantyzacji MXFP4, przeznaczony jako model flagowy. Wymaga środowiska wielo-GPU lub wysokowydajnej stacji roboczej, oferując znakomitą wydajność w złożonym wnioskowaniu, generowaniu kodu oraz przetwarzaniu wielojęzycznym, wspierając zaawansowane wywołania funkcji i integrację narzędzi."
|
||||
},
|
||||
"gpt-oss:20b": {
|
||||
"description": "GPT-OSS 20B to otwartoźródłowy duży model językowy wydany przez OpenAI, wykorzystujący technikę kwantyzacji MXFP4, przeznaczony do uruchamiania na wysokiej klasy konsumenckich GPU lub Apple Silicon Mac. Model wykazuje doskonałe wyniki w generowaniu dialogów, pisaniu kodu i zadaniach wnioskowania, obsługuje wywołania funkcji i korzystanie z narzędzi."
|
||||
},
|
||||
"gpt-realtime": {
|
||||
"description": "Uniwersalny model czasu rzeczywistego, obsługujący tekstowe i audio wejścia i wyjścia oraz wejścia obrazów."
|
||||
},
|
||||
"grok-2-1212": {
|
||||
"description": "Model ten poprawił dokładność, przestrzeganie instrukcji oraz zdolności wielojęzyczne."
|
||||
},
|
||||
@@ -1712,6 +1727,12 @@
|
||||
"grok-4-0709": {
|
||||
"description": "Grok 4 od xAI, wyposażony w potężne zdolności rozumowania."
|
||||
},
|
||||
"grok-4-fast-non-reasoning": {
|
||||
"description": "Z radością prezentujemy Grok 4 Fast, nasz najnowszy postęp w modelach inferencyjnych o wysokiej efektywności kosztowej."
|
||||
},
|
||||
"grok-4-fast-reasoning": {
|
||||
"description": "Z radością prezentujemy Grok 4 Fast, nasz najnowszy postęp w modelach inferencyjnych o wysokiej efektywności kosztowej."
|
||||
},
|
||||
"grok-code-fast-1": {
|
||||
"description": "Z radością przedstawiamy grok-code-fast-1, szybki i ekonomiczny model inferencyjny, który doskonale sprawdza się w kodowaniu agentów."
|
||||
},
|
||||
@@ -1847,8 +1868,14 @@
|
||||
"inception/mercury-coder-small": {
|
||||
"description": "Mercury Coder Small to idealny wybór do generowania, debugowania i refaktoryzacji kodu, oferujący minimalne opóźnienia."
|
||||
},
|
||||
"inclusionAI/Ling-flash-2.0": {
|
||||
"description": "Ling-flash-2.0 to trzeci model z serii architektury Ling 2.0 wydany przez zespół Bailing z Ant Group. Jest to model hybrydowy ekspertów (MoE) o łącznej liczbie parametrów 100 miliardów, z aktywacją jedynie 6,1 miliarda parametrów na token (48 miliardów bez uwzględnienia wektorów osadzeń). Jako lekka konfiguracja modelu, Ling-flash-2.0 wykazuje w wielu autorytatywnych testach wydajność porównywalną lub przewyższającą modele gęste (Dense) o wielkości 40 miliardów parametrów oraz większe modele MoE. Model ten ma na celu eksplorację efektywnych ścieżek w kontekście powszechnego przekonania, że „duży model to duża liczba parametrów”, poprzez zaawansowany projekt architektury i strategię treningową."
|
||||
},
|
||||
"inclusionAI/Ling-mini-2.0": {
|
||||
"description": "Ling-mini-2.0 to mały, wysokowydajny model językowy oparty na architekturze MoE. Posiada 16 miliardów parametrów ogółem, jednak dla każdego tokena aktywowanych jest tylko 1,4 miliarda (nie obejmując osadzeń 789 milionów), co umożliwia bardzo wysoką prędkość generowania. Dzięki efektywnemu projektowi MoE oraz dużej, wysokiej jakości bazie treningowej, mimo że aktywowanych parametrów jest tylko 1,4 miliarda, Ling-mini-2.0 osiąga w zadaniach końcowych wydajność porównywalną z modelami dense LLM poniżej 10 miliardów parametrów oraz większymi modelami MoE."
|
||||
"description": "Ling-mini-2.0 to mały, wysokowydajny duży model językowy oparty na architekturze MoE. Posiada 16 miliardów parametrów, ale aktywuje tylko 1,4 miliarda na token (789 milionów bez osadzeń), co zapewnia bardzo wysoką szybkość generowania. Dzięki efektywnemu projektowi MoE i dużej, wysokiej jakości bazie treningowej, mimo niskiej liczby aktywowanych parametrów, Ling-mini-2.0 osiąga w zadaniach downstream wydajność porównywalną z najlepszymi modelami gęstymi poniżej 10 miliardów parametrów oraz większymi modelami MoE."
|
||||
},
|
||||
"inclusionAI/Ring-flash-2.0": {
|
||||
"description": "Ring-flash-2.0 to wysoko wydajny model myślenia głęboko zoptymalizowany na bazie Ling-flash-2.0-base. Wykorzystuje architekturę hybrydowych ekspertów (MoE) z łączną liczbą parametrów 100 miliardów, aktywując podczas inferencji tylko 6,1 miliarda parametrów. Model rozwiązuje problem niestabilności treningu MoE w uczeniu ze wzmocnieniem (RL) dzięki autorskiej metodzie icepop, co pozwala na ciągłe zwiększanie zdolności do złożonego wnioskowania podczas długotrwałego treningu. Ring-flash-2.0 osiągnął znaczące przełomy w trudnych benchmarkach, takich jak konkursy matematyczne, generowanie kodu i rozumowanie logiczne. Jego wydajność przewyższa najlepsze modele gęste poniżej 40 miliardów parametrów i jest porównywalna z większymi otwartoźródłowymi modelami MoE oraz zamkniętymi modelami myślenia o wysokiej wydajności. Choć skupiony na złożonym wnioskowaniu, model dobrze radzi sobie także z zadaniami kreatywnego pisania. Dzięki efektywnej architekturze Ring-flash-2.0 oferuje wysoką wydajność przy szybkim inferowaniu, co znacząco obniża koszty wdrożenia modeli myślenia w środowiskach o dużej równoczesności."
|
||||
},
|
||||
"internlm/internlm2_5-7b-chat": {
|
||||
"description": "InternLM2.5 oferuje inteligentne rozwiązania dialogowe w różnych scenariuszach."
|
||||
@@ -1974,7 +2001,10 @@
|
||||
"description": "LLaVA to multimodalny model łączący kodery wizualne i Vicunę, przeznaczony do silnego rozumienia wizualnego i językowego."
|
||||
},
|
||||
"magistral-medium-latest": {
|
||||
"description": "Magistral Medium 1.1 to model inferencyjny najnowszej generacji, wydany przez Mistral AI w lipcu 2025 roku."
|
||||
"description": "Magistral Medium 1.2 to zaawansowany model inferencyjny z obsługą wizualną, wydany przez Mistral AI we wrześniu 2025 roku."
|
||||
},
|
||||
"magistral-small-2509": {
|
||||
"description": "Magistral Small 1.2 to otwartoźródłowy, kompaktowy model inferencyjny z obsługą wizualną, wydany przez Mistral AI we wrześniu 2025 roku."
|
||||
},
|
||||
"mathstral": {
|
||||
"description": "MathΣtral zaprojektowany do badań naukowych i wnioskowania matematycznego, oferujący efektywne możliwości obliczeniowe i interpretację wyników."
|
||||
@@ -2282,9 +2312,6 @@
|
||||
"mistral/mistral-large": {
|
||||
"description": "Mistral Large to idealny wybór do złożonych zadań wymagających dużej mocy wnioskowania lub wysokiej specjalizacji — takich jak generowanie tekstu syntetycznego, generowanie kodu, RAG lub agenci."
|
||||
},
|
||||
"mistral/mistral-saba-24b": {
|
||||
"description": "Mistral Saba 24B to otwarty model o 24 miliardach parametrów opracowany przez Mistral.ai. Saba to specjalistyczny model wytrenowany do doskonałości w językach arabskim, perskim, urdu, hebrajskim i językach indyjskich. Obsługiwany przez Groq na ich niestandardowym sprzęcie LPU, zapewnia szybkie i wydajne wnioskowanie."
|
||||
},
|
||||
"mistral/mistral-small": {
|
||||
"description": "Mistral Small to idealny wybór do prostych zadań, które można przetwarzać hurtowo — takich jak klasyfikacja, obsługa klienta czy generowanie tekstu. Oferuje doskonałą wydajność w przystępnej cenie."
|
||||
},
|
||||
@@ -2357,9 +2384,6 @@
|
||||
"moonshotai/Kimi-Dev-72B": {
|
||||
"description": "Kimi-Dev-72B to otwarty model kodu źródłowego, zoptymalizowany za pomocą zaawansowanego uczenia ze wzmocnieniem, zdolny do generowania stabilnych, gotowych do produkcji poprawek. Model osiągnął nowy rekord 60,4% na SWE-bench Verified, ustanawiając nowy standard w zadaniach automatyzacji inżynierii oprogramowania, takich jak naprawa błędów i przegląd kodu."
|
||||
},
|
||||
"moonshotai/Kimi-K2-Instruct": {
|
||||
"description": "Kimi K2 to podstawowy model architektury MoE o potężnych zdolnościach kodowania i agenta, z łączną liczbą parametrów 1 biliona i 32 miliardami aktywowanych parametrów. W testach wydajności w zakresie ogólnej wiedzy, programowania, matematyki i zadań agenta model K2 przewyższa inne popularne otwarte modele."
|
||||
},
|
||||
"moonshotai/Kimi-K2-Instruct-0905": {
|
||||
"description": "Kimi K2-Instruct-0905 to najnowsza i najpotężniejsza wersja Kimi K2. Jest to zaawansowany model językowy typu Mixture of Experts (MoE) z 1 bilionem parametrów ogółem i 32 miliardami aktywowanych parametrów. Główne cechy modelu to: wzmocniona inteligencja kodowania agentów, która wykazuje znaczącą poprawę wydajności w publicznych testach porównawczych oraz w rzeczywistych zadaniach kodowania agentów; ulepszone doświadczenie kodowania front-end, z postępami zarówno w estetyce, jak i funkcjonalności programowania front-endowego."
|
||||
},
|
||||
@@ -2570,6 +2594,9 @@
|
||||
"qwen-image": {
|
||||
"description": "Qwen-Image jest uniwersalnym modelem generowania obrazów, obsługującym wiele stylów artystycznych, a w szczególności znakomicie radzącym sobie z renderowaniem złożonego tekstu, zwłaszcza tekstu w języku chińskim i angielskim. Model obsługuje układy wielowierszowe, generowanie tekstu na poziomie akapitu oraz odwzorowywanie drobnych detali, co pozwala na tworzenie złożonych projektów łączących obraz i tekst."
|
||||
},
|
||||
"qwen-image-edit": {
|
||||
"description": "Qwen Image Edit to model generujący obrazy na podstawie obrazów i tekstu, umożliwiający edycję i modyfikację obrazów zgodnie z podanymi wskazówkami. Potrafi precyzyjnie dostosować i kreatywnie przekształcić oryginalny obraz zgodnie z potrzebami użytkownika."
|
||||
},
|
||||
"qwen-long": {
|
||||
"description": "Qwen to ultra-duży model językowy, który obsługuje długie konteksty tekstowe oraz funkcje dialogowe oparte na długich dokumentach i wielu dokumentach."
|
||||
},
|
||||
@@ -2804,8 +2831,11 @@
|
||||
"qwen3-coder-plus": {
|
||||
"description": "Model kodowania Tongyi Qianwen. Najnowsza seria modeli Qwen3-Coder oparta na Qwen3 to modele generujące kod, posiadające potężne zdolności agenta kodującego, biegłe w wywoływaniu narzędzi i interakcji ze środowiskiem, umożliwiające autonomiczne programowanie, łącząc doskonałe umiejętności kodowania z uniwersalnymi zdolnościami."
|
||||
},
|
||||
"qwen3-max-preview": {
|
||||
"description": "Preview modelu Max z serii Qwen 3, który w porównaniu do serii 2.5 znacząco poprawia ogólne zdolności, w tym rozumienie tekstu w języku chińskim i angielskim, przestrzeganie złożonych instrukcji, zdolności do zadań otwartych i subiektywnych, wielojęzyczność oraz wywoływanie narzędzi; model generuje mniej halucynacji wiedzy."
|
||||
"qwen3-coder:480b": {
|
||||
"description": "Wysokowydajny model długiego kontekstu od Alibaba, zoptymalizowany pod kątem zadań agenta i kodowania."
|
||||
},
|
||||
"qwen3-max": {
|
||||
"description": "Model serii Tongyi Qianwen 3 Max, który w porównaniu do serii 2.5 oferuje znacznie ulepszone zdolności ogólne, w tym rozumienie tekstu w języku chińskim i angielskim, zdolność do wykonywania złożonych instrukcji, zadania otwarte o charakterze subiektywnym, wielojęzyczność oraz wywoływanie narzędzi; model cechuje się mniejszą halucynacją wiedzy. Najnowsza wersja qwen3-max, w porównaniu do wersji podglądowej qwen3-max-preview, została specjalnie ulepszona w zakresie programowania agentów i wywoływania narzędzi. Wydany oficjalny model osiąga poziom SOTA w swojej dziedzinie i jest dostosowany do bardziej złożonych scenariuszy zastosowań agentów."
|
||||
},
|
||||
"qwen3-next-80b-a3b-instruct": {
|
||||
"description": "Nowa generacja otwartego modelu bez trybu myślenia oparta na Qwen3, która w porównaniu z poprzednią wersją (Tongyi Qianwen 3-235B-A22B-Instruct-2507) cechuje się lepszym rozumieniem tekstu w języku chińskim, wzmocnionymi zdolnościami wnioskowania logicznego oraz lepszą wydajnością w zadaniach generowania tekstu."
|
||||
@@ -2813,6 +2843,9 @@
|
||||
"qwen3-next-80b-a3b-thinking": {
|
||||
"description": "Nowa generacja otwartego modelu z trybem myślenia oparta na Qwen3, która w porównaniu z poprzednią wersją (Tongyi Qianwen 3-235B-A22B-Thinking-2507) wykazuje poprawę w przestrzeganiu instrukcji oraz bardziej zwięzłe podsumowania w odpowiedziach modelu."
|
||||
},
|
||||
"qwen3-vl-plus": {
|
||||
"description": "Tongyi Qianwen VL to model generujący tekst z umiejętnością rozumienia wizualnego (obrazów). Potrafi nie tylko wykonywać OCR (rozpoznawanie tekstu na obrazach), ale także podsumowywać i wnioskować, na przykład wyodrębniać atrybuty z fotografii produktów czy rozwiązywać zadania na podstawie ilustracji."
|
||||
},
|
||||
"qwq": {
|
||||
"description": "QwQ to eksperymentalny model badawczy, skoncentrowany na zwiększeniu zdolności wnioskowania AI."
|
||||
},
|
||||
|
||||
@@ -281,6 +281,7 @@
|
||||
"actionFiletip": "Enviar arquivo",
|
||||
"actionTooltip": "Enviar",
|
||||
"disabled": "O modelo atual não suporta reconhecimento visual e análise de arquivos, por favor, mude de modelo antes de usar",
|
||||
"fileNotSupported": "O modo navegador não suporta upload de arquivos, apenas imagens são permitidas",
|
||||
"visionNotSupported": "O modelo atual não suporta reconhecimento visual, por favor, altere o modelo para usar esta função"
|
||||
},
|
||||
"preview": {
|
||||
@@ -289,6 +290,9 @@
|
||||
"pending": "Preparando para upload...",
|
||||
"processing": "Processando arquivo..."
|
||||
}
|
||||
},
|
||||
"validation": {
|
||||
"videoSizeExceeded": "O tamanho do arquivo de vídeo não pode exceder 20MB, o tamanho atual do arquivo é {{actualSize}}"
|
||||
}
|
||||
},
|
||||
"zenMode": "Modo de Foco"
|
||||
|
||||
@@ -114,6 +114,7 @@
|
||||
"reasoning": "Este modelo suporta pensamento profundo",
|
||||
"search": "Este modelo suporta pesquisa online",
|
||||
"tokens": "Este modelo suporta no máximo {{tokens}} tokens por sessão.",
|
||||
"video": "Este modelo suporta reconhecimento de vídeo",
|
||||
"vision": "Este modelo suporta reconhecimento visual."
|
||||
},
|
||||
"removed": "Este modelo não está na lista, se for desmarcado, será removido automaticamente"
|
||||
|
||||
+53
-20
@@ -287,9 +287,6 @@
|
||||
"Pro/deepseek-ai/DeepSeek-V3.1": {
|
||||
"description": "DeepSeek-V3.1 é um modelo de linguagem grande em modo híbrido lançado pela DeepSeek AI, que traz várias melhorias importantes em relação à geração anterior. Uma inovação chave do modelo é a integração dos modos “Pensamento” (Thinking Mode) e “Não Pensamento” (Non-thinking Mode), permitindo que o usuário alterne flexivelmente entre eles ajustando o template de conversa para atender diferentes demandas. Com otimizações pós-treinamento específicas, o V3.1 apresenta desempenho significativamente melhorado em chamadas de ferramentas e tarefas Agent, suportando melhor ferramentas de busca externas e execução de tarefas complexas em múltiplas etapas. Baseado no DeepSeek-V3.1-Base, o modelo foi treinado adicionalmente com um método de expansão de texto longo em duas fases, aumentando substancialmente o volume de dados de treinamento, o que melhora seu desempenho no processamento de documentos longos e códigos extensos. Como modelo open source, o DeepSeek-V3.1 demonstra capacidades comparáveis a modelos fechados de ponta em benchmarks de codificação, matemática e raciocínio, e graças à sua arquitetura de especialistas mistos (MoE), mantém uma enorme capacidade de modelo enquanto reduz efetivamente os custos de inferência."
|
||||
},
|
||||
"Pro/moonshotai/Kimi-K2-Instruct": {
|
||||
"description": "Kimi K2 é um modelo base com arquitetura MoE e capacidades avançadas de código e agente, com 1 trilhão de parâmetros totais e 32 bilhões ativados. Em testes de desempenho em raciocínio geral, programação, matemática e agentes, o modelo K2 supera outros modelos open source populares."
|
||||
},
|
||||
"Pro/moonshotai/Kimi-K2-Instruct-0905": {
|
||||
"description": "Kimi K2-Instruct-0905 é a versão mais recente e poderosa do Kimi K2. Trata-se de um modelo de linguagem de especialistas mistos (MoE) de ponta, com um total de 1 trilhão de parâmetros e 32 bilhões de parâmetros ativados. As principais características deste modelo incluem: inteligência aprimorada para codificação de agentes, demonstrando melhorias significativas em testes de referência públicos e em tarefas reais de codificação de agentes; experiência de codificação front-end melhorada, com avanços tanto na estética quanto na funcionalidade da programação front-end."
|
||||
},
|
||||
@@ -380,6 +377,12 @@
|
||||
"Qwen/Qwen3-Coder-480B-A35B-Instruct": {
|
||||
"description": "Qwen3-Coder-480B-A35B-Instruct é o modelo de código com maior capacidade agentic (de atuação autônoma) publicado pela Alibaba até o momento. É um modelo de especialistas mistos (MoE) com 480 bilhões de parâmetros totais e 35 bilhões de parâmetros ativados, que alcança um equilíbrio entre eficiência e desempenho. O modelo oferece suporte nativo a um comprimento de contexto de 256K (aproximadamente 260 mil) tokens e pode ser estendido até 1 milhão de tokens por meio de métodos de extrapolação como YaRN, permitindo lidar com grandes bases de código e tarefas de programação complexas. O Qwen3-Coder foi projetado para fluxos de trabalho de codificação baseados em agentes: além de gerar código, ele pode interagir de forma autônoma com ferramentas e ambientes de desenvolvimento para resolver problemas de programação complexos. Em diversos benchmarks de tarefas de codificação e de agentes, este modelo alcançou desempenho de ponta entre os modelos de código aberto, comparável a modelos líderes como o Claude Sonnet 4."
|
||||
},
|
||||
"Qwen/Qwen3-Next-80B-A3B-Instruct": {
|
||||
"description": "Qwen3-Next-80B-A3B-Instruct é o modelo base de próxima geração lançado pela equipe Tongyi Qianwen da Alibaba. Baseado na nova arquitetura Qwen3-Next, visa alcançar eficiência máxima em treinamento e inferência. O modelo adota um mecanismo inovador de atenção híbrida (Gated DeltaNet e Gated Attention), uma estrutura de especialistas mistos altamente esparsos (MoE) e várias otimizações para estabilidade no treinamento. Como um modelo esparso com 80 bilhões de parâmetros totais, ativa apenas cerca de 3 bilhões de parâmetros durante a inferência, reduzindo significativamente o custo computacional. Em tarefas de contexto longo com mais de 32 mil tokens, sua taxa de inferência é mais de 10 vezes superior ao modelo Qwen3-32B. Esta versão é ajustada por instrução para tarefas gerais e não suporta o modo de cadeia de pensamento (Thinking). Em desempenho, é comparável ao modelo principal Tongyi Qianwen Qwen3-235B em alguns benchmarks, destacando-se especialmente em tarefas de contexto ultra longo."
|
||||
},
|
||||
"Qwen/Qwen3-Next-80B-A3B-Thinking": {
|
||||
"description": "Qwen3-Next-80B-A3B-Thinking é o modelo base de próxima geração lançado pela equipe Tongyi Qianwen da Alibaba, projetado para tarefas complexas de raciocínio. Baseado na inovadora arquitetura Qwen3-Next, que integra mecanismos híbridos de atenção (Gated DeltaNet e Gated Attention) e uma estrutura de especialistas mistos altamente esparsos (MoE), busca máxima eficiência em treinamento e inferência. Como um modelo esparso com 80 bilhões de parâmetros totais, ativa apenas cerca de 3 bilhões durante a inferência, reduzindo significativamente o custo computacional. Em tarefas de contexto longo com mais de 32 mil tokens, sua taxa de inferência é mais de 10 vezes superior ao modelo Qwen3-32B. Esta versão “Thinking” é otimizada para executar tarefas complexas de múltiplas etapas, como provas matemáticas, síntese de código, análise lógica e planejamento, e por padrão produz o processo de raciocínio em forma estruturada de “cadeia de pensamento”. Em desempenho, supera modelos mais custosos como o Qwen3-32B-Thinking e também apresenta melhor desempenho que o Gemini-2.5-Flash-Thinking em vários benchmarks."
|
||||
},
|
||||
"Qwen2-72B-Instruct": {
|
||||
"description": "Qwen2 é a mais recente série do modelo Qwen, suportando 128k de contexto. Em comparação com os melhores modelos de código aberto atuais, o Qwen2-72B supera significativamente os modelos líderes em várias capacidades, incluindo compreensão de linguagem natural, conhecimento, código, matemática e multilinguismo."
|
||||
},
|
||||
@@ -809,9 +812,6 @@
|
||||
"codex-mini-latest": {
|
||||
"description": "codex-mini-latest é uma versão ajustada do o4-mini, especialmente para Codex CLI. Para uso direto via API, recomendamos começar pelo gpt-4.1."
|
||||
},
|
||||
"cognitivecomputations/dolphin-mixtral-8x22b": {
|
||||
"description": "Dolphin Mixtral 8x22B é um modelo projetado para seguir instruções, diálogos e programação."
|
||||
},
|
||||
"cogview-4": {
|
||||
"description": "CogView-4 é o primeiro modelo de geração de imagens a partir de texto open source da Zhipu que suporta a geração de caracteres chineses. Ele apresenta melhorias abrangentes em compreensão semântica, qualidade de geração de imagens e capacidade de geração de textos em chinês e inglês, suportando entradas bilíngues de qualquer comprimento e podendo gerar imagens em qualquer resolução dentro do intervalo especificado."
|
||||
},
|
||||
@@ -926,6 +926,9 @@
|
||||
"deepseek-ai/deepseek-r1": {
|
||||
"description": "LLM avançado e eficiente, especializado em raciocínio, matemática e programação."
|
||||
},
|
||||
"deepseek-ai/deepseek-v3.1": {
|
||||
"description": "DeepSeek V3.1: modelo de inferência de próxima geração, aprimorado para raciocínio complexo e pensamento em cadeia, ideal para tarefas que exigem análise profunda."
|
||||
},
|
||||
"deepseek-ai/deepseek-vl2": {
|
||||
"description": "DeepSeek-VL2 é um modelo de linguagem visual baseado no DeepSeekMoE-27B, desenvolvido como um especialista misto (MoE), utilizando uma arquitetura de MoE com ativação esparsa, alcançando desempenho excepcional com apenas 4,5 bilhões de parâmetros ativados. Este modelo se destaca em várias tarefas, incluindo perguntas visuais, reconhecimento óptico de caracteres, compreensão de documentos/tabelas/gráficos e localização visual."
|
||||
},
|
||||
@@ -1007,6 +1010,9 @@
|
||||
"deepseek-v3.1": {
|
||||
"description": "DeepSeek-V3.1 é o novo modelo híbrido de raciocínio lançado pela DeepSeek, suportando dois modos de raciocínio: com e sem pensamento, com eficiência de pensamento superior ao DeepSeek-R1-0528. Após otimização pós-treinamento, o uso de ferramentas Agent e o desempenho em tarefas inteligentes foram significativamente aprimorados. Suporta janela de contexto de 128k e comprimento máximo de saída de 64k tokens."
|
||||
},
|
||||
"deepseek-v3.1:671b": {
|
||||
"description": "DeepSeek V3.1: modelo de inferência de próxima geração, aprimorado para raciocínio complexo e pensamento em cadeia, ideal para tarefas que exigem análise profunda."
|
||||
},
|
||||
"deepseek/deepseek-chat-v3-0324": {
|
||||
"description": "O DeepSeek V3 é um modelo misto especializado com 685B de parâmetros, sendo a mais recente iteração da série de modelos de chat da equipe DeepSeek.\n\nEle herda o modelo [DeepSeek V3](/deepseek/deepseek-chat-v3) e se destaca em várias tarefas."
|
||||
},
|
||||
@@ -1626,7 +1632,7 @@
|
||||
"description": "ChatGPT-4o é um modelo dinâmico, atualizado em tempo real para manter a versão mais atualizada. Combina uma poderosa compreensão e capacidade de geração de linguagem, adequado para cenários de aplicação em larga escala, incluindo atendimento ao cliente, educação e suporte técnico."
|
||||
},
|
||||
"gpt-4o-audio-preview": {
|
||||
"description": "Modelo de áudio GPT-4o, suporta entrada e saída de áudio."
|
||||
"description": "Modelo GPT-4o Audio Preview, com suporte para entrada e saída de áudio."
|
||||
},
|
||||
"gpt-4o-mini": {
|
||||
"description": "O GPT-4o mini é o mais recente modelo lançado pela OpenAI após o GPT-4 Omni, suportando entrada de texto e imagem e gerando texto como saída. Como seu modelo compacto mais avançado, ele é muito mais acessível do que outros modelos de ponta recentes, custando mais de 60% menos que o GPT-3.5 Turbo. Ele mantém uma inteligência de ponta, ao mesmo tempo que oferece um custo-benefício significativo. O GPT-4o mini obteve uma pontuação de 82% no teste MMLU e atualmente está classificado acima do GPT-4 em preferências de chat."
|
||||
@@ -1667,24 +1673,33 @@
|
||||
"gpt-5-chat-latest": {
|
||||
"description": "Modelo GPT-5 usado no ChatGPT. Combina forte compreensão e geração de linguagem, ideal para aplicações de interação conversacional."
|
||||
},
|
||||
"gpt-5-codex": {
|
||||
"description": "GPT-5 Codex é uma versão do GPT-5 otimizada para tarefas de codificação de agentes em ambientes Codex ou similares."
|
||||
},
|
||||
"gpt-5-mini": {
|
||||
"description": "Versão mais rápida e econômica do GPT-5, adequada para tarefas bem definidas. Oferece respostas mais rápidas mantendo alta qualidade de saída."
|
||||
},
|
||||
"gpt-5-nano": {
|
||||
"description": "Versão mais rápida e econômica do GPT-5. Muito adequada para cenários que exigem respostas rápidas e sensibilidade a custos."
|
||||
},
|
||||
"gpt-audio": {
|
||||
"description": "GPT Audio é um modelo de chat universal voltado para entrada e saída de áudio, suportando uso de áudio I/O na API de Chat Completions."
|
||||
},
|
||||
"gpt-image-1": {
|
||||
"description": "Modelo nativo multimodal de geração de imagens do ChatGPT"
|
||||
},
|
||||
"gpt-oss": {
|
||||
"description": "GPT-OSS 20B é um modelo de linguagem grande de código aberto lançado pela OpenAI, que utiliza a tecnologia de quantização MXFP4, adequado para execução em GPUs de consumo avançado ou Macs com Apple Silicon. Este modelo apresenta excelente desempenho em geração de diálogos, escrita de código e tarefas de raciocínio, suportando chamadas de funções e uso de ferramentas."
|
||||
},
|
||||
"gpt-oss-120b": {
|
||||
"description": "GPT-OSS-120B MXFP4: estrutura Transformer quantificada, mantendo desempenho robusto mesmo em recursos limitados."
|
||||
},
|
||||
"gpt-oss:120b": {
|
||||
"description": "GPT-OSS 120B é um modelo de linguagem grande de código aberto lançado pela OpenAI, utilizando a tecnologia de quantização MXFP4, sendo um modelo de ponta. Requer múltiplas GPUs ou estações de trabalho de alto desempenho para execução, oferecendo desempenho excepcional em raciocínio complexo, geração de código e processamento multilíngue, com suporte a chamadas avançadas de funções e integração de ferramentas."
|
||||
},
|
||||
"gpt-oss:20b": {
|
||||
"description": "GPT-OSS 20B é um modelo de linguagem grande open source lançado pela OpenAI, utilizando quantização MXFP4, adequado para execução em GPUs de consumo avançado ou Macs com Apple Silicon. O modelo apresenta excelente desempenho em geração de diálogo, codificação e tarefas de inferência, suportando chamadas de função e uso de ferramentas."
|
||||
},
|
||||
"gpt-realtime": {
|
||||
"description": "Modelo universal em tempo real, suportando entrada e saída de texto e áudio, além de entrada de imagem."
|
||||
},
|
||||
"grok-2-1212": {
|
||||
"description": "Este modelo apresenta melhorias em precisão, conformidade com instruções e capacidade multilíngue."
|
||||
},
|
||||
@@ -1712,6 +1727,12 @@
|
||||
"grok-4-0709": {
|
||||
"description": "Grok 4 da xAI, com forte capacidade de raciocínio."
|
||||
},
|
||||
"grok-4-fast-non-reasoning": {
|
||||
"description": "Temos o prazer de lançar o Grok 4 Fast, nosso avanço mais recente em modelos de inferência com custo-benefício."
|
||||
},
|
||||
"grok-4-fast-reasoning": {
|
||||
"description": "Temos o prazer de lançar o Grok 4 Fast, nosso avanço mais recente em modelos de inferência com custo-benefício."
|
||||
},
|
||||
"grok-code-fast-1": {
|
||||
"description": "Temos o prazer de apresentar o grok-code-fast-1, um modelo de inferência rápido e econômico, que se destaca na codificação de agentes."
|
||||
},
|
||||
@@ -1847,8 +1868,14 @@
|
||||
"inception/mercury-coder-small": {
|
||||
"description": "Mercury Coder Small é a escolha ideal para tarefas de geração, depuração e refatoração de código, com latência mínima."
|
||||
},
|
||||
"inclusionAI/Ling-flash-2.0": {
|
||||
"description": "Ling-flash-2.0 é o terceiro modelo da série Ling 2.0, lançado pela equipe Bailing do Ant Group. É um modelo de especialistas mistos (MoE) com 100 bilhões de parâmetros totais, mas ativa apenas 6,1 bilhões por token (4,8 bilhões excluindo embeddings). Como uma configuração leve, Ling-flash-2.0 demonstra desempenho comparável ou superior a modelos densos de 40 bilhões e modelos MoE de maior escala em várias avaliações autoritativas. O modelo busca explorar caminhos eficientes sob o consenso de que “modelos grandes equivalem a muitos parâmetros” por meio de design arquitetônico e estratégias de treinamento extremas."
|
||||
},
|
||||
"inclusionAI/Ling-mini-2.0": {
|
||||
"description": "Ling-mini-2.0 é um modelo de linguagem grande de alto desempenho e pequeno porte baseado na arquitetura MoE. Ele possui 16 bilhões de parâmetros totais, mas ativa apenas 1,4 bilhão por token (789 milhões não-embedding), alcançando assim uma velocidade de geração extremamente alta. Graças ao design eficiente do MoE e a um grande volume de dados de treinamento de alta qualidade, apesar de ativar apenas 1,4 bilhão de parâmetros, o Ling-mini-2.0 ainda apresenta desempenho de ponta em tarefas downstream, comparável a modelos dense LLM abaixo de 10 bilhões e a modelos MoE de maior escala."
|
||||
"description": "Ling-mini-2.0 é um modelo de linguagem grande de alto desempenho e pequeno porte baseado na arquitetura MoE. Possui 16 bilhões de parâmetros totais, mas ativa apenas 1,4 bilhão por token (789 milhões excluindo embeddings), alcançando alta velocidade de geração. Graças ao design eficiente do MoE e a grandes volumes de dados de treinamento de alta qualidade, Ling-mini-2.0 apresenta desempenho de ponta em tarefas downstream, comparável a modelos densos abaixo de 10 bilhões e modelos MoE de maior escala."
|
||||
},
|
||||
"inclusionAI/Ring-flash-2.0": {
|
||||
"description": "Ring-flash-2.0 é um modelo de pensamento de alto desempenho profundamente otimizado a partir do Ling-flash-2.0-base. Utiliza arquitetura de especialistas mistos (MoE) com 100 bilhões de parâmetros totais, mas ativa apenas 6,1 bilhões por inferência. O modelo resolve a instabilidade do treinamento por reforço (RL) em grandes modelos MoE com o algoritmo inovador icepop, permitindo melhoria contínua do raciocínio complexo em treinamentos longos. Ring-flash-2.0 alcançou avanços significativos em competições matemáticas, geração de código e raciocínio lógico, superando modelos densos de até 40 bilhões de parâmetros e rivalizando com modelos MoE open source maiores e modelos de pensamento proprietários de alto desempenho. Embora focado em raciocínio complexo, também se destaca em tarefas criativas. Além disso, graças ao design eficiente, oferece alta velocidade de inferência e reduz significativamente o custo de implantação em cenários de alta concorrência."
|
||||
},
|
||||
"internlm/internlm2_5-7b-chat": {
|
||||
"description": "InternLM2.5 oferece soluções de diálogo inteligente em múltiplos cenários."
|
||||
@@ -1974,7 +2001,10 @@
|
||||
"description": "LLaVA é um modelo multimodal que combina um codificador visual e Vicuna, projetado para forte compreensão visual e linguística."
|
||||
},
|
||||
"magistral-medium-latest": {
|
||||
"description": "Magistral Medium 1.1 é um modelo de inferência de ponta lançado pela Mistral AI em julho de 2025."
|
||||
"description": "Magistral Medium 1.2 é um modelo de inferência de ponta com suporte visual, lançado pela Mistral AI em setembro de 2025."
|
||||
},
|
||||
"magistral-small-2509": {
|
||||
"description": "Magistral Small 1.2 é um modelo de inferência pequeno e open source com suporte visual, lançado pela Mistral AI em setembro de 2025."
|
||||
},
|
||||
"mathstral": {
|
||||
"description": "MathΣtral é projetado para pesquisa científica e raciocínio matemático, oferecendo capacidade de cálculo eficaz e interpretação de resultados."
|
||||
@@ -2282,9 +2312,6 @@
|
||||
"mistral/mistral-large": {
|
||||
"description": "Mistral Large é ideal para tarefas complexas que exigem grandes capacidades de raciocínio ou alta especialização — como geração de texto sintético, geração de código, RAG ou agentes."
|
||||
},
|
||||
"mistral/mistral-saba-24b": {
|
||||
"description": "Mistral Saba 24B é um modelo open source de 24 bilhões de parâmetros desenvolvido pela Mistral.ai. Saba é um modelo especializado treinado para desempenho excepcional em árabe, persa, urdu, hebraico e línguas indianas. Atendido pela Groq usando seu hardware personalizado de unidade de processamento de linguagem (LPU) para fornecer inferência rápida e eficiente."
|
||||
},
|
||||
"mistral/mistral-small": {
|
||||
"description": "Mistral Small é ideal para tarefas simples que podem ser processadas em lote — como classificação, suporte ao cliente ou geração de texto. Oferece excelente desempenho a um preço acessível."
|
||||
},
|
||||
@@ -2357,9 +2384,6 @@
|
||||
"moonshotai/Kimi-Dev-72B": {
|
||||
"description": "Kimi-Dev-72B é um modelo de código aberto de grande porte, otimizado por meio de aprendizado reforçado em larga escala, capaz de gerar patches robustos e prontos para produção. Este modelo alcançou uma nova pontuação máxima de 60,4% no SWE-bench Verified, estabelecendo um recorde entre modelos de código aberto em tarefas automatizadas de engenharia de software, como correção de defeitos e revisão de código."
|
||||
},
|
||||
"moonshotai/Kimi-K2-Instruct": {
|
||||
"description": "Kimi K2 é um modelo base com arquitetura MoE e capacidades avançadas de código e agente, com 1 trilhão de parâmetros totais e 32 bilhões ativados. Em testes de desempenho em raciocínio geral, programação, matemática e agentes, o modelo K2 supera outros modelos open source populares."
|
||||
},
|
||||
"moonshotai/Kimi-K2-Instruct-0905": {
|
||||
"description": "Kimi K2-Instruct-0905 é a versão mais recente e poderosa do Kimi K2. Trata-se de um modelo de linguagem de especialistas mistos (MoE) de ponta, com um total de 1 trilhão de parâmetros e 32 bilhões de parâmetros ativados. As principais características deste modelo incluem: inteligência aprimorada para codificação de agentes, demonstrando melhorias significativas em testes de referência públicos e em tarefas reais de codificação de agentes; experiência de codificação front-end melhorada, com avanços tanto na estética quanto na funcionalidade da programação front-end."
|
||||
},
|
||||
@@ -2570,6 +2594,9 @@
|
||||
"qwen-image": {
|
||||
"description": "Qwen-Image é um modelo de geração de imagens de uso geral que suporta diversos estilos artísticos. É especialmente eficaz na renderização de textos complexos, em particular na renderização de textos em chinês e inglês. O modelo oferece suporte a layouts de múltiplas linhas, geração de texto em nível de parágrafo e detalhamento de alta precisão, possibilitando a criação de designs complexos com layouts híbridos de imagem e texto."
|
||||
},
|
||||
"qwen-image-edit": {
|
||||
"description": "Qwen Image Edit é um modelo de geração de imagens que suporta edição e modificação de imagens com base em uma imagem de entrada e instruções de texto, capaz de ajustar e transformar a imagem original com precisão e criatividade conforme as necessidades do usuário."
|
||||
},
|
||||
"qwen-long": {
|
||||
"description": "O Qwen é um modelo de linguagem em larga escala que suporta contextos de texto longos e funcionalidades de diálogo baseadas em documentos longos e múltiplos cenários."
|
||||
},
|
||||
@@ -2804,8 +2831,11 @@
|
||||
"qwen3-coder-plus": {
|
||||
"description": "Modelo de código Tongyi Qianwen. A mais recente série de modelos Qwen3-Coder é baseada no Qwen3 para geração de código, com forte capacidade de agente de codificação, especializada em chamadas de ferramentas e interação com o ambiente, capaz de programação autônoma, combinando excelente habilidade de codificação com capacidades gerais."
|
||||
},
|
||||
"qwen3-max-preview": {
|
||||
"description": "Versão Preview do modelo Max da série Qwen 3, com melhorias significativas em relação à série 2.5 em capacidades gerais, compreensão de texto em chinês e inglês, conformidade com instruções complexas, tarefas subjetivas abertas, multilinguismo e chamadas de ferramentas; o modelo apresenta menos alucinações de conhecimento."
|
||||
"qwen3-coder:480b": {
|
||||
"description": "Modelo de contexto longo de alto desempenho da Alibaba, voltado para tarefas de agentes e codificação."
|
||||
},
|
||||
"qwen3-max": {
|
||||
"description": "A série Max do Tongyi Qianwen 3 apresenta melhorias significativas em relação à série 2.5 na capacidade geral, compreensão de texto em chinês e inglês, seguimento de instruções complexas, tarefas abertas subjetivas, multilinguismo e chamadas de ferramentas; o modelo apresenta menos alucinações de conhecimento. A versão mais recente do qwen3-max, em comparação com a prévia, recebeu atualizações específicas para programação de agentes e chamadas de ferramentas. O modelo oficial lançado atinge o estado da arte no domínio, adaptando-se a demandas mais complexas de agentes."
|
||||
},
|
||||
"qwen3-next-80b-a3b-instruct": {
|
||||
"description": "Modelo open source de nova geração no modo não reflexivo baseado no Qwen3, que apresenta melhor compreensão de texto em chinês, capacidades aprimoradas de raciocínio lógico e desempenho superior em tarefas de geração de texto em comparação com a versão anterior (Tongyi Qianwen 3-235B-A22B-Instruct-2507)."
|
||||
@@ -2813,6 +2843,9 @@
|
||||
"qwen3-next-80b-a3b-thinking": {
|
||||
"description": "Modelo open source de nova geração no modo reflexivo baseado no Qwen3, que oferece melhor conformidade com instruções e respostas mais concisas em resumos, em comparação com a versão anterior (Tongyi Qianwen 3-235B-A22B-Thinking-2507)."
|
||||
},
|
||||
"qwen3-vl-plus": {
|
||||
"description": "Tongyi Qianwen VL é um modelo gerador de texto com capacidade de compreensão visual (imagens), capaz não só de realizar OCR (reconhecimento de texto em imagens), mas também de resumir e inferir, como extrair atributos de fotos de produtos e resolver problemas a partir de imagens de exercícios."
|
||||
},
|
||||
"qwq": {
|
||||
"description": "QwQ é um modelo de pesquisa experimental, focado em melhorar a capacidade de raciocínio da IA."
|
||||
},
|
||||
|
||||
@@ -281,6 +281,7 @@
|
||||
"actionFiletip": "Загрузить файл",
|
||||
"actionTooltip": "Загрузить",
|
||||
"disabled": "Текущая модель не поддерживает визуальное распознавание и анализ файлов, пожалуйста, переключитесь на другую модель",
|
||||
"fileNotSupported": "В режиме браузера загрузка файлов не поддерживается, разрешена только загрузка изображений",
|
||||
"visionNotSupported": "Текущая модель не поддерживает визуальное распознавание, пожалуйста, переключитесь на другую модель для использования"
|
||||
},
|
||||
"preview": {
|
||||
@@ -289,6 +290,9 @@
|
||||
"pending": "Подготовка к загрузке...",
|
||||
"processing": "Обработка файла..."
|
||||
}
|
||||
},
|
||||
"validation": {
|
||||
"videoSizeExceeded": "Размер видеофайла не должен превышать 20 МБ, текущий размер файла: {{actualSize}}"
|
||||
}
|
||||
},
|
||||
"zenMode": "Режим концентрации"
|
||||
|
||||
@@ -114,6 +114,7 @@
|
||||
"reasoning": "Эта модель поддерживает глубокое мышление",
|
||||
"search": "Эта модель поддерживает поиск в интернете",
|
||||
"tokens": "Эта модель поддерживает до {{tokens}} токенов в одной сессии",
|
||||
"video": "Эта модель поддерживает распознавание видео",
|
||||
"vision": "Эта модель поддерживает распознавание изображений"
|
||||
},
|
||||
"removed": "Эта модель не находится в списке. Если вы ее отмените, она будет автоматически удалена"
|
||||
|
||||
+53
-20
@@ -287,9 +287,6 @@
|
||||
"Pro/deepseek-ai/DeepSeek-V3.1": {
|
||||
"description": "DeepSeek-V3.1 — гибридная большая языковая модель, выпущенная DeepSeek AI, которая включает множество важных улучшений по сравнению с предыдущими версиями. Главной инновацией модели является интеграция режимов «мышления» (Thinking Mode) и «без мышления» (Non-thinking Mode), которые пользователь может гибко переключать, изменяя шаблоны диалога для разных задач. Благодаря специализированной посттренировочной оптимизации V3.1 значительно улучшила производительность при вызове инструментов и выполнении задач агента, обеспечивая лучшую поддержку внешних поисковых инструментов и выполнение многошаговых сложных задач. Модель основана на DeepSeek-V3.1-Base и дообучена с использованием двухэтапного расширения длинных текстов, что значительно увеличило объем тренировочных данных и улучшило работу с длинными документами и большими объемами кода. Как открытая модель, DeepSeek-V3.1 демонстрирует сопоставимые с ведущими закрытыми моделями результаты в кодировании, математике и рассуждениях, а благодаря архитектуре с экспертами (MoE) сохраняет огромную емкость модели при эффективном снижении затрат на вывод."
|
||||
},
|
||||
"Pro/moonshotai/Kimi-K2-Instruct": {
|
||||
"description": "Kimi K2 — базовая модель на архитектуре MoE с выдающимися возможностями в кодировании и агентских задачах, общим числом параметров 1 триллион и 32 миллиардами активируемых параметров. В тестах на универсальное знание, программирование, математику и агентские задачи производительность модели K2 превосходит другие ведущие открытые модели."
|
||||
},
|
||||
"Pro/moonshotai/Kimi-K2-Instruct-0905": {
|
||||
"description": "Kimi K2-Instruct-0905 — это последняя и самая мощная версия Kimi K2. Это передовая языковая модель с архитектурой смешанных экспертов (MoE), обладающая общим числом параметров в 1 триллион и 32 миллиардами активных параметров. Основные характеристики модели включают: улучшенный интеллект кодирующих агентов, демонстрирующий значительный прирост производительности на открытых бенчмарках и в реальных задачах кодирования агентов; усовершенствованный опыт фронтенд-кодирования, с улучшениями как в эстетике, так и в практичности фронтенд-программирования."
|
||||
},
|
||||
@@ -380,6 +377,12 @@
|
||||
"Qwen/Qwen3-Coder-480B-A35B-Instruct": {
|
||||
"description": "Qwen3-Coder-480B-A35B-Instruct — модель для работы с кодом, выпущенная Alibaba, обладающая на сегодняшний день одними из самых выраженных агентных (agentic) возможностей. Это модель смешанных экспертов (Mixture-of-Experts, MoE) с суммарно 4800亿 параметров и 350亿 активных параметров (приблизительно 480 млрд и 35 млрд соответственно), обеспечивающая баланс между эффективностью и производительностью. Модель изначально поддерживает длину контекста 256K (≈260 000) токенов и может быть расширена до 1 000 000 токенов с помощью методов экстраполяции, таких как YaRN, что позволяет ей работать с крупными репозиториями кода и решать сложные программные задачи. Qwen3-Coder спроектирована для агентных рабочих процессов кодирования: она не только генерирует код, но и способна автономно взаимодействовать с инструментами и средами разработки для решения сложных задач. В ряде бенчмарков по кодированию и агентным задачам модель демонстрирует ведущие результаты среди открытых моделей, а её производительность сопоставима с такими передовыми решениями, как Claude Sonnet 4."
|
||||
},
|
||||
"Qwen/Qwen3-Next-80B-A3B-Instruct": {
|
||||
"description": "Qwen3-Next-80B-A3B-Instruct — это следующего поколения базовая модель, выпущенная командой Alibaba Tongyi Qianwen. Она основана на новой архитектуре Qwen3-Next и предназначена для достижения максимальной эффективности обучения и вывода. Модель использует инновационный гибридный механизм внимания (Gated DeltaNet и Gated Attention), высокоразреженную структуру смешанных экспертов (MoE) и множество оптимизаций стабильности обучения. Как разреженная модель с общим числом параметров 80 миллиардов, при выводе активируется всего около 3 миллиардов параметров, что значительно снижает вычислительные затраты. При обработке задач с длинным контекстом более 32K токенов пропускная способность вывода превышает модель Qwen3-32B более чем в 10 раз. Эта модель является версией с инструктивной донастройкой, предназначенной для универсальных задач и не поддерживает режим цепочки мышления (Thinking). По производительности она сопоставима с флагманской моделью Tongyi Qianwen Qwen3-235B в некоторых бенчмарках, особенно демонстрируя явные преимущества в задачах с очень длинным контекстом."
|
||||
},
|
||||
"Qwen/Qwen3-Next-80B-A3B-Thinking": {
|
||||
"description": "Qwen3-Next-80B-A3B-Thinking — это следующего поколения базовая модель, выпущенная командой Alibaba Tongyi Qianwen, специально разработанная для сложных задач рассуждения. Она основана на инновационной архитектуре Qwen3-Next, которая объединяет гибридный механизм внимания (Gated DeltaNet и Gated Attention) и высокоразреженную структуру смешанных экспертов (MoE), направленную на максимальную эффективность обучения и вывода. Как разреженная модель с общим числом параметров 80 миллиардов, при выводе активируется около 3 миллиардов параметров, что значительно снижает вычислительные затраты. При обработке задач с длинным контекстом более 32K токенов пропускная способность вывода превышает модель Qwen3-32B более чем в 10 раз. Эта версия «Thinking» оптимизирована для выполнения сложных многошаговых задач, таких как математические доказательства, синтез кода, логический анализ и планирование, и по умолчанию выводит процесс рассуждения в структурированной форме «цепочки мышления». По производительности она не только превосходит более дорогие модели, такие как Qwen3-32B-Thinking, но и опережает Gemini-2.5-Flash-Thinking в нескольких бенчмарках."
|
||||
},
|
||||
"Qwen2-72B-Instruct": {
|
||||
"description": "Qwen2 — это последняя серия моделей Qwen, поддерживающая контекст до 128k. По сравнению с текущими лучшими открытыми моделями, Qwen2-72B значительно превосходит ведущие модели по многим аспектам, включая понимание естественного языка, знания, код, математику и многоязычность."
|
||||
},
|
||||
@@ -809,9 +812,6 @@
|
||||
"codex-mini-latest": {
|
||||
"description": "codex-mini-latest — это доработанная версия o4-mini, специально предназначенная для Codex CLI. Для прямого использования через API мы рекомендуем начинать с gpt-4.1."
|
||||
},
|
||||
"cognitivecomputations/dolphin-mixtral-8x22b": {
|
||||
"description": "Dolphin Mixtral 8x22B — это модель, разработанная для соблюдения инструкций, диалогов и программирования."
|
||||
},
|
||||
"cogview-4": {
|
||||
"description": "CogView-4 — это первая в истории Zhipu открытая модель текст-в-изображение, поддерживающая генерацию китайских иероглифов. Она значительно улучшена в понимании семантики, качестве генерации изображений и способности создавать тексты на китайском и английском языках. Модель поддерживает двуязычный ввод любой длины и может генерировать изображения с любым разрешением в заданных пределах."
|
||||
},
|
||||
@@ -926,6 +926,9 @@
|
||||
"deepseek-ai/deepseek-r1": {
|
||||
"description": "Современная эффективная LLM, специализирующаяся на рассуждениях, математике и программировании."
|
||||
},
|
||||
"deepseek-ai/deepseek-v3.1": {
|
||||
"description": "DeepSeek V3.1: модель следующего поколения для вывода, улучшенная для сложных рассуждений и цепочек мышления, подходит для задач, требующих глубокого анализа."
|
||||
},
|
||||
"deepseek-ai/deepseek-vl2": {
|
||||
"description": "DeepSeek-VL2 — это модель визуального языка, разработанная на основе DeepSeekMoE-27B, использующая архитектуру MoE с разреженной активацией, которая демонстрирует выдающуюся производительность при активации всего 4,5 миллиарда параметров. Эта модель показывает отличные результаты в таких задачах, как визуальные вопросы и ответы, оптическое распознавание символов, понимание документов/таблиц/графиков и визуальная локализация."
|
||||
},
|
||||
@@ -1007,6 +1010,9 @@
|
||||
"deepseek-v3.1": {
|
||||
"description": "DeepSeek-V3.1 — новая гибридная модель рассуждений от DeepSeek, поддерживающая два режима рассуждений: с размышлением и без размышления, с более высокой эффективностью размышлений по сравнению с DeepSeek-R1-0528. После посттренировочной оптимизации значительно улучшена работа с инструментами агента и выполнение задач интеллектуального агента. Поддерживает контекстное окно до 128k и максимальную длину вывода до 64k токенов."
|
||||
},
|
||||
"deepseek-v3.1:671b": {
|
||||
"description": "DeepSeek V3.1: модель следующего поколения для вывода, улучшенная для сложных рассуждений и цепочек мышления, подходит для задач, требующих глубокого анализа."
|
||||
},
|
||||
"deepseek/deepseek-chat-v3-0324": {
|
||||
"description": "DeepSeek V3 — это экспертная смешанная модель с 685B параметрами, являющаяся последней итерацией флагманской серии чат-моделей команды DeepSeek.\n\nОна унаследовала модель [DeepSeek V3](/deepseek/deepseek-chat-v3) и демонстрирует отличные результаты в различных задачах."
|
||||
},
|
||||
@@ -1626,7 +1632,7 @@
|
||||
"description": "ChatGPT-4o — это динамическая модель, которая обновляется в реальном времени для поддержания актуальной версии. Она сочетает в себе мощное понимание языка и генерацию текста, подходя для широкого спектра приложений, включая обслуживание клиентов, образование и техническую поддержку."
|
||||
},
|
||||
"gpt-4o-audio-preview": {
|
||||
"description": "Модель GPT-4o Audio, поддерживающая аудиовход и аудиовыход."
|
||||
"description": "Модель GPT-4o Audio Preview с поддержкой аудиовхода и аудиовыхода."
|
||||
},
|
||||
"gpt-4o-mini": {
|
||||
"description": "GPT-4o mini — это последняя модель, выпущенная OpenAI после GPT-4 Omni, поддерживающая ввод изображений и текстов с выводом текста. Как их самый продвинутый компактный модель, она значительно дешевле других недавних передовых моделей и более чем на 60% дешевле GPT-3.5 Turbo. Она сохраняет передовой уровень интеллекта при значительном соотношении цена-качество. GPT-4o mini набрала 82% на тесте MMLU и в настоящее время занимает более высокое место в предпочтениях чата по сравнению с GPT-4."
|
||||
@@ -1667,24 +1673,33 @@
|
||||
"gpt-5-chat-latest": {
|
||||
"description": "Модель GPT-5, используемая в ChatGPT. Объединяет мощные возможности понимания и генерации языка, идеально подходит для диалоговых приложений."
|
||||
},
|
||||
"gpt-5-codex": {
|
||||
"description": "GPT-5 Codex — версия GPT-5, оптимизированная для задач агентского кодирования в средах Codex или аналогичных."
|
||||
},
|
||||
"gpt-5-mini": {
|
||||
"description": "Более быстрая и экономичная версия GPT-5, предназначенная для чётко определённых задач. Обеспечивает более быстрый отклик при сохранении высокого качества вывода."
|
||||
},
|
||||
"gpt-5-nano": {
|
||||
"description": "Самая быстрая и экономичная версия GPT-5. Отлично подходит для приложений, требующих быстрого отклика и чувствительных к затратам."
|
||||
},
|
||||
"gpt-audio": {
|
||||
"description": "GPT Audio — универсальная чат-модель с поддержкой аудиовхода и аудиовыхода, доступная через API Chat Completions с аудио I/O."
|
||||
},
|
||||
"gpt-image-1": {
|
||||
"description": "Родная мультимодальная модель генерации изображений ChatGPT."
|
||||
},
|
||||
"gpt-oss": {
|
||||
"description": "GPT-OSS 20B — это открытая большая языковая модель, выпущенная OpenAI, использующая технологию квантования MXFP4, подходящая для работы на высокопроизводительных потребительских GPU или Apple Silicon Mac. Эта модель демонстрирует отличные результаты в генерации диалогов, написании кода и задачах рассуждения, поддерживает вызовы функций и использование инструментов."
|
||||
},
|
||||
"gpt-oss-120b": {
|
||||
"description": "GPT-OSS-120B MXFP4: квантизированная структура Transformer, сохраняющая высокую производительность при ограниченных ресурсах."
|
||||
},
|
||||
"gpt-oss:120b": {
|
||||
"description": "GPT-OSS 120B — крупная открытая языковая модель от OpenAI, использующая технологию квантования MXFP4, предназначенная для флагманских решений. Требует многопроцессорной GPU или высокопроизводительной рабочей станции для работы, обладает выдающейся производительностью в сложных задачах рассуждения, генерации кода и многоязыковой обработке, поддерживает расширенные вызовы функций и интеграцию инструментов."
|
||||
},
|
||||
"gpt-oss:20b": {
|
||||
"description": "GPT-OSS 20B — это открытая большая языковая модель, выпущенная OpenAI, использующая технологию квантования MXFP4, подходящая для запуска на высокопроизводительных потребительских GPU или Apple Silicon Mac. Модель демонстрирует отличные результаты в генерации диалогов, написании кода и задачах рассуждения, поддерживает вызовы функций и использование инструментов."
|
||||
},
|
||||
"gpt-realtime": {
|
||||
"description": "Универсальная модель реального времени с поддержкой текстового и аудиовхода/выхода, а также поддержки ввода изображений."
|
||||
},
|
||||
"grok-2-1212": {
|
||||
"description": "Модель улучшена в точности, соблюдении инструкций и многоязычных возможностях."
|
||||
},
|
||||
@@ -1712,6 +1727,12 @@
|
||||
"grok-4-0709": {
|
||||
"description": "Grok 4 от xAI с мощными возможностями рассуждения."
|
||||
},
|
||||
"grok-4-fast-non-reasoning": {
|
||||
"description": "Мы рады представить Grok 4 Fast — наш последний прогресс в области экономически эффективных моделей для вывода."
|
||||
},
|
||||
"grok-4-fast-reasoning": {
|
||||
"description": "Мы рады представить Grok 4 Fast — наш последний прогресс в области экономически эффективных моделей для вывода."
|
||||
},
|
||||
"grok-code-fast-1": {
|
||||
"description": "Мы рады представить grok-code-fast-1 — быстрый и экономичный модель вывода, которая отлично справляется с кодированием агентов."
|
||||
},
|
||||
@@ -1847,8 +1868,14 @@
|
||||
"inception/mercury-coder-small": {
|
||||
"description": "Mercury Coder Small — идеальный выбор для задач генерации, отладки и рефакторинга кода с минимальной задержкой."
|
||||
},
|
||||
"inclusionAI/Ling-flash-2.0": {
|
||||
"description": "Ling-flash-2.0 — третья модель серии Ling 2.0, выпущенная командой Ant Group Bailing. Это модель смешанных экспертов (MoE) с общим числом параметров 100 миллиардов, при этом для каждого токена активируется всего 6.1 миллиарда параметров (без учета эмбеддингов — 4.8 миллиарда). Как легковесная конфигурация, Ling-flash-2.0 демонстрирует в нескольких авторитетных тестах производительность, сопоставимую или превосходящую модели плотного типа (Dense) с 40 миллиардами параметров и более крупные MoE-модели. Модель направлена на исследование эффективных путей при концепции «большая модель равна большому числу параметров» через продуманный дизайн архитектуры и стратегии обучения."
|
||||
},
|
||||
"inclusionAI/Ling-mini-2.0": {
|
||||
"description": "Ling-mini-2.0 — это компактная высокопроизводительная большая языковая модель на базе архитектуры MoE. Она содержит 16 миллиардов параметров, при этом для каждого токена активируется всего 1,4 миллиарда (не включая эмбеддинги — 789 миллионов), что обеспечивает чрезвычайно высокую скорость генерации. Благодаря эффективному дизайну MoE и масштабным высококачественным обучающим данным, несмотря на всего 1,4 миллиарда активных параметров, Ling-mini-2.0 демонстрирует в задачах нижнего уровня производительность, сопоставимую с плотными LLM размером до 10 миллиардов параметров и более крупными MoE-моделями."
|
||||
"description": "Ling-mini-2.0 — компактная высокопроизводительная большая языковая модель на базе архитектуры MoE. Она содержит 16 миллиардов параметров, при этом для каждого токена активируется всего 1.4 миллиарда параметров (без эмбеддингов — 789 миллионов), что обеспечивает очень высокую скорость генерации. Благодаря эффективному дизайну MoE и масштабным качественным тренировочным данным, несмотря на низкое число активируемых параметров, Ling-mini-2.0 демонстрирует в downstream-задачах производительность, сопоставимую с плотными LLM менее 10 миллиардов параметров и более крупными MoE-моделями."
|
||||
},
|
||||
"inclusionAI/Ring-flash-2.0": {
|
||||
"description": "Ring-flash-2.0 — высокопроизводительная модель для рассуждений, глубоко оптимизированная на базе Ling-flash-2.0-base. Она использует архитектуру смешанных экспертов (MoE) с общим числом параметров 100 миллиардов, при этом при каждом выводе активируется только 6.1 миллиарда параметров. Модель решает проблему нестабильности MoE-моделей при обучении с подкреплением (RL) с помощью уникального алгоритма icepop, что позволяет постоянно улучшать сложные способности рассуждения в долгосрочном обучении. Ring-flash-2.0 достигла значительных прорывов в сложных бенчмарках, таких как математические соревнования, генерация кода и логическое рассуждение. Ее производительность превосходит лучшие плотные модели с числом параметров менее 40 миллиардов и сопоставима с более крупными открытыми MoE-моделями и закрытыми высокопроизводительными моделями для рассуждений. Несмотря на фокус на сложных рассуждениях, модель также отлично справляется с творческим письмом. Благодаря эффективному дизайну архитектуры Ring-flash-2.0 обеспечивает высокую скорость вывода и значительно снижает затраты на развертывание моделей рассуждений в условиях высокой нагрузки."
|
||||
},
|
||||
"internlm/internlm2_5-7b-chat": {
|
||||
"description": "InternLM2.5 предлагает интеллектуальные решения для диалогов в различных сценариях."
|
||||
@@ -1974,7 +2001,10 @@
|
||||
"description": "LLaVA — это многомодальная модель, объединяющая визуальный кодировщик и Vicuna, предназначенная для мощного понимания визуальной и языковой информации."
|
||||
},
|
||||
"magistral-medium-latest": {
|
||||
"description": "Magistral Medium 1.1 — передовая модель для инференса, выпущенная Mistral AI в июле 2025 года."
|
||||
"description": "Magistral Medium 1.2 — это передовая модель вывода с поддержкой визуальных данных, выпущенная Mistral AI в сентябре 2025 года."
|
||||
},
|
||||
"magistral-small-2509": {
|
||||
"description": "Magistral Small 1.2 — это открытая компактная модель вывода с поддержкой визуальных данных, выпущенная Mistral AI в сентябре 2025 года."
|
||||
},
|
||||
"mathstral": {
|
||||
"description": "MathΣtral специально разработан для научных исследований и математического вывода, обеспечивая эффективные вычислительные возможности и интерпретацию результатов."
|
||||
@@ -2282,9 +2312,6 @@
|
||||
"mistral/mistral-large": {
|
||||
"description": "Mistral Large — идеальный выбор для сложных задач, требующих большой вычислительной мощности или высокой специализации, таких как синтез текста, генерация кода, RAG или агентные задачи."
|
||||
},
|
||||
"mistral/mistral-saba-24b": {
|
||||
"description": "Mistral Saba 24B — открытая модель с 24 миллиардами параметров, разработанная Mistral.ai. Saba — специализированная модель, обученная для выдающихся результатов на арабском, персидском, урду, иврите и индийских языках. Обслуживается на аппаратуре Groq с использованием их специализированных языковых процессорных блоков (LPU) для быстрой и эффективной работы."
|
||||
},
|
||||
"mistral/mistral-small": {
|
||||
"description": "Mistral Small — идеальный выбор для простых задач, которые можно выполнять пакетно, таких как классификация, поддержка клиентов или генерация текста. Обеспечивает отличную производительность по доступной цене."
|
||||
},
|
||||
@@ -2357,9 +2384,6 @@
|
||||
"moonshotai/Kimi-Dev-72B": {
|
||||
"description": "Kimi-Dev-72B — это крупная модель с открытым исходным кодом, оптимизированная с помощью масштабного обучения с подкреплением, способная выдавать надежные патчи, готовые к непосредственному внедрению. Эта модель достигла нового рекордного результата 60,4 % на SWE-bench Verified, обновив рекорды открытых моделей в автоматизированных задачах программной инженерии, таких как исправление ошибок и код-ревью."
|
||||
},
|
||||
"moonshotai/Kimi-K2-Instruct": {
|
||||
"description": "Kimi K2 — базовая модель на архитектуре MoE с выдающимися возможностями в кодировании и агентских задачах, с общим числом параметров 1 триллион и 32 миллиардами активируемых параметров. В тестах на универсальное знание, программирование, математику и агентские задачи производительность модели K2 превосходит другие ведущие открытые модели."
|
||||
},
|
||||
"moonshotai/Kimi-K2-Instruct-0905": {
|
||||
"description": "Kimi K2-Instruct-0905 — это последняя и самая мощная версия Kimi K2. Это передовая языковая модель с архитектурой смешанных экспертов (MoE), обладающая общим числом параметров в 1 триллион и 32 миллиардами активных параметров. Основные характеристики модели включают: улучшенный интеллект кодирующих агентов, демонстрирующий значительный прирост производительности на открытых бенчмарках и в реальных задачах кодирования агентов; усовершенствованный опыт фронтенд-кодирования, с улучшениями как в эстетике, так и в практичности фронтенд-программирования."
|
||||
},
|
||||
@@ -2570,6 +2594,9 @@
|
||||
"qwen-image": {
|
||||
"description": "Qwen-Image — это универсальная модель генерации изображений, поддерживающая различные художественные стили. Она особенно хорошо справляется с рендерингом сложного текста, в частности с отображением китайских и английских надписей. Модель поддерживает многострочную верстку, генерацию текста на уровне абзацев и тонкую проработку деталей, что позволяет создавать сложные комбинированные макеты с изображениями и текстом."
|
||||
},
|
||||
"qwen-image-edit": {
|
||||
"description": "Qwen Image Edit — это модель преобразования изображений, поддерживающая редактирование и изменение изображений на основе входного изображения и текстовых подсказок, способная точно настраивать и творчески преобразовывать исходное изображение в соответствии с требованиями пользователя."
|
||||
},
|
||||
"qwen-long": {
|
||||
"description": "Qwen — это сверхмасштабная языковая модель, поддерживающая длинный контекст текста и диалоговые функции на основе длинных документов и нескольких документов."
|
||||
},
|
||||
@@ -2804,8 +2831,11 @@
|
||||
"qwen3-coder-plus": {
|
||||
"description": "Модель кода Tongyi Qianwen. Последняя серия моделей Qwen3-Coder основана на Qwen3 и представляет собой модель генерации кода с мощными возможностями Coding Agent, отлично справляющуюся с вызовом инструментов и взаимодействием с окружением, способную к автономному программированию, обладающую выдающимися кодировочными и универсальными способностями."
|
||||
},
|
||||
"qwen3-max-preview": {
|
||||
"description": "Предварительная версия модели серии Qwen 3 Max, которая значительно превосходит серию 2.5 по универсальным возможностям, включая понимание текста на китайском и английском языках, выполнение сложных инструкций, способности к субъективным открытым задачам, многоязычность и вызов инструментов; модель демонстрирует меньше искажений знаний."
|
||||
"qwen3-coder:480b": {
|
||||
"description": "Высокопроизводительная модель с длинным контекстом от Alibaba, предназначенная для агентских и кодировочных задач."
|
||||
},
|
||||
"qwen3-max": {
|
||||
"description": "Серия моделей Tongyi Qianwen 3 Max значительно улучшена по сравнению с серией 2.5 в плане универсальных возможностей: значительно усилены способности понимания текста на китайском и английском языках, следования сложным инструкциям, выполнения субъективных открытых задач, многоязычность и вызов инструментов; уменьшено количество ошибок, связанных с галлюцинациями знаний. Последняя версия модели qwen3-max получила специальное обновление в области программирования агентов и вызова инструментов по сравнению с версией qwen3-max-preview. Выпущенная официальная версия достигла уровня SOTA в своей области и адаптирована под более сложные сценарии использования агентов."
|
||||
},
|
||||
"qwen3-next-80b-a3b-instruct": {
|
||||
"description": "Новая генерация открытой модели без режима мышления на базе Qwen3, которая по сравнению с предыдущей версией (通义千问3-235B-A22B-Instruct-2507) обладает улучшенными способностями понимания китайского текста, усиленными логическими рассуждениями и лучшими результатами в задачах генерации текста."
|
||||
@@ -2813,6 +2843,9 @@
|
||||
"qwen3-next-80b-a3b-thinking": {
|
||||
"description": "Новая генерация открытой модели с режимом мышления на базе Qwen3, которая по сравнению с предыдущей версией (通义千问3-235B-A22B-Thinking-2507) демонстрирует улучшенное следование инструкциям и более лаконичные ответы модели."
|
||||
},
|
||||
"qwen3-vl-plus": {
|
||||
"description": "Tongyi Qianwen VL — текстовая генеративная модель с возможностями визуального (изображенческого) понимания. Она не только способна выполнять OCR (распознавание текста на изображениях), но и проводить дальнейшее суммирование и рассуждение, например, извлекать атрибуты из фотографий товаров или решать задачи по изображениям учебных заданий."
|
||||
},
|
||||
"qwq": {
|
||||
"description": "QwQ — это экспериментальная исследовательская модель, сосредоточенная на повышении возможностей вывода ИИ."
|
||||
},
|
||||
|
||||
@@ -281,6 +281,7 @@
|
||||
"actionFiletip": "Dosya Yükle",
|
||||
"actionTooltip": "Yükle",
|
||||
"disabled": "Mevcut model görsel tanımayı ve dosya analizini desteklemiyor, lütfen modeli değiştirin ve tekrar deneyin",
|
||||
"fileNotSupported": "Tarayıcı modunda dosya yükleme desteklenmiyor, sadece resimler desteklenmektedir",
|
||||
"visionNotSupported": "Seçili model görsel tanımayı desteklemiyor, lütfen başka bir modele geçiş yaparak kullanın"
|
||||
},
|
||||
"preview": {
|
||||
@@ -289,6 +290,9 @@
|
||||
"pending": "Yüklemeye Hazırlanıyor...",
|
||||
"processing": "Dosya İşleniyor..."
|
||||
}
|
||||
},
|
||||
"validation": {
|
||||
"videoSizeExceeded": "Video dosyası boyutu 20MB'ı geçemez, mevcut dosya boyutu {{actualSize}}"
|
||||
}
|
||||
},
|
||||
"zenMode": "Odak Modu"
|
||||
|
||||
@@ -114,6 +114,7 @@
|
||||
"reasoning": "Bu model derin düşünmeyi destekler",
|
||||
"search": "Bu model çevrimiçi aramayı destekler",
|
||||
"tokens": "Bu model tek bir oturumda en fazla {{tokens}} Token destekler",
|
||||
"video": "Bu model video tanımayı destekler",
|
||||
"vision": "Bu model görüntü tanımıyı destekler"
|
||||
},
|
||||
"removed": "Bu model listeden çıkarıldı, seçiminizi kaldırırsanız otomatik olarak kaldırılacaktır"
|
||||
|
||||
+53
-20
@@ -287,9 +287,6 @@
|
||||
"Pro/deepseek-ai/DeepSeek-V3.1": {
|
||||
"description": "DeepSeek-V3.1, DeepSeek AI tarafından yayımlanan hibrit modlu büyük dil modelidir ve selef modellerine kıyasla birçok önemli yükseltme içermektedir. Modelin en büyük yeniliği, \"Düşünme Modu\" (Thinking Mode) ve \"Düşünmeme Modu\" (Non-thinking Mode) özelliklerini bir arada sunmasıdır; kullanıcılar sohbet şablonlarını ayarlayarak farklı görev ihtiyaçlarına esnek şekilde uyum sağlayabilirler. Özel post-training optimizasyonları sayesinde V3.1, araç çağrıları ve Agent görevlerinde performansını önemli ölçüde artırmış, dış arama araçlarını destekleme ve çok adımlı karmaşık görevleri yerine getirme kapasitesini geliştirmiştir. Model, DeepSeek-V3.1-Base üzerine post-training uygulanarak, iki aşamalı uzun metin genişletme yöntemiyle eğitim veri miktarını büyük ölçüde artırmış ve uzun belgeler ile uzun kod parçalarını işleme yeteneğini geliştirmiştir. Açık kaynaklı bir model olarak DeepSeek-V3.1, kodlama, matematik ve çıkarım gibi birçok kıyaslama testinde en iyi kapalı kaynak modellerle rekabet eden performans sergilemekte ve MoE (Mixture of Experts) mimarisi sayesinde büyük model kapasitesini korurken çıkarım maliyetlerini etkin şekilde düşürmektedir."
|
||||
},
|
||||
"Pro/moonshotai/Kimi-K2-Instruct": {
|
||||
"description": "Kimi K2, güçlü kodlama ve ajan yeteneklerine sahip MoE mimarili temel modeldir; toplam 1 trilyon parametre, 32 milyar aktif parametreye sahiptir. Genel bilgi çıkarımı, programlama, matematik ve ajan gibi ana kategorilerdeki kıyaslama testlerinde K2 modeli diğer önde gelen açık kaynak modelleri geride bırakır."
|
||||
},
|
||||
"Pro/moonshotai/Kimi-K2-Instruct-0905": {
|
||||
"description": "Kimi K2-Instruct-0905, Kimi K2'nin en yeni ve en güçlü versiyonudur. Bu, toplamda 1 trilyon parametreye ve 32 milyar aktif parametreye sahip, üst düzey bir Hibrit Uzman (MoE) dil modelidir. Modelin başlıca özellikleri şunlardır: geliştirilmiş ajan kodlama zekası, açık benchmark testlerinde ve gerçek dünya ajan kodlama görevlerinde belirgin performans artışı; ön uç kodlama deneyiminde iyileştirmeler, ön uç programlamada estetik ve işlevsellik açısından ilerlemeler."
|
||||
},
|
||||
@@ -380,6 +377,12 @@
|
||||
"Qwen/Qwen3-Coder-480B-A35B-Instruct": {
|
||||
"description": "Qwen3-Coder-480B-A35B-Instruct, Alibaba tarafından yayımlanan ve şimdiye kadar en gelişmiş ajan (Agentic) yeteneklerine sahip kod modelidir. Bu model, toplam 480 milyar parametre ve 35 milyar aktifleşen parametreye sahip bir Mixture-of-Experts (MoE, karışık uzman) modelidir ve verimlilik ile performans arasında bir denge sağlar. Model, yerel olarak 256K (yaklaşık 260.000) token bağlam uzunluğunu destekler ve YaRN gibi dışa genelleme yöntemleriyle 1.000.000 token seviyesine kadar genişletilebilerek büyük ölçekli kod tabanları ve karmaşık programlama görevleriyle başa çıkabilir. Qwen3-Coder, ajan tabanlı kodlama iş akışları için tasarlanmış olup yalnızca kod üretmez; aynı zamanda geliştirme araçları ve ortamlarla bağımsız şekilde etkileşime girerek karmaşık programlama problemlerini çözer. Birçok kodlama ve ajan görevindeki kıyaslama testlerinde bu model, açık kaynak modeller arasında en üst düzey performansı göstermiş ve performansı Claude Sonnet 4 gibi önde gelen modellerle kıyaslanabilir düzeydedir."
|
||||
},
|
||||
"Qwen/Qwen3-Next-80B-A3B-Instruct": {
|
||||
"description": "Qwen3-Next-80B-A3B-Instruct, Alibaba Tongyi Qianwen ekibi tarafından yayınlanan yeni nesil temel modeldir. Tamamen yeni Qwen3-Next mimarisi üzerine kurulmuş olup, en üst düzey eğitim ve çıkarım verimliliğini hedeflemektedir. Model, yenilikçi hibrit dikkat mekanizması (Gated DeltaNet ve Gated Attention), yüksek seyrekli hibrit uzman (MoE) yapısı ve çeşitli eğitim stabilitesi optimizasyonları kullanmaktadır. 80 milyar toplam parametreye sahip seyrek bir model olarak, çıkarım sırasında yalnızca yaklaşık 3 milyar parametreyi aktive ederek hesaplama maliyetlerini önemli ölçüde düşürür ve 32K token’dan uzun bağlam görevlerinde çıkarım verimliliği Qwen3-32B modeline kıyasla 10 kat daha fazladır. Bu model, genel görevler için tasarlanmış talimat ince ayarlı bir versiyondur ve Düşünme (Thinking) modunu desteklemez. Performans açısından, Tongyi Qianwen’in amiral gemisi modeli Qwen3-235B ile bazı kıyaslama testlerinde eşdeğer performans sergiler ve özellikle uzun bağlam görevlerinde belirgin avantajlar gösterir."
|
||||
},
|
||||
"Qwen/Qwen3-Next-80B-A3B-Thinking": {
|
||||
"description": "Qwen3-Next-80B-A3B-Thinking, Alibaba Tongyi Qianwen ekibi tarafından karmaşık çıkarım görevleri için tasarlanmış yeni nesil temel modeldir. Yenilikçi Qwen3-Next mimarisi üzerine kurulmuş olup, hibrit dikkat mekanizması (Gated DeltaNet ve Gated Attention) ve yüksek seyrekli hibrit uzman (MoE) yapısını birleştirerek en üst düzey eğitim ve çıkarım verimliliğini hedefler. 80 milyar toplam parametreye sahip seyrek bir model olarak, çıkarım sırasında yalnızca yaklaşık 3 milyar parametreyi aktive ederek hesaplama maliyetlerini önemli ölçüde düşürür ve 32K token’dan uzun bağlam görevlerinde çıkarım verimliliği Qwen3-32B modeline kıyasla 10 kat daha fazladır. Bu “Thinking” versiyonu, matematiksel ispatlar, kod sentezi, mantıksal analiz ve planlama gibi zorlu çok adımlı görevler için optimize edilmiştir ve çıkarım sürecini varsayılan olarak yapılandırılmış “düşünce zinciri” biçiminde sunar. Performans açısından, yalnızca daha maliyetli modeller olan Qwen3-32B-Thinking’i değil, aynı zamanda Gemini-2.5-Flash-Thinking’i de birçok kıyaslama testinde geride bırakır."
|
||||
},
|
||||
"Qwen2-72B-Instruct": {
|
||||
"description": "Qwen2, Qwen modelinin en yeni serisidir ve 128k bağlamı destekler. Mevcut en iyi açık kaynak modellerle karşılaştırıldığında, Qwen2-72B doğal dil anlama, bilgi, kod, matematik ve çok dilli yetenekler açısından mevcut lider modelleri önemli ölçüde aşmaktadır."
|
||||
},
|
||||
@@ -809,9 +812,6 @@
|
||||
"codex-mini-latest": {
|
||||
"description": "codex-mini-latest, Codex CLI için özel olarak ince ayarlanmış o4-mini versiyonudur. API üzerinden doğrudan kullanım için, gpt-4.1'den başlamanızı öneririz."
|
||||
},
|
||||
"cognitivecomputations/dolphin-mixtral-8x22b": {
|
||||
"description": "Dolphin Mixtral 8x22B, talimat takibi, diyalog ve programlama için tasarlanmış bir modeldir."
|
||||
},
|
||||
"cogview-4": {
|
||||
"description": "CogView-4, Zhipu'nun Çince karakter üretimini destekleyen ilk açık kaynaklı metinden görsele modelidir. Anlam anlayışı, görüntü üretim kalitesi ve Çince-İngilizce metin üretme yeteneklerinde kapsamlı iyileştirmeler sunar. Her uzunlukta Çince ve İngilizce çift dilli girişi destekler ve verilen aralıkta herhangi bir çözünürlükte görüntü oluşturabilir."
|
||||
},
|
||||
@@ -926,6 +926,9 @@
|
||||
"deepseek-ai/deepseek-r1": {
|
||||
"description": "En son teknolojiye sahip verimli LLM, akıl yürütme, matematik ve programlama konularında uzmandır."
|
||||
},
|
||||
"deepseek-ai/deepseek-v3.1": {
|
||||
"description": "DeepSeek V3.1: Karmaşık çıkarım ve bağlantılı düşünme yeteneklerini geliştiren yeni nesil çıkarım modeli, derinlemesine analiz gerektiren görevler için uygundur."
|
||||
},
|
||||
"deepseek-ai/deepseek-vl2": {
|
||||
"description": "DeepSeek-VL2, DeepSeekMoE-27B tabanlı bir karma uzman (MoE) görsel dil modelidir. Seyrek etkinleştirilen MoE mimarisini kullanarak yalnızca 4.5B parametreyi etkinleştirerek olağanüstü performans sergilemektedir. Bu model, görsel soru yanıtlama, optik karakter tanıma, belge/tablolar/grafikler anlama ve görsel konumlandırma gibi birçok görevde mükemmel sonuçlar elde etmektedir."
|
||||
},
|
||||
@@ -1007,6 +1010,9 @@
|
||||
"deepseek-v3.1": {
|
||||
"description": "DeepSeek-V3.1, DeepSeek'in tamamen yeni hibrit çıkarım modeli olup, düşünme ve düşünmeme olmak üzere iki çıkarım modunu destekler ve DeepSeek-R1-0528'e kıyasla düşünme verimliliği daha yüksektir. Post-Training optimizasyonu sayesinde, Agent araç kullanımı ve akıllı görev performansı önemli ölçüde artırılmıştır. 128k bağlam penceresini destekler ve çıktı uzunluğu maksimum 64k token'a kadar çıkabilir."
|
||||
},
|
||||
"deepseek-v3.1:671b": {
|
||||
"description": "DeepSeek V3.1: Karmaşık çıkarım ve bağlantılı düşünme yeteneklerini geliştiren yeni nesil çıkarım modeli, derinlemesine analiz gerektiren görevler için uygundur."
|
||||
},
|
||||
"deepseek/deepseek-chat-v3-0324": {
|
||||
"description": "DeepSeek V3, 685B parametreye sahip bir uzman karışık modeldir ve DeepSeek ekibinin amiral gemisi sohbet modeli serisinin en son iterasyonudur.\n\nÇeşitli görevlerde mükemmel performans sergileyen [DeepSeek V3](/deepseek/deepseek-chat-v3) modelini devralmıştır."
|
||||
},
|
||||
@@ -1626,7 +1632,7 @@
|
||||
"description": "ChatGPT-4o, güncel en son sürümü korumak için gerçek zamanlı olarak güncellenen dinamik bir modeldir. Müşteri hizmetleri, eğitim ve teknik destek gibi büyük ölçekli uygulama senaryoları için güçlü dil anlama ve üretme yeteneklerini bir araya getirir."
|
||||
},
|
||||
"gpt-4o-audio-preview": {
|
||||
"description": "GPT-4o Ses modeli, sesli giriş ve çıkış desteği sunar."
|
||||
"description": "Ses giriş ve çıkışını destekleyen GPT-4o Ses Önizleme modeli"
|
||||
},
|
||||
"gpt-4o-mini": {
|
||||
"description": "GPT-4o mini, OpenAI'nin GPT-4 Omni'den sonra tanıttığı en yeni modeldir. Görsel ve metin girişi destekler ve metin çıktısı verir. En gelişmiş küçük model olarak, diğer son zamanlardaki öncü modellere göre çok daha ucuzdur ve GPT-3.5 Turbo'dan %60'tan fazla daha ucuzdur. En son teknolojiyi korurken, önemli bir maliyet etkinliği sunar. GPT-4o mini, MMLU testinde %82 puan almış olup, şu anda sohbet tercihleri açısından GPT-4'ün üzerinde yer almaktadır."
|
||||
@@ -1667,24 +1673,33 @@
|
||||
"gpt-5-chat-latest": {
|
||||
"description": "ChatGPT'de kullanılan GPT-5 modeli. Güçlü dil anlama ve üretme yeteneklerini birleştirerek diyalog tabanlı etkileşim uygulamaları için uygundur."
|
||||
},
|
||||
"gpt-5-codex": {
|
||||
"description": "GPT-5 Codex, Codex veya benzeri ortamlardaki ajan kodlama görevleri için optimize edilmiş GPT-5 versiyonudur."
|
||||
},
|
||||
"gpt-5-mini": {
|
||||
"description": "Daha hızlı ve ekonomik GPT-5 versiyonu, belirgin tanımlı görevler için uygundur. Yüksek kaliteli çıktıyı korurken daha hızlı yanıt sağlar."
|
||||
},
|
||||
"gpt-5-nano": {
|
||||
"description": "En hızlı ve en ekonomik GPT-5 versiyonu. Hızlı yanıt gerektiren ve maliyet duyarlı uygulamalar için idealdir."
|
||||
},
|
||||
"gpt-audio": {
|
||||
"description": "GPT Audio, ses giriş ve çıkışına yönelik genel sohbet modelidir ve Chat Completions API’de ses I/O kullanımını destekler."
|
||||
},
|
||||
"gpt-image-1": {
|
||||
"description": "ChatGPT'nin yerel çok modlu görüntü oluşturma modeli"
|
||||
},
|
||||
"gpt-oss": {
|
||||
"description": "GPT-OSS 20B, OpenAI tarafından yayımlanan açık kaynaklı büyük dil modelidir ve MXFP4 kuantizasyon teknolojisini kullanır. Yüksek performanslı tüketici sınıfı GPU'lar veya Apple Silicon Mac üzerinde çalışmaya uygundur. Bu model, diyalog üretimi, kod yazımı ve çıkarım görevlerinde üstün performans sergiler ve fonksiyon çağrıları ile araç kullanımını destekler."
|
||||
},
|
||||
"gpt-oss-120b": {
|
||||
"description": "GPT-OSS-120B MXFP4 kuantize edilmiş Transformer yapısı, sınırlı kaynaklarda bile güçlü performans sağlar."
|
||||
},
|
||||
"gpt-oss:120b": {
|
||||
"description": "GPT-OSS 120B, OpenAI tarafından yayımlanan büyük ölçekli açık kaynak dil modelidir ve MXFP4 kuantizasyon teknolojisini kullanır. Amiral gemisi model olarak çoklu GPU veya yüksek performanslı iş istasyonu ortamlarında çalıştırılması gerekmektedir. Karmaşık çıkarım, kod üretimi ve çok dilli işleme konularında üstün performans sunar ve gelişmiş fonksiyon çağrıları ile araç entegrasyonunu destekler."
|
||||
},
|
||||
"gpt-oss:20b": {
|
||||
"description": "GPT-OSS 20B, OpenAI tarafından yayınlanan açık kaynaklı büyük dil modelidir. MXFP4 kuantizasyon teknolojisi kullanır ve üst düzey tüketici sınıfı GPU’lar veya Apple Silicon Mac üzerinde çalışmaya uygundur. Model, diyalog üretimi, kod yazımı ve çıkarım görevlerinde üstün performans sergiler, fonksiyon çağrısı ve araç kullanımını destekler."
|
||||
},
|
||||
"gpt-realtime": {
|
||||
"description": "Metin ve sesin gerçek zamanlı giriş ve çıkışını destekleyen genel amaçlı gerçek zamanlı model, ayrıca görüntü girişini de destekler."
|
||||
},
|
||||
"grok-2-1212": {
|
||||
"description": "Bu model, doğruluk, talimat takibi ve çok dilli yetenekler açısından geliştirilmiştir."
|
||||
},
|
||||
@@ -1712,6 +1727,12 @@
|
||||
"grok-4-0709": {
|
||||
"description": "xAI'nin Grok 4 modeli, güçlü akıl yürütme yeteneklerine sahiptir."
|
||||
},
|
||||
"grok-4-fast-non-reasoning": {
|
||||
"description": "Maliyet-etkin çıkarım modellerinde en son gelişmemiz olan Grok 4 Fast’i sunmaktan mutluluk duyuyoruz."
|
||||
},
|
||||
"grok-4-fast-reasoning": {
|
||||
"description": "Maliyet-etkin çıkarım modellerinde en son gelişmemiz olan Grok 4 Fast’i sunmaktan mutluluk duyuyoruz."
|
||||
},
|
||||
"grok-code-fast-1": {
|
||||
"description": "Hızlı ve ekonomik bir çıkarım modeli olan grok-code-fast-1'i sunmaktan mutluluk duyuyoruz; ajan kodlamasında mükemmel performans sergiler."
|
||||
},
|
||||
@@ -1847,8 +1868,14 @@
|
||||
"inception/mercury-coder-small": {
|
||||
"description": "Mercury Coder Small, kod üretimi, hata ayıklama ve yeniden yapılandırma görevleri için ideal olup, minimum gecikme sunar."
|
||||
},
|
||||
"inclusionAI/Ling-flash-2.0": {
|
||||
"description": "Ling-flash-2.0, Ant Group Bailing ekibi tarafından yayınlanan Ling 2.0 mimari serisinin üçüncü modelidir. Bu, hibrit uzman (MoE) modeli olup toplam parametre sayısı 100 milyara ulaşırken, her token için yalnızca 6.1 milyar parametre aktive eder (embedding dışı 4.8 milyar). Hafif yapılandırmaya sahip bu model, birçok otoriter değerlendirmede 40 milyar seviyesindeki yoğun (Dense) modeller ve daha büyük ölçekli MoE modelleriyle rekabet eden hatta onları aşan performans sergiler. Model, \"büyük model büyük parametre demektir\" anlayışı altında yüksek verimlilik yollarını keşfetmek için üstün mimari tasarım ve eğitim stratejileriyle geliştirilmiştir."
|
||||
},
|
||||
"inclusionAI/Ling-mini-2.0": {
|
||||
"description": "Ling-mini-2.0, MoE mimarisi temelinde geliştirilmiş, küçük boyutlu yüksek performanslı büyük bir dil modelidir. Toplamda 16 milyar parametreye sahiptir, ancak her token için yalnızca 1.4 milyar (embedding dışı 789M) aktif hale gelir, bu da son derece yüksek üretim hızını mümkün kılar. Verimli MoE tasarımı ve büyük ölçekli yüksek kaliteli eğitim verileri sayesinde, aktif parametre sayısı sadece 1.4 milyar olmasına rağmen, Ling-mini-2.0, alt görevlerde 10 milyar altı yoğun LLM'ler ve daha büyük ölçekli MoE modelleriyle rekabet edebilecek üst düzey performans sergiler."
|
||||
"description": "Ling-mini-2.0, MoE mimarisi temelinde küçük boyutlu yüksek performanslı büyük dil modelidir. Toplam 16 milyar parametreye sahip olup, her token için yalnızca 1.4 milyar parametre aktive eder (embedding dışı 789 milyon), böylece çok yüksek üretim hızı sağlar. Verimli MoE tasarımı ve büyük ölçekli yüksek kaliteli eğitim verileri sayesinde, aktive edilen parametre sayısı sadece 1.4 milyar olmasına rağmen, Ling-mini-2.0 altındaki 10 milyar yoğun LLM ve daha büyük ölçekli MoE modelleriyle kıyaslanabilir üst düzey performans gösterir."
|
||||
},
|
||||
"inclusionAI/Ring-flash-2.0": {
|
||||
"description": "Ring-flash-2.0, Ling-flash-2.0-base üzerine derinlemesine optimize edilmiş yüksek performanslı düşünme modelidir. Hibrit uzman (MoE) mimarisi kullanır, toplam parametre sayısı 100 milyardır ancak her çıkarımda yalnızca 6.1 milyar parametre aktive edilir. Model, özgün icepop algoritması ile MoE büyük modellerin pekiştirmeli öğrenme (RL) eğitimindeki kararsızlık sorununu çözerek karmaşık çıkarım yeteneğini uzun dönemli eğitimlerde sürekli artırır. Ring-flash-2.0, matematik yarışmaları, kod üretimi ve mantıksal çıkarım gibi zorlu kıyaslama testlerinde önemli atılımlar yapmış, performansı 40 milyar parametre altındaki en iyi yoğun modelleri aşmakla kalmayıp, daha büyük ölçekli açık kaynak MoE modelleri ve kapalı kaynak yüksek performanslı düşünme modelleriyle rekabet edebilir. Model karmaşık çıkarıma odaklanmasına rağmen yaratıcı yazma gibi görevlerde de başarılıdır. Ayrıca, yüksek verimli mimari tasarımı sayesinde güçlü performans sunarken yüksek hızda çıkarım yapar ve yüksek eşzamanlılık senaryolarında düşünme modeli dağıtım maliyetlerini önemli ölçüde azaltır."
|
||||
},
|
||||
"internlm/internlm2_5-7b-chat": {
|
||||
"description": "InternLM2.5, çoklu senaryolarda akıllı diyalog çözümleri sunar."
|
||||
@@ -1974,7 +2001,10 @@
|
||||
"description": "LLaVA, görsel kodlayıcı ve Vicuna'yı birleştiren çok modlu bir modeldir, güçlü görsel ve dil anlama yetenekleri sunar."
|
||||
},
|
||||
"magistral-medium-latest": {
|
||||
"description": "Magistral Medium 1.1, Mistral AI tarafından Temmuz 2025'te yayımlanan ileri düzey bir çıkarım modelidir."
|
||||
"description": "Magistral Medium 1.2, Mistral AI tarafından Eylül 2025'te yayınlanan, görsel destekli ileri seviye bir çıkarım modelidir."
|
||||
},
|
||||
"magistral-small-2509": {
|
||||
"description": "Magistral Small 1.2, Mistral AI tarafından Eylül 2025'te yayınlanan, görsel destekli açık kaynaklı küçük ölçekli bir çıkarım modelidir."
|
||||
},
|
||||
"mathstral": {
|
||||
"description": "MathΣtral, bilimsel araştırma ve matematik akıl yürütme için tasarlanmış, etkili hesaplama yetenekleri ve sonuç açıklamaları sunar."
|
||||
@@ -2282,9 +2312,6 @@
|
||||
"mistral/mistral-large": {
|
||||
"description": "Mistral Large, büyük çıkarım yetenekleri veya yüksek uzmanlık gerektiren karmaşık görevler için ideal seçimdir—örneğin sentez metin üretimi, kod üretimi, RAG veya ajanlık."
|
||||
},
|
||||
"mistral/mistral-saba-24b": {
|
||||
"description": "Mistral Saba 24B, Mistral.ai tarafından geliştirilen 24 milyar parametreli açık kaynak modelidir. Saba, Arapça, Farsça, Urduca, İbranice ve Hint dillerinde üstün performans göstermek üzere özel olarak eğitilmiş bir modeldir. Groq tarafından özel Dil İşleme Birimi (LPU) donanımı ile hizmet verilir ve hızlı, verimli çıkarım sağlar."
|
||||
},
|
||||
"mistral/mistral-small": {
|
||||
"description": "Mistral Small, sınıflandırma, müşteri desteği veya metin üretimi gibi toplu yapılabilen basit görevler için ideal seçimdir. Uygun fiyat noktasında mükemmel performans sunar."
|
||||
},
|
||||
@@ -2357,9 +2384,6 @@
|
||||
"moonshotai/Kimi-Dev-72B": {
|
||||
"description": "Kimi-Dev-72B, büyük ölçekli pekiştirmeli öğrenme ile optimize edilmiş açık kaynaklı bir kod modeli olup, sağlam ve doğrudan üretime uygun yamalar üretebilir. Bu model, SWE-bench Verified üzerinde %60,4 ile yeni bir rekor kırarak, açık kaynak modeller arasında hata düzeltme, kod incelemesi gibi otomatik yazılım mühendisliği görevlerinde en yüksek puanı elde etmiştir."
|
||||
},
|
||||
"moonshotai/Kimi-K2-Instruct": {
|
||||
"description": "Kimi K2, güçlü kodlama ve ajan yeteneklerine sahip MoE mimarili temel modeldir; toplam 1 trilyon parametre, 32 milyar aktif parametreye sahiptir. Genel bilgi çıkarımı, programlama, matematik ve ajan gibi ana kategorilerdeki kıyaslama testlerinde K2 modeli diğer önde gelen açık kaynak modelleri geride bırakır."
|
||||
},
|
||||
"moonshotai/Kimi-K2-Instruct-0905": {
|
||||
"description": "Kimi K2-Instruct-0905, Kimi K2'nin en yeni ve en güçlü versiyonudur. Bu, toplamda 1 trilyon parametreye ve 32 milyar aktif parametreye sahip, üst düzey bir Hibrit Uzman (MoE) dil modelidir. Modelin başlıca özellikleri şunlardır: geliştirilmiş ajan kodlama zekası, açık benchmark testlerinde ve gerçek dünya ajan kodlama görevlerinde belirgin performans artışı; ön uç kodlama deneyiminde iyileştirmeler, ön uç programlamada estetik ve işlevsellik açısından ilerlemeler."
|
||||
},
|
||||
@@ -2570,6 +2594,9 @@
|
||||
"qwen-image": {
|
||||
"description": "Qwen-Image, çeşitli sanat stillerini destekleyen genel amaçlı bir görsel oluşturma modelidir; karmaşık metin renderleme konusunda, özellikle Çince ve İngilizce metinlerin renderlenmesinde uzmandır. Model çok satırlı düzenleri, paragraf düzeyinde metin üretimini ve ince ayrıntıların işlenmesini destekler; karmaşık görsel-metin karışık düzen tasarımlarının oluşturulmasına olanak tanır."
|
||||
},
|
||||
"qwen-image-edit": {
|
||||
"description": "Qwen Image Edit, girdiğiniz görüntü ve metin ipuçlarına dayanarak görüntü düzenleme ve değiştirme yapabilen bir görüntüden görüntüye modelidir. Kullanıcı ihtiyaçlarına göre orijinal görüntüyü hassas bir şekilde ayarlayabilir ve yaratıcı dönüşümler gerçekleştirebilir."
|
||||
},
|
||||
"qwen-long": {
|
||||
"description": "Tongyi Qianwen, uzun metin bağlamını destekleyen ve uzun belgeler, çoklu belgeler gibi çeşitli senaryolar için diyalog işlevselliği sunan büyük ölçekli bir dil modelidir."
|
||||
},
|
||||
@@ -2804,8 +2831,11 @@
|
||||
"qwen3-coder-plus": {
|
||||
"description": "Tongyi Qianwen kod modeli. En yeni Qwen3-Coder serisi modeller, Qwen3 tabanlı kod üretim modelleridir, güçlü Kodlama Ajanı yeteneklerine sahiptir, araç çağrıları ve ortam etkileşiminde uzmandır, bağımsız programlama yapabilir, üstün kodlama yeteneklerinin yanı sıra genel yeteneklere de sahiptir."
|
||||
},
|
||||
"qwen3-max-preview": {
|
||||
"description": "Tongyi Qianwen 3 serisi Max modelinin önizleme sürümüdür. 2.5 serisine kıyasla genel yeteneklerde büyük gelişmeler göstermiştir; Çince ve İngilizce genel metin anlama, karmaşık talimat uyumu, öznel açık görevler, çok dilli yetenekler ve araç çağrısı yetenekleri belirgin şekilde artmıştır; model bilgi yanılgıları daha azdır."
|
||||
"qwen3-coder:480b": {
|
||||
"description": "Alibaba tarafından ajan ve kodlama görevleri için optimize edilmiş yüksek performanslı uzun bağlam modelidir."
|
||||
},
|
||||
"qwen3-max": {
|
||||
"description": "Tongyi Qianwen 3 serisi Max modeli, 2.5 serisine kıyasla genel yeteneklerde büyük gelişme göstermiştir; hem Çince hem İngilizce metin anlama, karmaşık talimat takibi, öznel açık görevler, çoklu dil yetenekleri ve araç çağrısı yetenekleri belirgin şekilde artmıştır; model bilgi halüsinasyonları azalmıştır. En yeni qwen3-max modeli, qwen3-max-preview versiyonuna göre akıllı ajan programlama ve araç çağrısı alanlarında özel yükseltmeler içermektedir. Bu resmi sürüm modeli, alanında SOTA seviyesine ulaşmış olup, daha karmaşık ajan ihtiyaçlarına uyarlanmıştır."
|
||||
},
|
||||
"qwen3-next-80b-a3b-instruct": {
|
||||
"description": "Qwen3 tabanlı yeni nesil düşünmeden çalışan açık kaynak modeli, önceki sürüme (Tongyi Qianwen 3-235B-A22B-Instruct-2507) kıyasla Çince metin anlama yeteneği daha iyi, mantıksal çıkarım yeteneği geliştirilmiş ve metin üretimi görevlerinde daha başarılıdır."
|
||||
@@ -2813,6 +2843,9 @@
|
||||
"qwen3-next-80b-a3b-thinking": {
|
||||
"description": "Qwen3 tabanlı yeni nesil düşünme modlu açık kaynak modeli, önceki sürüme (Tongyi Qianwen 3-235B-A22B-Thinking-2507) kıyasla komutlara uyum yeteneği artırılmış ve modelin özetleyici yanıtları daha özlü hale getirilmiştir."
|
||||
},
|
||||
"qwen3-vl-plus": {
|
||||
"description": "Tongyi Qianwen VL, görsel (resim) anlama yeteneğine sahip metin üretim modelidir. Sadece OCR (resim metni tanıma) yapmakla kalmaz, aynı zamanda ürün fotoğraflarından özellik çıkarma, alıştırma resimlerinden problem çözme gibi özetleme ve çıkarım yapabilir."
|
||||
},
|
||||
"qwq": {
|
||||
"description": "QwQ, AI akıl yürütme yeteneklerini artırmaya odaklanan deneysel bir araştırma modelidir."
|
||||
},
|
||||
|
||||
@@ -281,6 +281,7 @@
|
||||
"actionFiletip": "Tải lên tệp",
|
||||
"actionTooltip": "Tải lên",
|
||||
"disabled": "Mô hình hiện tại không hỗ trợ nhận diện hình ảnh và phân tích tệp, vui lòng chuyển đổi mô hình để sử dụng",
|
||||
"fileNotSupported": "Chế độ trình duyệt hiện không hỗ trợ tải lên tệp, chỉ hỗ trợ hình ảnh",
|
||||
"visionNotSupported": "Mô hình hiện tại không hỗ trợ nhận dạng hình ảnh, vui lòng chuyển sang mô hình khác để sử dụng"
|
||||
},
|
||||
"preview": {
|
||||
@@ -289,6 +290,9 @@
|
||||
"pending": "Đang chuẩn bị tải lên...",
|
||||
"processing": "Đang xử lý tệp..."
|
||||
}
|
||||
},
|
||||
"validation": {
|
||||
"videoSizeExceeded": "Kích thước tệp video không được vượt quá 20MB, kích thước tệp hiện tại là {{actualSize}}"
|
||||
}
|
||||
},
|
||||
"zenMode": "Chế độ tập trung"
|
||||
|
||||
@@ -114,6 +114,7 @@
|
||||
"reasoning": "Mô hình này hỗ trợ tư duy sâu sắc",
|
||||
"search": "Mô hình này hỗ trợ tìm kiếm trực tuyến",
|
||||
"tokens": "Mỗi phiên của mô hình này hỗ trợ tối đa {{tokens}} Tokens",
|
||||
"video": "Mô hình này hỗ trợ nhận dạng video",
|
||||
"vision": "Mô hình này hỗ trợ nhận diện hình ảnh"
|
||||
},
|
||||
"removed": "Mô hình này không còn trong danh sách, nếu bỏ chọn sẽ tự động xóa"
|
||||
|
||||
+53
-20
@@ -287,9 +287,6 @@
|
||||
"Pro/deepseek-ai/DeepSeek-V3.1": {
|
||||
"description": "DeepSeek-V3.1 là mô hình ngôn ngữ lớn chế độ hỗn hợp do DeepSeek AI phát hành, với nhiều nâng cấp quan trọng dựa trên phiên bản trước. Một đổi mới lớn của mô hình là tích hợp \"Chế độ suy nghĩ\" (Thinking Mode) và \"Chế độ không suy nghĩ\" (Non-thinking Mode) trong cùng một mô hình, người dùng có thể linh hoạt chuyển đổi bằng cách điều chỉnh mẫu trò chuyện để phù hợp với các yêu cầu nhiệm vụ khác nhau. Qua tối ưu hóa sau huấn luyện chuyên biệt, V3.1 đã cải thiện đáng kể hiệu suất trong việc gọi công cụ và nhiệm vụ Agent, hỗ trợ tốt hơn cho các công cụ tìm kiếm bên ngoài và thực hiện các nhiệm vụ phức tạp nhiều bước. Mô hình được huấn luyện tiếp dựa trên DeepSeek-V3.1-Base, sử dụng phương pháp mở rộng văn bản dài hai giai đoạn, tăng đáng kể lượng dữ liệu huấn luyện, giúp cải thiện khả năng xử lý tài liệu dài và mã nguồn dài. Là một mô hình mã nguồn mở, DeepSeek-V3.1 thể hiện năng lực tương đương với các mô hình đóng hàng đầu trong các bài kiểm tra chuẩn về mã hóa, toán học và suy luận, đồng thời với kiến trúc chuyên gia hỗn hợp (MoE), nó duy trì dung lượng mô hình lớn trong khi giảm chi phí suy luận hiệu quả."
|
||||
},
|
||||
"Pro/moonshotai/Kimi-K2-Instruct": {
|
||||
"description": "Kimi K2 là mô hình nền tảng kiến trúc MoE với khả năng mã hóa và đại lý vượt trội, tổng tham số 1T, tham số kích hoạt 32B. Trong các bài kiểm tra chuẩn về suy luận kiến thức chung, lập trình, toán học và đại lý, hiệu suất của mô hình K2 vượt trội so với các mô hình mã nguồn mở phổ biến khác."
|
||||
},
|
||||
"Pro/moonshotai/Kimi-K2-Instruct-0905": {
|
||||
"description": "Kimi K2-Instruct-0905 là phiên bản mới nhất và mạnh mẽ nhất của Kimi K2. Đây là một mô hình ngôn ngữ chuyên gia hỗn hợp (MoE) hàng đầu với tổng số tham số lên đến 1 nghìn tỷ và 32 tỷ tham số kích hoạt. Các đặc điểm chính của mô hình bao gồm: tăng cường trí tuệ mã hóa tác nhân, thể hiện sự cải thiện đáng kể trong các bài kiểm tra chuẩn công khai và các nhiệm vụ mã hóa tác nhân trong thế giới thực; cải tiến trải nghiệm mã hóa giao diện người dùng, nâng cao cả về tính thẩm mỹ và tính thực tiễn trong lập trình giao diện."
|
||||
},
|
||||
@@ -380,6 +377,12 @@
|
||||
"Qwen/Qwen3-Coder-480B-A35B-Instruct": {
|
||||
"description": "Qwen3-Coder-480B-A35B-Instruct là mô hình mã do Alibaba phát hành, được đánh giá là có khả năng tác nhân (agentic) mạnh mẽ nhất tính đến nay. Đây là một mô hình chuyên gia hỗn hợp (Mixture of Experts, MoE) với tổng cộng 480 tỷ tham số và 35 tỷ tham số kích hoạt, cân bằng giữa hiệu suất và hiệu quả. Mô hình này hỗ trợ ngữ cảnh gốc dài 256K (khoảng 260 nghìn) token và có thể được mở rộng tới 1 triệu token thông qua các phương pháp ngoại suy như YaRN, giúp nó xử lý các kho mã quy mô lớn và các nhiệm vụ lập trình phức tạp. Qwen3-Coder được thiết kế cho quy trình làm việc lập trình theo mô hình tác nhân, không chỉ sinh mã mà còn có khả năng tương tác tự chủ với các công cụ và môi trường phát triển để giải quyết những vấn đề lập trình phức tạp. Trong nhiều bộ đánh giá chuẩn về mã nguồn và nhiệm vụ tác nhân, mô hình này đạt thứ hạng dẫn đầu trong các mô hình mã nguồn mở, với hiệu năng có thể sánh ngang các mô hình hàng đầu như Claude Sonnet 4."
|
||||
},
|
||||
"Qwen/Qwen3-Next-80B-A3B-Instruct": {
|
||||
"description": "Qwen3-Next-80B-A3B-Instruct là mô hình nền tảng thế hệ tiếp theo do đội ngũ Alibaba Tongyi Qianwen phát hành. Nó dựa trên kiến trúc Qwen3-Next hoàn toàn mới, nhằm đạt được hiệu quả tối ưu trong huấn luyện và suy luận. Mô hình này áp dụng cơ chế chú ý hỗn hợp sáng tạo (Gated DeltaNet và Gated Attention), cấu trúc chuyên gia hỗn hợp có độ thưa cao (MoE) cùng nhiều tối ưu hóa về độ ổn định trong huấn luyện. Là một mô hình thưa với tổng số 80 tỷ tham số, nó chỉ kích hoạt khoảng 3 tỷ tham số trong quá trình suy luận, giúp giảm đáng kể chi phí tính toán và khi xử lý các tác vụ ngữ cảnh dài trên 32K token, thông lượng suy luận cao hơn mô hình Qwen3-32B hơn 10 lần. Mô hình này là phiên bản tinh chỉnh theo chỉ dẫn, thiết kế cho các tác vụ chung và không hỗ trợ chế độ Chuỗi suy nghĩ (Thinking). Về hiệu năng, nó tương đương với mô hình chủ lực Qwen3-235B của Tongyi Qianwen trong một số bài kiểm tra chuẩn, đặc biệt thể hiện ưu thế rõ rệt trong các tác vụ ngữ cảnh siêu dài."
|
||||
},
|
||||
"Qwen/Qwen3-Next-80B-A3B-Thinking": {
|
||||
"description": "Qwen3-Next-80B-A3B-Thinking là mô hình nền tảng thế hệ tiếp theo do đội ngũ Alibaba Tongyi Qianwen phát hành, được thiết kế chuyên biệt cho các tác vụ suy luận phức tạp. Nó dựa trên kiến trúc sáng tạo Qwen3-Next, kết hợp cơ chế chú ý hỗn hợp (Gated DeltaNet và Gated Attention) và cấu trúc chuyên gia hỗn hợp có độ thưa cao (MoE), nhằm đạt hiệu quả tối ưu trong huấn luyện và suy luận. Là mô hình thưa với tổng số 80 tỷ tham số, nó chỉ kích hoạt khoảng 3 tỷ tham số trong quá trình suy luận, giảm đáng kể chi phí tính toán, và khi xử lý các tác vụ ngữ cảnh dài trên 32K token, thông lượng cao hơn mô hình Qwen3-32B hơn 10 lần. Phiên bản “Thinking” này được tối ưu để thực hiện các tác vụ đa bước khó như chứng minh toán học, tổng hợp mã, phân tích logic và lập kế hoạch, và mặc định xuất ra quá trình suy luận dưới dạng chuỗi suy nghĩ có cấu trúc. Về hiệu năng, nó không chỉ vượt trội so với các mô hình có chi phí cao hơn như Qwen3-32B-Thinking mà còn vượt qua Gemini-2.5-Flash-Thinking trong nhiều bài kiểm tra chuẩn."
|
||||
},
|
||||
"Qwen2-72B-Instruct": {
|
||||
"description": "Qwen2 là dòng mô hình mới nhất của Qwen, hỗ trợ ngữ cảnh 128k, so với các mô hình mã nguồn mở tốt nhất hiện tại, Qwen2-72B vượt trội hơn hẳn trong nhiều khả năng như hiểu ngôn ngữ tự nhiên, kiến thức, mã, toán học và đa ngôn ngữ."
|
||||
},
|
||||
@@ -809,9 +812,6 @@
|
||||
"codex-mini-latest": {
|
||||
"description": "codex-mini-latest là phiên bản tinh chỉnh của o4-mini, được thiết kế đặc biệt cho Codex CLI. Đối với việc sử dụng trực tiếp qua API, chúng tôi khuyến nghị bắt đầu từ gpt-4.1."
|
||||
},
|
||||
"cognitivecomputations/dolphin-mixtral-8x22b": {
|
||||
"description": "Dolphin Mixtral 8x22B là mô hình được thiết kế cho việc tuân thủ hướng dẫn, đối thoại và lập trình."
|
||||
},
|
||||
"cogview-4": {
|
||||
"description": "CogView-4 là mô hình tạo hình ảnh văn bản mã nguồn mở đầu tiên của Zhipu hỗ trợ tạo ký tự Trung Hoa, với sự cải tiến toàn diện về hiểu ngữ nghĩa, chất lượng tạo hình ảnh, khả năng tạo ký tự tiếng Trung và tiếng Anh, hỗ trợ đầu vào song ngữ Trung-Anh với độ dài tùy ý, có thể tạo hình ảnh với độ phân giải bất kỳ trong phạm vi cho phép."
|
||||
},
|
||||
@@ -926,6 +926,9 @@
|
||||
"deepseek-ai/deepseek-r1": {
|
||||
"description": "LLM hiệu quả tiên tiến, xuất sắc trong suy luận, toán học và lập trình."
|
||||
},
|
||||
"deepseek-ai/deepseek-v3.1": {
|
||||
"description": "DeepSeek V3.1: Mô hình suy luận thế hệ tiếp theo, nâng cao khả năng suy luận phức tạp và tư duy chuỗi, phù hợp cho các tác vụ cần phân tích sâu."
|
||||
},
|
||||
"deepseek-ai/deepseek-vl2": {
|
||||
"description": "DeepSeek-VL2 là một mô hình ngôn ngữ hình ảnh hỗn hợp chuyên gia (MoE) được phát triển dựa trên DeepSeekMoE-27B, sử dụng kiến trúc MoE với kích hoạt thưa, đạt được hiệu suất xuất sắc chỉ với 4.5B tham số được kích hoạt. Mô hình này thể hiện xuất sắc trong nhiều nhiệm vụ như hỏi đáp hình ảnh, nhận diện ký tự quang học, hiểu tài liệu/bảng/biểu đồ và định vị hình ảnh."
|
||||
},
|
||||
@@ -1007,6 +1010,9 @@
|
||||
"deepseek-v3.1": {
|
||||
"description": "DeepSeek-V3.1 là mô hình suy luận hỗn hợp hoàn toàn mới do DeepSeek phát hành, hỗ trợ hai chế độ suy luận: suy nghĩ và không suy nghĩ, với hiệu quả suy nghĩ cao hơn so với DeepSeek-R1-0528. Sau khi tối ưu hóa Post-Training, việc sử dụng công cụ Agent và hiệu suất nhiệm vụ của tác nhân được cải thiện đáng kể. Hỗ trợ cửa sổ ngữ cảnh 128k, độ dài đầu ra tối đa lên đến 64k tokens."
|
||||
},
|
||||
"deepseek-v3.1:671b": {
|
||||
"description": "DeepSeek V3.1: Mô hình suy luận thế hệ tiếp theo, nâng cao khả năng suy luận phức tạp và tư duy chuỗi, phù hợp cho các tác vụ cần phân tích sâu."
|
||||
},
|
||||
"deepseek/deepseek-chat-v3-0324": {
|
||||
"description": "DeepSeek V3 là một mô hình hỗn hợp chuyên gia với 685B tham số, là phiên bản mới nhất trong dòng mô hình trò chuyện flagship của đội ngũ DeepSeek.\n\nNó kế thừa mô hình [DeepSeek V3](/deepseek/deepseek-chat-v3) và thể hiện xuất sắc trong nhiều nhiệm vụ."
|
||||
},
|
||||
@@ -1626,7 +1632,7 @@
|
||||
"description": "ChatGPT-4o là một mô hình động, được cập nhật liên tục để giữ phiên bản mới nhất. Nó kết hợp khả năng hiểu và tạo ngôn ngữ mạnh mẽ, phù hợp cho nhiều ứng dụng quy mô lớn, bao gồm dịch vụ khách hàng, giáo dục và hỗ trợ kỹ thuật."
|
||||
},
|
||||
"gpt-4o-audio-preview": {
|
||||
"description": "Mô hình GPT-4o Audio, hỗ trợ đầu vào và đầu ra âm thanh."
|
||||
"description": "Mô hình GPT-4o Audio Preview, hỗ trợ đầu vào và đầu ra âm thanh."
|
||||
},
|
||||
"gpt-4o-mini": {
|
||||
"description": "GPT-4o mini là mô hình mới nhất do OpenAI phát hành sau GPT-4 Omni, hỗ trợ đầu vào hình ảnh và đầu ra văn bản. Là mô hình nhỏ gọn tiên tiến nhất của họ, nó rẻ hơn nhiều so với các mô hình tiên tiến gần đây khác và rẻ hơn hơn 60% so với GPT-3.5 Turbo. Nó giữ lại trí thông minh tiên tiến nhất trong khi có giá trị sử dụng đáng kể. GPT-4o mini đạt 82% điểm trong bài kiểm tra MMLU và hiện đứng cao hơn GPT-4 về sở thích trò chuyện."
|
||||
@@ -1667,24 +1673,33 @@
|
||||
"gpt-5-chat-latest": {
|
||||
"description": "Mô hình GPT-5 được sử dụng trong ChatGPT. Kết hợp khả năng hiểu và tạo ngôn ngữ mạnh mẽ, phù hợp cho các ứng dụng tương tác đối thoại."
|
||||
},
|
||||
"gpt-5-codex": {
|
||||
"description": "GPT-5 Codex là phiên bản GPT-5 được tối ưu cho các tác vụ mã hóa đại diện trong môi trường Codex hoặc tương tự."
|
||||
},
|
||||
"gpt-5-mini": {
|
||||
"description": "Phiên bản GPT-5 nhanh hơn và tiết kiệm chi phí hơn, phù hợp cho các nhiệm vụ được xác định rõ ràng. Cung cấp tốc độ phản hồi nhanh hơn trong khi vẫn giữ chất lượng đầu ra cao."
|
||||
},
|
||||
"gpt-5-nano": {
|
||||
"description": "Phiên bản GPT-5 nhanh nhất và tiết kiệm chi phí nhất. Rất phù hợp cho các ứng dụng cần phản hồi nhanh và nhạy cảm về chi phí."
|
||||
},
|
||||
"gpt-audio": {
|
||||
"description": "GPT Audio là mô hình trò chuyện chung hỗ trợ đầu vào và đầu ra âm thanh, có thể sử dụng âm thanh I/O trong API Chat Completions."
|
||||
},
|
||||
"gpt-image-1": {
|
||||
"description": "Mô hình tạo hình ảnh đa phương thức nguyên bản của ChatGPT"
|
||||
},
|
||||
"gpt-oss": {
|
||||
"description": "GPT-OSS 20B là mô hình ngôn ngữ lớn mã nguồn mở do OpenAI phát hành, sử dụng công nghệ lượng tử hóa MXFP4, phù hợp để chạy trên GPU tiêu dùng cao cấp hoặc Mac Apple Silicon. Mô hình này thể hiện xuất sắc trong việc tạo đối thoại, viết mã và các nhiệm vụ suy luận, hỗ trợ gọi hàm và sử dụng công cụ."
|
||||
},
|
||||
"gpt-oss-120b": {
|
||||
"description": "GPT-OSS-120B MXFP4: Cấu trúc Transformer được lượng tử hóa, duy trì hiệu suất mạnh mẽ ngay cả khi tài nguyên hạn chế."
|
||||
},
|
||||
"gpt-oss:120b": {
|
||||
"description": "GPT-OSS 120B là mô hình ngôn ngữ lớn mã nguồn mở do OpenAI phát hành, sử dụng công nghệ lượng tử hóa MXFP4, thuộc dòng mô hình hàng đầu. Cần môi trường đa GPU hoặc máy trạm hiệu năng cao để vận hành, có hiệu suất vượt trội trong suy luận phức tạp, tạo mã và xử lý đa ngôn ngữ, hỗ trợ gọi hàm nâng cao và tích hợp bộ công cụ."
|
||||
},
|
||||
"gpt-oss:20b": {
|
||||
"description": "GPT-OSS 20B là mô hình ngôn ngữ lớn mã nguồn mở do OpenAI phát hành, sử dụng kỹ thuật lượng tử hóa MXFP4, phù hợp chạy trên GPU tiêu dùng cao cấp hoặc Apple Silicon Mac. Mô hình này thể hiện xuất sắc trong tạo hội thoại, viết mã và các tác vụ suy luận, hỗ trợ gọi hàm và sử dụng công cụ."
|
||||
},
|
||||
"gpt-realtime": {
|
||||
"description": "Mô hình thời gian thực chung, hỗ trợ đầu vào và đầu ra văn bản, âm thanh theo thời gian thực, đồng thời hỗ trợ đầu vào hình ảnh."
|
||||
},
|
||||
"grok-2-1212": {
|
||||
"description": "Mô hình này đã được cải thiện về độ chính xác, khả năng tuân thủ hướng dẫn và khả năng đa ngôn ngữ."
|
||||
},
|
||||
@@ -1712,6 +1727,12 @@
|
||||
"grok-4-0709": {
|
||||
"description": "Grok 4 của xAI, có khả năng suy luận mạnh mẽ."
|
||||
},
|
||||
"grok-4-fast-non-reasoning": {
|
||||
"description": "Chúng tôi rất vui mừng giới thiệu Grok 4 Fast, bước tiến mới nhất của chúng tôi trong các mô hình suy luận hiệu quả về chi phí."
|
||||
},
|
||||
"grok-4-fast-reasoning": {
|
||||
"description": "Chúng tôi rất vui mừng giới thiệu Grok 4 Fast, bước tiến mới nhất của chúng tôi trong các mô hình suy luận hiệu quả về chi phí."
|
||||
},
|
||||
"grok-code-fast-1": {
|
||||
"description": "Chúng tôi rất vui mừng giới thiệu grok-code-fast-1, một mô hình suy luận nhanh và tiết kiệm chi phí, thể hiện xuất sắc trong việc mã hóa đại lý."
|
||||
},
|
||||
@@ -1847,8 +1868,14 @@
|
||||
"inception/mercury-coder-small": {
|
||||
"description": "Mercury Coder Small là lựa chọn lý tưởng cho các nhiệm vụ tạo mã, gỡ lỗi và tái cấu trúc với độ trễ tối thiểu."
|
||||
},
|
||||
"inclusionAI/Ling-flash-2.0": {
|
||||
"description": "Ling-flash-2.0 là mô hình thứ ba trong dòng kiến trúc Ling 2.0 do đội ngũ Bailing của Ant Group phát hành. Đây là mô hình chuyên gia hỗn hợp (MoE) với tổng số tham số lên đến 100 tỷ, nhưng mỗi token chỉ kích hoạt 6.1 tỷ tham số (không bao gồm embedding là 4.8 tỷ). Là mô hình cấu hình nhẹ, Ling-flash-2.0 thể hiện hiệu năng ngang hoặc vượt trội so với các mô hình dày đặc (Dense) 40 tỷ tham số và các mô hình MoE quy mô lớn hơn trong nhiều bài đánh giá uy tín. Mô hình này nhằm khám phá con đường hiệu quả trong bối cảnh quan niệm “mô hình lớn đồng nghĩa với tham số lớn” thông qua thiết kế kiến trúc và chiến lược huấn luyện tối ưu."
|
||||
},
|
||||
"inclusionAI/Ling-mini-2.0": {
|
||||
"description": "Ling-mini-2.0 là một mô hình ngôn ngữ lớn hiệu suất cao kích thước nhỏ dựa trên kiến trúc MoE. Nó có tổng số 16 tỷ tham số, nhưng mỗi token chỉ kích hoạt 1.4 tỷ tham số (không bao gồm embedding là 789 triệu), từ đó đạt được tốc độ sinh nhanh vượt trội. Nhờ thiết kế MoE hiệu quả và dữ liệu huấn luyện quy mô lớn, chất lượng cao, mặc dù tham số kích hoạt chỉ là 1.4 tỷ, Ling-mini-2.0 vẫn thể hiện hiệu suất hàng đầu trong các nhiệm vụ hạ nguồn, có thể sánh ngang với các mô hình LLM dense dưới 10 tỷ tham số và các mô hình MoE quy mô lớn hơn."
|
||||
"description": "Ling-mini-2.0 là mô hình ngôn ngữ lớn hiệu năng cao kích thước nhỏ dựa trên kiến trúc MoE. Nó có tổng số 16 tỷ tham số, nhưng mỗi token chỉ kích hoạt 1.4 tỷ tham số (không bao gồm embedding là 789 triệu), từ đó đạt tốc độ sinh nhanh vượt trội. Nhờ thiết kế MoE hiệu quả và dữ liệu huấn luyện quy mô lớn, chất lượng cao, mặc dù tham số kích hoạt chỉ 1.4 tỷ, Ling-mini-2.0 vẫn thể hiện hiệu năng hàng đầu trong các tác vụ hạ nguồn, có thể so sánh với các mô hình dense dưới 10 tỷ tham số và các mô hình MoE quy mô lớn hơn."
|
||||
},
|
||||
"inclusionAI/Ring-flash-2.0": {
|
||||
"description": "Ring-flash-2.0 là mô hình tư duy hiệu năng cao được tối ưu sâu dựa trên Ling-flash-2.0-base. Nó sử dụng kiến trúc chuyên gia hỗn hợp (MoE) với tổng số 100 tỷ tham số, nhưng mỗi lần suy luận chỉ kích hoạt 6.1 tỷ tham số. Mô hình này áp dụng thuật toán độc quyền icepop, giải quyết vấn đề không ổn định trong huấn luyện tăng cường (RL) của các mô hình MoE lớn, giúp năng lực suy luận phức tạp được cải thiện liên tục trong quá trình huấn luyện dài hạn. Ring-flash-2.0 đạt bước đột phá đáng kể trong các bài kiểm tra chuẩn khó như thi toán, tạo mã và suy luận logic, hiệu năng không chỉ vượt các mô hình dense hàng đầu dưới 40 tỷ tham số mà còn có thể sánh ngang các mô hình MoE mã nguồn mở quy mô lớn và các mô hình tư duy hiệu năng cao đóng nguồn. Mặc dù tập trung vào suy luận phức tạp, mô hình cũng thể hiện tốt trong các tác vụ sáng tạo viết lách. Ngoài ra, nhờ thiết kế kiến trúc hiệu quả, Ring-flash-2.0 vừa cung cấp hiệu năng mạnh mẽ vừa đạt tốc độ suy luận cao, giảm đáng kể chi phí triển khai mô hình tư duy trong các kịch bản tải cao."
|
||||
},
|
||||
"internlm/internlm2_5-7b-chat": {
|
||||
"description": "InternLM2.5 cung cấp giải pháp đối thoại thông minh cho nhiều tình huống."
|
||||
@@ -1974,7 +2001,10 @@
|
||||
"description": "LLaVA là mô hình đa phương thức kết hợp bộ mã hóa hình ảnh và Vicuna, phục vụ cho việc hiểu biết mạnh mẽ về hình ảnh và ngôn ngữ."
|
||||
},
|
||||
"magistral-medium-latest": {
|
||||
"description": "Magistral Medium 1.1 là một mô hình suy luận tiên tiến do Mistral AI ra mắt vào tháng 7 năm 2025."
|
||||
"description": "Magistral Medium 1.2 là mô hình suy luận tiên tiến do Mistral AI phát hành vào tháng 9 năm 2025, có hỗ trợ thị giác."
|
||||
},
|
||||
"magistral-small-2509": {
|
||||
"description": "Magistral Small 1.2 là mô hình suy luận nhỏ mã nguồn mở do Mistral AI phát hành vào tháng 9 năm 2025, có hỗ trợ thị giác."
|
||||
},
|
||||
"mathstral": {
|
||||
"description": "MathΣtral được thiết kế cho nghiên cứu khoa học và suy luận toán học, cung cấp khả năng tính toán hiệu quả và giải thích kết quả."
|
||||
@@ -2282,9 +2312,6 @@
|
||||
"mistral/mistral-large": {
|
||||
"description": "Mistral Large là lựa chọn lý tưởng cho các nhiệm vụ phức tạp đòi hỏi khả năng suy luận lớn hoặc chuyên môn cao — như tạo văn bản tổng hợp, tạo mã, RAG hoặc đại lý."
|
||||
},
|
||||
"mistral/mistral-saba-24b": {
|
||||
"description": "Mistral Saba 24B là mô hình mã nguồn mở 24 tỷ tham số do Mistral.ai phát triển. Saba là mô hình chuyên biệt được huấn luyện để thể hiện xuất sắc trong các ngôn ngữ Ả Rập, Ba Tư, Urdu, Do Thái và các ngôn ngữ Ấn Độ. Được Groq phục vụ bằng phần cứng đơn vị xử lý ngôn ngữ (LPU) tùy chỉnh để cung cấp suy luận nhanh và hiệu quả."
|
||||
},
|
||||
"mistral/mistral-small": {
|
||||
"description": "Mistral Small là lựa chọn lý tưởng cho các nhiệm vụ đơn giản có thể xử lý theo lô — như phân loại, hỗ trợ khách hàng hoặc tạo văn bản. Nó cung cấp hiệu suất xuất sắc với mức giá phải chăng."
|
||||
},
|
||||
@@ -2357,9 +2384,6 @@
|
||||
"moonshotai/Kimi-Dev-72B": {
|
||||
"description": "Kimi-Dev-72B là một mô hình mã nguồn mở lớn, được tối ưu hóa qua học tăng cường quy mô lớn, có khả năng tạo ra các bản vá ổn định và có thể triển khai trực tiếp. Mô hình này đã đạt điểm cao kỷ lục 60,4% trên SWE-bench Verified, phá vỡ các kỷ lục của mô hình mã nguồn mở trong các nhiệm vụ kỹ thuật phần mềm tự động như sửa lỗi và đánh giá mã."
|
||||
},
|
||||
"moonshotai/Kimi-K2-Instruct": {
|
||||
"description": "Kimi K2 là mô hình nền tảng kiến trúc MoE có khả năng mã hóa và đại lý vượt trội, tổng tham số 1T, tham số kích hoạt 32B. Trong các bài kiểm tra chuẩn về suy luận kiến thức chung, lập trình, toán học và đại lý, hiệu suất của mô hình K2 vượt trội so với các mô hình mã nguồn mở phổ biến khác."
|
||||
},
|
||||
"moonshotai/Kimi-K2-Instruct-0905": {
|
||||
"description": "Kimi K2-Instruct-0905 là phiên bản mới nhất và mạnh mẽ nhất của Kimi K2. Đây là một mô hình ngôn ngữ chuyên gia hỗn hợp (MoE) hàng đầu với tổng số tham số lên đến 1 nghìn tỷ và 32 tỷ tham số kích hoạt. Các đặc điểm chính của mô hình bao gồm: tăng cường trí tuệ mã hóa tác nhân, thể hiện sự cải thiện đáng kể trong các bài kiểm tra chuẩn công khai và các nhiệm vụ mã hóa tác nhân trong thế giới thực; cải tiến trải nghiệm mã hóa giao diện người dùng, nâng cao cả về tính thẩm mỹ và tính thực tiễn trong lập trình giao diện."
|
||||
},
|
||||
@@ -2570,6 +2594,9 @@
|
||||
"qwen-image": {
|
||||
"description": "Qwen-Image là một mô hình sinh hình ảnh đa dụng, hỗ trợ nhiều phong cách nghệ thuật và đặc biệt giỏi trong việc tái hiện văn bản phức tạp, nhất là văn bản tiếng Trung và tiếng Anh. Mô hình hỗ trợ bố cục nhiều dòng, sinh văn bản ở cấp đoạn và khắc họa các chi tiết tinh tế, cho phép thực hiện các thiết kế bố cục kết hợp hình ảnh và văn bản phức tạp."
|
||||
},
|
||||
"qwen-image-edit": {
|
||||
"description": "Qwen Image Edit là một mô hình tạo hình ảnh từ hình ảnh, hỗ trợ chỉnh sửa và thay đổi hình ảnh dựa trên hình ảnh đầu vào và các gợi ý văn bản, có khả năng điều chỉnh chính xác và sáng tạo hình ảnh gốc theo yêu cầu của người dùng."
|
||||
},
|
||||
"qwen-long": {
|
||||
"description": "Mô hình ngôn ngữ quy mô lớn Qwen, hỗ trợ ngữ cảnh văn bản dài và chức năng đối thoại dựa trên tài liệu dài, nhiều tài liệu."
|
||||
},
|
||||
@@ -2804,8 +2831,11 @@
|
||||
"qwen3-coder-plus": {
|
||||
"description": "Mô hình mã nguồn của Thông Nghĩa Thiên Vấn. Bộ mô hình Qwen3-Coder mới nhất dựa trên Qwen3 là mô hình tạo mã, có khả năng Coding Agent mạnh mẽ, thành thạo gọi công cụ và tương tác môi trường, có thể tự lập trình, vừa xuất sắc về năng lực mã hóa vừa có khả năng tổng quát."
|
||||
},
|
||||
"qwen3-max-preview": {
|
||||
"description": "Phiên bản xem trước mô hình Max của dòng Qwen 3, so với dòng 2.5 có sự cải thiện lớn về năng lực tổng quát, khả năng hiểu văn bản song ngữ Trung-Anh, tuân thủ chỉ thị phức tạp, thực hiện nhiệm vụ mở chủ quan, đa ngôn ngữ và gọi công cụ đều được tăng cường rõ rệt; mô hình giảm thiểu ảo giác kiến thức."
|
||||
"qwen3-coder:480b": {
|
||||
"description": "Mô hình ngữ cảnh dài hiệu năng cao của Alibaba dành cho các tác vụ đại diện và mã hóa."
|
||||
},
|
||||
"qwen3-max": {
|
||||
"description": "Dòng mô hình Max của Tongyi Qianwen 3, so với dòng 2.5 có sự cải thiện lớn về khả năng chung, bao gồm hiểu văn bản song ngữ Trung-Anh, tuân thủ chỉ dẫn phức tạp, khả năng thực hiện các tác vụ mở chủ quan, đa ngôn ngữ và gọi công cụ; giảm thiểu ảo tưởng kiến thức của mô hình. Phiên bản qwen3-max mới nhất đã nâng cấp chuyên biệt về lập trình tác nhân và gọi công cụ so với phiên bản qwen3-max-preview. Mô hình chính thức phát hành đạt mức SOTA trong lĩnh vực, phù hợp với các nhu cầu tác nhân phức tạp hơn."
|
||||
},
|
||||
"qwen3-next-80b-a3b-instruct": {
|
||||
"description": "Mô hình mã nguồn mở thế hệ mới không có chế độ suy nghĩ dựa trên Qwen3, so với phiên bản trước (Thông Nghĩa Thiên Vấn 3-235B-A22B-Instruct-2507) có khả năng hiểu văn bản tiếng Trung tốt hơn, năng lực suy luận logic được cải thiện, và hiệu suất trong các nhiệm vụ tạo văn bản cũng tốt hơn."
|
||||
@@ -2813,6 +2843,9 @@
|
||||
"qwen3-next-80b-a3b-thinking": {
|
||||
"description": "Mô hình mã nguồn mở thế hệ mới có chế độ suy nghĩ dựa trên Qwen3, so với phiên bản trước (Thông Nghĩa Thiên Vấn 3-235B-A22B-Thinking-2507) có khả năng tuân thủ chỉ dẫn được nâng cao, và các phản hồi tóm tắt của mô hình trở nên ngắn gọn hơn."
|
||||
},
|
||||
"qwen3-vl-plus": {
|
||||
"description": "Tongyi Qianwen VL là mô hình sinh văn bản có khả năng hiểu thị giác (hình ảnh), không chỉ thực hiện OCR (nhận dạng chữ trong ảnh) mà còn có thể tóm tắt và suy luận thêm, ví dụ như trích xuất thuộc tính từ ảnh sản phẩm, giải bài tập dựa trên hình ảnh minh họa."
|
||||
},
|
||||
"qwq": {
|
||||
"description": "QwQ là một mô hình nghiên cứu thử nghiệm, tập trung vào việc nâng cao khả năng suy luận của AI."
|
||||
},
|
||||
|
||||
@@ -281,6 +281,7 @@
|
||||
"actionFiletip": "上传文件",
|
||||
"actionTooltip": "上传",
|
||||
"disabled": "当前模型不支持视觉识别和文件分析,请切换模型后使用",
|
||||
"fileNotSupported": "浏览器模式下暂不支持上传文件,仅支持图片",
|
||||
"visionNotSupported": "当前模型不支持视觉识别,请切换模型后使用"
|
||||
},
|
||||
"preview": {
|
||||
@@ -289,6 +290,9 @@
|
||||
"pending": "准备上传...",
|
||||
"processing": "文件处理中..."
|
||||
}
|
||||
},
|
||||
"validation": {
|
||||
"videoSizeExceeded": "视频文件大小不能超过 20MB,当前文件大小为 {{actualSize}}"
|
||||
}
|
||||
},
|
||||
"zenMode": "专注模式"
|
||||
|
||||
@@ -114,6 +114,7 @@
|
||||
"reasoning": "该模型支持深度思考",
|
||||
"search": "该模型支持联网搜索",
|
||||
"tokens": "该模型单个会话最多支持 {{tokens}} Tokens",
|
||||
"video": "该模型支持视频识别",
|
||||
"vision": "该模型支持视觉识别"
|
||||
},
|
||||
"removed": "该模型不在列表中,若取消选中将会自动移除"
|
||||
|
||||
+53
-20
@@ -287,9 +287,6 @@
|
||||
"Pro/deepseek-ai/DeepSeek-V3.1": {
|
||||
"description": "DeepSeek-V3.1 是由深度求索(DeepSeek AI)发布的混合模式大语言模型,它在前代模型的基础上进行了多方面的重要升级。该模型的一大创新是集成了“思考模式”(Thinking Mode)和“非思考模式”(Non-thinking Mode)于一体,用户可以通过调整聊天模板灵活切换,以适应不同的任务需求。通过专门的训练后优化,V3.1 在工具调用和 Agent 任务方面的性能得到了显著增强,能够更好地支持外部搜索工具和执行多步复杂任务。该模型基于 DeepSeek-V3.1-Base 进行后训练,通过两阶段长文本扩展方法,大幅增加了训练数据量,使其在处理长文档和长篇代码方面表现更佳。作为一个开源模型,DeepSeek-V3.1 在编码、数学和推理等多个基准测试中展现了与顶尖闭源模型相媲美的能力,同时凭借其混合专家(MoE)架构,在保持巨大模型容量的同时,有效降低了推理成本。"
|
||||
},
|
||||
"Pro/moonshotai/Kimi-K2-Instruct": {
|
||||
"description": "Kimi K2 是一款具备超强代码和 Agent 能力的 MoE 架构基础模型,总参数 1T,激活参数 32B。在通用知识推理、编程、数学、Agent 等主要类别的基准性能测试中,K2 模型的性能超过其他主流开源模型。"
|
||||
},
|
||||
"Pro/moonshotai/Kimi-K2-Instruct-0905": {
|
||||
"description": "Kimi K2-Instruct-0905 是 Kimi K2 最新、最强大的版本。它是一款顶尖的混合专家(MoE)语言模型,拥有 1 万亿的总参数和 320 亿的激活参数。该模型的主要特性包括:增强的智能体编码智能,在公开基准测试和真实世界的编码智能体任务中表现出显著的性能提升;改进的前端编码体验,在前端编程的美观性和实用性方面均有进步。"
|
||||
},
|
||||
@@ -380,6 +377,12 @@
|
||||
"Qwen/Qwen3-Coder-480B-A35B-Instruct": {
|
||||
"description": "Qwen3-Coder-480B-A35B-Instruct 是由阿里巴巴发布的、迄今为止最具代理(Agentic)能力的代码模型。它是一个拥有 4800 亿总参数和 350 亿激活参数的混合专家(MoE)模型,在效率和性能之间取得了平衡。该模型原生支持 256K(约 26 万) tokens 的上下文长度,并可通过 YaRN 等外推方法扩展至 100 万 tokens,使其能够处理大规模代码库和复杂的编程任务。Qwen3-Coder 专为代理式编码工作流设计,不仅能生成代码,还能与开发工具和环境自主交互,以解决复杂的编程问题。在多个编码和代理任务的基准测试中,该模型在开源模型中取得了顶尖水平,其性能可与 Claude Sonnet 4 等领先模型相媲美。"
|
||||
},
|
||||
"Qwen/Qwen3-Next-80B-A3B-Instruct": {
|
||||
"description": "Qwen3-Next-80B-A3B-Instruct 是由阿里巴巴通义千问团队发布的下一代基础模型。它基于全新的 Qwen3-Next 架构,旨在实现极致的训练和推理效率。该模型采用了创新的混合注意力机制(Gated DeltaNet 和 Gated Attention)、高稀疏度混合专家(MoE)结构以及多项训练稳定性优化。作为一个拥有 800 亿总参数的稀疏模型,它在推理时仅需激活约 30 亿参数,从而大幅降低了计算成本,并在处理超过 32K tokens 的长上下文任务时,推理吞吐量比 Qwen3-32B 模型高出 10 倍以上。此模型为指令微调版本,专为通用任务设计,不支持思维链(Thinking)模式。在性能上,它与通义千问的旗舰模型 Qwen3-235B 在部分基准测试中表现相当,尤其在超长上下文任务中展现出明显优势。"
|
||||
},
|
||||
"Qwen/Qwen3-Next-80B-A3B-Thinking": {
|
||||
"description": "Qwen3-Next-80B-A3B-Thinking 是由阿里巴巴通义千问团队发布的、专为复杂推理任务设计的下一代基础模型。它基于创新的 Qwen3-Next 架构,该架构融合了混合注意力机制(Gated DeltaNet 与 Gated Attention)和高稀疏度混合专家(MoE)结构,旨在实现极致的训练与推理效率。作为一个总参数达 800 亿的稀疏模型,它在推理时仅激活约 30 亿参数,大幅降低了计算成本,在处理超过 32K tokens 的长上下文任务时,吞吐量比 Qwen3-32B 模型高出 10 倍以上。此“Thinking”版本专为执行数学证明、代码综合、逻辑分析和规划等高难度多步任务而优化,并默认以结构化的“思维链”形式输出推理过程。在性能上,它不仅超越了 Qwen3-32B-Thinking 等成本更高的模型,还在多个基准测试中优于 Gemini-2.5-Flash-Thinking。"
|
||||
},
|
||||
"Qwen2-72B-Instruct": {
|
||||
"description": "Qwen2 是 Qwen 模型的最新系列,支持 128k 上下文,对比当前最优的开源模型,Qwen2-72B 在自然语言理解、知识、代码、数学及多语言等多项能力上均显著超越当前领先的模型。"
|
||||
},
|
||||
@@ -809,9 +812,6 @@
|
||||
"codex-mini-latest": {
|
||||
"description": "codex-mini-latest 是 o4-mini 的微调版本,专门用于 Codex CLI。对于直接通过 API 使用,我们推荐从 gpt-4.1 开始。"
|
||||
},
|
||||
"cognitivecomputations/dolphin-mixtral-8x22b": {
|
||||
"description": "Dolphin Mixtral 8x22B 是一款为指令遵循、对话和编程设计的模型。"
|
||||
},
|
||||
"cogview-4": {
|
||||
"description": "CogView-4 是智谱首个支持生成汉字的开源文生图模型,在语义理解、图像生成质量、中英文字生成能力等方面全面提升,支持任意长度的中英双语输入,能够生成在给定范围内的任意分辨率图像。"
|
||||
},
|
||||
@@ -926,6 +926,9 @@
|
||||
"deepseek-ai/deepseek-r1": {
|
||||
"description": "最先进的高效 LLM,擅长推理、数学和编程。"
|
||||
},
|
||||
"deepseek-ai/deepseek-v3.1": {
|
||||
"description": "DeepSeek V3.1:下一代推理模型,提升了复杂推理与链路思考能力,适合需要深入分析的任务。"
|
||||
},
|
||||
"deepseek-ai/deepseek-vl2": {
|
||||
"description": "DeepSeek-VL2 是一个基于 DeepSeekMoE-27B 开发的混合专家(MoE)视觉语言模型,采用稀疏激活的 MoE 架构,在仅激活 4.5B 参数的情况下实现了卓越性能。该模型在视觉问答、光学字符识别、文档/表格/图表理解和视觉定位等多个任务中表现优异。"
|
||||
},
|
||||
@@ -1007,6 +1010,9 @@
|
||||
"deepseek-v3.1": {
|
||||
"description": "DeepSeek-V3.1 是深度求索全新推出的混合推理模型,支持思考与非思考2种推理模式,较 DeepSeek-R1-0528 思考效率更高。经 Post-Training 优化,Agent 工具使用与智能体任务表现大幅提升。支持 128k 上下文窗口,输出长度支持最大 64k tokens。"
|
||||
},
|
||||
"deepseek-v3.1:671b": {
|
||||
"description": "DeepSeek V3.1:下一代推理模型,提升了复杂推理与链路思考能力,适合需要深入分析的任务。"
|
||||
},
|
||||
"deepseek/deepseek-chat-v3-0324": {
|
||||
"description": "DeepSeek V3 是一个 685B 参数的专家混合模型,是 DeepSeek 团队旗舰聊天模型系列的最新迭代。\n\n它继承了 [DeepSeek V3](/deepseek/deepseek-chat-v3) 模型,并在各种任务上表现出色。"
|
||||
},
|
||||
@@ -1626,7 +1632,7 @@
|
||||
"description": "ChatGPT-4o 是一款动态模型,实时更新以保持当前最新版本。它结合了强大的语言理解与生成能力,适合于大规模应用场景,包括客户服务、教育和技术支持。"
|
||||
},
|
||||
"gpt-4o-audio-preview": {
|
||||
"description": "GPT-4o Audio 模型,支持音频输入输出"
|
||||
"description": "GPT-4o Audio Preview 模型,支持音频输入输出"
|
||||
},
|
||||
"gpt-4o-mini": {
|
||||
"description": "GPT-4o mini是OpenAI在GPT-4 Omni之后推出的最新模型,支持图文输入并输出文本。作为他们最先进的小型模型,它比其他近期的前沿模型便宜很多,并且比GPT-3.5 Turbo便宜超过60%。它保持了最先进的智能,同时具有显著的性价比。GPT-4o mini在MMLU测试中获得了 82% 的得分,目前在聊天偏好上排名高于 GPT-4。"
|
||||
@@ -1667,24 +1673,33 @@
|
||||
"gpt-5-chat-latest": {
|
||||
"description": "ChatGPT 中使用的 GPT-5 模型。结合了强大的语言理解与生成能力,适合对话式交互应用。"
|
||||
},
|
||||
"gpt-5-codex": {
|
||||
"description": "GPT-5 Codex 是一个针对 Codex 或类似环境中的代理编码任务优化的 GPT-5 版本。"
|
||||
},
|
||||
"gpt-5-mini": {
|
||||
"description": "更快、更经济高效的 GPT-5 版本,适用于明确定义的任务。在保持高质量输出的同时,提供更快的响应速度。"
|
||||
},
|
||||
"gpt-5-nano": {
|
||||
"description": "最快、最经济高效的 GPT-5 版本。非常适合需要快速响应且成本敏感的应用场景。"
|
||||
},
|
||||
"gpt-audio": {
|
||||
"description": "GPT Audio 是面向音频输入输出的通用聊天模型,支持在 Chat Completions API 中使用音频 I/O。"
|
||||
},
|
||||
"gpt-image-1": {
|
||||
"description": "ChatGPT 原生多模态图片生成模型"
|
||||
},
|
||||
"gpt-oss": {
|
||||
"description": "GPT-OSS 20B 是 OpenAI 发布的开源大语言模型,采用 MXFP4 量化技术,适合在高端消费级GPU或Apple Silicon Mac上运行。该模型在对话生成、代码编写和推理任务方面表现出色,支持函数调用和工具使用。"
|
||||
},
|
||||
"gpt-oss-120b": {
|
||||
"description": "GPT-OSS-120B MXFP4 量化的 Transformer 结构,在资源受限时仍能保持强劲性能。"
|
||||
},
|
||||
"gpt-oss:120b": {
|
||||
"description": "GPT-OSS 120B 是 OpenAI 发布的大型开源语言模型,采用 MXFP4 量化技术,为旗舰级模型。需要多GPU或高性能工作站环境运行,在复杂推理、代码生成和多语言处理方面具备卓越性能,支持高级函数调用和工具集成。"
|
||||
},
|
||||
"gpt-oss:20b": {
|
||||
"description": "GPT-OSS 20B 是 OpenAI 发布的开源大语言模型,采用 MXFP4 量化技术,适合在高端消费级GPU或Apple Silicon Mac上运行。该模型在对话生成、代码编写和推理任务方面表现出色,支持函数调用和工具使用。"
|
||||
},
|
||||
"gpt-realtime": {
|
||||
"description": "通用实时模型,支持文本与音频的实时输入输出,并支持图像输入。"
|
||||
},
|
||||
"grok-2-1212": {
|
||||
"description": "该模型在准确性、指令遵循和多语言能力方面有所改进。"
|
||||
},
|
||||
@@ -1712,6 +1727,12 @@
|
||||
"grok-4-0709": {
|
||||
"description": "xAI 的 Grok 4,具备强大的推理能力。"
|
||||
},
|
||||
"grok-4-fast-non-reasoning": {
|
||||
"description": "我们很高兴发布 Grok 4 Fast,这是我们在成本效益推理模型方面的最新进展。"
|
||||
},
|
||||
"grok-4-fast-reasoning": {
|
||||
"description": "我们很高兴发布 Grok 4 Fast,这是我们在成本效益推理模型方面的最新进展。"
|
||||
},
|
||||
"grok-code-fast-1": {
|
||||
"description": "我们很高兴推出 grok-code-fast-1,这是一款快速且经济高效的推理模型,在代理编码方面表现出色。"
|
||||
},
|
||||
@@ -1847,8 +1868,14 @@
|
||||
"inception/mercury-coder-small": {
|
||||
"description": "Mercury Coder Small 是代码生成、调试和重构任务的理想选择,具有最小延迟。"
|
||||
},
|
||||
"inclusionAI/Ling-flash-2.0": {
|
||||
"description": "Ling-flash-2.0 是由蚂蚁集团百灵团队发布的 Ling 2.0 架构系列的第三款模型。它是一款混合专家(MoE)模型,总参数规模达到 1000 亿,但每个 token 仅激活 61 亿参数(非词向量激活 48 亿)。 作为一个轻量级配置的模型,Ling-flash-2.0 在多个权威评测中展现出媲美甚至超越 400 亿级别稠密(Dense)模型及更大规模 MoE 模型的性能。该模型旨在通过极致的架构设计与训练策略,在“大模型等于大参数”的共识下探索高效能的路径。"
|
||||
},
|
||||
"inclusionAI/Ling-mini-2.0": {
|
||||
"description": "Ling-mini-2.0 是一款基于 MoE 架构的小尺寸高性能大语言模型。它拥有 16B 总参数,但每个 token 仅激活 1.4B(non-embedding 789M),从而实现了极高的生成速度。得益于高效的 MoE 设计与大规模高质量训练数据,尽管激活参数仅为 1.4B,Ling-mini-2.0 依然在下游任务中展现出可媲美 10B 以下 dense LLM 及更大规模 MoE 模型的顶尖性能"
|
||||
"description": "Ling-mini-2.0 是一款基于 MoE 架构的小尺寸高性能大语言模型。它拥有 16B 总参数,但每个 token 仅激活 1.4B(non-embedding 789M),从而实现了极高的生成速度。得益于高效的 MoE 设计与大规模高质量训练数据,尽管激活参数仅为 1.4B,Ling-mini-2.0 依然在下游任务中展现出可媲美 10B 以下 dense LLM 及更大规模 MoE 模型的顶尖性能。"
|
||||
},
|
||||
"inclusionAI/Ring-flash-2.0": {
|
||||
"description": "Ring-flash-2.0 是一个基于 Ling-flash-2.0-base 深度优化的高性能思考模型。它采用混合专家(MoE)架构,总参数量为 100B,但在每次推理中仅激活 6.1B 参数。该模型通过独创的 icepop 算法,解决了 MoE 大模型在强化学习(RL)训练中的不稳定性难题,使其复杂推理能力在长周期训练中得以持续提升。Ring-flash-2.0 在数学竞赛、代码生成和逻辑推理等多个高难度基准测试中取得了显著突破,其性能不仅超越了 40B 参数规模以下的顶尖稠密模型,还能媲美更大规模的开源 MoE 模型及闭源的高性能思考模型。尽管该模型专注于复杂推理,它在创意写作等任务上也表现出色。此外,得益于其高效的架构设计,Ring-flash-2.0 在提供强大性能的同时,也实现了高速推理,显著降低了思考模型在高并发场景下的部署成本。"
|
||||
},
|
||||
"internlm/internlm2_5-7b-chat": {
|
||||
"description": "InternLM2.5-7B-Chat 是一个开源的对话模型,基于 InternLM2 架构开发。该 7B 参数规模的模型专注于对话生成任务,支持中英双语交互。模型采用了最新的训练技术,旨在提供流畅、智能的对话体验。InternLM2.5-7B-Chat 适用于各种对话应用场景,包括但不限于智能客服、个人助手等领域"
|
||||
@@ -1974,7 +2001,10 @@
|
||||
"description": "LLaVA 是结合视觉编码器和 Vicuna 的多模态模型,用于强大的视觉和语言理解。"
|
||||
},
|
||||
"magistral-medium-latest": {
|
||||
"description": "Magistral Medium 1.1 是 Mistral AI 于2025年7月发布的前沿级推理模型。"
|
||||
"description": "Magistral Medium 1.2 是Mistral AI于2025年9月发布的前沿级推理模型,具有视觉支持。"
|
||||
},
|
||||
"magistral-small-2509": {
|
||||
"description": "Magistral Small 1.2 是Mistral AI于2025年9月发布的开源小型推理模型,具有视觉支持。"
|
||||
},
|
||||
"mathstral": {
|
||||
"description": "MathΣtral 专为科学研究和数学推理设计,提供有效的计算能力和结果解释。"
|
||||
@@ -2282,9 +2312,6 @@
|
||||
"mistral/mistral-large": {
|
||||
"description": "Mistral Large 是复杂任务的理想选择,这些任务需要大型推理能力或高度专业化——如合成文本生成、代码生成、RAG 或代理。"
|
||||
},
|
||||
"mistral/mistral-saba-24b": {
|
||||
"description": "Mistral Saba 24B 是一个由 Mistral.ai 开发的 240 亿参数开源模型。Saba 是一个专门训练以在阿拉伯语、波斯语、乌尔都语、希伯来语和印度语言方面表现出色的专门模型。由 Groq 使用其自定义语言处理单元 (LPU) 硬件提供服务,以提供快速高效的推理。"
|
||||
},
|
||||
"mistral/mistral-small": {
|
||||
"description": "Mistral Small 是简单任务的理想选择,这些任务可以批量完成——如分类、客户支持或文本生成。它以可承受的价格点提供出色的性能。"
|
||||
},
|
||||
@@ -2357,9 +2384,6 @@
|
||||
"moonshotai/Kimi-Dev-72B": {
|
||||
"description": "Kimi-Dev-72B 是一款开源代码大模型,经过大规模强化学习优化,能输出稳健、可直接投产的补丁。该模型在 SWE-bench Verified 上取得 60.4 % 的新高分,刷新了开源模型在缺陷修复、代码评审等自动化软件工程任务上的纪录。"
|
||||
},
|
||||
"moonshotai/Kimi-K2-Instruct": {
|
||||
"description": "Kimi K2 是一款具备超强代码和 Agent 能力的 MoE 架构基础模型,总参数 1T,激活参数 32B。在通用知识推理、编程、数学、Agent 等主要类别的基准性能测试中,K2 模型的性能超过其他主流开源模型。"
|
||||
},
|
||||
"moonshotai/Kimi-K2-Instruct-0905": {
|
||||
"description": "Kimi K2-Instruct-0905 是 Kimi K2 最新、最强大的版本。它是一款顶尖的混合专家(MoE)语言模型,拥有 1 万亿的总参数和 320 亿的激活参数。该模型的主要特性包括:增强的智能体编码智能,在公开基准测试和真实世界的编码智能体任务中表现出显著的性能提升;改进的前端编码体验,在前端编程的美观性和实用性方面均有进步。"
|
||||
},
|
||||
@@ -2570,6 +2594,9 @@
|
||||
"qwen-image": {
|
||||
"description": "Qwen-Image 是一款通用图像生成模型,支持多种艺术风格,尤其擅长复杂文本渲染,特别是中英文文本渲染。模型支持多行布局、段落级文本生成以及细粒度细节刻画,可实现复杂的图文混合布局设计。"
|
||||
},
|
||||
"qwen-image-edit": {
|
||||
"description": "Qwen Image Edit 是一款图生图模型,支持基于输入图像和文本提示进行图像编辑和修改,能够根据用户需求对原图进行精准调整和创意改造。"
|
||||
},
|
||||
"qwen-long": {
|
||||
"description": "通义千问超大规模语言模型,支持长文本上下文,以及基于长文档、多文档等多个场景的对话功能。"
|
||||
},
|
||||
@@ -2804,8 +2831,11 @@
|
||||
"qwen3-coder-plus": {
|
||||
"description": "通义千问代码模型。最新的 Qwen3-Coder 系列模型是基于 Qwen3 的代码生成模型,具有强大的Coding Agent能力,擅长工具调用和环境交互,能够实现自主编程,代码能力卓越的同时兼具通用能力。"
|
||||
},
|
||||
"qwen3-max-preview": {
|
||||
"description": "通义千问3系列Max模型Preview版本,相较2.5系列整体通用能力有大幅度提升,中英文通用文本理解能力、复杂指令遵循能力、主观开放任务能力、多语言能力、工具调用能力均显著增强;模型知识幻觉更少。"
|
||||
"qwen3-coder:480b": {
|
||||
"description": "阿里巴巴针对代理和编码任务的高性能长上下文模型。"
|
||||
},
|
||||
"qwen3-max": {
|
||||
"description": "通义千问3系列Max模型,相较2.5系列整体通用能力有大幅度提升,中英文通用文本理解能力、复杂指令遵循能力、主观开放任务能力、多语言能力、工具调用能力均显著增强;模型知识幻觉更少。最新的qwen3-max模型:相较qwen3-max-preview版本,在智能体编程与工具调用方向进行了专项升级。本次发布的正式版模型达到领域SOTA水平,适配场景更加复杂的智能体需求。"
|
||||
},
|
||||
"qwen3-next-80b-a3b-instruct": {
|
||||
"description": "基于 Qwen3 的新一代非思考模式开源模型,相较上一版本(通义千问3-235B-A22B-Instruct-2507)中文文本理解能力更佳、逻辑推理能力有增强、文本生成类任务表现更好。"
|
||||
@@ -2813,6 +2843,9 @@
|
||||
"qwen3-next-80b-a3b-thinking": {
|
||||
"description": "基于 Qwen3 的新一代思考模式开源模型,相较上一版本(通义千问3-235B-A22B-Thinking-2507)指令遵循能力有提升、模型总结回复更加精简。"
|
||||
},
|
||||
"qwen3-vl-plus": {
|
||||
"description": "通义千问VL是具有视觉(图像)理解能力的文本生成模型,不仅能进行OCR(图片文字识别),还能进一步总结和推理,例如从商品照片中提取属性,根据习题图进行解题等。"
|
||||
},
|
||||
"qwq": {
|
||||
"description": "QwQ 是 Qwen 系列的推理模型。与传统的指令调优模型相比,QwQ 具备思考和推理的能力,能够在下游任务中,尤其是困难问题上,显著提升性能。QwQ-32B 是中型推理模型,能够在与最先进的推理模型(如 DeepSeek-R1、o1-mini)竞争时取得可观的表现。"
|
||||
},
|
||||
|
||||
@@ -281,6 +281,7 @@
|
||||
"actionFiletip": "上傳檔案",
|
||||
"actionTooltip": "上傳",
|
||||
"disabled": "當前模型不支援視覺識別和檔案分析,請切換模型後使用",
|
||||
"fileNotSupported": "瀏覽器模式下暫不支援上傳檔案,僅支援圖片",
|
||||
"visionNotSupported": "當前模型不支援視覺識別,請切換模型後使用"
|
||||
},
|
||||
"preview": {
|
||||
@@ -289,6 +290,9 @@
|
||||
"pending": "準備上傳...",
|
||||
"processing": "檔案處理中..."
|
||||
}
|
||||
},
|
||||
"validation": {
|
||||
"videoSizeExceeded": "影片檔案大小不能超過 20MB,當前檔案大小為 {{actualSize}}"
|
||||
}
|
||||
},
|
||||
"zenMode": "專注模式"
|
||||
|
||||
@@ -114,6 +114,7 @@
|
||||
"reasoning": "該模型支持深度思考",
|
||||
"search": "該模型支援聯網搜尋",
|
||||
"tokens": "該模型單一會話最多支援 {{tokens}} Tokens",
|
||||
"video": "該模型支援影片識別",
|
||||
"vision": "該模型支援視覺辨識"
|
||||
},
|
||||
"removed": "該模型不在清單中,若取消選取將會自動移除"
|
||||
|
||||
+53
-20
@@ -287,9 +287,6 @@
|
||||
"Pro/deepseek-ai/DeepSeek-V3.1": {
|
||||
"description": "DeepSeek-V3.1 是由深度求索(DeepSeek AI)發佈的混合模式大型語言模型,它在前代模型的基礎上進行了多方面的重要升級。該模型的一大創新是整合了「思考模式」(Thinking Mode)與「非思考模式」(Non-thinking Mode)於一體,使用者可以透過調整聊天範本靈活切換,以適應不同的任務需求。透過專門的後訓練優化,V3.1 在工具調用與 Agent 任務方面的效能獲得顯著提升,能更好地支援外部搜尋工具及執行多步複雜任務。該模型基於 DeepSeek-V3.1-Base 進行後訓練,透過兩階段長文本擴展方法,大幅增加訓練資料量,使其在處理長文件與長篇程式碼方面表現更佳。作為一個開源模型,DeepSeek-V3.1 在編碼、數學與推理等多個基準測試中展現了與頂尖閉源模型相媲美的能力,同時憑藉其混合專家(MoE)架構,在保持龐大模型容量的同時,有效降低推理成本。"
|
||||
},
|
||||
"Pro/moonshotai/Kimi-K2-Instruct": {
|
||||
"description": "Kimi K2 是一款具備超強程式碼和 Agent 能力的 MoE 架構基礎模型,總參數 1T,激活參數 32B。在通用知識推理、程式設計、數學、Agent 等主要類別的基準性能測試中,K2 模型的性能超過其他主流開源模型。"
|
||||
},
|
||||
"Pro/moonshotai/Kimi-K2-Instruct-0905": {
|
||||
"description": "Kimi K2-Instruct-0905 是 Kimi K2 最新、最強大的版本。它是一款頂尖的混合專家(MoE)語言模型,擁有 1 兆的總參數和 320 億的激活參數。該模型的主要特性包括:增強的智能體編碼智能,在公開基準測試和真實世界的編碼智能體任務中表現出顯著的性能提升;改進的前端編碼體驗,在前端程式設計的美觀性和實用性方面均有進步。"
|
||||
},
|
||||
@@ -380,6 +377,12 @@
|
||||
"Qwen/Qwen3-Coder-480B-A35B-Instruct": {
|
||||
"description": "Qwen3-Coder-480B-A35B-Instruct 是由阿里巴巴發佈的、迄今為止最具代理(Agentic)能力的程式碼模型。它是一個擁有 4,800 億總參數和 350 億激活參數的混合專家(MoE)模型,在效率和效能之間取得了平衡。該模型原生支援 256K(約 26 萬)tokens 的上下文長度,並可透過 YaRN 等外推方法擴展至 100 萬 tokens,使其能夠處理大規模程式碼庫與複雜的程式設計任務。Qwen3-Coder 專為代理式編碼工作流程設計,不僅能產生程式碼,還能與開發工具與環境自主互動,以解決複雜的程式設計問題。在多個編碼與代理任務的基準測試中,該模型在開源模型中達到頂尖水準,其表現可與 Claude Sonnet 4 等領先模型相媲美。"
|
||||
},
|
||||
"Qwen/Qwen3-Next-80B-A3B-Instruct": {
|
||||
"description": "Qwen3-Next-80B-A3B-Instruct 是由阿里巴巴通義千問團隊發布的下一代基礎模型。它基於全新的 Qwen3-Next 架構,旨在實現極致的訓練和推理效率。該模型採用了創新的混合注意力機制(Gated DeltaNet 和 Gated Attention)、高稀疏度混合專家(MoE)結構以及多項訓練穩定性優化。作為一個擁有 800 億總參數的稀疏模型,它在推理時僅需啟動約 30 億參數,從而大幅降低了計算成本,並在處理超過 32K tokens 的長上下文任務時,推理吞吐量比 Qwen3-32B 模型高出 10 倍以上。此模型為指令微調版本,專為通用任務設計,不支援思維鏈(Thinking)模式。在性能上,它與通義千問的旗艦模型 Qwen3-235B 在部分基準測試中表現相當,尤其在超長上下文任務中展現出明顯優勢。"
|
||||
},
|
||||
"Qwen/Qwen3-Next-80B-A3B-Thinking": {
|
||||
"description": "Qwen3-Next-80B-A3B-Thinking 是由阿里巴巴通義千問團隊發布的、專為複雜推理任務設計的下一代基礎模型。它基於創新的 Qwen3-Next 架構,該架構融合了混合注意力機制(Gated DeltaNet 與 Gated Attention)和高稀疏度混合專家(MoE)結構,旨在實現極致的訓練與推理效率。作為一個總參數達 800 億的稀疏模型,它在推理時僅啟動約 30 億參數,大幅降低了計算成本,在處理超過 32K tokens 的長上下文任務時,吞吐量比 Qwen3-32B 模型高出 10 倍以上。此“Thinking”版本專為執行數學證明、程式碼綜合、邏輯分析和規劃等高難度多步任務而優化,並預設以結構化的“思維鏈”形式輸出推理過程。在性能上,它不僅超越了 Qwen3-32B-Thinking 等成本更高的模型,還在多個基準測試中優於 Gemini-2.5-Flash-Thinking。"
|
||||
},
|
||||
"Qwen2-72B-Instruct": {
|
||||
"description": "Qwen2 是 Qwen 模型的最新系列,支持 128k 上下文,對比當前最優的開源模型,Qwen2-72B 在自然語言理解、知識、代碼、數學及多語言等多項能力上均顯著超越當前領先的模型。"
|
||||
},
|
||||
@@ -809,9 +812,6 @@
|
||||
"codex-mini-latest": {
|
||||
"description": "codex-mini-latest 是 o4-mini 的微調版本,專門用於 Codex CLI。對於直接透過 API 使用,我們推薦從 gpt-4.1 開始。"
|
||||
},
|
||||
"cognitivecomputations/dolphin-mixtral-8x22b": {
|
||||
"description": "Dolphin Mixtral 8x22B 是一款為指令遵循、對話和編程設計的模型。"
|
||||
},
|
||||
"cogview-4": {
|
||||
"description": "CogView-4 是智譜首個支援生成漢字的開源文生圖模型,在語義理解、圖像生成質量、中英文字生成能力等方面全面提升,支援任意長度的中英雙語輸入,能夠生成在給定範圍內的任意解析度圖像。"
|
||||
},
|
||||
@@ -926,6 +926,9 @@
|
||||
"deepseek-ai/deepseek-r1": {
|
||||
"description": "最先進的高效 LLM,擅長推理、數學和編程。"
|
||||
},
|
||||
"deepseek-ai/deepseek-v3.1": {
|
||||
"description": "DeepSeek V3.1:下一代推理模型,提升了複雜推理與鏈路思考能力,適合需要深入分析的任務。"
|
||||
},
|
||||
"deepseek-ai/deepseek-vl2": {
|
||||
"description": "DeepSeek-VL2 是一個基於 DeepSeekMoE-27B 開發的混合專家(MoE)視覺語言模型,採用稀疏激活的 MoE 架構,在僅激活 4.5B 參數的情況下實現了卓越性能。該模型在視覺問答、光學字符識別、文檔/表格/圖表理解和視覺定位等多個任務中表現優異。"
|
||||
},
|
||||
@@ -1007,6 +1010,9 @@
|
||||
"deepseek-v3.1": {
|
||||
"description": "DeepSeek-V3.1 是深度求索全新推出的混合推理模型,支援思考與非思考兩種推理模式,較 DeepSeek-R1-0528 思考效率更高。經過後訓練優化,Agent 工具使用與智能體任務表現大幅提升。支援 128k 上下文視窗,輸出長度支援最大 64k tokens。"
|
||||
},
|
||||
"deepseek-v3.1:671b": {
|
||||
"description": "DeepSeek V3.1:下一代推理模型,提升了複雜推理與鏈路思考能力,適合需要深入分析的任務。"
|
||||
},
|
||||
"deepseek/deepseek-chat-v3-0324": {
|
||||
"description": "DeepSeek V3 是一個 685B 參數的專家混合模型,是 DeepSeek 團隊旗艦聊天模型系列的最新迭代。\n\n它繼承了 [DeepSeek V3](/deepseek/deepseek-chat-v3) 模型,並在各種任務上表現出色。"
|
||||
},
|
||||
@@ -1626,7 +1632,7 @@
|
||||
"description": "ChatGPT-4o 是一款動態模型,實時更新以保持當前最新版本。它結合了強大的語言理解與生成能力,適合於大規模應用場景,包括客戶服務、教育和技術支持。"
|
||||
},
|
||||
"gpt-4o-audio-preview": {
|
||||
"description": "GPT-4o Audio 模型,支持音頻輸入輸出"
|
||||
"description": "GPT-4o Audio Preview 模型,支援音訊輸入輸出"
|
||||
},
|
||||
"gpt-4o-mini": {
|
||||
"description": "GPT-4o mini是OpenAI在GPT-4 Omni之後推出的最新模型,支持圖文輸入並輸出文本。作為他們最先進的小型模型,它比其他近期的前沿模型便宜很多,並且比GPT-3.5 Turbo便宜超過60%。它保持了最先進的智能,同時具有顯著的性價比。GPT-4o mini在MMLU測試中獲得了82%的得分,目前在聊天偏好上排名高於GPT-4。"
|
||||
@@ -1667,24 +1673,33 @@
|
||||
"gpt-5-chat-latest": {
|
||||
"description": "ChatGPT 中使用的 GPT-5 模型。結合了強大的語言理解與生成能力,適合對話式互動應用。"
|
||||
},
|
||||
"gpt-5-codex": {
|
||||
"description": "GPT-5 Codex 是一個針對 Codex 或類似環境中的代理編碼任務優化的 GPT-5 版本。"
|
||||
},
|
||||
"gpt-5-mini": {
|
||||
"description": "更快、更經濟高效的 GPT-5 版本,適用於明確定義的任務。在保持高品質輸出的同時,提供更快的回應速度。"
|
||||
},
|
||||
"gpt-5-nano": {
|
||||
"description": "最快、最經濟高效的 GPT-5 版本。非常適合需要快速回應且成本敏感的應用場景。"
|
||||
},
|
||||
"gpt-audio": {
|
||||
"description": "GPT Audio 是面向音訊輸入輸出的通用聊天模型,支援在 Chat Completions API 中使用音訊 I/O。"
|
||||
},
|
||||
"gpt-image-1": {
|
||||
"description": "ChatGPT 原生多模態圖片生成模型"
|
||||
},
|
||||
"gpt-oss": {
|
||||
"description": "GPT-OSS 20B 是 OpenAI 發布的開源大型語言模型,採用 MXFP4 量化技術,適合在高端消費級 GPU 或 Apple Silicon Mac 上運行。該模型在對話生成、程式碼撰寫和推理任務方面表現出色,支援函數呼叫和工具使用。"
|
||||
},
|
||||
"gpt-oss-120b": {
|
||||
"description": "GPT-OSS-120B MXFP4 量化的 Transformer 結構,在資源受限時仍能保持強勁性能。"
|
||||
},
|
||||
"gpt-oss:120b": {
|
||||
"description": "GPT-OSS 120B 是 OpenAI 發布的大型開源語言模型,採用 MXFP4 量化技術,為旗艦級模型。需要多 GPU 或高效能工作站環境運行,在複雜推理、程式碼生成和多語言處理方面具備卓越性能,支援高級函數呼叫和工具整合。"
|
||||
},
|
||||
"gpt-oss:20b": {
|
||||
"description": "GPT-OSS 20B 是 OpenAI 發布的開源大型語言模型,採用 MXFP4 量化技術,適合在高端消費級 GPU 或 Apple Silicon Mac 上運行。該模型在對話生成、程式碼編寫和推理任務方面表現出色,支援函數調用和工具使用。"
|
||||
},
|
||||
"gpt-realtime": {
|
||||
"description": "通用即時模型,支援文字與音訊的即時輸入輸出,並支援影像輸入。"
|
||||
},
|
||||
"grok-2-1212": {
|
||||
"description": "該模型在準確性、指令遵循和多語言能力方面有所改進。"
|
||||
},
|
||||
@@ -1712,6 +1727,12 @@
|
||||
"grok-4-0709": {
|
||||
"description": "xAI 的 Grok 4,具備強大的推理能力。"
|
||||
},
|
||||
"grok-4-fast-non-reasoning": {
|
||||
"description": "我們很高興發布 Grok 4 Fast,這是我們在成本效益推理模型方面的最新進展。"
|
||||
},
|
||||
"grok-4-fast-reasoning": {
|
||||
"description": "我們很高興發布 Grok 4 Fast,這是我們在成本效益推理模型方面的最新進展。"
|
||||
},
|
||||
"grok-code-fast-1": {
|
||||
"description": "我們很高興推出 grok-code-fast-1,這是一款快速且經濟高效的推理模型,在代理編碼方面表現出色。"
|
||||
},
|
||||
@@ -1847,8 +1868,14 @@
|
||||
"inception/mercury-coder-small": {
|
||||
"description": "Mercury Coder Small 是程式碼生成、除錯和重構任務的理想選擇,具有最小延遲。"
|
||||
},
|
||||
"inclusionAI/Ling-flash-2.0": {
|
||||
"description": "Ling-flash-2.0 是由螞蟻集團百靈團隊發布的 Ling 2.0 架構系列的第三款模型。它是一款混合專家(MoE)模型,總參數規模達到 1000 億,但每個 token 僅啟動 61 億參數(非詞向量啟動 48 億)。作為一個輕量級配置的模型,Ling-flash-2.0 在多個權威評測中展現出媲美甚至超越 400 億級別稠密(Dense)模型及更大規模 MoE 模型的性能。該模型旨在透過極致的架構設計與訓練策略,在「大模型等於大參數」的共識下探索高效能的路徑。"
|
||||
},
|
||||
"inclusionAI/Ling-mini-2.0": {
|
||||
"description": "Ling-mini-2.0 是一款基於 MoE 架構的小尺寸高效能大型語言模型。它擁有 16B 總參數,但每個 token 僅激活 1.4B(non-embedding 789M),從而實現了極高的生成速度。得益於高效的 MoE 設計與大規模高品質訓練資料,儘管激活參數僅為 1.4B,Ling-mini-2.0 依然在下游任務中展現出可媲美 10B 以下 dense LLM 及更大規模 MoE 模型的頂尖性能。"
|
||||
"description": "Ling-mini-2.0 是一款基於 MoE 架構的小尺寸高性能大型語言模型。它擁有 16B 總參數,但每個 token 僅啟動 1.4B(non-embedding 789M),從而實現了極高的生成速度。得益於高效的 MoE 設計與大規模高品質訓練資料,儘管啟動參數僅為 1.4B,Ling-mini-2.0 依然在下游任務中展現出可媲美 10B 以下 dense LLM 及更大規模 MoE 模型的頂尖性能。"
|
||||
},
|
||||
"inclusionAI/Ring-flash-2.0": {
|
||||
"description": "Ring-flash-2.0 是一個基於 Ling-flash-2.0-base 深度優化的高性能思考模型。它採用混合專家(MoE)架構,總參數量為 100B,但在每次推理中僅啟動 6.1B 參數。該模型透過獨創的 icepop 演算法,解決了 MoE 大模型在強化學習(RL)訓練中的不穩定性難題,使其複雜推理能力在長週期訓練中得以持續提升。Ring-flash-2.0 在數學競賽、程式碼生成和邏輯推理等多個高難度基準測試中取得了顯著突破,其性能不僅超越了 40B 參數規模以下的頂尖稠密模型,還能媲美更大規模的開源 MoE 模型及閉源的高性能思考模型。儘管該模型專注於複雜推理,它在創意寫作等任務上也表現出色。此外,得益於其高效的架構設計,Ring-flash-2.0 在提供強大性能的同時,也實現了高速推理,顯著降低了思考模型在高併發場景下的部署成本。"
|
||||
},
|
||||
"internlm/internlm2_5-7b-chat": {
|
||||
"description": "InternLM2.5 提供多場景下的智能對話解決方案。"
|
||||
@@ -1974,7 +2001,10 @@
|
||||
"description": "LLaVA 是結合視覺編碼器和 Vicuna 的多模態模型,用於強大的視覺和語言理解。"
|
||||
},
|
||||
"magistral-medium-latest": {
|
||||
"description": "Magistral Medium 1.1 為 Mistral AI 於 2025 年 7 月發佈的尖端推理模型。"
|
||||
"description": "Magistral Medium 1.2 是 Mistral AI 於 2025 年 9 月發布的前沿級推理模型,具備視覺支援。"
|
||||
},
|
||||
"magistral-small-2509": {
|
||||
"description": "Magistral Small 1.2 是 Mistral AI 於 2025 年 9 月發布的開源小型推理模型,具備視覺支援。"
|
||||
},
|
||||
"mathstral": {
|
||||
"description": "MathΣtral 專為科學研究和數學推理設計,提供有效的計算能力和結果解釋。"
|
||||
@@ -2282,9 +2312,6 @@
|
||||
"mistral/mistral-large": {
|
||||
"description": "Mistral Large 是複雜任務的理想選擇,這些任務需要大型推理能力或高度專業化——如合成文字生成、程式碼生成、RAG 或代理。"
|
||||
},
|
||||
"mistral/mistral-saba-24b": {
|
||||
"description": "Mistral Saba 24B 是一個由 Mistral.ai 開發的 240 億參數開源模型。Saba 是一個專門訓練以在阿拉伯語、波斯語、烏爾都語、希伯來語和印度語言方面表現出色的專門模型。由 Groq 使用其自訂語言處理單元 (LPU) 硬體提供服務,以提供快速高效的推理。"
|
||||
},
|
||||
"mistral/mistral-small": {
|
||||
"description": "Mistral Small 是簡單任務的理想選擇,這些任務可以批量完成——如分類、客戶支援或文字生成。它以可負擔的價格點提供出色的性能。"
|
||||
},
|
||||
@@ -2357,9 +2384,6 @@
|
||||
"moonshotai/Kimi-Dev-72B": {
|
||||
"description": "Kimi-Dev-72B 是一款開源程式碼大型模型,經過大規模強化學習優化,能輸出穩健、可直接投產的補丁。該模型在 SWE-bench Verified 上取得 60.4 % 的新高分,刷新了開源模型在缺陷修復、程式碼審查等自動化軟體工程任務上的紀錄。"
|
||||
},
|
||||
"moonshotai/Kimi-K2-Instruct": {
|
||||
"description": "Kimi K2 是一款具備超強程式碼和 Agent 能力的 MoE 架構基礎模型,總參數 1T,激活參數 32B。在通用知識推理、程式設計、數學、Agent 等主要類別的基準性能測試中,K2 模型的性能超過其他主流開源模型。"
|
||||
},
|
||||
"moonshotai/Kimi-K2-Instruct-0905": {
|
||||
"description": "Kimi K2-Instruct-0905 是 Kimi K2 最新、最強大的版本。它是一款頂尖的混合專家(MoE)語言模型,擁有 1 兆的總參數和 320 億的激活參數。該模型的主要特性包括:增強的智能體編碼智能,在公開基準測試和真實世界的編碼智能體任務中表現出顯著的性能提升;改進的前端編碼體驗,在前端程式設計的美觀性和實用性方面均有進步。"
|
||||
},
|
||||
@@ -2570,6 +2594,9 @@
|
||||
"qwen-image": {
|
||||
"description": "Qwen-Image 是一款通用圖像生成模型,支援多種藝術風格,尤其擅長複雜文字渲染,特別是中英文文字的呈現。模型支援多行版式、段落級文字生成以及細緻的細節刻畫,可實現複雜的圖文混合版面設計。"
|
||||
},
|
||||
"qwen-image-edit": {
|
||||
"description": "Qwen Image Edit 是一款圖生圖模型,支援基於輸入圖像和文字提示進行圖像編輯和修改,能夠根據使用者需求對原圖進行精準調整和創意改造。"
|
||||
},
|
||||
"qwen-long": {
|
||||
"description": "通義千問超大規模語言模型,支持長文本上下文,以及基於長文檔、多文檔等多個場景的對話功能。"
|
||||
},
|
||||
@@ -2804,8 +2831,11 @@
|
||||
"qwen3-coder-plus": {
|
||||
"description": "通義千問程式碼模型。最新的 Qwen3-Coder 系列模型是基於 Qwen3 的程式碼生成模型,具有強大的Coding Agent能力,擅長工具調用和環境互動,能夠實現自主程式設計,程式碼能力卓越的同時兼具通用能力。"
|
||||
},
|
||||
"qwen3-max-preview": {
|
||||
"description": "通義千問3系列 Max 模型 Preview 版本,相較 2.5 系列整體通用能力有大幅度提升,中英文通用文本理解能力、複雜指令遵循能力、主觀開放任務能力、多語言能力、工具調用能力均顯著增強;模型知識幻覺更少。"
|
||||
"qwen3-coder:480b": {
|
||||
"description": "阿里巴巴針對代理和編碼任務的高性能長上下文模型。"
|
||||
},
|
||||
"qwen3-max": {
|
||||
"description": "通義千問3系列Max模型,相較2.5系列整體通用能力有大幅度提升,中英文通用文本理解能力、複雜指令遵循能力、主觀開放任務能力、多語言能力、工具調用能力均顯著增強;模型知識幻覺更少。最新的qwen3-max模型:相較qwen3-max-preview版本,在智能體編程與工具調用方向進行了專項升級。本次發布的正式版模型達到領域SOTA水平,適配場景更加複雜的智能體需求。"
|
||||
},
|
||||
"qwen3-next-80b-a3b-instruct": {
|
||||
"description": "基於 Qwen3 的新一代非思考模式開源模型,相較上一版本(通義千問3-235B-A22B-Instruct-2507)中文文本理解能力更佳、邏輯推理能力有增強、文本生成類任務表現更好。"
|
||||
@@ -2813,6 +2843,9 @@
|
||||
"qwen3-next-80b-a3b-thinking": {
|
||||
"description": "基於 Qwen3 的新一代思考模式開源模型,相較上一版本(通義千問3-235B-A22B-Thinking-2507)指令遵循能力有提升、模型總結回覆更加精簡。"
|
||||
},
|
||||
"qwen3-vl-plus": {
|
||||
"description": "通義千問VL是具有視覺(圖像)理解能力的文本生成模型,不僅能進行OCR(圖片文字識別),還能進一步總結和推理,例如從商品照片中提取屬性,根據習題圖進行解題等。"
|
||||
},
|
||||
"qwq": {
|
||||
"description": "QwQ 是一個實驗研究模型,專注於提高 AI 推理能力。"
|
||||
},
|
||||
|
||||
+7
-5
@@ -21,6 +21,7 @@ const standaloneConfig: NextConfig = {
|
||||
|
||||
const nextConfig: NextConfig = {
|
||||
...(isStandaloneMode ? standaloneConfig : {}),
|
||||
assetPrefix: process.env.NEXT_PUBLIC_ASSET_PREFIX,
|
||||
compiler: {
|
||||
emotion: true,
|
||||
},
|
||||
@@ -244,11 +245,11 @@ const nextConfig: NextConfig = {
|
||||
permanent: true,
|
||||
source: '/discover/providers',
|
||||
},
|
||||
{
|
||||
destination: '/settings/common',
|
||||
permanent: true,
|
||||
source: '/settings',
|
||||
},
|
||||
// {
|
||||
// destination: '/settings/common',
|
||||
// permanent: true,
|
||||
// source: '/settings',
|
||||
// },
|
||||
{
|
||||
destination: '/chat',
|
||||
permanent: true,
|
||||
@@ -271,6 +272,7 @@ const nextConfig: NextConfig = {
|
||||
// when external packages in dev mode with turbopack, this config will lead to bundle error
|
||||
serverExternalPackages: isProd ? ['@electric-sql/pglite'] : undefined,
|
||||
transpilePackages: ['pdfjs-dist', 'mermaid'],
|
||||
|
||||
typescript: {
|
||||
ignoreBuildErrors: true,
|
||||
},
|
||||
|
||||
+12
-11
@@ -1,6 +1,6 @@
|
||||
{
|
||||
"name": "@lobehub/chat",
|
||||
"version": "1.130.0",
|
||||
"version": "1.132.15",
|
||||
"description": "Lobe Chat - an open-source, high-performance chatbot framework that supports speech synthesis, multimodal, and extensible Function Call plugin system. Supports one-click free deployment of your private ChatGPT/LLM web application.",
|
||||
"keywords": [
|
||||
"framework",
|
||||
@@ -122,10 +122,10 @@
|
||||
"dependencies": {
|
||||
"@ant-design/icons": "^5.6.1",
|
||||
"@ant-design/pro-components": "^2.8.10",
|
||||
"@anthropic-ai/sdk": "^0.62.0",
|
||||
"@anthropic-ai/sdk": "^0.63.0",
|
||||
"@auth/core": "^0.40.0",
|
||||
"@aws-sdk/client-s3": "^3.887.0",
|
||||
"@aws-sdk/s3-request-presigner": "^3.887.0",
|
||||
"@aws-sdk/client-s3": "~3.893.0",
|
||||
"@aws-sdk/s3-request-presigner": "~3.893.0",
|
||||
"@azure-rest/ai-inference": "1.0.0-beta.5",
|
||||
"@azure/core-auth": "^1.10.1",
|
||||
"@cfworker/json-schema": "^4.1.1",
|
||||
@@ -151,6 +151,7 @@
|
||||
"@lobechat/electron-server-ipc": "workspace:*",
|
||||
"@lobechat/file-loaders": "workspace:*",
|
||||
"@lobechat/model-runtime": "workspace:*",
|
||||
"@lobechat/observability-otel": "workspace:*",
|
||||
"@lobechat/prompts": "workspace:*",
|
||||
"@lobechat/utils": "workspace:*",
|
||||
"@lobechat/web-crawler": "workspace:*",
|
||||
@@ -158,11 +159,11 @@
|
||||
"@lobehub/charts": "^2.1.2",
|
||||
"@lobehub/chat-plugin-sdk": "^1.32.4",
|
||||
"@lobehub/chat-plugins-gateway": "^1.9.0",
|
||||
"@lobehub/editor": "^1.8.5",
|
||||
"@lobehub/editor": "^1.11.0",
|
||||
"@lobehub/icons": "^2.32.2",
|
||||
"@lobehub/market-sdk": "^0.22.7",
|
||||
"@lobehub/tts": "^2.0.1",
|
||||
"@lobehub/ui": "^2.12.4",
|
||||
"@lobehub/ui": "^2.13.0",
|
||||
"@modelcontextprotocol/sdk": "^1.18.0",
|
||||
"@neondatabase/serverless": "^1.0.1",
|
||||
"@next/third-parties": "^15.5.3",
|
||||
@@ -260,7 +261,7 @@
|
||||
"remark": "^15.0.1",
|
||||
"remark-gfm": "^4.0.1",
|
||||
"remark-html": "^16.0.1",
|
||||
"request-filtering-agent": "^2.0.1",
|
||||
"request-filtering-agent": "^3.0.0",
|
||||
"resolve-accept-language": "^3.1.13",
|
||||
"rtl-detect": "^1.1.2",
|
||||
"semver": "^7.7.2",
|
||||
@@ -271,8 +272,8 @@
|
||||
"svix": "^1.76.1",
|
||||
"swr": "2.3.4",
|
||||
"systemjs": "^6.15.1",
|
||||
"tokenx": "^0.4.1",
|
||||
"ts-md5": "^1.3.1",
|
||||
"tokenx": "^1.0.0",
|
||||
"ts-md5": "^2.0.0",
|
||||
"ua-parser-js": "^1.0.41",
|
||||
"unstructured-client": "^0.19.0",
|
||||
"url-join": "^5.0.0",
|
||||
@@ -321,7 +322,6 @@
|
||||
"@types/systemjs": "^6.15.3",
|
||||
"@types/ua-parser-js": "^0.7.39",
|
||||
"@types/unist": "^3.0.3",
|
||||
"@types/uuid": "^10.0.0",
|
||||
"@types/ws": "^8.18.1",
|
||||
"@typescript/native-preview": "7.0.0-dev.20250711.1",
|
||||
"@vitest/coverage-v8": "^3.2.4",
|
||||
@@ -343,6 +343,7 @@
|
||||
"glob": "^11.0.3",
|
||||
"happy-dom": "^18.0.1",
|
||||
"husky": "^9.1.7",
|
||||
"import-in-the-middle": "^1.14.2",
|
||||
"just-diff": "^6.0.2",
|
||||
"lint-staged": "^15.5.2",
|
||||
"lodash": "^4.17.21",
|
||||
@@ -369,7 +370,7 @@
|
||||
"vite": "^7.1.5",
|
||||
"vitest": "^3.2.4"
|
||||
},
|
||||
"packageManager": "pnpm@10.16.1",
|
||||
"packageManager": "pnpm@10.17.0",
|
||||
"publishConfig": {
|
||||
"access": "public",
|
||||
"registry": "https://registry.npmjs.org"
|
||||
|
||||
@@ -1,7 +1,5 @@
|
||||
import { authEnv } from '@/envs/auth';
|
||||
|
||||
export const enableClerk = authEnv.NEXT_PUBLIC_ENABLE_CLERK_AUTH;
|
||||
export const enableNextAuth = authEnv.NEXT_PUBLIC_ENABLE_NEXT_AUTH;
|
||||
export const enableClerk = !!process.env.NEXT_PUBLIC_CLERK_PUBLISHABLE_KEY;
|
||||
export const enableNextAuth = process.env.NEXT_PUBLIC_ENABLE_NEXT_AUTH === '1';
|
||||
export const enableAuth = enableClerk || enableNextAuth || false;
|
||||
|
||||
export const LOBE_CHAT_AUTH_HEADER = 'X-lobe-chat-auth';
|
||||
|
||||
@@ -12,6 +12,8 @@ export const ORG_NAME = 'LobeHub';
|
||||
export const BRANDING_URL = {
|
||||
help: undefined,
|
||||
privacy: undefined,
|
||||
subscription: undefined,
|
||||
support: undefined,
|
||||
terms: undefined,
|
||||
};
|
||||
|
||||
@@ -27,3 +29,7 @@ export const BRANDING_EMAIL = {
|
||||
business: 'hello@lobehub.com',
|
||||
support: 'support@lobehub.com',
|
||||
};
|
||||
|
||||
export const BRANDING_PROVIDER = 'lobehub';
|
||||
|
||||
export const COPYRIGHT = `© ${new Date().getFullYear()} ${ORG_NAME}`;
|
||||
|
||||
@@ -4,6 +4,8 @@ import { BRANDING_LOGO_URL } from './branding';
|
||||
|
||||
export const DEFAULT_AVATAR = '🤖';
|
||||
export const DEFAULT_USER_AVATAR = '😀';
|
||||
export const DEFAULT_SUPERVISOR_AVATAR = '🎙️';
|
||||
export const DEFAULT_SUPERVISOR_ID = 'supervisor';
|
||||
export const DEFAULT_BACKGROUND_COLOR = 'rgba(0,0,0,0)';
|
||||
export const DEFAULT_AGENT_META: MetaData = {};
|
||||
export const DEFAULT_INBOX_AVATAR = BRANDING_LOGO_URL || '🤯';
|
||||
|
||||
@@ -3,7 +3,9 @@ export const PLUGIN_SCHEMA_API_MD5_PREFIX = 'MD5HASH_';
|
||||
|
||||
export const ARTIFACT_TAG = 'lobeArtifact';
|
||||
export const ARTIFACT_THINKING_TAG = 'lobeThinking';
|
||||
|
||||
export const MENTION_TAG = 'mention';
|
||||
export const THINKING_TAG = 'think';
|
||||
export const LOCAL_FILE_TAG = 'localFile';
|
||||
// https://regex101.com/r/TwzTkf/2
|
||||
export const ARTIFACT_TAG_REGEX = /<lobeArtifact\b[^>]*>(?<content>[\S\s]*?)(?:<\/lobeArtifact>|$)/;
|
||||
|
||||
@@ -14,3 +16,5 @@ export const ARTIFACT_TAG_CLOSED_REGEX = /<lobeArtifact\b[^>]*>([\S\s]*?)<\/lobe
|
||||
export const ARTIFACT_THINKING_TAG_REGEX = /<lobeThinking\b[^>]*>([\S\s]*?)(?:<\/lobeThinking>|$)/;
|
||||
|
||||
export const THINKING_TAG_REGEX = /<think\b[^>]*>([\S\s]*?)(?:<\/think>|$)/;
|
||||
|
||||
export const MENTION_TAG_REGEX = /<mention\b[^>]*>([\S\s]*?)(?:<\/mention>|$)/;
|
||||
|
||||
@@ -1,7 +1,8 @@
|
||||
import { LobeAgentSession, LobeSessionType } from '@lobechat/types';
|
||||
import { LobeAgentSession, LobeGroupSession, LobeSessionType } from '@lobechat/types';
|
||||
|
||||
import { DEFAULT_AGENT_META } from './meta';
|
||||
import { DEFAULT_AGENT_META, DEFAULT_INBOX_AVATAR } from './meta';
|
||||
import { DEFAULT_AGENT_CONFIG } from './settings';
|
||||
import { merge } from './utils/merge';
|
||||
|
||||
export const INBOX_SESSION_ID = 'inbox';
|
||||
|
||||
@@ -16,3 +17,19 @@ export const DEFAULT_AGENT_LOBE_SESSION: LobeAgentSession = {
|
||||
type: LobeSessionType.Agent,
|
||||
updatedAt: new Date(),
|
||||
};
|
||||
|
||||
export const DEFAULT_GROUP_LOBE_SESSION: LobeGroupSession = {
|
||||
createdAt: new Date(),
|
||||
id: '',
|
||||
members: [],
|
||||
meta: DEFAULT_AGENT_META,
|
||||
type: LobeSessionType.Group,
|
||||
updatedAt: new Date(),
|
||||
};
|
||||
|
||||
export const DEFAULT_INBOX_SESSION: LobeAgentSession = merge(DEFAULT_AGENT_LOBE_SESSION, {
|
||||
id: 'inbox',
|
||||
meta: {
|
||||
avatar: DEFAULT_INBOX_AVATAR,
|
||||
},
|
||||
});
|
||||
|
||||
@@ -4,7 +4,7 @@ import { describe, expect, it, vi } from 'vitest';
|
||||
import { genUserLLMConfig } from './genUserLLMConfig';
|
||||
|
||||
// Mock ModelProvider enum
|
||||
vi.mock('@lobechat/model-runtime', () => ({
|
||||
vi.mock('model-bank', () => ({
|
||||
ModelProvider: {
|
||||
Ollama: 'ollama',
|
||||
OpenAI: 'openai',
|
||||
|
||||
@@ -1,5 +1,5 @@
|
||||
import { ModelProvider } from '@lobechat/model-runtime';
|
||||
import { ModelProviderCard, UserModelProviderConfig } from '@lobechat/types';
|
||||
import { ModelProvider } from 'model-bank';
|
||||
|
||||
import * as ProviderCards from '@/config/modelProviders';
|
||||
|
||||
|
||||
@@ -0,0 +1,30 @@
|
||||
import {
|
||||
LobeChatGroupChatConfig,
|
||||
LobeChatGroupFullConfig,
|
||||
LobeChatGroupMetaConfig,
|
||||
} from '@lobechat/types';
|
||||
|
||||
import { DEFAULT_MODEL, DEFAULT_PROVIDER } from './llm';
|
||||
|
||||
export const DEFAULT_CHAT_GROUP_CHAT_CONFIG: LobeChatGroupChatConfig = {
|
||||
allowDM: true,
|
||||
enableSupervisor: true,
|
||||
maxResponseInRow: 10,
|
||||
orchestratorModel: DEFAULT_MODEL,
|
||||
orchestratorProvider: DEFAULT_PROVIDER,
|
||||
responseOrder: 'natural',
|
||||
responseSpeed: 'fast',
|
||||
revealDM: false,
|
||||
scene: 'productive',
|
||||
systemPrompt: '',
|
||||
};
|
||||
|
||||
export const DEFAULT_CHAT_GROUP_META_CONFIG: LobeChatGroupMetaConfig = {
|
||||
description: '',
|
||||
title: '',
|
||||
};
|
||||
|
||||
export const DEFAULT_CHAT_GROUP_CONFIG: LobeChatGroupFullConfig = {
|
||||
chat: DEFAULT_CHAT_GROUP_CHAT_CONFIG,
|
||||
meta: DEFAULT_CHAT_GROUP_META_CONFIG,
|
||||
};
|
||||
@@ -9,6 +9,7 @@ import { DEFAULT_TOOL_CONFIG } from './tool';
|
||||
import { DEFAULT_TTS_CONFIG } from './tts';
|
||||
|
||||
export * from './agent';
|
||||
export * from './group';
|
||||
export * from './hotkey';
|
||||
export * from './llm';
|
||||
export * from './systemAgent';
|
||||
|
||||
@@ -1,11 +1,12 @@
|
||||
import qs from 'query-string';
|
||||
import urlJoin from 'url-join';
|
||||
|
||||
import { BRANDING_EMAIL, BRANDING_URL } from './branding';
|
||||
import { INBOX_SESSION_ID } from './session';
|
||||
|
||||
const isDev = process.env.NODE_ENV === 'development';
|
||||
|
||||
export const UTM_SOURCE = 'chat_preview';
|
||||
export const UTM_SOURCE = 'chat_community';
|
||||
|
||||
export const OFFICIAL_URL = 'https://lobechat.com';
|
||||
export const OFFICIAL_PREVIEW_URL = 'https://chat-preview.lobehub.com';
|
||||
@@ -62,6 +63,7 @@ export const LOBE_URL_IMPORT_NAME = 'settings';
|
||||
export const RELEASES_URL = urlJoin(GITHUB, 'releases');
|
||||
|
||||
export const mailTo = (email: string) => `mailto:${email}`;
|
||||
export const SUPPORT_URL = BRANDING_URL.support ?? `mailto:${BRANDING_EMAIL.support}`;
|
||||
|
||||
export const AES_GCM_URL = 'https://datatracker.ietf.org/doc/html/draft-ietf-avt-srtp-aes-gcm-01';
|
||||
export const BASE_PROVIDER_DOC_URL = 'https://lobehub.com/docs/usage/providers';
|
||||
|
||||
@@ -0,0 +1,62 @@
|
||||
import { merge as _merge, isEmpty, mergeWith } from 'lodash-es';
|
||||
|
||||
/**
|
||||
* 用于合并对象,如果是数组则直接替换
|
||||
* @param target
|
||||
* @param source
|
||||
*/
|
||||
export const merge: typeof _merge = <T = object>(target: T, source: T) =>
|
||||
mergeWith({}, target, source, (obj, src) => {
|
||||
if (Array.isArray(obj)) return src;
|
||||
});
|
||||
|
||||
type MergeableItem = {
|
||||
[key: string]: any;
|
||||
id: string;
|
||||
};
|
||||
|
||||
/**
|
||||
* Merge two arrays based on id, preserving metadata from default items
|
||||
* @param defaultItems Items with default configuration and metadata
|
||||
* @param userItems User-defined items with higher priority
|
||||
*/
|
||||
export const mergeArrayById = <T extends MergeableItem>(defaultItems: T[], userItems: T[]): T[] => {
|
||||
// Create a map of default items for faster lookup
|
||||
const defaultItemsMap = new Map(defaultItems.map((item) => [item.id, item]));
|
||||
|
||||
// 使用 Map 存储合并结果,这样重复 ID 的后项会自然覆盖前项
|
||||
const mergedItemsMap = new Map<string, T>();
|
||||
|
||||
// Process user items with default metadata
|
||||
userItems.forEach((userItem) => {
|
||||
const defaultItem = defaultItemsMap.get(userItem.id);
|
||||
if (!defaultItem) {
|
||||
mergedItemsMap.set(userItem.id, userItem);
|
||||
return;
|
||||
}
|
||||
|
||||
const mergedItem: T = { ...defaultItem };
|
||||
Object.entries(userItem).forEach(([key, value]) => {
|
||||
if (value !== null && value !== undefined && !(typeof value === 'object' && isEmpty(value))) {
|
||||
// @ts-expect-error
|
||||
mergedItem[key] = value;
|
||||
}
|
||||
|
||||
if (typeof value === 'object' && !isEmpty(value)) {
|
||||
// @ts-expect-error
|
||||
mergedItem[key] = merge(defaultItem[key], value);
|
||||
}
|
||||
});
|
||||
|
||||
mergedItemsMap.set(userItem.id, mergedItem);
|
||||
});
|
||||
|
||||
// 添加只在默认配置中存在的项
|
||||
defaultItems.forEach((item) => {
|
||||
if (!mergedItemsMap.has(item.id)) {
|
||||
mergedItemsMap.set(item.id, item);
|
||||
}
|
||||
});
|
||||
|
||||
return Array.from(mergedItemsMap.values());
|
||||
};
|
||||
@@ -18,6 +18,9 @@
|
||||
"test:update": "vitest -u"
|
||||
},
|
||||
"dependencies": {
|
||||
"@lobechat/prompts": "workspace:*",
|
||||
"@lobechat/types": "workspace:*",
|
||||
"@lobechat/utils": "workspace:*",
|
||||
"debug": "^4.3.4",
|
||||
"immer": "^10.0.3",
|
||||
"lodash-es": "^4.17.21"
|
||||
@@ -25,16 +28,5 @@
|
||||
"devDependencies": {
|
||||
"@types/debug": "^4.1.12",
|
||||
"@types/lodash-es": "^4.17.12"
|
||||
},
|
||||
"peerDependencies": {
|
||||
"@lobechat/const": "workspace:*",
|
||||
"@lobechat/model-runtime": "workspace:*",
|
||||
"@lobechat/prompts": "workspace:*",
|
||||
"@lobechat/types": "workspace:*",
|
||||
"@lobechat/utils": "workspace:*"
|
||||
},
|
||||
"publishConfig": {
|
||||
"access": "public",
|
||||
"registry": "https://registry.npmjs.org"
|
||||
}
|
||||
}
|
||||
|
||||
@@ -17,6 +17,8 @@ export interface FileContextConfig {
|
||||
export interface MessageContentConfig {
|
||||
/** File context configuration */
|
||||
fileContext?: FileContextConfig;
|
||||
/** Function to check if video is supported */
|
||||
isCanUseVideo?: (model: string, provider: string) => boolean | undefined;
|
||||
/** Function to check if vision is supported */
|
||||
isCanUseVision?: (model: string, provider: string) => boolean | undefined;
|
||||
/** Model name */
|
||||
@@ -33,7 +35,10 @@ export interface UserMessageContentPart {
|
||||
signature?: string;
|
||||
text?: string;
|
||||
thinking?: string;
|
||||
type: 'text' | 'image_url' | 'thinking';
|
||||
type: 'text' | 'image_url' | 'thinking' | 'video_url';
|
||||
video_url?: {
|
||||
url: string;
|
||||
};
|
||||
}
|
||||
|
||||
/**
|
||||
@@ -104,12 +109,13 @@ export class MessageContentProcessor extends BaseProcessor {
|
||||
* Process user message content
|
||||
*/
|
||||
private async processUserMessage(message: any): Promise<any> {
|
||||
// Check if images or files need processing
|
||||
// Check if images, videos or files need processing
|
||||
const hasImages = message.imageList && message.imageList.length > 0;
|
||||
const hasVideos = message.videoList && message.videoList.length > 0;
|
||||
const hasFiles = message.fileList && message.fileList.length > 0;
|
||||
|
||||
// If no images and files, return plain text content directly
|
||||
if (!hasImages && !hasFiles) {
|
||||
// If no images, videos and files, return plain text content directly
|
||||
if (!hasImages && !hasVideos && !hasFiles) {
|
||||
return {
|
||||
...message,
|
||||
content: message.content,
|
||||
@@ -121,12 +127,13 @@ export class MessageContentProcessor extends BaseProcessor {
|
||||
// Add text content
|
||||
let textContent = message.content || '';
|
||||
|
||||
// Add file context (if file context is enabled and has files or images)
|
||||
if ((hasFiles || hasImages) && this.config.fileContext?.enabled) {
|
||||
// Add file context (if file context is enabled and has files, images or videos)
|
||||
if ((hasFiles || hasImages || hasVideos) && this.config.fileContext?.enabled) {
|
||||
const filesContext = filesPrompts({
|
||||
addUrl: this.config.fileContext.includeFileUrl ?? true,
|
||||
fileList: message.fileList,
|
||||
imageList: message.imageList,
|
||||
imageList: message.imageList || [],
|
||||
videoList: message.videoList || [],
|
||||
});
|
||||
|
||||
if (filesContext) {
|
||||
@@ -148,17 +155,26 @@ export class MessageContentProcessor extends BaseProcessor {
|
||||
contentParts.push(...imageContentParts);
|
||||
}
|
||||
|
||||
// Process video content
|
||||
if (hasVideos && this.config.isCanUseVideo?.(this.config.model, this.config.provider)) {
|
||||
const videoContentParts = await this.processVideoList(message.videoList || []);
|
||||
contentParts.push(...videoContentParts);
|
||||
}
|
||||
|
||||
// 明确返回的字段,只保留必要的消息字段
|
||||
const hasFileContext = (hasFiles || hasImages) && this.config.fileContext?.enabled;
|
||||
const hasFileContext = (hasFiles || hasImages || hasVideos) && this.config.fileContext?.enabled;
|
||||
const hasVisionContent =
|
||||
hasImages && this.config.isCanUseVision?.(this.config.model, this.config.provider);
|
||||
const hasVideoContent =
|
||||
hasVideos && this.config.isCanUseVideo?.(this.config.model, this.config.provider);
|
||||
|
||||
// 如果只有文本内容且没有添加文件上下文也没有视觉内容,返回纯文本
|
||||
// 如果只有文本内容且没有添加文件上下文也没有视觉/视频内容,返回纯文本
|
||||
if (
|
||||
contentParts.length === 1 &&
|
||||
contentParts[0].type === 'text' &&
|
||||
!hasFileContext &&
|
||||
!hasVisionContent
|
||||
!hasVisionContent &&
|
||||
!hasVideoContent
|
||||
) {
|
||||
return {
|
||||
content: contentParts[0].text,
|
||||
@@ -274,6 +290,22 @@ export class MessageContentProcessor extends BaseProcessor {
|
||||
);
|
||||
}
|
||||
|
||||
/**
|
||||
* 处理视频列表
|
||||
*/
|
||||
private async processVideoList(videoList: any[]): Promise<UserMessageContentPart[]> {
|
||||
if (!videoList || videoList.length === 0) {
|
||||
return [];
|
||||
}
|
||||
|
||||
return videoList.map((video) => {
|
||||
return {
|
||||
type: 'video_url',
|
||||
video_url: { url: video.url },
|
||||
} as UserMessageContentPart;
|
||||
});
|
||||
}
|
||||
|
||||
/**
|
||||
* 验证内容部分格式
|
||||
*/
|
||||
@@ -290,6 +322,9 @@ export class MessageContentProcessor extends BaseProcessor {
|
||||
case 'thinking': {
|
||||
return !!(part.thinking && part.signature);
|
||||
}
|
||||
case 'video_url': {
|
||||
return !!(part.video_url && part.video_url.url);
|
||||
}
|
||||
default: {
|
||||
return false;
|
||||
}
|
||||
|
||||
@@ -1,4 +1,4 @@
|
||||
import { ChatImageItem, ChatMessage } from '@lobechat/types';
|
||||
import { ChatImageItem, ChatMessage, ChatVideoItem } from '@lobechat/types';
|
||||
import { describe, expect, it, vi } from 'vitest';
|
||||
|
||||
import type { PipelineContext } from '../../types';
|
||||
@@ -26,6 +26,7 @@ const createContext = (messages: ChatMessage[]): PipelineContext => ({
|
||||
});
|
||||
|
||||
const mockIsCanUseVision = vi.fn();
|
||||
const mockIsCanUseVideo = vi.fn();
|
||||
|
||||
describe('MessageContentProcessor', () => {
|
||||
describe('Image processing functionality', () => {
|
||||
@@ -391,4 +392,181 @@ describe('MessageContentProcessor', () => {
|
||||
expect(result.metadata.assistantMessagesProcessed).toBe(1);
|
||||
});
|
||||
});
|
||||
|
||||
describe('Video processing functionality', () => {
|
||||
it('should return empty video content parts if model cannot use video', async () => {
|
||||
mockIsCanUseVideo.mockReturnValue(false);
|
||||
|
||||
const processor = new MessageContentProcessor({
|
||||
model: 'any-model',
|
||||
provider: 'any-provider',
|
||||
isCanUseVideo: mockIsCanUseVideo,
|
||||
fileContext: { enabled: false },
|
||||
});
|
||||
|
||||
const messages: ChatMessage[] = [
|
||||
{
|
||||
id: 'test',
|
||||
role: 'user',
|
||||
content: 'Hello',
|
||||
videoList: [{ url: 'video_url', alt: 'test video', id: 'test' } as ChatVideoItem],
|
||||
createdAt: Date.now(),
|
||||
updatedAt: Date.now(),
|
||||
meta: {},
|
||||
},
|
||||
];
|
||||
|
||||
const result = await processor.process(createContext(messages));
|
||||
|
||||
// Should return plain text when video is not supported
|
||||
expect(result.messages[0].content).toBe('Hello');
|
||||
});
|
||||
|
||||
it('should process videos if model can use video', async () => {
|
||||
mockIsCanUseVideo.mockReturnValue(true);
|
||||
|
||||
const processor = new MessageContentProcessor({
|
||||
model: 'gpt-4-vision',
|
||||
provider: 'openai',
|
||||
isCanUseVideo: mockIsCanUseVideo,
|
||||
fileContext: { enabled: false },
|
||||
});
|
||||
|
||||
const messages: ChatMessage[] = [
|
||||
{
|
||||
id: 'test',
|
||||
role: 'user',
|
||||
content: 'Hello',
|
||||
videoList: [
|
||||
{ url: 'http://example.com/video.mp4', alt: 'test video', id: 'test1' },
|
||||
{ url: 'http://example.com/video2.mp4', alt: 'test video 2', id: 'test2' },
|
||||
] as ChatVideoItem[],
|
||||
createdAt: Date.now(),
|
||||
updatedAt: Date.now(),
|
||||
meta: {},
|
||||
},
|
||||
];
|
||||
|
||||
const result = await processor.process(createContext(messages));
|
||||
|
||||
const content = result.messages[0].content as any[];
|
||||
expect(content).toHaveLength(3); // text + 2 videos
|
||||
expect(content[0].type).toBe('text');
|
||||
expect(content[0].text).toBe('Hello');
|
||||
expect(content[1].type).toBe('video_url');
|
||||
expect(content[1].video_url.url).toBe('http://example.com/video.mp4');
|
||||
expect(content[2].type).toBe('video_url');
|
||||
expect(content[2].video_url.url).toBe('http://example.com/video2.mp4');
|
||||
});
|
||||
|
||||
it('should handle video disabled scenario correctly', async () => {
|
||||
mockIsCanUseVideo.mockReturnValue(false);
|
||||
|
||||
const processor = new MessageContentProcessor({
|
||||
model: 'text-model',
|
||||
provider: 'openai',
|
||||
isCanUseVideo: mockIsCanUseVideo,
|
||||
fileContext: { enabled: false },
|
||||
});
|
||||
|
||||
const messages: ChatMessage[] = [
|
||||
{
|
||||
id: 'test',
|
||||
role: 'user',
|
||||
content: 'Analyze this video',
|
||||
videoList: [
|
||||
{ url: 'http://example.com/video.mp4', alt: 'test video', id: 'test' },
|
||||
] as ChatVideoItem[],
|
||||
createdAt: Date.now(),
|
||||
updatedAt: Date.now(),
|
||||
meta: {},
|
||||
},
|
||||
];
|
||||
|
||||
const result = await processor.process(createContext(messages));
|
||||
|
||||
// Should return plain text only when video not supported
|
||||
expect(result.messages[0].content).toBe('Analyze this video');
|
||||
});
|
||||
|
||||
it('should include videos in file context when enabled', async () => {
|
||||
mockIsCanUseVideo.mockReturnValue(false); // Video processing disabled but file context enabled
|
||||
|
||||
const processor = new MessageContentProcessor({
|
||||
model: 'gpt-4',
|
||||
provider: 'openai',
|
||||
isCanUseVideo: mockIsCanUseVideo,
|
||||
fileContext: { enabled: true, includeFileUrl: true },
|
||||
});
|
||||
|
||||
const messages: ChatMessage[] = [
|
||||
{
|
||||
id: 'test',
|
||||
role: 'user',
|
||||
content: 'Hello',
|
||||
videoList: [
|
||||
{
|
||||
id: 'video1',
|
||||
url: 'http://example.com/video.mp4',
|
||||
alt: 'Test video',
|
||||
},
|
||||
] as ChatVideoItem[],
|
||||
createdAt: Date.now(),
|
||||
updatedAt: Date.now(),
|
||||
meta: {},
|
||||
},
|
||||
];
|
||||
|
||||
const result = await processor.process(createContext(messages));
|
||||
|
||||
// Should return structured content when has videos and file context enabled
|
||||
expect(Array.isArray(result.messages[0].content)).toBe(true);
|
||||
const content = result.messages[0].content as any[];
|
||||
expect(content).toHaveLength(1);
|
||||
expect(content[0].type).toBe('text');
|
||||
expect(content[0].text).toContain('SYSTEM CONTEXT');
|
||||
expect(content[0].text).toContain('Hello');
|
||||
});
|
||||
|
||||
it('should handle mixed images and videos correctly', async () => {
|
||||
mockIsCanUseVision.mockReturnValue(true);
|
||||
mockIsCanUseVideo.mockReturnValue(true);
|
||||
|
||||
const processor = new MessageContentProcessor({
|
||||
model: 'gpt-4-vision',
|
||||
provider: 'openai',
|
||||
isCanUseVideo: mockIsCanUseVideo,
|
||||
isCanUseVision: mockIsCanUseVision,
|
||||
fileContext: { enabled: false },
|
||||
});
|
||||
|
||||
const messages: ChatMessage[] = [
|
||||
{
|
||||
id: 'test',
|
||||
role: 'user',
|
||||
content: 'Analyze these media files',
|
||||
imageList: [
|
||||
{ url: 'http://example.com/image.jpg', alt: 'test image', id: 'img1' },
|
||||
] as ChatImageItem[],
|
||||
videoList: [
|
||||
{ url: 'http://example.com/video.mp4', alt: 'test video', id: 'vid1' },
|
||||
] as ChatVideoItem[],
|
||||
createdAt: Date.now(),
|
||||
updatedAt: Date.now(),
|
||||
meta: {},
|
||||
},
|
||||
];
|
||||
|
||||
const result = await processor.process(createContext(messages));
|
||||
|
||||
const content = result.messages[0].content as any[];
|
||||
expect(content).toHaveLength(3); // text + image + video
|
||||
expect(content[0].type).toBe('text');
|
||||
expect(content[0].text).toBe('Analyze these media files');
|
||||
expect(content[1].type).toBe('image_url');
|
||||
expect(content[1].image_url.url).toBe('http://example.com/image.jpg');
|
||||
expect(content[2].type).toBe('video_url');
|
||||
expect(content[2].video_url.url).toBe('http://example.com/video.mp4');
|
||||
});
|
||||
});
|
||||
});
|
||||
|
||||
@@ -0,0 +1,4 @@
|
||||
ALTER TABLE "messages" ALTER COLUMN "role" SET DATA TYPE varchar(255);--> statement-breakpoint
|
||||
ALTER TABLE "chat_groups" ADD COLUMN IF NOT EXISTS "group_id" text;--> statement-breakpoint
|
||||
ALTER TABLE "chat_groups" DROP CONSTRAINT IF EXISTS "chat_groups_group_id_session_groups_id_fk";--> statement-breakpoint
|
||||
ALTER TABLE "chat_groups" ADD CONSTRAINT "chat_groups_group_id_session_groups_id_fk" FOREIGN KEY ("group_id") REFERENCES "public"."session_groups"("id") ON DELETE set null ON UPDATE no action;
|
||||
File diff suppressed because it is too large
Load Diff
@@ -236,7 +236,14 @@
|
||||
"idx": 33,
|
||||
"version": "7",
|
||||
"when": 1758012348218,
|
||||
"tag": "0033_modern_mercury",
|
||||
"tag": "0033_add_table_index",
|
||||
"breakpoints": true
|
||||
},
|
||||
{
|
||||
"idx": 34,
|
||||
"version": "7",
|
||||
"when": 1758825944181,
|
||||
"tag": "0034_fix_chat_group",
|
||||
"breakpoints": true
|
||||
}
|
||||
],
|
||||
|
||||
@@ -615,5 +615,16 @@
|
||||
"bps": true,
|
||||
"folderMillis": 1758012348218,
|
||||
"hash": "ce04ef4cde2db479d28ff08dced8383052c5052c904bab8343b5493fa10b0679"
|
||||
},
|
||||
{
|
||||
"sql": [
|
||||
"ALTER TABLE \"messages\" ALTER COLUMN \"role\" SET DATA TYPE varchar(255);",
|
||||
"\nALTER TABLE \"chat_groups\" ADD COLUMN IF NOT EXISTS \"group_id\" text;",
|
||||
"\nALTER TABLE \"chat_groups\" DROP CONSTRAINT IF EXISTS \"chat_groups_group_id_session_groups_id_fk\";",
|
||||
"\nALTER TABLE \"chat_groups\" ADD CONSTRAINT \"chat_groups_group_id_session_groups_id_fk\" FOREIGN KEY (\"group_id\") REFERENCES \"public\".\"session_groups\"(\"id\") ON DELETE set null ON UPDATE no action;\n"
|
||||
],
|
||||
"bps": true,
|
||||
"folderMillis": 1758825944181,
|
||||
"hash": "1ba9b1f74ea13348da98d6fcdad7867ab4316ed565bf75d84d160c526cdac14b"
|
||||
}
|
||||
]
|
||||
|
||||
@@ -1,6 +1,6 @@
|
||||
// @vitest-environment node
|
||||
import { ModelProvider } from '@lobechat/model-runtime';
|
||||
import { eq } from 'drizzle-orm';
|
||||
import { ModelProvider } from 'model-bank';
|
||||
import { afterEach, beforeEach, describe, expect, it, vi } from 'vitest';
|
||||
|
||||
import { sleep } from '@/utils/sleep';
|
||||
|
||||
@@ -1,9 +1,8 @@
|
||||
import { ModelProvider } from '@lobechat/model-runtime';
|
||||
import { and, asc, desc, eq } from 'drizzle-orm';
|
||||
import { isEmpty } from 'lodash-es';
|
||||
import { ModelProvider } from 'model-bank';
|
||||
|
||||
import { DEFAULT_MODEL_PROVIDER_LIST } from '@/config/modelProviders';
|
||||
import { LobeChatDatabase } from '../type';
|
||||
import {
|
||||
AiProviderDetailItem,
|
||||
AiProviderListItem,
|
||||
@@ -14,6 +13,7 @@ import {
|
||||
import { merge } from '@/utils/merge';
|
||||
|
||||
import { AiProviderSelectItem, aiModels, aiProviders } from '../schemas';
|
||||
import { LobeChatDatabase } from '../type';
|
||||
|
||||
type DecryptUserKeyVaults = (encryptKeyVaultsStr: string | null) => Promise<any>;
|
||||
|
||||
|
||||
@@ -5,6 +5,7 @@ import {
|
||||
ChatTTS,
|
||||
ChatToolPayload,
|
||||
ChatTranslate,
|
||||
ChatVideoItem,
|
||||
CreateMessageParams,
|
||||
MessageItem,
|
||||
ModelRankItem,
|
||||
@@ -175,7 +176,10 @@ export class MessageModel {
|
||||
}
|
||||
|
||||
const imageList = relatedFileList.filter((i) => (i.fileType || '').startsWith('image'));
|
||||
const fileList = relatedFileList.filter((i) => !(i.fileType || '').startsWith('image'));
|
||||
const videoList = relatedFileList.filter((i) => (i.fileType || '').startsWith('video'));
|
||||
const fileList = relatedFileList.filter(
|
||||
(i) => !(i.fileType || '').startsWith('image') && !(i.fileType || '').startsWith('video'),
|
||||
);
|
||||
|
||||
// 3. get relative file chunks
|
||||
const chunksList = await this.db
|
||||
@@ -251,6 +255,10 @@ export class MessageModel {
|
||||
ragQuery: messageQuery?.rewriteQuery,
|
||||
ragQueryId: messageQuery?.id,
|
||||
ragRawQuery: messageQuery?.userQuery,
|
||||
videoList: videoList
|
||||
.filter((relation) => relation.messageId === item.id)
|
||||
// eslint-disable-next-line @typescript-eslint/no-unused-vars
|
||||
.map<ChatVideoItem>(({ id, url, name }) => ({ alt: name!, id, url })),
|
||||
} as unknown as ChatMessage;
|
||||
},
|
||||
);
|
||||
|
||||
@@ -186,7 +186,7 @@ export class AiInfraRepos {
|
||||
};
|
||||
|
||||
/**
|
||||
* use in the `/settings/provider/[id]` page
|
||||
* use in the `/settings?active=provider&provider=[id]` page
|
||||
*/
|
||||
getAiProviderDetail = async (id: string, decryptor?: DecryptUserKeyVaults) => {
|
||||
const config = await this.aiProviderModel.getAiProviderById(id, decryptor);
|
||||
|
||||
@@ -7,15 +7,14 @@ import {
|
||||
primaryKey,
|
||||
text,
|
||||
uniqueIndex,
|
||||
varchar,
|
||||
} from 'drizzle-orm/pg-core';
|
||||
import { createInsertSchema } from 'drizzle-zod';
|
||||
|
||||
import { idGenerator } from '@/database/utils/idGenerator';
|
||||
import type { ChatGroupConfig } from '@/database/types/chatGroup';
|
||||
|
||||
import type { ChatGroupConfig } from '../types/chatGroup';
|
||||
import { idGenerator } from '../utils/idGenerator';
|
||||
import { timestamps } from './_helpers';
|
||||
import { agents } from './agent';
|
||||
import { sessionGroups } from './session';
|
||||
import { users } from './user';
|
||||
|
||||
/**
|
||||
@@ -32,9 +31,6 @@ export const chatGroups = pgTable(
|
||||
title: text('title'),
|
||||
description: text('description'),
|
||||
|
||||
/**
|
||||
* Group configuration
|
||||
*/
|
||||
config: jsonb('config').$type<ChatGroupConfig>(),
|
||||
|
||||
clientId: text('client_id'),
|
||||
@@ -43,6 +39,8 @@ export const chatGroups = pgTable(
|
||||
.references(() => users.id, { onDelete: 'cascade' })
|
||||
.notNull(),
|
||||
|
||||
groupId: text('group_id').references(() => sessionGroups.id, { onDelete: 'set null' }),
|
||||
|
||||
pinned: boolean('pinned').default(false),
|
||||
|
||||
...timestamps,
|
||||
@@ -95,4 +93,4 @@ export const chatGroupsAgents = pgTable(
|
||||
);
|
||||
|
||||
export type NewChatGroupAgent = typeof chatGroupsAgents.$inferInsert;
|
||||
export type ChatGroupAgentItem = typeof agents.$inferInsert
|
||||
export type ChatGroupAgentItem = typeof agents.$inferInsert;
|
||||
|
||||
@@ -9,6 +9,7 @@ import {
|
||||
text,
|
||||
uniqueIndex,
|
||||
uuid,
|
||||
varchar,
|
||||
} from 'drizzle-orm/pg-core';
|
||||
import { createSelectSchema } from 'drizzle-zod';
|
||||
|
||||
@@ -33,7 +34,7 @@ export const messages = pgTable(
|
||||
.$defaultFn(() => idGenerator('messages'))
|
||||
.primaryKey(),
|
||||
|
||||
role: text('role', { enum: ['user', 'system', 'assistant', 'tool'] }).notNull(),
|
||||
role: varchar('role', { length: 255 }).notNull(),
|
||||
content: text('content'),
|
||||
reasoning: jsonb('reasoning').$type<ModelReasoning>(),
|
||||
search: jsonb('search').$type<GroundingSearch>(),
|
||||
|
||||
Some files were not shown because too many files have changed in this diff Show More
Reference in New Issue
Block a user