Compare commits

...

187 Commits

Author SHA1 Message Date
semantic-release-bot b52183cdbf 🔖 chore(release): v1.132.3 [skip ci]
### [Version 1.132.3](https://github.com/lobehub/lobe-chat/compare/v1.132.2...v1.132.3)
<sup>Released on **2025-09-21**</sup>

#### 💄 Styles

- **misc**: Added `AUTH_MICROSOFT_ENTRA_ID_BASE_URL` routing.

<br/>

<details>
<summary><kbd>Improvements and Fixes</kbd></summary>

#### Styles

* **misc**: Added `AUTH_MICROSOFT_ENTRA_ID_BASE_URL` routing, closes [#9293](https://github.com/lobehub/lobe-chat/issues/9293) ([78a2f9e](https://github.com/lobehub/lobe-chat/commit/78a2f9e))

</details>

<div align="right">

[![](https://img.shields.io/badge/-BACK_TO_TOP-151515?style=flat-square)](#readme-top)

</div>
2025-09-21 17:15:58 +00:00
Jim Seiwert 78a2f9e874 💄 style: Added AUTH_MICROSOFT_ENTRA_ID_BASE_URL routing (#9293)
Added AUTH_MICROSOFT_ENTRA_ID_BASE_URL routing
2025-09-22 01:05:58 +08:00
lobehubbot 8f274aeba9 📝 docs(bot): Auto sync agents & plugin to readme 2025-09-21 17:02:45 +00:00
semantic-release-bot 9146362c9b 🔖 chore(release): v1.132.2 [skip ci]
### [Version&nbsp;1.132.2](https://github.com/lobehub/lobe-chat/compare/v1.132.1...v1.132.2)
<sup>Released on **2025-09-21**</sup>

#### 🐛 Bug Fixes

- **misc**: Fix non stream mode in OpenAI Response API.

<br/>

<details>
<summary><kbd>Improvements and Fixes</kbd></summary>

#### What's fixed

* **misc**: Fix non stream mode in OpenAI Response API, closes [#9360](https://github.com/lobehub/lobe-chat/issues/9360) ([1c61b21](https://github.com/lobehub/lobe-chat/commit/1c61b21))

</details>

<div align="right">

[![](https://img.shields.io/badge/-BACK_TO_TOP-151515?style=flat-square)](#readme-top)

</div>
2025-09-21 17:01:47 +00:00
Arvin Xu 1c61b21133 🐛 fix: fix non stream mode in OpenAI Response API (#9360)
* fix

* fix non stream

*  test: add comprehensive unit tests for nonStreamToStream functions

- Add tests for transformResponseToStream covering ChatCompletion conversion, reasoning content, tool calls, and edge cases
- Add tests for transformResponseAPIToStream covering Response API conversion, missing outputs, and error cases
- Tests verify complete event arrays as requested, not partial verification
- Tests will help expose issues with tool call handling and Response API compatibility

Co-authored-by: Arvin Xu <arvinxx@users.noreply.github.com>

* 🧪 test: fix nonStreamToStream test array comparisons and TypeScript errors

- Change test assertions to use array comparisons instead of individual equals
- Add missing refusal property to ChatCompletionMessage objects
- Fix Response API object types and add missing usage properties
- Resolve all TypeScript build errors in test file

Co-authored-by: Arvin Xu <arvinxx@users.noreply.github.com>

* fix

* fix tests
2025-09-22 00:51:39 +08:00
lobehubbot c14d165124 📝 docs(bot): Auto sync agents & plugin to readme 2025-09-21 16:24:44 +00:00
semantic-release-bot 69817182a0 🔖 chore(release): v1.132.1 [skip ci]
### [Version&nbsp;1.132.1](https://github.com/lobehub/lobe-chat/compare/v1.132.0...v1.132.1)
<sup>Released on **2025-09-21**</sup>

#### 🐛 Bug Fixes

- **misc**: Fix missing provider in server message.

<br/>

<details>
<summary><kbd>Improvements and Fixes</kbd></summary>

#### What's fixed

* **misc**: Fix missing provider in server message, closes [#9361](https://github.com/lobehub/lobe-chat/issues/9361) ([4099dfd](https://github.com/lobehub/lobe-chat/commit/4099dfd))

</details>

<div align="right">

[![](https://img.shields.io/badge/-BACK_TO_TOP-151515?style=flat-square)](#readme-top)

</div>
2025-09-21 16:23:46 +00:00
Arvin Xu 4099dfd955 🐛 fix: fix missing provider in server message (#9361)
fix
2025-09-22 00:13:28 +08:00
lobehubbot 48ad272f90 📝 docs(bot): Auto sync agents & plugin to readme 2025-09-21 13:47:34 +00:00
semantic-release-bot 9352a9c80e 🔖 chore(release): v1.132.0 [skip ci]
## [Version&nbsp;1.132.0](https://github.com/lobehub/lobe-chat/compare/v1.131.4...v1.132.0)
<sup>Released on **2025-09-21**</sup>

####  Features

- **misc**: Support google video understanding.

<br/>

<details>
<summary><kbd>Improvements and Fixes</kbd></summary>

#### What's improved

* **misc**: Support google video understanding, closes [#8761](https://github.com/lobehub/lobe-chat/issues/8761) ([f02d43b](https://github.com/lobehub/lobe-chat/commit/f02d43b))

</details>

<div align="right">

[![](https://img.shields.io/badge/-BACK_TO_TOP-151515?style=flat-square)](#readme-top)

</div>
2025-09-21 13:46:39 +00:00
Arvin Xu f02d43b8d3 feat: support google video understanding (#8761)
* refactor

improve upload

fix tests

clean client mode

add video

support google image understand

* update

* fix tests
2025-09-21 21:37:06 +08:00
lobehubbot 6808099ce9 📝 docs(bot): Auto sync agents & plugin to readme 2025-09-21 13:29:33 +00:00
semantic-release-bot 08347bbe01 🔖 chore(release): v1.131.4 [skip ci]
### [Version&nbsp;1.131.4](https://github.com/lobehub/lobe-chat/compare/v1.131.3...v1.131.4)
<sup>Released on **2025-09-21**</sup>

#### 💄 Styles

- **misc**: Enhanced AkashChat experience.

<br/>

<details>
<summary><kbd>Improvements and Fixes</kbd></summary>

#### Styles

* **misc**: Enhanced AkashChat experience, closes [#9330](https://github.com/lobehub/lobe-chat/issues/9330) ([47ec2d8](https://github.com/lobehub/lobe-chat/commit/47ec2d8))

</details>

<div align="right">

[![](https://img.shields.io/badge/-BACK_TO_TOP-151515?style=flat-square)](#readme-top)

</div>
2025-09-21 13:28:36 +00:00
sxjeru 47ec2d81dc 💄 style: Enhanced AkashChat experience (#9330)
* 🔧 refactor: update akashChat models to use settings and enhance payload handling

*  feat: 添加视觉支持和更新描述,增强 Mistral 模型信息
2025-09-21 21:18:15 +08:00
lobehubbot 541d0f46b2 📝 docs(bot): Auto sync agents & plugin to readme 2025-09-21 11:38:24 +00:00
semantic-release-bot af3daa4022 🔖 chore(release): v1.131.3 [skip ci]
### [Version&nbsp;1.131.3](https://github.com/lobehub/lobe-chat/compare/v1.131.2...v1.131.3)
<sup>Released on **2025-09-21**</sup>

#### 🐛 Bug Fixes

- **misc**: Update Responses search tool to web_search.

<br/>

<details>
<summary><kbd>Improvements and Fixes</kbd></summary>

#### What's fixed

* **misc**: Update Responses search tool to web_search, closes [#9354](https://github.com/lobehub/lobe-chat/issues/9354) ([58d34ff](https://github.com/lobehub/lobe-chat/commit/58d34ff))

</details>

<div align="right">

[![](https://img.shields.io/badge/-BACK_TO_TOP-151515?style=flat-square)](#readme-top)

</div>
2025-09-21 11:37:26 +00:00
sxjeru 58d34ff53f 🐛 fix: Update Responses search tool to web_search (#9354)
*  feat: 更新搜索工具为 web_search

* Update index.test.ts
2025-09-21 19:27:39 +08:00
lobehubbot b5389e44a2 📝 docs(bot): Auto sync agents & plugin to readme 2025-09-21 10:23:22 +00:00
semantic-release-bot e827f286e6 🔖 chore(release): v1.131.2 [skip ci]
### [Version&nbsp;1.131.2](https://github.com/lobehub/lobe-chat/compare/v1.131.1...v1.131.2)
<sup>Released on **2025-09-21**</sup>

#### 💄 Styles

- **misc**: Use ID as name if provider name is empty.

<br/>

<details>
<summary><kbd>Improvements and Fixes</kbd></summary>

#### Styles

* **misc**: Use ID as name if provider name is empty, closes [#9356](https://github.com/lobehub/lobe-chat/issues/9356) ([7f60544](https://github.com/lobehub/lobe-chat/commit/7f60544))

</details>

<div align="right">

[![](https://img.shields.io/badge/-BACK_TO_TOP-151515?style=flat-square)](#readme-top)

</div>
2025-09-21 10:22:24 +00:00
sxjeru 7f60544950 💄 style: Use ID as name if provider name is empty (#9356)
Use ID as name if provider name is empty
2025-09-21 18:11:34 +08:00
lobehubbot 116af84640 📝 docs(bot): Auto sync agents & plugin to readme 2025-09-21 09:22:59 +00:00
semantic-release-bot 764fd4fa78 🔖 chore(release): v1.131.1 [skip ci]
### [Version&nbsp;1.131.1](https://github.com/lobehub/lobe-chat/compare/v1.131.0...v1.131.1)
<sup>Released on **2025-09-21**</sup>

#### ♻ Code Refactoring

- **misc**: Improve codebase.

#### 💄 Styles

- **misc**: Extend custom provider runtime options, Optimized modelFetch for Vercel AI Gateway, update i18n.

<br/>

<details>
<summary><kbd>Improvements and Fixes</kbd></summary>

#### Code refactoring

* **misc**: Improve codebase, closes [#9353](https://github.com/lobehub/lobe-chat/issues/9353) ([7dc000e](https://github.com/lobehub/lobe-chat/commit/7dc000e))

#### Styles

* **misc**: Extend custom provider runtime options, closes [#9278](https://github.com/lobehub/lobe-chat/issues/9278) ([a94e881](https://github.com/lobehub/lobe-chat/commit/a94e881))
* **misc**: Optimized modelFetch for Vercel AI Gateway, closes [#9342](https://github.com/lobehub/lobe-chat/issues/9342) ([45b7a43](https://github.com/lobehub/lobe-chat/commit/45b7a43))
* **misc**: Update i18n, closes [#9338](https://github.com/lobehub/lobe-chat/issues/9338) ([d2ff75c](https://github.com/lobehub/lobe-chat/commit/d2ff75c))

</details>

<div align="right">

[![](https://img.shields.io/badge/-BACK_TO_TOP-151515?style=flat-square)](#readme-top)

</div>
2025-09-21 09:21:29 +00:00
renovate[bot] f37ec1d4c2 Update dependency ts-md5 to v2 (#9348)
Co-authored-by: renovate[bot] <29139614+renovate[bot]@users.noreply.github.com>
2025-09-21 17:11:28 +08:00
Arvin Xu a94e8810a3 💄 style: extend custom provider runtime options (#9278)
*  support more runtimes for custom providers

* Update customProviderSdkOptions.ts
2025-09-21 17:05:33 +08:00
sxjeru 45b7a43170 💄 style: Optimized modelFetch for Vercel AI Gateway (#9342)
* Refactor VercelAIGateway integration: Enhance model card structure and error handling

*  feat(vercelaigateway): Update model card structure and change check model to GPT-5

*  feat(vercelaigateway): 添加模型设置以支持推理努力和文本详细程度参数
2025-09-21 17:03:17 +08:00
Arvin Xu 7dc000e10c ♻️ refactor: improve codebase (#9353)
refactor
2025-09-21 16:57:16 +08:00
Arvin Xu f25fda6de2 📝 docs: renamed license to LobeHub Community License (#9355)
update license
2025-09-21 16:53:12 +08:00
LobeHub Bot d2ff75cc05 🤖 style: update i18n (#9338)
💄 style: update i18n

Co-authored-by: canisminor1990 <17870709+canisminor1990@users.noreply.github.com>
2025-09-21 16:43:57 +08:00
renovate[bot] 8de927a419 Update dependency request-filtering-agent to v3 (#9346)
Co-authored-by: renovate[bot] <29139614+renovate[bot]@users.noreply.github.com>
2025-09-21 16:43:35 +08:00
renovate[bot] fe9d4afa05 Update dependency @types/uuid to v11 (#9345)
Co-authored-by: renovate[bot] <29139614+renovate[bot]@users.noreply.github.com>
2025-09-21 16:41:56 +08:00
renovate[bot] 54704b1247 Update dependency @anthropic-ai/sdk to ^0.63.0 (#9343)
Co-authored-by: renovate[bot] <29139614+renovate[bot]@users.noreply.github.com>
2025-09-21 16:41:44 +08:00
renovate[bot] 65d2c0c2ea Update pnpm to v10.17.0 (#9344)
Co-authored-by: renovate[bot] <29139614+renovate[bot]@users.noreply.github.com>
2025-09-21 16:41:03 +08:00
renovate[bot] 9f99b0bc2a Update dependency tokenx to v1 (#9347)
Co-authored-by: renovate[bot] <29139614+renovate[bot]@users.noreply.github.com>
2025-09-21 16:40:54 +08:00
lobehubbot a78fc1fd24 📝 docs(bot): Auto sync agents & plugin to readme 2025-09-19 13:10:52 +00:00
semantic-release-bot 4e0e99e503 🔖 chore(release): v1.131.0 [skip ci]
## [Version&nbsp;1.131.0](https://github.com/lobehub/lobe-chat/compare/v1.130.1...v1.131.0)
<sup>Released on **2025-09-19**</sup>

####  Features

- **misc**: Qwen provider add qwen-image-edit model support.

<br/>

<details>
<summary><kbd>Improvements and Fixes</kbd></summary>

#### What's improved

* **misc**: Qwen provider add qwen-image-edit model support, closes [#9311](https://github.com/lobehub/lobe-chat/issues/9311) ([a0074fc](https://github.com/lobehub/lobe-chat/commit/a0074fc))

</details>

<div align="right">

[![](https://img.shields.io/badge/-BACK_TO_TOP-151515?style=flat-square)](#readme-top)

</div>
2025-09-19 13:09:57 +00:00
Maple Gao a0074fc280 feat: qwen provider add qwen-image-edit model support (#9311) 2025-09-19 21:00:09 +08:00
lobehubbot 6c01f21cec 📝 docs(bot): Auto sync agents & plugin to readme 2025-09-18 12:58:27 +00:00
semantic-release-bot 8f4a98fed0 🔖 chore(release): v1.130.1 [skip ci]
### [Version&nbsp;1.130.1](https://github.com/lobehub/lobe-chat/compare/v1.130.0...v1.130.1)
<sup>Released on **2025-09-18**</sup>

#### 🐛 Bug Fixes

- **misc**: Fix oidc open direct issue.

<br/>

<details>
<summary><kbd>Improvements and Fixes</kbd></summary>

#### What's fixed

* **misc**: Fix oidc open direct issue, closes [#9315](https://github.com/lobehub/lobe-chat/issues/9315) ([70f52a3](https://github.com/lobehub/lobe-chat/commit/70f52a3))

</details>

<div align="right">

[![](https://img.shields.io/badge/-BACK_TO_TOP-151515?style=flat-square)](#readme-top)

</div>
2025-09-18 12:57:25 +00:00
Arvin Xu 70f52a3c1f 🐛 fix: fix oidc open direct issue (#9315)
* add tests

* fix open direct

* update
2025-09-18 20:47:49 +08:00
Arvin Xu 8711ea244c 🔨 chore: fix nextjs@15.5.x runtime warning (#9063)
* update

fix tools

Update route.ts

Update next dependency version to ^15.5.0

更新 package.json

test prebuild type-check

try

* Change 'next' dependency version in package.json

Updated 'next' dependency version from ^15.5.3 to ~15.3.5.
2025-09-18 19:13:36 +08:00
lobehubbot 255a89c9f3 📝 docs(bot): Auto sync agents & plugin to readme 2025-09-18 09:13:52 +00:00
semantic-release-bot b8c4c4e927 🔖 chore(release): v1.130.0 [skip ci]
## [Version&nbsp;1.130.0](https://github.com/lobehub/lobe-chat/compare/v1.129.4...v1.130.0)
<sup>Released on **2025-09-18**</sup>

####  Features

- **misc**: Add scroll support for pinned assistants using ScrollShadow.

<br/>

<details>
<summary><kbd>Improvements and Fixes</kbd></summary>

#### What's improved

* **misc**: Add scroll support for pinned assistants using ScrollShadow, closes [#9319](https://github.com/lobehub/lobe-chat/issues/9319) [#9316](https://github.com/lobehub/lobe-chat/issues/9316) ([54c0ac4](https://github.com/lobehub/lobe-chat/commit/54c0ac4))

</details>

<div align="right">

[![](https://img.shields.io/badge/-BACK_TO_TOP-151515?style=flat-square)](#readme-top)

</div>
2025-09-18 09:12:51 +00:00
Shinji-Li 54c0ac4426 feat: Add scroll support for pinned assistants using ScrollShadow (#9319)
*  feat: Add scroll support for pinned assistants using ScrollShadow

- Import ScrollShadow component from @lobehub/ui
- Wrap pinned assistants list with ScrollShadow for vertical scrolling
- Remove 9-item limitation to show all pinned assistants
- Maintain hotkey support for first 9 items
- Add proper styling and padding for consistent layout

Fixes #9316

Co-authored-by: Shinji-Li <ONLY-yours@users.noreply.github.com>

* fix: add some style

---------

Co-authored-by: claude[bot] <209825114+claude[bot]@users.noreply.github.com>
Co-authored-by: Shinji-Li <ONLY-yours@users.noreply.github.com>
2025-09-18 17:02:43 +08:00
lobehubbot b7e7186229 📝 docs(bot): Auto sync agents & plugin to readme 2025-09-18 05:05:00 +00:00
semantic-release-bot 0d1086fe55 🔖 chore(release): v1.129.4 [skip ci]
### [Version&nbsp;1.129.4](https://github.com/lobehub/lobe-chat/compare/v1.129.3...v1.129.4)
<sup>Released on **2025-09-18**</sup>

#### 🐛 Bug Fixes

- **misc**: Fix svg xss issue.

<br/>

<details>
<summary><kbd>Improvements and Fixes</kbd></summary>

#### What's fixed

* **misc**: Fix svg xss issue, closes [#9313](https://github.com/lobehub/lobe-chat/issues/9313) ([9f044ed](https://github.com/lobehub/lobe-chat/commit/9f044ed))

</details>

<div align="right">

[![](https://img.shields.io/badge/-BACK_TO_TOP-151515?style=flat-square)](#readme-top)

</div>
2025-09-18 05:03:52 +00:00
Arvin Xu 9f044edd07 🐛 fix: fix svg xss issue (#9313)
* fix svg xss

* fix svg xss

* update

* improve

* fix
2025-09-18 12:53:56 +08:00
YuTengjing 1762dc9148 ♻️ chore: refactor router runtime (#9306) 2025-09-17 23:30:04 +08:00
Shinji-Li 2e928cd587 fix:fixed when plugins unistall & install both take problem (#9296)
* 🐛 fix: prevent plugin re-installation bug by disabling from agent on uninstall

- Fix plugin uninstall not removing plugin from agent configuration
- Add confirmation modal warning when uninstalling enabled plugins
- Automatically disable plugin from current agent before uninstall
- Apply fix to all plugin uninstall actions (PluginList, InstalledList, McpList)

Fixes #9279

Co-authored-by: Shinji-Li <ONLY-yours@users.noreply.github.com>

* 🐛 fix: remove warning content from plugin uninstall confirmation dialog

Co-authored-by: Shinji-Li <ONLY-yours@users.noreply.github.com>

---------

Co-authored-by: claude[bot] <209825114+claude[bot]@users.noreply.github.com>
Co-authored-by: Shinji-Li <ONLY-yours@users.noreply.github.com>
2025-09-17 12:02:41 +08:00
lobehubbot 0ea738222d 📝 docs(bot): Auto sync agents & plugin to readme 2025-09-17 03:35:43 +00:00
semantic-release-bot 25a5be639a 🔖 chore(release): v1.129.3 [skip ci]
### [Version&nbsp;1.129.3](https://github.com/lobehub/lobe-chat/compare/v1.129.2...v1.129.3)
<sup>Released on **2025-09-17**</sup>

#### 🐛 Bug Fixes

- **misc**: Add qwen provider support for image-edit model.

<br/>

<details>
<summary><kbd>Improvements and Fixes</kbd></summary>

#### What's fixed

* **misc**: Add qwen provider support for image-edit model, closes [#9277](https://github.com/lobehub/lobe-chat/issues/9277) [#9184](https://github.com/lobehub/lobe-chat/issues/9184) ([e137b33](https://github.com/lobehub/lobe-chat/commit/e137b33))

</details>

<div align="right">

[![](https://img.shields.io/badge/-BACK_TO_TOP-151515?style=flat-square)](#readme-top)

</div>
2025-09-17 03:34:44 +00:00
Maple Gao e137b33c8d 🐛 fix: add qwen provider support for image-edit model (#9277)
* 🐛 fix: add qwen provider support for image-edit model

- Register qwen provider in baseRuntimeMap
- Add qwen routing support in NewAPI provider
- Implement qwen-image-edit model with correct multimodal API
- Fix API endpoint and request format for image-to-image generation

Fixes #9184

* Update packages/model-runtime/src/providers/qwen/createImage.ts

Co-authored-by: Copilot <175728472+Copilot@users.noreply.github.com>

---------

Co-authored-by: Copilot <175728472+Copilot@users.noreply.github.com>
2025-09-17 11:24:21 +08:00
lobehubbot 47c6e7fc17 📝 docs(bot): Auto sync agents & plugin to readme 2025-09-17 03:19:07 +00:00
semantic-release-bot 046138b32c 🔖 chore(release): v1.129.2 [skip ci]
### [Version&nbsp;1.129.2](https://github.com/lobehub/lobe-chat/compare/v1.129.1...v1.129.2)
<sup>Released on **2025-09-17**</sup>

#### 🐛 Bug Fixes

- **misc**: Improve db migrations sql.

#### 💄 Styles

- **misc**: Update i18n.

<br/>

<details>
<summary><kbd>Improvements and Fixes</kbd></summary>

#### What's fixed

* **misc**: Improve db migrations sql, closes [#9295](https://github.com/lobehub/lobe-chat/issues/9295) ([96ff5aa](https://github.com/lobehub/lobe-chat/commit/96ff5aa))

#### Styles

* **misc**: Update i18n, closes [#9294](https://github.com/lobehub/lobe-chat/issues/9294) ([c018f3d](https://github.com/lobehub/lobe-chat/commit/c018f3d))

</details>

<div align="right">

[![](https://img.shields.io/badge/-BACK_TO_TOP-151515?style=flat-square)](#readme-top)

</div>
2025-09-17 03:17:56 +00:00
LobeHub Bot c018f3d05b 🤖 style: update i18n (#9294)
💄 style: update i18n

Co-authored-by: canisminor1990 <17870709+canisminor1990@users.noreply.github.com>
2025-09-17 11:07:02 +08:00
Arvin Xu 96ff5aa461 🐛 fix: improve db migrations sql (#9295)
improve db migrations sql
2025-09-17 11:06:37 +08:00
lobehubbot 9f29869fd2 📝 docs(bot): Auto sync agents & plugin to readme 2025-09-16 11:47:59 +00:00
semantic-release-bot e3afca3678 🔖 chore(release): v1.129.1 [skip ci]
### [Version&nbsp;1.129.1](https://github.com/lobehub/lobe-chat/compare/v1.129.0...v1.129.1)
<sup>Released on **2025-09-16**</sup>

#### ♻ Code Refactoring

- **misc**: Improve db sql performance.

#### 💄 Styles

- **misc**: Update SiliconCloud reasoning models.

<br/>

<details>
<summary><kbd>Improvements and Fixes</kbd></summary>

#### Code refactoring

* **misc**: Improve db sql performance, closes [#9283](https://github.com/lobehub/lobe-chat/issues/9283) ([cee555a](https://github.com/lobehub/lobe-chat/commit/cee555a))

#### Styles

* **misc**: Update SiliconCloud reasoning models, closes [#9287](https://github.com/lobehub/lobe-chat/issues/9287) ([b47bb5b](https://github.com/lobehub/lobe-chat/commit/b47bb5b))

</details>

<div align="right">

[![](https://img.shields.io/badge/-BACK_TO_TOP-151515?style=flat-square)](#readme-top)

</div>
2025-09-16 11:47:02 +00:00
WangYK b47bb5b3aa 💄 style: update SiliconCloud reasoning models (#9287)
💄 style: update siliconcloud reasoning models
2025-09-16 19:37:14 +08:00
Arvin Xu cee555a0f0 ♻️ refactor: improve db sql performance (#9283)
* improve sql

* improve db index

* improve db index

* improve db index
2025-09-16 19:33:35 +08:00
lobehubbot 28f84d5cb4 📝 docs(bot): Auto sync agents & plugin to readme 2025-09-16 09:00:29 +00:00
semantic-release-bot d0063f809a 🔖 chore(release): v1.129.0 [skip ci]
## [Version&nbsp;1.129.0](https://github.com/lobehub/lobe-chat/compare/v1.128.10...v1.129.0)
<sup>Released on **2025-09-16**</sup>

####  Features

- **misc**: Support Vercel AI Gateway provider.

<br/>

<details>
<summary><kbd>Improvements and Fixes</kbd></summary>

#### What's improved

* **misc**: Support Vercel AI Gateway provider, closes [#8883](https://github.com/lobehub/lobe-chat/issues/8883) ([5a4b0fd](https://github.com/lobehub/lobe-chat/commit/5a4b0fd))

</details>

<div align="right">

[![](https://img.shields.io/badge/-BACK_TO_TOP-151515?style=flat-square)](#readme-top)

</div>
2025-09-16 08:59:32 +00:00
WangYK 5a4b0fd344 feat: support Vercel AI Gateway provider (#8883)
*  feat: support Vercel AI Gateway provider

* fix: add `vercelaigateway` to package.json.exports

* chore: 把 runtime 挪到 providers 目录下
2025-09-16 16:49:54 +08:00
lobehubbot 47874ac6c7 📝 docs(bot): Auto sync agents & plugin to readme 2025-09-16 07:37:32 +00:00
semantic-release-bot dfdcdce298 🔖 chore(release): v1.128.10 [skip ci]
### [Version&nbsp;1.128.10](https://github.com/lobehub/lobe-chat/compare/v1.128.9...v1.128.10)
<sup>Released on **2025-09-16**</sup>

#### 🐛 Bug Fixes

- **misc**: Fix azure ai runtime error.

<br/>

<details>
<summary><kbd>Improvements and Fixes</kbd></summary>

#### What's fixed

* **misc**: Fix azure ai runtime error, closes [#9276](https://github.com/lobehub/lobe-chat/issues/9276) ([c21c14e](https://github.com/lobehub/lobe-chat/commit/c21c14e))

</details>

<div align="right">

[![](https://img.shields.io/badge/-BACK_TO_TOP-151515?style=flat-square)](#readme-top)

</div>
2025-09-16 07:36:28 +00:00
Arvin Xu 72443783a1 🔨 chore: update dbschema workflow (#9282)
update workflow
2025-09-16 15:25:55 +08:00
Arvin Xu c21c14e715 🐛 fix: fix azure ai runtime error (#9276)
* fix azure ai

* improve agent schema

* improve agent schema

* improve header size

* remove sentry

* remove sentry

* fix

* clean

* fix tests
2025-09-16 15:19:55 +08:00
huangkairan 46f2a28ee7 🔨 chore: lint error (#9268)
fix: lint error
2025-09-15 15:40:10 +08:00
CanisMinor 11ceb8b346 🔧 chore: Migrating from Sentry NextJS SDK 7.x to 10.x (#9264)
* 🔧 chore: Migrating from Sentry JavaScript SDK 7.x to 8.x

* 🔧 chore: Migrating from Sentry JavaScript SDK 7.x to 8.x

* 🔧 chore: Migrate sentry v10
2025-09-15 15:35:36 +08:00
lobehubbot 01103e7d1f 📝 docs(bot): Auto sync agents & plugin to readme 2025-09-15 05:21:12 +00:00
semantic-release-bot 37f7028c4c 🔖 chore(release): v1.128.9 [skip ci]
### [Version&nbsp;1.128.9](https://github.com/lobehub/lobe-chat/compare/v1.128.8...v1.128.9)
<sup>Released on **2025-09-15**</sup>

#### 💄 Styles

- **misc**: Improve error handle with agent config, support `.doc` file parse.

<br/>

<details>
<summary><kbd>Improvements and Fixes</kbd></summary>

#### Styles

* **misc**: Improve error handle with agent config, closes [#9263](https://github.com/lobehub/lobe-chat/issues/9263) ([6656217](https://github.com/lobehub/lobe-chat/commit/6656217))
* **misc**: Support `.doc` file parse, closes [#8182](https://github.com/lobehub/lobe-chat/issues/8182) ([ed42753](https://github.com/lobehub/lobe-chat/commit/ed42753))

</details>

<div align="right">

[![](https://img.shields.io/badge/-BACK_TO_TOP-151515?style=flat-square)](#readme-top)

</div>
2025-09-15 05:20:07 +00:00
Arvin Xu d1f68c5b9f test: fix tests (#9265)
fix
2025-09-15 13:10:05 +08:00
bbbugg 9568eafd76 🐛Fix: non streaming not displaying token usage and thinking content (#9087)
* 🐛 fix: add usage data to chat completion chunk for stream = false

* 🐛 fix: ensure reasoning_content is included in chat completion chunks for non-stream responses

* 🐛 fix: include reasoning content and usage data in non-streaming chat completion responses

* 🐛 fix: test

* 🐛 fix: non stream Deeply Thought stop correctly

* 🐛 fix: test

* 🐛 fix: test
2025-09-15 11:28:28 +08:00
Arvin Xu 66562170ac 💄 style: improve error handle with agent config (#9263)
fix
2025-09-15 11:23:13 +08:00
copialot ed42753fe5 💄 style: support .doc file parse (#8182)
*  feat: support .doc file parse

*  feat: support .doc file parse

---------

Co-authored-by: admin <admin@punch.local>
2025-09-15 11:22:00 +08:00
lobehubbot cc67b5443d 📝 docs(bot): Auto sync agents & plugin to readme 2025-09-15 03:10:05 +00:00
semantic-release-bot 20e026c9f1 🔖 chore(release): v1.128.8 [skip ci]
### [Version&nbsp;1.128.8](https://github.com/lobehub/lobe-chat/compare/v1.128.7...v1.128.8)
<sup>Released on **2025-09-15**</sup>

#### 💄 Styles

- **misc**: Enable toggling search on/off via search button click & historyCount button.

<br/>

<details>
<summary><kbd>Improvements and Fixes</kbd></summary>

#### Styles

* **misc**: Enable toggling search on/off via search button click & historyCount button, closes [#9173](https://github.com/lobehub/lobe-chat/issues/9173) ([240c7b7](https://github.com/lobehub/lobe-chat/commit/240c7b7))

</details>

<div align="right">

[![](https://img.shields.io/badge/-BACK_TO_TOP-151515?style=flat-square)](#readme-top)

</div>
2025-09-15 03:09:01 +00:00
sxjeru 240c7b7f4f 💄 style: Enable toggling search on/off via search button click & historyCount button (#9173)
*  feat: Enhance Search Action with mobile support and update agent chat config

*  feat: Update History component to support mobile interactions and enhance Controls with form handling
2025-09-15 10:59:27 +08:00
Arvin Xu b73d0972b2 ️ perf: fix search agent slow (#9261)
* try to fix search agent issue

* Update session.ts
2025-09-15 10:56:03 +08:00
Arvin Xu d942a635b3 🔨 chore: add agent-runtime (#9206)
* add agent runtime

* add agent runtime

* support finish reason

* update workflow

* 支持中断

* 支持 token usage 统计

* refactor

* add example

* add docs

* update
2025-09-14 17:29:19 +08:00
renovate[bot] a47ec04f20 Update dependency electron to v38 (#9248)
Co-authored-by: renovate[bot] <29139614+renovate[bot]@users.noreply.github.com>
2025-09-14 16:42:44 +08:00
lobehubbot 20eb99534c 📝 docs(bot): Auto sync agents & plugin to readme 2025-09-14 04:52:52 +00:00
semantic-release-bot 96b9c9705a 🔖 chore(release): v1.128.7 [skip ci]
### [Version&nbsp;1.128.7](https://github.com/lobehub/lobe-chat/compare/v1.128.6...v1.128.7)
<sup>Released on **2025-09-14**</sup>

<br/>

<details>
<summary><kbd>Improvements and Fixes</kbd></summary>

</details>

<div align="right">

[![](https://img.shields.io/badge/-BACK_TO_TOP-151515?style=flat-square)](#readme-top)

</div>
2025-09-14 04:51:56 +00:00
Arvin Xu 3f42ee3dfe 👷 build: fix electron build (#9250)
Remove linting from prebuild:electron script
2025-09-14 12:41:44 +08:00
semantic-release-bot 0f9755bbd7 🔖 chore(release): v1.128.6 [skip ci]
### [Version&nbsp;1.128.6](https://github.com/lobehub/lobe-chat/compare/v1.128.5...v1.128.6)
<sup>Released on **2025-09-14**</sup>

#### 💄 Styles

- **misc**: Update i18n.

<br/>

<details>
<summary><kbd>Improvements and Fixes</kbd></summary>

#### Styles

* **misc**: Update i18n, closes [#9243](https://github.com/lobehub/lobe-chat/issues/9243) ([04764ad](https://github.com/lobehub/lobe-chat/commit/04764ad))

</details>

<div align="right">

[![](https://img.shields.io/badge/-BACK_TO_TOP-151515?style=flat-square)](#readme-top)

</div>
2025-09-14 04:40:46 +00:00
renovate[bot] 87ae85f7c7 Update dependency fix-path to v5 (#9249)
Co-authored-by: renovate[bot] <29139614+renovate[bot]@users.noreply.github.com>
2025-09-14 12:30:41 +08:00
LobeHub Bot 04764ad1cb 🤖 style: update i18n (#9243)
💄 style: update i18n

Co-authored-by: canisminor1990 <17870709+canisminor1990@users.noreply.github.com>
2025-09-14 12:27:38 +08:00
renovate[bot] e8044e3eca Update dependency @vercel/functions to v3 (#9247)
Co-authored-by: renovate[bot] <29139614+renovate[bot]@users.noreply.github.com>
2025-09-14 12:27:21 +08:00
renovate[bot] e9412f146c Update pnpm to v10.16.1 (#9246)
Co-authored-by: renovate[bot] <29139614+renovate[bot]@users.noreply.github.com>
2025-09-14 12:27:03 +08:00
renovate[bot] 6c72681b26 Update dependency @anthropic-ai/sdk to ^0.62.0 (#9244)
Co-authored-by: renovate[bot] <29139614+renovate[bot]@users.noreply.github.com>
2025-09-14 12:26:55 +08:00
renovate[bot] 31d2cb8fd7 Update dependency lucide-react to ^0.544.0 (#9245)
Co-authored-by: renovate[bot] <29139614+renovate[bot]@users.noreply.github.com>
2025-09-14 12:26:44 +08:00
lobehubbot 1cf371f418 📝 docs(bot): Auto sync agents & plugin to readme 2025-09-13 16:12:02 +00:00
semantic-release-bot ebc205a8ae 🔖 chore(release): v1.128.5 [skip ci]
### [Version&nbsp;1.128.5](https://github.com/lobehub/lobe-chat/compare/v1.128.4...v1.128.5)
<sup>Released on **2025-09-13**</sup>

#### 🐛 Bug Fixes

- **misc**: Google stream error unable to abort request.

<br/>

<details>
<summary><kbd>Improvements and Fixes</kbd></summary>

#### What's fixed

* **misc**: Google stream error unable to abort request, closes [#9180](https://github.com/lobehub/lobe-chat/issues/9180) ([78eaead](https://github.com/lobehub/lobe-chat/commit/78eaead))

</details>

<div align="right">

[![](https://img.shields.io/badge/-BACK_TO_TOP-151515?style=flat-square)](#readme-top)

</div>
2025-09-13 16:11:00 +00:00
sxjeru 78eaead0d2 🐛 fix: Google stream error unable to abort request (#9180)
* 🐛 fix: 优化 Gemini 流处理中的错误注入和终止事件管理

* 🐛 fix: 在流处理过程中注入提供者信息以增强错误报告

* 提取 lobe_error;添加单测

* fix test

* 修复单元测试

* 优化 LobeGoogleAI 中的错误日志记录,使用 debug 替代 console.log;更新单元测试以验证流处理的错误和数据块

* 增强 createSSEProtocolTransformer,添加 requireTerminalEvent 选项以控制终端事件的强制要求;更新相关单元测试以验证新行为

* revert tests

* fix test
2025-09-14 00:00:31 +08:00
bbbugg 45fa4e01ae 🐛fix: update check model and mark deprecated models (#9214)
🐛fix: update checkModel values and remove deprecated models
2025-09-13 18:29:10 +08:00
lobehubbot 504b14dd3f 📝 docs(bot): Auto sync agents & plugin to readme 2025-09-13 09:56:31 +00:00
semantic-release-bot d753169b69 🔖 chore(release): v1.128.4 [skip ci]
### [Version&nbsp;1.128.4](https://github.com/lobehub/lobe-chat/compare/v1.128.3...v1.128.4)
<sup>Released on **2025-09-13**</sup>

#### 💄 Styles

- **misc**: Fix discover plugin link.

<br/>

<details>
<summary><kbd>Improvements and Fixes</kbd></summary>

#### Styles

* **misc**: Fix discover plugin link, closes [#9240](https://github.com/lobehub/lobe-chat/issues/9240) ([cfb2246](https://github.com/lobehub/lobe-chat/commit/cfb2246))

</details>

<div align="right">

[![](https://img.shields.io/badge/-BACK_TO_TOP-151515?style=flat-square)](#readme-top)

</div>
2025-09-13 09:55:30 +00:00
keep cfb2246492 💄 style: fix discover plugin link (#9240)
修复Discover
2025-09-13 17:45:24 +08:00
renovate[bot] 3a0b0d2173 Update dependency @formkit/auto-animate to ^0.9.0 (#9149)
Co-authored-by: renovate[bot] <29139614+renovate[bot]@users.noreply.github.com>
2025-09-13 17:45:14 +08:00
Neko 7f1b631c35 🔨 chore(model-runtime): openai stream error not inherited correctly (#9102)
* fix(model-runtime,utils): openai stream error not inherited correctly

* fix: test
2025-09-13 17:37:29 +08:00
lobehubbot eca41d33bf 📝 docs(bot): Auto sync agents & plugin to readme 2025-09-13 09:14:21 +00:00
semantic-release-bot c8dea6322d 🔖 chore(release): v1.128.3 [skip ci]
### [Version&nbsp;1.128.3](https://github.com/lobehub/lobe-chat/compare/v1.128.2...v1.128.3)
<sup>Released on **2025-09-13**</sup>

#### 🐛 Bug Fixes

- **misc**: Fix open chat page with float link modal.

<br/>

<details>
<summary><kbd>Improvements and Fixes</kbd></summary>

#### What's fixed

* **misc**: Fix open chat page with float link modal, closes [#9235](https://github.com/lobehub/lobe-chat/issues/9235) ([2c677e5](https://github.com/lobehub/lobe-chat/commit/2c677e5))

</details>

<div align="right">

[![](https://img.shields.io/badge/-BACK_TO_TOP-151515?style=flat-square)](#readme-top)

</div>
2025-09-13 09:13:24 +00:00
Arvin Xu 2c677e597a 🐛 fix: fix open chat page with float link modal (#9235)
* refactor @lobechat/database

* move config/file and llm to envs

* move config/auth to envs

* refactor

* fix tests

* fix tests

* upgrade
2025-09-13 17:03:10 +08:00
lobehubbot a1f7bff302 📝 docs(bot): Auto sync agents & plugin to readme 2025-09-13 04:06:34 +00:00
semantic-release-bot e00ee6c6d1 🔖 chore(release): v1.128.2 [skip ci]
### [Version&nbsp;1.128.2](https://github.com/lobehub/lobe-chat/compare/v1.128.1...v1.128.2)
<sup>Released on **2025-09-13**</sup>

#### 💄 Styles

- **misc**: Update i18n, Update model configs.

<br/>

<details>
<summary><kbd>Improvements and Fixes</kbd></summary>

#### Styles

* **misc**: Update i18n, closes [#9237](https://github.com/lobehub/lobe-chat/issues/9237) ([642dc3b](https://github.com/lobehub/lobe-chat/commit/642dc3b))
* **misc**: Update model configs, closes [#9170](https://github.com/lobehub/lobe-chat/issues/9170) ([f89b730](https://github.com/lobehub/lobe-chat/commit/f89b730))

</details>

<div align="right">

[![](https://img.shields.io/badge/-BACK_TO_TOP-151515?style=flat-square)](#readme-top)

</div>
2025-09-13 04:05:34 +00:00
sxjeru f89b73059d 💄 style: Update model configs (#9170)
* 🐛 fix: 更新深度寻求和谷歌模型的定价,修复模型显示名称

* 🐛 fix: 更新模型配置,增加最大输出限制并移除冗余模型信息

* 🐛 fix: 更新谷歌模型定价策略,将缓存读取的定价从固定改为分层定价

* 🐛 fix: 更新 Kimi K2 模型信息,增加新版本及定价策略,修正显示名称

* 🐛 fix: 更新深度寻求和谷歌模型的定价,修复模型显示名称

* 🐛 fix: 更新模型配置,增加最大输出限制并移除冗余模型信息

* 🐛 fix: 更新谷歌模型定价策略,将缓存读取的定价从固定改为分层定价

* 🐛 fix: 添加新模型 Qwen MT Plus 和 Ling Mini 2.0,更新定价策略

* 🐛 fix: 更新模型配置,调整上下文窗口大小并添加最大输出限制

*  feat: 添加新的聊天模型 Qwen3 Next 80B A3B Thinking 和 Qwen3 Next 80B A3B Instruct

*  feat: 添加 GLM-4.5 和 GLM-4.5-Air 聊天模型,支持推理能力和定价策略

*  feat: 更新聊天模型配置,添加 Qwen3 Next 80B A3B Thinking 和 Qwen3 Next 80B A3B Instruct,调整 Kimi K2 部署名称及参数
2025-09-13 11:54:58 +08:00
LobeHub Bot 642dc3b6c9 🤖 style: update i18n (#9237)
💄 style: update i18n

Co-authored-by: canisminor1990 <17870709+canisminor1990@users.noreply.github.com>
2025-09-13 11:52:21 +08:00
lobehubbot e33c84bcae 📝 docs(bot): Auto sync agents & plugin to readme 2025-09-12 16:24:17 +00:00
semantic-release-bot fd84da415b 🔖 chore(release): v1.128.1 [skip ci]
### [Version&nbsp;1.128.1](https://github.com/lobehub/lobe-chat/compare/v1.128.0...v1.128.1)
<sup>Released on **2025-09-12**</sup>

#### ♻ Code Refactoring

- **misc**: Refactor message proccesser to the context engine.

<br/>

<details>
<summary><kbd>Improvements and Fixes</kbd></summary>

#### Code refactoring

* **misc**: Refactor message proccesser to the context engine, closes [#9230](https://github.com/lobehub/lobe-chat/issues/9230) ([dacfffd](https://github.com/lobehub/lobe-chat/commit/dacfffd))

</details>

<div align="right">

[![](https://img.shields.io/badge/-BACK_TO_TOP-151515?style=flat-square)](#readme-top)

</div>
2025-09-12 16:23:15 +00:00
Arvin Xu dacfffdb63 ♻️ refactor: refactor message proccesser to the context engine (#9230)
* init context engine

* refactor

* refactor

* move

* refactor

* refactor PlaceholderVariables

* refactor name

* refactor

* update

* fix tests

* update workflow

* clean code

* add test

* move from store into service

* implement the HistoryTruncate and Input Template into context engine

* fix history truncate

* clean
2025-09-13 00:12:53 +08:00
Arvin Xu c38079d36f 🔨 chore: improve build process (#9227)
* update

* update
2025-09-12 19:11:42 +08:00
Arvin Xu cf0272cc1b 🔨 chore: upgrade deps (#9228)
upgrade deps
2025-09-12 16:04:05 +08:00
lobehubbot 35da7651b7 📝 docs(bot): Auto sync agents & plugin to readme 2025-09-12 06:57:14 +00:00
semantic-release-bot b2c1209eb7 🔖 chore(release): v1.128.0 [skip ci]
## [Version&nbsp;1.128.0](https://github.com/lobehub/lobe-chat/compare/v1.127.4...v1.128.0)
<sup>Released on **2025-09-12**</sup>

####  Features

- **misc**: ChatInput support resize.

<br/>

<details>
<summary><kbd>Improvements and Fixes</kbd></summary>

#### What's improved

* **misc**: ChatInput support resize, closes [#9215](https://github.com/lobehub/lobe-chat/issues/9215) ([5e814e0](https://github.com/lobehub/lobe-chat/commit/5e814e0))

</details>

<div align="right">

[![](https://img.shields.io/badge/-BACK_TO_TOP-151515?style=flat-square)](#readme-top)

</div>
2025-09-12 06:56:07 +00:00
CanisMinor 5e814e017d feat: ChatInput support resize (#9215)
*  feat: ChatInput support resize

* 💄 style: Update resizeMaxHeightOffset

* 💄 style: Update ChatInput and fix some issues

* 📝 docs: Fix i18n
2025-09-12 14:45:06 +08:00
yliu7949 9a804b5df5 💄 style: add Qwen3-Next-80B-A3B models  (#9223)
update qwen.ts
2025-09-12 12:48:39 +08:00
lobehubbot 0d4264e9ad 📝 docs(bot): Auto sync agents & plugin to readme 2025-09-11 16:31:00 +00:00
semantic-release-bot 419557a2df 🔖 chore(release): v1.127.4 [skip ci]
### [Version&nbsp;1.127.4](https://github.com/lobehub/lobe-chat/compare/v1.127.3...v1.127.4)
<sup>Released on **2025-09-11**</sup>

#### 🐛 Bug Fixes

- **misc**: Improve OpenAIStream processing to emit usage data for chunks lacking choices.

<br/>

<details>
<summary><kbd>Improvements and Fixes</kbd></summary>

#### What's fixed

* **misc**: Improve OpenAIStream processing to emit usage data for chunks lacking choices, closes [#9220](https://github.com/lobehub/lobe-chat/issues/9220) ([8ba662c](https://github.com/lobehub/lobe-chat/commit/8ba662c))

</details>

<div align="right">

[![](https://img.shields.io/badge/-BACK_TO_TOP-151515?style=flat-square)](#readme-top)

</div>
2025-09-11 16:29:56 +00:00
Arvin Xu 8ba662c9de 🐛 fix: Improve OpenAIStream processing to emit usage data for chunks lacking choices (#9220)
* add

* update
2025-09-12 00:19:51 +08:00
Arvin Xu 43a455549c 🔨 chore: Update vite version to ^7.1.5 (#9211)
Update vite version to ^7.1.5
2025-09-11 13:20:34 +08:00
Arvin Xu 58f1a52eb9 🔨 chore(model-runtime): improve export type (#9213)
* improve exports

* improve provider
2025-09-11 13:13:04 +08:00
lobehubbot 4b134968bf 📝 docs(bot): Auto sync agents & plugin to readme 2025-09-11 03:41:15 +00:00
semantic-release-bot 937dd85c6b 🔖 chore(release): v1.127.3 [skip ci]
### [Version&nbsp;1.127.3](https://github.com/lobehub/lobe-chat/compare/v1.127.2...v1.127.3)
<sup>Released on **2025-09-11**</sup>

#### ♻ Code Refactoring

- **misc**: Refactor model runtime folder structure and add more tests.

<br/>

<details>
<summary><kbd>Improvements and Fixes</kbd></summary>

#### Code refactoring

* **misc**: Refactor model runtime folder structure and add more tests, closes [#9210](https://github.com/lobehub/lobe-chat/issues/9210) ([7fe17e4](https://github.com/lobehub/lobe-chat/commit/7fe17e4))

</details>

<div align="right">

[![](https://img.shields.io/badge/-BACK_TO_TOP-151515?style=flat-square)](#readme-top)

</div>
2025-09-11 03:40:13 +00:00
Neko bed591c559 👷 chore: added docker-compose configuration files for Grafana, Prometheus, and Tempo, Otel stacks (#9071)
* feat: added docker-compose configuration files for Grafana, Prometheus, and Tempo, Otel stacks

* fix: datasource uid
2025-09-11 11:27:24 +08:00
Neko 9089e2683e 📝 docs: added docs for deploying production level Grafana stack (#9072)
* docs: added docs for deploying production level Grafana stack

* fix: use absolute path
2025-09-11 11:25:52 +08:00
Arvin Xu 7fe17e4028 ♻️ refactor: refactor model runtime folder structure and add more tests (#9210)
* add test

* fix tests

* fix tests

* revert tests

* refactor model runtime folder

* refactor model runtime folder and remove @/libs/model-runtime

* fix lint

* move

* fix tests
2025-09-11 11:22:05 +08:00
lobehubbot 6ace931e52 📝 docs(bot): Auto sync agents & plugin to readme 2025-09-11 03:18:49 +00:00
semantic-release-bot 76de2a20c1 🔖 chore(release): v1.127.2 [skip ci]
### [Version&nbsp;1.127.2](https://github.com/lobehub/lobe-chat/compare/v1.127.1...v1.127.2)
<sup>Released on **2025-09-11**</sup>

#### 🐛 Bug Fixes

- **misc**: Delete files should delete chunks、embedings、fileChunk.

<br/>

<details>
<summary><kbd>Improvements and Fixes</kbd></summary>

#### What's fixed

* **misc**: Delete files should delete chunks、embedings、fileChunk, closes [#9196](https://github.com/lobehub/lobe-chat/issues/9196) ([4ee1d29](https://github.com/lobehub/lobe-chat/commit/4ee1d29))

</details>

<div align="right">

[![](https://img.shields.io/badge/-BACK_TO_TOP-151515?style=flat-square)](#readme-top)

</div>
2025-09-11 03:17:54 +00:00
Shinji-Li 4ee1d292ff 🐛 fix: delete files should delete chunks、embedings、fileChunk (#9196)
* fix: delete files should delete chunk and documentChunks,embeddings

* feat: add try catch

* feat: add files test

* fix: change chunkid to uuid

* fix: change test embeddings to 1024w

* fix: delete documentchunk
2025-09-11 10:47:22 +08:00
lobehubbot b6aad3b1bc 📝 docs(bot): Auto sync agents & plugin to readme 2025-09-11 01:24:32 +00:00
semantic-release-bot b980c3d702 🔖 chore(release): v1.127.1 [skip ci]
### [Version&nbsp;1.127.1](https://github.com/lobehub/lobe-chat/compare/v1.127.0...v1.127.1)
<sup>Released on **2025-09-11**</sup>

#### 🐛 Bug Fixes

- **misc**: Fix not remove message with server mode.

#### 💄 Styles

- **misc**: Update i18n.

<br/>

<details>
<summary><kbd>Improvements and Fixes</kbd></summary>

#### What's fixed

* **misc**: Fix not remove message with server mode, closes [#9207](https://github.com/lobehub/lobe-chat/issues/9207) ([790af5f](https://github.com/lobehub/lobe-chat/commit/790af5f))

#### Styles

* **misc**: Update i18n, closes [#9208](https://github.com/lobehub/lobe-chat/issues/9208) ([987fbf2](https://github.com/lobehub/lobe-chat/commit/987fbf2))

</details>

<div align="right">

[![](https://img.shields.io/badge/-BACK_TO_TOP-151515?style=flat-square)](#readme-top)

</div>
2025-09-11 01:23:30 +00:00
LobeHub Bot 987fbf2adf 🤖 style: update i18n (#9208)
💄 style: update i18n

Co-authored-by: canisminor1990 <17870709+canisminor1990@users.noreply.github.com>
2025-09-11 09:12:03 +08:00
Arvin Xu 790af5ff40 🐛 fix: fix not remove message with server mode (#9207)
* fix remove message

* make wideScreen default false

* improve topic generate and add tests for delete

* refactor

* fix tests
2025-09-11 09:11:36 +08:00
Maple Gao 3eaeb6c531 📝 docs: consolidate image generation docs with server database setup (#9096)
♻️ refactor: consolidate image generation docs with server database setup

- Merge image-generation-setup content into work-with-server-side-database docs
- Remove duplicate image-generation-setup documentation files
- Add server-side database links to setup-development guides
- Add missing .env.development copy step to setup instructions
- Add .env.development to .gitignore for security

The setup script approach has been replaced by Docker Compose configuration
with .env.example.development file, eliminating documentation duplication
and providing a unified server-side development workflow.
2025-09-11 01:16:58 +08:00
lobehubbot aa841a3879 📝 docs(bot): Auto sync agents & plugin to readme 2025-09-10 13:27:08 +00:00
semantic-release-bot a49422b322 🔖 chore(release): v1.127.0 [skip ci]
## [Version&nbsp;1.127.0](https://github.com/lobehub/lobe-chat/compare/v1.126.3...v1.127.0)
<sup>Released on **2025-09-10**</sup>

####  Features

- **misc**: Seedream 4.0.

#### 💄 Styles

- **misc**: Add hotkey tooltip to typobar actions.

<br/>

<details>
<summary><kbd>Improvements and Fixes</kbd></summary>

#### What's improved

* **misc**: Seedream 4.0, closes [#9198](https://github.com/lobehub/lobe-chat/issues/9198) ([26a743f](https://github.com/lobehub/lobe-chat/commit/26a743f))

#### Styles

* **misc**: Add hotkey tooltip to typobar actions, closes [#9203](https://github.com/lobehub/lobe-chat/issues/9203) ([e372875](https://github.com/lobehub/lobe-chat/commit/e372875))

</details>

<div align="right">

[![](https://img.shields.io/badge/-BACK_TO_TOP-151515?style=flat-square)](#readme-top)

</div>
2025-09-10 13:26:06 +00:00
CanisMinor e3728750af 💄 style: Add hotkey tooltip to typobar actions (#9203)
* 💄 style: Add hotkey tooltip to typobar actions

* 💄 style: Udpate input style

* 💄 style: Add toggleExpandInputActionbar to GlobalStore
2025-09-10 21:15:57 +08:00
YuTengjing 26a743f3bd feat: Seedream 4.0 (#9198) 2025-09-10 19:51:43 +08:00
lobehubbot bfbf38d106 📝 docs(bot): Auto sync agents & plugin to readme 2025-09-10 02:45:00 +00:00
semantic-release-bot f8eb891d3b 🔖 chore(release): v1.126.3 [skip ci]
### [Version&nbsp;1.126.3](https://github.com/lobehub/lobe-chat/compare/v1.126.2...v1.126.3)
<sup>Released on **2025-09-10**</sup>

#### 💄 Styles

- **misc**: Add CometAPI model provider and chat models, update i18n.

<br/>

<details>
<summary><kbd>Improvements and Fixes</kbd></summary>

#### Styles

* **misc**: Add CometAPI model provider and chat models, closes [#9065](https://github.com/lobehub/lobe-chat/issues/9065) ([575e334](https://github.com/lobehub/lobe-chat/commit/575e334))
* **misc**: Update i18n, closes [#9146](https://github.com/lobehub/lobe-chat/issues/9146) ([e6fc02e](https://github.com/lobehub/lobe-chat/commit/e6fc02e))

</details>

<div align="right">

[![](https://img.shields.io/badge/-BACK_TO_TOP-151515?style=flat-square)](#readme-top)

</div>
2025-09-10 02:43:57 +00:00
renovate[bot] 52ec64dfd4 Update dependency @anthropic-ai/sdk to ^0.61.0 (#9148)
Co-authored-by: renovate[bot] <29139614+renovate[bot]@users.noreply.github.com>
2025-09-10 10:33:28 +08:00
LobeHub Bot e6fc02eb9d 🤖 style: update i18n (#9146)
💄 style: update i18n

Co-authored-by: canisminor1990 <17870709+canisminor1990@users.noreply.github.com>
2025-09-10 10:26:40 +08:00
TensorNull 575e334d7f 💄 style: Add CometAPI model provider and chat models (#9065)
*  feat: 添加 CometAPI 模型支持及相关配置

* 🐛 fix: 移除 CometAPI 中的 chatModels 列表以简化配置
2025-09-10 10:26:20 +08:00
lobehubbot a4ed5a053f 📝 docs(bot): Auto sync agents & plugin to readme 2025-09-09 15:23:51 +00:00
semantic-release-bot dbb49337b4 🔖 chore(release): v1.126.2 [skip ci]
### [Version&nbsp;1.126.2](https://github.com/lobehub/lobe-chat/compare/v1.126.1...v1.126.2)
<sup>Released on **2025-09-09**</sup>

#### 🐛 Bug Fixes

- **misc**: Fix editor key handling.

<br/>

<details>
<summary><kbd>Improvements and Fixes</kbd></summary>

#### What's fixed

* **misc**: Fix editor key handling, closes [#9189](https://github.com/lobehub/lobe-chat/issues/9189) ([8be822b](https://github.com/lobehub/lobe-chat/commit/8be822b))

</details>

<div align="right">

[![](https://img.shields.io/badge/-BACK_TO_TOP-151515?style=flat-square)](#readme-top)

</div>
2025-09-09 15:22:49 +00:00
CanisMinor 8be822b0b7 🐛 fix: Fix editor key handling (#9189)
* 🐛 fix: Fix editor send key handling

* 🐛 fix: Fix editor key handle
2025-09-09 23:12:02 +08:00
renovate[bot] 5a999c0fbc Update pnpm to v10.15.1 (#9147)
Co-authored-by: renovate[bot] <29139614+renovate[bot]@users.noreply.github.com>
2025-09-09 11:35:34 +08:00
lobehubbot 9abeb7b545 📝 docs(bot): Auto sync agents & plugin to readme 2025-09-09 03:23:18 +00:00
semantic-release-bot 8751141c7c 🔖 chore(release): v1.126.1 [skip ci]
### [Version&nbsp;1.126.1](https://github.com/lobehub/lobe-chat/compare/v1.126.0...v1.126.1)
<sup>Released on **2025-09-09**</sup>

#### 🐛 Bug Fixes

- **misc**: Fix Assistant List error message.

<br/>

<details>
<summary><kbd>Improvements and Fixes</kbd></summary>

#### What's fixed

* **misc**: Fix Assistant List error message, closes [#9178](https://github.com/lobehub/lobe-chat/issues/9178) ([3519cb2](https://github.com/lobehub/lobe-chat/commit/3519cb2))

</details>

<div align="right">

[![](https://img.shields.io/badge/-BACK_TO_TOP-151515?style=flat-square)](#readme-top)

</div>
2025-09-09 03:22:23 +00:00
Arvin Xu 3519cb20d9 🐛 fix: fix Assistant List error message (#9178)
* fix

* fix tests
2025-09-09 11:12:53 +08:00
lobehubbot e135e2bb87 📝 docs(bot): Auto sync agents & plugin to readme 2025-09-08 15:58:41 +00:00
semantic-release-bot a494af8e7f 🔖 chore(release): v1.126.0 [skip ci]
## [Version&nbsp;1.126.0](https://github.com/lobehub/lobe-chat/compare/v1.125.0...v1.126.0)
<sup>Released on **2025-09-08**</sup>

####  Features

- **image**: Implement model selection memory functionality.

<br/>

<details>
<summary><kbd>Improvements and Fixes</kbd></summary>

#### What's improved

* **image**: Implement model selection memory functionality, closes [#9160](https://github.com/lobehub/lobe-chat/issues/9160) ([b00e6d7](https://github.com/lobehub/lobe-chat/commit/b00e6d7))

</details>

<div align="right">

[![](https://img.shields.io/badge/-BACK_TO_TOP-151515?style=flat-square)](#readme-top)

</div>
2025-09-08 15:57:35 +00:00
YuTengjing ea819a3421 feat: support mac intel desktop (#9136) 2025-09-08 23:46:57 +08:00
YuTengjing b00e6d7817 feat(image): implement model selection memory functionality (#9160) 2025-09-08 23:46:47 +08:00
lobehubbot 58378fd10f 📝 docs(bot): Auto sync agents & plugin to readme 2025-09-08 11:46:52 +00:00
semantic-release-bot c0736ead54 🔖 chore(release): v1.125.0 [skip ci]
## [Version&nbsp;1.125.0](https://github.com/lobehub/lobe-chat/compare/v1.124.4...v1.125.0)
<sup>Released on **2025-09-08**</sup>

####  Features

- **misc**: Add Math and TaskList to Editor.

<br/>

<details>
<summary><kbd>Improvements and Fixes</kbd></summary>

#### What's improved

* **misc**: Add Math and TaskList to Editor, closes [#9165](https://github.com/lobehub/lobe-chat/issues/9165) ([9e0621f](https://github.com/lobehub/lobe-chat/commit/9e0621f))

</details>

<div align="right">

[![](https://img.shields.io/badge/-BACK_TO_TOP-151515?style=flat-square)](#readme-top)

</div>
2025-09-08 11:45:52 +00:00
CanisMinor 9e0621f873 feat: Add Math and TaskList to Editor (#9165)
*  feat: Add Math and TaskList to Editor

* 🔧 chore: Update editor version

* 🐛 fix: Fix code plugin
2025-09-08 19:35:32 +08:00
René Wang 082898825c 🔨 chore: Branching input component for incoming group chat (#9163)
feat: Branching input component
2025-09-08 12:13:01 +08:00
lobehubbot 7832287abd 📝 docs(bot): Auto sync agents & plugin to readme 2025-09-06 16:32:27 +00:00
semantic-release-bot 5fe229c600 🔖 chore(release): v1.124.4 [skip ci]
### [Version&nbsp;1.124.4](https://github.com/lobehub/lobe-chat/compare/v1.124.3...v1.124.4)
<sup>Released on **2025-09-06**</sup>

#### 🐛 Bug Fixes

- **misc**: Revert V1 Mobile.

<br/>

<details>
<summary><kbd>Improvements and Fixes</kbd></summary>

#### What's fixed

* **misc**: Revert V1 Mobile, closes [#9143](https://github.com/lobehub/lobe-chat/issues/9143) ([b385602](https://github.com/lobehub/lobe-chat/commit/b385602))

</details>

<div align="right">

[![](https://img.shields.io/badge/-BACK_TO_TOP-151515?style=flat-square)](#readme-top)

</div>
2025-09-06 16:31:26 +00:00
bbbugg 6b9337b8ae 🐛fix: Qwen 3 Max Preview model with search capability (#9132)
fix: Qwen 3 Max Preview with search capability
2025-09-07 00:21:17 +08:00
Arvin Xu b3856026d2 🐛 fix: revert V1 Mobile (#9143)
revert V1 Mobile
2025-09-07 00:20:24 +08:00
bbbugg 8dbcbd8c4b 🐛fix: update back navigation logic for provider settings in mobile view (#9141)
🐛 fix: update back navigation logic for provider settings in mobile view
2025-09-06 23:57:02 +08:00
lobehubbot a5b6aadc1f 📝 docs(bot): Auto sync agents & plugin to readme 2025-09-06 10:55:25 +00:00
semantic-release-bot 3690724751 🔖 chore(release): v1.124.3 [skip ci]
### [Version&nbsp;1.124.3](https://github.com/lobehub/lobe-chat/compare/v1.124.2...v1.124.3)
<sup>Released on **2025-09-06**</sup>

#### ♻ Code Refactoring

- **misc**: Refactor to remove edge runtime and add more tests.

<br/>

<details>
<summary><kbd>Improvements and Fixes</kbd></summary>

#### Code refactoring

* **misc**: Refactor to remove edge runtime and add more tests, closes [#9133](https://github.com/lobehub/lobe-chat/issues/9133) ([6f87034](https://github.com/lobehub/lobe-chat/commit/6f87034))

</details>

<div align="right">

[![](https://img.shields.io/badge/-BACK_TO_TOP-151515?style=flat-square)](#readme-top)

</div>
2025-09-06 10:54:26 +00:00
Arvin Xu 6f87034303 ♻️ refactor: refactor to remove edge runtime and add more tests (#9133)
* refactor to add more tests

* refactor the add

* update

* remove edge runtime

* improve types

* remove edge runtime

* fix

* revert auth part

* revert auth part

* revert auth part
2025-09-06 18:44:19 +08:00
Arvin Xu ae28f1794c ️ build : Revert "support mac intel chip" (#9134)
Revert "feat(desktop): support mac intel chip (#9084)"

This reverts commit 1a75f4a6b5.
2025-09-06 16:14:42 +08:00
lobehubbot 68783fd2f7 📝 docs(bot): Auto sync agents & plugin to readme 2025-09-06 07:10:23 +00:00
semantic-release-bot 9e43c1d6e0 🔖 chore(release): v1.124.2 [skip ci]
### [Version&nbsp;1.124.2](https://github.com/lobehub/lobe-chat/compare/v1.124.1...v1.124.2)
<sup>Released on **2025-09-06**</sup>

#### 🐛 Bug Fixes

- **misc**: Fix ChatInput send command switch.

<br/>

<details>
<summary><kbd>Improvements and Fixes</kbd></summary>

#### What's fixed

* **misc**: Fix ChatInput send command switch, closes [#9131](https://github.com/lobehub/lobe-chat/issues/9131) ([4d5246a](https://github.com/lobehub/lobe-chat/commit/4d5246a))

</details>

<div align="right">

[![](https://img.shields.io/badge/-BACK_TO_TOP-151515?style=flat-square)](#readme-top)

</div>
2025-09-06 07:09:17 +00:00
Arvin Xu 4d5246acd8 🐛 fix: fix ChatInput send command switch (#9131)
fix command enter switch
2025-09-06 14:59:26 +08:00
Arvin Xu f813d0c429 test: add model runtime tests (#9128)
* fix

* refactor to remove model runtime alias in tests
2025-09-06 14:57:14 +08:00
YuTengjing 1a75f4a6b5 feat(desktop): support mac intel chip (#9084) 2025-09-06 14:03:16 +08:00
Arvin Xu f4c3002b55 test: refactor to improve utils tests and add more tests (#9124)
* refactor to improve utils code

* refactor to improve const code

* refactor to improve types code

* add web crawler tests

* refactor citation item

* add electron server ipc tests

* fix tests

* add more tests

* add timeout
2025-09-06 12:21:58 +08:00
lobehubbot e3aacfcdce 📝 docs(bot): Auto sync agents & plugin to readme 2025-09-06 03:42:14 +00:00
semantic-release-bot 67ad3c42cc 🔖 chore(release): v1.124.1 [skip ci]
### [Version&nbsp;1.124.1](https://github.com/lobehub/lobe-chat/compare/v1.124.0...v1.124.1)
<sup>Released on **2025-09-06**</sup>

#### 🐛 Bug Fixes

- **misc**: Enhance NewAPI with environment variables and fix routers compatibility.

#### 💄 Styles

- **misc**: Update doubao-seed-1.6-vision models.

<br/>

<details>
<summary><kbd>Improvements and Fixes</kbd></summary>

#### What's fixed

* **misc**: Enhance NewAPI with environment variables and fix routers compatibility, closes [#9110](https://github.com/lobehub/lobe-chat/issues/9110) ([a66856d](https://github.com/lobehub/lobe-chat/commit/a66856d))

#### Styles

* **misc**: Update doubao-seed-1.6-vision models, closes [#9052](https://github.com/lobehub/lobe-chat/issues/9052) ([df2d001](https://github.com/lobehub/lobe-chat/commit/df2d001))

</details>

<div align="right">

[![](https://img.shields.io/badge/-BACK_TO_TOP-151515?style=flat-square)](#readme-top)

</div>
2025-09-06 03:41:13 +00:00
sxjeru df2d001336 💄 style: Update doubao-seed-1.6-vision models (#9052)
*  feat: 更新 Hunyuan、Novita 和 VolcEngine 模型的参数和描述

*  feat: 添加 DeepSeek V3.1 的思考模式和非思考模式模型,更新描述和显示名称

*  feat: 更新 Groq 模型的描述和显示名称,调整 ID 格式

*  feat: 更新 Novita 模型的上下文窗口令牌和定价策略

*  feat: 添加 Gemma 3 12B 和 Seed OSS 36B Instruct 模型,更新描述、定价和上下文窗口令牌

*  feat: 更新 Novita 模型的定价策略,调整输入和输出的费率

*  feat: 移除 Gemini 2.5 Flash 实验模型,更新模型列表

*  feat: 添加 Kimi K2 0905 模型,更新上下文窗口令牌和定价策略

* update groq

*  feat: 添加 Kimi K2 0905 模型,更新上下文窗口令牌和定价策略

*  feat: 更新 Doubao Seed 模型的部署名称和最大输出,调整上下文窗口令牌

*  feat: 添加 Qwen3 Max Preview 模型,更新上下文窗口令牌和定价策略
2025-09-06 11:30:46 +08:00
Maple Gao a66856dc83 🐛 fix: enhance NewAPI with environment variables and fix routers compatibility (#9110)
 feat: enhance NewAPI with environment variables and fix routers compatibility

- Add NEWAPI_API_KEY and NEWAPI_PROXY_URL environment variable support
- Update documentation for NewAPI configuration options
- Fix routers baseURL handling to prevent duplicate version paths
- Remove /v1 baseURL requirement to avoid SDK compatibility issues
- Auto-detect model capabilities based on provider detection
- Support dynamic routing to correct provider endpoints

This resolves URL duplication issues like /v1beta/v1beta/ and ensures
proper routing to Anthropic, Google, OpenAI, and XAI endpoints.
2025-09-06 11:30:12 +08:00
Arvin Xu e7036af61e test: add test for v2 genai (#9123)
* add more tests

* update tests

* improve
2025-09-06 11:16:30 +08:00
lobehubbot 86ff95ff15 📝 docs(bot): Auto sync agents & plugin to readme 2025-09-06 02:03:08 +00:00
semantic-release-bot 926577302e 🔖 chore(release): v1.124.0 [skip ci]
## [Version&nbsp;1.124.0](https://github.com/lobehub/lobe-chat/compare/v1.123.4...v1.124.0)
<sup>Released on **2025-09-06**</sup>

####  Features

- **misc**: ChatInput support rich text and support parallel send.

<br/>

<details>
<summary><kbd>Improvements and Fixes</kbd></summary>

#### What's improved

* **misc**: ChatInput support rich text and support parallel send, closes [#8964](https://github.com/lobehub/lobe-chat/issues/8964) ([38d9d98](https://github.com/lobehub/lobe-chat/commit/38d9d98))

</details>

<div align="right">

[![](https://img.shields.io/badge/-BACK_TO_TOP-151515?style=flat-square)](#readme-top)

</div>
2025-09-06 02:02:12 +00:00
CanisMinor 38d9d98b97 feat: ChatInput support rich text and support parallel send (#8964)
*  feat: Add LobeEditor

* fix tests

* fix mobile

---------

Co-authored-by: arvinxx <arvinx@foxmail.com>
2025-09-06 09:51:52 +08:00
lobehubbot e2448eb091 📝 docs(bot): Auto sync agents & plugin to readme 2025-09-05 14:23:34 +00:00
semantic-release-bot 5747239625 🔖 chore(release): v1.123.4 [skip ci]
### [Version&nbsp;1.123.4](https://github.com/lobehub/lobe-chat/compare/v1.123.3...v1.123.4)
<sup>Released on **2025-09-05**</sup>

#### ♻ Code Refactoring

- **misc**: Remove edge runtime.

<br/>

<details>
<summary><kbd>Improvements and Fixes</kbd></summary>

#### Code refactoring

* **misc**: Remove edge runtime, closes [#9085](https://github.com/lobehub/lobe-chat/issues/9085) ([d3544f9](https://github.com/lobehub/lobe-chat/commit/d3544f9))

</details>

<div align="right">

[![](https://img.shields.io/badge/-BACK_TO_TOP-151515?style=flat-square)](#readme-top)

</div>
2025-09-05 14:22:34 +00:00
Arvin Xu d3544f90d3 ♻️ refactor: remove edge runtime (#9085)
* remove edge runtime

* refactor
2025-09-05 22:12:34 +08:00
Arvin Xu 3e537cd01d ♻️ refactor: refactor to use trpc client link chain (#9107)
* refactor

* Update lambda.ts
2025-09-05 21:53:31 +08:00
lobehubbot 72e77b497c 📝 docs(bot): Auto sync agents & plugin to readme 2025-09-05 09:58:40 +00:00
semantic-release-bot 285e2f35f7 🔖 chore(release): v1.123.3 [skip ci]
### [Version&nbsp;1.123.3](https://github.com/lobehub/lobe-chat/compare/v1.123.2...v1.123.3)
<sup>Released on **2025-09-05**</sup>

#### 🐛 Bug Fixes

- **misc**: Fix mobile header title to loog not ellipsis.

<br/>

<details>
<summary><kbd>Improvements and Fixes</kbd></summary>

#### What's fixed

* **misc**: Fix mobile header title to loog not ellipsis, closes [#9109](https://github.com/lobehub/lobe-chat/issues/9109) ([9b8435b](https://github.com/lobehub/lobe-chat/commit/9b8435b))

</details>

<div align="right">

[![](https://img.shields.io/badge/-BACK_TO_TOP-151515?style=flat-square)](#readme-top)

</div>
2025-09-05 09:57:45 +00:00
Shinji-Li 9b8435b024 🐛 fix: fix mobile header title to loog not ellipsis (#9109)
fix: fix mobile header title to loog not ellipsis
2025-09-05 17:47:37 +08:00
775 changed files with 57261 additions and 7507 deletions
+2 -2
View File
@@ -1,6 +1,6 @@
---
description: 包含添加 debug 日志请求时
globs:
description: 包含添加 console.log 日志请求时
globs:
alwaysApply: false
---
# Debug 包使用指南
+95 -93
View File
@@ -2,117 +2,115 @@
globs: *.tsx
alwaysApply: false
---
# LobeChat 国际化指南
# LobeChat Internationalization Guide
## 架构概览
## Key Points
LobeChat 使用 react-i18next 进行国际化,采用良好的命名空间架构:
- Default language: Chinese (zh-CN) as the source language
- Supported languages: 18 languages including English, Japanese, Korean, Arabic, etc.
- Framework: react-i18next with Next.js app router
- Translation automation: @lobehub/i18n-cli for automatic translation, config file: .i18nrc.js
- Never manually modify any json file. You can only modify files in `default` folder
- 默认语言:中文(zh-CN),作为源语言
- 支持语言:18 种语言,包括英语、日语、韩语、阿拉伯语等
- 框架:react-i18next 配合 Next.js app router
- 翻译自动化:@lobehub/i18n-cli 用于自动翻译,配置文件:.i18nrc.js
## 目录结构
## Directory Structure
```
src/locales/
├── default/ # 源语言文件(zh-CN
│ ├── index.ts # 命名空间导出
│ ├── common.ts # 通用翻译
│ ├── chat.ts # 聊天相关翻译
│ ├── setting.ts # 设置翻译
│ └── ... # 其他命名空间文件
└── resources.ts # 类型定义和语言配置
├── default/ # Source language files (zh-CN)
│ ├── index.ts # Namespace exports
│ ├── common.ts # Common translations
│ ├── chat.ts # Chat-related translations
│ ├── setting.ts # Settings translations
│ └── ... # Other namespace files
└── resources.ts # Type definitions and language configuration
locales/ # 翻译文件
├── en-US/ # 英语翻译
│ ├── common.json # 通用翻译
│ ├── chat.json # 聊天翻译
│ ├── setting.json # 设置翻译
│ └── ... # 其他命名空间 JSON 文件
├── ja-JP/ # 日语翻译
locales/ # Translation files
├── en-US/ # English translations
│ ├── common.json # Common translations
│ ├── chat.json # Chat translations
│ ├── setting.json # Settings translations
│ └── ... # Other namespace JSON files
├── ja-JP/ # Japanese translations
│ ├── common.json
│ ├── chat.json
│ └── ...
└── ... # 其他语言文件夹
└── ... # Other language folders
```
## 添加新翻译的工作流程
## Workflow for Adding New Translations
### 1. 添加新的翻译键
### 1. Adding New Translation Keys
第一步:在 src/locales/default 目录下的相应命名空间文件中添加翻译键
Step 1: Add translation keys in the corresponding namespace files under src/locales/default directory
```typescript
// 示例:src/locales/default/common.ts
// Example: src/locales/default/common.ts
export default {
// ... 现有键
newFeature: {
title: "新功能标题",
description: "功能描述文案",
button: "操作按钮",
},
// ... existing keys
newFeature: {
title: '新功能标题',
description: '功能描述文案',
button: '操作按钮',
},
};
```
第二步:如果创建新命名空间,需要在 src/locales/default/index.ts 中导出
Step 2: If creating a new namespace, export it in src/locales/default/index.ts
```typescript
import newNamespace from "./newNamespace";
import newNamespace from './newNamespace';
const resources = {
// ... 现有命名空间
newNamespace,
// ... existing namespaces
newNamespace,
} as const;
```
### 2. 翻译过程
### 2. Translation Process
开发模式:
Development mode:
一般情况下不需要你帮我跑自动翻译工具,跑一次很久,需要的时候我会自己跑。
但是为了立马能看到效果,还是需要先翻译 `locales/zh-CN/namespace.json`,不需要翻译其它语言。
Generally, you don't need to help me run the automatic translation tool as it takes a long time. I'll run it myself when needed. However, to see immediate results, you still need to translate `locales/zh-CN/namespace.json` first, no need to translate other languages.
生产模式:
Production mode:
```bash
# 为所有语言生成翻译
# Generate translations for all languages
npm run i18n
```
## 在组件中使用
## Usage in Components
### 基本用法
### Basic Usage
```tsx
import { useTranslation } from "react-i18next";
import { useTranslation } from 'react-i18next';
const MyComponent = () => {
const { t } = useTranslation("common");
const { t } = useTranslation('common');
return (
<div>
<h1>{t("newFeature.title")}</h1>
<p>{t("newFeature.description")}</p>
<button>{t("newFeature.button")}</button>
</div>
);
return (
<div>
<h1>{t('newFeature.title')}</h1>
<p>{t('newFeature.description')}</p>
<button>{t('newFeature.button')}</button>
</div>
);
};
```
### 带参数的用法
### Usage with Parameters
```tsx
const { t } = useTranslation("common");
const { t } = useTranslation('common');
<p>{t("welcome.message", { name: "John" })}</p>;
<p>{t('welcome.message', { name: 'John' })}</p>;
// 对应的语言文件:
// welcome: { message: '欢迎 {{name}} 使用!' }
// Corresponding language file:
// welcome: { message: 'Welcome {{name}}!' }
```
### 多个命名空间
### Multiple Namespaces
```tsx
const { t } = useTranslation(['common', 'chat']);
@@ -121,59 +119,63 @@ const { t } = useTranslation(['common', 'chat']);
<span>{t('chat:typing')}</span>
```
## 类型安全
## Type Safety
项目使用 TypeScript 实现类型安全的翻译,类型从 src/locales/resources.ts 自动生成:
The project uses TypeScript to implement type-safe translations, with types automatically generated from src/locales/resources.ts:
```typescript
import type { DefaultResources, NS, Locales } from "@/locales/resources";
import type { DefaultResources, Locales, NS } from '@/locales/resources';
// 可用类型:
// - NS: 可用命名空间键 ('common' | 'chat' | 'setting' | ...)
// - Locales: 支持的语言代码 ('en-US' | 'zh-CN' | 'ja-JP' | ...)
// Available types:
// - NS: Available namespace keys ('common' | 'chat' | 'setting' | ...)
// - Locales: Supported language codes ('en-US' | 'zh-CN' | 'ja-JP' | ...)
const namespace: NS = "common";
const locale: Locales = "en-US";
const namespace: NS = 'common';
const locale: Locales = 'en-US';
```
## 最佳实践
## Best Practices
### 1. 命名空间组织
### 1. Namespace Organization
- common: 共享 UI 元素(按钮、标签、操作)
- chat: 聊天特定功能
- setting: 配置和设置
- error: 错误消息和处理
- [feature]: 功能特定或页面特定的命名空间
- components: 可复用组件文案
- common: Shared UI elements (buttons, labels, actions)
- chat: Chat-specific functionality
- setting: Configuration and settings
- error: Error messages and handling
- [feature]: Feature-specific or page-specific namespaces
- components: Reusable component text
### 2. 键命名约定
### 2. Key Naming Conventions
```typescript
// ✅ 好:层次结构
// ✅ Good: Hierarchical structure
export default {
modal: {
confirm: {
title: "确认操作",
message: "确定要执行此操作吗?",
actions: {
confirm: "确认",
cancel: "取消",
},
},
modal: {
confirm: {
title: '确认操作',
message: '确定要执行此操作吗?',
actions: {
confirm: '确认',
cancel: '取消',
},
},
},
};
// ❌ 避免:扁平结构
// ❌ Avoid: Flat structure
export default {
modalConfirmTitle: "确认操作",
modalConfirmMessage: "确定要执行此操作吗?",
modalConfirmTitle: '确认操作',
modalConfirmMessage: '确定要执行此操作吗?',
};
```
## 故障排除
## Troubleshooting
### 缺少翻译键
### Missing Translation Keys
- Check if the key exists in src/locales/default/namespace.ts
- Ensure the namespace is correctly imported in the component
- Ensure new namespaces are exported in src/locales/default/index.ts
- 检查键是否存在于 src/locales/default/namespace.ts 中
- 确保在组件中正确导入命名空间
+4 -4
View File
@@ -18,13 +18,13 @@ The project uses the following technologies:
- Next.js 15 for frontend and backend, using app router instead of pages router
- react 19, using hooks, functional components, react server components
- TypeScript programming language
- antd, @lobehub/ui for component framework
- antd, `@lobehub/ui` for component framework
- antd-style for css-in-js framework
- react-layout-kit for flex layout
- react-i18next for i18n
- lucide-react, @ant-design/icons for icons
- @lobehub/icons for AI provider/model logo icon
- @formkit/auto-animate for react list animation
- lucide-react, `@ant-design/icons` for icons
- `@lobehub/icons` for AI provider/model logo icon
- `@formkit/auto-animate` for react list animation
- zustand for global state management
- nuqs for type-safe search params state manager
- SWR for react data fetch
+3 -2
View File
@@ -9,6 +9,7 @@ alwaysApply: false
- 如果要写复杂样式的话用 antd-style ,简单的话可以用 style 属性直接写内联样式
- 如果需要 flex 布局或者居中布局应该使用 react-layout-kit 的 Flexbox 和 Center 组件
- 选择组件时优先顺序应该是 src/components > 安装的组件 package > lobe-ui > antd
- 使用 selector 访问 zustand store 的数据,而不是直接从 store 获取
## antd-style token system
@@ -85,9 +86,9 @@ const Card: FC<CardProps> = ({ title, content }) => {
## Lobe UI 包含的组件
- 不知道 @lobehub/ui 的组件怎么用,有哪些属性,就自己搜下这个项目其它地方怎么用的,不要瞎猜,大部分组件都是在 antd 的基础上扩展了属性
- 不知道 `@lobehub/ui` 的组件怎么用,有哪些属性,就自己搜下这个项目其它地方怎么用的,不要瞎猜,大部分组件都是在 antd 的基础上扩展了属性
- 具体用法不懂可以联网搜索,例如 ActionIcon 就爬取 https://ui.lobehub.com/components/action-icon
- 可以阅读 node_modules/@lobehub/ui/es/index.js 了解有哪些组件,每个组件的属性是什么
- 可以阅读 `node_modules/@lobehub/ui/es/index.js` 了解有哪些组件,每个组件的属性是什么
- General
- ActionIcon
+57 -5
View File
@@ -8,11 +8,63 @@ alwaysApply: false
## Types and Type Safety
- Avoid explicit type annotations when TypeScript can infer types.
- Avoid implicitly `any` variables; explicitly type when necessary (e.g., `let a: number` instead of `let a`).
- Use the most accurate type possible (e.g., prefer `Record<PropertyKey, unknown>` over `object`).
- Prefer `interface` over `type` for object shapes (e.g., React component props). Keep `type` for unions, intersections, and utility types.
- Prefer `as const satisfies XyzInterface` over plain `as const` when suitable.
- avoid explicit type annotations when TypeScript can infer types.
- avoid implicitly `any` variables; explicitly type when necessary (e.g., `let a: number` instead of `let a`).
- use the most accurate type possible (e.g., prefer `Record<PropertyKey, unknown>` over `object`).
- prefer `interface` over `type` for object shapes (e.g., React component props). Keep `type` for unions, intersections, and utility types.
- prefer `as const satisfies XyzInterface` over plain `as const` when suitable.
- prefer `@ts-expect-error` over `@ts-ignore`
- prefer `Record<string, any>` over `any`
- **Avoid unnecessary null checks**: Before adding `xxx !== null`, `?.`, `??`, or `!.`, read the type definition to confirm the necessary. **Example:**
```typescript
// ❌ Wrong: budget.spend and budget.maxBudget is number, not number | null
if (budget.spend !== null && budget.maxBudget !== null && budget.spend >= budget.maxBudget) {
// ...
}
// ✅ Right
if (budget.spend >= budget.maxBudget) {
// ...
}
```
- **Avoid redundant runtime checks**: Don't add runtime validation for conditions already guaranteed by types or previous checks. Trust the type system and calling contract. **Example:**
```typescript
// ❌ Wrong: Adding impossible-to-fail checks
const due = await db.query.budgets.findMany({
where: and(isNotNull(budgets.budgetDuration)), // Already filtered non-null
});
const result = due.map(b => {
const nextReset = computeNextResetAt(b.budgetResetAt!, b.budgetDuration!);
if (!nextReset) { // This check is impossible to fail
throw new Error(`Unexpected null nextResetAt`);
}
return nextReset;
});
// ✅ Right: Trust the contract
const due = await db.query.budgets.findMany({
where: and(isNotNull(budgets.budgetDuration)),
});
const result = due.map(b => computeNextResetAt(b.budgetResetAt!, b.budgetDuration!));
```
- **Avoid meaningless null/undefined parameters**: Don't accept null/undefined for parameters that have no business meaning when null. Design strict function contracts. **Example:**
```typescript
// ❌ Wrong: Function accepts meaningless null input
function computeNextResetAt(currentResetAt: Date, durationStr: string | null): Date | null {
if (!durationStr) return null; // Why accept null if it just returns null?
}
// ✅ Right: Strict contract, clear responsibility
function computeNextResetAt(currentResetAt: Date, durationStr: string): Date {
// Function has single clear purpose, caller ensures valid input
}
```
## Imports and Modules
+4 -3
View File
@@ -1,6 +1,7 @@
{
"image": "mcr.microsoft.com/devcontainers/typescript-node",
"features": {
"ghcr.io/devcontainer-community/devcontainer-features/bun.sh:1": {}
}
"ghcr.io/devcontainer-community/devcontainer-features/bun.sh:1": {},
"ghcr.io/devcontainers/features/docker-outside-of-docker:1": {}
},
"image": "mcr.microsoft.com/devcontainers/typescript-node"
}
+10
View File
@@ -173,6 +173,16 @@ OPENAI_API_KEY=sk-xxxxxxxxx
# NEBIUS_API_KEY=sk-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
### NewAPI Service ###
# NEWAPI_API_KEY=sk-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
# NEWAPI_PROXY_URL=https://your-newapi-server.com
### Vercel AI Gateway ###
# VERCELAIGATEWAY_API_KEY=your_vercel_ai_gateway_api_key
########################################
############ Market Service ############
########################################
+11 -2
View File
@@ -36,10 +36,19 @@ module.exports = async ({ github, context, releaseUrl, version, tag }) => {
// Generate combined download table
let assetTable = '| Platform | File | Size |\n| --- | --- | --- |\n';
// Add macOS assets
// Add macOS assets with architecture detection
macAssets.forEach((asset) => {
const sizeInMB = (asset.size / (1024 * 1024)).toFixed(2);
assetTable += `| macOS | [${asset.name}](${asset.browser_download_url}) | ${sizeInMB} MB |\n`;
// Detect architecture from filename
let architecture = '';
if (asset.name.includes('arm64')) {
architecture = ' (Apple Silicon)';
} else if (asset.name.includes('x64') || asset.name.includes('-mac.')) {
architecture = ' (Intel)';
}
assetTable += `| macOS${architecture} | [${asset.name}](${asset.browser_download_url}) | ${sizeInMB} MB |\n`;
});
// Add Windows assets
+1 -1
View File
@@ -26,7 +26,7 @@ jobs:
ref: ${{ github.event.pull_request.head.ref }}
- name: Install bun
uses: oven-sh/setup-bun@v1
uses: oven-sh/setup-bun@v2
with:
bun-version: ${{ secrets.BUN_VERSION }}
+103 -23
View File
@@ -28,22 +28,23 @@ jobs:
fetch-depth: 0
- name: Setup Node.js
uses: actions/setup-node@v4
uses: actions/setup-node@v5
with:
node-version: 22
package-manager-cache: false
- name: Setup pnpm
uses: pnpm/action-setup@v2
- name: Install bun
uses: oven-sh/setup-bun@v2
with:
version: 10
bun-version: ${{ secrets.BUN_VERSION }}
- name: Install deps
run: pnpm install
run: bun i
env:
NODE_OPTIONS: --max-old-space-size=6144
- name: Lint
run: pnpm run lint
run: bun run lint
env:
NODE_OPTIONS: --max-old-space-size=6144
@@ -61,9 +62,10 @@ jobs:
fetch-depth: 0
- name: Setup Node.js
uses: actions/setup-node@v4
uses: actions/setup-node@v5
with:
node-version: 22
package-manager-cache: false
# 主要逻辑:确定构建版本号
- name: Set version
@@ -93,24 +95,25 @@ jobs:
runs-on: ${{ matrix.os }}
strategy:
matrix:
os: [macos-latest, windows-2025, ubuntu-latest]
os: [macos-latest, macos-13, windows-2025, ubuntu-latest]
steps:
- uses: actions/checkout@v5
with:
fetch-depth: 0
- name: Install pnpm
uses: pnpm/action-setup@v4
with:
run_install: false
- name: Setup Node.js
uses: actions/setup-node@v4
uses: actions/setup-node@v5
with:
node-version: 22
- name: Setup pnpm
uses: pnpm/action-setup@v2
with:
version: 10
package-manager-cache: false
# node-linker=hoisted 模式将可以确保 asar 压缩可用
- name: Install deps
- name: Install dependencies
run: pnpm install --node-linker=hoisted
- name: Install deps on Desktop
@@ -172,6 +175,28 @@ jobs:
NEXT_PUBLIC_DESKTOP_PROJECT_ID: ${{ secrets.UMAMI_NIGHTLY_DESKTOP_PROJECT_ID }}
NEXT_PUBLIC_DESKTOP_UMAMI_BASE_URL: ${{ secrets.UMAMI_NIGHTLY_DESKTOP_BASE_URL }}
# 处理 macOS latest-mac.yml 重命名 (避免多架构覆盖)
- name: Rename macOS latest-mac.yml for multi-architecture support
if: runner.os == 'macOS'
run: |
cd apps/desktop/release
if [ -f "latest-mac.yml" ]; then
# 使用系统架构检测,与 electron-builder 输出保持一致
SYSTEM_ARCH=$(uname -m)
if [[ "$SYSTEM_ARCH" == "arm64" ]]; then
ARCH_SUFFIX="arm64"
else
ARCH_SUFFIX="x64"
fi
mv latest-mac.yml "latest-mac-${ARCH_SUFFIX}.yml"
echo "✅ Renamed latest-mac.yml to latest-mac-${ARCH_SUFFIX}.yml (detected: $SYSTEM_ARCH)"
ls -la latest-mac-*.yml
else
echo "⚠️ latest-mac.yml not found, skipping rename"
ls -la latest*.yml || echo "No latest*.yml files found"
fi
# 上传构建产物
- name: Upload artifact
uses: actions/upload-artifact@v4
@@ -189,8 +214,64 @@ jobs:
apps/desktop/release/*.tar.gz*
retention-days: 5
publish-pr:
# 合并 macOS 多架构 latest-mac.yml 文件
merge-mac-files:
needs: [build, version]
name: Merge macOS Release Files for PR
runs-on: ubuntu-latest
permissions:
contents: write
steps:
- name: Checkout repository
uses: actions/checkout@v5
- name: Setup Node.js
uses: actions/setup-node@v5
with:
node-version: 22
package-manager-cache: false
- name: Install bun
uses: oven-sh/setup-bun@v2
with:
bun-version: ${{ secrets.BUN_VERSION }}
# 下载所有平台的构建产物
- name: Download artifacts
uses: actions/download-artifact@v4
with:
path: release
pattern: release-*
merge-multiple: true
# 列出下载的构建产物
- name: List downloaded artifacts
run: ls -R release
# 仅为该步骤在脚本目录安装 yaml 单包,避免安装整个 monorepo 依赖
- name: Install yaml only for merge step
run: |
cd scripts/electronWorkflow
# 在脚本目录创建最小 package.json,防止 bun 向上寻找根 package.json
if [ ! -f package.json ]; then
echo '{"name":"merge-mac-release","private":true}' > package.json
fi
bun add --no-save yaml@2.8.1
# 合并 macOS YAML 文件 (使用 bun 运行 JavaScript)
- name: Merge latest-mac.yml files
run: bun run scripts/electronWorkflow/mergeMacReleaseFiles.js
# 上传合并后的构建产物
- name: Upload artifacts with merged macOS files
uses: actions/upload-artifact@v4
with:
name: merged-release-pr
path: release/
retention-days: 1
publish-pr:
needs: [merge-mac-files, version]
name: Publish PR Build
runs-on: ubuntu-latest
# Grant write permissions for creating release and commenting on PR
@@ -204,22 +285,21 @@ jobs:
with:
fetch-depth: 0
# 下载所有平台的构建产物
- name: Download artifacts
# 下载合并后的构建产物
- name: Download merged artifacts
uses: actions/download-artifact@v4
with:
name: merged-release-pr
path: release
pattern: release-*
merge-multiple: true
# 列出所有构建产物
- name: List artifacts
- name: List final artifacts
run: ls -R release
# 生成PR发布描述
- name: Generate PR Release Body
id: pr_release_body
uses: actions/github-script@v7
uses: actions/github-script@v8
with:
result-encoding: string
script: |
@@ -258,7 +338,7 @@ jobs:
# 在 PR 上添加评论,包含构建信息和下载链接
- name: Comment on PR
uses: actions/github-script@v7
uses: actions/github-script@v8
with:
github-token: ${{ secrets.GITHUB_TOKEN }}
script: |
+1 -4
View File
@@ -160,10 +160,9 @@ jobs:
run: |
docker buildx imagetools inspect ${{ env.REGISTRY_IMAGE }}:${{ steps.meta.outputs.version }}
- name: Comment on PR with Docker build info
if: github.event_name == 'pull_request'
uses: actions/github-script@v7
uses: actions/github-script@v8
with:
github-token: ${{ secrets.GITHUB_TOKEN }}
script: |
@@ -178,5 +177,3 @@ jobs:
platforms: "linux/amd64, linux/arm64",
});
core.info(`Status: ${result.updated ? 'Updated' : 'Created'}, ID: ${result.id}`);
+102 -25
View File
@@ -24,20 +24,21 @@ jobs:
fetch-depth: 0
- name: Setup Node.js
uses: actions/setup-node@v4
uses: actions/setup-node@v5
with:
node-version: 22
package-manager-cache: false
- name: Setup pnpm
uses: pnpm/action-setup@v2
- name: Install bun
uses: oven-sh/setup-bun@v2
with:
version: 10
bun-version: ${{ secrets.BUN_VERSION }}
- name: Install deps
run: pnpm install
run: bun i
- name: Lint
run: pnpm run lint
run: bun run lint
version:
name: Determine version
@@ -52,9 +53,10 @@ jobs:
fetch-depth: 0
- name: Setup Node.js
uses: actions/setup-node@v4
uses: actions/setup-node@v5
with:
node-version: 22
package-manager-cache: false
# 主要逻辑:确定构建版本号
- name: Set version
@@ -80,24 +82,25 @@ jobs:
runs-on: ${{ matrix.os }}
strategy:
matrix:
os: [macos-latest, windows-2025, ubuntu-latest]
os: [macos-latest, macos-13, windows-2025, ubuntu-latest]
steps:
- uses: actions/checkout@v5
with:
fetch-depth: 0
- name: Install pnpm
uses: pnpm/action-setup@v4
with:
run_install: false
- name: Setup Node.js
uses: actions/setup-node@v4
uses: actions/setup-node@v5
with:
node-version: 22
- name: Setup pnpm
uses: pnpm/action-setup@v2
with:
version: 10
package-manager-cache: false
# node-linker=hoisted 模式将可以确保 asar 压缩可用
- name: Install deps
- name: Install dependencies
run: pnpm install --node-linker=hoisted
- name: Install deps on Desktop
@@ -154,7 +157,29 @@ jobs:
NEXT_PUBLIC_DESKTOP_PROJECT_ID: ${{ secrets.UMAMI_BETA_DESKTOP_PROJECT_ID }}
NEXT_PUBLIC_DESKTOP_UMAMI_BASE_URL: ${{ secrets.UMAMI_BETA_DESKTOP_BASE_URL }}
# 上传构建产物,移除了 zip 相关部分
# 处理 macOS latest-mac.yml 重命名 (避免多架构覆盖)
- name: Rename macOS latest-mac.yml for multi-architecture support
if: runner.os == 'macOS'
run: |
cd apps/desktop/release
if [ -f "latest-mac.yml" ]; then
# 使用系统架构检测,与 electron-builder 输出保持一致
SYSTEM_ARCH=$(uname -m)
if [[ "$SYSTEM_ARCH" == "arm64" ]]; then
ARCH_SUFFIX="arm64"
else
ARCH_SUFFIX="x64"
fi
mv latest-mac.yml "latest-mac-${ARCH_SUFFIX}.yml"
echo "✅ Renamed latest-mac.yml to latest-mac-${ARCH_SUFFIX}.yml (detected: $SYSTEM_ARCH)"
ls -la latest-mac-*.yml
else
echo "⚠️ latest-mac.yml not found, skipping rename"
ls -la latest*.yml || echo "No latest*.yml files found"
fi
# 上传构建产物 (工作流处理重命名,不依赖 electron-builder 钩子)
- name: Upload artifact
uses: actions/upload-artifact@v4
with:
@@ -171,17 +196,28 @@ jobs:
apps/desktop/release/*.tar.gz*
retention-days: 5
# 正式版发布 job
publish-release:
# 合并 macOS 多架构 latest-mac.yml 文件
merge-mac-files:
needs: [build, version]
name: Publish Beta Release
name: Merge macOS Release Files
runs-on: ubuntu-latest
# Grant write permission to contents for uploading release assets
permissions:
contents: write
outputs:
artifact_path: ${{ steps.set_path.outputs.path }}
steps:
- name: Checkout repository
uses: actions/checkout@v5
- name: Setup Node.js
uses: actions/setup-node@v5
with:
node-version: 22
package-manager-cache: false
- name: Install bun
uses: oven-sh/setup-bun@v2
with:
bun-version: ${{ secrets.BUN_VERSION }}
# 下载所有平台的构建产物
- name: Download artifacts
uses: actions/download-artifact@v4
@@ -190,11 +226,52 @@ jobs:
pattern: release-*
merge-multiple: true
# 列出所有构建产物
- name: List artifacts
# 列出下载的构建产物
- name: List downloaded artifacts
run: ls -R release
# 将构建产物上传到现有 release
# 仅为该步骤在脚本目录安装 yaml 单包,避免安装整个 monorepo 依赖
- name: Install yaml only for merge step
run: |
cd scripts/electronWorkflow
# 在脚本目录创建最小 package.json,防止 bun 向上寻找根 package.json
if [ ! -f package.json ]; then
echo '{"name":"merge-mac-release","private":true}' > package.json
fi
bun add --no-save yaml@2.8.1
# 合并 macOS YAML 文件 (使用 bun 运行 JavaScript)
- name: Merge latest-mac.yml files
run: bun run scripts/electronWorkflow/mergeMacReleaseFiles.js
# 上传合并后的构建产物
- name: Upload artifacts with merged macOS files
uses: actions/upload-artifact@v4
with:
name: merged-release
path: release/
retention-days: 1
# 发布所有平台构建产物
publish-release:
needs: [merge-mac-files]
name: Publish Beta Release
runs-on: ubuntu-latest
permissions:
contents: write
steps:
# 下载合并后的构建产物
- name: Download merged artifacts
uses: actions/download-artifact@v4
with:
name: merged-release
path: release
# 列出所有构建产物
- name: List final artifacts
run: ls -R release
# 将构建产物上传到现有 release (现在包含合并后的 latest-mac.yml)
- name: Upload to Release
uses: softprops/action-gh-release@v1
with:
+3 -2
View File
@@ -27,12 +27,13 @@ jobs:
token: ${{ secrets.GH_TOKEN }}
- name: Setup Node.js
uses: actions/setup-node@v4
uses: actions/setup-node@v5
with:
node-version: 22
package-manager-cache: false
- name: Install bun
uses: oven-sh/setup-bun@v1
uses: oven-sh/setup-bun@v2
with:
bun-version: ${{ secrets.BUN_VERSION }}
+6 -4
View File
@@ -13,11 +13,13 @@ jobs:
steps:
- uses: actions/checkout@v5
- name: Install dbdocs
run: sudo npm install -g dbdocs
- name: Install bun
uses: oven-sh/setup-bun@v2
with:
bun-version: ${{ secrets.BUN_VERSION }}
- name: Check dbdocs
run: dbdocs
- name: Install deps
run: bun i
- name: sync database schema to dbdocs
env:
+21 -10
View File
@@ -11,7 +11,15 @@ jobs:
runs-on: ubuntu-latest
strategy:
matrix:
package: [file-loaders, prompts, model-runtime, web-crawler, electron-server-ipc, utils]
package:
- file-loaders
- prompts
- model-runtime
- web-crawler
- electron-server-ipc
- utils
- context-engine
- agent-runtime
name: Test package ${{ matrix.package }}
@@ -19,12 +27,13 @@ jobs:
- uses: actions/checkout@v5
- name: Setup Node.js
uses: actions/setup-node@v4
uses: actions/setup-node@v5
with:
node-version: 22
package-manager-cache: false
- name: Install bun
uses: oven-sh/setup-bun@v1
uses: oven-sh/setup-bun@v2
with:
bun-version: ${{ secrets.BUN_VERSION }}
@@ -53,12 +62,13 @@ jobs:
- uses: actions/checkout@v5
- name: Setup Node.js
uses: actions/setup-node@v4
uses: actions/setup-node@v5
with:
node-version: 22
package-manager-cache: false
- name: Install bun
uses: oven-sh/setup-bun@v1
uses: oven-sh/setup-bun@v2
with:
bun-version: ${{ secrets.BUN_VERSION }}
@@ -75,7 +85,6 @@ jobs:
files: ./packages/${{ matrix.package }}/coverage/lcov.info
flags: packages/${{ matrix.package }}
# App tests
test-website:
name: Test Website
@@ -86,12 +95,13 @@ jobs:
- uses: actions/checkout@v5
- name: Setup Node.js
uses: actions/setup-node@v4
uses: actions/setup-node@v5
with:
node-version: 22
package-manager-cache: false
- name: Install bun
uses: oven-sh/setup-bun@v1
uses: oven-sh/setup-bun@v2
with:
bun-version: ${{ secrets.BUN_VERSION }}
@@ -129,12 +139,13 @@ jobs:
- uses: actions/checkout@v5
- name: Setup Node.js
uses: actions/setup-node@v4
uses: actions/setup-node@v5
with:
node-version: 22
package-manager-cache: false
- name: Install bun
uses: oven-sh/setup-bun@v1
uses: oven-sh/setup-bun@v2
with:
bun-version: ${{ secrets.BUN_VERSION }}
+5
View File
@@ -23,6 +23,7 @@ Desktop.ini
.history/
.windsurfrules
*.code-workspace
.vscode/sessions.json
# Temporary files
.temp/
@@ -38,6 +39,7 @@ tmp/
.env
.env.local
.env*.local
.env.development
venv/
.venv/
@@ -112,3 +114,6 @@ CLAUDE.local.md
*.ppt*
*.doc*
*.xls*
prd
GEMINI.md
+3 -1
View File
@@ -88,6 +88,8 @@
"**/src/server/routers/async/*.ts": "${filename} • async",
"**/src/server/routers/edge/*.ts": "${filename} • edge",
"**/src/locales/default/*.ts": "${filename} • locale"
"**/src/locales/default/*.ts": "${filename} • locale",
"**/index.*": "${dirname}/${filename}.${extname}"
}
}
+2 -5
View File
@@ -12,7 +12,7 @@ Built with modern technologies:
- **Database**: PostgreSQL, PGLite, Drizzle ORM
- **Testing**: Vitest, Testing Library
- **Package Manager**: pnpm (monorepo structure)
- **Build Tools**: Next.js (Turbopack in dev, Webpack in prod), Vitest
- **Build Tools**: Next.js (Turbopack in dev, Webpack in prod)
## Directory Structure
@@ -28,7 +28,7 @@ The project follows a well-organized monorepo structure:
### Git Workflow
- Use rebase for git pull: `git pull --rebase`
- Use rebase for git pull
- Git commit messages should prefix with gitmoji
- Git branch name format: `username/feat/feature-name`
- Use `.github/PULL_REQUEST_TEMPLATE.md` for PR descriptions
@@ -52,9 +52,6 @@ The project follows a well-organized monorepo structure:
#### React Components
- Use functional components with hooks
- Follow the component structure guidelines
- Use antd-style & @lobehub/ui for styling
- Implement proper error boundaries
#### Database Schema
+1145
View File
File diff suppressed because it is too large Load Diff
+5 -1
View File
@@ -196,6 +196,8 @@ ENV \
MOONSHOT_API_KEY="" MOONSHOT_MODEL_LIST="" MOONSHOT_PROXY_URL="" \
# Nebius
NEBIUS_API_KEY="" NEBIUS_MODEL_LIST="" NEBIUS_PROXY_URL="" \
# NewAPI
NEWAPI_API_KEY="" NEWAPI_PROXY_URL="" \
# Novita
NOVITA_API_KEY="" NOVITA_MODEL_LIST="" \
# Nvidia NIM
@@ -255,7 +257,9 @@ ENV \
# FAL
FAL_API_KEY="" FAL_MODEL_LIST="" \
# BFL
BFL_API_KEY="" BFL_MODEL_LIST=""
BFL_API_KEY="" BFL_MODEL_LIST="" \
# Vercel AI Gateway
VERCELAIGATEWAY_API_KEY="" VERCELAIGATEWAY_MODEL_LIST=""
USER nextjs
+5 -1
View File
@@ -238,6 +238,8 @@ ENV \
MOONSHOT_API_KEY="" MOONSHOT_MODEL_LIST="" MOONSHOT_PROXY_URL="" \
# Nebius
NEBIUS_API_KEY="" NEBIUS_MODEL_LIST="" NEBIUS_PROXY_URL="" \
# NewAPI
NEWAPI_API_KEY="" NEWAPI_PROXY_URL="" \
# Novita
NOVITA_API_KEY="" NOVITA_MODEL_LIST="" \
# Nvidia NIM
@@ -297,7 +299,9 @@ ENV \
# FAL
FAL_API_KEY="" FAL_MODEL_LIST="" \
# BFL
BFL_API_KEY="" BFL_MODEL_LIST=""
BFL_API_KEY="" BFL_MODEL_LIST="" \
# Vercel AI Gateway
VERCELAIGATEWAY_API_KEY="" VERCELAIGATEWAY_MODEL_LIST=""
USER nextjs
+5 -1
View File
@@ -198,6 +198,8 @@ ENV \
MOONSHOT_API_KEY="" MOONSHOT_MODEL_LIST="" MOONSHOT_PROXY_URL="" \
# Nebius
NEBIUS_API_KEY="" NEBIUS_MODEL_LIST="" NEBIUS_PROXY_URL="" \
# NewAPI
NEWAPI_API_KEY="" NEWAPI_PROXY_URL="" \
# Novita
NOVITA_API_KEY="" NOVITA_MODEL_LIST="" \
# Nvidia NIM
@@ -253,7 +255,9 @@ ENV \
# FAL
FAL_API_KEY="" FAL_MODEL_LIST="" \
# BFL
BFL_API_KEY="" BFL_MODEL_LIST=""
BFL_API_KEY="" BFL_MODEL_LIST="" \
# Vercel AI Gateway
VERCELAIGATEWAY_API_KEY="" VERCELAIGATEWAY_MODEL_LIST=""
USER nextjs
+2 -16
View File
@@ -1,10 +1,10 @@
Apache License Version 2.0
LobeHub Community License
Copyright (c) 2024/06/17 - current LobeHub LLC. All rights reserved.
----------
From 1.0, LobeChat is licensed under the Apache License 2.0, with the following additional conditions:
From 1.0, LobeChat is licensed under the LobeHub Community License, based on Apache License 2.0 with the following additional conditions:
1. The commercial usage of LobeChat:
@@ -22,17 +22,3 @@ Please contact hello@lobehub.com by email to inquire about licensing matters.
b. Your contributed code may be used for commercial purposes, including but not limited to its cloud edition.
Apart from the specific conditions mentioned above, all other rights and restrictions follow the Apache License 2.0. Detailed information about the Apache License 2.0 can be found at http://www.apache.org/licenses/LICENSE-2.0.
----------
Licensed under the Apache License, Version 2.0 (the "License");
you may not use this file except in compliance with the License.
You may obtain a copy of the License at
http://www.apache.org/licenses/LICENSE-2.0
Unless required by applicable law or agreed to in writing, software
distributed under the License is distributed on an "AS IS" BASIS,
WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
See the License for the specific language governing permissions and
limitations under the License.
+8 -4
View File
@@ -1,12 +1,15 @@
const dotenv = require('dotenv');
const os = require('node:os');
dotenv.config();
const packageJSON = require('./package.json');
const channel = process.env.UPDATE_CHANNEL;
const arch = os.arch();
console.log(`🚄 Build Version ${packageJSON.version}, Channel: ${channel}`);
console.log(`🏗️ Building for architecture: ${arch}`);
const isNightly = channel === 'nightly';
const isBeta = packageJSON.name.includes('beta');
@@ -87,12 +90,13 @@ const config = {
hardenedRuntime: true,
notarize: true,
target:
// 降低构建时间,nightly 只打 arm64
// 降低构建时间,nightly 只打 dmg
// 根据当前机器架构只构建对应架构的包
isNightly
? [{ arch: ['arm64'], target: 'dmg' }]
? [{ arch: [arch === 'arm64' ? 'arm64' : 'x64'], target: 'dmg' }]
: [
{ arch: ['x64', 'arm64'], target: 'dmg' },
{ arch: ['x64', 'arm64'], target: 'zip' },
{ arch: [arch === 'arm64' ? 'arm64' : 'x64'], target: 'dmg' },
{ arch: [arch === 'arm64' ? 'arm64' : 'x64'], target: 'zip' },
],
},
npmRebuild: true,
+2 -2
View File
@@ -52,14 +52,14 @@
"@typescript/native-preview": "7.0.0-dev.20250711.1",
"consola": "^3.1.0",
"cookie": "^1.0.2",
"electron": "^37.4.0",
"electron": "^38.0.0",
"electron-builder": "^26.0.12",
"electron-is": "^3.0.0",
"electron-log": "^5.3.3",
"electron-store": "^8.2.0",
"electron-vite": "^3.0.0",
"execa": "^9.5.2",
"fix-path": "^4.0.0",
"fix-path": "^5.0.0",
"http-proxy-agent": "^7.0.2",
"https-proxy-agent": "^7.0.6",
"just-diff": "^6.0.2",
+305
View File
@@ -1,4 +1,309 @@
[
{
"children": {
"fixes": ["Fix non stream mode in OpenAI Response API."]
},
"date": "2025-09-21",
"version": "1.132.2"
},
{
"children": {
"fixes": ["Fix missing provider in server message."]
},
"date": "2025-09-21",
"version": "1.132.1"
},
{
"children": {
"features": ["Support google video understanding."]
},
"date": "2025-09-21",
"version": "1.132.0"
},
{
"children": {
"improvements": ["Enhanced AkashChat experience."]
},
"date": "2025-09-21",
"version": "1.131.4"
},
{
"children": {
"fixes": ["Update Responses search tool to web_search."]
},
"date": "2025-09-21",
"version": "1.131.3"
},
{
"children": {
"improvements": ["Use ID as name if provider name is empty."]
},
"date": "2025-09-21",
"version": "1.131.2"
},
{
"children": {
"improvements": [
"Extend custom provider runtime options, Optimized modelFetch for Vercel AI Gateway, update i18n."
]
},
"date": "2025-09-21",
"version": "1.131.1"
},
{
"children": {
"features": ["Qwen provider add qwen-image-edit model support."]
},
"date": "2025-09-19",
"version": "1.131.0"
},
{
"children": {
"fixes": ["Fix oidc open direct issue."]
},
"date": "2025-09-18",
"version": "1.130.1"
},
{
"children": {
"features": ["Add scroll support for pinned assistants using ScrollShadow."]
},
"date": "2025-09-18",
"version": "1.130.0"
},
{
"children": {
"fixes": ["Fix svg xss issue."]
},
"date": "2025-09-18",
"version": "1.129.4"
},
{
"children": {
"fixes": ["Add qwen provider support for image-edit model."]
},
"date": "2025-09-17",
"version": "1.129.3"
},
{
"children": {
"fixes": ["Improve db migrations sql."],
"improvements": ["Update i18n."]
},
"date": "2025-09-17",
"version": "1.129.2"
},
{
"children": {
"improvements": ["Update SiliconCloud reasoning models."]
},
"date": "2025-09-16",
"version": "1.129.1"
},
{
"children": {
"features": ["Support Vercel AI Gateway provider."]
},
"date": "2025-09-16",
"version": "1.129.0"
},
{
"children": {
"fixes": ["Fix azure ai runtime error."]
},
"date": "2025-09-16",
"version": "1.128.10"
},
{
"children": {
"improvements": ["Improve error handle with agent config, support .doc file parse."]
},
"date": "2025-09-15",
"version": "1.128.9"
},
{
"children": {
"improvements": [
"Enable toggling search on/off via search button click & historyCount button."
]
},
"date": "2025-09-15",
"version": "1.128.8"
},
{
"children": {},
"date": "2025-09-14",
"version": "1.128.7"
},
{
"children": {
"improvements": ["Update i18n."]
},
"date": "2025-09-14",
"version": "1.128.6"
},
{
"children": {
"fixes": ["Google stream error unable to abort request."]
},
"date": "2025-09-13",
"version": "1.128.5"
},
{
"children": {
"improvements": ["Fix discover plugin link."]
},
"date": "2025-09-13",
"version": "1.128.4"
},
{
"children": {
"fixes": ["Fix open chat page with float link modal."]
},
"date": "2025-09-13",
"version": "1.128.3"
},
{
"children": {
"improvements": ["Update i18n, Update model configs."]
},
"date": "2025-09-13",
"version": "1.128.2"
},
{
"children": {
"improvements": ["Refactor message proccesser to the context engine."]
},
"date": "2025-09-12",
"version": "1.128.1"
},
{
"children": {
"features": ["ChatInput support resize."]
},
"date": "2025-09-12",
"version": "1.128.0"
},
{
"children": {
"fixes": ["Improve OpenAIStream processing to emit usage data for chunks lacking choices."]
},
"date": "2025-09-11",
"version": "1.127.4"
},
{
"children": {
"improvements": ["Refactor model runtime folder structure and add more tests."]
},
"date": "2025-09-11",
"version": "1.127.3"
},
{
"children": {
"fixes": ["Delete files should delete chunks、embedings、fileChunk."]
},
"date": "2025-09-11",
"version": "1.127.2"
},
{
"children": {
"fixes": ["Fix not remove message with server mode."],
"improvements": ["Update i18n."]
},
"date": "2025-09-11",
"version": "1.127.1"
},
{
"children": {
"features": ["Seedream 4.0."],
"improvements": ["Add hotkey tooltip to typobar actions."]
},
"date": "2025-09-10",
"version": "1.127.0"
},
{
"children": {
"improvements": ["Add CometAPI model provider and chat models, update i18n."]
},
"date": "2025-09-10",
"version": "1.126.3"
},
{
"children": {
"fixes": ["Fix editor key handling."]
},
"date": "2025-09-09",
"version": "1.126.2"
},
{
"children": {
"fixes": ["Fix Assistant List error message."]
},
"date": "2025-09-09",
"version": "1.126.1"
},
{
"children": {},
"date": "2025-09-08",
"version": "1.126.0"
},
{
"children": {
"features": ["Add Math and TaskList to Editor."]
},
"date": "2025-09-08",
"version": "1.125.0"
},
{
"children": {
"fixes": ["Revert V1 Mobile."]
},
"date": "2025-09-06",
"version": "1.124.4"
},
{
"children": {
"improvements": ["Refactor to remove edge runtime and add more tests."]
},
"date": "2025-09-06",
"version": "1.124.3"
},
{
"children": {
"fixes": ["Fix ChatInput send command switch."]
},
"date": "2025-09-06",
"version": "1.124.2"
},
{
"children": {
"fixes": ["Enhance NewAPI with environment variables and fix routers compatibility."],
"improvements": ["Update doubao-seed-1.6-vision models."]
},
"date": "2025-09-06",
"version": "1.124.1"
},
{
"children": {
"features": ["ChatInput support rich text and support parallel send."]
},
"date": "2025-09-06",
"version": "1.124.0"
},
{
"children": {
"improvements": ["Remove edge runtime."]
},
"date": "2025-09-05",
"version": "1.123.4"
},
{
"children": {
"fixes": ["Fix mobile header title to loog not ellipsis."]
},
"date": "2025-09-05",
"version": "1.123.3"
},
{
"children": {
"fixes": ["Not use branch topic when this topic is not save."]
+44
View File
@@ -8,6 +8,9 @@ services:
- '${MINIO_PORT}:${MINIO_PORT}' # MinIO API
- '9001:9001' # MinIO Console
- '${CASDOOR_PORT}:${CASDOOR_PORT}' # Casdoor
- '3000:3000' # Grafana
- '4318:4318' # otel-collector HTTP
- '4317:4317' # otel-collector gRPC
command: tail -f /dev/null
networks:
- lobe-network
@@ -29,11 +32,52 @@ services:
file: docker-compose/local/docker-compose.yml
service: searxng
grafana:
profiles:
- otel
extends:
file: docker-compose/local/grafana/docker-compose.yml
service: grafana
tempo:
profiles:
- otel
extends:
file: docker-compose/local/grafana/docker-compose.yml
service: tempo
prometheus:
profiles:
- otel
extends:
file: docker-compose/local/grafana/docker-compose.yml
service: prometheus
otel-collector:
profiles:
- otel
extends:
file: docker-compose/local/grafana/docker-compose.yml
service: otel-collector
otel-tracing-test:
profiles:
- otel-test
extends:
file: docker-compose/local/grafana/docker-compose.yml
service: otel-tracing-test
volumes:
data:
driver: local
s3_data:
driver: local
grafana_data:
driver: local
tempo_data:
driver: local
prometheus_data:
driver: local
networks:
lobe-network:
+83 -1
View File
@@ -9,6 +9,9 @@ services:
- '9001:9001' # MinIO Console
- '${CASDOOR_PORT}:${CASDOOR_PORT}' # Casdoor
- '${LOBE_PORT}:3210' # LobeChat
- '3000:3000' # Grafana
- '4318:4318' # otel-collector HTTP
- '4317:4317' # otel-collector gRPC
command: tail -f /dev/null
networks:
- lobe-network
@@ -58,7 +61,7 @@ services:
wait \$MINIO_PID
"
# version lock ref: https://github.com/lobehub/lobe-chat/pull/7331
# version lock ref: https://github.com/lobehub/lobe-chat/pull/7331
casdoor:
image: casbin/casdoor:v2.13.0
container_name: lobe-casdoor
@@ -162,11 +165,90 @@ services:
wait \$LOBE_PID
"
grafana:
profiles:
- otel
image: grafana/grafana:12.2.0-17419259409
container_name: lobe-grafana
network_mode: 'service:network-service'
restart: always
environment:
- GF_AUTH_ANONYMOUS_ENABLED=true
- GF_AUTH_ANONYMOUS_ORG_ROLE=Admin
- GF_AUTH_DISABLE_LOGIN_FORM=true
- GF_FEATURE_TOGGLES_ENABLE=traceqlEditor
volumes:
- grafana_data:/var/lib/grafana
- ./grafana/dashboards:/etc/grafana/provisioning/dashboards
- ./grafana/datasources:/etc/grafana/provisioning/datasources
depends_on:
- tempo
- prometheus
tempo:
profiles:
- otel
image: grafana/tempo:latest
container_name: lobe-tempo
network_mode: 'service:network-service'
restart: always
volumes:
- ./tempo/tempo.yaml:/etc/tempo.yaml
- tempo_data:/var/tempo
command: ['-config.file=/etc/tempo.yaml']
prometheus:
profiles:
- otel
image: prom/prometheus
container_name: lobe-prometheus
network_mode: 'service:network-service'
restart: always
volumes:
- ./prometheus/prometheus.yml:/etc/prometheus/prometheus.yml
- prometheus_data:/prometheus
command:
- '--config.file=/etc/prometheus/prometheus.yml'
- '--web.enable-otlp-receiver'
- '--web.enable-remote-write-receiver'
- '--enable-feature=exemplar-storage'
otel-collector:
profiles:
- otel
image: otel/opentelemetry-collector
container_name: lobe-otel-collector
network_mode: 'service:network-service'
restart: always
volumes:
- ./otel-collector/collector-config.yaml:/etc/otelcol/config.yaml
command: ['--config', '/etc/otelcol/config.yaml']
depends_on:
- tempo
- prometheus
otel-tracing-test:
profiles:
- otel-test
image: ghcr.io/grafana/xk6-client-tracing:v0.0.7
container_name: lobe-otel-tracing-test
network_mode: 'service:network-service'
restart: always
environment:
- ENDPOINT=127.0.0.1:4317
volumes:
data:
driver: local
s3_data:
driver: local
grafana_data:
driver: local
tempo_data:
driver: local
prometheus_data:
driver: local
networks:
lobe-network:
+42
View File
@@ -0,0 +1,42 @@
# Proxy, if you need it
# HTTP_PROXY=http://localhost:7890
# HTTPS_PROXY=http://localhost:7890
# Other environment variables, as needed. You can refer to the environment variables configuration for the client version, making sure not to have ACCESS_CODE.
# OPENAI_API_KEY=sk-xxxx
# OPENAI_PROXY_URL=https://api.openai.com/v1
# OPENAI_MODEL_LIST=...
# ===========================
# ====== Preset config ======
# ===========================
# if no special requirements, no need to change
LOBE_PORT=3210
CASDOOR_PORT=8000
MINIO_PORT=9000
APP_URL=http://localhost:3210
AUTH_URL=http://localhost:3210/api/auth
# Postgres related, which are the necessary environment variables for DB
LOBE_DB_NAME=lobechat
POSTGRES_PASSWORD=uWNZugjBqixf8dxC
AUTH_CASDOOR_ISSUER=http://localhost:8000
# Casdoor secret
AUTH_CASDOOR_ID=a387a4892ee19b1a2249
AUTH_CASDOOR_SECRET=dbf205949d704de81b0b5b3603174e23fbecc354
CASDOOR_WEBHOOK_SECRET=casdoor-secret
# MinIO S3 configuration
MINIO_ROOT_USER=admin
MINIO_ROOT_PASSWORD=YOUR_MINIO_PASSWORD
# Configure the bucket information of MinIO
S3_PUBLIC_DOMAIN=http://localhost:9000
S3_ENDPOINT=http://localhost:9000
MINIO_LOBE_BUCKET=lobe
# Configure for casdoor
origin=http://localhost:8000
@@ -0,0 +1,42 @@
# Proxy,如果你需要的话(比如你使用 GitHub 作为鉴权服务提供商)
# HTTP_PROXY=http://localhost:7890
# HTTPS_PROXY=http://localhost:7890
# 其他环境变量,视需求而定,可以参照客户端版本的环境变量配置,注意不要有 ACCESS_CODE
# OPENAI_API_KEY=sk-xxxx
# OPENAI_PROXY_URL=https://api.openai.com/v1
# OPENAI_MODEL_LIST=...
# ===================
# ===== 预设配置 =====
# ===================
# 如没有特殊需要不用更改
LOBE_PORT=3210
CASDOOR_PORT=8000
MINIO_PORT=9000
APP_URL=http://localhost:3210
AUTH_URL=http://localhost:3210/api/auth
# Postgres 相关,也即 DB 必须的环境变量
LOBE_DB_NAME=lobechat
POSTGRES_PASSWORD=uWNZugjBqixf8dxC
AUTH_CASDOOR_ISSUER=http://localhost:8000
# Casdoor secret
AUTH_CASDOOR_ID=a387a4892ee19b1a2249
AUTH_CASDOOR_SECRET=dbf205949d704de81b0b5b3603174e23fbecc354
CASDOOR_WEBHOOK_SECRET=casdoor-secret
# MinIO S3 配置
MINIO_ROOT_USER=admin
MINIO_ROOT_PASSWORD=YOUR_MINIO_PASSWORD
# 在下方配置 minio 中添加的桶
S3_PUBLIC_DOMAIN=http://localhost:9000
S3_ENDPOINT=http://localhost:9000
MINIO_LOBE_BUCKET=lobe
# 为 casdoor 配置
origin=http://localhost:8000
@@ -0,0 +1,251 @@
name: lobe-chat-database
services:
network-service:
image: alpine
container_name: lobe-network
restart: always
ports:
- '${MINIO_PORT}:${MINIO_PORT}' # MinIO API
- '9001:9001' # MinIO Console
- '${CASDOOR_PORT}:${CASDOOR_PORT}' # Casdoor
- '${LOBE_PORT}:3210' # LobeChat
- '3000:3000' # Grafana
- '4318:4318' # otel-collector HTTP
- '4317:4317' # otel-collector gRPC
command: tail -f /dev/null
networks:
- lobe-network
postgresql:
image: pgvector/pgvector:pg17
container_name: lobe-postgres
ports:
- '5432:5432'
volumes:
- './data:/var/lib/postgresql/data'
environment:
- 'POSTGRES_DB=${LOBE_DB_NAME}'
- 'POSTGRES_PASSWORD=${POSTGRES_PASSWORD}'
healthcheck:
test: ['CMD-SHELL', 'pg_isready -U postgres']
interval: 5s
timeout: 5s
retries: 5
restart: always
networks:
- lobe-network
minio:
image: minio/minio:RELEASE.2025-04-22T22-12-26Z
container_name: lobe-minio
network_mode: 'service:network-service'
volumes:
- './s3_data:/etc/minio/data'
environment:
- 'MINIO_API_CORS_ALLOW_ORIGIN=*'
env_file:
- .env
restart: always
entrypoint: >
/bin/sh -c "
minio server /etc/minio/data --address ':${MINIO_PORT}' --console-address ':9001' &
MINIO_PID=\$!
while ! curl -s http://localhost:${MINIO_PORT}/minio/health/live; do
echo 'Waiting for MinIO to start...'
sleep 1
done
sleep 5
mc alias set myminio http://localhost:${MINIO_PORT} ${MINIO_ROOT_USER} ${MINIO_ROOT_PASSWORD}
echo 'Creating bucket ${MINIO_LOBE_BUCKET}'
mc mb myminio/${MINIO_LOBE_BUCKET}
wait \$MINIO_PID
"
# version lock ref: https://github.com/lobehub/lobe-chat/pull/7331
casdoor:
image: casbin/casdoor:v2.13.0
container_name: lobe-casdoor
entrypoint: /bin/sh -c './server --createDatabase=true'
network_mode: 'service:network-service'
depends_on:
postgresql:
condition: service_healthy
environment:
httpport: ${CASDOOR_PORT}
RUNNING_IN_DOCKER: 'true'
driverName: 'postgres'
dataSourceName: 'user=postgres password=${POSTGRES_PASSWORD} host=postgresql port=5432 sslmode=disable dbname=casdoor'
runmode: 'dev'
volumes:
- ./init_data.json:/init_data.json
env_file:
- .env
searxng:
image: searxng/searxng
container_name: lobe-searxng
volumes:
- './searxng-settings.yml:/etc/searxng/settings.yml'
environment:
- 'SEARXNG_SETTINGS_FILE=/etc/searxng/settings.yml'
restart: always
networks:
- lobe-network
env_file:
- .env
grafana:
image: grafana/grafana:12.2.0-17419259409
container_name: lobe-grafana
network_mode: 'service:network-service'
restart: always
environment:
- GF_AUTH_ANONYMOUS_ENABLED=true
- GF_AUTH_ANONYMOUS_ORG_ROLE=Admin
- GF_AUTH_DISABLE_LOGIN_FORM=true
- GF_FEATURE_TOGGLES_ENABLE=traceqlEditor
volumes:
- grafana_data:/var/lib/grafana
- ./grafana/dashboards:/etc/grafana/provisioning/dashboards
- ./grafana/datasources:/etc/grafana/provisioning/datasources
depends_on:
- tempo
- prometheus
tempo:
image: grafana/tempo:latest
container_name: lobe-tempo
network_mode: 'service:network-service'
restart: always
volumes:
- ./tempo/tempo.yaml:/etc/tempo.yaml
- tempo_data:/var/tempo
command: ['-config.file=/etc/tempo.yaml']
prometheus:
image: prom/prometheus
container_name: lobe-prometheus
network_mode: 'service:network-service'
restart: always
volumes:
- ./prometheus/prometheus.yml:/etc/prometheus/prometheus.yml
- prometheus_data:/prometheus
command:
- '--config.file=/etc/prometheus/prometheus.yml'
- '--web.enable-otlp-receiver'
- '--web.enable-remote-write-receiver'
- '--enable-feature=exemplar-storage'
otel-collector:
image: otel/opentelemetry-collector
container_name: lobe-otel-collector
network_mode: 'service:network-service'
restart: always
volumes:
- ./otel-collector/collector-config.yaml:/etc/otelcol/config.yaml
command: ['--config', '/etc/otelcol/config.yaml']
depends_on:
- tempo
- prometheus
otel-tracing-test:
profiles:
- otel-test
image: ghcr.io/grafana/xk6-client-tracing:v0.0.7
container_name: lobe-otel-tracing-test
network_mode: 'service:network-service'
restart: always
environment:
- ENDPOINT=127.0.0.1:4317
lobe:
image: lobehub/lobe-chat-database
container_name: lobe-chat
network_mode: 'service:network-service'
depends_on:
postgresql:
condition: service_healthy
network-service:
condition: service_started
minio:
condition: service_started
casdoor:
condition: service_started
environment:
- 'NEXT_AUTH_SSO_PROVIDERS=casdoor'
- 'KEY_VAULTS_SECRET=Kix2wcUONd4CX51E/ZPAd36BqM4wzJgKjPtz2sGztqQ='
- 'NEXT_AUTH_SECRET=NX2kaPE923dt6BL2U8e9oSre5RfoT7hg'
- 'DATABASE_URL=postgresql://postgres:${POSTGRES_PASSWORD}@postgresql:5432/${LOBE_DB_NAME}'
- 'S3_BUCKET=${MINIO_LOBE_BUCKET}'
- 'S3_ENABLE_PATH_STYLE=1'
- 'S3_ACCESS_KEY=${MINIO_ROOT_USER}'
- 'S3_ACCESS_KEY_ID=${MINIO_ROOT_USER}'
- 'S3_SECRET_ACCESS_KEY=${MINIO_ROOT_PASSWORD}'
- 'LLM_VISION_IMAGE_USE_BASE64=1'
- 'S3_SET_ACL=0'
- 'SEARXNG_URL=http://searxng:8080'
- 'OTEL_EXPORTER_OTLP_METRICS_PROTOCOL=http/protobuf'
- 'OTEL_EXPORTER_OTLP_METRICS_ENDPOINT=http://localhost:4318/v1/metrics'
- 'OTEL_EXPORTER_OTLP_TRACES_PROTOCOL=http/protobuf'
- 'OTEL_EXPORTER_OTLP_TRACES_ENDPOINT=http://localhost:4318/v1/traces'
env_file:
- .env
restart: always
entrypoint: >
/bin/sh -c "
/bin/node /app/startServer.js &
LOBE_PID=\$!
sleep 3
if [ $(wget --timeout=5 --spider --server-response ${AUTH_CASDOOR_ISSUER}/.well-known/openid-configuration 2>&1 | grep -c 'HTTP/1.1 200 OK') -eq 0 ]; then
echo '⚠️Warning: Unable to fetch OIDC configuration from Casdoor'
echo 'Request URL: ${AUTH_CASDOOR_ISSUER}/.well-known/openid-configuration'
echo 'Read more at: https://lobehub.com/docs/self-hosting/server-database/docker-compose#necessary-configuration'
echo ''
echo '⚠️注意:无法从 Casdoor 获取 OIDC 配置'
echo '请求 URL: ${AUTH_CASDOOR_ISSUER}/.well-known/openid-configuration'
echo '了解更多:https://lobehub.com/zh/docs/self-hosting/server-database/docker-compose#necessary-configuration'
echo ''
else
if ! wget -O - --timeout=5 ${AUTH_CASDOOR_ISSUER}/.well-known/openid-configuration 2>&1 | grep 'issuer' | grep ${AUTH_CASDOOR_ISSUER}; then
printf '❌Error: The Auth issuer is conflict, Issuer in OIDC configuration is: %s' \$(wget -O - --timeout=5 ${AUTH_CASDOOR_ISSUER}/.well-known/openid-configuration 2>&1 | grep -E 'issuer.*' | awk -F '\"' '{print \$4}')
echo ' , but the issuer in .env file is: ${AUTH_CASDOOR_ISSUER} '
echo 'Request URL: ${AUTH_CASDOOR_ISSUER}/.well-known/openid-configuration'
echo 'Read more at: https://lobehub.com/docs/self-hosting/server-database/docker-compose#necessary-configuration'
echo ''
printf '❌错误:Auth 的 issuer 冲突,OIDC 配置中的 issuer 是:%s' \$(wget -O - --timeout=5 ${AUTH_CASDOOR_ISSUER}/.well-known/openid-configuration 2>&1 | grep -E 'issuer.*' | awk -F '\"' '{print \$4}')
echo ' , 但 .env 文件中的 issuer 是:${AUTH_CASDOOR_ISSUER} '
echo '请求 URL: ${AUTH_CASDOOR_ISSUER}/.well-known/openid-configuration'
echo '了解更多:https://lobehub.com/zh/docs/self-hosting/server-database/docker-compose#necessary-configuration'
echo ''
fi
fi
if [ $(wget --timeout=5 --spider --server-response ${S3_ENDPOINT}/minio/health/live 2>&1 | grep -c 'HTTP/1.1 200 OK') -eq 0 ]; then
echo '⚠️Warning: Unable to fetch MinIO health status'
echo 'Request URL: ${S3_ENDPOINT}/minio/health/live'
echo 'Read more at: https://lobehub.com/docs/self-hosting/server-database/docker-compose#necessary-configuration'
echo ''
echo '⚠️注意:无法获取 MinIO 健康状态'
echo '请求 URL: ${S3_ENDPOINT}/minio/health/live'
echo '了解更多:https://lobehub.com/zh/docs/self-hosting/server-database/docker-compose#necessary-configuration'
echo ''
fi
wait \$LOBE_PID
"
volumes:
data:
driver: local
s3_data:
driver: local
grafana_data:
driver: local
tempo_data:
driver: local
prometheus_data:
driver: local
networks:
lobe-network:
driver: bridge
@@ -0,0 +1,15 @@
apiVersion: 1
prune: true
datasources:
- name: Prometheus
type: prometheus
uid: prometheus
access: proxy
orgId: 1
url: http://127.0.0.1:9090
basicAuth: false
isDefault: false
version: 1
editable: false
@@ -0,0 +1,16 @@
apiVersion: 1
prune: true
datasources:
- name: Tempo
type: tempo
access: proxy
orgId: 1
url: http://127.0.0.1:3200
basicAuth: false
isDefault: true
version: 1
editable: false
apiVersion: 1
uid: tempo
@@ -0,0 +1,45 @@
extensions:
health_check:
endpoint: 127.0.0.1:13133
receivers:
prometheus:
config:
scrape_configs:
- job_name: otel-collector-metrics
scrape_interval: 10s
static_configs:
- targets: ["127.0.0.1:8888"]
otlp:
protocols:
grpc:
endpoint: 0.0.0.0:4317
http:
endpoint: 0.0.0.0:4318
exporters:
prometheusremotewrite:
endpoint: http://127.0.0.1:9090/api/v1/write
tls:
insecure: true
otlp:
endpoint: 127.0.0.1:14317
tls:
insecure: true
debug:
verbosity: detailed
service:
pipelines:
metrics:
receivers: [prometheus]
exporters: [prometheusremotewrite]
traces:
receivers: [otlp]
exporters: [otlp]
logs:
receivers: [otlp]
exporters: [debug]
@@ -0,0 +1,11 @@
global:
scrape_interval: 15s
evaluation_interval: 15s
scrape_configs:
- job_name: "prometheus"
static_configs:
- targets: ["127.0.0.1:9090"]
- job_name: "tempo"
static_configs:
- targets: ["127.0.0.1:3200"]
@@ -0,0 +1,58 @@
stream_over_http_enabled: true
server:
http_listen_port: 3200
log_level: info
query_frontend:
search:
duration_slo: 5s
throughput_bytes_slo: 1.073741824e+09
metadata_slo:
duration_slo: 5s
throughput_bytes_slo: 1.073741824e+09
trace_by_id:
duration_slo: 5s
distributor:
max_attribute_bytes: 10485760
receivers:
otlp:
protocols:
grpc:
endpoint: 127.0.0.1:14317
http:
endpoint: 127.0.0.1:14318
ingester:
max_block_duration: 5m # cut the headblock when this much time passes. this is being set for demo purposes and should probably be left alone normally
compactor:
compaction:
block_retention: 1h # overall Tempo trace retention. set for demo purposes
metrics_generator:
registry:
external_labels:
source: tempo
cluster: docker-compose
storage:
path: /var/tempo/generator/wal
remote_write:
- url: http://127.0.0.1:9090/api/v1/write
send_exemplars: true
traces_storage:
path: /var/tempo/generator/traces
storage:
trace:
backend: local # backend configuration to use
wal:
path: /var/tempo/wal # where to store the wal locally
local:
path: /var/tempo/blocks
overrides:
defaults:
metrics_generator:
processors: [service-graphs, span-metrics, local-blocks] # enables metrics generator
generate_native_histograms: both
@@ -0,0 +1,44 @@
# Proxy, if you need it
# HTTP_PROXY=http://localhost:7890
# HTTPS_PROXY=http://localhost:7890
# Other environment variables, as needed. You can refer to the environment variables configuration for the client version, making sure not to have ACCESS_CODE.
# OPENAI_API_KEY=sk-xxxx
# OPENAI_PROXY_URL=https://api.openai.com/v1
# OPENAI_MODEL_LIST=...
# ===========================
# ====== Preset config ======
# ===========================
# if no special requirements, no need to change
LOBE_PORT=3210
CASDOOR_PORT=8000
MINIO_PORT=9000
APP_URL=http://localhost:3210
AUTH_URL=http://localhost:3210/api/auth
# Postgres related, which are the necessary environment variables for DB
LOBE_DB_NAME=lobechat
POSTGRES_PASSWORD=uWNZugjBqixf8dxC
AUTH_CASDOOR_ISSUER=http://localhost:8000
# Casdoor secret
AUTH_CASDOOR_ID=a387a4892ee19b1a2249
AUTH_CASDOOR_SECRET=dbf205949d704de81b0b5b3603174e23fbecc354
CASDOOR_WEBHOOK_SECRET=casdoor-secret
# MinIO S3 configuration
MINIO_ROOT_USER=admin
MINIO_ROOT_PASSWORD=YOUR_MINIO_PASSWORD
# Configure the bucket information of MinIO
S3_PUBLIC_DOMAIN=http://localhost:9000
S3_ENDPOINT=http://localhost:9000
MINIO_LOBE_BUCKET=lobe
GF_SECURITY_ADMIN_PASSWORD=YOUR_GRAFANA_PASSWORD
# Configure for casdoor
origin=http://localhost:8000
@@ -0,0 +1,42 @@
# Proxy,如果你需要的话(比如你使用 GitHub 作为鉴权服务提供商)
# HTTP_PROXY=http://localhost:7890
# HTTPS_PROXY=http://localhost:7890
# 其他环境变量,视需求而定,可以参照客户端版本的环境变量配置,注意不要有 ACCESS_CODE
# OPENAI_API_KEY=sk-xxxx
# OPENAI_PROXY_URL=https://api.openai.com/v1
# OPENAI_MODEL_LIST=...
# ===================
# ===== 预设配置 =====
# ===================
# 如没有特殊需要不用更改
LOBE_PORT=3210
CASDOOR_PORT=8000
MINIO_PORT=9000
APP_URL=http://localhost:3210
AUTH_URL=http://localhost:3210/api/auth
# Postgres 相关,也即 DB 必须的环境变量
LOBE_DB_NAME=lobechat
POSTGRES_PASSWORD=uWNZugjBqixf8dxC
AUTH_CASDOOR_ISSUER=http://localhost:8000
# Casdoor secret
AUTH_CASDOOR_ID=a387a4892ee19b1a2249
AUTH_CASDOOR_SECRET=dbf205949d704de81b0b5b3603174e23fbecc354
CASDOOR_WEBHOOK_SECRET=casdoor-secret
# MinIO S3 配置
MINIO_ROOT_USER=admin
MINIO_ROOT_PASSWORD=YOUR_MINIO_PASSWORD
# 在下方配置 minio 中添加的桶
S3_PUBLIC_DOMAIN=http://localhost:9000
S3_ENDPOINT=http://localhost:9000
MINIO_LOBE_BUCKET=lobe
# 为 casdoor 配置
origin=http://localhost:8000
@@ -0,0 +1,249 @@
name: lobe-chat-database
services:
network-service:
image: alpine
container_name: lobe-network
restart: always
ports:
- '${MINIO_PORT}:${MINIO_PORT}' # MinIO API
- '9001:9001' # MinIO Console
- '${CASDOOR_PORT}:${CASDOOR_PORT}' # Casdoor
- '${LOBE_PORT}:3210' # LobeChat
- '3000:3000' # Grafana
- '4318:4318' # otel-collector HTTP
- '4317:4317' # otel-collector gRPC
command: tail -f /dev/null
networks:
- lobe-network
postgresql:
image: pgvector/pgvector:pg17
container_name: lobe-postgres
ports:
- '5432:5432'
volumes:
- './data:/var/lib/postgresql/data'
environment:
- 'POSTGRES_DB=${LOBE_DB_NAME}'
- 'POSTGRES_PASSWORD=${POSTGRES_PASSWORD}'
healthcheck:
test: ['CMD-SHELL', 'pg_isready -U postgres']
interval: 5s
timeout: 5s
retries: 5
restart: always
networks:
- lobe-network
minio:
image: minio/minio:RELEASE.2025-04-22T22-12-26Z
container_name: lobe-minio
network_mode: 'service:network-service'
volumes:
- './s3_data:/etc/minio/data'
environment:
- 'MINIO_API_CORS_ALLOW_ORIGIN=*'
env_file:
- .env
restart: always
entrypoint: >
/bin/sh -c "
minio server /etc/minio/data --address ':${MINIO_PORT}' --console-address ':9001' &
MINIO_PID=\$!
while ! curl -s http://localhost:${MINIO_PORT}/minio/health/live; do
echo 'Waiting for MinIO to start...'
sleep 1
done
sleep 5
mc alias set myminio http://localhost:${MINIO_PORT} ${MINIO_ROOT_USER} ${MINIO_ROOT_PASSWORD}
echo 'Creating bucket ${MINIO_LOBE_BUCKET}'
mc mb myminio/${MINIO_LOBE_BUCKET}
wait \$MINIO_PID
"
# version lock ref: https://github.com/lobehub/lobe-chat/pull/7331
casdoor:
image: casbin/casdoor:v2.13.0
container_name: lobe-casdoor
entrypoint: /bin/sh -c './server --createDatabase=true'
network_mode: 'service:network-service'
depends_on:
postgresql:
condition: service_healthy
environment:
httpport: ${CASDOOR_PORT}
RUNNING_IN_DOCKER: 'true'
driverName: 'postgres'
dataSourceName: 'user=postgres password=${POSTGRES_PASSWORD} host=postgresql port=5432 sslmode=disable dbname=casdoor'
runmode: 'dev'
volumes:
- ./init_data.json:/init_data.json
env_file:
- .env
searxng:
image: searxng/searxng
container_name: lobe-searxng
volumes:
- './searxng-settings.yml:/etc/searxng/settings.yml'
environment:
- 'SEARXNG_SETTINGS_FILE=/etc/searxng/settings.yml'
restart: always
networks:
- lobe-network
env_file:
- .env
grafana:
image: grafana/grafana:12.2.0-17419259409
container_name: lobe-grafana
network_mode: 'service:network-service'
restart: always
environment:
- GF_SECURITY_ADMIN_PASSWORD=${GF_SECURITY_ADMIN_PASSWORD}
- GF_FEATURE_TOGGLES_ENABLE=traceqlEditor
volumes:
- grafana_data:/var/lib/grafana
- ./grafana/dashboards:/etc/grafana/provisioning/dashboards
- ./grafana/datasources:/etc/grafana/provisioning/datasources
depends_on:
- tempo
- prometheus
tempo:
image: grafana/tempo:latest
container_name: lobe-tempo
network_mode: 'service:network-service'
restart: always
volumes:
- ./tempo/tempo.yaml:/etc/tempo.yaml
- tempo_data:/var/tempo
command: ['-config.file=/etc/tempo.yaml']
prometheus:
image: prom/prometheus
container_name: lobe-prometheus
network_mode: 'service:network-service'
restart: always
volumes:
- ./prometheus/prometheus.yml:/etc/prometheus/prometheus.yml
- prometheus_data:/prometheus
command:
- '--config.file=/etc/prometheus/prometheus.yml'
- '--web.enable-otlp-receiver'
- '--web.enable-remote-write-receiver'
- '--enable-feature=exemplar-storage'
otel-collector:
image: otel/opentelemetry-collector
container_name: lobe-otel-collector
network_mode: 'service:network-service'
restart: always
volumes:
- ./otel-collector/collector-config.yaml:/etc/otelcol/config.yaml
command: ['--config', '/etc/otelcol/config.yaml']
depends_on:
- tempo
- prometheus
otel-tracing-test:
profiles:
- otel-test
image: ghcr.io/grafana/xk6-client-tracing:v0.0.7
container_name: lobe-otel-tracing-test
network_mode: 'service:network-service'
restart: always
environment:
- ENDPOINT=127.0.0.1:4317
lobe:
image: lobehub/lobe-chat-database
container_name: lobe-chat
network_mode: 'service:network-service'
depends_on:
postgresql:
condition: service_healthy
network-service:
condition: service_started
minio:
condition: service_started
casdoor:
condition: service_started
environment:
- 'NEXT_AUTH_SSO_PROVIDERS=casdoor'
- 'KEY_VAULTS_SECRET=Kix2wcUONd4CX51E/ZPAd36BqM4wzJgKjPtz2sGztqQ='
- 'NEXT_AUTH_SECRET=NX2kaPE923dt6BL2U8e9oSre5RfoT7hg'
- 'DATABASE_URL=postgresql://postgres:${POSTGRES_PASSWORD}@postgresql:5432/${LOBE_DB_NAME}'
- 'S3_BUCKET=${MINIO_LOBE_BUCKET}'
- 'S3_ENABLE_PATH_STYLE=1'
- 'S3_ACCESS_KEY=${MINIO_ROOT_USER}'
- 'S3_ACCESS_KEY_ID=${MINIO_ROOT_USER}'
- 'S3_SECRET_ACCESS_KEY=${MINIO_ROOT_PASSWORD}'
- 'LLM_VISION_IMAGE_USE_BASE64=1'
- 'S3_SET_ACL=0'
- 'SEARXNG_URL=http://searxng:8080'
- 'OTEL_EXPORTER_OTLP_METRICS_PROTOCOL=http/protobuf'
- 'OTEL_EXPORTER_OTLP_METRICS_ENDPOINT=http://localhost:4318/v1/metrics'
- 'OTEL_EXPORTER_OTLP_TRACES_PROTOCOL=http/protobuf'
- 'OTEL_EXPORTER_OTLP_TRACES_ENDPOINT=http://localhost:4318/v1/traces'
env_file:
- .env
restart: always
entrypoint: >
/bin/sh -c "
/bin/node /app/startServer.js &
LOBE_PID=\$!
sleep 3
if [ $(wget --timeout=5 --spider --server-response ${AUTH_CASDOOR_ISSUER}/.well-known/openid-configuration 2>&1 | grep -c 'HTTP/1.1 200 OK') -eq 0 ]; then
echo '⚠️Warning: Unable to fetch OIDC configuration from Casdoor'
echo 'Request URL: ${AUTH_CASDOOR_ISSUER}/.well-known/openid-configuration'
echo 'Read more at: https://lobehub.com/docs/self-hosting/server-database/docker-compose#necessary-configuration'
echo ''
echo '⚠️注意:无法从 Casdoor 获取 OIDC 配置'
echo '请求 URL: ${AUTH_CASDOOR_ISSUER}/.well-known/openid-configuration'
echo '了解更多:https://lobehub.com/zh/docs/self-hosting/server-database/docker-compose#necessary-configuration'
echo ''
else
if ! wget -O - --timeout=5 ${AUTH_CASDOOR_ISSUER}/.well-known/openid-configuration 2>&1 | grep 'issuer' | grep ${AUTH_CASDOOR_ISSUER}; then
printf '❌Error: The Auth issuer is conflict, Issuer in OIDC configuration is: %s' \$(wget -O - --timeout=5 ${AUTH_CASDOOR_ISSUER}/.well-known/openid-configuration 2>&1 | grep -E 'issuer.*' | awk -F '\"' '{print \$4}')
echo ' , but the issuer in .env file is: ${AUTH_CASDOOR_ISSUER} '
echo 'Request URL: ${AUTH_CASDOOR_ISSUER}/.well-known/openid-configuration'
echo 'Read more at: https://lobehub.com/docs/self-hosting/server-database/docker-compose#necessary-configuration'
echo ''
printf '❌错误:Auth 的 issuer 冲突,OIDC 配置中的 issuer 是:%s' \$(wget -O - --timeout=5 ${AUTH_CASDOOR_ISSUER}/.well-known/openid-configuration 2>&1 | grep -E 'issuer.*' | awk -F '\"' '{print \$4}')
echo ' , 但 .env 文件中的 issuer 是:${AUTH_CASDOOR_ISSUER} '
echo '请求 URL: ${AUTH_CASDOOR_ISSUER}/.well-known/openid-configuration'
echo '了解更多:https://lobehub.com/zh/docs/self-hosting/server-database/docker-compose#necessary-configuration'
echo ''
fi
fi
if [ $(wget --timeout=5 --spider --server-response ${S3_ENDPOINT}/minio/health/live 2>&1 | grep -c 'HTTP/1.1 200 OK') -eq 0 ]; then
echo '⚠️Warning: Unable to fetch MinIO health status'
echo 'Request URL: ${S3_ENDPOINT}/minio/health/live'
echo 'Read more at: https://lobehub.com/docs/self-hosting/server-database/docker-compose#necessary-configuration'
echo ''
echo '⚠️注意:无法获取 MinIO 健康状态'
echo '请求 URL: ${S3_ENDPOINT}/minio/health/live'
echo '了解更多:https://lobehub.com/zh/docs/self-hosting/server-database/docker-compose#necessary-configuration'
echo ''
fi
wait \$LOBE_PID
"
volumes:
data:
driver: local
s3_data:
driver: local
grafana_data:
driver: local
tempo_data:
driver: local
prometheus_data:
driver: local
networks:
lobe-network:
driver: bridge
@@ -0,0 +1,15 @@
apiVersion: 1
datasources:
- name: Prometheus
type: prometheus
uid: prometheus
access: proxy
orgId: 1
url: http://127.0.0.1:9090
basicAuth: false
isDefault: false
version: 1
editable: false
jsonData:
httpMethod: GET
@@ -0,0 +1,20 @@
apiVersion: 1
datasources:
- name: Tempo
type: tempo
access: proxy
orgId: 1
url: http://127.0.0.1:3200
basicAuth: false
isDefault: true
version: 1
editable: false
apiVersion: 1
uid: tempo
jsonData:
httpMethod: GET
serviceMap:
datasourceUid: prometheus
streamingEnabled:
search: true
@@ -0,0 +1,45 @@
extensions:
health_check:
endpoint: 127.0.0.1:13133
receivers:
prometheus:
config:
scrape_configs:
- job_name: otel-collector-metrics
scrape_interval: 10s
static_configs:
- targets: ["127.0.0.1:8888"]
otlp:
protocols:
grpc:
endpoint: 0.0.0.0:4317
http:
endpoint: 0.0.0.0:4318
exporters:
prometheusremotewrite:
endpoint: http://127.0.0.1:9090/api/v1/write
tls:
insecure: true
otlp:
endpoint: 127.0.0.1:14317
tls:
insecure: true
debug:
verbosity: detailed
service:
pipelines:
metrics:
receivers: [prometheus]
exporters: [prometheusremotewrite]
traces:
receivers: [otlp]
exporters: [otlp]
logs:
receivers: [otlp]
exporters: [debug]
@@ -0,0 +1,11 @@
global:
scrape_interval: 15s
evaluation_interval: 15s
scrape_configs:
- job_name: "prometheus"
static_configs:
- targets: ["127.0.0.1:9090"]
- job_name: "tempo"
static_configs:
- targets: ["127.0.0.1:3200"]
@@ -0,0 +1,58 @@
stream_over_http_enabled: true
server:
http_listen_port: 3200
log_level: info
query_frontend:
search:
duration_slo: 5s
throughput_bytes_slo: 1.073741824e+09
metadata_slo:
duration_slo: 5s
throughput_bytes_slo: 1.073741824e+09
trace_by_id:
duration_slo: 5s
distributor:
max_attribute_bytes: 10485760
receivers:
otlp:
protocols:
grpc:
endpoint: 127.0.0.1:14317
http:
endpoint: 127.0.0.1:14318
ingester:
max_block_duration: 5m # cut the headblock when this much time passes. this is being set for demo purposes and should probably be left alone normally
compactor:
compaction:
block_retention: 1h # overall Tempo trace retention. set for demo purposes
metrics_generator:
registry:
external_labels:
source: tempo
cluster: docker-compose
storage:
path: /var/tempo/generator/wal
remote_write:
- url: http://127.0.0.1:9090/api/v1/write
send_exemplars: true
traces_storage:
path: /var/tempo/generator/traces
storage:
trace:
backend: local # backend configuration to use
wal:
path: /var/tempo/wal # where to store the wal locally
local:
path: /var/tempo/blocks
overrides:
defaults:
metrics_generator:
processors: [service-graphs, span-metrics, local-blocks] # enables metrics generator
generate_native_histograms: both
@@ -1,190 +0,0 @@
---
title: Image Generation Development Setup
description: Configure local environment for developing text-to-image and image-to-image features
---
# Image Generation Development Setup
This guide helps developers set up the local environment for developing image generation features (text-to-image, image-to-image) with file storage capabilities.
## Prerequisites
- Docker installed and running
- Node.js and pnpm installed
- PostgreSQL client tools (optional, for debugging)
<Callout type="warning">
**Security Notice**: This setup is designed for local development only. It uses default credentials and open permissions that are NOT suitable for production environments.
</Callout>
## Quick Setup
Run the provided script to automatically set up all required services:
```bash
# Set up PostgreSQL and MinIO for image storage
./scripts/setup-image-generation-dev.sh
# Start the development server
pnpm dev:desktop
```
This script will:
1. Start PostgreSQL (no authentication for local development)
2. Run database migrations to initialize schema
3. Start MinIO (S3-compatible storage)
4. Create and configure the storage bucket
5. Add necessary S3 environment variables to `.env.desktop`
## Architecture Overview
The image generation feature requires:
- **PostgreSQL**: Stores metadata about generated images
- **MinIO/S3**: Stores the actual image files
- **Server Mode**: Required for file handling (`NEXT_PUBLIC_SERVICE_MODE=server`)
## Environment Configuration
The following environment variables are automatically configured by the setup script:
```bash
# S3 Storage Configuration (MinIO for local development)
S3_ACCESS_KEY_ID=minioadmin
S3_SECRET_ACCESS_KEY=minioadmin
S3_ENDPOINT=http://localhost:9000
S3_BUCKET=lobe-chat
S3_REGION=us-east-1
S3_PUBLIC_DOMAIN=http://localhost:9000/lobe-chat
S3_ENABLE_PATH_STYLE=1 # Required for MinIO
```
## Development Workflow
### 1. Image Generation API
When developing image generation features, generated images will be:
1. Created by the AI model
2. Uploaded to S3/MinIO via presigned URLs
3. Metadata stored in PostgreSQL
4. Served via the public S3 URL
### 2. File Storage Structure
```
lobe-chat/ # S3 Bucket
├── generated/ # Generated images
│ └── {userId}/
│ └── {sessionId}/
│ └── {imageId}.png
└── uploads/ # User uploads for image-to-image
└── {userId}/
└── {fileId}.{ext}
```
### 3. Testing Your Implementation
After setting up the environment, you can test:
```typescript
// Example: Upload generated image
const uploadUrl = await trpc.upload.createPresignedUrl.mutate({
filename: 'generated-image.png',
contentType: 'image/png',
});
// Upload to S3
await fetch(uploadUrl, {
method: 'PUT',
body: imageBlob,
headers: { 'Content-Type': 'image/png' },
});
```
## Manual Setup
If you prefer to set up services manually:
### PostgreSQL
```bash
docker run -d --name lobe-postgres \
-p 5432:5432 \
-e POSTGRES_HOST_AUTH_METHOD=trust \
-e POSTGRES_DB=postgres \
postgres:15
```
### MinIO
```bash
# Start MinIO
docker run -d --name lobe-minio \
-p 9000:9000 -p 9001:9001 \
-e MINIO_ROOT_USER=minioadmin \
-e MINIO_ROOT_PASSWORD=minioadmin \
quay.io/minio/minio:RELEASE.2025-04-22T22-12-26Z \
server /data --console-address ":9001"
# Create bucket
docker run --rm \
--link lobe-minio:minio \
--entrypoint bash \
quay.io/minio/mc:RELEASE.2025-04-18T16-45-00Z \
-c "
mc config host add minio http://minio:9000 minioadmin minioadmin &&
mc mb minio/lobe-chat &&
mc anonymous set public minio/lobe-chat
"
```
## Service URLs
- **PostgreSQL**: `postgres://postgres@localhost:5432/postgres`
- **MinIO API**: `http://localhost:9000`
- **MinIO Console**: `http://localhost:9001` (minioadmin/minioadmin)
- **Application**: `http://localhost:3015`
## Troubleshooting
### Port Conflicts
If ports are already in use:
```bash
# Check what's using the ports
lsof -i :5432 # PostgreSQL
lsof -i :9000 # MinIO API
lsof -i :9001 # MinIO Console
```
### Reset Environment
To completely reset your development environment:
```bash
# Stop and remove containers
docker stop lobe-postgres lobe-minio
docker rm lobe-postgres lobe-minio
# Re-run setup
./scripts/setup-image-generation-dev.sh
```
### Database Migrations
The setup script runs migrations automatically. If you need to run them manually:
```bash
pnpm db:migrate
```
Note: In development mode with `pnpm dev:desktop`, migrations also run automatically on startup.
## Related Documentation
- [Server Database Setup](/docs/self-hosting/server-database)
- [S3 Storage Configuration](/docs/self-hosting/advanced/s3)
- [Environment Variables](/docs/self-hosting/environment-variables)
@@ -1,190 +0,0 @@
---
title: 图像生成开发环境配置
description: 配置本地环境以开发文本生图和图像处理功能
---
# 图像生成开发环境配置
本指南帮助开发者配置本地环境,用于开发图像生成功能(文生图、图生图)等和文件存储能力。
## 前置条件
- 已安装并运行 Docker
- 已安装 Node.js 和 pnpm
- PostgreSQL 客户端工具(可选,用于调试)
<Callout type="warning">
**安全提醒**:此配置仅适用于本地开发。使用的默认凭据和开放权限不适合生产环境。
</Callout>
## 快速配置
运行提供的脚本来自动配置所有必需的服务:
```bash
# 配置 PostgreSQL 和 MinIO 用于图像存储
./scripts/setup-image-generation-dev.sh
# 启动开发服务器
pnpm dev:desktop
```
此脚本将执行:
1. 启动 PostgreSQL(本地开发无需身份验证)
2. 运行数据库迁移以初始化模式
3. 启动 MinIOS3 兼容存储)
4. 创建并配置存储桶
5. 在 `.env.desktop` 中添加必要的 S3 环境变量
## 架构概览
图像生成功能需要:
- **PostgreSQL**:存储生成图像的元数据
- **MinIO/S3**:存储实际的图像文件
- **服务器模式**:文件处理所需(`NEXT_PUBLIC_SERVICE_MODE=server`
## 环境配置
以下环境变量会被配置脚本自动设置:
```bash
# S3 存储配置(本地开发使用 MinIO)
S3_ACCESS_KEY_ID=minioadmin
S3_SECRET_ACCESS_KEY=minioadmin
S3_ENDPOINT=http://localhost:9000
S3_BUCKET=lobe-chat
S3_REGION=us-east-1
S3_PUBLIC_DOMAIN=http://localhost:9000/lobe-chat
S3_ENABLE_PATH_STYLE=1 # MinIO 必需
```
## 开发工作流
### 1. 图像生成 API
在开发图像生成功能时,生成的图像将:
1. 由 AI 模型创建
2. 通过预签名 URL 上传到 S3/MinIO
3. 元数据存储在 PostgreSQL 中
4. 通过公共 S3 URL 提供服务
### 2. 文件存储结构
```
lobe-chat/ # S3 存储桶
├── generated/ # 生成的图像
│ └── {userId}/
│ └── {sessionId}/
│ └── {imageId}.png
└── uploads/ # 用户上传的图像处理文件
└── {userId}/
└── {fileId}.{ext}
```
### 3. 测试您的实现
配置环境后,您可以测试:
```typescript
// 示例:上传生成的图像
const uploadUrl = await trpc.upload.createPresignedUrl.mutate({
filename: 'generated-image.png',
contentType: 'image/png',
});
// 上传到 S3
await fetch(uploadUrl, {
method: 'PUT',
body: imageBlob,
headers: { 'Content-Type': 'image/png' },
});
```
## 手动配置
如果您希望手动配置服务:
### PostgreSQL
```bash
docker run -d --name lobe-postgres \
-p 5432:5432 \
-e POSTGRES_HOST_AUTH_METHOD=trust \
-e POSTGRES_DB=postgres \
postgres:15
```
### MinIO
```bash
# 启动 MinIO
docker run -d --name lobe-minio \
-p 9000:9000 -p 9001:9001 \
-e MINIO_ROOT_USER=minioadmin \
-e MINIO_ROOT_PASSWORD=minioadmin \
quay.io/minio/minio:RELEASE.2025-04-22T22-12-26Z \
server /data --console-address ":9001"
# 创建存储桶
docker run --rm \
--link lobe-minio:minio \
--entrypoint bash \
quay.io/minio/mc:RELEASE.2025-04-18T16-45-00Z \
-c "
mc config host add minio http://minio:9000 minioadmin minioadmin &&
mc mb minio/lobe-chat &&
mc anonymous set public minio/lobe-chat
"
```
## 服务地址
- **PostgreSQL**`postgres://postgres@localhost:5432/postgres`
- **MinIO API**`http://localhost:9000`
- **MinIO 控制台**`http://localhost:9001` (minioadmin/minioadmin)
- **应用程序**`http://localhost:3015`
## 故障排除
### 端口冲突
如果端口已被占用:
```bash
# 检查端口使用情况
lsof -i :5432 # PostgreSQL
lsof -i :9000 # MinIO API
lsof -i :9001 # MinIO 控制台
```
### 重置环境
要完全重置开发环境:
```bash
# 停止并删除容器
docker stop lobe-postgres lobe-minio
docker rm lobe-postgres lobe-minio
# 重新运行配置
./scripts/setup-image-generation-dev.sh
```
### 数据库迁移
配置脚本会自动运行迁移。如需手动运行:
```bash
pnpm db:migrate
```
注意:在使用 `pnpm dev:desktop` 的开发模式下,迁移也会在启动时自动运行。
## 相关文档
- [服务器数据库配置](/docs/self-hosting/server-database)
- [S3 存储配置](/docs/self-hosting/advanced/s3)
- [环境变量](/docs/self-hosting/environment-variables)
@@ -53,6 +53,18 @@ Now, you can open `http://localhost:3010` in your browser, and you should see th
![](https://github-production-user-asset-6210df.s3.amazonaws.com/28616219/274655364-414bc31e-8511-47a3-af17-209b530effc7.png)
## Working with Server-Side Features
The basic setup above uses LobeChat's client-side database mode. If you need to work with server-side features such as:
- Database persistence
- File uploads and storage
- Image generation
- Multi-user authentication
- Advanced server-side integrations
Please refer to the [Work with Server-Side Database](/docs/development/basic/work-with-server-side-database) guide for complete setup instructions.
During the development process, if you encounter any issues with environment setup or have any questions about LobeChat development, feel free to ask us at any time. We look forward to seeing your contributions!
[codespaces-link]: https://codespaces.new/lobehub/lobe-chat
@@ -53,6 +53,18 @@ bun run dev
![Chat Page](https://hub-apac-1.lobeobjects.space/docs/fc7b157a3bc016bc97719065f80c555c.png)
## 使用服务端功能
上述基础设置使用 LobeChat 的客户端数据库模式。如果你需要开发服务端功能,如:
- 数据库持久化
- 文件上传和存储
- 图像生成
- 多用户身份验证
- 高级服务端集成
请参考[使用服务端数据库](/docs/development/basic/work-with-server-side-database)指南获得完整的设置说明。
在开发过程中,如果你在环境设置上遇到任何问题,或者有任何关于 LobeChat 开发的问题,欢迎随时向我们提问。我们期待看到你的贡献!
[codespaces-link]: https://codespaces.new/lobehub/lobe-chat
@@ -11,7 +11,13 @@ But here is the easier approach that can reduce your pain.
### Environment Configuration
The project already includes a `.env.development` file with all necessary environment variables for server-side database mode. This file configures:
First, copy the example environment file to create your development configuration:
```bash
cp .env.example.development .env.development
```
This file contains all necessary environment variables for server-side database mode and configures:
- **Service Mode**: `NEXT_PUBLIC_SERVICE_MODE=server`
- **Database**: PostgreSQL with connection string
@@ -60,6 +66,88 @@ And you can check all Docker services are running by running:
docker-compose -f docker-compose.development.yml ps
```
## Image Generation Development
When working with image generation features (text-to-image, image-to-image), the Docker Compose setup already includes all necessary storage services for handling generated images and user uploads.
### Image Generation Configuration
The existing Docker Compose configuration already includes MinIO storage service and all necessary environment variables in `.env.example.development`. No additional setup is required.
### Image Generation Architecture
The image generation feature requires:
- **PostgreSQL**: Stores metadata about generated images
- **MinIO/S3**: Stores the actual image files
- **Server Mode**: Required for file handling (`NEXT_PUBLIC_SERVICE_MODE=server`)
### Storage Configuration
The `.env.example.development` file includes all necessary S3 environment variables:
```bash
# S3 Storage Configuration (MinIO for local development)
S3_ACCESS_KEY_ID=${MINIO_ROOT_USER}
S3_SECRET_ACCESS_KEY=${MINIO_ROOT_PASSWORD}
S3_ENDPOINT=http://localhost:${MINIO_PORT}
S3_BUCKET=${MINIO_LOBE_BUCKET}
S3_PUBLIC_DOMAIN=http://localhost:${MINIO_PORT}
S3_ENABLE_PATH_STYLE=1 # Required for MinIO
S3_SET_ACL=0 # MinIO compatibility
```
### File Storage Structure
Generated images and user uploads are organized in the MinIO bucket:
```
lobe/ # S3 Bucket (MINIO_LOBE_BUCKET)
├── generated/ # Generated images
│ └── {userId}/
│ └── {sessionId}/
│ └── {imageId}.png
└── uploads/ # User uploads for image-to-image
└── {userId}/
└── {fileId}.{ext}
```
### Development Workflow for Images
When developing image generation features, generated images will be:
1. Created by the AI model
2. Uploaded to S3/MinIO via presigned URLs
3. Metadata stored in PostgreSQL
4. Served via the public S3 URL
Example code for testing image upload:
```typescript
// Example: Upload generated image
const uploadUrl = await trpc.upload.createPresignedUrl.mutate({
filename: 'generated-image.png',
contentType: 'image/png',
});
// Upload to S3
await fetch(uploadUrl, {
method: 'PUT',
body: imageBlob,
headers: { 'Content-Type': 'image/png' },
});
```
### Service URLs
When running with Docker Compose development setup:
- **PostgreSQL**: `postgres://postgres@localhost:5432/lobechat`
- **MinIO API**: `http://localhost:9000`
- **MinIO Console**: `http://localhost:9001` (admin/CHANGE_THIS_PASSWORD_IN_PRODUCTION)
- **Application**: `http://localhost:3010`
### Reset Services
If you encounter issues, you can reset the entire stack:
@@ -75,3 +163,27 @@ docker-compose -f docker-compose.development.yml down -v
docker-compose -f docker-compose.development.yml up -d
pnpm db:migrate
```
### Troubleshooting
#### Port Conflicts
If ports are already in use:
```bash
# Check what's using the ports
lsof -i :5432 # PostgreSQL
lsof -i :9000 # MinIO API
lsof -i :9001 # MinIO Console
```
#### Database Migrations
The setup script runs migrations automatically. If you need to run them manually:
```bash
pnpm db:migrate
```
Note: In development mode with `pnpm dev:desktop`, migrations also run automatically on startup.
@@ -11,7 +11,13 @@ LobeChat 提供了内置的客户端数据库体验。
### 环境配置
项目已经包含了一个 `.env.development` 文件,其中包含服务端数据库模式所需的所有环境变量。此文件配置
首先,复制示例环境文件来创建你的开发配置:
```bash
cp .env.example.development .env.development
```
此文件包含服务端数据库模式所需的所有环境变量,配置了:
- **服务模式**: `NEXT_PUBLIC_SERVICE_MODE=server`
- **数据库**: 带连接字符串的 PostgreSQL
@@ -60,6 +66,88 @@ pnpm dev
docker-compose -f docker-compose.development.yml ps
```
## 图像生成开发
在开发图像生成功能(文生图、图生图)时,Docker Compose 配置已经包含了处理生成图像和用户上传所需的所有存储服务。
### 图像生成配置
现有的 Docker Compose 配置已经包含了 MinIO 存储服务以及 `.env.example.development` 中的所有必要环境变量。无需额外配置。
### 图像生成架构
图像生成功能需要:
- **PostgreSQL**:存储生成图像的元数据
- **MinIO/S3**:存储实际的图像文件
- **服务器模式**:文件处理所需(`NEXT_PUBLIC_SERVICE_MODE=server`
### 存储配置
`.env.example.development` 文件包含所有必要的 S3 环境变量:
```bash
# S3 存储配置(本地开发使用 MinIO)
S3_ACCESS_KEY_ID=${MINIO_ROOT_USER}
S3_SECRET_ACCESS_KEY=${MINIO_ROOT_PASSWORD}
S3_ENDPOINT=http://localhost:${MINIO_PORT}
S3_BUCKET=${MINIO_LOBE_BUCKET}
S3_PUBLIC_DOMAIN=http://localhost:${MINIO_PORT}
S3_ENABLE_PATH_STYLE=1 # MinIO 必需
S3_SET_ACL=0 # MinIO 兼容性
```
### 文件存储结构
生成的图像和用户上传在 MinIO 存储桶中按以下方式组织:
```
lobe/ # S3 存储桶 (MINIO_LOBE_BUCKET)
├── generated/ # 生成的图像
│ └── {userId}/
│ └── {sessionId}/
│ └── {imageId}.png
└── uploads/ # 用户上传的图像处理文件
└── {userId}/
└── {fileId}.{ext}
```
### 图像开发工作流
在开发图像生成功能时,生成的图像将:
1. 由 AI 模型创建
2. 通过预签名 URL 上传到 S3/MinIO
3. 元数据存储在 PostgreSQL 中
4. 通过公共 S3 URL 提供服务
测试图像上传的示例代码:
```typescript
// 示例:上传生成的图像
const uploadUrl = await trpc.upload.createPresignedUrl.mutate({
filename: 'generated-image.png',
contentType: 'image/png',
});
// 上传到 S3
await fetch(uploadUrl, {
method: 'PUT',
body: imageBlob,
headers: { 'Content-Type': 'image/png' },
});
```
### 服务地址
运行 Docker Compose 开发环境时:
- **PostgreSQL**`postgres://postgres@localhost:5432/lobechat`
- **MinIO API**`http://localhost:9000`
- **MinIO 控制台**`http://localhost:9001` (admin/CHANGE_THIS_PASSWORD_IN_PRODUCTION)
- **应用程序**`http://localhost:3010`
### 重置服务
如遇到问题,可以重置整个服务堆栈:
@@ -75,3 +163,27 @@ docker-compose -f docker-compose.development.yml down -v
docker-compose -f docker-compose.development.yml up -d
pnpm db:migrate
```
### 故障排除
#### 端口冲突
如果端口已被占用:
```bash
# 检查端口使用情况
lsof -i :5432 # PostgreSQL
lsof -i :9000 # MinIO API
lsof -i :9001 # MinIO 控制台
```
#### 数据库迁移
配置脚本会自动运行迁移。如需手动运行:
```bash
pnpm db:migrate
```
注意:在使用 `pnpm dev:desktop` 的开发模式下,迁移也会在启动时自动运行。
+13 -2
View File
@@ -1,8 +1,8 @@
table agents {
id text [pk, not null]
slug varchar(100) [unique]
title text
description text
title varchar(255)
description varchar(1000)
tags jsonb [default: `[]`]
avatar text
background_color text
@@ -24,6 +24,8 @@ table agents {
indexes {
(client_id, user_id) [name: 'client_id_user_id_unique', unique]
title [name: 'agents_title_idx']
description [name: 'agents_description_idx']
}
}
@@ -417,6 +419,9 @@ table messages {
topic_id [name: 'messages_topic_id_idx']
parent_id [name: 'messages_parent_id_idx']
quota_id [name: 'messages_quota_id_idx']
user_id [name: 'messages_user_id_idx']
session_id [name: 'messages_session_id_idx']
thread_id [name: 'messages_thread_id_idx']
}
}
@@ -622,6 +627,7 @@ table chunks {
indexes {
(client_id, user_id) [name: 'chunks_client_id_user_id_unique', unique]
user_id [name: 'chunks_user_id_idx']
}
}
@@ -635,6 +641,7 @@ table embeddings {
indexes {
(client_id, user_id) [name: 'embeddings_client_id_user_id_unique', unique]
chunk_id [name: 'embeddings_chunk_id_idx']
}
}
@@ -834,6 +841,8 @@ table sessions {
indexes {
(slug, user_id) [name: 'slug_user_id_unique', unique]
(client_id, user_id) [name: 'sessions_client_id_user_id_unique', unique]
user_id [name: 'sessions_user_id_idx']
(id, user_id) [name: 'sessions_id_user_id_idx']
}
}
@@ -884,6 +893,8 @@ table topics {
indexes {
(client_id, user_id) [name: 'topics_client_id_user_id_unique', unique]
user_id [name: 'topics_user_id_idx']
(id, user_id) [name: 'topics_id_user_id_idx']
}
}
@@ -0,0 +1,71 @@
---
title: Observability with Grafana, Prometheus, and Tempo
description: >-
Monitor and analyze your LobeChat instance using Grafana dashboards, Prometheus metrics, and Tempo traces. This guide covers setup, configuration for self-hosted deployments.
tags:
- Observability
- Grafana
- Prometheus
- Tempo
---
# Observability with [Grafana](https://grafana.com/), [Prometheus](https://prometheus.io/), and [Tempo](https://grafana.com/docs/tempo/latest/)
LobeChat supports advanced observability for self-hosted deployments using open-source tools:
- **Grafana** for dashboards and visualization
- **Prometheus** for metrics collection
- **Tempo** for distributed tracing
- **otel-collector** ingesting other OpenTelemetry supported data
We provided Docker Compose (`docker-compose`) file presets to bootstrap the observability stack with advanced self-hosting features.
This guide will help you set up and use these tools to monitor your LobeChat instance.
## Prerequisites
- `docker` CLI
- OrbStack (macOS), or Docker Desktop Windows
- `docker-compose` plugin enabled (check through `docker compose version`)
## 1. Deploy
```bash
curl -O https://raw.githubusercontent.com/lobehub/lobe-chat/HEAD/docker-compose/production/grafana/docker-compose.yml
curl -O https://raw.githubusercontent.com/lobehub/lobe-chat/HEAD/docker-compose/production/grafana/.env.example
mv .env.example .env
```
1. Update the password & secrets in the `.env` file as needed.
2. Start the stack with the correct profile:
```sh
docker compose up -d
```
This will launch Grafana, Prometheus, Tempo, and the otel-collector alongside LobeChat with Casdoor, Minio, and other advanced services.
## 2. Access Grafana Dashboards
- Open Grafana in your browser at [http://localhost:3000](http://localhost:3000) (or your server's IP).
- Default login (if required):
- **Username:** admin
- **Password:** (see your environment or Docker Compose file)
## 3. Explore traces & metrics
Click on "Explore" in the left sidebar to access the query editor to run ad-hoc queries against your Prometheus and Tempo data sources.
## 4. Troubleshooting
- Ensure all containers are running: `docker compose ps`
- Check logs for any service: `docker compose logs <service-name>`
- Verify Prometheus and Tempo are scraping and receiving data from LobeChat and otel-collector.
## See Also
- [Langfuse Observability](https://lobehub.com/docs/self-hosting/advanced/observability/langfuse)
- [Self-Hosting Overview](https://lobehub.com/docs/self-hosting/start)
---
For questions or feedback, open an issue on GitHub or join our community discussions.
@@ -0,0 +1,70 @@
---
title: 使用 Grafana、Prometheus 和 Tempo 进行可观测性监控
description: >-
使用 Grafana、Prometheus 指标和 Tempo 链路追踪,监控和分析你的 LobeChat 实例。本指南涵盖自托管部署的搭建、配置和示例仪表盘。
tags:
- 可观测性
- Grafana
- Prometheus
- Tempo
---
# 使用 [Grafana](https://grafana.com/)、[Prometheus](https://prometheus.io/) 和 [Tempo](https://grafana.com/docs/tempo/latest/) 进行可观测性监控
LobeChat 支持通过开源工具实现自托管部署的高级可观测性:
- **Grafana**:仪表盘与可视化
- **Prometheus**:指标采集
- **Tempo**:分布式链路追踪
- **otel-collector**:采集 OpenTelemetry 支持的数据
我们提供了 Docker Compose (`docker-compose`) 预设文件,帮助你一键启动包含高级可观测性功能的自托管栈。
## 前置条件
- 已安装 `docker` 命令行工具
- OrbStackmacOS)或 Docker DesktopWindows
- 启用 `docker-compose` 插件(可通过 `docker compose version` 检查)
## 1. 部署
```bash
curl -O https://raw.githubusercontent.com/lobehub/lobe-chat/HEAD/docker-compose/production/grafana/docker-compose.yml
curl -O https://raw.githubusercontent.com/lobehub/lobe-chat/HEAD/docker-compose/production/grafana/.env.example
mv .env.example .env
```
1. 根据需要修改 `.env` 文件中的密码和密钥。
2. 使用如下命令启动服务:
```sh
docker compose up -d
```
这将会启动 Grafana、Prometheus、Tempo、otel-collector 以及 LobeChat、Casdoor、Minio 等高级服务。
## 2. 访问 Grafana 仪表盘
- 在浏览器中打开 [http://localhost:3000](http://localhost:3000)(或你的服务器 IP)。
- 默认登录信息(如需):
- **用户名:** admin
- **密码:** 见你的环境变量或 Docker Compose 文件
## 3. 探索链路追踪与指标
点击左侧边栏的 “Explore” 进入查询编辑器,可对 Prometheus 和 Tempo 数据源进行即席查询。
## 4. 故障排查
- 确认所有容器已运行:`docker compose ps`
- 查看服务日志:`docker compose logs <服务名>`
- 检查 Prometheus 和 Tempo 是否正常采集 LobeChat 及 otel-collector 的数据。
## 相关链接
- [Langfuse 可观测性](https://lobehub.com/zh/docs/self-hosting/advanced/observability/langfuse)
- [自托管总览](https://lobehub.com/zh/docs/self-hosting/start)
---
如有问题或建议,欢迎在 GitHub 提 Issue 或加入社区讨论。
@@ -205,6 +205,13 @@ LobeChat provides a complete authentication service capability when deployed. Th
### Microsoft Entra ID
#### `AUTH_MICROSOFT_ENTRA_ID_BASE_URL`
- Type: Required
- Description: - Description: Base URL for Azure login. Use when authenticating against other Microsoft sovereignty clouds like Azure US Government.
- Default: `https://login.microsoftonline.com`
- Example: `https://login.microsoftonline.us`
#### `AUTH_AZURE_AD_ID`
- Type: Required
@@ -3,6 +3,7 @@ title: LobeChat Model Service Providers - Environment Variables and Configuratio
description: >-
Learn about the environment variables and configuration settings for various model service providers like OpenAI, Google AI, AWS Bedrock, Ollama, Perplexity AI, Anthropic AI, Mistral AI, Groq AI, OpenRouter AI, and 01.AI.
tags:
- Model Service Providers
- Environment Variables
@@ -646,9 +647,9 @@ If you need to use Azure OpenAI to provide model services, you can refer to the
- Type: Optional
- Description: Used to control the FAL model list. Use `+` to add a model, `-` to hide a model, and `model_name=display_name` to customize the display name of a model. Separate multiple entries with commas. The definition syntax follows the same rules as other providers' model lists.
- Default: `-`
- Example: `-all,+flux/schnell,+flux-pro/kontext=FLUX.1 Kontext [pro]`
- Example: `-all,+fal-ai/flux/schnell,+fal-ai/flux-pro/kontext=FLUX.1 Kontext [pro]`
The above example disables all models first, then enables `flux/schnell` and `flux-pro/kontext` (displayed as `FLUX.1 Kontext [pro]`).
The above example disables all models first, then enables `fal-ai/flux/schnell` and `fal-ai/flux-pro/kontext` (displayed as `FLUX.1 Kontext [pro]`).
## BFL
@@ -675,4 +676,45 @@ The above example disables all models first, then enables `flux/schnell` and `fl
The above example disables all models first, then enables `flux-pro-1.1` and `flux-kontext-pro` (displayed as `FLUX.1 Kontext [pro]`).
## NewAPI
### `NEWAPI_API_KEY`
- Type: Optional
- Description: This is the API key for your NewAPI service instance. NewAPI is a multi-provider model aggregation service that provides unified access to various AI model APIs.
- Default: -
- Example: `sk-xxxxxx...xxxxxx`
### `NEWAPI_PROXY_URL`
- Type: Optional
- Description: The base URL for your NewAPI server instance. This should point to your deployed NewAPI service endpoint.
- Default: -
- Example: `https://your-newapi-server.com/`
NewAPI is a multi-provider model aggregation service that supports automatic model routing based on provider detection. It offers cost management features and provides a single endpoint for accessing models from multiple providers including OpenAI, Anthropic, Google, and more. Learn more about NewAPI at [https://github.com/Calcium-Ion/new-api](https://github.com/Calcium-Ion/new-api).
## Vercel AI Gateway
### `ENABLED_VERCELAIGATEWAY`
- Type: Optional
- Description: Enables Vercel AI Gateway as a model provider by default. Set to `0` to disable the Vercel AI Gateway service.
- Default: `1`
- Example: `0`
### `VERCELAIGATEWAY_API_KEY`
- Type: Required
- Description: This is the API key you applied for in the Vercel AI Gateway service.
- Default: -
- Example: `vck_xxxxxx...xxxxxx`
### `VERCELAIGATEWAY_MODEL_LIST`
- Type: Optional
- Description: Used to control the Vercel AI Gateway model list. Use `+` to add a model, `-` to hide a model, and `model_name=display_name` to customize the display name of a model. Separate multiple entries with commas. The definition syntax follows the same rules as other providers' model lists.
- Default: `-`
- Example: `-all,+vercel-model-1,+vercel-model-2=vercel-special`
[model-list]: /docs/self-hosting/advanced/model-list
@@ -645,9 +645,9 @@ LobeChat 在部署时提供了丰富的模型服务商相关的环境变量,
- 类型:可选
- 描述:用来控制 FAL 模型列表,使用 `+` 增加一个模型,使用 `-` 来隐藏一个模型,使用 `模型名=展示名` 来自定义模型的展示名,用英文逗号隔开。模型定义语法规则与其他 provider 保持一致。
- 默认值:`-`
- 示例:`-all,+flux/schnell,+flux-pro/kontext=FLUX.1 Kontext [pro]`
- 示例:`-all,+fal-ai/flux/schnell,+fal-ai/flux-pro/kontext=FLUX.1 Kontext [pro]`
上述示例表示先禁用所有模型,再启用 `flux/schnell` 和 `flux-pro/kontext`(显示名为 `FLUX.1 Kontext [pro]`)。
上述示例表示先禁用所有模型,再启用 `fal-ai/flux/schnell` 和 `fal-ai/flux-pro/kontext`(显示名为 `FLUX.1 Kontext [pro]`)。
## BFL
@@ -674,4 +674,50 @@ LobeChat 在部署时提供了丰富的模型服务商相关的环境变量,
上述示例表示先禁用所有模型,再启用 `flux-pro-1.1` 和 `flux-kontext-pro`(显示名为 `FLUX.1 Kontext [pro]`)。
## NewAPI
### `NEWAPI_API_KEY`
- 类型:可选
- 描述:这是你的 NewAPI 服务实例的 API 密钥。NewAPI 是一个多供应商模型聚合服务,提供对各种 AI 模型 API 的统一访问。
- 默认值:-
- 示例:`sk-xxxxxx...xxxxxx`
### `NEWAPI_PROXY_URL`
- 类型:可选
- 描述:你的 NewAPI 服务器实例的基础 URL。这应该指向你部署的 NewAPI 服务端点。
- 默认值:-
- 示例:`https://your-newapi-server.com`
<Callout type={'info'}>
NewAPI
是一个多供应商模型聚合服务,支持基于供应商检测的自动模型路由。它提供成本管理功能,并为访问包括
OpenAI、Anthropic、Google 等多个供应商的模型提供单一端点。了解更多关于 NewAPI 的信息请访问
[https://github.com/Calcium-Ion/new-api](https://github.com/Calcium-Ion/new-api)。
</Callout>
## Vercel AI Gateway
### `ENABLED_VERCELAIGATEWAY`
- 类型:可选
- 描述:默认启用 Vercel AI Gateway 作为模型供应商,当设为 0 时关闭 Vercel AI Gateway 服务
- 默认值:`1`
- 示例:`0`
### `VERCELAIGATEWAY_API_KEY`
- 类型:必选
- 描述:这是你在 Vercel AI Gateway 服务中申请的 API 密钥
- 默认值:-
- 示例:`vck_xxxxxx...xxxxxx`
### `VERCELAIGATEWAY_MODEL_LIST`
- 类型:可选
- 描述:用来控制 Vercel AI Gateway 模型列表,使用 `+` 增加一个模型,使用 `-` 来隐藏一个模型,使用 `模型名=展示名` 来自定义模型的展示名,用英文逗号隔开。模型定义语法规则与其他 provider 保持一致。
- 默认值:`-`
- 示例:`-all,+vercel-model-1,+vercel-model-2=vercel-special`
[model-list]: /zh/docs/self-hosting/advanced/model-list
@@ -0,0 +1,62 @@
---
title: Using Vercel AI Gateway in LobeChat
description: >-
Learn how to integrate and utilize Vercel AI Gateway's unified API in LobeChat.
tags:
- LobeChat
- Vercel AI Gateway
- API Key
- Web UI
---
# Using Vercel AI Gateway in LobeChat
[Vercel AI Gateway](https://vercel.com/ai-gateway) is a unified API that provides access to 100+ AI models through a single endpoint. It offers features like budget management, usage monitoring, load balancing, and fallback handling.
This article will guide you on how to use Vercel AI Gateway in LobeChat.
<Steps>
### Step 1: Create an API Key in Vercel AI Gateway
- Go to [Vercel Dashboard](https://vercel.com/dashboard)
- Click on the **AI Gateway** tab on the left side
- Click on **API keys** in the left sidebar
- Click **Create key** and then **Create key** in the dialog to complete
### Step 2: Configure Vercel AI Gateway in LobeChat
- Go to the `Settings` page in LobeChat
- Under `AI Service Provider`, find the setting for `Vercel AI Gateway`
- Enter the API Key you obtained
- Choose a model from Vercel AI Gateway for your AI assistant to start the conversation
<Callout type={'warning'}>
During usage, you may need to pay the API service provider, so please refer to Vercel AI Gateway's
[pricing policy](https://vercel.com/docs/ai-gateway/models).
</Callout>
</Steps>
At this point, you can start chatting using the models provided by Vercel AI Gateway in LobeChat.
## Model Selection
Vercel AI Gateway supports various model providers including:
- **OpenAI**: `openai/gpt-4o`, `openai/gpt-4o-mini`, `openai/o1`, etc.
- **Anthropic**: `anthropic/claude-3-5-sonnet`, `anthropic/claude-3-opus`, etc.
- **Google**: `google/gemini-2.5-pro`, `google/gemini-2.0-flash`, etc.
- **DeepSeek**: `deepseek/deepseek-chat`, `deepseek/deepseek-reasoner`, etc.
- And many more...
For a complete list of supported models, visit [Vercel AI Gateway Models](https://vercel.com/ai-gateway/models).
## API Configuration
Vercel AI Gateway uses OpenAI-compatible API format. The base URL is:
```
https://ai-gateway.vercel.sh/v1
```
You can use any OpenAI-compatible client with this endpoint and your API key.
@@ -0,0 +1,61 @@
---
title: 在 LobeChat 中使用 Vercel AI Gateway
description: 了解如何在 LobeChat 中集成和使用 Vercel AI Gateway 的统一 API
tags:
- LobeChat
- Vercel AI Gateway
- API 密钥
- Web 界面
---
# 在 LobeChat 中使用 Vercel AI Gateway
[Vercel AI Gateway](https://vercel.com/ai-gateway) 是一个统一的 API,通过单一端点提供对 100+ AI 模型的访问。它提供预算管理、使用监控、负载均衡和回退处理等功能。
本文将指导您如何在 LobeChat 中使用 Vercel AI Gateway。
<Steps>
### 第一步:在 Vercel AI Gateway 中创建 API 密钥
- 访问 [Vercel 控制台](https://vercel.com/dashboard)
- 点击左侧的 **AI Gateway** 标签
- 点击左侧边栏的 **API 密钥**
- 点击 **创建密钥**,然后在对话框中点击 **创建密钥** 完成创建
### 第二步:在 LobeChat 中配置 Vercel AI Gateway
- 进入 LobeChat 的 `设置` 页面
- 在 `AI 服务提供商` 下,找到 `Vercel AI Gateway` 设置
- 输入您获得的 API 密钥
- 选择 Vercel AI Gateway 的模型,开始与 AI 助手对话
<Callout type={'warning'}>
使用过程中可能需要向 API 服务提供商付费,请参考 Vercel AI Gateway 的
[定价政策](https://vercel.com/docs/ai-gateway/models)。
</Callout>
</Steps>
至此,您可以在 LobeChat 中使用 Vercel AI Gateway 提供的模型开始聊天了。
## 模型选择
Vercel AI Gateway 支持多种模型提供商,包括:
- **OpenAI**: `openai/gpt-4o`、`openai/gpt-4o-mini`、`openai/o1` 等
- **Anthropic**: `anthropic/claude-3-5-sonnet`、`anthropic/claude-3-opus` 等
- **Google**: `google/gemini-2.5-pro`、`google/gemini-2.0-flash` 等
- **DeepSeek**: `deepseek/deepseek-chat`、`deepseek/deepseek-reasoner` 等
- 以及更多...
如需查看完整的支持模型列表,请访问 [Vercel AI Gateway 模型](https://vercel.com/ai-gateway/models)。
## API 配置
Vercel AI Gateway 使用 OpenAI 兼容的 API 格式。基础 URL 为:
```
https://ai-gateway.vercel.sh/v1
```
您可以使用任何 OpenAI 兼容的客户端与此端点和您的 API 密钥一起使用。
+10 -3
View File
@@ -70,12 +70,15 @@
"input": {
"addAi": "إضافة رسالة AI",
"addUser": "إضافة رسالة مستخدم",
"disclaimer": "قد يرتكب الذكاء الاصطناعي أخطاءً أيضًا، يرجى التحقق من المعلومات الهامة",
"errorMsg": "فشل إرسال الرسالة، يرجى التحقق من الشبكة والمحاولة مرة أخرى: {{errorMsg}}",
"more": "المزيد",
"send": "إرسال",
"sendWithCmdEnter": "اضغط {{meta}} + Enter للإرسال",
"sendWithEnter": "اضغط Enter للإرسال",
"sendWithCmdEnter": "اضغط <key/> للإرسال",
"sendWithEnter": "اضغط <key/> للإرسال",
"stop": "توقف",
"warp": "تغيير السطر"
"warp": "تغيير السطر",
"warpWithKey": "اضغط على مفتاح <key/> للانتقال إلى السطر"
},
"intentUnderstanding": {
"title": "جارٍ فهم وتحليل نواياك..."
@@ -232,6 +235,10 @@
"threadMessageCount": "{{messageCount}} رسالة",
"title": "موضوع فرعي"
},
"toggleWideScreen": {
"off": "إيقاف وضع الشاشة العريضة",
"on": "تشغيل وضع الشاشة العريضة"
},
"tokenDetails": {
"chats": "رسائل المحادثة",
"historySummary": "ملخص التاريخ",
+62
View File
@@ -0,0 +1,62 @@
{
"actions": {
"expand": {
"off": "طي",
"on": "توسيع"
},
"typobar": {
"off": "إخفاء شريط أدوات التنسيق",
"on": "إظهار شريط أدوات التنسيق"
}
},
"cancel": "إلغاء",
"confirm": "تأكيد",
"file": {
"error": "خطأ: {{message}}",
"uploading": "جاري رفع الملف..."
},
"image": {
"broken": "الصورة تالفة"
},
"link": {
"edit": "تعديل الرابط",
"open": "فتح الرابط",
"placeholder": "أدخل عنوان URL للرابط",
"unlink": "إزالة الرابط"
},
"math": {
"placeholder": "يرجى إدخال معادلة TeX"
},
"slash": {
"h1": "عنوان رئيسي من المستوى الأول",
"h2": "عنوان فرعي من المستوى الثاني",
"h3": "عنوان فرعي من المستوى الثالث",
"hr": "خط فاصل",
"table": "جدول",
"tex": "معادلة TeX"
},
"table": {
"delete": "حذف الجدول",
"deleteColumn": "حذف العمود",
"deleteRow": "حذف الصف",
"insertColumnLeft": "إدراج {{count}} عمودًا إلى اليسار",
"insertColumnRight": "إدراج {{count}} عمودًا إلى اليمين",
"insertRowAbove": "إدراج {{count}} صفًا في الأعلى",
"insertRowBelow": "إدراج {{count}} صفًا في الأسفل"
},
"typobar": {
"blockquote": "اقتباس",
"bold": "غامق",
"bulletList": "قائمة نقطية",
"code": "كود مضمن",
"codeblock": "كتلة كود",
"italic": "مائل",
"link": "رابط",
"numberList": "قائمة مرقمة",
"strikethrough": "شطب",
"table": "جدول",
"taskList": "قائمة المهام",
"tex": "معادلة TeX",
"underline": "تسطير"
}
}
+3
View File
@@ -5,6 +5,9 @@
"lock": "قفل نسبة العرض إلى الارتفاع",
"unlock": "إلغاء قفل نسبة العرض إلى الارتفاع"
},
"cfg": {
"label": "شدة التوجيه"
},
"header": {
"desc": "وصف بسيط، ابتكر فورًا",
"title": "الرسم"
+355 -52
View File
@@ -53,6 +53,9 @@
"Baichuan4-Turbo": {
"description": "النموذج الأول محليًا، يتفوق على النماذج الرئيسية الأجنبية في المهام الصينية مثل المعرفة الموسوعية، النصوص الطويلة، والإبداع. كما يتمتع بقدرات متعددة الوسائط الرائدة في الصناعة، ويظهر أداءً ممتازًا في العديد من معايير التقييم الموثوقة."
},
"ByteDance-Seed/Seed-OSS-36B-Instruct": {
"description": "Seed-OSS هي سلسلة من نماذج اللغة الكبيرة مفتوحة المصدر التي طورتها فريق Seed في شركة ByteDance، مصممة خصيصًا لمعالجة السياقات الطويلة القوية، والاستدلال، والوكيل الذكي (agent)، والقدرات العامة. النموذج Seed-OSS-36B-Instruct في هذه السلسلة هو نموذج ضبط دقيق للتعليمات يحتوي على 36 مليار معلمة، ويدعم بطبيعته سياقات فائقة الطول، مما يمكنه من معالجة كميات هائلة من الوثائق أو قواعد الشيفرة المعقدة دفعة واحدة. تم تحسين هذا النموذج بشكل خاص لمهام الاستدلال، وتوليد الشيفرة، ومهام الوكيل (مثل استخدام الأدوات)، مع الحفاظ على توازن وقدرات عامة ممتازة. من الميزات البارزة لهذا النموذج وظيفة \"ميزانية التفكير\" التي تسمح للمستخدمين بضبط طول الاستدلال بمرونة حسب الحاجة، مما يعزز كفاءة الاستدلال في التطبيقات العملية."
},
"DeepSeek-R1": {
"description": "نموذج LLM المتقدم والفعال، بارع في الاستدلال والرياضيات والبرمجة."
},
@@ -81,7 +84,13 @@
"description": "مزود النموذج: منصة sophnet. DeepSeek V3 Fast هو النسخة السريعة عالية TPS من إصدار DeepSeek V3 0324، غير مكوّن بالكامل، يتمتع بقدرات برمجية ورياضية أقوى واستجابة أسرع!"
},
"DeepSeek-V3.1": {
"description": "DeepSeek-V3.1 هو نموذج استدلال هجين جديد أطلقته DeepSeek، يدعم وضعين للاستدلال: التفكير وعدم التفكير، مع كفاءة تفكير أعلى مقارنة بـ DeepSeek-R1-0528. بعد تحسين ما بعد التدريب، تم تعزيز استخدام أدوات الوكيل وأداء مهام الوكيل بشكل كبير."
"description": "DeepSeek-V3.1 - وضع عدم التفكير؛ DeepSeek-V3.1 هو نموذج استدلال هجين جديد من DeepSeek يدعم وضعين للاستدلال: التفكير وعدم التفكير، مع كفاءة تفكير أعلى مقارنة بـ DeepSeek-R1-0528. بعد تحسين ما بعد التدريب، تحسنت بشكل كبير أداء استخدام أدوات الوكيل ومهام الوكيل الذكي."
},
"DeepSeek-V3.1-Fast": {
"description": "DeepSeek V3.1 Fast هو النسخة عالية الأداء من DeepSeek V3.1 مع معدل معاملات في الثانية (TPS) مرتفع. وضع التفكير الهجين: من خلال تغيير قالب المحادثة، يمكن لنموذج واحد دعم وضعي التفكير وعدم التفكير في نفس الوقت. استدعاء أدوات أكثر ذكاءً: بفضل تحسين ما بعد التدريب، تحسن أداء النموذج بشكل ملحوظ في استخدام الأدوات ومهام الوكيل."
},
"DeepSeek-V3.1-Think": {
"description": "DeepSeek-V3.1 - وضع التفكير؛ DeepSeek-V3.1 هو نموذج استدلال هجين جديد من DeepSeek يدعم وضعين للاستدلال: التفكير وعدم التفكير، مع كفاءة تفكير أعلى مقارنة بـ DeepSeek-R1-0528. بعد تحسين ما بعد التدريب، تحسنت بشكل كبير أداء استخدام أدوات الوكيل ومهام الوكيل الذكي."
},
"Doubao-lite-128k": {
"description": "Doubao-lite يتميز بسرعة استجابة فائقة وقيمة أفضل مقابل المال، ويوفر خيارات أكثر مرونة للعملاء في سيناريوهات مختلفة. يدعم الاستدلال والتخصيص مع نافذة سياق 128k."
@@ -281,6 +290,9 @@
"Pro/moonshotai/Kimi-K2-Instruct": {
"description": "Kimi K2 هو نموذج أساسي يعتمد على بنية MoE مع قدرات قوية في البرمجة والوكيل، يحتوي على 1 تريليون معلمة و32 مليار معلمة مفعلة. يتفوق نموذج K2 في اختبارات الأداء الأساسية في مجالات المعرفة العامة، البرمجة، الرياضيات والوكيل مقارنة بالنماذج المفتوحة المصدر الأخرى."
},
"Pro/moonshotai/Kimi-K2-Instruct-0905": {
"description": "Kimi K2-Instruct-0905 هو أحدث وأقوى إصدار من Kimi K2. إنه نموذج لغوي من نوع الخبراء المختلطين (MoE) من الطراز الأول، يحتوي على تريليون معلمة إجمالية و32 مليار معلمة مفعلة. تشمل الميزات الرئيسية للنموذج: تعزيز ذكاء التكويد للوكيل، مع تحسينات ملحوظة في الأداء في اختبارات المعيار المفتوحة ومهام التكويد الواقعية للوكيل؛ تحسين تجربة التكويد في الواجهة الأمامية، مع تقدم في الجمالية والعملية في برمجة الواجهة الأمامية."
},
"QwQ-32B-Preview": {
"description": "QwQ-32B-Preview هو نموذج معالجة اللغة الطبيعية المبتكر، قادر على معالجة مهام توليد الحوار وفهم السياق بشكل فعال."
},
@@ -590,6 +602,33 @@
"ai21-labs/AI21-Jamba-1.5-Mini": {
"description": "نموذج متعدد اللغات يحتوي على 52 مليار معلمة (12 مليار نشطة)، يوفر نافذة سياق طويلة تصل إلى 256 ألف كلمة، استدعاء دوال، إخراج منظم وتوليد قائم على الحقائق."
},
"alibaba/qwen-3-14b": {
"description": "Qwen3 هو الجيل الأحدث من سلسلة Qwen لنماذج اللغة الكبيرة، ويقدم مجموعة شاملة من النماذج الكثيفة ونماذج الخبراء المختلطة (MoE). مبني على تدريب واسع النطاق، يحقق Qwen3 تقدمًا ثوريًا في الاستدلال، والامتثال للتعليمات، وقدرات الوكيل، ودعم اللغات المتعددة."
},
"alibaba/qwen-3-235b": {
"description": "Qwen3 هو الجيل الأحدث من سلسلة Qwen لنماذج اللغة الكبيرة، ويقدم مجموعة شاملة من النماذج الكثيفة ونماذج الخبراء المختلطة (MoE). مبني على تدريب واسع النطاق، يحقق Qwen3 تقدمًا ثوريًا في الاستدلال، والامتثال للتعليمات، وقدرات الوكيل، ودعم اللغات المتعددة."
},
"alibaba/qwen-3-30b": {
"description": "Qwen3 هو الجيل الأحدث من سلسلة Qwen لنماذج اللغة الكبيرة، ويقدم مجموعة شاملة من النماذج الكثيفة ونماذج الخبراء المختلطة (MoE). مبني على تدريب واسع النطاق، يحقق Qwen3 تقدمًا ثوريًا في الاستدلال، والامتثال للتعليمات، وقدرات الوكيل، ودعم اللغات المتعددة."
},
"alibaba/qwen-3-32b": {
"description": "Qwen3 هو الجيل الأحدث من سلسلة Qwen لنماذج اللغة الكبيرة، ويقدم مجموعة شاملة من النماذج الكثيفة ونماذج الخبراء المختلطة (MoE). مبني على تدريب واسع النطاق، يحقق Qwen3 تقدمًا ثوريًا في الاستدلال، والامتثال للتعليمات، وقدرات الوكيل، ودعم اللغات المتعددة."
},
"alibaba/qwen3-coder": {
"description": "Qwen3-Coder-480B-A35B-Instruct هو نموذج الكود الأكثر قدرة على الوكيل في Qwen، يتميز بأداء بارز في ترميز الوكيل، واستخدام متصفح الوكيل، ومهام الترميز الأساسية الأخرى، محققًا نتائج مماثلة لـ Claude Sonnet."
},
"amazon/nova-lite": {
"description": "نموذج متعدد الوسائط منخفض التكلفة للغاية، يعالج الصور والفيديو والنصوص بسرعة فائقة."
},
"amazon/nova-micro": {
"description": "نموذج نصي فقط يقدم استجابات بأدنى تأخير وبتكلفة منخفضة جدًا."
},
"amazon/nova-pro": {
"description": "نموذج متعدد الوسائط عالي الكفاءة يجمع بين الدقة والسرعة والتكلفة المثلى، مناسب لمجموعة واسعة من المهام."
},
"amazon/titan-embed-text-v2": {
"description": "Amazon Titan Text Embeddings V2 هو نموذج تضمين متعدد اللغات خفيف الوزن وفعال، يدعم أبعاد 1024 و512 و256."
},
"anthropic.claude-3-5-sonnet-20240620-v1:0": {
"description": "Claude 3.5 Sonnet يرفع المعايير في الصناعة، حيث يتفوق على نماذج المنافسين وClaude 3 Opus، ويظهر أداءً ممتازًا في تقييمات واسعة، مع سرعة وتكلفة تتناسب مع نماذجنا المتوسطة."
},
@@ -615,25 +654,28 @@
"description": "الإصدار المحدث من Claude 2، مع نافذة سياقية مضاعفة، وتحسينات في الاعتمادية ومعدل الهلوسة والدقة المستندة إلى الأدلة في الوثائق الطويلة وسياقات RAG."
},
"anthropic/claude-3-haiku": {
"description": "Claude 3 Haiku هو أسرع وأصغر نموذج من Anthropic، مصمم لتحقيق استجابة شبه فورية. يتمتع بأداء توجيهي سريع ودقيق."
"description": "Claude 3 Haiku هو أسرع نموذج حتى الآن من Anthropic، مصمم خصيصًا لأعباء العمل المؤسسية التي تتطلب عادةً مطالبات طويلة. يمكن لـ Haiku تحليل كميات كبيرة من الوثائق بسرعة، مثل التقارير الفصلية والعقود والقضايا القانونية، بتكلفة نصف تكلفة النماذج الأخرى في فئته."
},
"anthropic/claude-3-opus": {
"description": "Claude 3 Opus هو أقوى نموذج من Anthropic لمعالجة المهام المعقدة للغاية. يتميز بأداء ممتاز وذكاء وسلاسة وفهم."
"description": "Claude 3 Opus هو أذكى نموذج من Anthropic، يقدم أداءً رائدًا في السوق للمهام المعقدة للغاية. يتميز بسلاسة استثنائية وفهم شبيه بالبشر للتعامل مع المطالبات المفتوحة والسيناريوهات غير المسبوقة."
},
"anthropic/claude-3.5-haiku": {
"description": "Claude 3.5 Haiku هو أسرع نموذج من الجيل التالي من Anthropic. مقارنةً بـ Claude 3 Haiku، تم تحسين Claude 3.5 Haiku في جميع المهارات، وتفوق في العديد من اختبارات الذكاء على النموذج الأكبر من الجيل السابق Claude 3 Opus."
"description": "Claude 3.5 Haiku هو الجيل التالي من أسرع نماذجنا. يتمتع بسرعة مماثلة لـ Claude 3 Haiku، مع تحسينات في كل مجموعة مهارات، وتفوق في العديد من اختبارات الذكاء على أكبر نموذج لدينا من الجيل السابق Claude 3 Opus."
},
"anthropic/claude-3.5-sonnet": {
"description": "Claude 3.5 Sonnet يقدم قدرات تتجاوز Opus وسرعة أكبر من Sonnet، مع الحفاظ على نفس السعر. يتميز Sonnet بمهارات خاصة في البرمجة وعلوم البيانات ومعالجة الصور والمهام الوكيلة."
"description": "Claude 3.5 Sonnet يحقق توازنًا مثاليًا بين الذكاء والسرعة، خاصة لأعباء العمل المؤسسية. يقدم أداءً قويًا بتكلفة أقل مقارنة بالمنافسين، ومصمم لتحمل عالي في نشرات الذكاء الاصطناعي على نطاق واسع."
},
"anthropic/claude-3.7-sonnet": {
"description": "Claude 3.7 Sonnet هو أكثر النماذج ذكاءً من Anthropic حتى الآن، وهو أيضًا أول نموذج مختلط للتفكير في السوق. يمكن لـ Claude 3.7 Sonnet إنتاج استجابات شبه فورية أو تفكير تدريجي ممتد، حيث يمكن للمستخدمين رؤية هذه العمليات بوضوح. يتميز Sonnet بشكل خاص في البرمجة، وعلوم البيانات، ومعالجة الصور، والمهام الوكيلة."
"description": "Claude 3.7 Sonnet هو أول نموذج استدلال مختلط، وأذكى نموذج حتى الآن من Anthropic. يقدم أداءً متقدمًا في الترميز، وتوليد المحتوى، وتحليل البيانات، ومهام التخطيط، مبنيًا على قدرات الهندسة البرمجية واستخدام الحاسوب في سلفه Claude 3.5 Sonnet."
},
"anthropic/claude-opus-4": {
"description": "كلود أوبوس 4 هو أقوى نموذج من أنثروبيك لمعالجة المهام المعقدة للغاية. يتميز بأداء ممتاز وذكاء وسلاسة وفهم عميق."
"description": "Claude Opus 4 هو أقوى نموذج حتى الآن من Anthropic، وأفضل نموذج ترميز في العالم، متصدرًا في اختبارات SWE-bench (72.5%) وTerminal-bench (43.2%). يوفر أداءً مستمرًا للمهام الطويلة التي تتطلب تركيزًا وجهدًا وآلاف الخطوات، قادرًا على العمل لساعات متواصلة، مما يوسع بشكل كبير قدرات وكلاء الذكاء الاصطناعي."
},
"anthropic/claude-opus-4.1": {
"description": "Claude Opus 4.1 هو بديل جاهز للاستخدام لـ Opus 4، يقدم أداءً ودقة ممتازة في مهام الترميز والوكالة العملية. يرفع أداء الترميز المتقدم إلى 74.5% في SWE-bench Verified، ويتعامل مع المشكلات المعقدة متعددة الخطوات بدقة واهتمام أكبر بالتفاصيل."
},
"anthropic/claude-sonnet-4": {
"description": "كلود سونيت 4 يمكنه إنتاج استجابات شبه فورية أو تفكير تدريجي مطول، حيث يمكن للمستخدمين رؤية هذه العمليات بوضوح. كما يمكن لمستخدمي API التحكم بدقة في مدة تفكير النموذج."
"description": "Claude Sonnet 4 يحسن بشكل كبير على قدرات Sonnet 3.7 الرائدة في الصناعة، ويظهر أداءً ممتازًا في الترميز، محققًا 72.7% في SWE-bench. يوازن النموذج بين الأداء والكفاءة، مناسب للحالات الداخلية والخارجية، ويحقق تحكمًا أكبر في التنفيذ من خلال قابلية تحكم محسنة."
},
"ascend-tribe/pangu-pro-moe": {
"description": "Pangu-Pro-MoE 72B-A16B هو نموذج لغة ضخم نادر التنشيط يحتوي على 72 مليار معلمة و16 مليار معلمة نشطة، يعتمد على بنية الخبراء المختلطين المجمعة (MoGE). في مرحلة اختيار الخبراء، يتم تجميع الخبراء وتقيد تنشيط عدد متساوٍ من الخبراء داخل كل مجموعة لكل رمز، مما يحقق توازنًا في تحميل الخبراء ويعزز بشكل كبير كفاءة نشر النموذج على منصة Ascend."
@@ -689,6 +731,9 @@
"claude-3-5-haiku-20241022": {
"description": "Claude 3.5 Haiku هو أسرع نموذج من الجيل التالي من Anthropic. مقارنةً بـ Claude 3 Haiku، فإن Claude 3.5 Haiku قد حقق تحسينات في جميع المهارات، وتفوق في العديد من اختبارات الذكاء على أكبر نموذج من الجيل السابق، Claude 3 Opus."
},
"claude-3-5-haiku-latest": {
"description": "كلود 3.5 هايكو يوفر استجابة سريعة، مناسب للمهام الخفيفة."
},
"claude-3-5-sonnet-20240620": {
"description": "Claude 3.5 Sonnet يوفر قدرات تتجاوز Opus وسرعة أكبر من Sonnet، مع الحفاظ على نفس السعر. Sonnet بارع بشكل خاص في البرمجة، وعلوم البيانات، ومعالجة الصور، ومهام الوكالة."
},
@@ -698,6 +743,9 @@
"claude-3-7-sonnet-20250219": {
"description": "Claude 3.7 Sonnet هو أحدث نموذج من Anthropic، يتميز بأداء ممتاز في تقييمات واسعة، ويتفوق على نماذج المنافسين ونموذج Claude 3.5 Sonnet، مع الحفاظ على سرعة وتكلفة نماذجنا المتوسطة."
},
"claude-3-7-sonnet-latest": {
"description": "كلود 3.7 سونيت هو أحدث وأقوى نموذج من أنثروبيك لمعالجة المهام المعقدة للغاية. يتميز بأداء ممتاز، ذكاء، سلاسة وفهم عميق."
},
"claude-3-haiku-20240307": {
"description": "Claude 3 Haiku هو أسرع وأصغر نموذج من Anthropic، مصمم لتحقيق استجابة شبه فورية. يتمتع بأداء توجيهي سريع ودقيق."
},
@@ -710,11 +758,17 @@
"claude-opus-4-1-20250805": {
"description": "Claude Opus 4.1 هو أحدث وأقوى نموذج من Anthropic لمعالجة المهام المعقدة للغاية. يتميز بأداء ذكي وسلس وفهم عميق."
},
"claude-opus-4-1-20250805-thinking": {
"description": "كلود أوبوس 4.1 نموذج تفكيري يمكنه عرض عملية الاستدلال الخاصة به بإصدار متقدم."
},
"claude-opus-4-20250514": {
"description": "Claude Opus 4 هو أقوى نموذج من Anthropic لمعالجة المهام المعقدة للغاية. إنه يتفوق في الأداء والذكاء والسلاسة والفهم."
},
"claude-sonnet-4-20250514": {
"description": "يمكن لClaude 4 Sonnet أن ينتج استجابات شبه فورية أو تفكير تدريجي ممتد، حيث يمكن للمستخدمين رؤية هذه العمليات بوضوح. يمكن لمستخدمي API أيضًا التحكم بدقة في وقت تفكير النموذج."
"description": "كلود سونيت 4 يمكنه إنتاج استجابات شبه فورية أو تفكير تدريجي مطول، حيث يمكن للمستخدم رؤية هذه العمليات بوضوح."
},
"claude-sonnet-4-20250514-thinking": {
"description": "كلود سونيت 4 نموذج تفكيري يمكنه إنتاج استجابات شبه فورية أو تفكير تدريجي مطول، حيث يمكن للمستخدم رؤية هذه العمليات بوضوح."
},
"codegeex-4": {
"description": "CodeGeeX-4 هو مساعد برمجي قوي، يدعم مجموعة متنوعة من لغات البرمجة في الإجابة الذكية وإكمال الشيفرة، مما يعزز من كفاءة التطوير."
@@ -773,6 +827,18 @@
"cohere/Cohere-command-r-plus": {
"description": "Command R+ هو نموذج متقدم محسّن لـ RAG، مصمم للتعامل مع أعباء العمل على مستوى المؤسسات."
},
"cohere/command-a": {
"description": "Command A هو أقوى نموذج أداءً حتى الآن من Cohere، يتفوق في استخدام الأدوات، والوكالة، والتوليد المعزز بالاسترجاع (RAG)، وحالات الاستخدام متعددة اللغات. طول السياق يصل إلى 256K، ويعمل على اثنين من وحدات معالجة الرسومات فقط، مع زيادة في الإنتاجية بنسبة 150% مقارنة بـ Command R+ 08-2024."
},
"cohere/command-r": {
"description": "Command R هو نموذج لغة كبير مُحسّن للتفاعل الحواري والمهام ذات السياق الطويل. يصنف ضمن فئة \"القابل للتوسع\"، ويوازن بين الأداء العالي والدقة القوية، مما يمكّن الشركات من تجاوز إثبات المفهوم والدخول في الإنتاج."
},
"cohere/command-r-plus": {
"description": "Command R+ هو أحدث نموذج لغة كبير من Cohere، مُحسّن للتفاعل الحواري والمهام ذات السياق الطويل. يهدف إلى تقديم أداء استثنائي يمكّن الشركات من تجاوز إثبات المفهوم والدخول في الإنتاج."
},
"cohere/embed-v4.0": {
"description": "نموذج يسمح بتصنيف النصوص أو الصور أو المحتوى المختلط أو تحويلها إلى تمثيلات مضمنة."
},
"command": {
"description": "نموذج حواري يتبع التعليمات، يظهر جودة عالية وموثوقية أكبر في المهام اللغوية، ويتميز بطول سياق أطول مقارنة بنموذجنا الأساسي للتوليد."
},
@@ -809,12 +875,6 @@
"command-r7b-12-2024": {
"description": "الأمر-r7b-12-2024 هو إصدار صغير وفعال تم إصداره في ديسمبر 2024. يظهر أداءً ممتازًا في المهام التي تتطلب استدلالًا معقدًا ومعالجة متعددة الخطوات مثل RAG، واستخدام الأدوات، والوكالات."
},
"compound-beta": {
"description": "Compound-beta هو نظام ذكاء اصطناعي مركب، مدعوم بعدة نماذج مفتوحة متاحة في GroqCloud، يمكنه استخدام الأدوات بشكل ذكي وانتقائي للإجابة على استفسارات المستخدمين."
},
"compound-beta-mini": {
"description": "Compound-beta-mini هو نظام ذكاء اصطناعي مركب، مدعوم بنماذج مفتوحة متاحة في GroqCloud، يمكنه استخدام الأدوات بشكل ذكي وانتقائي للإجابة على استفسارات المستخدمين."
},
"computer-use-preview": {
"description": "نموذج computer-use-preview هو نموذج مخصص لأدوات \"استخدام الحاسوب\"، تم تدريبه لفهم وتنفيذ المهام المتعلقة بالحاسوب."
},
@@ -957,7 +1017,7 @@
"description": "DeepSeek-V3.1 هو نموذج استدلال هجين كبير يدعم سياق طويل يصل إلى 128K وتبديل أوضاع فعال، ويحقق أداءً وسرعة ممتازة في استدعاء الأدوات، وتوليد الأكواد، والمهام الاستدلالية المعقدة."
},
"deepseek/deepseek-r1": {
"description": "DeepSeek-R1 يعزز بشكل كبير من قدرة النموذج على الاستدلال في ظل وجود بيانات محدودة جدًا. قبل تقديم الإجابة النهائية، يقوم النموذج أولاً بإخراج سلسلة من التفكير لتحسين دقة الإجابة النهائية."
"description": "تم ترقية نموذج DeepSeek R1 إلى إصدار صغير جديد، الإصدار الحالي هو DeepSeek-R1-0528. في التحديث الأخير، حسّن DeepSeek R1 عمق الاستدلال وقدرته بشكل ملحوظ من خلال استغلال موارد حسابية متزايدة وإدخال آليات تحسين خوارزمية بعد التدريب. النموذج يحقق أداءً ممتازًا في تقييمات معيارية متعددة مثل الرياضيات، والبرمجة، والمنطق العام، وأداؤه العام يقترب الآن من النماذج الرائدة مثل O3 وGemini 2.5 Pro."
},
"deepseek/deepseek-r1-0528": {
"description": "DeepSeek-R1 يعزز بشكل كبير قدرة الاستدلال للنموذج حتى مع وجود بيانات تعليمية قليلة جدًا. قبل إخراج الإجابة النهائية، يقوم النموذج أولاً بإخراج سلسلة من التفكير لتحسين دقة الإجابة النهائية."
@@ -966,7 +1026,7 @@
"description": "DeepSeek-R1 يعزز بشكل كبير قدرة الاستدلال للنموذج حتى مع وجود بيانات تعليمية قليلة جدًا. قبل إخراج الإجابة النهائية، يقوم النموذج أولاً بإخراج سلسلة من التفكير لتحسين دقة الإجابة النهائية."
},
"deepseek/deepseek-r1-distill-llama-70b": {
"description": "DeepSeek R1 Distill Llama 70B هو نموذج لغوي كبير يعتمد على Llama3.3 70B، حيث يحقق أداءً تنافسيًا مماثلاً للنماذج الرائدة الكبيرة من خلال استخدام التعديلات المستندة إلى مخرجات DeepSeek R1."
"description": "DeepSeek-R1-Distill-Llama-70B هو نسخة مكثفة وأكثر كفاءة من نموذج Llama 70B. يحافظ على أداء قوي في مهام توليد النصوص مع تقليل استهلاك الحوسبة لتسهيل النشر والبحث. يتم تشغيله بواسطة Groq باستخدام وحدة معالجة اللغة المخصصة (LPU) لتوفير استدلال سريع وفعال."
},
"deepseek/deepseek-r1-distill-llama-8b": {
"description": "DeepSeek R1 Distill Llama 8B هو نموذج لغوي كبير مكرر يعتمد على Llama-3.1-8B-Instruct، تم تدريبه باستخدام مخرجات DeepSeek R1."
@@ -984,7 +1044,10 @@
"description": "DeepSeek-R1 يعزز بشكل كبير من قدرة النموذج على الاستدلال في ظل وجود بيانات محدودة جدًا. قبل تقديم الإجابة النهائية، يقوم النموذج أولاً بإخراج سلسلة من التفكير لتحسين دقة الإجابة النهائية."
},
"deepseek/deepseek-v3": {
"description": "حقق DeepSeek-V3 تقدمًا كبيرًا في سرعة الاستدلال مقارنة بالنماذج السابقة. يحتل المرتبة الأولى بين النماذج المفتوحة المصدر، ويمكن مقارنته بأحدث النماذج المغلقة على مستوى العالم. يعتمد DeepSeek-V3 على بنية الانتباه المتعدد الرؤوس (MLA) وبنية DeepSeekMoE، والتي تم التحقق منها بشكل شامل في DeepSeek-V2. بالإضافة إلى ذلك، قدم DeepSeek-V3 استراتيجية مساعدة غير مدمرة للتوازن في الحمل، وحدد أهداف تدريب متعددة التسمية لتحقيق أداء أقوى."
"description": "نموذج لغة كبير عام سريع مع قدرات استدلال محسنة."
},
"deepseek/deepseek-v3.1-base": {
"description": "DeepSeek V3.1 Base هو نسخة محسنة من نموذج DeepSeek V3."
},
"deepseek/deepseek-v3/community": {
"description": "حقق DeepSeek-V3 تقدمًا كبيرًا في سرعة الاستدلال مقارنة بالنماذج السابقة. يحتل المرتبة الأولى بين النماذج المفتوحة المصدر، ويمكن مقارنته بأحدث النماذج المغلقة على مستوى العالم. يعتمد DeepSeek-V3 على بنية الانتباه المتعدد الرؤوس (MLA) وبنية DeepSeekMoE، والتي تم التحقق منها بشكل شامل في DeepSeek-V2. بالإضافة إلى ذلك، قدم DeepSeek-V3 استراتيجية مساعدة غير مدمرة للتوازن في الحمل، وحدد أهداف تدريب متعددة التسمية لتحقيق أداء أقوى."
@@ -1055,8 +1118,17 @@
"doubao-seed-1.6-thinking": {
"description": "نموذج Doubao-Seed-1.6-thinking يعزز قدرات التفكير بشكل كبير، مقارنة بـ Doubao-1.5-thinking-pro، مع تحسينات إضافية في القدرات الأساسية مثل البرمجة والرياضيات والاستدلال المنطقي، ويدعم الفهم البصري. يدعم نافذة سياق بحجم 256k وطول إخراج يصل إلى 16k رمز."
},
"doubao-seed-1.6-vision": {
"description": "نموذج التفكير العميق البصري Doubao-Seed-1.6-vision، يظهر قدرة فهم واستدلال متعددة الوسائط عامة أقوى في سيناريوهات التعليم، مراجعة الصور، التفتيش والأمن، والبحث والإجابة بالذكاء الاصطناعي. يدعم نافذة سياق بحجم 256k وطول إخراج يصل إلى 64k رمزًا."
},
"doubao-seededit-3-0-i2i-250628": {
"description": "نموذج توليد الصور Doubao من فريق Seed في ByteDance، يدعم إدخال النص والصورة، ويوفر تجربة توليد صور عالية الجودة وقابلة للتحكم بدرجة كبيرة. يدعم تحرير الصور عبر أوامر نصية، وأبعاد الصور تتراوح بين 512 إلى 1536 بكسل."
},
"doubao-seedream-3-0-t2i-250415": {
"description": "نموذج توليد الصور Doubao طوره فريق Seed في ByteDance، يدعم إدخال النص والصورة، ويوفر تجربة توليد صور عالية الجودة وقابلة للتحكم. يولد الصور بناءً على أوامر نصية."
"description": "نموذج توليد الصور Seedream 3.0 من فريق Seed في ByteDance، يدعم إدخال النص والصورة، ويوفر تجربة توليد صور عالية الجودة وقابلة للتحكم بدرجة كبيرة. يعتمد على أوامر نصية لتوليد الصور."
},
"doubao-seedream-4-0-250828": {
"description": "نموذج توليد الصور Seedream 4.0 من فريق Seed في ByteDance، يدعم إدخال النص والصورة، ويوفر تجربة توليد صور عالية الجودة وقابلة للتحكم بدرجة كبيرة. يعتمد على أوامر نصية لتوليد الصور."
},
"doubao-vision-lite-32k": {
"description": "نموذج Doubao-vision هو نموذج متعدد الوسائط أطلقته Doubao، يتمتع بقدرات قوية في فهم الصور والاستدلال، بالإضافة إلى دقة عالية في فهم التعليمات. أظهر النموذج أداءً قويًا في استخراج المعلومات من النصوص والصور، والمهام الاستدلالية القائمة على الصور، مما يجعله مناسبًا لمهام الأسئلة البصرية المعقدة والواسعة."
@@ -1139,6 +1211,33 @@
"ernie-x1-turbo-32k": {
"description": "يتميز هذا النموذج بأداء أفضل مقارنةً بـ ERNIE-X1-32K."
},
"fal-ai/bytedance/seedream/v4": {
"description": "نموذج توليد الصور Seedream 4.0 من فريق Seed في ByteDance، يدعم إدخال النص والصورة، ويوفر تجربة توليد صور عالية الجودة وقابلة للتحكم بدرجة كبيرة. يعتمد على أوامر نصية لتوليد الصور."
},
"fal-ai/flux-kontext/dev": {
"description": "نموذج FLUX.1 مخصص لمهام تحرير الصور، يدعم إدخال النص والصورة."
},
"fal-ai/flux-pro/kontext": {
"description": "FLUX.1 Kontext [pro] قادر على معالجة النصوص والصور المرجعية كمدخلات، لتحقيق تحرير محلي مستهدف وتحولات معقدة للمشهد الكلي بسلاسة."
},
"fal-ai/flux/krea": {
"description": "Flux Krea [dev] هو نموذج توليد صور ذو تفضيلات جمالية، يهدف إلى إنتاج صور أكثر واقعية وطبيعية."
},
"fal-ai/flux/schnell": {
"description": "FLUX.1 [schnell] هو نموذج توليد صور يحتوي على 12 مليار معلمة، يركز على توليد صور عالية الجودة بسرعة."
},
"fal-ai/imagen4/preview": {
"description": "نموذج توليد صور عالي الجودة مقدم من جوجل."
},
"fal-ai/nano-banana": {
"description": "Nano Banana هو أحدث وأسرع وأكثر نماذج جوجل الأصلية متعددة الوسائط كفاءة، يسمح لك بتوليد وتحرير الصور عبر المحادثة."
},
"fal-ai/qwen-image": {
"description": "نموذج قوي لتوليد الصور من فريق Qwen، يتميز بقدرة مميزة على توليد النصوص الصينية وأنماط بصرية متنوعة للصور."
},
"fal-ai/qwen-image-edit": {
"description": "نموذج تحرير الصور الاحترافي من فريق Qwen، يدعم التحرير الدلالي والتحرير الظاهري، يمكنه تحرير النصوص الصينية والإنجليزية بدقة، وتحويل الأنماط، تدوير الأجسام، وغيرها من تحرير الصور عالية الجودة."
},
"flux-1-schnell": {
"description": "نموذج توليد صور نصية يحتوي على 12 مليار معلمة طورته Black Forest Labs، يستخدم تقنية تقطير الانتشار التنافسي الكامن، قادر على توليد صور عالية الجودة في 1 إلى 4 خطوات. أداء النموذج يضاهي البدائل المغلقة المصدر، ومتاح بموجب ترخيص Apache-2.0 للاستخدام الشخصي، البحثي والتجاري."
},
@@ -1151,9 +1250,6 @@
"flux-kontext-pro": {
"description": "توليد وتحرير الصور السياقية بأحدث التقنيات — يجمع بين النص والصورة للحصول على نتائج دقيقة ومتسقة."
},
"flux-kontext/dev": {
"description": "نموذج FLUX.1 مخصص لمهام تحرير الصور، يدعم إدخال النصوص والصور."
},
"flux-merged": {
"description": "نموذج FLUX.1-merged يجمع بين ميزات العمق التي استكشفتها نسخة \"DEV\" أثناء التطوير ومزايا التنفيذ السريع التي تمثلها نسخة \"Schnell\". من خلال هذا الدمج، يعزز FLUX.1-merged حدود أداء النموذج ويوسع نطاق تطبيقاته."
},
@@ -1166,21 +1262,12 @@
"flux-pro-1.1-ultra": {
"description": "توليد صور بالذكاء الاصطناعي بدقة فائقة — يدعم إخراج يصل إلى 4 ميجابكسل ويولد صورًا فائقة الوضوح خلال 10 ثوانٍ."
},
"flux-pro/kontext": {
"description": "FLUX.1 Kontext [pro] قادر على معالجة النصوص والصور المرجعية كمدخلات، مما يتيح تحريرًا محليًا مستهدفًا وتحولات معقدة للمشهد الكلي بسلاسة."
},
"flux-schnell": {
"description": "FLUX.1 [schnell] هو النموذج المفتوح المصدر الأكثر تقدمًا حاليًا في فئة النماذج قليلة الخطوات، متفوقًا على المنافسين وحتى على نماذج غير مكررة قوية مثل Midjourney v6.0 وDALL·E 3 (HD). تم ضبط النموذج خصيصًا للحفاظ على تنوع المخرجات الكامل من مرحلة ما قبل التدريب، ويحقق تحسينات ملحوظة في جودة الصورة، الالتزام بالتعليمات، التغيرات في الحجم/النسبة، معالجة الخطوط وتنوع المخرجات مقارنة بأحدث النماذج في السوق، مما يوفر تجربة توليد صور إبداعية أكثر ثراءً وتنوعًا للمستخدمين."
},
"flux.1-schnell": {
"description": "محول تدفق مصحح يحتوي على 12 مليار معلمة، قادر على توليد الصور بناءً على الوصف النصي."
},
"flux/krea": {
"description": "Flux Krea [dev] هو نموذج توليد صور ذو تفضيلات جمالية، يهدف إلى إنتاج صور أكثر واقعية وطبيعية."
},
"flux/schnell": {
"description": "FLUX.1 [schnell] هو نموذج توليد صور يحتوي على 12 مليار معلمة، يركز على توليد صور عالية الجودة بسرعة."
},
"gemini-1.0-pro-001": {
"description": "Gemini 1.0 Pro 001 (تعديل) يوفر أداءً مستقرًا وقابلًا للتعديل، وهو الخيار المثالي لحلول المهام المعقدة."
},
@@ -1388,20 +1475,26 @@
"glm-zero-preview": {
"description": "يمتلك GLM-Zero-Preview قدرة قوية على الاستدلال المعقد، ويظهر أداءً ممتازًا في مجالات الاستدلال المنطقي، والرياضيات، والبرمجة."
},
"google/gemini-2.0-flash": {
"description": "Gemini 2.0 Flash يقدم ميزات الجيل التالي وتحسينات تشمل سرعة فائقة، استخدام أدوات مدمجة، توليد متعدد الوسائط، ونافذة سياق تصل إلى مليون رمز."
},
"google/gemini-2.0-flash-001": {
"description": "Gemini 2.0 Flash يقدم ميزات وتحسينات من الجيل التالي، بما في ذلك سرعة فائقة، واستخدام أدوات أصلية، وتوليد متعدد الوسائط، ونافذة سياق تصل إلى 1M توكن."
},
"google/gemini-2.0-flash-exp:free": {
"description": "Gemini 2.0 Flash Experimental هو أحدث نموذج ذكاء اصطناعي متعدد الوسائط من Google، مع تحسينات ملحوظة في الجودة مقارنة بالإصدارات السابقة، خاصة في المعرفة العالمية، الشيفرات، والسياقات الطويلة."
},
"google/gemini-2.0-flash-lite": {
"description": "Gemini 2.0 Flash Lite يقدم ميزات الجيل التالي وتحسينات تشمل سرعة فائقة، استخدام أدوات مدمجة، توليد متعدد الوسائط، ونافذة سياق تصل إلى مليون رمز."
},
"google/gemini-2.5-flash": {
"description": "Gemini 2.5 Flash هو النموذج الرئيسي الأكثر تقدمًا من Google، مصمم خصيصًا للمهام المتقدمة في الاستدلال، الترميز، الرياضيات والعلوم. يحتوي على قدرة مدمجة على \"التفكير\"، مما يمكنه من تقديم استجابات بدقة أعلى ومعالجة سياقية أكثر تفصيلاً.\n\nملاحظة: يحتوي هذا النموذج على نسختين: نسخة التفكير ونسخة غير التفكير. تختلف تكلفة الإخراج بشكل ملحوظ بناءً على تفعيل قدرة التفكير. إذا اخترت النسخة القياسية (بدون لاحقة \":thinking\"), سيتجنب النموذج بوضوح توليد رموز التفكير.\n\nلاستغلال قدرة التفكير واستلام رموز التفكير، يجب عليك اختيار النسخة \":thinking\"، والتي ستؤدي إلى تكلفة إخراج أعلى للتفكير.\n\nبالإضافة إلى ذلك، يمكن تكوين Gemini 2.5 Flash من خلال معلمة \"الحد الأقصى لعدد رموز الاستدلال\" كما هو موضح في الوثائق (https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning)."
"description": "Gemini 2.5 Flash هو نموذج تفكيري يقدم قدرات شاملة ممتازة. مصمم لتحقيق توازن بين السعر والأداء، ويدعم متعدد الوسائط ونافذة سياق تصل إلى مليون رمز."
},
"google/gemini-2.5-flash-image-preview": {
"description": "نموذج تجريبي Gemini 2.5 Flash، يدعم توليد الصور."
},
"google/gemini-2.5-flash-image-preview:free": {
"description": "نموذج تجريبي Gemini 2.5 Flash، يدعم توليد الصور."
"google/gemini-2.5-flash-lite": {
"description": "Gemini 2.5 Flash-Lite هو نموذج متوازن ومنخفض التأخير مع ميزانية تفكير قابلة للتكوين واتصال بالأدوات (مثل البحث في Google والتنفيذ البرمجي). يدعم مدخلات متعددة الوسائط ويوفر نافذة سياق تصل إلى مليون رمز."
},
"google/gemini-2.5-flash-preview": {
"description": "Gemini 2.5 Flash هو النموذج الرائد الأكثر تقدمًا من Google، مصمم للاستدلال المتقدم، الترميز، المهام الرياضية والعلمية. يحتوي على قدرة \"التفكير\" المدمجة، مما يمكّنه من تقديم استجابات بدقة أعلى ومعالجة سياقات أكثر تفصيلاً.\n\nملاحظة: يحتوي هذا النموذج على نوعين: التفكير وغير التفكير. تختلف تسعير الإخراج بشكل ملحوظ بناءً على ما إذا كانت قدرة التفكير مفعلة. إذا اخترت النوع القياسي (بدون لاحقة \" :thinking \")، سيتجنب النموذج بشكل صريح توليد رموز التفكير.\n\nلاستغلال قدرة التفكير واستقبال رموز التفكير، يجب عليك اختيار النوع \" :thinking \"، مما سيؤدي إلى تسعير إخراج تفكير أعلى.\n\nبالإضافة إلى ذلك، يمكن تكوين Gemini 2.5 Flash من خلال معلمة \"الحد الأقصى لعدد رموز الاستدلال\"، كما هو موضح في الوثائق (https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning)."
@@ -1410,11 +1503,14 @@
"description": "Gemini 2.5 Flash هو النموذج الرائد الأكثر تقدمًا من Google، مصمم للاستدلال المتقدم، الترميز، المهام الرياضية والعلمية. يحتوي على قدرة \"التفكير\" المدمجة، مما يمكّنه من تقديم استجابات بدقة أعلى ومعالجة سياقات أكثر تفصيلاً.\n\nملاحظة: يحتوي هذا النموذج على نوعين: التفكير وغير التفكير. تختلف تسعير الإخراج بشكل ملحوظ بناءً على ما إذا كانت قدرة التفكير مفعلة. إذا اخترت النوع القياسي (بدون لاحقة \" :thinking \")، سيتجنب النموذج بشكل صريح توليد رموز التفكير.\n\nلاستغلال قدرة التفكير واستقبال رموز التفكير، يجب عليك اختيار النوع \" :thinking \"، مما سيؤدي إلى تسعير إخراج تفكير أعلى.\n\nبالإضافة إلى ذلك، يمكن تكوين Gemini 2.5 Flash من خلال معلمة \"الحد الأقصى لعدد رموز الاستدلال\"، كما هو موضح في الوثائق (https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning)."
},
"google/gemini-2.5-pro": {
"description": "Gemini 2.5 Pro هو نموذج التفكير الأكثر تقدمًا من Google، قادر على الاستدلال في مسائل معقدة في البرمجة، الرياضيات ومجالات العلوم والتكنولوجيا والهندسة والرياضيات (STEM)، بالإضافة إلى استخدام السياق الطويل لتحليل مجموعات بيانات كبيرة، قواعد الشيفرة والمستندات."
"description": "Gemini 2.5 Pro هو نموذج Gemini المتقدم للاستدلال، قادر على حل المشكلات المعقدة. يحتوي على نافذة سياق تصل إلى مليوني رمز، ويدعم مدخلات متعددة الوسائط تشمل النصوص، الصور، الصوت، الفيديو، ومستندات PDF."
},
"google/gemini-2.5-pro-preview": {
"description": "معاينة Gemini 2.5 Pro هي أحدث نموذج تفكيري من Google، قادر على استنتاج المشكلات المعقدة في مجالات البرمجة والرياضيات والعلوم والتكنولوجيا والهندسة والرياضيات (STEM)، بالإضافة إلى استخدام سياق طويل لتحليل مجموعات البيانات الكبيرة، وقواعد الشيفرة، والوثائق."
},
"google/gemini-embedding-001": {
"description": "نموذج تضمين متقدم يقدم أداءً ممتازًا في مهام اللغة الإنجليزية، متعددة اللغات، والبرمجة."
},
"google/gemini-flash-1.5": {
"description": "يقدم Gemini 1.5 Flash قدرات معالجة متعددة الوسائط محسّنة، مناسبة لمجموعة متنوعة من سيناريوهات المهام المعقدة."
},
@@ -1442,12 +1538,21 @@
"google/gemma-2b-it": {
"description": "Gemma Instruct (2B) يوفر قدرة أساسية على معالجة التعليمات، مناسب للتطبيقات الخفيفة."
},
"google/gemma-3-12b-it": {
"description": "Gemma 3 12B هو نموذج لغة مفتوح المصدر من جوجل، وضع معايير جديدة في الكفاءة والأداء."
},
"google/gemma-3-1b-it": {
"description": "Gemma 3 1B هو نموذج لغة مفتوح المصدر من جوجل، وضع معايير جديدة في الكفاءة والأداء."
},
"google/gemma-3-27b-it": {
"description": "جيمّا 3 27B هو نموذج لغوي مفتوح المصدر من جوجل، وقد وضع معايير جديدة من حيث الكفاءة والأداء."
},
"google/text-embedding-005": {
"description": "نموذج تضمين نصي مركز على اللغة الإنجليزية ومحسن لمهام البرمجة واللغة الإنجليزية."
},
"google/text-multilingual-embedding-002": {
"description": "نموذج تضمين نص متعدد اللغات محسن لمهام عبر اللغات، يدعم عدة لغات."
},
"gpt-3.5-turbo": {
"description": "نموذج GPT 3.5 Turbo، مناسب لمجموعة متنوعة من مهام توليد وفهم النصوص، يشير حاليًا إلى gpt-3.5-turbo-0125."
},
@@ -1604,9 +1709,18 @@
"grok-4": {
"description": "نموذجنا الرائد الأحدث والأقوى، يتميز بأداء ممتاز في معالجة اللغة الطبيعية، الحسابات الرياضية، والاستدلال — إنه لاعب شامل مثالي."
},
"grok-4-0709": {
"description": "Grok 4 من xAI، يتمتع بقدرات استدلال قوية."
},
"grok-code-fast-1": {
"description": "نحن سعداء بإطلاق grok-code-fast-1، وهو نموذج استدلال سريع وفعال من حيث التكلفة، يتميز بأداء ممتاز في ترميز الوكلاء."
},
"groq/compound": {
"description": "Compound هو نظام ذكاء اصطناعي مركب مدعوم من عدة نماذج متاحة مفتوحة المصدر في GroqCloud، يمكنه استخدام الأدوات بذكاء وباختيار للرد على استفسارات المستخدمين."
},
"groq/compound-mini": {
"description": "Compound-mini هو نظام ذكاء اصطناعي مركب مدعوم من نماذج متاحة مفتوحة المصدر في GroqCloud، يمكنه استخدام الأدوات بذكاء وباختيار للرد على استفسارات المستخدمين."
},
"gryphe/mythomax-l2-13b": {
"description": "MythoMax l2 13B هو نموذج لغوي يجمع بين الإبداع والذكاء من خلال دمج عدة نماذج رائدة."
},
@@ -1662,7 +1776,7 @@
"description": "تحسين كبير في القدرات الرياضية، المنطقية والبرمجية عالية الصعوبة، مع تحسين استقرار مخرجات النموذج وتعزيز قدرات النصوص الطويلة."
},
"hunyuan-t1-latest": {
"description": "أول نموذج استدلال هجين ضخم في الصناعة، يوسع قدرات الاستدلال، بسرعة فك تشفير فائقة، ويعزز التوافق مع تفضيلات البشر."
"description": "تحسين كبير لقدرات نموذج التفكير البطيء الرئيسي في الرياضيات الصعبة، الاستدلال المعقد، الشيفرة الصعبة، الالتزام بالتعليمات، وجودة إنشاء النصوص."
},
"hunyuan-t1-vision": {
"description": "نموذج تفكير عميق متعدد الوسائط من Hunyuan، يدعم سلاسل التفكير الأصلية متعددة الوسائط، بارع في معالجة مختلف سيناريوهات الاستدلال على الصور، ويحقق تحسينًا شاملاً مقارنة بنموذج التفكير السريع في مسائل العلوم."
@@ -1730,8 +1844,11 @@
"imagen-4.0-ultra-generate-preview-06-06": {
"description": "نسخة ألترا من سلسلة نموذج Imagen للجيل الرابع لتحويل النص إلى صورة"
},
"imagen4/preview": {
"description": "نموذج توليد صور عالي الجودة مقدم من جوجل."
"inception/mercury-coder-small": {
"description": "Mercury Coder Small هو الخيار المثالي لمهام توليد الكود، وتصحيح الأخطاء، وإعادة الهيكلة، مع أدنى تأخير."
},
"inclusionAI/Ling-mini-2.0": {
"description": "Ling-mini-2.0 هو نموذج لغوي كبير عالي الأداء بحجم صغير يعتمد على بنية MoE. يحتوي على 16 مليار معلمة إجمالية، لكن يتم تفعيل 1.4 مليار فقط لكل رمز (789 مليون غير مضمن)، مما يحقق سرعة توليد عالية جداً. بفضل تصميم MoE الفعال وبيانات التدريب عالية الجودة وعلى نطاق واسع، بالرغم من أن المعلمات المفعلة تبلغ فقط 1.4 مليار، إلا أن Ling-mini-2.0 يظهر أداءً رفيع المستوى في المهام اللاحقة يمكن مقارنته بنماذج LLM الكثيفة التي تقل عن 10 مليارات والمع نماذج MoE الأكبر حجماً."
},
"internlm/internlm2_5-7b-chat": {
"description": "InternLM2.5 يوفر حلول حوار ذكية في عدة سيناريوهات."
@@ -1766,6 +1883,9 @@
"kimi-k2-0711-preview": {
"description": "kimi-k2 هو نموذج أساسي بمعمارية MoE يتمتع بقدرات فائقة في البرمجة والوكيل، مع إجمالي 1 تريليون معلمة و32 مليار معلمة مفعلة. في اختبارات الأداء الأساسية في مجالات المعرفة العامة، البرمجة، الرياضيات، والوكيل، يتفوق نموذج K2 على النماذج المفتوحة المصدر الرئيسية الأخرى."
},
"kimi-k2-0905-preview": {
"description": "نموذج kimi-k2-0905-preview يدعم طول سياق 256k، يتمتع بقدرات ترميز وكيل أقوى، وجمالية وعملية أفضل في الشيفرة الأمامية، وفهم سياق محسن."
},
"kimi-k2-turbo-preview": {
"description": "kimi-k2 هو نموذج أساسي بمعمارية MoE يتمتع بقدرات قوية للغاية في البرمجة وقدرات الوكيل (Agent)، بإجمالي معلمات يبلغ 1 تريليون والمعلمات المُفعَّلة 32 مليار. في اختبارات الأداء المعيارية للفئات الرئيسية مثل الاستدلال المعرفي العام والبرمجة والرياضيات والوكلاء (Agent)، تفوق أداء نموذج K2 على النماذج المفتوحة المصدر السائدة الأخرى."
},
@@ -2003,30 +2123,63 @@
"meta/Meta-Llama-3.1-8B-Instruct": {
"description": "نموذج نصي معدل للتعليمات من Llama 3.1، محسن لحالات استخدام الحوار متعدد اللغات، ويحقق أداءً ممتازًا في العديد من معايير الصناعة مقارنة بالعديد من نماذج الدردشة المفتوحة والمغلقة."
},
"meta/llama-3-70b": {
"description": "نموذج مفتوح المصدر مكون من 70 مليار معلمة، تم ضبطه بعناية من قبل Meta لأغراض الامتثال للتعليمات. يتم تشغيله بواسطة Groq باستخدام وحدة معالجة اللغة المخصصة (LPU) لتوفير استدلال سريع وفعال."
},
"meta/llama-3-8b": {
"description": "نموذج مفتوح المصدر مكون من 8 مليارات معلمة، تم ضبطه بعناية من قبل Meta لأغراض الامتثال للتعليمات. يتم تشغيله بواسطة Groq باستخدام وحدة معالجة اللغة المخصصة (LPU) لتوفير استدلال سريع وفعال."
},
"meta/llama-3.1-405b-instruct": {
"description": "نموذج لغوي متقدم، يدعم توليد البيانات الاصطناعية، وتقطير المعرفة، والاستدلال، مناسب للدردشة، والبرمجة، والمهام الخاصة."
},
"meta/llama-3.1-70b": {
"description": "نسخة محدثة من Meta Llama 3 70B Instruct، تشمل طول سياق موسع 128K، ودعم متعدد اللغات، وقدرات استدلال محسنة."
},
"meta/llama-3.1-70b-instruct": {
"description": "يمكنه تمكين المحادثات المعقدة، ويتميز بفهم سياقي ممتاز، وقدرات استدلال، وقدرة على توليد النصوص."
},
"meta/llama-3.1-8b": {
"description": "Llama 3.1 8B يدعم نافذة سياق 128K، مما يجعله خيارًا مثاليًا لواجهات المحادثة الحية وتحليل البيانات، مع توفير توفير كبير في التكلفة مقارنة بالنماذج الأكبر. يتم تشغيله بواسطة Groq باستخدام وحدة معالجة اللغة المخصصة (LPU) لتوفير استدلال سريع وفعال."
},
"meta/llama-3.1-8b-instruct": {
"description": "نموذج متقدم من الطراز الأول، يتمتع بفهم اللغة، وقدرات استدلال ممتازة، وقدرة على توليد النصوص."
},
"meta/llama-3.2-11b": {
"description": "نموذج توليد استدلال الصور مضبوط بالتعليمات (نص + إدخال صورة / إخراج نص)، محسن للتعرف البصري، استدلال الصور، توليد العناوين، والإجابة على الأسئلة العامة المتعلقة بالصور."
},
"meta/llama-3.2-11b-vision-instruct": {
"description": "نموذج متقدم للرؤية واللغة، بارع في إجراء استدلال عالي الجودة من الصور."
},
"meta/llama-3.2-1b": {
"description": "نموذج نصي فقط، يدعم حالات الاستخدام على الجهاز مثل استرجاع المعرفة المحلية متعددة اللغات، التلخيص، وإعادة الصياغة."
},
"meta/llama-3.2-1b-instruct": {
"description": "نموذج لغوي صغير متقدم، يتمتع بفهم اللغة، وقدرات استدلال ممتازة، وقدرة على توليد النصوص."
},
"meta/llama-3.2-3b": {
"description": "نموذج نصي فقط، مضبوط بعناية لدعم حالات الاستخدام على الجهاز مثل استرجاع المعرفة المحلية متعددة اللغات، التلخيص، وإعادة الصياغة."
},
"meta/llama-3.2-3b-instruct": {
"description": "نموذج لغوي صغير متقدم، يتمتع بفهم اللغة، وقدرات استدلال ممتازة، وقدرة على توليد النصوص."
},
"meta/llama-3.2-90b": {
"description": "نموذج توليد استدلال الصور مضبوط بالتعليمات (نص + إدخال صورة / إخراج نص)، محسن للتعرف البصري، استدلال الصور، توليد العناوين، والإجابة على الأسئلة العامة المتعلقة بالصور."
},
"meta/llama-3.2-90b-vision-instruct": {
"description": "نموذج متقدم للرؤية واللغة، بارع في إجراء استدلال عالي الجودة من الصور."
},
"meta/llama-3.3-70b": {
"description": "مزيج مثالي من الأداء والكفاءة. يدعم النموذج ذكاءً اصطناعيًا حواريًا عالي الأداء، مصممًا لإنشاء المحتوى، التطبيقات المؤسسية، والبحث، ويقدم قدرات متقدمة في فهم اللغة تشمل التلخيص النصي، التصنيف، تحليل المشاعر، وتوليد الكود."
},
"meta/llama-3.3-70b-instruct": {
"description": "نموذج لغوي متقدم، بارع في الاستدلال، والرياضيات، والمعرفة العامة، واستدعاء الدوال."
},
"meta/llama-4-maverick": {
"description": "مجموعة نماذج Llama 4 هي نماذج ذكاء اصطناعي متعددة الوسائط أصلية تدعم النص والتجارب متعددة الوسائط. تستفيد هذه النماذج من بنية الخبراء المختلطة لتقديم أداء رائد في الصناعة في فهم النصوص والصور. Llama 4 Maverick، نموذج مكون من 17 مليار معلمة مع 128 خبيرًا. مقدم الخدمة DeepInfra."
},
"meta/llama-4-scout": {
"description": "مجموعة نماذج Llama 4 هي نماذج ذكاء اصطناعي متعددة الوسائط أصلية تدعم النص والتجارب متعددة الوسائط. تستفيد هذه النماذج من بنية الخبراء المختلطة لتقديم أداء رائد في الصناعة في فهم النصوص والصور. Llama 4 Scout، نموذج مكون من 17 مليار معلمة مع 16 خبيرًا. مقدم الخدمة DeepInfra."
},
"microsoft/Phi-3-medium-128k-instruct": {
"description": "نفس نموذج Phi-3-medium ولكن مع حجم سياق أكبر، مناسب لـ RAG أو القليل من التلميحات."
},
@@ -2102,6 +2255,48 @@
"mistral-small-latest": {
"description": "Mistral Small هو خيار فعال من حيث التكلفة وسريع وموثوق، مناسب لمهام الترجمة، والتلخيص، وتحليل المشاعر."
},
"mistral/codestral": {
"description": "Mistral Codestral 25.01 هو نموذج ترميز متقدم، مُحسّن للحالات التي تتطلب تأخيرًا منخفضًا وترددًا عاليًا. يتقن أكثر من 80 لغة برمجة، ويبرع في مهام الملء الوسيط (FIM)، تصحيح الكود، وتوليد الاختبارات."
},
"mistral/codestral-embed": {
"description": "نموذج تضمين الكود يمكن دمجه في قواعد بيانات ومستودعات الكود لدعم مساعدي الترميز."
},
"mistral/devstral-small": {
"description": "Devstral هو نموذج لغة كبير وكيل مخصص لمهام هندسة البرمجيات، مما يجعله خيارًا ممتازًا كوكلاء هندسة البرمجيات."
},
"mistral/magistral-medium": {
"description": "تفكير معقد مدعوم بفهم عميق، مع استدلال شفاف يمكنك متابعته والتحقق منه. يحافظ النموذج على استدلال عالي الدقة عبر لغات متعددة حتى عند التبديل بين اللغات أثناء المهمة."
},
"mistral/magistral-small": {
"description": "تفكير معقد مدعوم بفهم عميق، مع استدلال شفاف يمكنك متابعته والتحقق منه. يحافظ النموذج على استدلال عالي الدقة عبر لغات متعددة حتى عند التبديل بين اللغات أثناء المهمة."
},
"mistral/ministral-3b": {
"description": "نموذج مضغوط وفعال للمهام على الأجهزة مثل المساعدات الذكية والتحليل المحلي، يقدم أداء منخفض التأخير."
},
"mistral/ministral-8b": {
"description": "نموذج أقوى مع استدلال أسرع وأكثر كفاءة في الذاكرة، مثالي لسير العمل المعقد وتطبيقات الحافة ذات المتطلبات العالية."
},
"mistral/mistral-embed": {
"description": "نموذج تضمين نص عام للبحث الدلالي، التشابه، التجميع، وسير عمل RAG."
},
"mistral/mistral-large": {
"description": "Mistral Large هو الخيار المثالي للمهام المعقدة التي تتطلب قدرات استدلال كبيرة أو تخصص عالي مثل توليد النصوص المركبة، توليد الكود، RAG أو الوكالة."
},
"mistral/mistral-saba-24b": {
"description": "Mistral Saba 24B هو نموذج مفتوح المصدر مكون من 24 مليار معلمة طورته Mistral.ai. Saba هو نموذج متخصص مدرب لأداء متميز في اللغات العربية، الفارسية، الأردية، العبرية، واللغات الهندية. يتم تشغيله بواسطة Groq باستخدام وحدة معالجة اللغة المخصصة (LPU) لتوفير استدلال سريع وفعال."
},
"mistral/mistral-small": {
"description": "Mistral Small هو الخيار المثالي للمهام البسيطة التي يمكن تنفيذها دفعة واحدة مثل التصنيف، دعم العملاء، أو توليد النصوص. يقدم أداءً ممتازًا بسعر معقول."
},
"mistral/mixtral-8x22b-instruct": {
"description": "نموذج 8x22b Instruct. 8x22b هو نموذج مفتوح المصدر من خبراء مختلطين مقدم من Mistral."
},
"mistral/pixtral-12b": {
"description": "نموذج 12B مع قدرات فهم الصور بالإضافة إلى النص."
},
"mistral/pixtral-large": {
"description": "Pixtral Large هو النموذج الثاني في عائلة النماذج متعددة الوسائط لدينا، ويظهر مستوى متقدمًا في فهم الصور. بشكل خاص، يمكن للنموذج فهم المستندات، المخططات، والصور الطبيعية، مع الحفاظ على قدرات فهم النص الرائدة في Mistral Large 2."
},
"mistralai/Mistral-7B-Instruct-v0.1": {
"description": "Mistral (7B) Instruct معروف بأدائه العالي، مناسب لمهام لغوية متعددة."
},
@@ -2165,8 +2360,23 @@
"moonshotai/Kimi-K2-Instruct": {
"description": "Kimi K2 هو نموذج أساسي يعتمد على بنية MoE يتمتع بقدرات قوية في البرمجة والوكيل، يحتوي على 1 تريليون معلمة و32 مليار معلمة مفعلة. يتفوق نموذج K2 في اختبارات الأداء الأساسية في مجالات المعرفة العامة، البرمجة، الرياضيات والوكيل مقارنة بالنماذج المفتوحة المصدر الأخرى."
},
"moonshotai/kimi-k2-instruct": {
"description": "kimi-k2 هو نموذج أساسي مبني على بنية MoE يتمتع بقدرات فائقة في البرمجة والوكيل، مع إجمالي 1 تريليون معلمة و32 مليار معلمة مفعلة. في اختبارات الأداء المعيارية في مجالات المعرفة العامة، البرمجة، الرياضيات، والوكيل، يتفوق نموذج K2 على النماذج المفتوحة المصدر الرئيسية الأخرى."
"moonshotai/Kimi-K2-Instruct-0905": {
"description": "Kimi K2-Instruct-0905 هو أحدث وأقوى إصدار من Kimi K2. إنه نموذج لغوي من نوع الخبراء المختلطين (MoE) من الطراز الأول، يحتوي على تريليون معلمة إجمالية و32 مليار معلمة مفعلة. تشمل الميزات الرئيسية للنموذج: تعزيز ذكاء التكويد للوكيل، مع تحسينات ملحوظة في الأداء في اختبارات المعيار المفتوحة ومهام التكويد الواقعية للوكيل؛ تحسين تجربة التكويد في الواجهة الأمامية، مع تقدم في الجمالية والعملية في برمجة الواجهة الأمامية."
},
"moonshotai/kimi-k2": {
"description": "Kimi K2 هو نموذج لغة كبير مختلط الخبراء (MoE) ضخم طورته Moonshot AI، يحتوي على تريليون معلمة إجمالية و32 مليار معلمة نشطة في كل تمرير أمامي. مُحسّن لقدرات الوكيل، بما في ذلك استخدام الأدوات المتقدمة، الاستدلال، وتركيب الكود."
},
"moonshotai/kimi-k2-0905": {
"description": "نموذج kimi-k2-0905-preview يدعم طول سياق 256k، يتمتع بقدرات ترميز وكيل أقوى، وجمالية وعملية أفضل في الشيفرة الأمامية، وفهم سياق محسن."
},
"moonshotai/kimi-k2-instruct-0905": {
"description": "نموذج kimi-k2-0905-preview يدعم طول سياق 256k، يتمتع بقدرات ترميز وكيل أقوى، وجمالية وعملية أفضل في الشيفرة الأمامية، وفهم سياق محسن."
},
"morph/morph-v3-fast": {
"description": "Morph يقدم نموذج ذكاء اصطناعي مخصص يطبق تغييرات الكود المقترحة من نماذج متقدمة مثل Claude أو GPT-4o على ملفات الكود الحالية بسرعة فائقة - أكثر من 4500 رمز في الثانية. يعمل كخطوة نهائية في سير عمل الترميز بالذكاء الاصطناعي. يدعم 16k رمز إدخال و16k رمز إخراج."
},
"morph/morph-v3-large": {
"description": "Morph يقدم نموذج ذكاء اصطناعي مخصص يطبق تغييرات الكود المقترحة من نماذج متقدمة مثل Claude أو GPT-4o على ملفات الكود الحالية بسرعة - أكثر من 2500 رمز في الثانية. يعمل كخطوة نهائية في سير عمل الترميز بالذكاء الاصطناعي. يدعم 16k رمز إدخال و16k رمز إخراج."
},
"nousresearch/hermes-2-pro-llama-3-8b": {
"description": "Hermes 2 Pro Llama 3 8B هو إصدار مطور من Nous Hermes 2، ويحتوي على أحدث مجموعات البيانات المطورة داخليًا."
@@ -2195,6 +2405,9 @@
"o3": {
"description": "o3 هو نموذج قوي شامل، يظهر أداءً ممتازًا في مجالات متعددة. يضع معايير جديدة في المهام الرياضية، العلمية، البرمجية، واستدلال الرؤية. كما أنه بارع في الكتابة التقنية واتباع التعليمات. يمكن للمستخدمين استخدامه لتحليل النصوص، الأكواد، والصور، وحل المشكلات المعقدة متعددة الخطوات."
},
"o3-2025-04-16": {
"description": "o3 هو نموذج استدلال جديد من OpenAI، يدعم إدخال الصور والنصوص ويخرج نصًا، مناسب للمهام المعقدة التي تتطلب معرفة عامة واسعة."
},
"o3-deep-research": {
"description": "o3-deep-research هو نموذج البحث العميق الأكثر تقدمًا لدينا، مصمم خصيصًا للتعامل مع مهام البحث المعقدة متعددة الخطوات. يمكنه البحث وتجميع المعلومات من الإنترنت، كما يمكنه الوصول إلى بياناتك الخاصة واستخدامها من خلال موصل MCP."
},
@@ -2204,9 +2417,15 @@
"o3-pro": {
"description": "نموذج o3-pro يستخدم موارد حسابية أكبر للتفكير الأعمق وتقديم إجابات أفضل باستمرار، ويدعم الاستخدام فقط عبر واجهة برمجة التطبيقات Responses API."
},
"o3-pro-2025-06-10": {
"description": "o3 Pro هو نموذج استدلال جديد من OpenAI، يدعم إدخال الصور والنصوص ويخرج نصًا، مناسب للمهام المعقدة التي تتطلب معرفة عامة واسعة."
},
"o4-mini": {
"description": "o4-mini هو أحدث نموذج صغير من سلسلة o. تم تحسينه للاستدلال السريع والفعال، ويظهر كفاءة وأداء عاليين في المهام البرمجية والرؤية."
},
"o4-mini-2025-04-16": {
"description": "o4-mini هو نموذج استدلال من OpenAI، يدعم إدخال الصور والنصوص ويخرج نصًا، مناسب للمهام التي تتطلب معرفة عامة واسعة. يحتوي النموذج على سياق يصل إلى 200 ألف كلمة."
},
"o4-mini-deep-research": {
"description": "o4-mini-deep-research هو نموذج البحث العميق الأسرع والأكثر اقتصادية لدينا — مثالي للتعامل مع مهام البحث المعقدة متعددة الخطوات. يمكنه البحث وتجميع المعلومات من الإنترنت، كما يمكنه الوصول إلى بياناتك الخاصة واستخدامها من خلال موصل MCP."
},
@@ -2225,29 +2444,47 @@
"open-mixtral-8x7b": {
"description": "Mixtral 8x7B هو نموذج خبير نادر، يستخدم عدة معلمات لزيادة سرعة الاستدلال، مناسب لمعالجة المهام متعددة اللغات وتوليد الشيفرة."
},
"openai/gpt-3.5-turbo": {
"description": "أكثر نماذج GPT-3.5 كفاءة من حيث الأداء والتكلفة من OpenAI، مُحسّن للدردشة، لكنه يؤدي جيدًا أيضًا في مهام الإكمال التقليدية."
},
"openai/gpt-3.5-turbo-instruct": {
"description": "قدرات مشابهة لنماذج عصر GPT-3. متوافق مع نقاط نهاية الإكمال التقليدية بدلاً من نقاط نهاية إكمال الدردشة."
},
"openai/gpt-4-turbo": {
"description": "gpt-4-turbo من OpenAI يمتلك معرفة عامة واسعة وخبرة ميدانية، مما يمكنه من اتباع تعليمات اللغة الطبيعية المعقدة وحل المشكلات بدقة. تاريخ المعرفة حتى أبريل 2023، ونافذة سياق تصل إلى 128,000 رمز."
},
"openai/gpt-4.1": {
"description": "GPT-4.1 هو نموذجنا الرائد للمهام المعقدة. إنه مثالي لحل المشكلات عبر مجالات متعددة."
"description": "GPT 4.1 هو النموذج الرائد من OpenAI، مناسب للمهام المعقدة. مثالي لحل المشكلات متعددة المجالات."
},
"openai/gpt-4.1-mini": {
"description": "يوفر GPT-4.1 mini توازنًا بين الذكاء والسرعة والتكلفة، مما يجعله نموذجًا جذابًا للعديد من الاستخدامات."
"description": "GPT 4.1 mini يوازن بين الذكاء والسرعة والتكلفة، مما يجعله نموذجًا جذابًا للعديد من حالات الاستخدام."
},
"openai/gpt-4.1-nano": {
"description": "GPT-4.1 nano هو أسرع وأقل تكلفة من نماذج GPT-4.1."
"description": "GPT-4.1 nano هو أسرع وأكفأ نموذج GPT 4.1 من حيث التكلفة."
},
"openai/gpt-4o": {
"description": "ChatGPT-4o هو نموذج ديناميكي يتم تحديثه في الوقت الحقيقي للحفاظ على أحدث إصدار. يجمع بين فهم اللغة القوي وقدرة التوليد، مما يجعله مناسبًا لمجموعة واسعة من التطبيقات، بما في ذلك خدمة العملاء والتعليم والدعم الفني."
"description": "GPT-4o من OpenAI يمتلك معرفة عامة واسعة وخبرة ميدانية، قادر على اتباع تعليمات اللغة الطبيعية المعقدة وحل المشكلات بدقة. يقدم أداءً مماثلًا لـ GPT-4 Turbo عبر API أسرع وأرخص."
},
"openai/gpt-4o-mini": {
"description": "GPT-4o mini هو أحدث نموذج من OpenAI تم إطلاقه بعد GPT-4 Omni، ويدعم إدخال النصوص والصور وإخراج النصوص. كأحد نماذجهم المتقدمة الصغيرة، فهو أرخص بكثير من النماذج الرائدة الأخرى في الآونة الأخيرة، وأرخص بأكثر من 60% من GPT-3.5 Turbo. يحتفظ بذكاء متقدم مع قيمة ممتازة. حصل GPT-4o mini على 82% في اختبار MMLU، وهو حاليًا يتفوق على GPT-4 في تفضيلات الدردشة."
"description": "GPT-4o mini من OpenAI هو أصغر نموذج متقدم وأكثر كفاءة من حيث التكلفة. متعدد الوسائط (يقبل نصوصًا أو صورًا ويخرج نصًا)، وأكثر ذكاءً من gpt-3.5-turbo، مع سرعة مماثلة."
},
"openai/gpt-5": {
"description": "GPT-5 هو النموذج الرائد من OpenAI، يتفوق في الاستدلال المعقد، المعرفة الواقعية الواسعة، المهام المكثفة للكود، والوكالة متعددة الخطوات."
},
"openai/gpt-5-mini": {
"description": "GPT-5 mini هو نموذج محسّن من حيث التكلفة، يقدم أداءً ممتازًا في مهام الاستدلال والدردشة. يوفر توازنًا مثاليًا بين السرعة والتكلفة والقدرة."
},
"openai/gpt-5-nano": {
"description": "GPT-5 nano هو نموذج عالي الإنتاجية، يتفوق في المهام البسيطة مثل التعليمات أو التصنيف."
},
"openai/gpt-oss-120b": {
"description": "OpenAI GPT-OSS 120B هو نموذج لغوي رائد يحتوي على 120 مليار معلمة، مزود بميزات تصفح الإنترنت وتنفيذ الأكواد، ويتميز بقدرات استدلالية."
"description": "نموذج لغة كبير عام عالي الكفاءة، يتمتع بقدرات استدلال قوية وقابلة للتحكم."
},
"openai/gpt-oss-20b": {
"description": "OpenAI GPT-OSS 20B هو نموذج لغوي رائد يحتوي على 20 مليار معلمة، مزود بميزات تصفح الإنترنت وتنفيذ الأكواد، ويتميز بقدرات استدلالية."
"description": "نموذج لغة مضغوط مفتوح المصدر، مُحسّن للتأخير المنخفض والبيئات ذات الموارد المحدودة، بما في ذلك النشر المحلي وعلى الحافة."
},
"openai/o1": {
"description": "o1 هو نموذج الاستدلال الجديد من OpenAI، يدعم إدخال الصور والنصوص ويخرج نصًا، مناسب للمهام المعقدة التي تتطلب معرفة عامة واسعة. يتميز هذا النموذج بسياق يصل إلى 200 ألف كلمة وتاريخ معرفة حتى أكتوبر 2023."
"description": "o1 من OpenAI هو نموذج استدلال رائد، مصمم للمشكلات المعقدة التي تتطلب تفكيرًا عميقًا. يوفر قدرات استدلال قوية ودقة أعلى للمهام متعددة الخطوات."
},
"openai/o1-mini": {
"description": "o1-mini هو نموذج استدلال سريع وفعال من حيث التكلفة مصمم لتطبيقات البرمجة والرياضيات والعلوم. يحتوي هذا النموذج على 128K من السياق وتاريخ انتهاء المعرفة في أكتوبر 2023."
@@ -2256,23 +2493,44 @@
"description": "o1 هو نموذج استدلال جديد من OpenAI، مناسب للمهام المعقدة التي تتطلب معرفة عامة واسعة. يحتوي هذا النموذج على 128K من السياق وتاريخ انتهاء المعرفة في أكتوبر 2023."
},
"openai/o3": {
"description": "o3 هو نموذج قوي شامل، يظهر أداءً ممتازًا في مجالات متعددة. إنه يضع معيارًا جديدًا لمهام الرياضيات والعلوم والبرمجة والتفكير البصري. كما أنه بارع في الكتابة التقنية واتباع التعليمات. يمكن للمستخدمين الاستفادة منه في تحليل النصوص والرموز والصور، وحل المشكلات المعقدة متعددة الخطوات."
"description": "o3 من OpenAI هو أقوى نموذج استدلال، يضع معايير جديدة في الترميز، الرياضيات، العلوم، والإدراك البصري. يتفوق في الاستعلامات المعقدة التي تتطلب تحليلات متعددة الجوانب، وله ميزة خاصة في تحليل الصور، المخططات، والرسوم البيانية."
},
"openai/o3-mini": {
"description": "o3-mini يقدم ذكاءً عاليًا بنفس تكلفة وأهداف التأخير مثل o1-mini."
"description": "o3-mini هو أحدث نموذج استدلال صغير من OpenAI، يقدم ذكاءً عاليًا بنفس تكلفة وتأخير o1-mini."
},
"openai/o3-mini-high": {
"description": "o3-mini عالي المستوى من حيث الاستدلال، يقدم ذكاءً عاليًا بنفس تكلفة وأهداف التأخير مثل o1-mini."
},
"openai/o4-mini": {
"description": "o4-mini تم تحسينه للاستدلال السريع والفعال، ويظهر كفاءة وأداء عاليين في المهام البرمجية والرؤية."
"description": "o4-mini من OpenAI يقدم استدلالًا سريعًا وفعالًا من حيث التكلفة، مع أداء ممتاز بالنسبة لحجمه، خاصة في الرياضيات (الأفضل في اختبار AIME)، الترميز، والمهام البصرية."
},
"openai/o4-mini-high": {
"description": "o4-mini إصدار عالي من حيث مستوى الاستدلال، تم تحسينه للاستدلال السريع والفعال، ويظهر كفاءة وأداء عاليين في المهام البرمجية والرؤية."
},
"openai/text-embedding-3-large": {
"description": "أكثر نماذج التضمين كفاءة من OpenAI، مناسب للمهام الإنجليزية وغير الإنجليزية."
},
"openai/text-embedding-3-small": {
"description": "نسخة محسنة وأعلى أداء من نموذج تضمين ada من OpenAI."
},
"openai/text-embedding-ada-002": {
"description": "نموذج تضمين نصي تقليدي من OpenAI."
},
"openrouter/auto": {
"description": "استنادًا إلى طول السياق، والموضوع، والتعقيد، سيتم إرسال طلبك إلى Llama 3 70B Instruct، أو Claude 3.5 Sonnet (التعديل الذاتي) أو GPT-4o."
},
"perplexity/sonar": {
"description": "منتج خفيف الوزن من Perplexity مع قدرة البحث الموجه، أسرع وأرخص من Sonar Pro."
},
"perplexity/sonar-pro": {
"description": "المنتج الرائد من Perplexity مع قدرة البحث الموجه، يدعم الاستعلامات المتقدمة والمتابعات."
},
"perplexity/sonar-reasoning": {
"description": "نموذج يركز على الاستدلال، ينتج سلاسل تفكير (CoT) في الردود، ويقدم تفسيرات مفصلة مع بحث موجه."
},
"perplexity/sonar-reasoning-pro": {
"description": "نموذج استدلال متقدم يركز على إنتاج سلاسل تفكير (CoT) في الردود، مع قدرات بحث معززة واستعلامات بحث متعددة لكل طلب لتقديم تفسيرات شاملة."
},
"phi3": {
"description": "Phi-3 هو نموذج مفتوح خفيف الوزن أطلقته Microsoft، مناسب للتكامل الفعال واستدلال المعرفة على نطاق واسع."
},
@@ -2313,7 +2571,7 @@
"description": "Qwen-Image هي نموذج عام لتوليد الصور يدعم أنماطًا فنية متعددة، ويتميز بقدرته على عرض النصوص المعقدة، خصوصًا النصوص بالصينية والإنجليزية. يدعم النموذج تخطيطات متعددة الأسطر، وتوليد نص على مستوى الفقرات، وتمثيل التفاصيل الدقيقة، مما يتيح إنشاء تصميمات معقدة تمزج بين النص والصورة."
},
"qwen-image-edit": {
"description": "أصدر فريق Qwen نموذجًا احترافيًا لتحرير الصور يدعم التحرير الدلالي وتحرير المظهر، ويستطيع تحرير النصوص بالصينية والإنجليزية بدقة، وتحقيق تحويلات النمط وتدوير الكائنات، وغيرها من عمليات تحرير الصور عالية الجودة."
"description": "Qwen Image Edit هو نموذج تحويل الصور إلى صور، يدعم تحرير وتعديل الصور بناءً على الصورة المدخلة والتعليمات النصية، ويستطيع إجراء تعديلات دقيقة وتحويلات إبداعية على الصورة الأصلية وفقًا لاحتياجات المستخدم."
},
"qwen-long": {
"description": "نموذج Qwen العملاق للغة، يدعم سياقات نصية طويلة، بالإضافة إلى وظائف الحوار المستندة إلى الوثائق الطويلة والعديد من الوثائق."
@@ -2549,6 +2807,15 @@
"qwen3-coder-plus": {
"description": "نموذج كود Tongyi Qianwen. أحدث سلسلة نماذج Qwen3-Coder مبنية على Qwen3 لتوليد الأكواد، تتمتع بقدرات وكيل ترميز قوية، بارعة في استدعاء الأدوات والتفاعل مع البيئة، قادرة على البرمجة الذاتية، وتجمع بين مهارات برمجية ممتازة وقدرات عامة."
},
"qwen3-max-preview": {
"description": "نسخة المعاينة لنموذج Qwen 3 Max من سلسلة Tongyi Qianwen، مع تحسينات كبيرة في القدرات العامة مقارنة بسلسلة 2.5، بما في ذلك فهم النصوص العامة باللغتين الصينية والإنجليزية، الالتزام بالتعليمات المعقدة، المهام المفتوحة الذاتية، القدرات متعددة اللغات، واستدعاء الأدوات؛ مع تقليل الأوهام المعرفية للنموذج."
},
"qwen3-next-80b-a3b-instruct": {
"description": "نموذج مفتوح المصدر من الجيل الجديد لوضع عدم التفكير مبني على Qwen3، يتميز بفهم أفضل للنصوص الصينية مقارنة بالإصدار السابق (Tongyi Qianwen 3-235B-A22B-Instruct-2507)، مع تعزيز في قدرات الاستدلال المنطقي وأداء أفضل في مهام توليد النصوص."
},
"qwen3-next-80b-a3b-thinking": {
"description": "نموذج مفتوح المصدر من الجيل الجديد لوضع التفكير مبني على Qwen3، يتميز بتحسين في الالتزام بالتعليمات مقارنة بالإصدار السابق (Tongyi Qianwen 3-235B-A22B-Thinking-2507)، مع ردود ملخصة وأكثر إيجازًا من النموذج."
},
"qwq": {
"description": "QwQ هو نموذج بحث تجريبي يركز على تحسين قدرات الاستدلال للذكاء الاصطناعي."
},
@@ -2729,6 +2996,12 @@
"v0-1.5-md": {
"description": "نموذج v0-1.5-md مناسب للمهام اليومية وتوليد واجهات المستخدم (UI)"
},
"vercel/v0-1.0-md": {
"description": "الوصول إلى النموذج خلف v0 لتوليد، إصلاح، وتحسين تطبيقات الويب الحديثة، مع استدلال مخصص للأطر المعينة ومعرفة حديثة."
},
"vercel/v0-1.5-md": {
"description": "الوصول إلى النموذج خلف v0 لتوليد، إصلاح، وتحسين تطبيقات الويب الحديثة، مع استدلال مخصص للأطر المعينة ومعرفة حديثة."
},
"wan2.2-t2i-flash": {
"description": "نسخة Wanxiang 2.2 فائقة السرعة، أحدث نموذج حاليًا. تم تحسين الإبداع، الاستقرار، والواقعية بشكل شامل، مع سرعة توليد عالية وقيمة ممتازة مقابل التكلفة."
},
@@ -2759,6 +3032,27 @@
"x1": {
"description": "سيتم ترقية نموذج Spark X1 بشكل أكبر، حيث ستحقق المهام العامة مثل الاستدلال، وتوليد النصوص، وفهم اللغة نتائج تتماشى مع OpenAI o1 و DeepSeek R1."
},
"xai/grok-2": {
"description": "Grok 2 هو نموذج لغة متقدم بقدرات استدلال رائدة. يتميز بقدرات متقدمة في الدردشة، الترميز، والاستدلال، ويتفوق على Claude 3.5 Sonnet وGPT-4-Turbo في تصنيف LMSYS."
},
"xai/grok-2-vision": {
"description": "نموذج Grok 2 البصري يتفوق في المهام المعتمدة على الرؤية، ويقدم أداءً رائدًا في الاستدلال الرياضي البصري (MathVista) والأسئلة المعتمدة على الوثائق (DocVQA). قادر على معالجة معلومات بصرية متنوعة تشمل الوثائق، المخططات، الرسوم البيانية، لقطات الشاشة، والصور."
},
"xai/grok-3": {
"description": "النموذج الرائد من xAI، يتفوق في حالات الاستخدام المؤسسية مثل استخراج البيانات، الترميز، وتلخيص النصوص. يمتلك معرفة عميقة في مجالات المالية، الرعاية الصحية، القانون، والعلوم."
},
"xai/grok-3-fast": {
"description": "النموذج الرائد من xAI، يتفوق في حالات الاستخدام المؤسسية مثل استخراج البيانات، الترميز، وتلخيص النصوص. النسخة السريعة تقدم استجابات أسرع بكثير على بنية تحتية أسرع، مع تكلفة أعلى لكل رمز مخرج."
},
"xai/grok-3-mini": {
"description": "نموذج خفيف الوزن من xAI، يفكر قبل الاستجابة. مثالي للمهام البسيطة أو المنطقية التي لا تتطلب معرفة مجال عميقة. مسار التفكير الخام متاح."
},
"xai/grok-3-mini-fast": {
"description": "نموذج خفيف الوزن من xAI، يفكر قبل الاستجابة. مثالي للمهام البسيطة أو المنطقية التي لا تتطلب معرفة مجال عميقة. مسار التفكير الخام متاح. النسخة السريعة تقدم استجابات أسرع بكثير على بنية تحتية أسرع، مع تكلفة أعلى لكل رمز مخرج."
},
"xai/grok-4": {
"description": "أحدث وأعظم نموذج رائد من xAI، يقدم أداءً لا مثيل له في اللغة الطبيعية، الرياضيات، والاستدلال — الخيار المثالي متعدد الاستخدامات."
},
"yi-1.5-34b-chat": {
"description": "يي-1.5 هو إصدار مُحدّث من يي. تم تدريبه بشكل مُسبق باستخدام مكتبة بيانات عالية الجودة تحتوي على 500 مليار علامة (Token) على يي، وتم تحسينه أيضًا باستخدام 3 ملايين مثال متنوع للتدريب الدقيق."
},
@@ -2806,5 +3100,14 @@
},
"zai-org/GLM-4.5V": {
"description": "GLM-4.5V هو نموذج لغوي بصري (VLM) من الجيل الأحدث صدر عن Zhipu AI (智谱 AI). بُني النموذج على نموذج النص الرائد GLM-4.5-Air الذي يحتوي على 106B من المعاملات الإجمالية و12B من معاملات التنشيط، ويعتمد على بنية الخبراء المختلطين (MoE) بهدف تحقيق أداء متميز بتكلفة استدلال أقل. من الناحية التقنية، يواصل GLM-4.5V نهج GLM-4.1V-Thinking ويقدّم ابتكارات مثل ترميز المواقع الدوراني ثلاثي الأبعاد (3D-RoPE)، مما عزّز بشكل ملحوظ قدرته على إدراك واستنتاج العلاقات المكانية ثلاثية الأبعاد. وبفضل تحسينات في مراحل ما قبل التدريب، والتعديل بالإشراف، والتعلّم المعزّز، أصبح النموذج قادراً على معالجة محتوى بصري متنوّع مثل الصور والفيديوهات والمستندات الطويلة، وقد حقق مستوى متقدماً ضمن أفضل نماذج المصدر المفتوح في 41 معياراً متعدد الوسائط منشوراً. بالإضافة إلى ذلك، أضاف النموذج مفتاح \"وضع التفكير\" الذي يتيح للمستخدمين التبديل بين الاستجابة السريعة والاستدلال العميق بحرية لتوازن أفضل بين الكفاءة والفعالية."
},
"zai/glm-4.5": {
"description": "سلسلة نماذج GLM-4.5 هي نماذج أساسية مصممة خصيصًا للوكلاء. النموذج الرائد GLM-4.5 يدمج 355 مليار معلمة إجمالية (32 مليار نشطة)، موحدًا الاستدلال، الترميز، وقدرات الوكيل لتلبية متطلبات التطبيقات المعقدة. كنظام استدلال مختلط، يوفر وضعين تشغيليين."
},
"zai/glm-4.5-air": {
"description": "GLM-4.5 وGLM-4.5-Air هما أحدث نماذجنا الرائدة، مصممة كنماذج أساسية لتطبيقات الوكلاء. كلاهما يستخدم بنية الخبراء المختلطة (MoE). يحتوي GLM-4.5 على 355 مليار معلمة إجمالية و32 مليار معلمة نشطة في كل تمرير أمامي، بينما يتميز GLM-4.5-Air بتصميم مبسط مع 106 مليار معلمة إجمالية و12 مليار معلمة نشطة."
},
"zai/glm-4.5v": {
"description": "GLM-4.5V مبني على نموذج GLM-4.5-Air الأساسي، يرث التقنيات المثبتة من GLM-4.1V-Thinking، ويوسعها بفعالية من خلال بنية MoE القوية التي تضم 106 مليار معلمة."
}
}
+6
View File
@@ -38,6 +38,9 @@
"cohere": {
"description": "تقدم Cohere أحدث نماذج متعددة اللغات، وميزات بحث متقدمة، ومساحة عمل AI مصممة خصيصًا للشركات الحديثة - كل ذلك مدمج في منصة آمنة."
},
"cometapi": {
"description": "CometAPI هو منصة خدمات توفر واجهات متعددة لنماذج الذكاء الاصطناعي المتقدمة، تدعم OpenAI وAnthropic وGoogle والمزيد، مناسبة لمتطلبات التطوير والتطبيق المتنوعة. يمكن للمستخدمين اختيار النموذج والسعر الأمثل وفقًا لاحتياجاتهم، مما يعزز تجربة الذكاء الاصطناعي."
},
"deepseek": {
"description": "DeepSeek هي شركة تركز على أبحاث وتطبيقات تقنيات الذكاء الاصطناعي، حيث يجمع نموذجها الأحدث DeepSeek-V2.5 بين قدرات الحوار العامة ومعالجة الشيفرات، وقد حقق تحسينات ملحوظة في محاذاة تفضيلات البشر، ومهام الكتابة، واتباع التعليمات."
},
@@ -158,6 +161,9 @@
"v0": {
"description": "v0 هو مساعد برمجة تعاوني، كل ما عليك هو وصف أفكارك بلغة طبيعية، وسيقوم بإنشاء الشيفرة وواجهة المستخدم (UI) لمشروعك."
},
"vercelaigateway": {
"description": "بوابة Vercel AI توفر واجهة برمجة تطبيقات موحدة للوصول إلى أكثر من 100 نموذج، من خلال نقطة نهاية واحدة يمكن استخدامها مع نماذج مقدمي خدمات مثل OpenAI وAnthropic وGoogle وغيرها. تدعم إعداد الميزانية، مراقبة الاستخدام، موازنة تحميل الطلبات والتبديل التلقائي عند الفشل."
},
"vertexai": {
"description": "سلسلة جيميني من جوجل هي نماذج الذكاء الاصطناعي الأكثر تقدمًا وعمومية، تم تطويرها بواسطة جوجل ديب مايند، مصممة خصيصًا لتكون متعددة الوسائط، تدعم الفهم والمعالجة السلسة للنصوص، الأكواد، الصور، الصوتيات، والفيديو. تناسب مجموعة متنوعة من البيئات، من مراكز البيانات إلى الأجهزة المحمولة، مما يعزز بشكل كبير كفاءة نماذج الذكاء الاصطناعي وتطبيقاتها الواسعة."
},
+10 -3
View File
@@ -70,12 +70,15 @@
"input": {
"addAi": "Добави AI съобщение",
"addUser": "Добави потребителско съобщение",
"disclaimer": "Изкуственият интелект също може да греши, моля проверете важната информация",
"errorMsg": "Неуспешно изпращане на съобщението, моля, проверете мрежата и опитайте отново: {{errorMsg}}",
"more": "още",
"send": "Изпрати",
"sendWithCmdEnter": "Натисни {{meta}} + Enter за да изпратиш",
"sendWithEnter": "Натисни Enter за да изпратиш",
"sendWithCmdEnter": "Натиснете <key/> за изпращане",
"sendWithEnter": "Натиснете <key/> за изпращане",
"stop": "Спри",
"warp": "Нов ред"
"warp": "Нов ред",
"warpWithKey": "Натиснете <key/> за нов ред"
},
"intentUnderstanding": {
"title": "Разбирам и анализирам вашето намерение..."
@@ -232,6 +235,10 @@
"threadMessageCount": "{{messageCount}} съобщения",
"title": "Подтема"
},
"toggleWideScreen": {
"off": "Изключване на широк екран",
"on": "Включване на широк екран"
},
"tokenDetails": {
"chats": "Чат съобщения",
"historySummary": "Историческо резюме",
+62
View File
@@ -0,0 +1,62 @@
{
"actions": {
"expand": {
"off": "Сгъни",
"on": "Разгъни"
},
"typobar": {
"off": "Скрий лентата за форматиране",
"on": "Покажи лентата за форматиране"
}
},
"cancel": "Отказ",
"confirm": "Потвърждение",
"file": {
"error": "Грешка: {{message}}",
"uploading": "Качване на файл..."
},
"image": {
"broken": "Изображението е повредено"
},
"link": {
"edit": "Редактирай връзката",
"open": "Отвори връзката",
"placeholder": "Въведете URL адрес на връзката",
"unlink": "Премахни връзката"
},
"math": {
"placeholder": "Моля, въведете TeX формула"
},
"slash": {
"h1": "Заглавие ниво 1",
"h2": "Заглавие ниво 2",
"h3": "Заглавие ниво 3",
"hr": "Разделителна линия",
"table": "Таблица",
"tex": "TeX формула"
},
"table": {
"delete": "Премахни таблицата",
"deleteColumn": "Премахни колоната",
"deleteRow": "Премахни реда",
"insertColumnLeft": "Вмъкни {{count}} колони отляво",
"insertColumnRight": "Вмъкни {{count}} колони отдясно",
"insertRowAbove": "Вмъкни {{count}} реда отгоре",
"insertRowBelow": "Вмъкни {{count}} реда отдолу"
},
"typobar": {
"blockquote": "Цитат",
"bold": "Удебели",
"bulletList": "Маркиран списък",
"code": "Код в реда",
"codeblock": "Блок с код",
"italic": "Курсив",
"link": "Връзка",
"numberList": "Номериран списък",
"strikethrough": "Зачеркване",
"table": "таблица",
"taskList": "Списък със задачи",
"tex": "TeX формула",
"underline": "Подчертаване"
}
}
+3
View File
@@ -5,6 +5,9 @@
"lock": "Заключване на съотношението на страните",
"unlock": "Отключване на съотношението на страните"
},
"cfg": {
"label": "Интензитет на насочване"
},
"header": {
"desc": "Кратко описание, създавайте веднага",
"title": "Рисуване"
+355 -52
View File
@@ -53,6 +53,9 @@
"Baichuan4-Turbo": {
"description": "Моделът е лидер в страната по способности, надминавайки чуждестранните основни модели в задачи на китайски език, като знания, дълги текстове и генериране на творби. Също така притежава водещи в индустрията мултимодални способности и отлични резултати в множество авторитетни оценки."
},
"ByteDance-Seed/Seed-OSS-36B-Instruct": {
"description": "Seed-OSS е серия от отворени големи езикови модели, разработени от екипа Seed на ByteDance, специално проектирани за мощна обработка на дълъг контекст, разсъждения, агенти и универсални способности. Seed-OSS-36B-Instruct в тази серия е модел с 36 милиарда параметри, фино настроен за инструкции, който поддържа естествено изключително дълъг контекст, позволявайки му да обработва големи документи или сложни кодови бази наведнъж. Моделът е специално оптимизиран за разсъждения, генериране на код и задачи с агенти (като използване на инструменти), като същевременно поддържа балансирани и отлични универсални способности. Една от ключовите характеристики на този модел е функцията „Бюджет за мислене“ (Thinking Budget), която позволява на потребителите гъвкаво да регулират дължината на разсъжденията според нуждите, което ефективно повишава ефективността при реални приложения."
},
"DeepSeek-R1": {
"description": "Най-напредналият ефективен LLM, специализиран в разсъждения, математика и програмиране."
},
@@ -81,7 +84,13 @@
"description": "Доставчик на модела: платформа sophnet. DeepSeek V3 Fast е високоскоростната версия с висока TPS на DeepSeek V3 0324, с пълна точност без квантизация, с по-силни кодови и математически възможности и по-бърз отговор!"
},
"DeepSeek-V3.1": {
"description": "DeepSeek-V3.1 е новият хибриден модел за разсъждение на DeepSeek, който поддържа два режима на разсъждение: мислене и немислене, с по-висока ефективност на мислене в сравнение с DeepSeek-R1-0528. След оптимизация чрез пост-тренировка, използването на агентски инструменти и изпълнението на задачи от интелигентни агенти са значително подобрени."
"description": "DeepSeek-V3.1 - режим без мислене; DeepSeek-V3.1 е нов хибриден модел за разсъждения, пуснат от DeepSeek, който поддържа два режима на разсъждения - с и без мислене, с по-висока ефективност на мислене в сравнение с DeepSeek-R1-0528. След оптимизация след обучение, използването на инструменти от агенти и изпълнението на задачи с агенти са значително подобрени."
},
"DeepSeek-V3.1-Fast": {
"description": "DeepSeek V3.1 Fast е високопроизводителната версия с висока TPS на DeepSeek V3.1. Хибриден режим на мислене: чрез промяна на шаблона за чат, един модел може да поддържа едновременно режим с мислене и без мислене. По-интелигентно извикване на инструменти: чрез оптимизация след обучение, представянето на модела при използване на инструменти и задачи с агенти е значително подобрено."
},
"DeepSeek-V3.1-Think": {
"description": "DeepSeek-V3.1 - режим с мислене; DeepSeek-V3.1 е нов хибриден модел за разсъждения, пуснат от DeepSeek, който поддържа два режима на разсъждения - с и без мислене, с по-висока ефективност на мислене в сравнение с DeepSeek-R1-0528. След оптимизация след обучение, използването на инструменти от агенти и изпълнението на задачи с агенти са значително подобрени."
},
"Doubao-lite-128k": {
"description": "Doubao-lite предлага изключително бърза реакция и по-добро съотношение цена-качество, осигурявайки по-гъвкави опции за различни сценарии на клиентите. Поддържа разсъждения и финна настройка с контекстен прозорец от 128k."
@@ -281,6 +290,9 @@
"Pro/moonshotai/Kimi-K2-Instruct": {
"description": "Kimi K2 е базов модел с MoE архитектура с изключителни кодови и агентски способности, с общо 1 трилион параметри и 32 милиарда активирани параметри. В бенчмаркове за общо знание, програмиране, математика и агентски задачи моделът K2 превъзхожда други водещи отворени модели."
},
"Pro/moonshotai/Kimi-K2-Instruct-0905": {
"description": "Kimi K2-Instruct-0905 е най-новата и най-мощна версия на Kimi K2. Това е водещ езиков модел с хибридна експертна архитектура (MoE), с общо 1 трилион параметри и 32 милиарда активни параметри. Основните характеристики на модела включват: подобрена интелигентност при кодиране на агенти, с изразително подобрение в производителността при публични бенчмаркове и реални задачи за кодиране на агенти; усъвършенстван опит при фронтенд кодиране, с напредък както в естетиката, така и в практичността на фронтенд програмирането."
},
"QwQ-32B-Preview": {
"description": "QwQ-32B-Preview е иновативен модел за обработка на естествен език, способен да обработва ефективно сложни задачи за генериране на диалог и разбиране на контекста."
},
@@ -590,6 +602,33 @@
"ai21-labs/AI21-Jamba-1.5-Mini": {
"description": "Многоезичен модел с 52 милиарда параметри (12 милиарда активни), предлагащ прозорец за дълъг контекст от 256K, извикване на функции, структурирани изходи и генериране, базирано на факти."
},
"alibaba/qwen-3-14b": {
"description": "Qwen3 е най-новото поколение голям езиков модел от серията Qwen, предлагащ цялостен набор от плътни и смесени експертни (MoE) модели. Изграден върху обширно обучение, Qwen3 постига пробиви в разсъжденията, следването на инструкции, агентските способности и многоезичната поддръжка."
},
"alibaba/qwen-3-235b": {
"description": "Qwen3 е най-новото поколение голям езиков модел от серията Qwen, предлагащ цялостен набор от плътни и смесени експертни (MoE) модели. Изграден върху обширно обучение, Qwen3 постига пробиви в разсъжденията, следването на инструкции, агентските способности и многоезичната поддръжка."
},
"alibaba/qwen-3-30b": {
"description": "Qwen3 е най-новото поколение голям езиков модел от серията Qwen, предлагащ цялостен набор от плътни и смесени експертни (MoE) модели. Изграден върху обширно обучение, Qwen3 постига пробиви в разсъжденията, следването на инструкции, агентските способности и многоезичната поддръжка."
},
"alibaba/qwen-3-32b": {
"description": "Qwen3 е най-новото поколение голям езиков модел от серията Qwen, предлагащ цялостен набор от плътни и смесени експертни (MoE) модели. Изграден върху обширно обучение, Qwen3 постига пробиви в разсъжденията, следването на инструкции, агентските способности и многоезичната поддръжка."
},
"alibaba/qwen3-coder": {
"description": "Qwen3-Coder-480B-A35B-Instruct е най-агентският кодов модел на Qwen, с изключителна производителност в агентско кодиране, използване на агентски браузър и други основни кодови задачи, постигащ резултати, сравними с Claude Sonnet."
},
"amazon/nova-lite": {
"description": "Много евтин мултимодален модел, който обработва изображения, видео и текст с изключително висока скорост."
},
"amazon/nova-micro": {
"description": "Модел само за текст, който осигурява най-ниска латентност на отговор при много ниска цена."
},
"amazon/nova-pro": {
"description": "Много способен мултимодален модел с оптимално съчетание на точност, скорост и цена, подходящ за широк спектър от задачи."
},
"amazon/titan-embed-text-v2": {
"description": "Amazon Titan Text Embeddings V2 е лек и ефективен многоезичен модел за вграждане, поддържащ размерности 1024, 512 и 256."
},
"anthropic.claude-3-5-sonnet-20240620-v1:0": {
"description": "Claude 3.5 Sonnet повишава индустриалните стандарти, с производителност, надвишаваща конкурентните модели и Claude 3 Opus, с отлични резултати в широки оценки, като същевременно предлага скорост и разходи на нашите модели от средно ниво."
},
@@ -615,25 +654,28 @@
"description": "Актуализирана версия на Claude 2, с двойно по-голям контекстуален прозорец и подобрения в надеждността, процента на халюцинации и точността, основана на доказателства, в контексти с дълги документи и RAG."
},
"anthropic/claude-3-haiku": {
"description": "Claude 3 Haiku е най-бързият и компактен модел на Anthropic, проектиран за почти мигновени отговори. Той предлага бърза и точна насочена производителност."
"description": "Claude 3 Haiku е най-бързият модел на Anthropic досега, проектиран за корпоративни натоварвания с обикновено дълги подсказки. Haiku може бързо да анализира големи обеми документи като тримесечни отчети, договори или правни дела, като разходите са наполовина в сравнение с други модели от същия клас."
},
"anthropic/claude-3-opus": {
"description": "Claude 3 Opus е най-мощният модел на Anthropic, предназначен за обработка на изключително сложни задачи. Той се отличава с изключителна производителност, интелигентност, гладкост и разбиране."
"description": "Claude 3 Opus е най-интелигентният модел на Anthropic с водещи на пазара резултати при изключително сложни задачи. Той се справя с отворени подсказки и непознати сценарии с изключителна плавност и човешко разбиране."
},
"anthropic/claude-3.5-haiku": {
"description": "Claude 3.5 Haiku е най-бързият следващ модел на Anthropic. В сравнение с Claude 3 Haiku, Claude 3.5 Haiku показва подобрения в различни умения и надминава предишното поколение най-голям модел Claude 3 Opus в много интелектуални бенчмаркове."
"description": "Claude 3.5 Haiku е следващото поколение на нашия най-бърз модел. Със скорост, подобна на Claude 3 Haiku, той подобрява всяка компетентност и надминава предишния ни най-голям модел Claude 3 Opus в много интелигентни бенчмаркове."
},
"anthropic/claude-3.5-sonnet": {
"description": "Claude 3.5 Sonnet предлага способности, надхвърлящи Opus, и по-бърза скорост в сравнение с Sonnet, като същевременно запазва същата цена. Sonnet е особено силен в програмирането, науката за данни, визуалната обработка и агентските задачи."
"description": "Claude 3.5 Sonnet постига идеален баланс между интелигентност и скорост — особено за корпоративни натоварвания. Той предлага мощна производителност на по-ниска цена в сравнение с конкурентите и е проектиран за висока издръжливост при мащабни AI внедрявания."
},
"anthropic/claude-3.7-sonnet": {
"description": "Claude 3.7 Sonnet е най-интелигентният модел на Anthropic до момента и е първият хибриден модел за разсъждение на пазара. Claude 3.7 Sonnet може да генерира почти мигновени отговори или удължено стъпково мислене, което позволява на потребителите ясно да видят тези процеси. Sonnet е особено добър в програмирането, науката за данни, визуалната обработка и агентските задачи."
"description": "Claude 3.7 Sonnet е първият хибриден разсъдъчен модел и най-интелигентният модел на Anthropic досега. Той предлага водещи резултати в кодиране, генериране на съдържание, анализ на данни и планиране, изграждайки се върху софтуерните инженерни и компютърни умения на предшественика си Claude 3.5 Sonnet."
},
"anthropic/claude-opus-4": {
"description": "Claude Opus 4 е най-мощният модел на Anthropic за справяне с изключително сложни задачи. Той се отличава с изключителна производителност, интелигентност, плавност и разбиране."
"description": "Claude Opus 4 е най-мощният модел на Anthropic досега и най-добрият кодов модел в света, водещ в SWE-bench (72.5%) и Terminal-bench (43.2%). Той осигурява устойчива производителност за дългосрочни задачи, изискващи фокус и хиляди стъпки, като може да работи непрекъснато часове — значително разширявайки възможностите на AI агентите."
},
"anthropic/claude-opus-4.1": {
"description": "Claude Opus 4.1 е plug-and-play алтернатива на Opus 4, осигуряваща изключителна производителност и точност за реални кодови и агентски задачи. Opus 4.1 повишава водещата кодова производителност до 74.5% в SWE-bench Verified и обработва сложни многостъпкови проблеми с по-голяма прецизност и внимание към детайлите."
},
"anthropic/claude-sonnet-4": {
"description": "Claude Sonnet 4 може да генерира почти мигновени отговори или удължено стъпково мислене, което потребителите могат ясно да проследят. Потребителите на API също така имат прецизен контрол върху времето за мислене на модела."
"description": "Claude Sonnet 4 значително подобрява водещите в индустрията възможности на Sonnet 3.7, с отлични резултати в кодиране и постига водещи 72.7% в SWE-bench. Моделът балансира производителност и ефективност, подходящ е за вътрешни и външни случаи и предлага по-голям контрол чрез подобрена управляемост."
},
"ascend-tribe/pangu-pro-moe": {
"description": "Pangu-Pro-MoE 72B-A16B е голям езиков модел с 72 милиарда параметри и 16 милиарда активирани параметри, базиран на архитектурата с групирани смесени експерти (MoGE). Той групира експертите по време на избора им и ограничава активацията на токените да активират равен брой експерти във всяка група, което осигурява балансирано натоварване на експертите и значително подобрява ефективността на разгръщане на модела на платформата Ascend."
@@ -689,6 +731,9 @@
"claude-3-5-haiku-20241022": {
"description": "Claude 3.5 Haiku е най-бързият следващ модел на Anthropic. В сравнение с Claude 3 Haiku, Claude 3.5 Haiku е подобрен във всички умения и надминава предишния най-голям модел Claude 3 Opus в много интелектуални тестове."
},
"claude-3-5-haiku-latest": {
"description": "Claude 3.5 Haiku предлага бързи отговори, подходящи за леки задачи."
},
"claude-3-5-sonnet-20240620": {
"description": "Claude 3.5 Sonnet предлага способности, надминаващи Opus и по-бърза скорост от Sonnet, като същевременно поддържа същата цена. Sonnet е особено силен в програмирането, науката за данни, визуалната обработка и задачи с агенти."
},
@@ -698,6 +743,9 @@
"claude-3-7-sonnet-20250219": {
"description": "Claude 3.7 Sonnet предлага индустриални стандарти, с производителност, надвишаваща конкурентните модели и Claude 3 Opus, с отлични резултати в широки оценки, като същевременно предлага скорост и разходи, характерни за нашите модели от среден клас."
},
"claude-3-7-sonnet-latest": {
"description": "Claude 3.7 Sonnet е най-мощният модел на Anthropic за обработка на изключително сложни задачи. Той се отличава с изключителна производителност, интелигентност, плавност и разбиране."
},
"claude-3-haiku-20240307": {
"description": "Claude 3 Haiku е най-бързият и компактен модел на Anthropic, проектиран за почти мигновени отговори. Той предлага бърза и точна насочена производителност."
},
@@ -710,11 +758,17 @@
"claude-opus-4-1-20250805": {
"description": "Claude Opus 4.1 е най-новият и най-мощен модел на Anthropic за справяне с изключително сложни задачи. Той се отличава с изключителна производителност, интелигентност, плавност и разбиране."
},
"claude-opus-4-1-20250805-thinking": {
"description": "Claude Opus 4.1 мисловен модел, който може да демонстрира своя процес на разсъждение в усъвършенствана версия."
},
"claude-opus-4-20250514": {
"description": "Claude Opus 4 е най-мощният модел на Anthropic, предназначен за обработка на изключително сложни задачи. Той се отличава с изключителна производителност, интелигентност, плавност и разбиране."
},
"claude-sonnet-4-20250514": {
"description": "Claude 4 Sonnet може да генерира почти мигновени отговори или удължено постепенно мислене, като потребителите могат ясно да видят тези процеси. Потребителите на API също могат да упражняват прецизен контрол върху времето за мислене на модела."
"description": "Claude Sonnet 4 може да генерира почти мигновени отговори или удължено стъпково мислене, като потребителите могат ясно да проследят тези процеси."
},
"claude-sonnet-4-20250514-thinking": {
"description": "Claude Sonnet 4 мисловен модел може да генерира почти мигновени отговори или удължено стъпково мислене, като потребителите могат ясно да проследят тези процеси."
},
"codegeex-4": {
"description": "CodeGeeX-4 е мощен AI помощник за програмиране, който поддържа интелигентни въпроси и отговори и автоматично допълване на код за различни програмни езици, повишавайки ефективността на разработката."
@@ -773,6 +827,18 @@
"cohere/Cohere-command-r-plus": {
"description": "Command R+ е усъвършенстван оптимизиран модел за RAG, предназначен да се справя с натоварвания на корпоративно ниво."
},
"cohere/command-a": {
"description": "Command A е най-мощният модел на Cohere досега, с отлични резултати в използване на инструменти, агенти, генериране с подобрено извличане (RAG) и многоезични случаи. Command A поддържа контекст с дължина 256K и работи с два GPU, като осигурява 150% по-висок пропускателен капацитет спрямо Command R+ 08-2024."
},
"cohere/command-r": {
"description": "Command R е голям езиков модел, оптимизиран за диалогови взаимодействия и задачи с дълъг контекст. Той е позициониран като модел от категорията „разширяем“, балансирайки висока производителност и точност, позволявайки на компаниите да преминат от концептуални доказателства към продукция."
},
"cohere/command-r-plus": {
"description": "Command R+ е най-новият голям езиков модел на Cohere, оптимизиран за диалогови взаимодействия и задачи с дълъг контекст. Целта му е да бъде изключително мощен, позволявайки на компаниите да преминат от концептуални доказателства към продукция."
},
"cohere/embed-v4.0": {
"description": "Модел, който позволява класифициране на текст, изображения или смесено съдържание или преобразуването им във вграждания."
},
"command": {
"description": "Диалогов модел, следващ инструкции, който показва високо качество и надеждност в езиковите задачи, с по-дълга контекстна дължина в сравнение с нашия основен генеративен модел."
},
@@ -809,12 +875,6 @@
"command-r7b-12-2024": {
"description": "command-r7b-12-2024 е малка и ефективна актуализирана версия, пусната през декември 2024 г. Тя показва отлични резултати в задачи, изискващи сложни разсъждения и многократна обработка, като RAG, използване на инструменти и агенти."
},
"compound-beta": {
"description": "Compound-beta е композитна AI система, подкрепена от множество отворени модели, налични в GroqCloud, която интелигентно и селективно използва инструменти за отговор на запитвания на потребителите."
},
"compound-beta-mini": {
"description": "Compound-beta-mini е композитна AI система, подкрепена от публично достъпни модели в GroqCloud, която интелигентно и селективно използва инструменти за отговор на запитвания на потребителите."
},
"computer-use-preview": {
"description": "Моделът computer-use-preview е специално разработен за „инструменти за използване на компютър“, обучен да разбира и изпълнява задачи, свързани с компютри."
},
@@ -957,7 +1017,7 @@
"description": "DeepSeek-V3.1 е голям хибриден модел за разсъждение, който поддържа 128K дълъг контекст и ефективно превключване на режими, постигащ изключителна производителност и скорост при използване на инструменти, генериране на код и сложни задачи за разсъждение."
},
"deepseek/deepseek-r1": {
"description": "DeepSeek-R1 значително подобри способността на модела за разсъждение при наличието на много малко маркирани данни. Преди да предостави окончателния отговор, моделът първо ще изведе част от съдържанието на веригата на мислене, за да повиши точността на окончателния отговор."
"description": "DeepSeek R1 моделът е получил малка версия ъпгрейд, текущата версия е DeepSeek-R1-0528. В последната актуализация DeepSeek R1 значително подобри дълбочината и способността за разсъждение чрез използване на увеличени изчислителни ресурси и въвеждане на алгоритмични оптимизации след обучението. Моделът постига отлични резултати в множество бенчмаркове като математика, програмиране и обща логика, като общата му производителност вече се доближава до водещи модели като O3 и Gemini 2.5 Pro."
},
"deepseek/deepseek-r1-0528": {
"description": "DeepSeek-R1 значително подобрява способността за разсъждение на модела дори с много малко анотирани данни. Преди да изведе окончателния отговор, моделът първо генерира мисловна верига, за да повиши точността на крайния отговор."
@@ -966,7 +1026,7 @@
"description": "DeepSeek-R1 значително подобрява способността за разсъждение на модела дори с много малко анотирани данни. Преди да изведе окончателния отговор, моделът първо генерира мисловна верига, за да повиши точността на крайния отговор."
},
"deepseek/deepseek-r1-distill-llama-70b": {
"description": "DeepSeek R1 Distill Llama 70B е голям езиков модел, базиран на Llama3.3 70B, който използва фина настройка на изхода на DeepSeek R1, за да постигне конкурентна производителност, сравнима с големите водещи модели."
"description": "DeepSeek-R1-Distill-Llama-70B е дистилиран и по-ефективен вариант на 70B Llama модела. Той запазва силна производителност при генериране на текст, намалявайки изчислителните разходи за по-лесно внедряване и изследване. Обслужва се от Groq с помощта на техния персонализиран хардуер за езикова обработка (LPU), осигурявайки бързо и ефективно разсъждение."
},
"deepseek/deepseek-r1-distill-llama-8b": {
"description": "DeepSeek R1 Distill Llama 8B е дестилиран голям езиков модел, базиран на Llama-3.1-8B-Instruct, обучен с изхода на DeepSeek R1."
@@ -984,7 +1044,10 @@
"description": "DeepSeek-R1 значително подобри способността на модела за разсъждение при наличието на много малко маркирани данни. Преди да предостави окончателния отговор, моделът първо ще изведе част от съдържанието на веригата на мислене, за да повиши точността на окончателния отговор."
},
"deepseek/deepseek-v3": {
"description": "DeepSeek-V3 постига значителен напредък в скоростта на извеждане в сравнение с предишните модели. Той е на първо място сред отворените модели и може да се сравнява с най-съвременните затворени модели в света. DeepSeek-V3 използва архитектури с многоглаво внимание (MLA) и DeepSeekMoE, които бяха напълно валидирани в DeepSeek-V2. Освен това, DeepSeek-V3 въвежда помощна беззагубна стратегия за баланс на натоварването и задава цели за обучение с множество етикети, за да постигне по-силна производителност."
"description": "Бърз универсален голям езиков модел с подобрени способности за разсъждение."
},
"deepseek/deepseek-v3.1-base": {
"description": "DeepSeek V3.1 Base е подобрена версия на DeepSeek V3 модела."
},
"deepseek/deepseek-v3/community": {
"description": "DeepSeek-V3 постига значителен напредък в скоростта на извеждане в сравнение с предишните модели. Той е на първо място сред отворените модели и може да се сравнява с най-съвременните затворени модели в света. DeepSeek-V3 използва архитектури с многоглаво внимание (MLA) и DeepSeekMoE, които бяха напълно валидирани в DeepSeek-V2. Освен това, DeepSeek-V3 въвежда помощна беззагубна стратегия за баланс на натоварването и задава цели за обучение с множество етикети, за да постигне по-силна производителност."
@@ -1055,8 +1118,17 @@
"doubao-seed-1.6-thinking": {
"description": "Doubao-Seed-1.6-thinking моделът значително подобрява способностите за мислене в сравнение с Doubao-1.5-thinking-pro, с допълнителни подобрения в кодиране, математика и логическо разсъждение, като поддържа и визуално разбиране. Поддържа контекстен прозорец от 256k и максимална дължина на изхода до 16k токена."
},
"doubao-seed-1.6-vision": {
"description": "Doubao-Seed-1.6-vision е визуален модел за дълбоко мислене, който демонстрира по-силни универсални мултимодални разбирания и способности за разсъждение в сценарии като образование, преглед на изображения, инспекции и сигурност, както и AI търсене и отговори. Поддържа контекстен прозорец от 256k и максимална дължина на изхода до 64k токена."
},
"doubao-seededit-3-0-i2i-250628": {
"description": "Моделът за генериране на изображения Doubao е разработен от екипа Seed на ByteDance, поддържа вход от текст и изображения, предоставя висококонтролирано и качествено генериране на изображения. Поддържа редактиране на изображения чрез текстови команди, с размери на изображението от 512 до 1536 пиксела."
},
"doubao-seedream-3-0-t2i-250415": {
"description": "Моделът за генериране на изображения Doubao е разработен от екипа Seed на ByteDance, поддържа вход както от текст, така и от изображения, и предлага високо контролирано и качествено генериране на изображения. Генерира изображения въз основа на текстови подсказки."
"description": "Seedream 3.0 е модел за генериране на изображения, разработен от екипа Seed на ByteDance, поддържа вход от текст и изображения, предоставя висококонтролирано и качествено генериране на изображения. Генерира изображения на базата на текстови подсказки."
},
"doubao-seedream-4-0-250828": {
"description": "Seedream 4.0 е модел за генериране на изображения, разработен от екипа Seed на ByteDance, поддържа вход от текст и изображения, предоставя висококонтролирано и качествено генериране на изображения. Генерира изображения на базата на текстови подсказки."
},
"doubao-vision-lite-32k": {
"description": "Моделът Doubao-vision е мултимодален голям модел, разработен от Doubao, с мощни способности за разбиране и разсъждение върху изображения, както и прецизно разбиране на инструкции. Моделът показва силна производителност при извличане на информация от изображения и текст, както и при задачи за разсъждение, базирани на изображения, подходящ за по-сложни и широки визуални въпроси."
@@ -1139,6 +1211,33 @@
"ernie-x1-turbo-32k": {
"description": "В сравнение с ERNIE-X1-32K, моделът предлага по-добри резултати и производителност."
},
"fal-ai/bytedance/seedream/v4": {
"description": "Seedream 4.0 е модел за генериране на изображения, разработен от екипа Seed на ByteDance, поддържа вход от текст и изображения, предоставя висококонтролирано и качествено генериране на изображения. Генерира изображения на базата на текстови подсказки."
},
"fal-ai/flux-kontext/dev": {
"description": "FLUX.1 модел, фокусиран върху задачи за редактиране на изображения, поддържа вход от текст и изображения."
},
"fal-ai/flux-pro/kontext": {
"description": "FLUX.1 Kontext [pro] може да обработва текст и референтни изображения като вход, осигурявайки безпроблемно целенасочено локално редактиране и сложни трансформации на цялостни сцени."
},
"fal-ai/flux/krea": {
"description": "Flux Krea [dev] е модел за генериране на изображения с естетически предпочитания, целящ да създава по-реалистични и естествени изображения."
},
"fal-ai/flux/schnell": {
"description": "FLUX.1 [schnell] е модел за генериране на изображения с 12 милиарда параметри, фокусиран върху бързото създаване на висококачествени изображения."
},
"fal-ai/imagen4/preview": {
"description": "Висококачествен модел за генериране на изображения, предоставен от Google."
},
"fal-ai/nano-banana": {
"description": "Nano Banana е най-новият, най-бързият и най-ефективен роден мултимодален модел на Google, който ви позволява да генерирате и редактирате изображения чрез диалог."
},
"fal-ai/qwen-image": {
"description": "Мощен модел за генериране на сурови изображения от екипа на Qwen, с впечатляващи възможности за генериране на китайски текст и разнообразни визуални стилове на изображения."
},
"fal-ai/qwen-image-edit": {
"description": "Професионален модел за редактиране на изображения, пуснат от екипа на Qwen, поддържа семантично и визуално редактиране, позволява прецизно редактиране на китайски и английски текст, както и стилови трансформации, въртене на обекти и други висококачествени редакции на изображения."
},
"flux-1-schnell": {
"description": "Модел за генериране на изображения от текст с 12 милиарда параметри, разработен от Black Forest Labs, използващ латентна противоречива дифузионна дистилация, способен да генерира висококачествени изображения за 1 до 4 стъпки. Моделът постига производителност, сравнима с проприетарни алтернативи, и е пуснат под лиценз Apache-2.0, подходящ за лична, научна и търговска употреба."
},
@@ -1151,9 +1250,6 @@
"flux-kontext-pro": {
"description": "Най-съвременни възможности за контекстно генериране и редактиране на изображения — комбиниране на текст и изображения за постигане на прецизни и последователни резултати."
},
"flux-kontext/dev": {
"description": "FLUX.1 модел, фокусиран върху задачи за редактиране на изображения, поддържащ текстови и визуални входни данни."
},
"flux-merged": {
"description": "FLUX.1-merged комбинира дълбоките характеристики, изследвани в разработката на \"DEV\" версията, с високоскоростните предимства на \"Schnell\". Тази комбинация не само разширява границите на производителността на модела, но и увеличава обхвата на неговото приложение."
},
@@ -1166,21 +1262,12 @@
"flux-pro-1.1-ultra": {
"description": "Генериране на изображения с изкуствен интелект с изключително висока резолюция — поддържа изход 4 мегапиксела, създава ултраясни изображения за по-малко от 10 секунди."
},
"flux-pro/kontext": {
"description": "FLUX.1 Kontext [pro] може да обработва текст и референтни изображения като вход, осигурявайки безпроблемно целенасочено локално редактиране и сложни трансформации на цялостната сцена."
},
"flux-schnell": {
"description": "FLUX.1 [schnell] е най-напредналият отворен модел с малък брой стъпки, който надминава конкурентите си и дори превъзхожда мощни нефино настроени модели като Midjourney v6.0 и DALL·E 3 (HD). Моделът е специално фино настроен, за да запази пълното разнообразие на изхода от предварителното обучение и значително подобрява визуалното качество, следването на инструкции, промяната на размери/пропорции, обработката на шрифтове и разнообразието на изхода в сравнение с най-съвременните модели на пазара, предоставяйки по-богато и разнообразно творческо генериране на изображения."
},
"flux.1-schnell": {
"description": "Коригиран потоков трансформър с 12 милиарда параметри, способен да генерира изображения въз основа на текстово описание."
},
"flux/krea": {
"description": "Flux Krea [dev] е модел за генериране на изображения с естетически предпочитания, целящ да създава по-реалистични и естествени изображения."
},
"flux/schnell": {
"description": "FLUX.1 [schnell] е модел за генериране на изображения с 12 милиарда параметри, фокусиран върху бързото създаване на висококачествени изображения."
},
"gemini-1.0-pro-001": {
"description": "Gemini 1.0 Pro 001 (Тунинг) предлага стабилна и настройваема производителност, идеален избор за решения на сложни задачи."
},
@@ -1388,20 +1475,26 @@
"glm-zero-preview": {
"description": "GLM-Zero-Preview притежава мощни способности за сложни разсъждения, показвайки отлични резултати в логическото разсъждение, математиката и програмирането."
},
"google/gemini-2.0-flash": {
"description": "Gemini 2.0 Flash предлага следващо поколение функции и подобрения, включително изключителна скорост, вградена употреба на инструменти, мултимодално генериране и контекстен прозорец от 1 милион токена."
},
"google/gemini-2.0-flash-001": {
"description": "Gemini 2.0 Flash предлага следващо поколение функции и подобрения, включително изключителна скорост, нативна употреба на инструменти, многомодално генериране и контекстен прозорец от 1M токена."
},
"google/gemini-2.0-flash-exp:free": {
"description": "Gemini 2.0 Flash Experimental е най-новият експериментален мултимодален AI модел на Google, с определено подобрение в качеството в сравнение с предишните версии, особено по отношение на световни знания, код и дълъг контекст."
},
"google/gemini-2.0-flash-lite": {
"description": "Gemini 2.0 Flash Lite предлага следващо поколение функции и подобрения, включително изключителна скорост, вградена употреба на инструменти, мултимодално генериране и контекстен прозорец от 1 милион токена."
},
"google/gemini-2.5-flash": {
"description": "Gemini 2.5 Flash е най-усъвършенстваният основен модел на Google, специално проектиран за напреднали задачи по разсъждение, кодиране, математика и наука. Той включва вградена способност за „мислене“, която му позволява да предоставя отговори с по-висока точност и по-детайлна обработка на контекста.\n\nЗабележка: Този модел има два варианта: с мислене и без мислене. Ценообразуването на изхода се различава значително в зависимост от това дали способността за мислене е активирана. Ако изберете стандартния вариант (без суфикса „:thinking“), моделът ясно избягва генерирането на мисловни токени.\n\nЗа да използвате способността за мислене и да получавате мисловни токени, трябва да изберете варианта „:thinking“, което ще доведе до по-висока цена за изход с мислене.\n\nОсвен това, Gemini 2.5 Flash може да бъде конфигуриран чрез параметъра „максимален брой токени за разсъждение“, както е описано в документацията (https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning)."
"description": "Gemini 2.5 Flash е мислещ модел, който предлага отлични всеобхватни възможности. Той е проектиран да балансира цена и производителност, поддържайки мултимодалност и контекстен прозорец от 1 милион токена."
},
"google/gemini-2.5-flash-image-preview": {
"description": "Gemini 2.5 Flash експериментален модел, поддържащ генериране на изображения."
},
"google/gemini-2.5-flash-image-preview:free": {
"description": "Gemini 2.5 Flash експериментален модел, поддържащ генериране на изображения."
"google/gemini-2.5-flash-lite": {
"description": "Gemini 2.5 Flash-Lite е балансиран, с ниска латентност модел с конфигурируем бюджет за мислене и свързаност с инструменти (например Google Search grounding и изпълнение на код). Поддържа мултимодален вход и предлага контекстен прозорец от 1 милион токена."
},
"google/gemini-2.5-flash-preview": {
"description": "Gemini 2.5 Flash е най-напредналият основен модел на Google, проектиран за напреднали разсъждения, кодиране, математика и научни задачи. Той включва вградена способност за \"мислене\", което му позволява да предоставя отговори с по-висока точност и детайлна обработка на контекста.\n\nЗабележка: Този модел има два варианта: с мислене и без мислене. Цените на изхода значително варират в зависимост от активирането на способността за мислене. Ако изберете стандартния вариант (без суфикс \":thinking\"), моделът ще избягва генерирането на токени за мислене.\n\nЗа да се възползвате от способността за мислене и да получите токени за мислене, трябва да изберете варианта \":thinking\", което ще доведе до по-високи цени на изхода за мислене.\n\nОсвен това, Gemini 2.5 Flash може да бъде конфигуриран чрез параметъра \"максимален брой токени за разсъждение\", както е описано в документацията (https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning)."
@@ -1410,11 +1503,14 @@
"description": "Gemini 2.5 Flash е най-напредналият основен модел на Google, проектиран за напреднали разсъждения, кодиране, математика и научни задачи. Той включва вградена способност за \"мислене\", което му позволява да предоставя отговори с по-висока точност и детайлна обработка на контекста.\n\nЗабележка: Този модел има два варианта: с мислене и без мислене. Цените на изхода значително варират в зависимост от активирането на способността за мислене. Ако изберете стандартния вариант (без суфикс \":thinking\"), моделът ще избягва генерирането на токени за мислене.\n\nЗа да се възползвате от способността за мислене и да получите токени за мислене, трябва да изберете варианта \":thinking\", което ще доведе до по-високи цени на изхода за мислене.\n\nОсвен това, Gemini 2.5 Flash може да бъде конфигуриран чрез параметъра \"максимален брой токени за разсъждение\", както е описано в документацията (https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning)."
},
"google/gemini-2.5-pro": {
"description": "Gemini 2.5 Pro е най-усъвършенстваният мисловен модел на Google, способен да извършва разсъждения върху сложни проблеми в областта на кодирането, математиката и STEM, както и да анализира големи набори от данни, кодови бази и документи с дълъг контекст."
"description": "Gemini 2.5 Pro е нашият най-напреднал разсъдъчен Gemini модел, способен да решава сложни проблеми. Той разполага с контекстен прозорец от 2 милиона токена и поддържа мултимодален вход, включително текст, изображения, аудио, видео и PDF документи."
},
"google/gemini-2.5-pro-preview": {
"description": "Gemini 2.5 Pro Preview е най-усъвършенстваният мисловен модел на Google, способен да извършва разсъждения върху сложни проблеми в областта на кодирането, математиката и STEM, както и да анализира големи набори от данни, кодови бази и документи с дълъг контекст."
},
"google/gemini-embedding-001": {
"description": "Водещ модел за вграждане с отлична производителност при задачи на английски, многоезични и кодови задачи."
},
"google/gemini-flash-1.5": {
"description": "Gemini 1.5 Flash предлага оптимизирани мултимодални обработващи способности, подходящи за различни сложни задачи."
},
@@ -1442,12 +1538,21 @@
"google/gemma-2b-it": {
"description": "Gemma Instruct (2B) предлага основни способности за обработка на инструкции, подходящи за леки приложения."
},
"google/gemma-3-12b-it": {
"description": "Gemma 3 12B е отворен езиков модел на Google, който поставя нови стандарти за ефективност и производителност."
},
"google/gemma-3-1b-it": {
"description": "Gemma 3 1B е отворен езиков модел на Google, който поставя нови стандарти за ефективност и производителност."
},
"google/gemma-3-27b-it": {
"description": "Gemma 3 27B е отворен езиков модел на Google, който поставя нови стандарти за ефективност и производителност."
},
"google/text-embedding-005": {
"description": "Текстово вграждане, оптимизирано за код и английски език."
},
"google/text-multilingual-embedding-002": {
"description": "Многоезичен модел за текстово вграждане, оптимизиран за междуезикови задачи, поддържащ множество езици."
},
"gpt-3.5-turbo": {
"description": "GPT 3.5 Turbo, подходящ за различни задачи по генериране и разбиране на текст, в момента сочи към gpt-3.5-turbo-0125."
},
@@ -1604,9 +1709,18 @@
"grok-4": {
"description": "Нашият най-нов и най-мощен флагмански модел, който се отличава с изключителни резултати в обработката на естествен език, математическите изчисления и разсъжденията — перфектен универсален играч."
},
"grok-4-0709": {
"description": "Grok 4 от xAI, с мощни способности за разсъждение."
},
"grok-code-fast-1": {
"description": "С удоволствие представяме grok-code-fast-1, бърз и икономичен модел за извод, който се отличава с отлични резултати при кодиране на агенти."
},
"groq/compound": {
"description": "Compound е сложна AI система, поддържана от множество отворени модели, вече налични в GroqCloud, която интелигентно и селективно използва инструменти за отговор на потребителски запитвания."
},
"groq/compound-mini": {
"description": "Compound-mini е сложна AI система, поддържана от публично достъпни модели, вече налични в GroqCloud, която интелигентно и селективно използва инструменти за отговор на потребителски запитвания."
},
"gryphe/mythomax-l2-13b": {
"description": "MythoMax l2 13B е езиков модел, който комбинира креативност и интелигентност, обединявайки множество водещи модели."
},
@@ -1662,7 +1776,7 @@
"description": "Значително подобрени способности в сложна математика, логика и кодиране, оптимизирана стабилност на изхода и подобрена работа с дълги текстове."
},
"hunyuan-t1-latest": {
"description": "Първият в индустрията свръхголям хибриден трансформаторен модел за инференция, който разширява инференционните способности, предлага изключителна скорост на декодиране и допълнително съгласува човешките предпочитания."
"description": "Значително подобрява способностите на основния модел за бавно мислене при сложна математика, комплексни разсъждения, труден код, спазване на инструкции и качество на текстовото творчество."
},
"hunyuan-t1-vision": {
"description": "Модел за дълбоко мултимодално разбиране Hunyuan, поддържащ естествени мултимодални вериги на мислене, експертен в различни сценарии за разсъждение върху изображения, с цялостно подобрение спрямо бързите мисловни модели при научни задачи."
@@ -1730,8 +1844,11 @@
"imagen-4.0-ultra-generate-preview-06-06": {
"description": "Imagen 4-то поколение текст-към-изображение модел серия Ултра версия"
},
"imagen4/preview": {
"description": "Висококачествен модел за генериране на изображения, предоставен от Google."
"inception/mercury-coder-small": {
"description": "Mercury Coder Small е идеален за задачи по генериране, отстраняване на грешки и рефакториране на код с минимална латентност."
},
"inclusionAI/Ling-mini-2.0": {
"description": "Ling-mini-2.0 е малък, високопроизводителен голям езиков модел, базиран на MoE архитектура. Той разполага с 16 милиарда общи параметри, но за всеки токен се активират само 1.4 милиарда (без вграждания 789 милиона), което осигурява изключително висока скорост на генериране. Благодарение на ефективния MoE дизайн и големия обем висококачествени тренировъчни данни, въпреки че активните параметри са само 1.4 милиарда, Ling-mini-2.0 демонстрира водещи резултати в задачи надолу по веригата, сравними с плътни LLM с по-малко от 10 милиарда параметри и по-големи MoE модели."
},
"internlm/internlm2_5-7b-chat": {
"description": "InternLM2.5 предлага интелигентни решения за диалог в множество сценарии."
@@ -1766,6 +1883,9 @@
"kimi-k2-0711-preview": {
"description": "kimi-k2 е базов модел с MoE архитектура с изключителни способности за кодиране и агентски функции, с общо 1 трилион параметри и 32 милиарда активни параметри. В тестове за общо знание, програмиране, математика и агентски задачи, моделът K2 превъзхожда други водещи отворени модели."
},
"kimi-k2-0905-preview": {
"description": "Моделът kimi-k2-0905-preview има контекстна дължина от 256k, с по-силни способности за агентно кодиране, по-изразителна естетика и практичност на фронтенд кода, както и по-добро разбиране на контекста."
},
"kimi-k2-turbo-preview": {
"description": "Kimi-k2 е базов модел с MoE архитектура, който притежава изключителни възможности за работа с код и агентни функции. Общият брой параметри е 1T, а активните параметри са 32B. В бенчмарковете за основни категории като общо знание и разсъждение, програмиране, математика и агентни задачи, моделът K2 превъзхожда другите водещи отворени модели."
},
@@ -2003,30 +2123,63 @@
"meta/Meta-Llama-3.1-8B-Instruct": {
"description": "Текстов модел Llama 3.1 с фино настройване за инструкции, оптимизиран за многоезични диалогови случаи, с отлични резултати в множество налични отворени и затворени чат модели при стандартни индустриални бенчмаркове."
},
"meta/llama-3-70b": {
"description": "70-милиарден параметров отворен модел, прецизно настроен от Meta за следване на инструкции. Обслужва се от Groq с техния персонализиран хардуер за езикова обработка (LPU) за бързо и ефективно разсъждение."
},
"meta/llama-3-8b": {
"description": "8-милиарден параметров отворен модел, прецизно настроен от Meta за следване на инструкции. Обслужва се от Groq с техния персонализиран хардуер за езикова обработка (LPU) за бързо и ефективно разсъждение."
},
"meta/llama-3.1-405b-instruct": {
"description": "Напреднал LLM, поддържащ генериране на синтетични данни, дестилация на знания и разсъждение, подходящ за чатботове, програмиране и специфични задачи."
},
"meta/llama-3.1-70b": {
"description": "Обновена версия на Meta Llama 3 70B Instruct, включваща разширена дължина на контекста 128K, многоезичност и подобрени способности за разсъждение."
},
"meta/llama-3.1-70b-instruct": {
"description": "Улеснява сложни разговори, с изключителни способности за разбиране на контекста, разсъждение и генериране на текст."
},
"meta/llama-3.1-8b": {
"description": "Llama 3.1 8B поддържа контекстен прозорец 128K, което го прави идеален за интерфейси за реално време и анализ на данни, като същевременно предлага значителни икономии в сравнение с по-големите модели. Обслужва се от Groq с техния персонализиран хардуер за езикова обработка (LPU) за бързо и ефективно разсъждение."
},
"meta/llama-3.1-8b-instruct": {
"description": "Напреднал, водещ модел с разбиране на езика, изключителни способности за разсъждение и генериране на текст."
},
"meta/llama-3.2-11b": {
"description": "Модел за генериране с разсъждения върху изображения (текст + входящи изображения / текстов изход), оптимизиран за визуално разпознаване, разсъждения върху изображения, генериране на заглавия и отговори на общи въпроси за изображения."
},
"meta/llama-3.2-11b-vision-instruct": {
"description": "Водещ визуално-езиков модел, специализиран в извършване на висококачествени разсъждения от изображения."
},
"meta/llama-3.2-1b": {
"description": "Модел само за текст, поддържащ локални случаи на употреба на устройството като многоезично локално извличане на знания, обобщение и пренаписване."
},
"meta/llama-3.2-1b-instruct": {
"description": "Напреднал, водещ малък езиков модел с разбиране на езика, изключителни способности за разсъждение и генериране на текст."
},
"meta/llama-3.2-3b": {
"description": "Модел само за текст, прецизно настроен за поддръжка на локални случаи на употреба на устройството като многоезично локално извличане на знания, обобщение и пренаписване."
},
"meta/llama-3.2-3b-instruct": {
"description": "Напреднал, водещ малък езиков модел с разбиране на езика, изключителни способности за разсъждение и генериране на текст."
},
"meta/llama-3.2-90b": {
"description": "Модел за генериране с разсъждения върху изображения (текст + входящи изображения / текстов изход), оптимизиран за визуално разпознаване, разсъждения върху изображения, генериране на заглавия и отговори на общи въпроси за изображения."
},
"meta/llama-3.2-90b-vision-instruct": {
"description": "Водещ визуално-езиков модел, специализиран в извършване на висококачествени разсъждения от изображения."
},
"meta/llama-3.3-70b": {
"description": "Перфектна комбинация от производителност и ефективност. Моделът поддържа високопроизводителен диалогов AI, проектиран за създаване на съдържание, корпоративни приложения и изследвания, предоставяйки усъвършенствани езикови разбирания, включително обобщение на текст, класификация, анализ на настроения и генериране на код."
},
"meta/llama-3.3-70b-instruct": {
"description": "Напреднал LLM, специализиран в разсъждения, математика, общи познания и извикване на функции."
},
"meta/llama-4-maverick": {
"description": "Колекцията модели Llama 4 са родени мултимодални AI модели, поддържащи текст и мултимодални преживявания. Тези модели използват архитектура с хибридни експерти, предоставяйки водеща в индустрията производителност в разбирането на текст и изображения. Llama 4 Maverick, модел с 17 милиарда параметри и 128 експерти. Обслужва се от DeepInfra."
},
"meta/llama-4-scout": {
"description": "Колекцията модели Llama 4 са родени мултимодални AI модели, поддържащи текст и мултимодални преживявания. Тези модели използват архитектура с хибридни експерти, предоставяйки водеща в индустрията производителност в разбирането на текст и изображения. Llama 4 Scout, модел с 17 милиарда параметри и 16 експерти. Обслужва се от DeepInfra."
},
"microsoft/Phi-3-medium-128k-instruct": {
"description": "Същият модел Phi-3-medium, но с по-голям размер на контекста, подходящ за RAG или малко количество подсказки."
},
@@ -2102,6 +2255,48 @@
"mistral-small-latest": {
"description": "Mistral Small е икономически ефективен, бърз и надежден вариант, подходящ за случаи на употреба като превод, резюме и анализ на настроението."
},
"mistral/codestral": {
"description": "Mistral Codestral 25.01 е най-съвременният кодов модел, оптимизиран за ниска латентност и висока честота на използване. Владее над 80 програмни езика и се представя отлично в задачи като междинно попълване (FIM), корекция на код и генериране на тестове."
},
"mistral/codestral-embed": {
"description": "Кодов модел за вграждане, който може да бъде вграден в кодови бази данни и хранилища, за да поддържа кодови асистенти."
},
"mistral/devstral-small": {
"description": "Devstral е голям езиков модел агент за софтуерно инженерство, което го прави отличен избор за софтуерни инженерни агенти."
},
"mistral/magistral-medium": {
"description": "Сложно мислене, подкрепено от дълбоко разбиране с прозрачно разсъждение, което можете да следвате и проверявате. Моделът поддържа висока вярност на разсъжденията на множество езици, дори при смяна на езика в средата на задачата."
},
"mistral/magistral-small": {
"description": "Сложно мислене, подкрепено от дълбоко разбиране с прозрачно разсъждение, което можете да следвате и проверявате. Моделът поддържа висока вярност на разсъжденията на множество езици, дори при смяна на езика в средата на задачата."
},
"mistral/ministral-3b": {
"description": "Компактен и ефективен модел за задачи на устройства като интелигентни асистенти и локален анализ, осигуряващ ниска латентност."
},
"mistral/ministral-8b": {
"description": "По-мощен модел с по-бързо и паметно ефективно разсъждение, идеален за сложни работни потоци и изискващи приложения на ръба."
},
"mistral/mistral-embed": {
"description": "Универсален текстов модел за вграждане, използван за семантично търсене, сходство, клъстериране и RAG работни потоци."
},
"mistral/mistral-large": {
"description": "Mistral Large е идеален за сложни задачи, изискващи големи разсъдъчни способности или висока специализация — като синтетично генериране на текст, генериране на код, RAG или агенти."
},
"mistral/mistral-saba-24b": {
"description": "Mistral Saba 24B е 24-милиарден параметров отворен модел, разработен от Mistral.ai. Saba е специализиран модел, обучен да се представя отлично на арабски, персийски, урду, иврит и индийски езици. Обслужва се от Groq с техния персонализиран хардуер за езикова обработка (LPU) за бързо и ефективно разсъждение."
},
"mistral/mistral-small": {
"description": "Mistral Small е идеален за прости задачи, които могат да се обработват на партиди — като класификация, клиентска поддръжка или генериране на текст. Предлага отлична производителност на достъпна цена."
},
"mistral/mixtral-8x22b-instruct": {
"description": "8x22b Instruct модел. 8x22b е отворен модел с хибридни експерти, обслужван от Mistral."
},
"mistral/pixtral-12b": {
"description": "12-милиарден модел с възможности за разбиране на изображения, както и текст."
},
"mistral/pixtral-large": {
"description": "Pixtral Large е вторият модел в нашето мултимодално семейство, демонстриращ водещи в класа способности за разбиране на изображения. По-специално, моделът може да разбира документи, диаграми и естествени изображения, като същевременно запазва водещите способности за разбиране на текст на Mistral Large 2."
},
"mistralai/Mistral-7B-Instruct-v0.1": {
"description": "Mistral (7B) Instruct е известен с високата си производителност, подходящ за множество езикови задачи."
},
@@ -2165,8 +2360,23 @@
"moonshotai/Kimi-K2-Instruct": {
"description": "Kimi K2 е базов модел с MoE архитектура, с изключителни кодови и агентски способности, общо 1 трилион параметри и 32 милиарда активирани параметри. В бенчмаркове за общо знание, програмиране, математика и агентски задачи моделът K2 превъзхожда други водещи отворени модели."
},
"moonshotai/kimi-k2-instruct": {
"description": "kimi-k2 е базов модел с MoE архитектура с изключителни способности за кодиране и агент, с общо 1 трилион параметри и 32 милиарда активни параметри. В бенчмаркови тестове за общи знания, програмиране, математика и агенти, моделът K2 превъзхожда други водещи отворени модели."
"moonshotai/Kimi-K2-Instruct-0905": {
"description": "Kimi K2-Instruct-0905 е най-новата и най-мощна версия на Kimi K2. Това е водещ езиков модел с хибридна експертна архитектура (MoE), с общо 1 трилион параметри и 32 милиарда активни параметри. Основните характеристики на модела включват: подобрена интелигентност при кодиране на агенти, с изразително подобрение в производителността при публични бенчмаркове и реални задачи за кодиране на агенти; усъвършенстван опит при фронтенд кодиране, с напредък както в естетиката, така и в практичността на фронтенд програмирането."
},
"moonshotai/kimi-k2": {
"description": "Kimi K2 е голям смесен експертен (MoE) езиков модел с 1 трилион общи параметри и 32 милиарда активни параметри на преден проход, разработен от Moonshot AI. Оптимизиран е за агентски способности, включително усъвършенствано използване на инструменти, разсъждения и синтез на код."
},
"moonshotai/kimi-k2-0905": {
"description": "Моделът kimi-k2-0905-preview има контекстна дължина от 256k, с по-силни способности за агентно кодиране, по-изразителна естетика и практичност на фронтенд кода, както и по-добро разбиране на контекста."
},
"moonshotai/kimi-k2-instruct-0905": {
"description": "Моделът kimi-k2-0905-preview има контекстна дължина от 256k, с по-силни способности за агентно кодиране, по-изразителна естетика и практичност на фронтенд кода, както и по-добро разбиране на контекста."
},
"morph/morph-v3-fast": {
"description": "Morph предоставя специализиран AI модел, който прилага препоръчаните от водещи модели (като Claude или GPT-4o) промени в кода към съществуващите ви файлове БЪРЗО - над 4500+ токена в секунда. Той служи като последна стъпка в AI кодовия работен поток. Поддържа 16k входни и 16k изходни токена."
},
"morph/morph-v3-large": {
"description": "Morph предоставя специализиран AI модел, който прилага препоръчаните от водещи модели (като Claude или GPT-4o) промени в кода към съществуващите ви файлове БЪРЗО - над 2500+ токена в секунда. Той служи като последна стъпка в AI кодовия работен поток. Поддържа 16k входни и 16k изходни токена."
},
"nousresearch/hermes-2-pro-llama-3-8b": {
"description": "Hermes 2 Pro Llama 3 8B е обновена версия на Nous Hermes 2, включваща най-новите вътрешно разработени набори от данни."
@@ -2195,6 +2405,9 @@
"o3": {
"description": "o3 е универсален и мощен модел, който показва отлични резултати в множество области. Той задава нови стандарти за задачи по математика, наука, програмиране и визуални разсъждения. Също така е добър в техническото писане и следването на инструкции. Потребителите могат да го използват за анализ на текст, код и изображения, за решаване на сложни проблеми с множество стъпки."
},
"o3-2025-04-16": {
"description": "o3 е новият модел за разсъждение на OpenAI, поддържа вход от изображения и текст и изход на текст, подходящ за сложни задачи, изискващи широко общо знание."
},
"o3-deep-research": {
"description": "o3-deep-research е нашият най-напреднал модел за дълбоко изследване, специално проектиран за обработка на сложни многократни изследователски задачи. Той може да търси и обобщава информация от интернет, както и да осъществява достъп и използва вашите собствени данни чрез MCP конектор."
},
@@ -2204,9 +2417,15 @@
"o3-pro": {
"description": "Моделът o3-pro използва повече изчислителна мощ за по-задълбочено мислене и винаги предоставя по-добри отговори, като се поддържа само чрез Responses API."
},
"o3-pro-2025-06-10": {
"description": "o3 Pro е новият модел за разсъждение на OpenAI, поддържа вход от изображения и текст и изход на текст, подходящ за сложни задачи, изискващи широко общо знание."
},
"o4-mini": {
"description": "o4-mini е нашият най-нов малък модел от серията o. Той е оптимизиран за бързо и ефективно извеждане, показвайки изключителна ефективност и производителност в задачи по кодиране и визуализация."
},
"o4-mini-2025-04-16": {
"description": "o4-mini е модел за разсъждение на OpenAI, поддържа вход от изображения и текст и изход на текст, подходящ за сложни задачи, изискващи широко общо знание. Този модел има контекст от 200K."
},
"o4-mini-deep-research": {
"description": "o4-mini-deep-research е нашият по-бърз и по-достъпен модел за дълбоко изследване — идеален за обработка на сложни многократни изследователски задачи. Той може да търси и обобщава информация от интернет, както и да осъществява достъп и използва вашите собствени данни чрез MCP конектор."
},
@@ -2225,29 +2444,47 @@
"open-mixtral-8x7b": {
"description": "Mixtral 8x7B е рядък експертен модел, който използва множество параметри за увеличаване на скоростта на разсъждение, подходящ за обработка на многоезични и кодови генериращи задачи."
},
"openai/gpt-3.5-turbo": {
"description": "Най-способният и икономичен модел от серията GPT-3.5 на OpenAI, оптимизиран за чат, но също така с добри резултати при традиционни задачи за завършване."
},
"openai/gpt-3.5-turbo-instruct": {
"description": "Подобни възможности на моделите от епохата GPT-3. Съвместим с традиционни крайни точки за завършване, а не с чат крайни точки."
},
"openai/gpt-4-turbo": {
"description": "gpt-4-turbo от OpenAI притежава обширни общи знания и експертиза в различни области, което му позволява да следва сложни инструкции на естествен език и да решава точно трудни проблеми. Знанията му са актуални до април 2023 г., а контекстният прозорец е 128 000 токена."
},
"openai/gpt-4.1": {
"description": "GPT-4.1 е нашият флагмански модел за сложни задачи. Той е изключително подходящ за решаване на проблеми в различни области."
"description": "GPT 4.1 е водещият модел на OpenAI, подходящ за сложни задачи. Изключително подходящ за решаване на проблеми в различни области."
},
"openai/gpt-4.1-mini": {
"description": "GPT-4.1 mini предлага баланс между интелигентност, скорост и разходи, което го прави привлекателен модел за много случаи на употреба."
"description": "GPT 4.1 mini постига баланс между интелигентност, скорост и цена, което го прави привлекателен модел за много случаи на употреба."
},
"openai/gpt-4.1-nano": {
"description": "GPT-4.1 nano е най-бързият и най-икономичният модел на GPT-4.1."
"description": "GPT-4.1 nano е най-бързият и икономичен модел от серията GPT 4.1."
},
"openai/gpt-4o": {
"description": "ChatGPT-4o е динамичен модел, който се актуализира в реално време, за да поддържа най-новата версия. Той комбинира мощно разбиране на езика и способности за генериране, подходящ за мащабни приложения, включително обслужване на клиенти, образование и техническа поддръжка."
"description": "GPT-4o от OpenAI притежава обширни общи знания и експертиза в различни области, способен да следва сложни инструкции на естествен език и да решава точно трудни проблеми. Предлага производителност, съпоставима с GPT-4 Turbo, но с по-бърз и по-евтин API."
},
"openai/gpt-4o-mini": {
"description": "GPT-4o mini е най-новият модел на OpenAI, пуснат след GPT-4 Omni, който поддържа вход и изход на текст и изображения. Като най-напредналият им малък модел, той е значително по-евтин от другите нови модели и е с над 60% по-евтин от GPT-3.5 Turbo. Запазва най-съвременната интелигентност, като предлага значителна стойност за парите. GPT-4o mini получи 82% на теста MMLU и в момента е с по-висок рейтинг от GPT-4 в предпочитанията за чат."
"description": "GPT-4o mini от OpenAI е техният най-напреднал и икономичен малък модел. Той е мултимодален (приема текст или изображения като вход и генерира текст) и е по-интелигентен от gpt-3.5-turbo, като същевременно е също толкова бърз."
},
"openai/gpt-5": {
"description": "GPT-5 е водещият езиков модел на OpenAI, отличаващ се в сложни разсъждения, обширни знания за реалния свят, задачи с интензивен код и многостъпкови агентски задачи."
},
"openai/gpt-5-mini": {
"description": "GPT-5 mini е оптимизиран по отношение на разходите модел, който се представя отлично при задачи за разсъждение и чат. Предлага най-добрия баланс между скорост, цена и способности."
},
"openai/gpt-5-nano": {
"description": "GPT-5 nano е модел с висок пропускателен капацитет, който се справя отлично с прости инструкции или задачи за класификация."
},
"openai/gpt-oss-120b": {
"description": "OpenAI GPT-OSS 120B е водещ езиков модел с 120 милиарда параметри, вграден браузър за търсене и изпълнение на код, както и способности за разсъждение."
"description": "Изключително способен универсален голям езиков модел с мощни и контролируеми способности за разсъждение."
},
"openai/gpt-oss-20b": {
"description": "OpenAI GPT-OSS 20B е водещ езиков модел с 20 милиарда параметри, вграден браузър за търсене и изпълнение на код, както и способности за разсъждение."
"description": "Компактен езиков модел с отворени тегла, оптимизиран за ниска латентност и среди с ограничени ресурси, включително локални и ръбови внедрявания."
},
"openai/o1": {
"description": "o1 е новият модел за разсъждение на OpenAI, който поддържа вход с изображения и текст и генерира текст, подходящ за сложни задачи, изискващи широкообхватни общи знания. Моделът разполага с контекст от 200K и дата на знание до октомври 2023 г."
"description": "o1 на OpenAI е водещ модел за разсъждение, проектиран за сложни проблеми, изискващи дълбоко мислене. Той осигурява мощни способности за разсъждение и по-висока точност при сложни многостъпкови задачи."
},
"openai/o1-mini": {
"description": "o1-mini е бърз и икономичен модел за изводи, проектиран за приложения в програмирането, математиката и науката. Моделът разполага с контекст от 128K и дата на знание до октомври 2023."
@@ -2256,23 +2493,44 @@
"description": "o1 е новият модел за изводи на OpenAI, подходящ за сложни задачи, изискващи обширни общи знания. Моделът разполага с контекст от 128K и дата на знание до октомври 2023."
},
"openai/o3": {
"description": "o3 е мощен универсален модел, който показва отлични резултати в множество области. Той поставя нови стандарти за математически, научни, програмистки и визуални задачи за разсъждение. Също така е добър в техническото писане и следването на инструкции. Потребителите могат да го използват за анализ на текст, код и изображения, за решаване на сложни проблеми с множество стъпки."
"description": "o3 на OpenAI е най-мощният модел за разсъждение, поставящ нови стандарти в кодиране, математика, наука и визуално възприятие. Отличава се при сложни заявки, изискващи многостранен анализ, с особен акцент върху анализа на изображения, диаграми и графики."
},
"openai/o3-mini": {
"description": "o3-mini предлага висока интелигентност при същите разходи и цели за закъснение като o1-mini."
"description": "o3-mini е най-новият малък модел за разсъждение на OpenAI, който предлага висока интелигентност при същите цели за цена и латентност като o1-mini."
},
"openai/o3-mini-high": {
"description": "o3-mini high е версия с високо ниво на разсъждение, която предлага висока интелигентност при същите разходи и цели за закъснение като o1-mini."
},
"openai/o4-mini": {
"description": "o4-mini е оптимизиран за бързо и ефективно извеждане, показвайки изключителна ефективност и производителност в задачи по кодиране и визуализация."
"description": "o4-mini на OpenAI предлага бързо и икономично разсъждение с отлична производителност за своя размер, особено в математика (най-добър в AIME бенчмарка), кодиране и визуални задачи."
},
"openai/o4-mini-high": {
"description": "o4-mini версия с високо ниво на извеждане, оптимизирана за бързо и ефективно извеждане, показваща изключителна ефективност и производителност в задачи по кодиране и визуализация."
},
"openai/text-embedding-3-large": {
"description": "Най-способният модел за вграждане на OpenAI, подходящ за задачи на английски и други езици."
},
"openai/text-embedding-3-small": {
"description": "Подобрена и по-високопроизводителна версия на ada модела за вграждане на OpenAI."
},
"openai/text-embedding-ada-002": {
"description": "Традиционният текстов модел за вграждане на OpenAI."
},
"openrouter/auto": {
"description": "В зависимост от дължината на контекста, темата и сложността, вашето запитване ще бъде изпратено до Llama 3 70B Instruct, Claude 3.5 Sonnet (саморегулиращ) или GPT-4o."
},
"perplexity/sonar": {
"description": "Лек продукт на Perplexity с възможности за търсене, по-бърз и по-евтин от Sonar Pro."
},
"perplexity/sonar-pro": {
"description": "Водещият продукт на Perplexity с възможности за търсене, поддържащ сложни заявки и последващи действия."
},
"perplexity/sonar-reasoning": {
"description": "Модел, фокусиран върху разсъждения, който издава мисловни вериги (CoT) в отговорите и предоставя подробни обяснения с търсене."
},
"perplexity/sonar-reasoning-pro": {
"description": "Разширен модел, фокусиран върху разсъждения, който издава мисловни вериги (CoT) в отговорите и предоставя комплексни обяснения с подобрени възможности за търсене и множество заявки за търсене на заявка."
},
"phi3": {
"description": "Phi-3 е лек отворен модел, представен от Microsoft, подходящ за ефективна интеграция и мащабно знание разсъждение."
},
@@ -2313,7 +2571,7 @@
"description": "Qwen-Image е универсален модел за генериране на изображения, който поддържа множество художествени стилове и е особено добър в рендериране на сложни текстове, включително на китайски и английски. Моделът поддържа многоредови оформления, генериране на текст на ниво абзац и изобразяване на детайли с висока прецизност, позволявайки създаване на сложни комбинирани оформления от изображение и текст."
},
"qwen-image-edit": {
"description": "Професионален модел за редактиране на изображения, публикуван от екипа на Qwen, който поддържа семантично редактиране и редактиране на външния вид и може прецизно да обработва текст на китайски и английски, извършвайки висококачествени редакции на изображения като трансформация на стил и въртене на обекти."
"description": "Qwen Image Edit е модел за генериране на изображения, който поддържа редактиране и модификация на изображения въз основа на входни изображения и текстови подсказки, като може да извършва прецизни корекции и креативни трансформации на оригиналното изображение според нуждите на потребителя."
},
"qwen-long": {
"description": "Qwen е мащабен езиков модел, който поддържа дълги текстови контексти и диалогови функции, базирани на дълги документи и множество документи."
@@ -2549,6 +2807,15 @@
"qwen3-coder-plus": {
"description": "Кодиращ модел на Tongyi Qianwen. Най-новата серия модели Qwen3-Coder е базирана на Qwen3 и е модел за генериране на код с мощни възможности на Coding Agent, умеещ да използва инструменти и да взаимодейства с околната среда, способен на автономно програмиране, с изключителни кодови умения и същевременно общи способности."
},
"qwen3-max-preview": {
"description": "Preview версия на Max модела от серията Qwen 3, с голямо подобрение спрямо серия 2.5 в общите универсални способности, разбиране на текст на китайски и английски, следване на сложни инструкции, субективни отворени задачи, многоезични способности и използване на инструменти; моделът има по-малко халюцинации на знания."
},
"qwen3-next-80b-a3b-instruct": {
"description": "Базирано на Qwen3, ново поколение отворен модел без мисловен режим, който предлага по-добро разбиране на китайски текстове, подобрени логически умения и по-добри резултати при задачи за генериране на текст в сравнение с предишната версия (Tongyi Qianwen 3-235B-A22B-Instruct-2507)."
},
"qwen3-next-80b-a3b-thinking": {
"description": "Базирано на Qwen3, ново поколение отворен модел с мисловен режим, който подобрява спазването на инструкции и предоставя по-кратки и точни обобщения в сравнение с предишната версия (Tongyi Qianwen 3-235B-A22B-Thinking-2507)."
},
"qwq": {
"description": "QwQ е експериментален изследователски модел, който се фокусира върху подобряване на AI разсъдъчните способности."
},
@@ -2729,6 +2996,12 @@
"v0-1.5-md": {
"description": "Моделът v0-1.5-md е подходящ за ежедневни задачи и генериране на потребителски интерфейс (UI)"
},
"vercel/v0-1.0-md": {
"description": "Достъп до модела зад v0 за генериране, поправка и оптимизация на модерни уеб приложения с разсъждения, специфични за рамки, и актуални знания."
},
"vercel/v0-1.5-md": {
"description": "Достъп до модела зад v0 за генериране, поправка и оптимизация на модерни уеб приложения с разсъждения, специфични за рамки, и актуални знания."
},
"wan2.2-t2i-flash": {
"description": "Wanxiang 2.2 експресна версия, най-новият модел към момента. Комплексно подобрение в креативност, стабилност и реализъм, с бърза скорост на генериране и висока цена-ефективност."
},
@@ -2759,6 +3032,27 @@
"x1": {
"description": "Моделът Spark X1 ще бъде допълнително обновен, като на базата на водещите в страната резултати в математически задачи, ще постигне ефекти в общи задачи като разсъждение, генериране на текст и разбиране на език, сравними с OpenAI o1 и DeepSeek R1."
},
"xai/grok-2": {
"description": "Grok 2 е водещ езиков модел с най-съвременни способности за разсъждение. Той има напреднали умения в чат, кодиране и разсъждение, превъзхождайки Claude 3.5 Sonnet и GPT-4-Turbo в класацията LMSYS."
},
"xai/grok-2-vision": {
"description": "Grok 2 визуалният модел се представя отлично при задачи, базирани на визуална информация, предоставяйки водещи резултати в визуално математическо разсъждение (MathVista) и въпроси и отговори, базирани на документи (DocVQA). Той може да обработва разнообразна визуална информация, включително документи, диаграми, графики, екранни снимки и снимки."
},
"xai/grok-3": {
"description": "Флагманският модел на xAI, който се представя отлично в корпоративни случаи като извличане на данни, кодиране и обобщение на текст. Притежава дълбоки познания в областите финанси, здравеопазване, право и наука."
},
"xai/grok-3-fast": {
"description": "Флагманският модел на xAI, който се представя отлично в корпоративни случаи като извличане на данни, кодиране и обобщение на текст. Вариантът бърз модел се обслужва на по-бърза инфраструктура, осигурявайки много по-бързо време за отговор. Увеличената скорост идва с по-висока цена на токен изход."
},
"xai/grok-3-mini": {
"description": "Лек модел на xAI, който мисли преди да отговори. Отличен за прости или логически задачи, които не изискват дълбоки познания в областта. Първоначалните мисловни пътеки са достъпни."
},
"xai/grok-3-mini-fast": {
"description": "Лек модел на xAI, който мисли преди да отговори. Отличен за прости или логически задачи, които не изискват дълбоки познания в областта. Първоначалните мисловни пътеки са достъпни. Вариантът бърз модел се обслужва на по-бърза инфраструктура, осигурявайки много по-бързо време за отговор. Увеличената скорост идва с по-висока цена на токен изход."
},
"xai/grok-4": {
"description": "Най-новият и най-велик флагмански модел на xAI, предоставящ ненадмината производителност в естествен език, математика и разсъждения — перфектният универсален играч."
},
"yi-1.5-34b-chat": {
"description": "Yi-1.5 е обновена версия на Yi. Тя използва висококачествен корпус от 500B токена за продължителна предварителна обучение на Yi и е майсторски подобрявана с 3M разнообразни примера за fino-tuning."
},
@@ -2806,5 +3100,14 @@
},
"zai-org/GLM-4.5V": {
"description": "GLM-4.5V е най-новото поколение визуално-езиков модел (VLM), публикуван от Zhipu AI (智谱 AI). Моделът е изграден върху водещия текстов модел GLM-4.5-Air, който разполага с общо 106 милиарда параметри и 12 милиарда активационни параметри, и използва архитектура с разбъркани експерти (Mixture of Experts, MoE), целяща постигане на висока производителност при по-ниски разходи за инференция. Технически GLM-4.5V продължава линията на GLM-4.1V-Thinking и въвежда иновации като триизмерно ротационно позиционно кодиране (3D-RoPE), което значително засилва възприемането и разсъжденията относно триизмерните пространствени взаимовръзки. Чрез оптимизации в етапите на предварително обучение, супервизирано фино настройване и подсилено обучение, моделът може да обработва различни визуални формати — изображения, видео и дълги документи — и в 41 публични мултимодални бенчмарка достига водещи резултати сред отворените модели от същия клас. Освен това моделът добавя превключвател за 'режим на мислене', който позволява на потребителите гъвкаво да избират между бърз отговор и дълбоко разсъждение, за да балансират ефективността и качеството."
},
"zai/glm-4.5": {
"description": "Серията модели GLM-4.5 е специално проектирана за агенти. Флагманът GLM-4.5 интегрира 355 милиарда общи параметри (32 милиарда активни), обединявайки разсъждения, кодиране и агентски способности за решаване на сложни приложения. Като хибридна разсъдъчна система, той предлага двойни режими на работа."
},
"zai/glm-4.5-air": {
"description": "GLM-4.5 и GLM-4.5-Air са нашите най-нови флагмански модели, специално проектирани като основни модели за агентски приложения. И двата използват архитектура с хибридни експерти (MoE). GLM-4.5 има 355 милиарда общи параметри с 32 милиарда активни на преден проход, докато GLM-4.5-Air е по-опростен с 106 милиарда общи параметри и 12 милиарда активни."
},
"zai/glm-4.5v": {
"description": "GLM-4.5V е изграден върху основния модел GLM-4.5-Air, наследявайки проверените технологии на GLM-4.1V-Thinking и постига ефективно мащабиране чрез мощната MoE архитектура с 106 милиарда параметри."
}
}
+6
View File
@@ -38,6 +38,9 @@
"cohere": {
"description": "Cohere ви предлага най-съвременни многоезични модели, напреднали функции за търсене и AI работно пространство, проектирано специално за съвременните предприятия — всичко интегрирано в една сигурна платформа."
},
"cometapi": {
"description": "CometAPI е платформа за услуги, която предоставя множество интерфейси за водещи големи модели, поддържайки OpenAI, Anthropic, Google и други, подходяща за разнообразни нужди на разработка и приложение. Потребителите могат гъвкаво да избират най-добрия модел и цена според своите изисквания, подпомагайки подобряването на AI изживяването."
},
"deepseek": {
"description": "DeepSeek е компания, специализирана в изследвания и приложения на технологии за изкуствен интелект, чийто най-нов модел DeepSeek-V2.5 комбинира способности за общи диалози и обработка на код, постигайки значителни подобрения в съответствието с човешките предпочитания, писателските задачи и следването на инструкции."
},
@@ -158,6 +161,9 @@
"v0": {
"description": "v0 е асистент за програмиране в екип, който ви позволява да описвате идеите си с естествен език и автоматично генерира код и потребителски интерфейс (UI) за вашия проект"
},
"vercelaigateway": {
"description": "Vercel AI Gateway предоставя унифициран API за достъп до над 100 модела, позволявайки използването на модели от множество доставчици като OpenAI, Anthropic, Google и други чрез единна крайна точка. Поддържа настройка на бюджет, мониторинг на използването, балансиране на натоварването на заявките и аварийно пренасочване."
},
"vertexai": {
"description": "Серията Gemini на Google е най-напредналият и универсален AI модел, създаден от Google DeepMind, проектиран за мултимодалност, който поддържа безпроблемно разбиране и обработка на текст, код, изображения, аудио и видео. Подходящ за различни среди, от центрове за данни до мобилни устройства, значително увеличава ефективността и приложимостта на AI моделите."
},
+10 -3
View File
@@ -70,12 +70,15 @@
"input": {
"addAi": "Fügen Sie eine AI-Nachricht hinzu",
"addUser": "Fügen Sie eine Benutzer-Nachricht hinzu",
"disclaimer": "KI kann auch Fehler machen, bitte überprüfen Sie wichtige Informationen",
"errorMsg": "Nachricht konnte nicht gesendet werden, bitte überprüfen Sie Ihre Netzwerkverbindung und versuchen Sie es erneut: {{errorMsg}}",
"more": "Mehr",
"send": "Senden",
"sendWithCmdEnter": "Mit {{meta}} + Eingabetaste senden",
"sendWithEnter": "Mit Eingabetaste senden",
"sendWithCmdEnter": "Drücken Sie <key/>, um zu senden",
"sendWithEnter": "Drücken Sie <key/>, um zu senden",
"stop": "Stoppen",
"warp": "Zeilenumbruch"
"warp": "Zeilenumbruch",
"warpWithKey": "Mit der Taste <key/> umbrechen"
},
"intentUnderstanding": {
"title": "Verstehe und analysiere gerade Ihre Absicht..."
@@ -232,6 +235,10 @@
"threadMessageCount": "{{messageCount}} Nachrichten",
"title": "Unterthema"
},
"toggleWideScreen": {
"off": "Breitbildmodus deaktivieren",
"on": "Breitbildmodus aktivieren"
},
"tokenDetails": {
"chats": "Chats",
"historySummary": "Historische Zusammenfassung",
+62
View File
@@ -0,0 +1,62 @@
{
"actions": {
"expand": {
"off": "Einklappen",
"on": "Ausklappen"
},
"typobar": {
"off": "Formatierungsleiste ausblenden",
"on": "Formatierungsleiste anzeigen"
}
},
"cancel": "Abbrechen",
"confirm": "Bestätigen",
"file": {
"error": "Fehler: {{message}}",
"uploading": "Datei wird hochgeladen..."
},
"image": {
"broken": "Bild beschädigt"
},
"link": {
"edit": "Link bearbeiten",
"open": "Link öffnen",
"placeholder": "Link-URL eingeben",
"unlink": "Link entfernen"
},
"math": {
"placeholder": "Bitte TeX-Formel eingeben"
},
"slash": {
"h1": "Überschrift 1. Ordnung",
"h2": "Überschrift 2. Ordnung",
"h3": "Überschrift 3. Ordnung",
"hr": "Trennlinie",
"table": "Tabelle",
"tex": "TeX-Formel"
},
"table": {
"delete": "Tabelle löschen",
"deleteColumn": "Spalte löschen",
"deleteRow": "Zeile löschen",
"insertColumnLeft": "Links {{count}} Spalten einfügen",
"insertColumnRight": "Rechts {{count}} Spalten einfügen",
"insertRowAbove": "Oben {{count}} Zeilen einfügen",
"insertRowBelow": "Unten {{count}} Zeilen einfügen"
},
"typobar": {
"blockquote": "Zitat",
"bold": "Fett",
"bulletList": "Ungeordnete Liste",
"code": "Inline-Code",
"codeblock": "Codeblock",
"italic": "Kursiv",
"link": "Link",
"numberList": "Nummerierte Liste",
"strikethrough": "Durchgestrichen",
"table": "Tabelle",
"taskList": "Aufgabenliste",
"tex": "TeX-Formel",
"underline": "Unterstrichen"
}
}
+3
View File
@@ -5,6 +5,9 @@
"lock": "Seitenverhältnis sperren",
"unlock": "Seitenverhältnis entsperren"
},
"cfg": {
"label": "Führungsstärke"
},
"header": {
"desc": "Einfache Beschreibung, sofortige Kreation",
"title": "Malerei"
+355 -52
View File
@@ -53,6 +53,9 @@
"Baichuan4-Turbo": {
"description": "Das Modell hat die höchste Leistungsfähigkeit im Inland und übertrifft ausländische Mainstream-Modelle in Aufgaben wie Wissensdatenbanken, langen Texten und kreativen Generierungen auf Chinesisch. Es verfügt auch über branchenführende multimodale Fähigkeiten und zeigt in mehreren anerkannten Bewertungsbenchmarks hervorragende Leistungen."
},
"ByteDance-Seed/Seed-OSS-36B-Instruct": {
"description": "Seed-OSS ist eine von ByteDance Seed entwickelten Reihe von Open-Source-Großsprachmodellen, die speziell für leistungsstarke Langkontextverarbeitung, Schlussfolgerungen, Agenten und allgemeine Fähigkeiten konzipiert sind. Das Modell Seed-OSS-36B-Instruct aus dieser Reihe ist ein feinabgestimmtes Instruktionsmodell mit 36 Milliarden Parametern, das nativ extrem lange Kontextlängen unterstützt, wodurch es in der Lage ist, umfangreiche Dokumente oder komplexe Codebasen auf einmal zu verarbeiten. Dieses Modell ist besonders für Schlussfolgerungen, Codegenerierung und Agentenaufgaben (wie Werkzeugnutzung) optimiert und bewahrt dabei eine ausgewogene und hervorragende allgemeine Leistungsfähigkeit. Ein herausragendes Merkmal dieses Modells ist die Funktion \"Thinking Budget\", die es Nutzern ermöglicht, die Schlussfolgerungslänge flexibel anzupassen, um die Effizienz in praktischen Anwendungen effektiv zu steigern."
},
"DeepSeek-R1": {
"description": "Ein hochmodernes, effizientes LLM, das sich auf Schlussfolgerungen, Mathematik und Programmierung spezialisiert hat."
},
@@ -81,7 +84,13 @@
"description": "Modellanbieter: sophnet-Plattform. DeepSeek V3 Fast ist die Hochgeschwindigkeitsversion mit hohem TPS des DeepSeek V3 0324 Modells, voll funktionsfähig ohne Quantisierung, mit stärkerer Code- und mathematischer Leistungsfähigkeit und schnellerer Reaktionszeit!"
},
"DeepSeek-V3.1": {
"description": "DeepSeek-V3.1 ist ein neu eingeführtes hybrides Inferenzmodell von DeepSeek, das zwei Inferenzmodi unterstützt: Denkmodus und Nicht-Denkmodus. Es ist effizienter im Denkprozess als DeepSeek-R1-0528. Durch Post-Training-Optimierung wurden die Nutzung von Agenten-Tools und die Leistung bei Agentenaufgaben erheblich verbessert."
"description": "DeepSeek-V3.1 - Nicht-Denkmodus; DeepSeek-V3.1 ist ein neu eingeführtes hybrides Inferenzmodell von DeepSeek, das zwei Inferenzmodi unterstützt: Denk- und Nicht-Denkmodus, mit höherer Denkeffizienz im Vergleich zu DeepSeek-R1-0528. Durch Post-Training-Optimierung wurde die Leistung bei Agenten-Werkzeugnutzung und Agentenaufgaben deutlich verbessert."
},
"DeepSeek-V3.1-Fast": {
"description": "DeepSeek V3.1 Fast ist die Hochgeschwindigkeitsversion von DeepSeek V3.1 mit hoher TPS. Hybrid-Denkmodus: Durch Änderung der Chat-Vorlage kann ein Modell sowohl Denk- als auch Nicht-Denkmodus gleichzeitig unterstützen. Intelligenterer Werkzeugaufruf: Durch Post-Training-Optimierung wurde die Leistung des Modells bei Werkzeugnutzung und Agentenaufgaben signifikant verbessert."
},
"DeepSeek-V3.1-Think": {
"description": "DeepSeek-V3.1 - Denkmodus; DeepSeek-V3.1 ist ein neu eingeführtes hybrides Inferenzmodell von DeepSeek, das zwei Inferenzmodi unterstützt: Denk- und Nicht-Denkmodus, mit höherer Denkeffizienz im Vergleich zu DeepSeek-R1-0528. Durch Post-Training-Optimierung wurde die Leistung bei Agenten-Werkzeugnutzung und Agentenaufgaben deutlich verbessert."
},
"Doubao-lite-128k": {
"description": "Doubao-lite bietet extrem schnelle Reaktionszeiten und ein hervorragendes Preis-Leistungs-Verhältnis, um Kunden in verschiedenen Szenarien flexiblere Optionen zu bieten. Unterstützt Inferenz und Feintuning mit einem Kontextfenster von 128k."
@@ -281,6 +290,9 @@
"Pro/moonshotai/Kimi-K2-Instruct": {
"description": "Kimi K2 ist ein MoE-Architektur-Basis-Modell mit herausragenden Code- und Agentenfähigkeiten, insgesamt 1 Billion Parameter und 32 Milliarden aktivierten Parametern. In Benchmark-Tests zu allgemeinem Wissen, Programmierung, Mathematik und Agentenaufgaben übertrifft das K2-Modell andere führende Open-Source-Modelle."
},
"Pro/moonshotai/Kimi-K2-Instruct-0905": {
"description": "Kimi K2-Instruct-0905 ist die neueste und leistungsstärkste Version von Kimi K2. Es handelt sich um ein erstklassiges Mixture-of-Experts (MoE) Sprachmodell mit insgesamt 1 Billion Parametern und 32 Milliarden aktivierten Parametern. Die Hauptmerkmale dieses Modells umfassen: verbesserte Agenten-Codierungsintelligenz, die in öffentlichen Benchmark-Tests und realen Agenten-Codierungsaufgaben eine signifikante Leistungssteigerung zeigt; verbesserte Frontend-Codierungserfahrung mit Fortschritten in Ästhetik und Praktikabilität der Frontend-Programmierung."
},
"QwQ-32B-Preview": {
"description": "QwQ-32B-Preview ist ein innovatives Modell für die Verarbeitung natürlicher Sprache, das komplexe Aufgaben der Dialoggenerierung und des Kontextverständnisses effizient bewältigen kann."
},
@@ -590,6 +602,33 @@
"ai21-labs/AI21-Jamba-1.5-Mini": {
"description": "Ein mehrsprachiges Modell mit 52 Milliarden Parametern (davon 12 Milliarden aktiv), das ein 256K langes Kontextfenster, Funktionsaufrufe, strukturierte Ausgaben und faktengestützte Generierung bietet."
},
"alibaba/qwen-3-14b": {
"description": "Qwen3 ist das neueste große Sprachmodell der Qwen-Serie und bietet eine umfassende Palette an dichten und gemischten Experten (MoE) Modellen. Basierend auf umfangreichem Training erzielt Qwen3 bahnbrechende Fortschritte in den Bereichen Inferenz, Befolgung von Anweisungen, Agentenfähigkeiten und mehrsprachige Unterstützung."
},
"alibaba/qwen-3-235b": {
"description": "Qwen3 ist das neueste große Sprachmodell der Qwen-Serie und bietet eine umfassende Palette an dichten und gemischten Experten (MoE) Modellen. Basierend auf umfangreichem Training erzielt Qwen3 bahnbrechende Fortschritte in den Bereichen Inferenz, Befolgung von Anweisungen, Agentenfähigkeiten und mehrsprachige Unterstützung."
},
"alibaba/qwen-3-30b": {
"description": "Qwen3 ist das neueste große Sprachmodell der Qwen-Serie und bietet eine umfassende Palette an dichten und gemischten Experten (MoE) Modellen. Basierend auf umfangreichem Training erzielt Qwen3 bahnbrechende Fortschritte in den Bereichen Inferenz, Befolgung von Anweisungen, Agentenfähigkeiten und mehrsprachige Unterstützung."
},
"alibaba/qwen-3-32b": {
"description": "Qwen3 ist das neueste große Sprachmodell der Qwen-Serie und bietet eine umfassende Palette an dichten und gemischten Experten (MoE) Modellen. Basierend auf umfangreichem Training erzielt Qwen3 bahnbrechende Fortschritte in den Bereichen Inferenz, Befolgung von Anweisungen, Agentenfähigkeiten und mehrsprachige Unterstützung."
},
"alibaba/qwen3-coder": {
"description": "Qwen3-Coder-480B-A35B-Instruct ist das agentenfähigste Codierungsmodell von Qwen mit herausragender Leistung bei Agenten-Codierung, Agenten-Browsernutzung und anderen grundlegenden Codierungsaufgaben, vergleichbar mit Claude Sonnet."
},
"amazon/nova-lite": {
"description": "Ein äußerst kostengünstiges multimodales Modell, das Bilder, Videos und Texteingaben extrem schnell verarbeitet."
},
"amazon/nova-micro": {
"description": "Ein reines Textmodell, das bei sehr niedrigen Kosten die geringste Latenz für Antworten bietet."
},
"amazon/nova-pro": {
"description": "Ein hochkompetentes multimodales Modell mit optimaler Kombination aus Genauigkeit, Geschwindigkeit und Kosten, geeignet für eine breite Palette von Aufgaben."
},
"amazon/titan-embed-text-v2": {
"description": "Amazon Titan Text Embeddings V2 ist ein leichtgewichtiges, effizientes mehrsprachiges Einbettungsmodell mit Unterstützung für 1024, 512 und 256 Dimensionen."
},
"anthropic.claude-3-5-sonnet-20240620-v1:0": {
"description": "Claude 3.5 Sonnet hebt den Branchenstandard an, übertrifft die Konkurrenzmodelle und Claude 3 Opus und zeigt in umfassenden Bewertungen hervorragende Leistungen, während es die Geschwindigkeit und Kosten unserer mittleren Modelle beibehält."
},
@@ -615,25 +654,28 @@
"description": "Die aktualisierte Version von Claude 2 bietet ein doppelt so großes Kontextfenster sowie Verbesserungen in der Zuverlässigkeit, der Halluzinationsrate und der evidenzbasierten Genauigkeit in langen Dokumenten und RAG-Kontexten."
},
"anthropic/claude-3-haiku": {
"description": "Claude 3 Haiku ist das schnellste und kompakteste Modell von Anthropic, das darauf ausgelegt ist, nahezu sofortige Antworten zu liefern. Es bietet schnelle und präzise zielgerichtete Leistungen."
"description": "Claude 3 Haiku ist das bisher schnellste Modell von Anthropic, speziell für Unternehmens-Workloads mit meist längeren Eingabeaufforderungen entwickelt. Haiku kann große Dokumentenmengen wie Quartalsberichte, Verträge oder Rechtsfälle schnell analysieren und kostet dabei nur die Hälfte anderer Modelle seiner Leistungsklasse."
},
"anthropic/claude-3-opus": {
"description": "Claude 3 Opus ist das leistungsstärkste Modell von Anthropic zur Bearbeitung hochkomplexer Aufgaben. Es zeichnet sich durch hervorragende Leistung, Intelligenz, Flüssigkeit und Verständnis aus."
"description": "Claude 3 Opus ist das intelligenteste Modell von Anthropic mit marktführender Leistung bei hochkomplexen Aufgaben. Es meistert offene Eingabeaufforderungen und unbekannte Szenarien mit herausragender Flüssigkeit und menschenähnlichem Verständnis."
},
"anthropic/claude-3.5-haiku": {
"description": "Claude 3.5 Haiku ist das schnellste nächste Generation Modell von Anthropic. Im Vergleich zu Claude 3 Haiku hat Claude 3.5 Haiku in allen Fähigkeiten Fortschritte gemacht und übertrifft in vielen intellektuellen Benchmark-Tests das größte Modell der vorherigen Generation, Claude 3 Opus."
"description": "Claude 3.5 Haiku ist die nächste Generation unseres schnellsten Modells. Mit ähnlicher Geschwindigkeit wie Claude 3 Haiku wurde Claude 3.5 Haiku in allen Kompetenzbereichen verbessert und übertrifft in vielen Intelligenz-Benchmarks unser bisher größtes Modell Claude 3 Opus."
},
"anthropic/claude-3.5-sonnet": {
"description": "Claude 3.5 Sonnet bietet Fähigkeiten, die über Opus hinausgehen, und eine schnellere Geschwindigkeit als Sonnet, während es den gleichen Preis wie Sonnet beibehält. Sonnet ist besonders gut in Programmierung, Datenwissenschaft, visueller Verarbeitung und Agentenaufgaben."
"description": "Claude 3.5 Sonnet erreicht eine ideale Balance zwischen Intelligenz und Geschwindigkeit besonders für Unternehmens-Workloads. Im Vergleich zu ähnlichen Produkten bietet es starke Leistung zu geringeren Kosten und ist für hohe Belastbarkeit bei großflächigen KI-Einsätzen konzipiert."
},
"anthropic/claude-3.7-sonnet": {
"description": "Claude 3.7 Sonnet ist das intelligenteste Modell von Anthropic bis heute und das erste hybride Inferenzmodell auf dem Markt. Claude 3.7 Sonnet kann nahezu sofortige Antworten oder verlängerte, schrittweise Überlegungen erzeugen, wobei die Benutzer diesen Prozess klar nachvollziehen können. Sonnet ist besonders gut in den Bereichen Programmierung, Datenwissenschaft, visuelle Verarbeitung und Agentenaufgaben."
"description": "Claude 3.7 Sonnet ist das erste hybride Inferenzmodell und das intelligenteste Modell von Anthropic bisher. Es bietet modernste Leistung bei Codierung, Inhaltserstellung, Datenanalyse und Planungsaufgaben und baut auf den Software-Engineering- und Computerfähigkeiten seines Vorgängers Claude 3.5 Sonnet auf."
},
"anthropic/claude-opus-4": {
"description": "Claude Opus 4 ist das leistungsstärkste Modell von Anthropic zur Bewältigung hochkomplexer Aufgaben. Es zeichnet sich durch herausragende Leistung, Intelligenz, Flüssigkeit und Verständnis aus."
"description": "Claude Opus 4 ist das leistungsstärkste Modell von Anthropic und das weltweit beste Codierungsmodell mit Spitzenwerten bei SWE-bench (72,5 %) und Terminal-bench (43,2 %). Es bietet anhaltende Leistung für langfristige Aufgaben mit tausenden Schritten und kann stundenlang ununterbrochen arbeiten was die Fähigkeiten von KI-Agenten erheblich erweitert."
},
"anthropic/claude-opus-4.1": {
"description": "Claude Opus 4.1 ist ein Plug-and-Play-Ersatz für Opus 4 und bietet herausragende Leistung und Präzision für praktische Codierungs- und Agentenaufgaben. Opus 4.1 hebt die modernste Codierungsleistung auf 74,5 % bei SWE-bench Verified und behandelt komplexe mehrstufige Probleme mit höherer Genauigkeit und Detailgenauigkeit."
},
"anthropic/claude-sonnet-4": {
"description": "Claude Sonnet 4 kann nahezu sofortige Antworten oder verlängerte schrittweise Überlegungen erzeugen, die für den Nutzer klar nachvollziehbar sind. API-Nutzer können zudem die Denkzeit des Modells präzise steuern."
"description": "Claude Sonnet 4 baut auf den branchenführenden Fähigkeiten von Sonnet 3.7 auf und zeigt herausragende Codierungsleistung mit einem Spitzenwert von 72,7 % bei SWE-bench. Das Modell bietet eine ausgewogene Kombination aus Leistung und Effizienz, geeignet für interne und externe Anwendungsfälle, und ermöglicht durch verbesserte Steuerbarkeit eine größere Kontrolle über die Ergebnisse."
},
"ascend-tribe/pangu-pro-moe": {
"description": "Pangu-Pro-MoE 72B-A16B ist ein spärlich besetztes großes Sprachmodell mit 72 Milliarden Parametern und 16 Milliarden aktivierten Parametern. Es basiert auf der gruppierten Mixture-of-Experts-Architektur (MoGE), bei der Experten in Gruppen eingeteilt werden und Tokens innerhalb jeder Gruppe eine gleiche Anzahl von Experten aktivieren, um eine ausgewogene Expertenauslastung zu gewährleisten. Dies verbessert die Effizienz der Modellausführung auf der Ascend-Plattform erheblich."
@@ -689,6 +731,9 @@
"claude-3-5-haiku-20241022": {
"description": "Claude 3.5 Haiku ist das schnellste nächste Modell von Anthropic. Im Vergleich zu Claude 3 Haiku hat Claude 3.5 Haiku in allen Fähigkeiten Verbesserungen erzielt und übertrifft das vorherige größte Modell, Claude 3 Opus, in vielen intellektuellen Benchmark-Tests."
},
"claude-3-5-haiku-latest": {
"description": "Claude 3.5 Haiku bietet schnelle Reaktionen und eignet sich für leichte Aufgaben."
},
"claude-3-5-sonnet-20240620": {
"description": "Claude 3.5 Sonnet bietet Fähigkeiten, die über Opus hinausgehen, und ist schneller als Sonnet, während es den gleichen Preis wie Sonnet beibehält. Sonnet ist besonders gut in Programmierung, Datenwissenschaft, visueller Verarbeitung und Agenturaufgaben."
},
@@ -698,6 +743,9 @@
"claude-3-7-sonnet-20250219": {
"description": "Claude 3.7 Sonnet hebt den Branchenstandard an, übertrifft die Modelle der Konkurrenz und Claude 3 Opus, und zeigt in umfassenden Bewertungen hervorragende Leistungen, während es die Geschwindigkeit und Kosten unserer mittelgroßen Modelle beibehält."
},
"claude-3-7-sonnet-latest": {
"description": "Claude 3.7 Sonnet ist das neueste und leistungsstärkste Modell von Anthropic für hochkomplexe Aufgaben. Es überzeugt durch herausragende Leistung, Intelligenz, Flüssigkeit und Verständnis."
},
"claude-3-haiku-20240307": {
"description": "Claude 3 Haiku ist das schnellste und kompakteste Modell von Anthropic, das darauf abzielt, nahezu sofortige Antworten zu liefern. Es bietet schnelle und präzise zielgerichtete Leistungen."
},
@@ -710,11 +758,17 @@
"claude-opus-4-1-20250805": {
"description": "Claude Opus 4.1 ist das neueste und leistungsstärkste Modell von Anthropic zur Bewältigung hochkomplexer Aufgaben. Es überzeugt durch herausragende Leistung, Intelligenz, Flüssigkeit und Verständnis."
},
"claude-opus-4-1-20250805-thinking": {
"description": "Claude Opus 4.1 Denkmodell, eine fortgeschrittene Version, die ihren Denkprozess offenlegt."
},
"claude-opus-4-20250514": {
"description": "Claude Opus 4 ist das leistungsstärkste Modell von Anthropic zur Bewältigung hochkomplexer Aufgaben. Es zeichnet sich durch hervorragende Leistung, Intelligenz, Flüssigkeit und Verständnis aus."
},
"claude-sonnet-4-20250514": {
"description": "Claude 4 Sonnet kann nahezu sofortige Antworten oder verlängerte, schrittweise Überlegungen erzeugen, wobei die Benutzer diesen Prozess klar nachvollziehen können. API-Nutzer haben zudem die Möglichkeit, die Denkzeit des Modells detailliert zu steuern."
"description": "Claude Sonnet 4 kann nahezu sofortige Antworten oder verlängerte schrittweise Überlegungen erzeugen, die für den Nutzer klar nachvollziehbar sind."
},
"claude-sonnet-4-20250514-thinking": {
"description": "Claude Sonnet 4 Denkmodell kann nahezu sofortige Antworten oder verlängerte schrittweise Überlegungen erzeugen, die für den Nutzer klar nachvollziehbar sind."
},
"codegeex-4": {
"description": "CodeGeeX-4 ist ein leistungsstarker AI-Programmierassistent, der intelligente Fragen und Codevervollständigung in verschiedenen Programmiersprachen unterstützt und die Entwicklungseffizienz steigert."
@@ -773,6 +827,18 @@
"cohere/Cohere-command-r-plus": {
"description": "Command R+ ist ein hochmodernes, für RAG optimiertes Modell, das für unternehmensweite Arbeitslasten ausgelegt ist."
},
"cohere/command-a": {
"description": "Command A ist das leistungsstärkste Modell von Cohere mit hervorragender Leistung bei Werkzeugnutzung, Agenten, Retrieval-unterstützter Generierung (RAG) und mehrsprachigen Anwendungsfällen. Command A unterstützt eine Kontextlänge von 256K und läuft auf nur zwei GPUs, mit einer 150 % höheren Durchsatzrate im Vergleich zu Command R+ 08-2024."
},
"cohere/command-r": {
"description": "Command R ist ein großes Sprachmodell, optimiert für dialogbasierte Interaktionen und Aufgaben mit langem Kontext. Es gehört zur Kategorie der \"skalierbaren\" Modelle und bietet eine Balance zwischen hoher Leistung und starker Genauigkeit, sodass Unternehmen über Proof-of-Concept hinaus in die Produktion gehen können."
},
"cohere/command-r-plus": {
"description": "Command R+ ist das neueste große Sprachmodell von Cohere, optimiert für dialogbasierte Interaktionen und Aufgaben mit langem Kontext. Es zielt darauf ab, außergewöhnliche Leistung zu bieten, damit Unternehmen über Proof-of-Concept hinaus in die Produktion gehen können."
},
"cohere/embed-v4.0": {
"description": "Ein Modell, das es ermöglicht, Text, Bilder oder gemischte Inhalte zu klassifizieren oder in Einbettungen umzuwandeln."
},
"command": {
"description": "Ein dialogbasiertes Modell, das Anweisungen folgt und in sprachlichen Aufgaben hohe Qualität und Zuverlässigkeit bietet. Im Vergleich zu unserem grundlegenden Generierungsmodell hat es eine längere Kontextlänge."
},
@@ -809,12 +875,6 @@
"command-r7b-12-2024": {
"description": "command-r7b-12-2024 ist eine kompakte und effiziente aktualisierte Version, die im Dezember 2024 veröffentlicht wurde. Es zeigt hervorragende Leistungen in Aufgaben, die komplexes Denken und mehrstufige Verarbeitung erfordern, wie RAG, Werkzeugnutzung und Agenten."
},
"compound-beta": {
"description": "Compound-beta ist ein hybrides KI-System, das von mehreren öffentlich verfügbaren Modellen in GroqCloud unterstützt wird und intelligent und selektiv Werkzeuge zur Beantwortung von Benutzeranfragen einsetzt."
},
"compound-beta-mini": {
"description": "Compound-beta-mini ist ein hybrides KI-System, das von öffentlich verfügbaren Modellen in GroqCloud unterstützt wird und intelligent und selektiv Werkzeuge zur Beantwortung von Benutzeranfragen einsetzt."
},
"computer-use-preview": {
"description": "Das Modell computer-use-preview ist ein speziell für „Computeranwendungstools“ entwickeltes Modell, das darauf trainiert wurde, computerbezogene Aufgaben zu verstehen und auszuführen."
},
@@ -957,7 +1017,7 @@
"description": "DeepSeek-V3.1 ist ein großes hybrides Inferenzmodell, das 128K langen Kontext und effizienten Moduswechsel unterstützt. Es erzielt herausragende Leistung und Geschwindigkeit bei Tool-Aufrufen, Codegenerierung und komplexen Inferenzaufgaben."
},
"deepseek/deepseek-r1": {
"description": "DeepSeek-R1 hat die Schlussfolgerungsfähigkeiten des Modells erheblich verbessert, selbst bei nur wenigen gekennzeichneten Daten. Bevor das Modell die endgültige Antwort ausgibt, gibt es zunächst eine Denkprozesskette aus, um die Genauigkeit der endgültigen Antwort zu erhöhen."
"description": "Das DeepSeek R1 Modell wurde in einer kleinen Version aktualisiert, aktuell DeepSeek-R1-0528. Das neueste Update verbessert die Inferenztiefe und -fähigkeit erheblich durch erhöhte Rechenressourcen und nachträgliche algorithmische Optimierungen. Das Modell zeigt hervorragende Leistungen in Mathematik, Programmierung und allgemeiner Logik und nähert sich führenden Modellen wie O3 und Gemini 2.5 Pro an."
},
"deepseek/deepseek-r1-0528": {
"description": "DeepSeek-R1 verbessert die Modellschlussfolgerungsfähigkeit erheblich, selbst bei sehr begrenzten annotierten Daten. Vor der Ausgabe der endgültigen Antwort generiert das Modell eine Denkprozesskette, um die Genauigkeit der Antwort zu erhöhen."
@@ -966,7 +1026,7 @@
"description": "DeepSeek-R1 verbessert die Modellschlussfolgerungsfähigkeit erheblich, selbst bei sehr begrenzten annotierten Daten. Vor der Ausgabe der endgültigen Antwort generiert das Modell eine Denkprozesskette, um die Genauigkeit der Antwort zu erhöhen."
},
"deepseek/deepseek-r1-distill-llama-70b": {
"description": "DeepSeek R1 Distill Llama 70B ist ein großes Sprachmodell, das auf Llama3.3 70B basiert und durch Feinabstimmung mit den Ausgaben von DeepSeek R1 eine wettbewerbsfähige Leistung erreicht, die mit großen, fortschrittlichen Modellen vergleichbar ist."
"description": "DeepSeek-R1-Distill-Llama-70B ist eine destillierte, effizientere Variante des 70B Llama Modells. Es behält starke Leistung bei Textgenerierungsaufgaben bei und reduziert den Rechenaufwand für einfachere Bereitstellung und Forschung. Betrieben von Groq mit deren maßgeschneiderter Language Processing Unit (LPU) Hardware für schnelle und effiziente Inferenz."
},
"deepseek/deepseek-r1-distill-llama-8b": {
"description": "DeepSeek R1 Distill Llama 8B ist ein distilliertes großes Sprachmodell, das auf Llama-3.1-8B-Instruct basiert und durch Training mit den Ausgaben von DeepSeek R1 erstellt wurde."
@@ -984,7 +1044,10 @@
"description": "DeepSeek-R1 hat die Schlussfolgerungsfähigkeiten des Modells erheblich verbessert, selbst bei nur wenigen gekennzeichneten Daten. Bevor das Modell die endgültige Antwort ausgibt, gibt es zunächst eine Denkprozesskette aus, um die Genauigkeit der endgültigen Antwort zu erhöhen."
},
"deepseek/deepseek-v3": {
"description": "DeepSeek-V3 hat einen bedeutenden Durchbruch in der Inferenzgeschwindigkeit im Vergleich zu früheren Modellen erzielt. Es belegt den ersten Platz unter den Open-Source-Modellen und kann mit den weltweit fortschrittlichsten proprietären Modellen konkurrieren. DeepSeek-V3 verwendet die Multi-Head-Latent-Attention (MLA) und die DeepSeekMoE-Architektur, die in DeepSeek-V2 umfassend validiert wurden. Darüber hinaus hat DeepSeek-V3 eine unterstützende verlustfreie Strategie für die Lastenverteilung eingeführt und mehrere Zielvorgaben für das Training von Mehrfachvorhersagen festgelegt, um eine stärkere Leistung zu erzielen."
"description": "Schnelles, universelles großes Sprachmodell mit verbesserter Inferenzfähigkeit."
},
"deepseek/deepseek-v3.1-base": {
"description": "DeepSeek V3.1 Base ist eine verbesserte Version des DeepSeek V3 Modells."
},
"deepseek/deepseek-v3/community": {
"description": "DeepSeek-V3 hat einen bedeutenden Durchbruch in der Inferenzgeschwindigkeit im Vergleich zu früheren Modellen erzielt. Es belegt den ersten Platz unter den Open-Source-Modellen und kann mit den weltweit fortschrittlichsten proprietären Modellen konkurrieren. DeepSeek-V3 verwendet die Multi-Head-Latent-Attention (MLA) und die DeepSeekMoE-Architektur, die in DeepSeek-V2 umfassend validiert wurden. Darüber hinaus hat DeepSeek-V3 eine unterstützende verlustfreie Strategie für die Lastenverteilung eingeführt und mehrere Zielvorgaben für das Training von Mehrfachvorhersagen festgelegt, um eine stärkere Leistung zu erzielen."
@@ -1055,8 +1118,17 @@
"doubao-seed-1.6-thinking": {
"description": "Das Doubao-Seed-1.6-thinking Modell verfügt über stark verbesserte Denkfähigkeiten. Im Vergleich zu Doubao-1.5-thinking-pro wurden die Grundfähigkeiten in Coding, Mathematik und logischem Denken weiter verbessert und unterstützt visuelles Verständnis. Unterstützt ein Kontextfenster von 256k und eine maximale Ausgabelänge von 16k Tokens."
},
"doubao-seed-1.6-vision": {
"description": "Doubao-Seed-1.6-vision ist ein visuelles Tiefdenkmodell, das in Szenarien wie Bildung, Bildprüfung, Inspektion und Sicherheit sowie KI-Suchfragen eine stärkere allgemeine multimodale Verständnis- und Schlussfolgerungsfähigkeit zeigt. Unterstützt ein Kontextfenster von 256k und eine maximale Ausgabelänge von 64k Tokens."
},
"doubao-seededit-3-0-i2i-250628": {
"description": "Das Doubao-Bildgenerierungsmodell wurde vom Seed-Team von ByteDance entwickelt, unterstützt Texteingaben und Bilder und bietet eine hochgradig kontrollierbare, qualitativ hochwertige Bildgenerierung. Es ermöglicht die Bildbearbeitung mittels Textanweisungen mit Bildseitenlängen zwischen 512 und 1536 Pixel."
},
"doubao-seedream-3-0-t2i-250415": {
"description": "Das Doubao-Bildgenerierungsmodell wurde vom ByteDance Seed Team entwickelt und unterstützt sowohl Text- als auch Bildeingaben, um eine hochgradig kontrollierbare und qualitativ hochwertige Bildgenerierung zu bieten. Es erzeugt Bilder basierend auf Text-Prompts."
"description": "Seedream 3.0 Bildgenerierungsmodell vom Seed-Team von ByteDance, unterstützt Texteingaben und Bilder und bietet eine hochgradig kontrollierbare, qualitativ hochwertige Bildgenerierung. Bilder werden basierend auf Textanweisungen erzeugt."
},
"doubao-seedream-4-0-250828": {
"description": "Seedream 4.0 Bildgenerierungsmodell vom Seed-Team von ByteDance, unterstützt Texteingaben und Bilder und bietet eine hochgradig kontrollierbare, qualitativ hochwertige Bildgenerierung. Bilder werden basierend auf Textanweisungen erzeugt."
},
"doubao-vision-lite-32k": {
"description": "Das Doubao-vision-Modell ist ein multimodales Großmodell von Doubao mit starker Bildverständnis- und Inferenzfähigkeit sowie präziser Befehlsinterpretation. Es zeigt starke Leistung bei der Extraktion von Bild- und Textinformationen sowie bei bildbasierten Inferenzaufgaben und eignet sich für komplexere und umfassendere visuelle Frage-Antwort-Aufgaben."
@@ -1139,6 +1211,33 @@
"ernie-x1-turbo-32k": {
"description": "Im Vergleich zu ERNIE-X1-32K bietet dieses Modell bessere Leistung und Effizienz."
},
"fal-ai/bytedance/seedream/v4": {
"description": "Seedream 4.0 Bildgenerierungsmodell vom Seed-Team von ByteDance, unterstützt Texteingaben und Bilder und bietet eine hochgradig kontrollierbare, qualitativ hochwertige Bildgenerierung. Bilder werden basierend auf Textanweisungen erzeugt."
},
"fal-ai/flux-kontext/dev": {
"description": "FLUX.1 Modell, spezialisiert auf Bildbearbeitungsaufgaben, unterstützt Texteingaben und Bilder."
},
"fal-ai/flux-pro/kontext": {
"description": "FLUX.1 Kontext [pro] kann Texte und Referenzbilder als Eingabe verarbeiten und ermöglicht nahtlose zielgerichtete lokale Bearbeitungen sowie komplexe umfassende Szenenveränderungen."
},
"fal-ai/flux/krea": {
"description": "Flux Krea [dev] ist ein bildgenerierendes Modell mit ästhetischer Präferenz, das darauf abzielt, realistischere und natürlichere Bilder zu erzeugen."
},
"fal-ai/flux/schnell": {
"description": "FLUX.1 [schnell] ist ein bildgenerierendes Modell mit 12 Milliarden Parametern, das sich auf die schnelle Erzeugung hochwertiger Bilder konzentriert."
},
"fal-ai/imagen4/preview": {
"description": "Hochwertiges Bildgenerierungsmodell von Google."
},
"fal-ai/nano-banana": {
"description": "Nano Banana ist Googles neuestes, schnellstes und effizientestes natives multimodales Modell, das es ermöglicht, Bilder durch Dialog zu erzeugen und zu bearbeiten."
},
"fal-ai/qwen-image": {
"description": "Das leistungsstarke Rohbildmodell des Qwen-Teams beeindruckt mit hervorragender chinesischer Textgenerierung und vielfältigen visuellen Bildstilen."
},
"fal-ai/qwen-image-edit": {
"description": "Das professionelle Bildbearbeitungsmodell des Qwen-Teams unterstützt semantische und optische Bearbeitungen, ermöglicht präzise Bearbeitung chinesischer und englischer Texte sowie Stilwechsel, Objektrotation und weitere hochwertige Bildbearbeitungen."
},
"flux-1-schnell": {
"description": "Ein von Black Forest Labs entwickeltes Text-zu-Bild-Modell mit 12 Milliarden Parametern, das latente adversariale Diffusionsdestillation verwendet und in 1 bis 4 Schritten hochwertige Bilder erzeugen kann. Die Leistung ist vergleichbar mit proprietären Alternativen und wird unter der Apache-2.0-Lizenz für private, wissenschaftliche und kommerzielle Nutzung veröffentlicht."
},
@@ -1151,9 +1250,6 @@
"flux-kontext-pro": {
"description": "Modernste kontextbezogene Bildgenerierung und -bearbeitung verbindet Text und Bild zu präzisen, kohärenten Ergebnissen."
},
"flux-kontext/dev": {
"description": "FLUX.1 Modell, spezialisiert auf Bildbearbeitungsaufgaben, unterstützt Text- und Bildeingaben."
},
"flux-merged": {
"description": "Das FLUX.1-merged Modell kombiniert die tiefgehenden Eigenschaften, die in der Entwicklungsphase von „DEV“ erforscht wurden, mit der hohen Ausführungsgeschwindigkeit von „Schnell“. Dadurch werden sowohl die Leistungsgrenzen des Modells erweitert als auch dessen Anwendungsbereich vergrößert."
},
@@ -1166,21 +1262,12 @@
"flux-pro-1.1-ultra": {
"description": "Ultrahochauflösende KI-Bildgenerierung — unterstützt Ausgaben mit 4 Megapixeln und erstellt hochauflösende Bilder innerhalb von 10 Sekunden."
},
"flux-pro/kontext": {
"description": "FLUX.1 Kontext [pro] kann Text und Referenzbilder als Eingabe verarbeiten und ermöglicht nahtlose zielgerichtete lokale Bearbeitungen sowie komplexe umfassende Szenenveränderungen."
},
"flux-schnell": {
"description": "FLUX.1 [schnell] ist das derzeit fortschrittlichste Open-Source-Modell mit wenigen Schritten, das nicht nur Konkurrenten übertrifft, sondern auch leistungsstärkere nicht-feinabgestimmte Modelle wie Midjourney v6.0 und DALL·E 3 (HD) übertrifft. Das Modell wurde speziell feinabgestimmt, um die gesamte Vielfalt der Vortrainingsausgaben zu bewahren. Im Vergleich zu den aktuell besten Modellen auf dem Markt bietet FLUX.1 [schnell] erhebliche Verbesserungen in visueller Qualität, Instruktionsbefolgung, Größen- und Proportionsänderungen, Schriftartenverarbeitung und Ausgabediversität, was den Nutzern eine reichhaltigere und vielfältigere kreative Bildgenerierung ermöglicht."
},
"flux.1-schnell": {
"description": "Ein Rectified Flow Transformer mit 12 Milliarden Parametern, der Bilder basierend auf Textbeschreibungen generieren kann."
},
"flux/krea": {
"description": "Flux Krea [dev] ist ein bildgenerierendes Modell mit ästhetischer Präferenz, das darauf abzielt, realistischere und natürlichere Bilder zu erzeugen."
},
"flux/schnell": {
"description": "FLUX.1 [schnell] ist ein bildgenerierendes Modell mit 12 Milliarden Parametern, das sich auf die schnelle Erstellung hochwertiger Bilder konzentriert."
},
"gemini-1.0-pro-001": {
"description": "Gemini 1.0 Pro 001 (Tuning) bietet stabile und anpassbare Leistung und ist die ideale Wahl für Lösungen komplexer Aufgaben."
},
@@ -1388,20 +1475,26 @@
"glm-zero-preview": {
"description": "GLM-Zero-Preview verfügt über starke Fähigkeiten zur komplexen Schlussfolgerung und zeigt hervorragende Leistungen in den Bereichen logisches Denken, Mathematik und Programmierung."
},
"google/gemini-2.0-flash": {
"description": "Gemini 2.0 Flash bietet Funktionen der nächsten Generation und Verbesserungen, darunter herausragende Geschwindigkeit, integrierte Werkzeugnutzung, multimodale Generierung und ein Kontextfenster von 1 Million Tokens."
},
"google/gemini-2.0-flash-001": {
"description": "Gemini 2.0 Flash bietet nächste Generation Funktionen und Verbesserungen, einschließlich außergewöhnlicher Geschwindigkeit, nativer Werkzeugnutzung, multimodaler Generierung und einem Kontextfenster von 1M Tokens."
},
"google/gemini-2.0-flash-exp:free": {
"description": "Gemini 2.0 Flash Experimental ist Googles neuestes experimentelles multimodales KI-Modell, das im Vergleich zu früheren Versionen eine gewisse Qualitätsverbesserung aufweist, insbesondere in Bezug auf Weltwissen, Code und langen Kontext."
},
"google/gemini-2.0-flash-lite": {
"description": "Gemini 2.0 Flash Lite bietet Funktionen der nächsten Generation und Verbesserungen, darunter herausragende Geschwindigkeit, integrierte Werkzeugnutzung, multimodale Generierung und ein Kontextfenster von 1 Million Tokens."
},
"google/gemini-2.5-flash": {
"description": "Gemini 2.5 Flash ist Googles fortschrittlichstes Hauptmodell, speziell entwickelt für anspruchsvolle Aufgaben in den Bereichen logisches Denken, Programmierung, Mathematik und Wissenschaft. Es verfügt über eingebaute \"Denkfähigkeiten\", die es ermöglichen, Antworten mit höherer Genauigkeit und detaillierter Kontextverarbeitung zu liefern.\n\nHinweis: Dieses Modell gibt es in zwei Varianten: mit und ohne Denkfähigkeit. Die Preisgestaltung für die Ausgabe variiert erheblich, je nachdem, ob die Denkfähigkeit aktiviert ist. Wenn Sie die Standardvariante (ohne den Suffix \":thinking\") wählen, vermeidet das Modell ausdrücklich die Erzeugung von Denk-Token.\n\nUm die Denkfähigkeit zu nutzen und Denk-Token zu erhalten, müssen Sie die \":thinking\"-Variante wählen, was zu höheren Kosten für die Denk-Ausgabe führt.\n\nDarüber hinaus kann Gemini 2.5 Flash über den Parameter \"Maximale Tokenanzahl für das Denken\" konfiguriert werden, wie in der Dokumentation beschrieben (https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning)."
"description": "Gemini 2.5 Flash ist ein Denkmodell mit hervorragenden umfassenden Fähigkeiten. Es ist auf ein ausgewogenes Verhältnis von Preis und Leistung ausgelegt und unterstützt multimodale Eingaben sowie ein Kontextfenster von 1 Million Tokens."
},
"google/gemini-2.5-flash-image-preview": {
"description": "Gemini 2.5 Flash Experimentelles Modell, unterstützt Bildgenerierung"
},
"google/gemini-2.5-flash-image-preview:free": {
"description": "Gemini 2.5 Flash Experimentelles Modell, unterstützt Bildgenerierung"
"google/gemini-2.5-flash-lite": {
"description": "Gemini 2.5 Flash-Lite ist ein ausgewogenes, latenzarmes Modell mit konfigurierbarem Denkbudget und Werkzeuganbindung (z. B. Google Search Grounding und Codeausführung). Es unterstützt multimodale Eingaben und bietet ein Kontextfenster von 1 Million Tokens."
},
"google/gemini-2.5-flash-preview": {
"description": "Gemini 2.5 Flash ist Googles fortschrittlichstes Hauptmodell, das für fortgeschrittenes Denken, Codierung, Mathematik und wissenschaftliche Aufgaben entwickelt wurde. Es enthält die eingebaute Fähigkeit zu \"denken\", was es ihm ermöglicht, Antworten mit höherer Genauigkeit und detaillierter Kontextverarbeitung zu liefern.\n\nHinweis: Dieses Modell hat zwei Varianten: Denken und Nicht-Denken. Die Ausgabepreise variieren erheblich, je nachdem, ob die Denkfähigkeit aktiviert ist oder nicht. Wenn Sie die Standardvariante (ohne den Suffix \":thinking\") wählen, wird das Modell ausdrücklich vermeiden, Denk-Tokens zu generieren.\n\nUm die Denkfähigkeit zu nutzen und Denk-Tokens zu erhalten, müssen Sie die \":thinking\"-Variante wählen, was zu höheren Preisen für Denk-Ausgaben führt.\n\nDarüber hinaus kann Gemini 2.5 Flash über den Parameter \"maximale Tokenanzahl für das Denken\" konfiguriert werden, wie in der Dokumentation beschrieben (https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning)."
@@ -1410,11 +1503,14 @@
"description": "Gemini 2.5 Flash ist Googles fortschrittlichstes Hauptmodell, das für fortgeschrittenes Denken, Codierung, Mathematik und wissenschaftliche Aufgaben entwickelt wurde. Es enthält die eingebaute Fähigkeit zu \"denken\", was es ihm ermöglicht, Antworten mit höherer Genauigkeit und detaillierter Kontextverarbeitung zu liefern.\n\nHinweis: Dieses Modell hat zwei Varianten: Denken und Nicht-Denken. Die Ausgabepreise variieren erheblich, je nachdem, ob die Denkfähigkeit aktiviert ist oder nicht. Wenn Sie die Standardvariante (ohne den Suffix \":thinking\") wählen, wird das Modell ausdrücklich vermeiden, Denk-Tokens zu generieren.\n\nUm die Denkfähigkeit zu nutzen und Denk-Tokens zu erhalten, müssen Sie die \":thinking\"-Variante wählen, was zu höheren Preisen für Denk-Ausgaben führt.\n\nDarüber hinaus kann Gemini 2.5 Flash über den Parameter \"maximale Tokenanzahl für das Denken\" konfiguriert werden, wie in der Dokumentation beschrieben (https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning)."
},
"google/gemini-2.5-pro": {
"description": "Gemini 2.5 Pro ist Googles fortschrittlichstes Denkmodell, das in der Lage ist, komplexe Probleme in den Bereichen Code, Mathematik und MINT-Fächer zu analysieren sowie große Datensätze, Codebasen und Dokumente mit langem Kontext zu untersuchen."
"description": "Gemini 2.5 Pro ist unser fortschrittlichstes Inferenz-Gemini-Modell, das komplexe Probleme lösen kann. Es verfügt über ein Kontextfenster von 2 Millionen Tokens und unterstützt multimodale Eingaben, darunter Text, Bilder, Audio, Video und PDF-Dokumente."
},
"google/gemini-2.5-pro-preview": {
"description": "Gemini 2.5 Pro Preview ist Googles fortschrittlichstes Denkmodell, das in der Lage ist, komplexe Probleme in den Bereichen Code, Mathematik und MINT zu analysieren sowie große Datensätze, Codebasen und Dokumente mit langem Kontext zu untersuchen."
},
"google/gemini-embedding-001": {
"description": "Modernstes Einbettungsmodell mit hervorragender Leistung bei englischen, mehrsprachigen und Code-Aufgaben."
},
"google/gemini-flash-1.5": {
"description": "Gemini 1.5 Flash bietet optimierte multimodale Verarbeitungsfähigkeiten, die für verschiedene komplexe Aufgabenszenarien geeignet sind."
},
@@ -1442,12 +1538,21 @@
"google/gemma-2b-it": {
"description": "Gemma Instruct (2B) bietet grundlegende Anweisungsverarbeitungsfähigkeiten und eignet sich für leichte Anwendungen."
},
"google/gemma-3-12b-it": {
"description": "Gemma 3 12B ist ein Open-Source-Sprachmodell von Google, das neue Maßstäbe in Effizienz und Leistung setzt."
},
"google/gemma-3-1b-it": {
"description": "Gemma 3 1B ist ein Open-Source-Sprachmodell von Google, das neue Maßstäbe in Effizienz und Leistung setzt."
},
"google/gemma-3-27b-it": {
"description": "Gemma 3 27B ist ein Open-Source-Sprachmodell von Google, das neue Maßstäbe in Bezug auf Effizienz und Leistung setzt."
},
"google/text-embedding-005": {
"description": "Englisch-fokussiertes Texteingebettetes Modell, optimiert für Code- und englischsprachige Aufgaben."
},
"google/text-multilingual-embedding-002": {
"description": "Mehrsprachiges Texteingebettetes Modell, optimiert für sprachübergreifende Aufgaben und unterstützt mehrere Sprachen."
},
"gpt-3.5-turbo": {
"description": "GPT 3.5 Turbo eignet sich für eine Vielzahl von Textgenerierungs- und Verständnisaufgaben. Derzeit verweist es auf gpt-3.5-turbo-0125."
},
@@ -1604,9 +1709,18 @@
"grok-4": {
"description": "Unser neuestes und leistungsstärkstes Flaggschiffmodell, das in der Verarbeitung natürlicher Sprache, mathematischen Berechnungen und logischem Denken herausragende Leistungen erbringt ein perfekter Allrounder."
},
"grok-4-0709": {
"description": "xAI's Grok 4 mit starker Schlussfolgerungsfähigkeit."
},
"grok-code-fast-1": {
"description": "Wir freuen uns, grok-code-fast-1 vorzustellen, ein schnelles und kosteneffizientes Inferenzmodell, das sich durch hervorragende Leistung bei der Agentencodierung auszeichnet."
},
"groq/compound": {
"description": "Compound ist ein zusammengesetztes KI-System, das von mehreren bereits in GroqCloud unterstützten öffentlich verfügbaren Modellen getragen wird und intelligent sowie selektiv Werkzeuge zur Beantwortung von Nutzeranfragen einsetzt."
},
"groq/compound-mini": {
"description": "Compound-mini ist ein zusammengesetztes KI-System, das von öffentlich verfügbaren Modellen unterstützt wird, die bereits in GroqCloud verfügbar sind, und intelligent sowie selektiv Werkzeuge zur Beantwortung von Nutzeranfragen einsetzt."
},
"gryphe/mythomax-l2-13b": {
"description": "MythoMax l2 13B ist ein Sprachmodell, das Kreativität und Intelligenz kombiniert und mehrere führende Modelle integriert."
},
@@ -1662,7 +1776,7 @@
"description": "Erhebliche Verbesserungen bei anspruchsvoller Mathematik, Logik und Programmierfähigkeiten, Optimierung der Modellstabilität und Steigerung der Leistungsfähigkeit bei langen Texten."
},
"hunyuan-t1-latest": {
"description": "Das erste ultra-skalierbare Hybrid-Transformer-Mamba-Inferenzmodell der Branche, das die Inferenzfähigkeiten erweitert, eine extrem hohe Dekodierungsgeschwindigkeit bietet und weiter auf menschliche Präferenzen abgestimmt ist."
"description": "Erhebliche Verbesserung der Fähigkeiten des Hauptmodells im langsamen Denkmodus bei anspruchsvoller Mathematik, komplexen Schlussfolgerungen, anspruchsvollem Code, Befolgung von Anweisungen und Textkreation."
},
"hunyuan-t1-vision": {
"description": "Hunyuan ist ein multimodales Verständnis- und Tiefdenkmodell, das native multimodale lange Denkprozesse unterstützt. Es ist spezialisiert auf verschiedene Bildinferenzszenarien und zeigt im Vergleich zu Schnelldenkmodellen umfassende Verbesserungen bei naturwissenschaftlichen Problemen."
@@ -1730,8 +1844,11 @@
"imagen-4.0-ultra-generate-preview-06-06": {
"description": "Imagen 4. Generation Text-zu-Bild Modellserie Ultra-Version"
},
"imagen4/preview": {
"description": "Hochwertiges bildgenerierendes Modell von Google."
"inception/mercury-coder-small": {
"description": "Mercury Coder Small ist ideal für Codegenerierung, Debugging und Refactoring-Aufgaben mit minimaler Latenz."
},
"inclusionAI/Ling-mini-2.0": {
"description": "Ling-mini-2.0 ist ein kleines, leistungsstarkes großes Sprachmodell basierend auf der MoE-Architektur. Es verfügt über 16 Milliarden Gesamtparameter, aktiviert jedoch pro Token nur 1,4 Milliarden (nicht-Embedding 789 Millionen), was eine extrem hohe Generierungsgeschwindigkeit ermöglicht. Dank des effizienten MoE-Designs und umfangreicher, qualitativ hochwertiger Trainingsdaten zeigt Ling-mini-2.0 trotz nur 1,4 Milliarden aktivierter Parameter Spitzenleistungen bei nachgelagerten Aufgaben, die mit dichten LLMs unter 10 Milliarden und größeren MoE-Modellen vergleichbar sind."
},
"internlm/internlm2_5-7b-chat": {
"description": "InternLM2.5 bietet intelligente Dialoglösungen in mehreren Szenarien."
@@ -1766,6 +1883,9 @@
"kimi-k2-0711-preview": {
"description": "kimi-k2 ist ein MoE-Architektur-Basis-Modell mit außergewöhnlichen Fähigkeiten in Code und Agentenfunktionen, mit insgesamt 1 Billion Parametern und 32 Milliarden aktiven Parametern. In Benchmark-Tests zu allgemeinem Wissen, Programmierung, Mathematik und Agenten übertrifft das K2-Modell andere führende Open-Source-Modelle."
},
"kimi-k2-0905-preview": {
"description": "Das Modell kimi-k2-0905-preview hat eine Kontextlänge von 256k, verfügt über stärkere Agentic-Coding-Fähigkeiten, eine herausragendere Ästhetik und Praktikabilität von Frontend-Code sowie ein besseres Kontextverständnis."
},
"kimi-k2-turbo-preview": {
"description": "kimi-k2 ist ein Basis-Modell mit MoE-Architektur und besonders starken Fähigkeiten im Bereich Code und Agenten. Es verfügt über insgesamt 1T Parameter und 32B aktivierte Parameter. In Benchmark-Tests der wichtigsten Kategorien allgemeines Wissens-Reasoning, Programmierung, Mathematik und Agenten übertrifft das K2-Modell die Leistung anderer gängiger OpenSourceModelle."
},
@@ -2003,30 +2123,63 @@
"meta/Meta-Llama-3.1-8B-Instruct": {
"description": "Llama 3.1 ist ein instruktionsoptimiertes Textmodell, das für mehrsprachige Dialoganwendungen optimiert wurde und in vielen verfügbaren offenen und geschlossenen Chatmodellen bei gängigen Branchenbenchmarks hervorragende Leistungen zeigt."
},
"meta/llama-3-70b": {
"description": "Ein von Meta sorgfältig für die Befolgung von Anweisungen abgestimmtes Open-Source-Modell mit 70 Milliarden Parametern. Betrieben von Groq mit deren maßgeschneiderter Language Processing Unit (LPU) Hardware für schnelle und effiziente Inferenz."
},
"meta/llama-3-8b": {
"description": "Ein von Meta sorgfältig für die Befolgung von Anweisungen abgestimmtes Open-Source-Modell mit 8 Milliarden Parametern. Betrieben von Groq mit deren maßgeschneiderter Language Processing Unit (LPU) Hardware für schnelle und effiziente Inferenz."
},
"meta/llama-3.1-405b-instruct": {
"description": "Fortgeschrittenes LLM, das die Generierung synthetischer Daten, Wissensverdichtung und Schlussfolgerungen unterstützt, geeignet für Chatbots, Programmierung und spezifische Aufgaben."
},
"meta/llama-3.1-70b": {
"description": "Aktualisierte Version von Meta Llama 3 70B Instruct mit erweitertem 128K Kontextfenster, Mehrsprachigkeit und verbesserter Inferenzfähigkeit."
},
"meta/llama-3.1-70b-instruct": {
"description": "Ermöglicht komplexe Gespräche mit hervorragendem Kontextverständnis, Schlussfolgerungsfähigkeiten und Textgenerierungsfähigkeiten."
},
"meta/llama-3.1-8b": {
"description": "Llama 3.1 8B unterstützt ein 128K Kontextfenster und ist ideal für Echtzeit-Dialogschnittstellen und Datenanalysen, während es im Vergleich zu größeren Modellen erhebliche Kosteneinsparungen bietet. Betrieben von Groq mit deren maßgeschneiderter Language Processing Unit (LPU) Hardware für schnelle und effiziente Inferenz."
},
"meta/llama-3.1-8b-instruct": {
"description": "Fortschrittliches, hochmodernes Modell mit Sprachverständnis, hervorragenden Schlussfolgerungsfähigkeiten und Textgenerierungsfähigkeiten."
},
"meta/llama-3.2-11b": {
"description": "Anweisungsabgestimmtes Bildinferenz-Generierungsmodell (Text + Bildeingabe / Textausgabe), optimiert für visuelle Erkennung, Bildinferenz, Bildunterschriftenerstellung und allgemeine Fragen zu Bildern."
},
"meta/llama-3.2-11b-vision-instruct": {
"description": "Spitzenmäßiges visuelles Sprachmodell, das in der Lage ist, qualitativ hochwertige Schlussfolgerungen aus Bildern zu ziehen."
},
"meta/llama-3.2-1b": {
"description": "Reines Textmodell, unterstützt On-Device-Anwendungsfälle wie mehrsprachige lokale Wissenssuche, Zusammenfassung und Umschreibung."
},
"meta/llama-3.2-1b-instruct": {
"description": "Fortschrittliches, hochmodernes kleines Sprachmodell mit Sprachverständnis, hervorragenden Schlussfolgerungsfähigkeiten und Textgenerierungsfähigkeiten."
},
"meta/llama-3.2-3b": {
"description": "Reines Textmodell, sorgfältig abgestimmt zur Unterstützung von On-Device-Anwendungsfällen wie mehrsprachige lokale Wissenssuche, Zusammenfassung und Umschreibung."
},
"meta/llama-3.2-3b-instruct": {
"description": "Fortschrittliches, hochmodernes kleines Sprachmodell mit Sprachverständnis, hervorragenden Schlussfolgerungsfähigkeiten und Textgenerierungsfähigkeiten."
},
"meta/llama-3.2-90b": {
"description": "Anweisungsabgestimmtes Bildinferenz-Generierungsmodell (Text + Bildeingabe / Textausgabe), optimiert für visuelle Erkennung, Bildinferenz, Bildunterschriftenerstellung und allgemeine Fragen zu Bildern."
},
"meta/llama-3.2-90b-vision-instruct": {
"description": "Spitzenmäßiges visuelles Sprachmodell, das in der Lage ist, qualitativ hochwertige Schlussfolgerungen aus Bildern zu ziehen."
},
"meta/llama-3.3-70b": {
"description": "Perfekte Kombination aus Leistung und Effizienz. Das Modell unterstützt leistungsstarke Dialog-KI, ist für Inhaltserstellung, Unternehmensanwendungen und Forschung konzipiert und bietet fortschrittliche Sprachverständnisfähigkeiten, einschließlich Textzusammenfassung, Klassifikation, Sentimentanalyse und Codegenerierung."
},
"meta/llama-3.3-70b-instruct": {
"description": "Fortschrittliches LLM, das auf Schlussfolgern, Mathematik, Allgemeinwissen und Funktionsaufrufen spezialisiert ist."
},
"meta/llama-4-maverick": {
"description": "Die Llama 4 Modellreihe sind native multimodale KI-Modelle, die Text- und multimodale Erlebnisse unterstützen. Diese Modelle nutzen eine gemischte Expertenarchitektur und bieten branchenführende Leistung bei Text- und Bildverständnis. Llama 4 Maverick ist ein 17 Milliarden Parameter Modell mit 128 Experten. Bereitgestellt von DeepInfra."
},
"meta/llama-4-scout": {
"description": "Die Llama 4 Modellreihe sind native multimodale KI-Modelle, die Text- und multimodale Erlebnisse unterstützen. Diese Modelle nutzen eine gemischte Expertenarchitektur und bieten branchenführende Leistung bei Text- und Bildverständnis. Llama 4 Scout ist ein 17 Milliarden Parameter Modell mit 16 Experten. Bereitgestellt von DeepInfra."
},
"microsoft/Phi-3-medium-128k-instruct": {
"description": "Dasselbe Phi-3-medium-Modell, jedoch mit größerem Kontextfenster, geeignet für RAG oder wenige Eingabeaufforderungen."
},
@@ -2102,6 +2255,48 @@
"mistral-small-latest": {
"description": "Mistral Small ist eine kosteneffiziente, schnelle und zuverlässige Option für Anwendungsfälle wie Übersetzung, Zusammenfassung und Sentimentanalyse."
},
"mistral/codestral": {
"description": "Mistral Codestral 25.01 ist ein hochmodernes Codierungsmodell, optimiert für latenzarme und hochfrequente Anwendungsfälle. Es beherrscht über 80 Programmiersprachen und zeigt hervorragende Leistungen bei Aufgaben wie Fill-in-the-Middle (FIM), Codekorrektur und Testgenerierung."
},
"mistral/codestral-embed": {
"description": "Ein Code-Einbettungsmodell, das in Code-Datenbanken und Repositories eingebettet werden kann, um Codierungsassistenten zu unterstützen."
},
"mistral/devstral-small": {
"description": "Devstral ist ein agentenfähiges großes Sprachmodell für Software-Engineering-Aufgaben und somit eine ausgezeichnete Wahl für Software-Engineering-Agenten."
},
"mistral/magistral-medium": {
"description": "Komplexes Denken, unterstützt durch tiefes Verständnis mit nachvollziehbarer und überprüfbarer transparenter Argumentation. Das Modell behält auch bei Sprachwechseln während der Aufgabe eine hohe Genauigkeit in vielen Sprachen bei."
},
"mistral/magistral-small": {
"description": "Komplexes Denken, unterstützt durch tiefes Verständnis mit nachvollziehbarer und überprüfbarer transparenter Argumentation. Das Modell behält auch bei Sprachwechseln während der Aufgabe eine hohe Genauigkeit in vielen Sprachen bei."
},
"mistral/ministral-3b": {
"description": "Ein kompaktes, effizientes Modell für On-Device-Aufgaben wie intelligente Assistenten und lokale Analysen mit niedriger Latenz."
},
"mistral/ministral-8b": {
"description": "Ein leistungsfähigeres Modell mit schnellerer und speichereffizienter Inferenz, ideal für komplexe Workflows und anspruchsvolle Edge-Anwendungen."
},
"mistral/mistral-embed": {
"description": "Universelles Texteingebettetes Modell für semantische Suche, Ähnlichkeit, Clustering und RAG-Workflows."
},
"mistral/mistral-large": {
"description": "Mistral Large ist ideal für komplexe Aufgaben, die große Inferenzkapazitäten oder hohe Spezialisierung erfordern wie synthetische Textgenerierung, Codegenerierung, RAG oder Agenten."
},
"mistral/mistral-saba-24b": {
"description": "Mistral Saba 24B ist ein 24 Milliarden Parameter Open-Source-Modell von Mistral.ai. Saba ist ein spezialisiertes Modell, das für herausragende Leistungen in Arabisch, Persisch, Urdu, Hebräisch und indischen Sprachen trainiert wurde. Betrieben von Groq mit deren maßgeschneiderter Language Processing Unit (LPU) Hardware für schnelle und effiziente Inferenz."
},
"mistral/mistral-small": {
"description": "Mistral Small ist ideal für einfache Aufgaben, die in großen Mengen ausgeführt werden können wie Klassifikation, Kundensupport oder Textgenerierung. Es bietet hervorragende Leistung zu einem erschwinglichen Preis."
},
"mistral/mixtral-8x22b-instruct": {
"description": "8x22b Instruct Modell. 8x22b ist ein von Mistral bereitgestelltes gemischtes Experten-Open-Source-Modell."
},
"mistral/pixtral-12b": {
"description": "Ein 12 Milliarden Parameter Modell mit Bildverständnisfähigkeiten sowie Text."
},
"mistral/pixtral-large": {
"description": "Pixtral Large ist das zweite Modell unserer multimodalen Familie und demonstriert Spitzenleistungen im Bildverständnis. Insbesondere kann das Modell Dokumente, Diagramme und natürliche Bilder verstehen und behält dabei die führenden Textverständnisfähigkeiten von Mistral Large 2 bei."
},
"mistralai/Mistral-7B-Instruct-v0.1": {
"description": "Mistral (7B) Instruct ist bekannt für seine hohe Leistung und eignet sich für eine Vielzahl von Sprachaufgaben."
},
@@ -2165,8 +2360,23 @@
"moonshotai/Kimi-K2-Instruct": {
"description": "Kimi K2 ist ein MoE-Basis-Modell mit herausragenden Code- und Agentenfähigkeiten, insgesamt 1 Billion Parameter und 32 Milliarden aktivierten Parametern. In Benchmark-Tests zu allgemeinem Wissen, Programmierung, Mathematik und Agentenaufgaben übertrifft das K2-Modell andere führende Open-Source-Modelle."
},
"moonshotai/kimi-k2-instruct": {
"description": "kimi-k2 ist ein MoE-Architektur-Basismodell mit außergewöhnlichen Fähigkeiten in Code und Agenten, mit insgesamt 1 Billion Parametern und 32 Milliarden aktiven Parametern. In Benchmark-Tests zu allgemeinem Wissen, Programmierung, Mathematik und Agenten übertrifft das K2-Modell andere führende Open-Source-Modelle."
"moonshotai/Kimi-K2-Instruct-0905": {
"description": "Kimi K2-Instruct-0905 ist die neueste und leistungsstärkste Version von Kimi K2. Es handelt sich um ein erstklassiges Mixture-of-Experts (MoE) Sprachmodell mit insgesamt 1 Billion Parametern und 32 Milliarden aktivierten Parametern. Die Hauptmerkmale dieses Modells umfassen: verbesserte Agenten-Codierungsintelligenz, die in öffentlichen Benchmark-Tests und realen Agenten-Codierungsaufgaben eine signifikante Leistungssteigerung zeigt; verbesserte Frontend-Codierungserfahrung mit Fortschritten in Ästhetik und Praktikabilität der Frontend-Programmierung."
},
"moonshotai/kimi-k2": {
"description": "Kimi K2 ist ein von Moonshot AI entwickeltes großes gemischtes Experten (MoE) Sprachmodell mit insgesamt 1 Billion Parametern und 32 Milliarden aktiven Parametern pro Vorwärtsdurchlauf. Es ist auf Agentenfähigkeiten optimiert, einschließlich fortgeschrittener Werkzeugnutzung, Inferenz und Code-Synthese."
},
"moonshotai/kimi-k2-0905": {
"description": "Das Modell kimi-k2-0905-preview hat eine Kontextlänge von 256k, verfügt über stärkere Agentic-Coding-Fähigkeiten, eine herausragendere Ästhetik und Praktikabilität von Frontend-Code sowie ein besseres Kontextverständnis."
},
"moonshotai/kimi-k2-instruct-0905": {
"description": "Das Modell kimi-k2-0905-preview hat eine Kontextlänge von 256k, verfügt über stärkere Agentic-Coding-Fähigkeiten, eine herausragendere Ästhetik und Praktikabilität von Frontend-Code sowie ein besseres Kontextverständnis."
},
"morph/morph-v3-fast": {
"description": "Morph bietet ein spezialisiertes KI-Modell, das von führenden Modellen wie Claude oder GPT-4o vorgeschlagene Codeänderungen schnell auf Ihre bestehenden Code-Dateien anwendet mit über 4500 Tokens pro Sekunde. Es fungiert als letzter Schritt im KI-Codierungsworkflow und unterstützt 16k Eingabe- und 16k Ausgabe-Tokens."
},
"morph/morph-v3-large": {
"description": "Morph bietet ein spezialisiertes KI-Modell, das von führenden Modellen wie Claude oder GPT-4o vorgeschlagene Codeänderungen schnell auf Ihre bestehenden Code-Dateien anwendet mit über 2500 Tokens pro Sekunde. Es fungiert als letzter Schritt im KI-Codierungsworkflow und unterstützt 16k Eingabe- und 16k Ausgabe-Tokens."
},
"nousresearch/hermes-2-pro-llama-3-8b": {
"description": "Hermes 2 Pro Llama 3 8B ist die aktualisierte Version von Nous Hermes 2 und enthält die neuesten intern entwickelten Datensätze."
@@ -2195,6 +2405,9 @@
"o3": {
"description": "o3 ist ein vielseitiges und leistungsstarkes Modell, das in mehreren Bereichen hervorragende Leistungen zeigt. Es setzt neue Maßstäbe für mathematische, wissenschaftliche, programmiertechnische und visuelle Schlussfolgerungsaufgaben. Es ist auch versiert in technischer Schreibweise und der Befolgung von Anweisungen. Benutzer können es nutzen, um Texte, Code und Bilder zu analysieren und komplexe Probleme mit mehreren Schritten zu lösen."
},
"o3-2025-04-16": {
"description": "o3 ist das neue Schlussfolgerungsmodell von OpenAI, unterstützt Bild- und Texteingaben und gibt Text aus, geeignet für komplexe Aufgaben mit umfangreichem Allgemeinwissen."
},
"o3-deep-research": {
"description": "o3-deep-research ist unser fortschrittlichstes Deep-Research-Modell, das speziell für die Bearbeitung komplexer, mehrstufiger Forschungsaufgaben entwickelt wurde. Es kann Informationen aus dem Internet suchen und zusammenfassen sowie über den MCP-Connector auf Ihre eigenen Daten zugreifen und diese nutzen."
},
@@ -2204,9 +2417,15 @@
"o3-pro": {
"description": "Das o3-pro Modell verwendet mehr Rechenleistung für tiefere Überlegungen und liefert stets bessere Antworten. Es ist ausschließlich über die Responses API nutzbar."
},
"o3-pro-2025-06-10": {
"description": "o3 Pro ist das neue Schlussfolgerungsmodell von OpenAI, unterstützt Bild- und Texteingaben und gibt Text aus, geeignet für komplexe Aufgaben mit umfangreichem Allgemeinwissen."
},
"o4-mini": {
"description": "o4-mini ist unser neuestes kompaktes Modell der o-Serie. Es wurde für schnelle und effektive Inferenz optimiert und zeigt in Programmier- und visuellen Aufgaben eine hohe Effizienz und Leistung."
},
"o4-mini-2025-04-16": {
"description": "o4-mini ist ein Schlussfolgerungsmodell von OpenAI, unterstützt Bild- und Texteingaben und gibt Text aus, geeignet für komplexe Aufgaben mit umfangreichem Allgemeinwissen. Das Modell verfügt über einen Kontextumfang von 200.000 Token."
},
"o4-mini-deep-research": {
"description": "o4-mini-deep-research ist unser schnelleres und kostengünstigeres Deep-Research-Modell ideal für die Bearbeitung komplexer, mehrstufiger Forschungsaufgaben. Es kann Informationen aus dem Internet suchen und zusammenfassen sowie über den MCP-Connector auf Ihre eigenen Daten zugreifen und diese nutzen."
},
@@ -2225,29 +2444,47 @@
"open-mixtral-8x7b": {
"description": "Mixtral 8x7B ist ein spärliches Expertenmodell, das mehrere Parameter nutzt, um die Schlussfolgerungsgeschwindigkeit zu erhöhen und sich für die Verarbeitung mehrsprachiger und Codegenerierungsaufgaben eignet."
},
"openai/gpt-3.5-turbo": {
"description": "OpenAIs leistungsfähigstes und kosteneffizientestes Modell der GPT-3.5-Reihe, optimiert für Chat-Anwendungen, aber auch gut für traditionelle Completion-Aufgaben geeignet."
},
"openai/gpt-3.5-turbo-instruct": {
"description": "Fähigkeiten ähnlich den Modellen der GPT-3-Ära. Kompatibel mit traditionellen Completion-Endpunkten, nicht mit Chat-Completion-Endpunkten."
},
"openai/gpt-4-turbo": {
"description": "OpenAIs gpt-4-turbo verfügt über umfangreiches Allgemeinwissen und Fachkenntnisse, kann komplexen natürlichen Sprachbefehlen folgen und schwierige Probleme präzise lösen. Wissensstand bis April 2023, Kontextfenster von 128.000 Tokens."
},
"openai/gpt-4.1": {
"description": "GPT-4.1 ist unser Flaggschiff-Modell für komplexe Aufgaben. Es eignet sich hervorragend zur Lösung von Problemen über verschiedene Fachgebiete hinweg."
"description": "GPT 4.1 ist das Flaggschiffmodell von OpenAI, geeignet für komplexe Aufgaben. Es ist hervorragend für interdisziplinäre Problemlösungen."
},
"openai/gpt-4.1-mini": {
"description": "GPT-4.1 mini bietet ein Gleichgewicht zwischen Intelligenz, Geschwindigkeit und Kosten, was es zu einem attraktiven Modell für viele Anwendungsfälle macht."
"description": "GPT 4.1 mini bietet eine ausgewogene Kombination aus Intelligenz, Geschwindigkeit und Kosten und ist damit für viele Anwendungsfälle attraktiv."
},
"openai/gpt-4.1-nano": {
"description": "GPT-4.1 nano ist das schnellste und kosteneffektivste Modell der GPT-4.1-Reihe."
"description": "GPT-4.1 nano ist das schnellste und kosteneffizienteste Modell der GPT 4.1 Reihe."
},
"openai/gpt-4o": {
"description": "ChatGPT-4o ist ein dynamisches Modell, das in Echtzeit aktualisiert wird, um die neueste Version zu gewährleisten. Es kombiniert starke Sprachverständnis- und Generierungsfähigkeiten und eignet sich für großangelegte Anwendungsszenarien, einschließlich Kundenservice, Bildung und technischem Support."
"description": "GPT-4o von OpenAI verfügt über umfangreiches Allgemeinwissen und Fachkenntnisse, kann komplexen natürlichen Sprachbefehlen folgen und schwierige Probleme präzise lösen. Es bietet die Leistung von GPT-4 Turbo mit schnellerem und kostengünstigerem API-Zugriff."
},
"openai/gpt-4o-mini": {
"description": "GPT-4o mini ist das neueste Modell von OpenAI, das nach GPT-4 Omni veröffentlicht wurde und Text- und Bild-Eingaben unterstützt. Als ihr fortschrittlichstes kleines Modell ist es viel günstiger als andere neueste Modelle und über 60 % günstiger als GPT-3.5 Turbo. Es behält die fortschrittlichste Intelligenz bei und bietet gleichzeitig ein hervorragendes Preis-Leistungs-Verhältnis. GPT-4o mini erzielte 82 % im MMLU-Test und rangiert derzeit in den Chat-Präferenzen über GPT-4."
"description": "GPT-4o mini von OpenAI ist ihr fortschrittlichstes und kosteneffizientestes kleines Modell. Es ist multimodal (akzeptiert Text- oder Bildeingaben und gibt Text aus) und intelligenter als gpt-3.5-turbo, bei gleicher Geschwindigkeit."
},
"openai/gpt-5": {
"description": "GPT-5 ist OpenAIs Flaggschiff-Sprachmodell mit herausragender Leistung bei komplexer Inferenz, umfangreichem Weltwissen, codeintensiven und mehrstufigen Agentenaufgaben."
},
"openai/gpt-5-mini": {
"description": "GPT-5 mini ist ein kostenoptimiertes Modell mit hervorragender Leistung bei Inferenz- und Chat-Aufgaben. Es bietet die beste Balance zwischen Geschwindigkeit, Kosten und Fähigkeiten."
},
"openai/gpt-5-nano": {
"description": "GPT-5 nano ist ein Modell mit hohem Durchsatz, das bei einfachen Anweisungen oder Klassifizierungsaufgaben hervorragende Leistungen zeigt."
},
"openai/gpt-oss-120b": {
"description": "OpenAI GPT-OSS 120B ist ein Spitzen-Sprachmodell mit 120 Milliarden Parametern, integriertem Browser-Such- und Code-Ausführungsfunktionen sowie ausgeprägten Inferenzfähigkeiten."
"description": "Extrem leistungsfähiges universelles großes Sprachmodell mit starker, kontrollierbarer Inferenzfähigkeit."
},
"openai/gpt-oss-20b": {
"description": "OpenAI GPT-OSS 20B ist ein Spitzen-Sprachmodell mit 20 Milliarden Parametern, integriertem Browser-Such- und Code-Ausführungsfunktionen sowie ausgeprägten Inferenzfähigkeiten."
"description": "Ein kompaktes, Open-Source-Gewichtsmodell, optimiert für niedrige Latenz und ressourcenbeschränkte Umgebungen, einschließlich lokaler und Edge-Bereitstellungen."
},
"openai/o1": {
"description": "o1 ist OpenAIs neues Inferenzmodell, das Bild- und Texteingaben unterstützt und Text ausgibt. Es eignet sich für komplexe Aufgaben, die umfangreiches Allgemeinwissen erfordern. Das Modell verfügt über einen Kontext von 200K und einen Wissensstand bis Oktober 2023."
"description": "OpenAIs o1 ist ein Flaggschiff-Inferenzmodell, entwickelt für komplexe Probleme, die tiefes Nachdenken erfordern. Es bietet starke Inferenzfähigkeiten und höhere Genauigkeit bei komplexen mehrstufigen Aufgaben."
},
"openai/o1-mini": {
"description": "o1-mini ist ein schnelles und kosteneffizientes Inferenzmodell, das für Programmier-, Mathematik- und Wissenschaftsanwendungen entwickelt wurde. Das Modell hat einen Kontext von 128K und einen Wissensstand bis Oktober 2023."
@@ -2256,23 +2493,44 @@
"description": "o1 ist OpenAIs neues Inferenzmodell, das für komplexe Aufgaben geeignet ist, die umfangreiches Allgemeinwissen erfordern. Das Modell hat einen Kontext von 128K und einen Wissensstand bis Oktober 2023."
},
"openai/o3": {
"description": "o3 ist ein leistungsstarkes Allround-Modell, das in mehreren Bereichen hervorragende Leistungen zeigt. Es setzt neue Maßstäbe für mathematische, wissenschaftliche, programmiertechnische und visuelle Denkaufgaben. Es ist auch versiert in technischer Schreibweise und der Befolgung von Anweisungen. Benutzer können es nutzen, um Texte, Code und Bilder zu analysieren und komplexe Probleme mit mehreren Schritten zu lösen."
"description": "OpenAIs o3 ist das leistungsstärkste Inferenzmodell mit neuen Spitzenleistungen in Codierung, Mathematik, Wissenschaft und visueller Wahrnehmung. Es ist besonders gut bei komplexen Anfragen, die multidisziplinäre Analyse erfordern, und hat besondere Stärken bei der Analyse von Bildern, Diagrammen und Grafiken."
},
"openai/o3-mini": {
"description": "o3-mini bietet hohe Intelligenz bei den gleichen Kosten- und Verzögerungszielen wie o1-mini."
"description": "o3-mini ist OpenAIs neuestes kleines Inferenzmodell, das bei gleichen Kosten- und Latenzzielen wie o1-mini hohe Intelligenz bietet."
},
"openai/o3-mini-high": {
"description": "o3-mini high ist eine hochintelligente Version mit dem gleichen Kosten- und Verzögerungsziel wie o1-mini."
},
"openai/o4-mini": {
"description": "o4-mini ist für schnelle und effektive Inferenz optimiert und zeigt in Programmier- und visuellen Aufgaben eine hohe Effizienz und Leistung."
"description": "OpenAIs o4-mini bietet schnelle, kosteneffiziente Inferenz mit hervorragender Leistung für seine Größe, insbesondere bei Mathematik (beste Leistung im AIME-Benchmark), Codierung und visuellen Aufgaben."
},
"openai/o4-mini-high": {
"description": "o4-mini Hochleistungsmodell, optimiert für schnelle und effektive Inferenz, zeigt in Programmier- und visuellen Aufgaben eine hohe Effizienz und Leistung."
},
"openai/text-embedding-3-large": {
"description": "OpenAIs leistungsfähigstes Einbettungsmodell, geeignet für englische und nicht-englische Aufgaben."
},
"openai/text-embedding-3-small": {
"description": "OpenAIs verbesserte, leistungsstärkere Version des ada-Einbettungsmodells."
},
"openai/text-embedding-ada-002": {
"description": "OpenAIs traditionelles Texteingebettetes Modell."
},
"openrouter/auto": {
"description": "Je nach Kontextlänge, Thema und Komplexität wird Ihre Anfrage an Llama 3 70B Instruct, Claude 3.5 Sonnet (selbstregulierend) oder GPT-4o gesendet."
},
"perplexity/sonar": {
"description": "Perplexitys leichtgewichtiges Produkt mit Suchanbindung, schneller und günstiger als Sonar Pro."
},
"perplexity/sonar-pro": {
"description": "Perplexitys Flaggschiffprodukt mit Suchanbindung, unterstützt erweiterte Abfragen und Folgeaktionen."
},
"perplexity/sonar-reasoning": {
"description": "Ein auf Inferenz fokussiertes Modell, das Denkprozesse (CoT) in Antworten ausgibt und detaillierte Erklärungen mit Suchanbindung bietet."
},
"perplexity/sonar-reasoning-pro": {
"description": "Ein fortgeschrittenes, auf Inferenz fokussiertes Modell, das Denkprozesse (CoT) in Antworten ausgibt und umfassende Erklärungen mit verbesserter Suchfähigkeit und mehreren Suchanfragen pro Anfrage bietet."
},
"phi3": {
"description": "Phi-3 ist ein leichtgewichtiges offenes Modell von Microsoft, das für effiziente Integration und großangelegte Wissensschlüsse geeignet ist."
},
@@ -2313,7 +2571,7 @@
"description": "Qwen-Image ist ein universelles Bildgenerierungsmodell, das zahlreiche Kunststile unterstützt und sich besonders bei der Wiedergabe komplexer Texte auszeichnet, insbesondere bei chinesischen und englischen Schriftzügen. Das Modell unterstützt mehrzeilige Layouts, absatzweises Textgenerieren sowie die präzise Darstellung feiner Details und ermöglicht die Erstellung komplexer Bild-Text-Kombinationen."
},
"qwen-image-edit": {
"description": "Das Qwen-Team hat ein professionelles Modell zur Bildbearbeitung veröffentlicht, das semantische Bearbeitungen und Aussehensbearbeitungen unterstützt. Es kann chinesische und englische Texte präzise bearbeiten und ermöglicht Stiltransformationen, Objektrotationen sowie weitere hochwertige Bildbearbeitungen."
"description": "Qwen Image Edit ist ein Bild-zu-Bild-Modell, das die Bearbeitung und Modifikation von Bildern basierend auf Eingabebildern und Textanweisungen unterstützt. Es ermöglicht präzise Anpassungen und kreative Umgestaltungen des Originalbildes entsprechend den Anforderungen der Nutzer."
},
"qwen-long": {
"description": "Qwen ist ein groß angelegtes Sprachmodell, das lange Textkontexte unterstützt und Dialogfunktionen für verschiedene Szenarien wie lange Dokumente und mehrere Dokumente bietet."
@@ -2549,6 +2807,15 @@
"qwen3-coder-plus": {
"description": "Tongyi Qianwen Code-Modell. Die neueste Qwen3-Coder Modellreihe basiert auf Qwen3 und ist ein Code-Generierungsmodell mit starker Coding-Agent-Fähigkeit, spezialisiert auf Werkzeugaufrufe und Umgebungsinteraktion, das selbstständiges Programmieren ermöglicht und neben hervorragenden Code-Fähigkeiten auch allgemeine Kompetenzen besitzt."
},
"qwen3-max-preview": {
"description": "Die Preview-Version des Max-Modells der Tongyi Qianwen 3-Serie zeigt im Vergleich zur 2.5-Serie eine deutliche Steigerung der allgemeinen Fähigkeiten, einschließlich verbesserter chinesisch- und englischsprachiger Textverständnisfähigkeiten, komplexer Befolgung von Anweisungen, subjektiver offener Aufgaben, Mehrsprachigkeit und Werkzeugaufruf-Fähigkeiten; das Modell zeigt weniger Wissenshalluzinationen."
},
"qwen3-next-80b-a3b-instruct": {
"description": "Ein neues Open-Source-Modell der nächsten Generation im Nicht-Denk-Modus basierend auf Qwen3. Im Vergleich zur vorherigen Version (Tongyi Qianwen 3-235B-A22B-Instruct-2507) bietet es eine verbesserte chinesische Textverständnisfähigkeit, verstärkte logische Schlussfolgerungen und bessere Leistung bei textgenerierenden Aufgaben."
},
"qwen3-next-80b-a3b-thinking": {
"description": "Ein neues Open-Source-Modell der nächsten Generation im Denkmodus basierend auf Qwen3. Im Vergleich zur vorherigen Version (Tongyi Qianwen 3-235B-A22B-Thinking-2507) wurde die Befehlsbefolgung verbessert und die Modellantworten sind prägnanter zusammengefasst."
},
"qwq": {
"description": "QwQ ist ein experimentelles Forschungsmodell, das sich auf die Verbesserung der KI-Inferenzfähigkeiten konzentriert."
},
@@ -2729,6 +2996,12 @@
"v0-1.5-md": {
"description": "Das Modell v0-1.5-md ist für alltägliche Aufgaben und die Generierung von Benutzeroberflächen (UI) geeignet"
},
"vercel/v0-1.0-md": {
"description": "Zugriff auf das Modell hinter v0 zur Generierung, Reparatur und Optimierung moderner Webanwendungen mit frameworkspezifischer Inferenz und aktuellem Wissen."
},
"vercel/v0-1.5-md": {
"description": "Zugriff auf das Modell hinter v0 zur Generierung, Reparatur und Optimierung moderner Webanwendungen mit frameworkspezifischer Inferenz und aktuellem Wissen."
},
"wan2.2-t2i-flash": {
"description": "Wanxiang 2.2 Turbo-Version, das aktuell neueste Modell. Es bietet umfassende Verbesserungen in Kreativität, Stabilität und realistischer Textur, erzeugt schnell und bietet ein hervorragendes Preis-Leistungs-Verhältnis."
},
@@ -2759,6 +3032,27 @@
"x1": {
"description": "Das Spark X1 Modell wird weiter verbessert und erreicht in allgemeinen Aufgaben wie Schlussfolgerungen, Textgenerierung und Sprachverständnis Ergebnisse, die mit OpenAI o1 und DeepSeek R1 vergleichbar sind, basierend auf der bereits führenden Leistung in mathematischen Aufgaben."
},
"xai/grok-2": {
"description": "Grok 2 ist ein fortschrittliches Sprachmodell mit modernsten Inferenzfähigkeiten. Es bietet fortschrittliche Fähigkeiten in Chat, Codierung und Inferenz und übertrifft Claude 3.5 Sonnet und GPT-4-Turbo in der LMSYS-Rangliste."
},
"xai/grok-2-vision": {
"description": "Das visuelle Modell Grok 2 zeigt hervorragende Leistungen bei visuellen Aufgaben und bietet modernste Leistung bei visueller mathematischer Inferenz (MathVista) und dokumentenbasierter Fragebeantwortung (DocVQA). Es kann verschiedene visuelle Informationen verarbeiten, darunter Dokumente, Diagramme, Grafiken, Screenshots und Fotos."
},
"xai/grok-3": {
"description": "xAIs Flaggschiffmodell mit hervorragender Leistung bei Unternehmensanwendungen wie Datenerfassung, Codierung und Textzusammenfassung. Es verfügt über tiefes Fachwissen in den Bereichen Finanzen, Gesundheitswesen, Recht und Wissenschaft."
},
"xai/grok-3-fast": {
"description": "xAIs Flaggschiffmodell mit hervorragender Leistung bei Unternehmensanwendungen wie Datenerfassung, Codierung und Textzusammenfassung. Die schnelle Modellvariante wird auf schnellerer Infrastruktur bereitgestellt und bietet deutlich schnellere Antwortzeiten. Die erhöhte Geschwindigkeit geht mit höheren Kosten pro ausgegebenem Token einher."
},
"xai/grok-3-mini": {
"description": "xAIs leichtgewichtiges Modell, das vor der Antwort nachdenkt. Ideal für einfache oder logikbasierte Aufgaben ohne tiefes Fachwissen. Der ursprüngliche Denkprozess ist zugänglich."
},
"xai/grok-3-mini-fast": {
"description": "xAIs leichtgewichtiges Modell, das vor der Antwort nachdenkt. Ideal für einfache oder logikbasierte Aufgaben ohne tiefes Fachwissen. Der ursprüngliche Denkprozess ist zugänglich. Die schnelle Modellvariante wird auf schnellerer Infrastruktur bereitgestellt und bietet deutlich schnellere Antwortzeiten. Die erhöhte Geschwindigkeit geht mit höheren Kosten pro ausgegebenem Token einher."
},
"xai/grok-4": {
"description": "xAIs neuestes und bestes Flaggschiffmodell mit unvergleichlicher Leistung in natürlicher Sprache, Mathematik und Inferenz der perfekte Allrounder."
},
"yi-1.5-34b-chat": {
"description": "Yi-1.5 ist eine verbesserte Version von Yi. Es wurde mit einem hochwertigen Korpus von 500B Tokens auf Yi fortlaufend vortrainiert und auf 3M diversen Feinabstimmungsbeispielen feinjustiert."
},
@@ -2806,5 +3100,14 @@
},
"zai-org/GLM-4.5V": {
"description": "GLM-4.5V ist das neueste visuell-sprachliche Modell (VLM), das von Zhipu AI veröffentlicht wurde. Das Modell basiert auf dem Flaggschiff-Textmodell GLM-4.5-Air mit insgesamt 106 Milliarden Parametern und 12 Milliarden Aktivierungsparametern und verwendet eine Mixture-of-Experts-(MoE)-Architektur. Es zielt darauf ab, bei geringeren Inferenzkosten herausragende Leistung zu erzielen. Technisch setzt es die Entwicklungslinie von GLM-4.1V-Thinking fort und führt Innovationen wie die dreidimensionale Rotations-Positionskodierung (3D-RoPE) ein, wodurch die Wahrnehmung und das Schließen über dreidimensionale Raumbeziehungen deutlich verbessert werden. Durch Optimierungen in den Phasen des Pre-Trainings, der überwachten Feinabstimmung und des Reinforcement Learnings ist das Modell in der Lage, verschiedene visuelle Inhalte wie Bilder, Videos und lange Dokumente zu verarbeiten; in 41 öffentlichen multimodalen Benchmarks erreichte es Spitzenwerte unter frei verfügbaren Modellen derselben Klasse. Zudem wurde ein \"Denkmodus\"-Schalter hinzugefügt, der es Nutzern erlaubt, flexibel zwischen schneller Reaktion und tiefgehendem Schlussfolgern zu wählen, um Effizienz und Ergebnisqualität auszubalancieren."
},
"zai/glm-4.5": {
"description": "Die GLM-4.5 Modellreihe sind speziell für Agenten entwickelte Basismodelle. Das Flaggschiff GLM-4.5 integriert 355 Milliarden Gesamtparameter (32 Milliarden aktiv) und vereint Inferenz-, Codierungs- und Agentenfähigkeiten zur Lösung komplexer Anwendungsanforderungen. Als hybrides Inferenzsystem bietet es zwei Betriebsmodi."
},
"zai/glm-4.5-air": {
"description": "GLM-4.5 und GLM-4.5-Air sind unsere neuesten Flaggschiffmodelle, speziell als Basismodelle für Agentenanwendungen entwickelt. Beide nutzen eine gemischte Expertenarchitektur (MoE). GLM-4.5 hat 355 Milliarden Gesamtparameter mit 32 Milliarden aktiven Parametern pro Vorwärtsdurchlauf, während GLM-4.5-Air ein vereinfachtes Design mit 106 Milliarden Gesamtparametern und 12 Milliarden aktiven Parametern verwendet."
},
"zai/glm-4.5v": {
"description": "GLM-4.5V basiert auf dem GLM-4.5-Air Basismodell, übernimmt bewährte Techniken von GLM-4.1V-Thinking und skaliert effektiv mit einer leistungsstarken MoE-Architektur mit 106 Milliarden Parametern."
}
}
+6
View File
@@ -38,6 +38,9 @@
"cohere": {
"description": "Cohere bringt Ihnen die fortschrittlichsten mehrsprachigen Modelle, leistungsstarke Suchfunktionen und einen maßgeschneiderten KI-Arbeitsbereich für moderne Unternehmen alles integriert in einer sicheren Plattform."
},
"cometapi": {
"description": "CometAPI ist eine Serviceplattform, die verschiedene fortschrittliche Schnittstellen für große Modelle anbietet und OpenAI, Anthropic, Google und weitere unterstützt. Sie eignet sich für vielfältige Entwicklungs- und Anwendungsanforderungen. Nutzer können je nach Bedarf das optimale Modell und den besten Preis flexibel auswählen, um das KI-Erlebnis zu verbessern."
},
"deepseek": {
"description": "DeepSeek ist ein Unternehmen, das sich auf die Forschung und Anwendung von KI-Technologien spezialisiert hat. Ihr neuestes Modell, DeepSeek-V2.5, kombiniert allgemeine Dialog- und Codeverarbeitungsfähigkeiten und hat signifikante Fortschritte in den Bereichen menschliche Präferenzanpassung, Schreibaufgaben und Befehlsbefolgung erzielt."
},
@@ -158,6 +161,9 @@
"v0": {
"description": "v0 ist ein Pair-Programming-Assistent, bei dem Sie Ihre Ideen einfach in natürlicher Sprache beschreiben können, und er generiert Code und Benutzeroberflächen (UI) für Ihr Projekt."
},
"vercelaigateway": {
"description": "Vercel AI Gateway bietet eine einheitliche API zum Zugriff auf über 100 Modelle und ermöglicht die Nutzung von Modellen verschiedener Anbieter wie OpenAI, Anthropic und Google über einen einzigen Endpunkt. Unterstützt Budgeteinstellungen, Nutzungsüberwachung, Lastenausgleich und Failover."
},
"vertexai": {
"description": "Die Gemini-Serie von Google ist das fortschrittlichste, universelle KI-Modell, das von Google DeepMind entwickelt wurde. Es ist speziell für multimodale Anwendungen konzipiert und unterstützt das nahtlose Verständnis und die Verarbeitung von Text, Code, Bildern, Audio und Video. Es eignet sich für eine Vielzahl von Umgebungen, von Rechenzentren bis hin zu mobilen Geräten, und verbessert erheblich die Effizienz und Anwendbarkeit von KI-Modellen."
},
+10 -3
View File
@@ -70,12 +70,15 @@
"input": {
"addAi": "Add an AI message",
"addUser": "Add a user message",
"disclaimer": "AI may also make mistakes, please verify important information",
"errorMsg": "Message sending failed, please check your network and try again: {{errorMsg}}",
"more": "more",
"send": "Send",
"sendWithCmdEnter": "Press {{meta}} + Enter to send",
"sendWithEnter": "Press Enter to send",
"sendWithCmdEnter": "Press <key/> to send",
"sendWithEnter": "Press <key/> to send",
"stop": "Stop",
"warp": "New Line"
"warp": "New Line",
"warpWithKey": "Press <key/> to insert a line break"
},
"intentUnderstanding": {
"title": "Understanding and analyzing your intent..."
@@ -232,6 +235,10 @@
"threadMessageCount": "{{messageCount}} messages",
"title": "Subtopic"
},
"toggleWideScreen": {
"off": "Turn off widescreen mode",
"on": "Turn on widescreen mode"
},
"tokenDetails": {
"chats": "Chat Messages",
"historySummary": "History Summary",
+62
View File
@@ -0,0 +1,62 @@
{
"actions": {
"expand": {
"off": "Collapse",
"on": "Expand"
},
"typobar": {
"off": "Hide formatting toolbar",
"on": "Show formatting toolbar"
}
},
"cancel": "Cancel",
"confirm": "Confirm",
"file": {
"error": "Error: {{message}}",
"uploading": "Uploading file..."
},
"image": {
"broken": "Image is corrupted"
},
"link": {
"edit": "Edit link",
"open": "Open link",
"placeholder": "Enter link URL",
"unlink": "Unlink"
},
"math": {
"placeholder": "Please enter a TeX formula"
},
"slash": {
"h1": "Heading 1",
"h2": "Heading 2",
"h3": "Heading 3",
"hr": "Divider",
"table": "Table",
"tex": "TeX Formula"
},
"table": {
"delete": "Delete table",
"deleteColumn": "Delete column",
"deleteRow": "Delete row",
"insertColumnLeft": "Insert {{count}} column(s) to the left",
"insertColumnRight": "Insert {{count}} column(s) to the right",
"insertRowAbove": "Insert {{count}} row(s) above",
"insertRowBelow": "Insert {{count}} row(s) below"
},
"typobar": {
"blockquote": "Blockquote",
"bold": "Bold",
"bulletList": "Bulleted list",
"code": "Inline code",
"codeblock": "Code block",
"italic": "Italic",
"link": "Link",
"numberList": "Numbered list",
"strikethrough": "Strikethrough",
"table": "Table",
"taskList": "Task List",
"tex": "TeX Formula",
"underline": "Underline"
}
}
+3
View File
@@ -5,6 +5,9 @@
"lock": "Lock Aspect Ratio",
"unlock": "Unlock Aspect Ratio"
},
"cfg": {
"label": "Guidance Intensity"
},
"header": {
"desc": "Brief description, create instantly",
"title": "Painting"
+355 -52
View File
@@ -53,6 +53,9 @@
"Baichuan4-Turbo": {
"description": "The leading model in the country, surpassing mainstream foreign models in Chinese tasks such as knowledge encyclopedias, long texts, and creative generation. It also possesses industry-leading multimodal capabilities, excelling in multiple authoritative evaluation benchmarks."
},
"ByteDance-Seed/Seed-OSS-36B-Instruct": {
"description": "Seed-OSS is a series of open-source large language models developed by ByteDance's Seed team, designed specifically for powerful long-context processing, reasoning, agents, and general capabilities. The Seed-OSS-36B-Instruct in this series is an instruction-tuned model with 36 billion parameters, natively supporting ultra-long context lengths, enabling it to handle massive documents or complex codebases in a single pass. This model is specially optimized for reasoning, code generation, and agent tasks (such as tool usage), while maintaining balanced and excellent general capabilities. A key feature of this model is the \"Thinking Budget\" function, which allows users to flexibly adjust the reasoning length as needed, effectively improving reasoning efficiency in practical applications."
},
"DeepSeek-R1": {
"description": "A state-of-the-art efficient LLM, skilled in reasoning, mathematics, and programming."
},
@@ -81,7 +84,13 @@
"description": "Model provider: sophnet platform. DeepSeek V3 Fast is the high-TPS ultra-fast version of DeepSeek V3 0324, fully powered without quantization, featuring enhanced coding and mathematical capabilities for faster response!"
},
"DeepSeek-V3.1": {
"description": "DeepSeek-V3.1 is a newly launched hybrid reasoning model by DeepSeek, supporting two reasoning modes: thinking and non-thinking. It offers higher thinking efficiency compared to DeepSeek-R1-0528. With post-training optimization, the use of Agent tools and agent task performance have been significantly enhanced."
"description": "DeepSeek-V3.1 - Non-Thinking Mode; DeepSeek-V3.1 is a newly launched hybrid reasoning model by DeepSeek, supporting both thinking and non-thinking reasoning modes, with higher thinking efficiency compared to DeepSeek-R1-0528. Post-training optimization significantly enhances agent tool usage and agent task performance."
},
"DeepSeek-V3.1-Fast": {
"description": "DeepSeek V3.1 Fast is the high-TPS, ultra-fast version of DeepSeek V3.1. Hybrid Thinking Mode: By changing the chat template, a single model can support both thinking and non-thinking modes simultaneously. Smarter Tool Invocation: Post-training optimization significantly improves the model's performance in tool usage and agent tasks."
},
"DeepSeek-V3.1-Think": {
"description": "DeepSeek-V3.1 - Thinking Mode; DeepSeek-V3.1 is a newly launched hybrid reasoning model by DeepSeek, supporting both thinking and non-thinking reasoning modes, with higher thinking efficiency compared to DeepSeek-R1-0528. Post-training optimization significantly enhances agent tool usage and agent task performance."
},
"Doubao-lite-128k": {
"description": "Doubao-lite offers ultra-fast response times and better cost-effectiveness, providing customers with more flexible options for different scenarios. Supports inference and fine-tuning with a 128k context window."
@@ -281,6 +290,9 @@
"Pro/moonshotai/Kimi-K2-Instruct": {
"description": "Kimi K2 is a MoE architecture base model with exceptional coding and agent capabilities, featuring 1 trillion total parameters and 32 billion activated parameters. In benchmark tests across general knowledge reasoning, programming, mathematics, and agent tasks, the K2 model outperforms other mainstream open-source models."
},
"Pro/moonshotai/Kimi-K2-Instruct-0905": {
"description": "Kimi K2-Instruct-0905 is the latest and most powerful version of Kimi K2. It is a top-tier Mixture of Experts (MoE) language model with a total of 1 trillion parameters and 32 billion activated parameters. Key features of this model include enhanced agent coding intelligence, demonstrating significant performance improvements in public benchmark tests and real-world agent coding tasks; and an improved frontend coding experience, with advancements in both aesthetics and practicality for frontend programming."
},
"QwQ-32B-Preview": {
"description": "QwQ-32B-Preview is an innovative natural language processing model capable of efficiently handling complex dialogue generation and context understanding tasks."
},
@@ -590,6 +602,33 @@
"ai21-labs/AI21-Jamba-1.5-Mini": {
"description": "A 52B parameter (12B active) multilingual model offering a 256K long context window, function calling, structured output, and fact-based generation."
},
"alibaba/qwen-3-14b": {
"description": "Qwen3 is the latest generation large language model in the Qwen series, offering a comprehensive set of dense and Mixture of Experts (MoE) models. Built on extensive training, Qwen3 delivers breakthrough advancements in reasoning, instruction following, agent capabilities, and multilingual support."
},
"alibaba/qwen-3-235b": {
"description": "Qwen3 is the latest generation large language model in the Qwen series, offering a comprehensive set of dense and Mixture of Experts (MoE) models. Built on extensive training, Qwen3 delivers breakthrough advancements in reasoning, instruction following, agent capabilities, and multilingual support."
},
"alibaba/qwen-3-30b": {
"description": "Qwen3 is the latest generation large language model in the Qwen series, offering a comprehensive set of dense and Mixture of Experts (MoE) models. Built on extensive training, Qwen3 delivers breakthrough advancements in reasoning, instruction following, agent capabilities, and multilingual support."
},
"alibaba/qwen-3-32b": {
"description": "Qwen3 is the latest generation large language model in the Qwen series, offering a comprehensive set of dense and Mixture of Experts (MoE) models. Built on extensive training, Qwen3 delivers breakthrough advancements in reasoning, instruction following, agent capabilities, and multilingual support."
},
"alibaba/qwen3-coder": {
"description": "Qwen3-Coder-480B-A35B-Instruct is Qwen's most agent-capable code model, demonstrating remarkable performance in agent coding, agent browser usage, and other fundamental coding tasks, achieving results comparable to Claude Sonnet."
},
"amazon/nova-lite": {
"description": "A very low-cost multimodal model that processes image, video, and text inputs at extremely high speed."
},
"amazon/nova-micro": {
"description": "A text-only model delivering the lowest latency responses at a very low cost."
},
"amazon/nova-pro": {
"description": "A highly capable multimodal model offering the best combination of accuracy, speed, and cost, suitable for a wide range of tasks."
},
"amazon/titan-embed-text-v2": {
"description": "Amazon Titan Text Embeddings V2 is a lightweight, efficient multilingual embedding model supporting 1024, 512, and 256 dimensions."
},
"anthropic.claude-3-5-sonnet-20240620-v1:0": {
"description": "Claude 3.5 Sonnet raises the industry standard, outperforming competitor models and Claude 3 Opus, excelling in a wide range of evaluations while maintaining the speed and cost of our mid-tier models."
},
@@ -615,25 +654,28 @@
"description": "An updated version of Claude 2, featuring double the context window and improvements in reliability, hallucination rates, and evidence-based accuracy in long documents and RAG contexts."
},
"anthropic/claude-3-haiku": {
"description": "Claude 3 Haiku is Anthropic's fastest and most compact model, designed for near-instantaneous responses. It features quick and accurate directional performance."
"description": "Claude 3 Haiku is Anthropic's fastest model to date, designed for enterprise workloads that typically involve longer prompts. Haiku can quickly analyze large volumes of documents such as quarterly filings, contracts, or legal cases, at half the cost of other models in its performance tier."
},
"anthropic/claude-3-opus": {
"description": "Claude 3 Opus is Anthropic's most powerful model for handling highly complex tasks. It excels in performance, intelligence, fluency, and comprehension."
"description": "Claude 3 Opus is Anthropic's smartest model, delivering market-leading performance on highly complex tasks. It navigates open-ended prompts and novel scenarios with exceptional fluency and human-like understanding."
},
"anthropic/claude-3.5-haiku": {
"description": "Claude 3.5 Haiku is Anthropic's fastest next-generation model. Compared to Claude 3 Haiku, Claude 3.5 Haiku shows improvements across various skills and surpasses the previous generation's largest model, Claude 3 Opus, in many intelligence benchmarks."
"description": "Claude 3.5 Haiku is the next generation of our fastest model. Matching the speed of Claude 3 Haiku, it improves across every skill set and surpasses our previous largest model Claude 3 Opus on many intelligence benchmarks."
},
"anthropic/claude-3.5-sonnet": {
"description": "Claude 3.5 Sonnet offers capabilities that surpass Opus and faster speeds than Sonnet, while maintaining the same pricing as Sonnet. Sonnet excels particularly in programming, data science, visual processing, and agent tasks."
"description": "Claude 3.5 Sonnet strikes an ideal balance between intelligence and speed—especially for enterprise workloads. It delivers powerful performance at lower cost compared to peers and is designed for high durability in large-scale AI deployments."
},
"anthropic/claude-3.7-sonnet": {
"description": "Claude 3.7 Sonnet is Anthropic's most advanced model to date and the first hybrid reasoning model on the market. Claude 3.7 Sonnet can generate near-instant responses or extended step-by-step reasoning, allowing users to clearly observe these processes. Sonnet excels particularly in programming, data science, visual processing, and agent tasks."
"description": "Claude 3.7 Sonnet is the first hybrid reasoning model and Anthropic's smartest model to date. It offers state-of-the-art performance in coding, content generation, data analysis, and planning tasks, building on the software engineering and computer usage capabilities of its predecessor Claude 3.5 Sonnet."
},
"anthropic/claude-opus-4": {
"description": "Claude Opus 4 is Anthropic's most powerful model designed for handling highly complex tasks. It excels in performance, intelligence, fluency, and comprehension."
"description": "Claude Opus 4 is Anthropic's most powerful model yet and the world's best coding model, leading on SWE-bench (72.5%) and Terminal-bench (43.2%). It provides sustained performance for long-term tasks requiring focused effort and thousands of steps, capable of continuous operation for hours—significantly extending AI agent capabilities."
},
"anthropic/claude-opus-4.1": {
"description": "Claude Opus 4.1 is a plug-and-play alternative to Opus 4, delivering excellent performance and accuracy for practical coding and agent tasks. Opus 4.1 advances state-of-the-art coding performance to 74.5% on SWE-bench Verified, handling complex multi-step problems with greater rigor and attention to detail."
},
"anthropic/claude-sonnet-4": {
"description": "Claude Sonnet 4 can generate near-instant responses or extended step-by-step reasoning, allowing users to clearly observe these processes. API users also have fine-grained control over the model's thinking time."
"description": "Claude Sonnet 4 significantly improves upon the industry-leading capabilities of Sonnet 3.7, excelling in coding with state-of-the-art 72.7% on SWE-bench. The model balances performance and efficiency, suitable for both internal and external use cases, and offers enhanced controllability for greater command over outcomes."
},
"ascend-tribe/pangu-pro-moe": {
"description": "Pangu-Pro-MoE 72B-A16B is a sparse large language model with 72 billion parameters and 16 billion activated parameters. It is based on the Group Mixture of Experts (MoGE) architecture, which groups experts during the expert selection phase and constrains tokens to activate an equal number of experts within each group, achieving expert load balancing and significantly improving deployment efficiency on the Ascend platform."
@@ -689,6 +731,9 @@
"claude-3-5-haiku-20241022": {
"description": "Claude 3.5 Haiku is Anthropic's fastest next-generation model. Compared to Claude 3 Haiku, Claude 3.5 Haiku has improved in various skills and has surpassed the previous generation's largest model, Claude 3 Opus, in many intelligence benchmark tests."
},
"claude-3-5-haiku-latest": {
"description": "Claude 3.5 Haiku offers fast responses, ideal for lightweight tasks."
},
"claude-3-5-sonnet-20240620": {
"description": "Claude 3.5 Sonnet offers capabilities that surpass Opus and faster speeds than Sonnet, while maintaining the same price as Sonnet. Sonnet excels particularly in programming, data science, visual processing, and agent tasks."
},
@@ -698,6 +743,9 @@
"claude-3-7-sonnet-20250219": {
"description": "Claude 3.7 Sonnet is Anthropic's latest model, offering a balance of speed and performance. It excels in a wide range of tasks, including programming, data science, visual processing, and agent tasks."
},
"claude-3-7-sonnet-latest": {
"description": "Claude 3.7 Sonnet is Anthropic's latest and most powerful model for handling highly complex tasks. It excels in performance, intelligence, fluency, and comprehension."
},
"claude-3-haiku-20240307": {
"description": "Claude 3 Haiku is Anthropic's fastest and most compact model, designed for near-instantaneous responses. It features rapid and accurate directional performance."
},
@@ -710,11 +758,17 @@
"claude-opus-4-1-20250805": {
"description": "Claude Opus 4.1 is Anthropic's latest and most powerful model designed for handling highly complex tasks. It demonstrates outstanding performance in intelligence, fluency, and comprehension."
},
"claude-opus-4-1-20250805-thinking": {
"description": "Claude Opus 4.1 Thinking model, an advanced version capable of demonstrating its reasoning process."
},
"claude-opus-4-20250514": {
"description": "Claude Opus 4 is Anthropic's most powerful model for handling highly complex tasks. It excels in performance, intelligence, fluency, and comprehension."
},
"claude-sonnet-4-20250514": {
"description": "Claude 4 Sonnet can generate near-instant responses or extended, step-by-step reasoning, allowing users to clearly observe these processes. API users can also have fine control over the time the model takes to think."
"description": "Claude Sonnet 4 can generate near-instant responses or extended step-by-step reasoning, allowing users to clearly observe these processes."
},
"claude-sonnet-4-20250514-thinking": {
"description": "Claude Sonnet 4 Thinking model can produce near-instant responses or extended step-by-step reasoning, enabling users to clearly see these processes."
},
"codegeex-4": {
"description": "CodeGeeX-4 is a powerful AI programming assistant that supports intelligent Q&A and code completion in various programming languages, enhancing development efficiency."
@@ -773,6 +827,18 @@
"cohere/Cohere-command-r-plus": {
"description": "Command R+ is a state-of-the-art RAG-optimized model designed to handle enterprise-level workloads."
},
"cohere/command-a": {
"description": "Command A is Cohere's most powerful model to date, excelling in tool use, agents, retrieval-augmented generation (RAG), and multilingual use cases. With a context length of 256K, it runs on just two GPUs and achieves 150% higher throughput compared to Command R+ 08-2024."
},
"cohere/command-r": {
"description": "Command R is a large language model optimized for conversational interactions and long-context tasks. Positioned in the \"scalable\" category, it balances high performance and strong accuracy, enabling companies to move beyond proof of concept into production."
},
"cohere/command-r-plus": {
"description": "Command R+ is Cohere's latest large language model optimized for conversational interactions and long-context tasks. It aims for exceptional performance, enabling companies to transition from proof of concept to production."
},
"cohere/embed-v4.0": {
"description": "A model that enables classification or embedding transformation of text, images, or mixed content."
},
"command": {
"description": "An instruction-following dialogue model that delivers high quality and reliability in language tasks, with a longer context length compared to our base generation models."
},
@@ -809,12 +875,6 @@
"command-r7b-12-2024": {
"description": "command-r7b-12-2024 is a compact and efficient updated version, released in December 2024. It excels in tasks requiring complex reasoning and multi-step processing, such as RAG, tool usage, and agent tasks."
},
"compound-beta": {
"description": "Compound-beta is a composite AI system supported by multiple publicly available models in GroqCloud, intelligently and selectively using tools to answer user queries."
},
"compound-beta-mini": {
"description": "Compound-beta-mini is a composite AI system supported by publicly available models in GroqCloud, intelligently and selectively using tools to answer user queries."
},
"computer-use-preview": {
"description": "The computer-use-preview model is a dedicated model designed for \"computer usage tools,\" trained to understand and execute computer-related tasks."
},
@@ -957,7 +1017,7 @@
"description": "DeepSeek-V3.1 is a large hybrid reasoning model supporting 128K long context and efficient mode switching, delivering outstanding performance and speed in tool invocation, code generation, and complex reasoning tasks."
},
"deepseek/deepseek-r1": {
"description": "DeepSeek-R1 significantly enhances model reasoning capabilities with minimal labeled data. Before outputting the final answer, the model first provides a chain of thought to improve the accuracy of the final response."
"description": "The DeepSeek R1 model has undergone minor version upgrades, currently at DeepSeek-R1-0528. The latest update significantly enhances inference depth and capability by leveraging increased compute resources and post-training algorithmic optimizations. The model performs excellently on benchmarks in mathematics, programming, and general logic, with overall performance approaching leading models like O3 and Gemini 2.5 Pro."
},
"deepseek/deepseek-r1-0528": {
"description": "DeepSeek-R1 greatly improves model reasoning capabilities with minimal labeled data. Before outputting the final answer, the model first generates a chain of thought to enhance answer accuracy."
@@ -966,7 +1026,7 @@
"description": "DeepSeek-R1 greatly improves model reasoning capabilities with minimal labeled data. Before outputting the final answer, the model first generates a chain of thought to enhance answer accuracy."
},
"deepseek/deepseek-r1-distill-llama-70b": {
"description": "DeepSeek R1 Distill Llama 70B is a large language model based on Llama3.3 70B, which achieves competitive performance comparable to large cutting-edge models by utilizing fine-tuning from DeepSeek R1 outputs."
"description": "DeepSeek-R1-Distill-Llama-70B is a distilled, more efficient variant of the 70B Llama model. It maintains strong performance on text generation tasks while reducing computational overhead for easier deployment and research. Served by Groq using its custom Language Processing Unit (LPU) hardware for fast, efficient inference."
},
"deepseek/deepseek-r1-distill-llama-8b": {
"description": "DeepSeek R1 Distill Llama 8B is a distilled large language model based on Llama-3.1-8B-Instruct, trained using outputs from DeepSeek R1."
@@ -984,7 +1044,10 @@
"description": "DeepSeek-R1 significantly enhances model reasoning capabilities with minimal labeled data. Before outputting the final answer, the model first provides a chain of thought to improve the accuracy of the final response."
},
"deepseek/deepseek-v3": {
"description": "DeepSeek-V3 has achieved a significant breakthrough in inference speed compared to previous models. It ranks first among open-source models and can compete with the world's most advanced closed-source models. DeepSeek-V3 employs Multi-Head Latent Attention (MLA) and DeepSeekMoE architectures, which have been thoroughly validated in DeepSeek-V2. Additionally, DeepSeek-V3 introduces an auxiliary lossless strategy for load balancing and sets multi-label prediction training objectives for enhanced performance."
"description": "A fast, general-purpose large language model with enhanced reasoning capabilities."
},
"deepseek/deepseek-v3.1-base": {
"description": "DeepSeek V3.1 Base is an improved version of the DeepSeek V3 model."
},
"deepseek/deepseek-v3/community": {
"description": "DeepSeek-V3 has achieved a significant breakthrough in inference speed compared to previous models. It ranks first among open-source models and can compete with the world's most advanced closed-source models. DeepSeek-V3 employs Multi-Head Latent Attention (MLA) and DeepSeekMoE architectures, which have been thoroughly validated in DeepSeek-V2. Additionally, DeepSeek-V3 introduces an auxiliary lossless strategy for load balancing and sets multi-label prediction training objectives for enhanced performance."
@@ -1055,8 +1118,17 @@
"doubao-seed-1.6-thinking": {
"description": "Doubao-Seed-1.6-thinking features greatly enhanced thinking capabilities. Compared to Doubao-1.5-thinking-pro, it further improves foundational skills such as coding, math, and logical reasoning, and supports visual understanding. It supports a 256k context window and output lengths up to 16k tokens."
},
"doubao-seed-1.6-vision": {
"description": "Doubao-Seed-1.6-vision is a visual deep thinking model that demonstrates stronger general multimodal understanding and reasoning capabilities in scenarios such as education, image review, inspection and security, and AI search Q&A. It supports a 256k context window and an output length of up to 64k tokens."
},
"doubao-seededit-3-0-i2i-250628": {
"description": "Doubao image generation model developed by ByteDance Seed team supports both text and image inputs, providing a highly controllable and high-quality image generation experience. Supports image editing via text instructions, generating images with dimensions between 512 and 1536 pixels."
},
"doubao-seedream-3-0-t2i-250415": {
"description": "Doubao image generation model developed by ByteDance Seed team supports both text and image inputs, providing a highly controllable and high-quality image generation experience based on text prompts."
"description": "Seedream 3.0 image generation model developed by ByteDance Seed team supports text and image inputs, delivering a highly controllable and high-quality image generation experience. Generates images based on text prompts."
},
"doubao-seedream-4-0-250828": {
"description": "Seedream 4.0 image generation model developed by ByteDance Seed team supports text and image inputs, offering a highly controllable and high-quality image generation experience. Generates images based on text prompts."
},
"doubao-vision-lite-32k": {
"description": "The Doubao-vision model is a multimodal large model launched by Doubao, featuring powerful image understanding and reasoning capabilities along with precise instruction comprehension. It demonstrates strong performance in image-text information extraction and image-based reasoning tasks, applicable to more complex and diverse visual question answering scenarios."
@@ -1139,6 +1211,33 @@
"ernie-x1-turbo-32k": {
"description": "The model performs better in terms of effectiveness and performance compared to ERNIE-X1-32K."
},
"fal-ai/bytedance/seedream/v4": {
"description": "Seedream 4.0 image generation model developed by ByteDance Seed team supports text and image inputs, providing a highly controllable and high-quality image generation experience. Generates images based on text prompts."
},
"fal-ai/flux-kontext/dev": {
"description": "FLUX.1 model focused on image editing tasks, supporting both text and image inputs."
},
"fal-ai/flux-pro/kontext": {
"description": "FLUX.1 Kontext [pro] can process text and reference images as inputs, seamlessly enabling targeted local edits and complex overall scene transformations."
},
"fal-ai/flux/krea": {
"description": "Flux Krea [dev] is an image generation model with an aesthetic preference, aiming to produce more realistic and natural images."
},
"fal-ai/flux/schnell": {
"description": "FLUX.1 [schnell] is a 12-billion-parameter image generation model focused on fast generation of high-quality images."
},
"fal-ai/imagen4/preview": {
"description": "High-quality image generation model provided by Google."
},
"fal-ai/nano-banana": {
"description": "Nano Banana is Google's latest, fastest, and most efficient native multimodal model, allowing you to generate and edit images through conversation."
},
"fal-ai/qwen-image": {
"description": "Powerful raw image model from the Qwen team, featuring impressive Chinese text generation capabilities and diverse visual styles."
},
"fal-ai/qwen-image-edit": {
"description": "Professional image editing model released by the Qwen team, supporting semantic and appearance editing, precise editing of Chinese and English text, style transfer, object rotation, and other high-quality image edits."
},
"flux-1-schnell": {
"description": "Developed by Black Forest Labs, this 12-billion-parameter text-to-image model uses latent adversarial diffusion distillation technology to generate high-quality images within 1 to 4 steps. Its performance rivals closed-source alternatives and is released under the Apache-2.0 license, suitable for personal, research, and commercial use."
},
@@ -1151,9 +1250,6 @@
"flux-kontext-pro": {
"description": "State-of-the-art contextual image generation and editing — combining text and images for precise, coherent results."
},
"flux-kontext/dev": {
"description": "FLUX.1 model focused on image editing tasks, supporting both text and image inputs."
},
"flux-merged": {
"description": "The FLUX.1-merged model combines the deep features explored during the development phase of “DEV” with the high-speed execution advantages represented by “Schnell.” This integration not only pushes the model's performance boundaries but also broadens its application scope."
},
@@ -1166,21 +1262,12 @@
"flux-pro-1.1-ultra": {
"description": "Ultra-high-resolution AI image generation — supports up to 4-megapixel output, producing ultra-high-definition images in under 10 seconds."
},
"flux-pro/kontext": {
"description": "FLUX.1 Kontext [pro] can process text and reference images as input, seamlessly enabling targeted local edits and complex overall scene transformations."
},
"flux-schnell": {
"description": "FLUX.1 [schnell], currently the most advanced open-source few-step model, surpasses competitors and even powerful non-distilled models like Midjourney v6.0 and DALL·E 3 (HD). Finely tuned to retain the full output diversity from pretraining, FLUX.1 [schnell] significantly enhances visual quality, instruction compliance, size/aspect ratio variation, font handling, and output diversity compared to state-of-the-art models on the market, offering users a richer and more diverse creative image generation experience."
},
"flux.1-schnell": {
"description": "A 12-billion-parameter rectified flow transformer capable of generating images based on text descriptions."
},
"flux/krea": {
"description": "Flux Krea [dev] is an image generation model with an aesthetic preference, aimed at producing more realistic and natural images."
},
"flux/schnell": {
"description": "FLUX.1 [schnell] is an image generation model with 12 billion parameters, specializing in fast generation of high-quality images."
},
"gemini-1.0-pro-001": {
"description": "Gemini 1.0 Pro 001 (Tuning) offers stable and tunable performance, making it an ideal choice for complex task solutions."
},
@@ -1388,20 +1475,26 @@
"glm-zero-preview": {
"description": "GLM-Zero-Preview possesses strong complex reasoning abilities, excelling in logical reasoning, mathematics, programming, and other fields."
},
"google/gemini-2.0-flash": {
"description": "Gemini 2.0 Flash offers next-generation features and improvements, including exceptional speed, built-in tool usage, multimodal generation, and a 1 million token context window."
},
"google/gemini-2.0-flash-001": {
"description": "Gemini 2.0 Flash offers next-generation features and improvements, including exceptional speed, native tool usage, multimodal generation, and a 1M token context window."
},
"google/gemini-2.0-flash-exp:free": {
"description": "Gemini 2.0 Flash Experimental is Google's latest experimental multimodal AI model, showing a quality improvement compared to historical versions, especially in world knowledge, code, and long context."
},
"google/gemini-2.0-flash-lite": {
"description": "Gemini 2.0 Flash Lite provides next-generation features and improvements, including exceptional speed, built-in tool usage, multimodal generation, and a 1 million token context window."
},
"google/gemini-2.5-flash": {
"description": "Gemini 2.5 Flash is Google's most advanced flagship model, designed for advanced reasoning, coding, mathematics, and scientific tasks. It features built-in \"thinking\" capabilities, enabling it to provide responses with higher accuracy and more nuanced contextual understanding.\n\nNote: This model has two variants: thinking and non-thinking. Output pricing varies significantly depending on whether the thinking capability is activated. If you choose the standard variant (without the \":thinking\" suffix), the model will explicitly avoid generating thinking tokens.\n\nTo leverage the thinking capability and receive thinking tokens, you must select the \":thinking\" variant, which incurs higher pricing for thinking outputs.\n\nAdditionally, Gemini 2.5 Flash can be configured via the \"max tokens for reasoning\" parameter, as detailed in the documentation (https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning)."
"description": "Gemini 2.5 Flash is a thoughtful model delivering excellent comprehensive capabilities. It is designed to balance price and performance, supporting multimodal inputs and a 1 million token context window."
},
"google/gemini-2.5-flash-image-preview": {
"description": "Gemini 2.5 Flash experimental model, supporting image generation."
},
"google/gemini-2.5-flash-image-preview:free": {
"description": "Gemini 2.5 Flash experimental model, supporting image generation."
"google/gemini-2.5-flash-lite": {
"description": "Gemini 2.5 Flash-Lite is a balanced, low-latency model with configurable reasoning budget and tool connectivity (e.g., Google Search grounding and code execution). It supports multimodal inputs and offers a 1 million token context window."
},
"google/gemini-2.5-flash-preview": {
"description": "Gemini 2.5 Flash is Google's most advanced flagship model, designed for advanced reasoning, coding, mathematics, and scientific tasks. It includes built-in 'thinking' capabilities that allow it to provide responses with higher accuracy and detailed context handling.\n\nNote: This model has two variants: thinking and non-thinking. Output pricing varies significantly based on whether the thinking capability is activated. If you choose the standard variant (without the ':thinking' suffix), the model will explicitly avoid generating thinking tokens.\n\nTo leverage the thinking capability and receive thinking tokens, you must select the ':thinking' variant, which will incur higher thinking output pricing.\n\nAdditionally, Gemini 2.5 Flash can be configured via the 'maximum tokens for reasoning' parameter, as described in the documentation (https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning)."
@@ -1410,11 +1503,14 @@
"description": "Gemini 2.5 Flash is Google's most advanced flagship model, designed for advanced reasoning, coding, mathematics, and scientific tasks. It includes built-in 'thinking' capabilities that allow it to provide responses with higher accuracy and detailed context handling.\n\nNote: This model has two variants: thinking and non-thinking. Output pricing varies significantly based on whether the thinking capability is activated. If you choose the standard variant (without the ':thinking' suffix), the model will explicitly avoid generating thinking tokens.\n\nTo leverage the thinking capability and receive thinking tokens, you must select the ':thinking' variant, which will incur higher thinking output pricing.\n\nAdditionally, Gemini 2.5 Flash can be configured via the 'maximum tokens for reasoning' parameter, as described in the documentation (https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning)."
},
"google/gemini-2.5-pro": {
"description": "Gemini 2.5 Pro is Google's most advanced thinking model, capable of reasoning through complex problems in code, mathematics, and STEM fields, as well as analyzing large datasets, codebases, and documents using long-context processing."
"description": "Gemini 2.5 Pro is our most advanced reasoning Gemini model, capable of solving complex problems. It features a 2 million token context window and supports multimodal inputs including text, images, audio, video, and PDF documents."
},
"google/gemini-2.5-pro-preview": {
"description": "Gemini 2.5 Pro Preview is Google's most advanced thinking model, capable of reasoning through complex problems in code, mathematics, and STEM fields, as well as analyzing large datasets, codebases, and documents using extended context."
},
"google/gemini-embedding-001": {
"description": "A state-of-the-art embedding model delivering excellent performance on English, multilingual, and code tasks."
},
"google/gemini-flash-1.5": {
"description": "Gemini 1.5 Flash offers optimized multimodal processing capabilities, suitable for various complex task scenarios."
},
@@ -1442,12 +1538,21 @@
"google/gemma-2b-it": {
"description": "Gemma Instruct (2B) provides basic instruction processing capabilities, suitable for lightweight applications."
},
"google/gemma-3-12b-it": {
"description": "Gemma 3 12B is an open-source language model from Google that sets new standards in efficiency and performance."
},
"google/gemma-3-1b-it": {
"description": "Gemma 3 1B is an open-source language model from Google that sets new standards in efficiency and performance."
},
"google/gemma-3-27b-it": {
"description": "Gemma 3 27B is an open-source language model from Google that sets new standards in efficiency and performance."
},
"google/text-embedding-005": {
"description": "An English-focused text embedding model optimized for code and English language tasks."
},
"google/text-multilingual-embedding-002": {
"description": "A multilingual text embedding model optimized for cross-lingual tasks, supporting multiple languages."
},
"gpt-3.5-turbo": {
"description": "GPT 3.5 Turbo is suitable for various text generation and understanding tasks. Currently points to gpt-3.5-turbo-0125."
},
@@ -1604,9 +1709,18 @@
"grok-4": {
"description": "Our latest and most powerful flagship model, excelling in natural language processing, mathematical computation, and reasoning — a perfect all-rounder."
},
"grok-4-0709": {
"description": "xAI's Grok 4, featuring strong reasoning capabilities."
},
"grok-code-fast-1": {
"description": "We are excited to introduce grok-code-fast-1, a fast and cost-effective inference model that excels in agent coding."
},
"groq/compound": {
"description": "Compound is a composite AI system supported by multiple openly available models already supported in GroqCloud, capable of intelligently and selectively using tools to answer user queries."
},
"groq/compound-mini": {
"description": "Compound-mini is a composite AI system supported by publicly available models already supported in GroqCloud, capable of intelligently and selectively using tools to answer user queries."
},
"gryphe/mythomax-l2-13b": {
"description": "MythoMax l2 13B is a language model that combines creativity and intelligence by merging multiple top models."
},
@@ -1662,7 +1776,7 @@
"description": "Significantly improves high-difficulty mathematics, logic, and coding capabilities, optimizes model output stability, and enhances long-text processing ability."
},
"hunyuan-t1-latest": {
"description": "The industry's first ultra-large-scale Hybrid-Transformer-Mamba inference model, enhancing reasoning capabilities with exceptional decoding speed, further aligning with human preferences."
"description": "Significantly enhances the main model's slow-thinking capabilities in advanced mathematics, complex reasoning, difficult coding, instruction adherence, and text creation quality."
},
"hunyuan-t1-vision": {
"description": "Hunyuan is a multimodal deep thinking model supporting native multimodal chain-of-thought reasoning, excelling in various image reasoning scenarios and significantly outperforming fast-thinking models on science problems."
@@ -1730,8 +1844,11 @@
"imagen-4.0-ultra-generate-preview-06-06": {
"description": "Imagen 4th generation text-to-image model series Ultra version"
},
"imagen4/preview": {
"description": "A high-quality image generation model provided by Google."
"inception/mercury-coder-small": {
"description": "Mercury Coder Small is ideal for code generation, debugging, and refactoring tasks, offering minimal latency."
},
"inclusionAI/Ling-mini-2.0": {
"description": "Ling-mini-2.0 is a compact, high-performance large language model based on the MoE architecture. It has 16 billion total parameters, but only activates 1.4 billion per token (non-embedding 789 million), enabling extremely fast generation speeds. Thanks to its efficient MoE design and large-scale, high-quality training data, Ling-mini-2.0 delivers top-tier performance on downstream tasks comparable to dense LLMs under 10 billion parameters and even larger MoE models, despite having only 1.4 billion activated parameters."
},
"internlm/internlm2_5-7b-chat": {
"description": "InternLM2.5 offers intelligent dialogue solutions across multiple scenarios."
@@ -1766,6 +1883,9 @@
"kimi-k2-0711-preview": {
"description": "kimi-k2 is a MoE architecture base model with powerful coding and agent capabilities, totaling 1 trillion parameters with 32 billion active parameters. In benchmark tests across general knowledge reasoning, programming, mathematics, and agent tasks, the K2 model outperforms other mainstream open-source models."
},
"kimi-k2-0905-preview": {
"description": "The kimi-k2-0905-preview model has a context length of 256k, featuring stronger Agentic Coding capabilities, more outstanding aesthetics and practicality of frontend code, and better context understanding."
},
"kimi-k2-turbo-preview": {
"description": "Kimi-K2 is a Mixture-of-Experts (MoE) foundation model with exceptional coding and agent capabilities, featuring 1T total parameters and 32B activated parameters. In benchmark evaluations across core categories — general knowledge reasoning, programming, mathematics, and agent tasks — the K2 model outperforms other leading open-source models."
},
@@ -2003,30 +2123,63 @@
"meta/Meta-Llama-3.1-8B-Instruct": {
"description": "Llama 3.1 instruction-tuned text model optimized for multilingual dialogue use cases, performing excellently on common industry benchmarks among many available open-source and closed chat models."
},
"meta/llama-3-70b": {
"description": "A 70 billion parameter open-source model finely tuned by Meta for instruction following. Served by Groq using its custom Language Processing Unit (LPU) hardware for fast, efficient inference."
},
"meta/llama-3-8b": {
"description": "An 8 billion parameter open-source model finely tuned by Meta for instruction following. Served by Groq using its custom Language Processing Unit (LPU) hardware for fast, efficient inference."
},
"meta/llama-3.1-405b-instruct": {
"description": "An advanced LLM supporting synthetic data generation, knowledge distillation, and reasoning, suitable for chatbots, programming, and domain-specific tasks."
},
"meta/llama-3.1-70b": {
"description": "An updated version of Meta Llama 3 70B Instruct, featuring extended 128K context length, multilingual support, and improved reasoning capabilities."
},
"meta/llama-3.1-70b-instruct": {
"description": "Empowering complex conversations with exceptional context understanding, reasoning capabilities, and text generation abilities."
},
"meta/llama-3.1-8b": {
"description": "Llama 3.1 8B supports a 128K context window, making it ideal for real-time conversational interfaces and data analysis, while offering significant cost savings compared to larger models. Served by Groq using its custom Language Processing Unit (LPU) hardware for fast, efficient inference."
},
"meta/llama-3.1-8b-instruct": {
"description": "An advanced cutting-edge model with language understanding, excellent reasoning capabilities, and text generation abilities."
},
"meta/llama-3.2-11b": {
"description": "Instruction-tuned image reasoning generation model (text + image input / text output), optimized for visual recognition, image reasoning, captioning, and answering general questions about images."
},
"meta/llama-3.2-11b-vision-instruct": {
"description": "A state-of-the-art vision-language model adept at high-quality reasoning from images."
},
"meta/llama-3.2-1b": {
"description": "Text-only model supporting on-device use cases such as multilingual local knowledge retrieval, summarization, and rewriting."
},
"meta/llama-3.2-1b-instruct": {
"description": "A cutting-edge small language model with language understanding, excellent reasoning capabilities, and text generation abilities."
},
"meta/llama-3.2-3b": {
"description": "Text-only model carefully tuned to support on-device use cases such as multilingual local knowledge retrieval, summarization, and rewriting."
},
"meta/llama-3.2-3b-instruct": {
"description": "A cutting-edge small language model with language understanding, excellent reasoning capabilities, and text generation abilities."
},
"meta/llama-3.2-90b": {
"description": "Instruction-tuned image reasoning generation model (text + image input / text output), optimized for visual recognition, image reasoning, captioning, and answering general questions about images."
},
"meta/llama-3.2-90b-vision-instruct": {
"description": "A state-of-the-art vision-language model adept at high-quality reasoning from images."
},
"meta/llama-3.3-70b": {
"description": "The perfect blend of performance and efficiency. This model supports high-performance conversational AI, designed for content creation, enterprise applications, and research, offering advanced language understanding capabilities including text summarization, classification, sentiment analysis, and code generation."
},
"meta/llama-3.3-70b-instruct": {
"description": "An advanced LLM skilled in reasoning, mathematics, common sense, and function calling."
},
"meta/llama-4-maverick": {
"description": "The Llama 4 model family consists of native multimodal AI models supporting text and multimodal experiences. These models leverage a Mixture of Experts architecture to deliver industry-leading performance in text and image understanding. Llama 4 Maverick, a 17 billion parameter model with 128 experts, is served by DeepInfra."
},
"meta/llama-4-scout": {
"description": "The Llama 4 model family consists of native multimodal AI models supporting text and multimodal experiences. These models leverage a Mixture of Experts architecture to deliver industry-leading performance in text and image understanding. Llama 4 Scout, a 17 billion parameter model with 16 experts, is served by DeepInfra."
},
"microsoft/Phi-3-medium-128k-instruct": {
"description": "The same Phi-3-medium model but with a larger context size, suitable for RAG or few-shot prompting."
},
@@ -2102,6 +2255,48 @@
"mistral-small-latest": {
"description": "Mistral Small is a cost-effective, fast, and reliable option suitable for use cases such as translation, summarization, and sentiment analysis."
},
"mistral/codestral": {
"description": "Mistral Codestral 25.01 is a state-of-the-art coding model optimized for low-latency, high-frequency use cases. Proficient in over 80 programming languages, it excels at fill-in-the-middle (FIM), code correction, and test generation tasks."
},
"mistral/codestral-embed": {
"description": "A code embedding model that can be embedded into code databases and repositories to support coding assistants."
},
"mistral/devstral-small": {
"description": "Devstral is an agent large language model for software engineering tasks, making it an excellent choice for software engineering agents."
},
"mistral/magistral-medium": {
"description": "Complex thinking supported by deep understanding, featuring transparent reasoning you can follow and verify. This model maintains high-fidelity reasoning across many languages, even when switching languages mid-task."
},
"mistral/magistral-small": {
"description": "Complex thinking supported by deep understanding, featuring transparent reasoning you can follow and verify. This model maintains high-fidelity reasoning across many languages, even when switching languages mid-task."
},
"mistral/ministral-3b": {
"description": "A compact, efficient model for on-device tasks such as intelligent assistants and local analytics, providing low-latency performance."
},
"mistral/ministral-8b": {
"description": "A more powerful model with faster, memory-efficient inference, ideal for complex workflows and demanding edge applications."
},
"mistral/mistral-embed": {
"description": "A general-purpose text embedding model for semantic search, similarity, clustering, and RAG workflows."
},
"mistral/mistral-large": {
"description": "Mistral Large is ideal for complex tasks requiring large-scale reasoning capabilities or high specialization—such as synthetic text generation, code generation, RAG, or agents."
},
"mistral/mistral-saba-24b": {
"description": "Mistral Saba 24B is a 24 billion parameter open-source model developed by Mistral.ai. Saba is a specialized model trained to excel in Arabic, Persian, Urdu, Hebrew, and Indian languages. Served by Groq using its custom Language Processing Unit (LPU) hardware for fast, efficient inference."
},
"mistral/mistral-small": {
"description": "Mistral Small is ideal for simple tasks that can be batched—such as classification, customer support, or text generation. It delivers excellent performance at an affordable price point."
},
"mistral/mixtral-8x22b-instruct": {
"description": "8x22b Instruct model. 8x22b is a Mixture of Experts open-source model served by Mistral."
},
"mistral/pixtral-12b": {
"description": "A 12B model with image understanding capabilities as well as text."
},
"mistral/pixtral-large": {
"description": "Pixtral Large is the second model in our multimodal family, demonstrating cutting-edge image understanding. Specifically, it can comprehend documents, charts, and natural images while maintaining the leading text understanding capabilities of Mistral Large 2."
},
"mistralai/Mistral-7B-Instruct-v0.1": {
"description": "Mistral (7B) Instruct is known for its high performance, suitable for various language tasks."
},
@@ -2165,8 +2360,23 @@
"moonshotai/Kimi-K2-Instruct": {
"description": "Kimi K2 is a MoE architecture base model with exceptional coding and agent capabilities, featuring 1 trillion total parameters and 32 billion activated parameters. In benchmark tests across general knowledge reasoning, programming, mathematics, and agent tasks, the K2 model outperforms other mainstream open-source models."
},
"moonshotai/kimi-k2-instruct": {
"description": "kimi-k2 is a MoE architecture base model with powerful coding and Agent capabilities, featuring a total of 1 trillion parameters and 32 billion active parameters. In benchmark tests across key categories such as general knowledge reasoning, programming, mathematics, and Agent tasks, the K2 model outperforms other mainstream open-source models."
"moonshotai/Kimi-K2-Instruct-0905": {
"description": "Kimi K2-Instruct-0905 is the latest and most powerful version of Kimi K2. It is a top-tier Mixture of Experts (MoE) language model with a total of 1 trillion parameters and 32 billion activated parameters. Key features of this model include enhanced agent coding intelligence, demonstrating significant performance improvements in public benchmark tests and real-world agent coding tasks; and an improved frontend coding experience, with advancements in both aesthetics and practicality for frontend programming."
},
"moonshotai/kimi-k2": {
"description": "Kimi K2 is a large-scale Mixture of Experts (MoE) language model developed by Moonshot AI, with a total of 1 trillion parameters and 32 billion active parameters per forward pass. It is optimized for agent capabilities, including advanced tool use, reasoning, and code synthesis."
},
"moonshotai/kimi-k2-0905": {
"description": "The kimi-k2-0905-preview model has a context length of 256k, featuring stronger Agentic Coding capabilities, more outstanding aesthetics and practicality of frontend code, and better context understanding."
},
"moonshotai/kimi-k2-instruct-0905": {
"description": "The kimi-k2-0905-preview model has a context length of 256k, featuring stronger Agentic Coding capabilities, more outstanding aesthetics and practicality of frontend code, and better context understanding."
},
"morph/morph-v3-fast": {
"description": "Morph offers a specialized AI model that applies code changes suggested by cutting-edge models like Claude or GPT-4o to your existing code files FAST - 4500+ tokens/second. It acts as the final step in the AI coding workflow. Supports 16k input tokens and 16k output tokens."
},
"morph/morph-v3-large": {
"description": "Morph offers a specialized AI model that applies code changes suggested by cutting-edge models like Claude or GPT-4o to your existing code files FAST - 2500+ tokens/second. It acts as the final step in the AI coding workflow. Supports 16k input tokens and 16k output tokens."
},
"nousresearch/hermes-2-pro-llama-3-8b": {
"description": "Hermes 2 Pro Llama 3 8B is an upgraded version of Nous Hermes 2, featuring the latest internally developed datasets."
@@ -2195,6 +2405,9 @@
"o3": {
"description": "o3 is a versatile and powerful model that excels across multiple domains. It sets new benchmarks for tasks in mathematics, science, programming, and visual reasoning. It is also skilled in technical writing and instruction following, allowing users to analyze text, code, and images to solve complex multi-step problems."
},
"o3-2025-04-16": {
"description": "o3 is OpenAI's new reasoning model, supporting text and image inputs with text outputs, suitable for complex tasks requiring broad general knowledge."
},
"o3-deep-research": {
"description": "o3-deep-research is our most advanced deep research model, specifically designed to handle complex multi-step research tasks. It can search and synthesize information from the internet, as well as access and utilize your proprietary data through the MCP connector."
},
@@ -2204,9 +2417,15 @@
"o3-pro": {
"description": "The o3-pro model employs greater computational power for deeper thinking and consistently provides better answers. It is only supported under the Responses API."
},
"o3-pro-2025-06-10": {
"description": "o3 Pro is OpenAI's new reasoning model, supporting text and image inputs with text outputs, designed for complex tasks requiring extensive general knowledge."
},
"o4-mini": {
"description": "o4-mini is our latest small model in the o series. It is optimized for fast and efficient inference, demonstrating high efficiency and performance in coding and visual tasks."
},
"o4-mini-2025-04-16": {
"description": "o4-mini is OpenAI's reasoning model supporting text and image inputs with text outputs, suitable for complex tasks requiring broad general knowledge. This model features a 200K token context window."
},
"o4-mini-deep-research": {
"description": "o4-mini-deep-research is our faster and more affordable deep research model—ideal for tackling complex multi-step research tasks. It can search and synthesize information from the internet, as well as access and utilize your proprietary data through the MCP connector."
},
@@ -2225,29 +2444,47 @@
"open-mixtral-8x7b": {
"description": "Mixtral 8x7B is a sparse expert model that leverages multiple parameters to enhance reasoning speed, suitable for handling multilingual and code generation tasks."
},
"openai/gpt-3.5-turbo": {
"description": "OpenAI's most capable and cost-effective model in the GPT-3.5 series, optimized for chat purposes but also performing well on traditional completion tasks."
},
"openai/gpt-3.5-turbo-instruct": {
"description": "Capabilities similar to GPT-3 era models. Compatible with traditional completion endpoints rather than chat completion endpoints."
},
"openai/gpt-4-turbo": {
"description": "OpenAI's gpt-4-turbo features broad general knowledge and domain expertise, enabling it to follow complex natural language instructions and accurately solve difficult problems. Its knowledge cutoff is April 2023, with a 128,000 token context window."
},
"openai/gpt-4.1": {
"description": "GPT-4.1 is our flagship model for complex tasks. It is particularly well-suited for cross-domain problem solving."
"description": "GPT 4.1 is OpenAI's flagship model, suited for complex tasks. It excels at cross-domain problem solving."
},
"openai/gpt-4.1-mini": {
"description": "GPT-4.1 mini strikes a balance between intelligence, speed, and cost, making it an attractive model for many use cases."
"description": "GPT 4.1 mini balances intelligence, speed, and cost, making it an attractive model for many use cases."
},
"openai/gpt-4.1-nano": {
"description": "GPT-4.1 nano is the fastest and most cost-effective version of the GPT-4.1 model."
"description": "GPT-4.1 nano is the fastest and most cost-effective GPT 4.1 model."
},
"openai/gpt-4o": {
"description": "ChatGPT-4o is a dynamic model that updates in real-time to maintain the latest version. It combines powerful language understanding and generation capabilities, suitable for large-scale application scenarios, including customer service, education, and technical support."
"description": "GPT-4o from OpenAI has broad general knowledge and domain expertise, capable of following complex natural language instructions and accurately solving challenging problems. It matches GPT-4 Turbo's performance with a faster, cheaper API."
},
"openai/gpt-4o-mini": {
"description": "GPT-4o mini is the latest model released by OpenAI following GPT-4 Omni, supporting both text and image input while outputting text. As their most advanced small model, it is significantly cheaper than other recent cutting-edge models and over 60% cheaper than GPT-3.5 Turbo. It maintains state-of-the-art intelligence while offering remarkable cost-effectiveness. GPT-4o mini scored 82% on the MMLU test and currently ranks higher than GPT-4 in chat preferences."
"description": "GPT-4o mini from OpenAI is their most advanced and cost-effective small model. It is multimodal (accepting text or image inputs and outputting text) and more intelligent than gpt-3.5-turbo, while maintaining similar speed."
},
"openai/gpt-5": {
"description": "GPT-5 is OpenAI's flagship language model, excelling in complex reasoning, extensive real-world knowledge, code-intensive, and multi-step agent tasks."
},
"openai/gpt-5-mini": {
"description": "GPT-5 mini is a cost-optimized model performing well on reasoning/chat tasks. It offers the best balance of speed, cost, and capability."
},
"openai/gpt-5-nano": {
"description": "GPT-5 nano is a high-throughput model excelling at simple instruction or classification tasks."
},
"openai/gpt-oss-120b": {
"description": "OpenAI GPT-OSS 120B is a top-tier language model with 120 billion parameters, featuring built-in browser search and code execution capabilities, along with strong reasoning skills."
"description": "An extremely capable general-purpose large language model with powerful, controllable reasoning abilities."
},
"openai/gpt-oss-20b": {
"description": "OpenAI GPT-OSS 20B is a top-tier language model with 20 billion parameters, featuring built-in browser search and code execution capabilities, along with strong reasoning skills."
"description": "A compact, open-source weighted language model optimized for low latency and resource-constrained environments, including local and edge deployments."
},
"openai/o1": {
"description": "o1 is OpenAI's new reasoning model that supports multimodal input and outputs text, suitable for complex tasks requiring broad general knowledge. This model features a 200K context window and a knowledge cutoff date of October 2023."
"description": "OpenAI's o1 is a flagship reasoning model designed for complex problems requiring deep thought. It provides strong reasoning capabilities and higher accuracy for complex multi-step tasks."
},
"openai/o1-mini": {
"description": "o1-mini is a fast and cost-effective reasoning model designed for programming, mathematics, and scientific applications. This model features a 128K context and has a knowledge cutoff date of October 2023."
@@ -2256,23 +2493,44 @@
"description": "o1 is OpenAI's new reasoning model, suitable for complex tasks that require extensive general knowledge. This model features a 128K context and has a knowledge cutoff date of October 2023."
},
"openai/o3": {
"description": "O3 is a versatile and powerful model that excels in multiple domains. It sets a new benchmark for tasks in mathematics, science, programming, and visual reasoning. It is also proficient in technical writing and following instructions. Users can leverage it to analyze text, code, and images, solving complex problems that require multiple steps."
"description": "OpenAI's o3 is the most powerful reasoning model, setting new state-of-the-art levels in coding, mathematics, science, and visual perception. It excels at complex queries requiring multifaceted analysis, with special strengths in analyzing images, charts, and graphs."
},
"openai/o3-mini": {
"description": "O3-mini delivers high intelligence at the same cost and latency targets as o1-mini."
"description": "o3-mini is OpenAI's latest small reasoning model, delivering high intelligence at the same cost and latency targets as o1-mini."
},
"openai/o3-mini-high": {
"description": "O3-mini high inference level version provides high intelligence at the same cost and latency targets as o1-mini."
},
"openai/o4-mini": {
"description": "o4-mini is optimized for fast and efficient inference, demonstrating high efficiency and performance in coding and visual tasks."
"description": "OpenAI's o4-mini offers fast, cost-effective reasoning with excellent performance for its size, especially in mathematics (best in AIME benchmark), coding, and visual tasks."
},
"openai/o4-mini-high": {
"description": "o4-mini high inference level version, optimized for fast and efficient inference, demonstrating high efficiency and performance in coding and visual tasks."
},
"openai/text-embedding-3-large": {
"description": "OpenAI's most capable embedding model, suitable for English and non-English tasks."
},
"openai/text-embedding-3-small": {
"description": "OpenAI's improved, higher-performance version of the ada embedding model."
},
"openai/text-embedding-ada-002": {
"description": "OpenAI's traditional text embedding model."
},
"openrouter/auto": {
"description": "Based on context length, topic, and complexity, your request will be sent to Llama 3 70B Instruct, Claude 3.5 Sonnet (self-regulating), or GPT-4o."
},
"perplexity/sonar": {
"description": "Perplexity's lightweight product with search grounding capabilities, faster and cheaper than Sonar Pro."
},
"perplexity/sonar-pro": {
"description": "Perplexity's flagship product with search grounding capabilities, supporting advanced queries and follow-up actions."
},
"perplexity/sonar-reasoning": {
"description": "A reasoning-focused model that outputs chain-of-thought (CoT) in responses, providing detailed explanations with search grounding."
},
"perplexity/sonar-reasoning-pro": {
"description": "An advanced reasoning-focused model that outputs chain-of-thought (CoT) in responses, offering comprehensive explanations with enhanced search capabilities and multiple search queries per request."
},
"phi3": {
"description": "Phi-3 is a lightweight open model launched by Microsoft, suitable for efficient integration and large-scale knowledge reasoning."
},
@@ -2313,7 +2571,7 @@
"description": "Qwen-Image is a general-purpose image generation model that supports a wide range of artistic styles and is particularly adept at rendering complex text, especially Chinese and English. The model supports multi-line layouts, paragraph-level text generation, and fine-grained detail rendering, enabling complex mixed text-and-image layout designs."
},
"qwen-image-edit": {
"description": "A professional image-editing model released by the Qwen team, supporting semantic editing and appearance editing. It can precisely edit Chinese and English text and perform high-quality image edits such as style transfer and object rotation."
"description": "Qwen Image Edit is an image-to-image model that supports editing and modifying images based on input images and text prompts, enabling precise adjustments and creative transformations of the original image according to user needs."
},
"qwen-long": {
"description": "Qwen is a large-scale language model that supports long text contexts and dialogue capabilities based on long documents and multiple documents."
@@ -2549,6 +2807,15 @@
"qwen3-coder-plus": {
"description": "Tongyi Qianwen code model. The latest Qwen3-Coder series models are code generation models based on Qwen3, equipped with powerful Coding Agent capabilities, proficient in tool invocation and environment interaction, enabling autonomous programming with excellent coding skills alongside general capabilities."
},
"qwen3-max-preview": {
"description": "The Qwen 3 series Max model preview version shows a significant overall improvement compared to the 2.5 series in general capabilities, including Chinese and English text understanding, complex instruction adherence, subjective open tasks, multilingual capabilities, and tool invocation. The model also exhibits fewer knowledge hallucinations."
},
"qwen3-next-80b-a3b-instruct": {
"description": "A new generation of non-thinking mode open-source model based on Qwen3. Compared to the previous version (Tongyi Qianwen 3-235B-A22B-Instruct-2507), it offers better Chinese text comprehension, enhanced logical reasoning abilities, and improved performance in text generation tasks."
},
"qwen3-next-80b-a3b-thinking": {
"description": "A new generation of thinking mode open-source model based on Qwen3. Compared to the previous version (Tongyi Qianwen 3-235B-A22B-Thinking-2507), it features improved instruction-following capabilities and more concise model-generated summaries."
},
"qwq": {
"description": "QwQ is an experimental research model focused on improving AI reasoning capabilities."
},
@@ -2729,6 +2996,12 @@
"v0-1.5-md": {
"description": "The v0-1.5-md model is suitable for everyday tasks and user interface (UI) generation."
},
"vercel/v0-1.0-md": {
"description": "Access the model behind v0 to generate, fix, and optimize modern web applications, with framework-specific reasoning and up-to-date knowledge."
},
"vercel/v0-1.5-md": {
"description": "Access the model behind v0 to generate, fix, and optimize modern web applications, with framework-specific reasoning and up-to-date knowledge."
},
"wan2.2-t2i-flash": {
"description": "Wanxiang 2.2 Flash version, the latest model currently available. Fully upgraded in creativity, stability, and realism, with fast generation speed and high cost-effectiveness."
},
@@ -2759,6 +3032,27 @@
"x1": {
"description": "The Spark X1 model will undergo further upgrades, achieving results in reasoning, text generation, and language understanding tasks that match OpenAI o1 and DeepSeek R1, building on its leading position in domestic mathematical tasks."
},
"xai/grok-2": {
"description": "Grok 2 is a cutting-edge language model with state-of-the-art reasoning capabilities. It excels in chat, coding, and reasoning, outperforming Claude 3.5 Sonnet and GPT-4-Turbo on the LMSYS leaderboard."
},
"xai/grok-2-vision": {
"description": "Grok 2 Vision model excels at vision-based tasks, delivering state-of-the-art performance in visual math reasoning (MathVista) and document-based question answering (DocVQA). It can process various visual information including documents, charts, graphs, screenshots, and photos."
},
"xai/grok-3": {
"description": "xAI's flagship model, excelling in enterprise use cases such as data extraction, coding, and text summarization. It has deep domain knowledge in finance, healthcare, legal, and scientific fields."
},
"xai/grok-3-fast": {
"description": "xAI's flagship model excelling in enterprise use cases like data extraction, coding, and text summarization. The fast variant is served on faster infrastructure, providing much quicker response times at the cost of higher per-token output expenses."
},
"xai/grok-3-mini": {
"description": "xAI's lightweight model that thinks before responding. Ideal for simple or logic-based tasks that do not require deep domain knowledge. Raw thought traces are accessible."
},
"xai/grok-3-mini-fast": {
"description": "xAI's lightweight model that thinks before responding. Ideal for simple or logic-based tasks that do not require deep domain knowledge. Raw thought traces are accessible. The fast variant is served on faster infrastructure, providing much quicker response times at the cost of higher per-token output expenses."
},
"xai/grok-4": {
"description": "xAI's latest and greatest flagship model, delivering unparalleled performance in natural language, mathematics, and reasoning—an ideal all-rounder."
},
"yi-1.5-34b-chat": {
"description": "Yi-1.5 is an upgraded version of Yi. It continues pre-training on Yi using a high-quality corpus of 500B tokens and is fine-tuned on 3M diverse samples."
},
@@ -2806,5 +3100,14 @@
},
"zai-org/GLM-4.5V": {
"description": "GLM-4.5V is the latest-generation vision-language model (VLM) released by Zhipu AI. It is built on the flagship text model GLM-4.5-Air, which has 106B total parameters and 12B active parameters, and adopts a Mixture-of-Experts (MoE) architecture to deliver outstanding performance at reduced inference cost. Technically, GLM-4.5V continues the trajectory of GLM-4.1V-Thinking and introduces innovations such as three-dimensional rotary position encoding (3D-RoPE), significantly improving perception and reasoning of three-dimensional spatial relationships. Through optimizations across pretraining, supervised fine-tuning, and reinforcement learning stages, the model can handle a wide range of visual content including images, video, and long documents, and has achieved top-tier performance among comparable open-source models across 41 public multimodal benchmarks. The model also adds a \"Thinking Mode\" toggle that lets users flexibly choose between fast responses and deep reasoning to balance efficiency and effectiveness."
},
"zai/glm-4.5": {
"description": "The GLM-4.5 series models are foundational models specifically designed for agents. The flagship GLM-4.5 integrates 355 billion total parameters (32 billion active), unifying reasoning, coding, and agent capabilities to address complex application needs. As a hybrid reasoning system, it offers dual operating modes."
},
"zai/glm-4.5-air": {
"description": "GLM-4.5 and GLM-4.5-Air are our latest flagship models, specifically designed as foundational models for agent applications. Both utilize a Mixture of Experts (MoE) architecture. GLM-4.5 has 355 billion total parameters with 32 billion active per forward pass, while GLM-4.5-Air features a streamlined design with 106 billion total parameters and 12 billion active."
},
"zai/glm-4.5v": {
"description": "GLM-4.5V is built on the GLM-4.5-Air foundational model, inheriting the proven techniques of GLM-4.1V-Thinking while achieving efficient scaling through a powerful 106 billion parameter MoE architecture."
}
}
+6
View File
@@ -38,6 +38,9 @@
"cohere": {
"description": "Cohere brings you cutting-edge multilingual models, advanced retrieval capabilities, and an AI workspace tailored for modern enterprises—all integrated into a secure platform."
},
"cometapi": {
"description": "CometAPI is a service platform offering a variety of cutting-edge large model interfaces, supporting OpenAI, Anthropic, Google, and more. It caters to diverse development and application needs, allowing users to flexibly choose the optimal model and pricing according to their requirements, enhancing the AI experience."
},
"deepseek": {
"description": "DeepSeek is a company focused on AI technology research and application, with its latest model DeepSeek-V2.5 integrating general dialogue and code processing capabilities, achieving significant improvements in human preference alignment, writing tasks, and instruction following."
},
@@ -158,6 +161,9 @@
"v0": {
"description": "v0 is a pair programming assistant that generates code and user interfaces (UI) for your projects based on your natural language descriptions."
},
"vercelaigateway": {
"description": "Vercel AI Gateway provides a unified API to access over 100 models, allowing you to use models from multiple providers such as OpenAI, Anthropic, and Google through a single endpoint. It supports budget settings, usage monitoring, request load balancing, and failover."
},
"vertexai": {
"description": "Google's Gemini series is its most advanced and versatile AI model, developed by Google DeepMind. It is designed for multimodal use, supporting seamless understanding and processing of text, code, images, audio, and video. Suitable for a variety of environments, from data centers to mobile devices, it significantly enhances the efficiency and applicability of AI models."
},
+10 -3
View File
@@ -70,12 +70,15 @@
"input": {
"addAi": "Agregar un mensaje de IA",
"addUser": "Agregar un mensaje de usuario",
"disclaimer": "La IA también puede cometer errores, por favor verifique la información importante",
"errorMsg": "Error al enviar el mensaje, por favor revise la conexión y vuelva a intentarlo: {{errorMsg}}",
"more": "más",
"send": "Enviar",
"sendWithCmdEnter": "Enviar con {{meta}} + Enter",
"sendWithEnter": "Enviar con Enter",
"sendWithCmdEnter": "Presiona <key/> para enviar",
"sendWithEnter": "Presiona <key/> para enviar",
"stop": "Detener",
"warp": "Salto de línea"
"warp": "Salto de línea",
"warpWithKey": "Presione la tecla <key/> para hacer un salto de línea"
},
"intentUnderstanding": {
"title": "Entendiendo y analizando su intención..."
@@ -232,6 +235,10 @@
"threadMessageCount": "{{messageCount}} mensajes",
"title": "Subtema"
},
"toggleWideScreen": {
"off": "Desactivar modo de pantalla ancha",
"on": "Activar modo de pantalla ancha"
},
"tokenDetails": {
"chats": "Mensajes de chat",
"historySummary": "Resumen histórico",
+62
View File
@@ -0,0 +1,62 @@
{
"actions": {
"expand": {
"off": "Contraer",
"on": "Expandir"
},
"typobar": {
"off": "Ocultar barra de herramientas de formato",
"on": "Mostrar barra de herramientas de formato"
}
},
"cancel": "Cancelar",
"confirm": "Confirmar",
"file": {
"error": "Error: {{message}}",
"uploading": "Subiendo archivo..."
},
"image": {
"broken": "Imagen dañada"
},
"link": {
"edit": "Editar enlace",
"open": "Abrir enlace",
"placeholder": "Introduce la URL del enlace",
"unlink": "Quitar enlace"
},
"math": {
"placeholder": "Por favor, introduzca la fórmula TeX"
},
"slash": {
"h1": "Título de nivel 1",
"h2": "Título de nivel 2",
"h3": "Título de nivel 3",
"hr": "Línea divisoria",
"table": "Tabla",
"tex": "Fórmula TeX"
},
"table": {
"delete": "Eliminar tabla",
"deleteColumn": "Eliminar columna",
"deleteRow": "Eliminar fila",
"insertColumnLeft": "Insertar {{count}} columna(s) a la izquierda",
"insertColumnRight": "Insertar {{count}} columna(s) a la derecha",
"insertRowAbove": "Insertar {{count}} fila(s) encima",
"insertRowBelow": "Insertar {{count}} fila(s) debajo"
},
"typobar": {
"blockquote": "Cita",
"bold": "Negrita",
"bulletList": "Lista desordenada",
"code": "Código en línea",
"codeblock": "Bloque de código",
"italic": "Cursiva",
"link": "Enlace",
"numberList": "Lista ordenada",
"strikethrough": "Tachado",
"table": "tabla",
"taskList": "Lista de tareas",
"tex": "Fórmula TeX",
"underline": "Subrayado"
}
}
+3
View File
@@ -5,6 +5,9 @@
"lock": "Bloquear relación de aspecto",
"unlock": "Desbloquear relación de aspecto"
},
"cfg": {
"label": "Intensidad de guía"
},
"header": {
"desc": "Descripción simple, crea al instante",
"title": "Pintura"
+358 -53
View File
@@ -53,6 +53,9 @@
"Baichuan4-Turbo": {
"description": "El modelo más potente del país, superando a los modelos principales extranjeros en tareas en chino como enciclopedias, textos largos y creación generativa. También cuenta con capacidades multimodales líderes en la industria, destacándose en múltiples evaluaciones de referencia."
},
"ByteDance-Seed/Seed-OSS-36B-Instruct": {
"description": "Seed-OSS es una serie de modelos de lenguaje grandes de código abierto desarrollados por el equipo Seed de ByteDance, diseñados específicamente para un potente manejo de contextos largos, razonamiento, agentes inteligentes y capacidades generales. Dentro de esta serie, Seed-OSS-36B-Instruct es un modelo afinado por instrucciones con 36 mil millones de parámetros, que soporta de forma nativa contextos ultra largos, permitiendo procesar grandes volúmenes de documentos o complejas bases de código de una sola vez. Este modelo está especialmente optimizado para tareas de razonamiento, generación de código y agentes (como el uso de herramientas), manteniendo un equilibrio y una capacidad general sobresaliente. Una característica destacada de este modelo es la función \"Presupuesto de Pensamiento\" (Thinking Budget), que permite a los usuarios ajustar de manera flexible la longitud del razonamiento según sus necesidades, mejorando así la eficiencia en aplicaciones prácticas."
},
"DeepSeek-R1": {
"description": "LLM eficiente de última generación, experto en razonamiento, matemáticas y programación."
},
@@ -81,7 +84,13 @@
"description": "Proveedor del modelo: plataforma sophnet. DeepSeek V3 Fast es la versión de alta velocidad y alto TPS de DeepSeek V3 0324, completamente sin cuantificación, con mayor capacidad en código y matemáticas, ¡y respuesta más rápida!"
},
"DeepSeek-V3.1": {
"description": "DeepSeek-V3.1 es un nuevo modelo híbrido de razonamiento lanzado por DeepSeek, que soporta dos modos de razonamiento: con pensamiento y sin pensamiento, con una eficiencia de pensamiento superior a DeepSeek-R1-0528. Tras una optimización post-entrenamiento, el uso de herramientas Agent y el rendimiento en tareas inteligentes han mejorado significativamente."
"description": "DeepSeek-V3.1 en modo no reflexivo; DeepSeek-V3.1 es un nuevo modelo híbrido de razonamiento lanzado por DeepSeek, que soporta dos modos de razonamiento: reflexivo y no reflexivo, con una eficiencia de pensamiento superior a DeepSeek-R1-0528. Tras una optimización post-entrenamiento, el uso de herramientas por agentes y el desempeño en tareas de agentes inteligentes han mejorado significativamente."
},
"DeepSeek-V3.1-Fast": {
"description": "DeepSeek V3.1 Fast es la versión de alta TPS y alta velocidad del DeepSeek V3.1. Modo híbrido de pensamiento: mediante la modificación de la plantilla de chat, un solo modelo puede soportar simultáneamente modos reflexivo y no reflexivo. Llamadas a herramientas más inteligentes: gracias a la optimización post-entrenamiento, el modelo mejora notablemente su desempeño en el uso de herramientas y tareas de agentes."
},
"DeepSeek-V3.1-Think": {
"description": "DeepSeek-V3.1 en modo reflexivo; DeepSeek-V3.1 es un nuevo modelo híbrido de razonamiento lanzado por DeepSeek, que soporta dos modos de razonamiento: reflexivo y no reflexivo, con una eficiencia de pensamiento superior a DeepSeek-R1-0528. Tras una optimización post-entrenamiento, el uso de herramientas por agentes y el desempeño en tareas de agentes inteligentes han mejorado significativamente."
},
"Doubao-lite-128k": {
"description": "Doubao-lite ofrece una velocidad de respuesta excepcional y una mejor relación calidad-precio, proporcionando opciones más flexibles para diferentes escenarios de los clientes. Soporta inferencia y ajuste fino con una ventana de contexto de 128k."
@@ -281,6 +290,9 @@
"Pro/moonshotai/Kimi-K2-Instruct": {
"description": "Kimi K2 es un modelo base con arquitectura MoE que posee capacidades avanzadas de codificación y agentes, con un total de 1 billón de parámetros y 32 mil millones de parámetros activados. En pruebas de referencia en categorías principales como razonamiento general, programación, matemáticas y agentes, el rendimiento del modelo K2 supera a otros modelos de código abierto populares."
},
"Pro/moonshotai/Kimi-K2-Instruct-0905": {
"description": "Kimi K2-Instruct-0905 es la versión más reciente y potente de Kimi K2. Es un modelo de lenguaje de expertos mixtos (MoE) de primer nivel, con un total de un billón de parámetros y 32 mil millones de parámetros activados. Las principales características de este modelo incluyen: inteligencia mejorada para agentes de codificación, mostrando un rendimiento notable en pruebas de referencia públicas y en tareas reales de agentes de codificación; y una experiencia mejorada en la codificación frontend, con avances tanto en la estética como en la funcionalidad de la programación frontend."
},
"QwQ-32B-Preview": {
"description": "QwQ-32B-Preview es un modelo de procesamiento de lenguaje natural innovador, capaz de manejar de manera eficiente tareas complejas de generación de diálogos y comprensión del contexto."
},
@@ -590,6 +602,33 @@
"ai21-labs/AI21-Jamba-1.5-Mini": {
"description": "Un modelo multilingüe de 52 mil millones de parámetros (12 mil millones activos), que ofrece una ventana de contexto larga de 256K, llamadas a funciones, salida estructurada y generación basada en hechos."
},
"alibaba/qwen-3-14b": {
"description": "Qwen3 es la última generación de modelos de lenguaje a gran escala de la serie Qwen, que ofrece un conjunto completo de modelos densos y de expertos mixtos (MoE). Basado en un entrenamiento extenso, Qwen3 proporciona avances revolucionarios en razonamiento, cumplimiento de instrucciones, capacidades de agente y soporte multilingüe."
},
"alibaba/qwen-3-235b": {
"description": "Qwen3 es la última generación de modelos de lenguaje a gran escala de la serie Qwen, que ofrece un conjunto completo de modelos densos y de expertos mixtos (MoE). Basado en un entrenamiento extenso, Qwen3 proporciona avances revolucionarios en razonamiento, cumplimiento de instrucciones, capacidades de agente y soporte multilingüe."
},
"alibaba/qwen-3-30b": {
"description": "Qwen3 es la última generación de modelos de lenguaje a gran escala de la serie Qwen, que ofrece un conjunto completo de modelos densos y de expertos mixtos (MoE). Basado en un entrenamiento extenso, Qwen3 proporciona avances revolucionarios en razonamiento, cumplimiento de instrucciones, capacidades de agente y soporte multilingüe."
},
"alibaba/qwen-3-32b": {
"description": "Qwen3 es la última generación de modelos de lenguaje a gran escala de la serie Qwen, que ofrece un conjunto completo de modelos densos y de expertos mixtos (MoE). Basado en un entrenamiento extenso, Qwen3 proporciona avances revolucionarios en razonamiento, cumplimiento de instrucciones, capacidades de agente y soporte multilingüe."
},
"alibaba/qwen3-coder": {
"description": "Qwen3-Coder-480B-A35B-Instruct es el modelo de código más orientado a agentes de Qwen, con un rendimiento destacado en codificación de agentes, uso de navegadores de agentes y otras tareas básicas de codificación, alcanzando resultados comparables a Claude Sonnet."
},
"amazon/nova-lite": {
"description": "Un modelo multimodal de muy bajo costo que procesa entradas de imágenes, videos y texto a una velocidad extremadamente rápida."
},
"amazon/nova-micro": {
"description": "Un modelo solo de texto que ofrece respuestas con la latencia más baja a un costo muy reducido."
},
"amazon/nova-pro": {
"description": "Un modelo multimodal altamente competente que ofrece la mejor combinación de precisión, velocidad y costo, adecuado para una amplia gama de tareas."
},
"amazon/titan-embed-text-v2": {
"description": "Amazon Titan Text Embeddings V2 es un modelo de incrustaciones multilingüe ligero y eficiente, compatible con dimensiones de 1024, 512 y 256."
},
"anthropic.claude-3-5-sonnet-20240620-v1:0": {
"description": "Claude 3.5 Sonnet eleva el estándar de la industria, superando a modelos competidores y a Claude 3 Opus, destacándose en evaluaciones amplias, mientras mantiene la velocidad y costo de nuestros modelos de nivel medio."
},
@@ -615,25 +654,28 @@
"description": "La versión actualizada de Claude 2, con el doble de ventana de contexto, así como mejoras en la fiabilidad, tasa de alucinaciones y precisión basada en evidencia en contextos de documentos largos y RAG."
},
"anthropic/claude-3-haiku": {
"description": "Claude 3 Haiku es el modelo más rápido y compacto de Anthropic, diseñado para lograr respuestas casi instantáneas. Tiene un rendimiento de orientación rápido y preciso."
"description": "Claude 3 Haiku es el modelo más rápido de Anthropic hasta la fecha, diseñado para cargas de trabajo empresariales que suelen involucrar indicaciones largas. Haiku puede analizar rápidamente grandes volúmenes de documentos, como informes trimestrales, contratos o casos legales, a la mitad del costo de otros modelos de su clase."
},
"anthropic/claude-3-opus": {
"description": "Claude 3 Opus es el modelo más potente de Anthropic para manejar tareas altamente complejas. Destaca en rendimiento, inteligencia, fluidez y comprensión."
"description": "Claude 3 Opus es el modelo más inteligente de Anthropic, con un rendimiento líder en el mercado en tareas altamente complejas. Navega indicaciones abiertas y escenarios inéditos con fluidez excepcional y comprensión humana."
},
"anthropic/claude-3.5-haiku": {
"description": "Claude 3.5 Haiku es el modelo de próxima generación más rápido de Anthropic. En comparación con Claude 3 Haiku, Claude 3.5 Haiku ha mejorado en todas las habilidades y ha superado al modelo más grande de la generación anterior, Claude 3 Opus, en muchas pruebas de inteligencia."
"description": "Claude 3.5 Haiku es la siguiente generación de nuestro modelo más rápido. Con una velocidad similar a Claude 3 Haiku, Claude 3.5 Haiku mejora en cada conjunto de habilidades y supera a nuestro modelo más grande anterior, Claude 3 Opus, en muchas pruebas de referencia de inteligencia."
},
"anthropic/claude-3.5-sonnet": {
"description": "Claude 3.5 Sonnet ofrece capacidades que superan a Opus y una velocidad más rápida que Sonnet, manteniendo el mismo precio que Sonnet. Sonnet es especialmente hábil en programación, ciencia de datos, procesamiento visual y tareas de agente."
"description": "Claude 3.5 Sonnet logra un equilibrio ideal entre inteligencia y velocidad, especialmente para cargas de trabajo empresariales. Ofrece un rendimiento potente a menor costo en comparación con productos similares y está diseñado para alta durabilidad en implementaciones de IA a gran escala."
},
"anthropic/claude-3.7-sonnet": {
"description": "Claude 3.7 Sonnet es el modelo más inteligente de Anthropic hasta la fecha y el primer modelo de razonamiento híbrido en el mercado. Claude 3.7 Sonnet puede generar respuestas casi instantáneas o un pensamiento prolongado y gradual, permitiendo a los usuarios observar claramente estos procesos. Sonnet es especialmente hábil en programación, ciencia de datos, procesamiento visual y tareas de agente."
"description": "Claude 3.7 Sonnet es el primer modelo de razonamiento híbrido y el más inteligente de Anthropic hasta la fecha. Ofrece un rendimiento de vanguardia en codificación, generación de contenido, análisis de datos y tareas de planificación, construido sobre las capacidades de ingeniería de software y computación de su predecesor Claude 3.5 Sonnet."
},
"anthropic/claude-opus-4": {
"description": "Claude Opus 4 es el modelo más potente de Anthropic para manejar tareas altamente complejas. Destaca por su rendimiento, inteligencia, fluidez y capacidad de comprensión excepcionales."
"description": "Claude Opus 4 es el modelo más potente de Anthropic y el mejor modelo de codificación del mundo, liderando en SWE-bench (72.5%) y Terminal-bench (43.2%). Proporciona rendimiento sostenido para tareas a largo plazo que requieren esfuerzo concentrado y miles de pasos, capaz de trabajar continuamente durante horas, ampliando significativamente las capacidades de los agentes de IA."
},
"anthropic/claude-opus-4.1": {
"description": "Claude Opus 4.1 es una alternativa plug-and-play a Opus 4, que ofrece un rendimiento y precisión excepcionales para tareas prácticas de codificación y agentes. Eleva el rendimiento de codificación de vanguardia a un 74.5% verificado en SWE-bench y maneja problemas complejos de múltiples pasos con mayor rigor y atención al detalle."
},
"anthropic/claude-sonnet-4": {
"description": "Claude Sonnet 4 puede generar respuestas casi instantáneas o razonamientos prolongados paso a paso, que los usuarios pueden seguir claramente. Los usuarios de la API también pueden controlar con precisión el tiempo de reflexión del modelo."
"description": "Claude Sonnet 4 mejora significativamente las capacidades líderes de Sonnet 3.7, destacándose en codificación con un rendimiento de vanguardia del 72.7% en SWE-bench. El modelo equilibra rendimiento y eficiencia, adecuado para casos de uso internos y externos, y ofrece mayor control mediante una mejor capacidad de control."
},
"ascend-tribe/pangu-pro-moe": {
"description": "Pangu-Pro-MoE 72B-A16B es un modelo de lenguaje grande disperso con 72 mil millones de parámetros y 16 mil millones de parámetros activados. Está basado en la arquitectura de expertos mixtos agrupados (MoGE), que agrupa expertos durante la selección y restringe la activación de un número igual de expertos por grupo para cada token, logrando un balance de carga entre expertos y mejorando significativamente la eficiencia de despliegue en la plataforma Ascend."
@@ -689,6 +731,9 @@
"claude-3-5-haiku-20241022": {
"description": "Claude 3.5 Haiku es el modelo de próxima generación más rápido de Anthropic. En comparación con Claude 3 Haiku, Claude 3.5 Haiku ha mejorado en todas las habilidades y ha superado al modelo más grande de la generación anterior, Claude 3 Opus, en muchas pruebas de referencia de inteligencia."
},
"claude-3-5-haiku-latest": {
"description": "Claude 3.5 Haiku ofrece respuestas rápidas, ideal para tareas ligeras."
},
"claude-3-5-sonnet-20240620": {
"description": "Claude 3.5 Sonnet ofrece capacidades que superan a Opus y una velocidad más rápida que Sonnet, manteniendo el mismo precio que Sonnet. Sonnet es especialmente bueno en programación, ciencia de datos, procesamiento visual y tareas de agentes."
},
@@ -698,6 +743,9 @@
"claude-3-7-sonnet-20250219": {
"description": "Claude 3.7 Sonnet es el modelo de IA más potente de Anthropic, con un rendimiento de vanguardia en tareas altamente complejas. Puede manejar indicaciones abiertas y escenarios no vistos, con una fluidez y comprensión humana excepcionales. Claude 3.7 Sonnet muestra la vanguardia de las posibilidades de la IA generativa."
},
"claude-3-7-sonnet-latest": {
"description": "Claude 3.7 Sonnet es el modelo más potente y reciente de Anthropic para manejar tareas altamente complejas. Destaca en rendimiento, inteligencia, fluidez y comprensión."
},
"claude-3-haiku-20240307": {
"description": "Claude 3 Haiku es el modelo más rápido y compacto de Anthropic, diseñado para lograr respuestas casi instantáneas. Tiene un rendimiento de orientación rápido y preciso."
},
@@ -710,11 +758,17 @@
"claude-opus-4-1-20250805": {
"description": "Claude Opus 4.1 es el modelo más potente y reciente de Anthropic para manejar tareas altamente complejas. Sobresale en rendimiento, inteligencia, fluidez y comprensión."
},
"claude-opus-4-1-20250805-thinking": {
"description": "Modelo de pensamiento Claude Opus 4.1, una versión avanzada que puede mostrar su proceso de razonamiento."
},
"claude-opus-4-20250514": {
"description": "Claude Opus 4 es el modelo más potente de Anthropic para manejar tareas altamente complejas. Se destaca en rendimiento, inteligencia, fluidez y comprensión."
},
"claude-sonnet-4-20250514": {
"description": "Claude 4 Sonnet puede generar respuestas casi instantáneas o un pensamiento gradual prolongado, permitiendo a los usuarios ver claramente estos procesos. Los usuarios de la API también pueden tener un control detallado sobre el tiempo de pensamiento del modelo."
"description": "Claude Sonnet 4 puede generar respuestas casi instantáneas o un pensamiento prolongado paso a paso, permitiendo a los usuarios ver claramente estos procesos."
},
"claude-sonnet-4-20250514-thinking": {
"description": "Modelo de pensamiento Claude Sonnet 4 que puede generar respuestas casi instantáneas o un pensamiento prolongado paso a paso, permitiendo a los usuarios ver claramente estos procesos."
},
"codegeex-4": {
"description": "CodeGeeX-4 es un potente asistente de programación AI, que admite preguntas y respuestas inteligentes y autocompletado de código en varios lenguajes de programación, mejorando la eficiencia del desarrollo."
@@ -773,6 +827,18 @@
"cohere/Cohere-command-r-plus": {
"description": "Command R+ es un modelo optimizado de última generación para RAG, diseñado para manejar cargas de trabajo empresariales."
},
"cohere/command-a": {
"description": "Command A es el modelo más potente de Cohere hasta la fecha, sobresaliendo en uso de herramientas, agentes, generación mejorada por recuperación (RAG) y casos multilingües. Con una longitud de contexto de 256K, funciona con solo dos GPU y ofrece un rendimiento 150% superior en comparación con Command R+ 08-2024."
},
"cohere/command-r": {
"description": "Command R es un modelo de lenguaje grande optimizado para interacciones conversacionales y tareas de contexto largo. Se posiciona en la categoría \"escalable\", equilibrando alto rendimiento y precisión para permitir que las empresas avancen más allá de la prueba de concepto hacia la producción."
},
"cohere/command-r-plus": {
"description": "Command R+ es el modelo de lenguaje grande más reciente de Cohere, optimizado para interacciones conversacionales y tareas de contexto largo. Su objetivo es ofrecer un rendimiento excepcional para que las empresas puedan superar la prueba de concepto y pasar a producción."
},
"cohere/embed-v4.0": {
"description": "Un modelo que permite clasificar texto, imágenes o contenido mixto o convertirlos en incrustaciones."
},
"command": {
"description": "Un modelo de conversación que sigue instrucciones, ofreciendo alta calidad y fiabilidad en tareas lingüísticas, además de tener una longitud de contexto más larga que nuestros modelos de generación básicos."
},
@@ -809,12 +875,6 @@
"command-r7b-12-2024": {
"description": "command-r7b-12-2024 es una versión pequeña y eficiente, lanzada en diciembre de 2024. Destaca en tareas que requieren razonamiento complejo y procesamiento en múltiples pasos, como RAG, uso de herramientas y agentes."
},
"compound-beta": {
"description": "Compound-beta es un sistema de IA compuesto, respaldado por múltiples modelos de acceso abierto ya soportados en GroqCloud, que puede utilizar herramientas de manera inteligente y selectiva para responder a consultas de los usuarios."
},
"compound-beta-mini": {
"description": "Compound-beta-mini es un sistema de IA compuesto, respaldado por modelos de acceso abierto ya soportados en GroqCloud, que puede utilizar herramientas de manera inteligente y selectiva para responder a consultas de los usuarios."
},
"computer-use-preview": {
"description": "El modelo computer-use-preview está diseñado exclusivamente para \"herramientas de uso informático\", entrenado para comprender y ejecutar tareas relacionadas con computadoras."
},
@@ -957,7 +1017,7 @@
"description": "DeepSeek-V3.1 es un modelo híbrido de razonamiento grande que soporta contexto largo de 128K y cambio eficiente de modos, logrando un rendimiento y velocidad sobresalientes en llamadas a herramientas, generación de código y tareas complejas de razonamiento."
},
"deepseek/deepseek-r1": {
"description": "DeepSeek-R1 mejora significativamente la capacidad de razonamiento del modelo con muy pocos datos etiquetados. Antes de proporcionar la respuesta final, el modelo genera una cadena de pensamiento para mejorar la precisión de la respuesta final."
"description": "El modelo DeepSeek R1 ha recibido una actualización menor, actualmente en la versión DeepSeek-R1-0528. En la última actualización, DeepSeek R1 mejora significativamente la profundidad y capacidad de razonamiento al aprovechar recursos computacionales aumentados y mecanismos de optimización algorítmica post-entrenamiento. El modelo destaca en evaluaciones de referencia en matemáticas, programación y lógica general, acercándose al rendimiento de modelos líderes como O3 y Gemini 2.5 Pro."
},
"deepseek/deepseek-r1-0528": {
"description": "DeepSeek-R1 mejora enormemente la capacidad de razonamiento del modelo con muy pocos datos etiquetados. Antes de generar la respuesta final, el modelo produce una cadena de pensamiento para aumentar la precisión de la respuesta."
@@ -966,7 +1026,7 @@
"description": "DeepSeek-R1 mejora enormemente la capacidad de razonamiento del modelo con muy pocos datos etiquetados. Antes de generar la respuesta final, el modelo produce una cadena de pensamiento para aumentar la precisión de la respuesta."
},
"deepseek/deepseek-r1-distill-llama-70b": {
"description": "DeepSeek R1 Distill Llama 70B es un modelo de lenguaje de gran tamaño basado en Llama3.3 70B, que utiliza el ajuste fino de la salida de DeepSeek R1 para lograr un rendimiento competitivo comparable a los modelos de vanguardia de gran tamaño."
"description": "DeepSeek-R1-Distill-Llama-70B es una variante destilada y más eficiente del modelo Llama de 70B. Mantiene un rendimiento sólido en tareas de generación de texto, reduciendo el costo computacional para facilitar su despliegue e investigación. Operado por Groq con su hardware personalizado de unidad de procesamiento de lenguaje (LPU) para ofrecer inferencia rápida y eficiente."
},
"deepseek/deepseek-r1-distill-llama-8b": {
"description": "DeepSeek R1 Distill Llama 8B es un modelo de lenguaje grande destilado basado en Llama-3.1-8B-Instruct, entrenado utilizando la salida de DeepSeek R1."
@@ -984,7 +1044,10 @@
"description": "DeepSeek-R1 mejora significativamente la capacidad de razonamiento del modelo con muy pocos datos etiquetados. Antes de proporcionar la respuesta final, el modelo genera una cadena de pensamiento para mejorar la precisión de la respuesta final."
},
"deepseek/deepseek-v3": {
"description": "DeepSeek-V3 ha logrado un avance significativo en la velocidad de inferencia en comparación con modelos anteriores. Se clasifica como el número uno entre los modelos de código abierto y puede competir con los modelos cerrados más avanzados del mundo. DeepSeek-V3 utiliza la arquitectura de atención multi-cabeza (MLA) y DeepSeekMoE, que han sido completamente validadas en DeepSeek-V2. Además, DeepSeek-V3 ha introducido una estrategia auxiliar sin pérdidas para el balanceo de carga y ha establecido objetivos de entrenamiento de predicción de múltiples etiquetas para lograr un rendimiento más robusto."
"description": "Modelo de lenguaje grande universal rápido con capacidades de razonamiento mejoradas."
},
"deepseek/deepseek-v3.1-base": {
"description": "DeepSeek V3.1 Base es una versión mejorada del modelo DeepSeek V3."
},
"deepseek/deepseek-v3/community": {
"description": "DeepSeek-V3 ha logrado un avance significativo en la velocidad de inferencia en comparación con modelos anteriores. Se clasifica como el número uno entre los modelos de código abierto y puede competir con los modelos cerrados más avanzados del mundo. DeepSeek-V3 utiliza la arquitectura de atención multi-cabeza (MLA) y DeepSeekMoE, que han sido completamente validadas en DeepSeek-V2. Además, DeepSeek-V3 ha introducido una estrategia auxiliar sin pérdidas para el balanceo de carga y ha establecido objetivos de entrenamiento de predicción de múltiples etiquetas para lograr un rendimiento más robusto."
@@ -1055,8 +1118,17 @@
"doubao-seed-1.6-thinking": {
"description": "El modelo Doubao-Seed-1.6-thinking tiene una capacidad de pensamiento significativamente mejorada. En comparación con Doubao-1.5-thinking-pro, mejora aún más en habilidades básicas como programación, matemáticas y razonamiento lógico, y soporta comprensión visual. Soporta una ventana de contexto de 256k y una longitud máxima de salida de 16k tokens."
},
"doubao-seed-1.6-vision": {
"description": "Doubao-Seed-1.6-vision es un modelo de pensamiento profundo visual que demuestra una capacidad multimodal general más fuerte en escenarios como educación, revisión de imágenes, inspección y seguridad, y búsqueda y respuesta con IA. Soporta una ventana de contexto de 256k y una longitud máxima de salida de 64k tokens."
},
"doubao-seededit-3-0-i2i-250628": {
"description": "El modelo de generación de imágenes Doubao fue desarrollado por el equipo Seed de ByteDance, soporta entrada de texto e imagen, ofreciendo una experiencia de generación de imágenes altamente controlable y de alta calidad. Permite editar imágenes mediante instrucciones de texto, generando imágenes con lados entre 512 y 1536 píxeles."
},
"doubao-seedream-3-0-t2i-250415": {
"description": "El modelo de generación de imágenes Doubao fue desarrollado por el equipo Seed de ByteDance, soporta entrada de texto e imagen, y ofrece una experiencia de generación de imágenes altamente controlable y de alta calidad. Genera imágenes basadas en indicaciones textuales."
"description": "El modelo de generación de imágenes Seedream 3.0, desarrollado por el equipo Seed de ByteDance, soporta entrada de texto e imagen, ofreciendo una experiencia de generación de imágenes altamente controlable y de alta calidad. Genera imágenes basadas en indicaciones de texto."
},
"doubao-seedream-4-0-250828": {
"description": "El modelo de generación de imágenes Seedream 4.0, desarrollado por el equipo Seed de ByteDance, soporta entrada de texto e imagen, ofreciendo una experiencia de generación de imágenes altamente controlable y de alta calidad. Genera imágenes basadas en indicaciones de texto."
},
"doubao-vision-lite-32k": {
"description": "El modelo Doubao-vision es un modelo multimodal desarrollado por Doubao, con potentes capacidades de comprensión e inferencia de imágenes, así como una precisa comprensión de instrucciones. El modelo muestra un rendimiento destacado en extracción de información texto-imagen y tareas de inferencia basadas en imágenes, aplicable a tareas de preguntas visuales más complejas y amplias."
@@ -1139,6 +1211,33 @@
"ernie-x1-turbo-32k": {
"description": "Mejora en comparación con ERNIE-X1-32K, con mejores resultados y rendimiento."
},
"fal-ai/bytedance/seedream/v4": {
"description": "El modelo de generación de imágenes Seedream 4.0, desarrollado por el equipo Seed de ByteDance, soporta entrada de texto e imagen, ofreciendo una experiencia de generación de imágenes altamente controlable y de alta calidad. Genera imágenes basadas en indicaciones de texto."
},
"fal-ai/flux-kontext/dev": {
"description": "Modelo FLUX.1 enfocado en tareas de edición de imágenes, soporta entrada de texto e imagen."
},
"fal-ai/flux-pro/kontext": {
"description": "FLUX.1 Kontext [pro] puede procesar texto e imágenes de referencia como entrada, logrando ediciones locales dirigidas y transformaciones complejas de escenas completas sin interrupciones."
},
"fal-ai/flux/krea": {
"description": "Flux Krea [dev] es un modelo generador de imágenes con preferencia estética, orientado a crear imágenes más realistas y naturales."
},
"fal-ai/flux/schnell": {
"description": "FLUX.1 [schnell] es un modelo generador de imágenes con 12 mil millones de parámetros, enfocado en la generación rápida de imágenes de alta calidad."
},
"fal-ai/imagen4/preview": {
"description": "Modelo de generación de imágenes de alta calidad proporcionado por Google."
},
"fal-ai/nano-banana": {
"description": "Nano Banana es el modelo multimodal nativo más reciente, rápido y eficiente de Google, que permite generar y editar imágenes mediante conversación."
},
"fal-ai/qwen-image": {
"description": "Potente modelo de imágenes sin procesar del equipo Qwen, con impresionante capacidad para generar texto en chino y diversos estilos visuales de imágenes."
},
"fal-ai/qwen-image-edit": {
"description": "Modelo profesional de edición de imágenes lanzado por el equipo Qwen, que soporta edición semántica y de apariencia, capaz de editar texto en chino e inglés con precisión, realizar transformaciones de estilo, rotación de objetos y otras ediciones de alta calidad."
},
"flux-1-schnell": {
"description": "Modelo de generación de imágenes a partir de texto con 12 mil millones de parámetros desarrollado por Black Forest Labs, que utiliza tecnología de destilación de difusión adversarial latente, capaz de generar imágenes de alta calidad en 1 a 4 pasos. Su rendimiento es comparable a alternativas propietarias y se publica bajo licencia Apache-2.0, apto para uso personal, investigación y comercial."
},
@@ -1151,9 +1250,6 @@
"flux-kontext-pro": {
"description": "Generación y edición de imágenes contextuales de vanguardia: combina texto e imágenes para obtener resultados precisos y coherentes."
},
"flux-kontext/dev": {
"description": "Modelo FLUX.1 centrado en tareas de edición de imágenes, compatible con entradas de texto e imagen."
},
"flux-merged": {
"description": "El modelo FLUX.1-merged combina las características profundas exploradas durante la fase de desarrollo de “DEV” con las ventajas de ejecución rápida representadas por “Schnell”. Esta combinación no solo amplía los límites de rendimiento del modelo, sino que también amplía su rango de aplicaciones."
},
@@ -1166,21 +1262,12 @@
"flux-pro-1.1-ultra": {
"description": "Generación de imágenes por IA de ultra alta resolución — compatible con salida de 4 megapíxeles; genera imágenes en alta definición en menos de 10 segundos."
},
"flux-pro/kontext": {
"description": "FLUX.1 Kontext [pro] puede procesar texto e imágenes de referencia como entrada, logrando sin problemas ediciones locales específicas y transformaciones complejas de escenas completas."
},
"flux-schnell": {
"description": "FLUX.1 [schnell], como el modelo de pocos pasos más avanzado de código abierto actualmente, supera no solo a competidores similares sino también a potentes modelos no refinados como Midjourney v6.0 y DALL·E 3 (HD). Este modelo ha sido ajustado específicamente para conservar toda la diversidad de salida de la etapa de preentrenamiento. En comparación con los modelos más avanzados del mercado, FLUX.1 [schnell] mejora significativamente la calidad visual, el cumplimiento de instrucciones, la variación de tamaño/proporción, el manejo de fuentes y la diversidad de salida, ofreciendo a los usuarios una experiencia de generación de imágenes creativas más rica y variada."
},
"flux.1-schnell": {
"description": "Transformador de flujo rectificado con 12 mil millones de parámetros, capaz de generar imágenes basadas en descripciones textuales."
},
"flux/krea": {
"description": "Flux Krea [dev] es un modelo generador de imágenes con preferencia estética, diseñado para crear imágenes más realistas y naturales."
},
"flux/schnell": {
"description": "FLUX.1 [schnell] es un modelo generador de imágenes con 12 mil millones de parámetros, enfocado en la generación rápida de imágenes de alta calidad."
},
"gemini-1.0-pro-001": {
"description": "Gemini 1.0 Pro 001 (Ajuste) ofrece un rendimiento estable y ajustable, siendo una opción ideal para soluciones de tareas complejas."
},
@@ -1388,20 +1475,26 @@
"glm-zero-preview": {
"description": "GLM-Zero-Preview posee una poderosa capacidad de razonamiento complejo, destacándose en áreas como razonamiento lógico, matemáticas y programación."
},
"google/gemini-2.0-flash": {
"description": "Gemini 2.0 Flash ofrece funcionalidades de próxima generación y mejoras, incluyendo velocidad sobresaliente, uso integrado de herramientas, generación multimodal y una ventana de contexto de 1 millón de tokens."
},
"google/gemini-2.0-flash-001": {
"description": "Gemini 2.0 Flash ofrece funciones y mejoras de próxima generación, incluyendo velocidad excepcional, uso de herramientas nativas, generación multimodal y una ventana de contexto de 1M tokens."
},
"google/gemini-2.0-flash-exp:free": {
"description": "Gemini 2.0 Flash Experimental es el último modelo de IA multimodal experimental de Google, con una mejora de calidad en comparación con versiones anteriores, especialmente en conocimiento del mundo, código y contexto largo."
},
"google/gemini-2.0-flash-lite": {
"description": "Gemini 2.0 Flash Lite ofrece funcionalidades de próxima generación y mejoras, incluyendo velocidad sobresaliente, uso integrado de herramientas, generación multimodal y una ventana de contexto de 1 millón de tokens."
},
"google/gemini-2.5-flash": {
"description": "Gemini 2.5 Flash es el modelo principal más avanzado de Google, diseñado para tareas avanzadas de razonamiento, codificación, matemáticas y ciencias. Incluye una capacidad incorporada de \"pensamiento\" que le permite proporcionar respuestas con mayor precisión y un manejo detallado del contexto.\n\nNota: este modelo tiene dos variantes: con pensamiento y sin pensamiento. La tarificación de salida varía significativamente según si la capacidad de pensamiento está activada. Si elige la variante estándar (sin el sufijo \":thinking\"), el modelo evitará explícitamente generar tokens de pensamiento.\n\nPara aprovechar la capacidad de pensamiento y recibir tokens de pensamiento, debe seleccionar la variante \":thinking\", lo que generará una tarificación más alta para la salida de pensamiento.\n\nAdemás, Gemini 2.5 Flash se puede configurar mediante el parámetro \"máximo de tokens para razonamiento\", como se describe en la documentación (https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning)."
"description": "Gemini 2.5 Flash es un modelo de pensamiento que ofrece capacidades integrales sobresalientes. Está diseñado para equilibrar precio y rendimiento, soportando multimodalidad y una ventana de contexto de 1 millón de tokens."
},
"google/gemini-2.5-flash-image-preview": {
"description": "Modelo experimental Gemini 2.5 Flash, compatible con generación de imágenes."
},
"google/gemini-2.5-flash-image-preview:free": {
"description": "Modelo experimental Gemini 2.5 Flash, compatible con generación de imágenes."
"google/gemini-2.5-flash-lite": {
"description": "Gemini 2.5 Flash-Lite es un modelo equilibrado y de baja latencia, con presupuesto de pensamiento configurable y conectividad de herramientas (por ejemplo, búsqueda de Google y ejecución de código). Soporta entradas multimodales y ofrece una ventana de contexto de 1 millón de tokens."
},
"google/gemini-2.5-flash-preview": {
"description": "Gemini 2.5 Flash es el modelo principal más avanzado de Google, diseñado para razonamiento avanzado, codificación, matemáticas y tareas científicas. Incluye la capacidad de 'pensar' incorporada, lo que le permite proporcionar respuestas con mayor precisión y un manejo más detallado del contexto.\n\nNota: Este modelo tiene dos variantes: con pensamiento y sin pensamiento. La fijación de precios de salida varía significativamente según si la capacidad de pensamiento está activada. Si elige la variante estándar (sin el sufijo ':thinking'), el modelo evitará explícitamente generar tokens de pensamiento.\n\nPara aprovechar la capacidad de pensamiento y recibir tokens de pensamiento, debe elegir la variante ':thinking', lo que resultará en un precio de salida de pensamiento más alto.\n\nAdemás, Gemini 2.5 Flash se puede configurar a través del parámetro 'número máximo de tokens de razonamiento', como se describe en la documentación (https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning)."
@@ -1410,11 +1503,14 @@
"description": "Gemini 2.5 Flash es el modelo principal más avanzado de Google, diseñado para razonamiento avanzado, codificación, matemáticas y tareas científicas. Incluye la capacidad de 'pensar' incorporada, lo que le permite proporcionar respuestas con mayor precisión y un manejo más detallado del contexto.\n\nNota: Este modelo tiene dos variantes: con pensamiento y sin pensamiento. La fijación de precios de salida varía significativamente según si la capacidad de pensamiento está activada. Si elige la variante estándar (sin el sufijo ':thinking'), el modelo evitará explícitamente generar tokens de pensamiento.\n\nPara aprovechar la capacidad de pensamiento y recibir tokens de pensamiento, debe elegir la variante ':thinking', lo que resultará en un precio de salida de pensamiento más alto.\n\nAdemás, Gemini 2.5 Flash se puede configurar a través del parámetro 'número máximo de tokens de razonamiento', como se describe en la documentación (https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning)."
},
"google/gemini-2.5-pro": {
"description": "Gemini 2.5 Pro es el modelo de pensamiento más avanzado de Google, capaz de razonar sobre problemas complejos en código, matemáticas y áreas STEM, así como de analizar grandes conjuntos de datos, bases de código y documentos utilizando contextos extensos."
"description": "Gemini 2.5 Pro es nuestro modelo Gemini de inferencia más avanzado, capaz de resolver problemas complejos. Cuenta con una ventana de contexto de 2 millones de tokens y soporta entradas multimodales, incluyendo texto, imágenes, audio, video y documentos PDF."
},
"google/gemini-2.5-pro-preview": {
"description": "Gemini 2.5 Pro Preview es el modelo de pensamiento más avanzado de Google, capaz de razonar sobre problemas complejos en código, matemáticas y áreas STEM, así como de analizar grandes conjuntos de datos, bases de código y documentos utilizando contextos extensos."
},
"google/gemini-embedding-001": {
"description": "Modelo de incrustaciones de última generación con rendimiento sobresaliente en tareas en inglés, multilingües y de código."
},
"google/gemini-flash-1.5": {
"description": "Gemini 1.5 Flash ofrece capacidades de procesamiento multimodal optimizadas, adecuadas para una variedad de escenarios de tareas complejas."
},
@@ -1442,12 +1538,21 @@
"google/gemma-2b-it": {
"description": "Gemma Instruct (2B) ofrece capacidades básicas de procesamiento de instrucciones, adecuado para aplicaciones ligeras."
},
"google/gemma-3-12b-it": {
"description": "Gemma 3 12B es un modelo de lenguaje de código abierto de Google que establece nuevos estándares en eficiencia y rendimiento."
},
"google/gemma-3-1b-it": {
"description": "Gemma 3 1B es un modelo de lenguaje de código abierto de Google que establece nuevos estándares en eficiencia y rendimiento."
},
"google/gemma-3-27b-it": {
"description": "Gemma 3 27B es un modelo de lenguaje de código abierto de Google, que establece nuevos estándares en eficiencia y rendimiento."
},
"google/text-embedding-005": {
"description": "Modelo de incrustaciones de texto enfocado en inglés, optimizado para tareas de código y lenguaje inglés."
},
"google/text-multilingual-embedding-002": {
"description": "Modelo de incrustaciones de texto multilingüe optimizado para tareas translingüísticas, compatible con múltiples idiomas."
},
"gpt-3.5-turbo": {
"description": "GPT 3.5 Turbo, adecuado para diversas tareas de generación y comprensión de texto, actualmente apunta a gpt-3.5-turbo-0125."
},
@@ -1505,7 +1610,9 @@
"gpt-4.1-nano": {
"description": "GPT-4.1 mini ofrece un equilibrio entre inteligencia, velocidad y costo, lo que lo convierte en un modelo atractivo para muchos casos de uso."
},
"gpt-4.5-preview": "GPT-4.5-preview es el modelo de propósito general más reciente, con un profundo conocimiento del mundo y una mejor comprensión de las intenciones de los usuarios; destaca en tareas creativas y en la planificación de agentes. El conocimiento de este modelo está actualizado hasta octubre de 2023.",
"gpt-4.5-preview": {
"description": "GPT-4.5-preview es el modelo de propósito general más reciente, con un profundo conocimiento del mundo y una mejor comprensión de las intenciones de los usuarios; destaca en tareas creativas y en la planificación de agentes. El conocimiento de este modelo está actualizado hasta octubre de 2023."
},
"gpt-4o": {
"description": "ChatGPT-4o es un modelo dinámico que se actualiza en tiempo real para mantener la versión más actual. Combina una poderosa comprensión y generación de lenguaje, adecuado para aplicaciones a gran escala, incluyendo servicio al cliente, educación y soporte técnico."
},
@@ -1602,9 +1709,18 @@
"grok-4": {
"description": "Nuestro modelo insignia más reciente y potente, que destaca en procesamiento de lenguaje natural, cálculo matemático y razonamiento — un competidor versátil y perfecto."
},
"grok-4-0709": {
"description": "Grok 4 de xAI, con potentes capacidades de razonamiento."
},
"grok-code-fast-1": {
"description": "Nos complace presentar grok-code-fast-1, un modelo de inferencia rápido y económico que destaca en la codificación de agentes."
},
"groq/compound": {
"description": "Compound es un sistema de IA compuesto, respaldado por múltiples modelos disponibles públicamente ya soportados en GroqCloud, que puede usar herramientas de manera inteligente y selectiva para responder consultas de usuarios."
},
"groq/compound-mini": {
"description": "Compound-mini es un sistema de IA compuesto, respaldado por modelos disponibles públicamente ya soportados en GroqCloud, que puede usar herramientas de manera inteligente y selectiva para responder consultas de usuarios."
},
"gryphe/mythomax-l2-13b": {
"description": "MythoMax l2 13B es un modelo de lenguaje que combina creatividad e inteligencia, fusionando múltiples modelos de vanguardia."
},
@@ -1660,7 +1776,7 @@
"description": "Mejora significativa en habilidades avanzadas de matemáticas, lógica y codificación, optimización de la estabilidad de salida del modelo y aumento de la capacidad para textos largos."
},
"hunyuan-t1-latest": {
"description": "El primer modelo de inferencia híbrido de gran escala Hybrid-Transformer-Mamba de la industria, que amplía la capacidad de inferencia, ofrece una velocidad de decodificación excepcional y alinea aún más con las preferencias humanas."
"description": "Mejora significativamente las capacidades del modelo principal de pensamiento lento en matemáticas avanzadas, razonamiento complejo, código difícil, cumplimiento de instrucciones y calidad en la creación de textos."
},
"hunyuan-t1-vision": {
"description": "Modelo de pensamiento profundo multimodal Hunyuan, que soporta cadenas de pensamiento nativas multimodales, sobresale en diversos escenarios de razonamiento con imágenes y mejora significativamente en problemas científicos en comparación con modelos de pensamiento rápido."
@@ -1728,8 +1844,11 @@
"imagen-4.0-ultra-generate-preview-06-06": {
"description": "Serie de modelos de texto a imagen de cuarta generación de Imagen, versión Ultra"
},
"imagen4/preview": {
"description": "Modelo generador de imágenes de alta calidad proporcionado por Google."
"inception/mercury-coder-small": {
"description": "Mercury Coder Small es la opción ideal para tareas de generación, depuración y refactorización de código, con latencia mínima."
},
"inclusionAI/Ling-mini-2.0": {
"description": "Ling-mini-2.0 es un modelo de lenguaje grande de alto rendimiento y tamaño pequeño basado en la arquitectura MoE. Cuenta con 16 mil millones de parámetros totales, pero solo activa 1.4 mil millones por token (no embedding 789 millones), lo que permite una velocidad de generación extremadamente alta. Gracias al diseño eficiente de MoE y a un entrenamiento a gran escala con datos de alta calidad, a pesar de tener solo 1.4 mil millones de parámetros activados, Ling-mini-2.0 demuestra un rendimiento de primer nivel en tareas downstream, comparable a modelos densos de menos de 10 mil millones de parámetros y a modelos MoE de mayor escala."
},
"internlm/internlm2_5-7b-chat": {
"description": "InternLM2.5 ofrece soluciones de diálogo inteligente en múltiples escenarios."
@@ -1764,6 +1883,9 @@
"kimi-k2-0711-preview": {
"description": "kimi-k2 es un modelo base con arquitectura MoE que posee capacidades excepcionales en código y agentes, con un total de 1T parámetros y 32B parámetros activados. En pruebas de rendimiento en categorías principales como razonamiento general, programación, matemáticas y agentes, el modelo K2 supera a otros modelos de código abierto populares."
},
"kimi-k2-0905-preview": {
"description": "El modelo kimi-k2-0905-preview tiene una longitud de contexto de 256k, con una mayor capacidad de codificación agentiva, una estética y funcionalidad mejoradas en el código frontend, y una mejor comprensión del contexto."
},
"kimi-k2-turbo-preview": {
"description": "kimi-k2 es un modelo base con arquitectura MoE que ofrece potentes capacidades para código y agentes, con 1T parámetros totales y 32B parámetros activados. En las pruebas de referencia en categorías principales como razonamiento de conocimiento general, programación, matemáticas y agentes, el rendimiento del modelo K2 supera al de otros modelos de código abierto más extendidos."
},
@@ -2001,30 +2123,63 @@
"meta/Meta-Llama-3.1-8B-Instruct": {
"description": "Modelo de texto ajustado por instrucciones Llama 3.1, optimizado para casos de uso de diálogo multilingüe, con un rendimiento destacado en muchos modelos de chat abiertos y cerrados disponibles y en puntos de referencia industriales comunes."
},
"meta/llama-3-70b": {
"description": "Modelo de código abierto de 70 mil millones de parámetros ajustado cuidadosamente por Meta para cumplimiento de instrucciones. Operado por Groq con su hardware personalizado de unidad de procesamiento de lenguaje (LPU) para ofrecer inferencia rápida y eficiente."
},
"meta/llama-3-8b": {
"description": "Modelo de código abierto de 8 mil millones de parámetros ajustado cuidadosamente por Meta para cumplimiento de instrucciones. Operado por Groq con su hardware personalizado de unidad de procesamiento de lenguaje (LPU) para ofrecer inferencia rápida y eficiente."
},
"meta/llama-3.1-405b-instruct": {
"description": "LLM avanzado, que soporta generación de datos sintéticos, destilación de conocimiento y razonamiento, adecuado para chatbots, programación y tareas de dominio específico."
},
"meta/llama-3.1-70b": {
"description": "Versión actualizada de Meta Llama 3 70B Instruct, que incluye una longitud de contexto extendida de 128K, soporte multilingüe y capacidades de razonamiento mejoradas."
},
"meta/llama-3.1-70b-instruct": {
"description": "Potencia diálogos complejos, con excelente comprensión del contexto, capacidad de razonamiento y generación de texto."
},
"meta/llama-3.1-8b": {
"description": "Llama 3.1 8B soporta una ventana de contexto de 128K, lo que lo hace ideal para interfaces de conversación en tiempo real y análisis de datos, ofreciendo un ahorro de costos significativo en comparación con modelos más grandes. Operado por Groq con su hardware personalizado de unidad de procesamiento de lenguaje (LPU) para ofrecer inferencia rápida y eficiente."
},
"meta/llama-3.1-8b-instruct": {
"description": "Modelo de última generación avanzado, con comprensión del lenguaje, excelente capacidad de razonamiento y generación de texto."
},
"meta/llama-3.2-11b": {
"description": "Modelo de generación de razonamiento visual ajustado por instrucciones (entrada de texto + imagen / salida de texto), optimizado para reconocimiento visual, razonamiento de imágenes, generación de títulos y respuestas a preguntas generales sobre imágenes."
},
"meta/llama-3.2-11b-vision-instruct": {
"description": "Modelo de visión-lenguaje de vanguardia, experto en razonamiento de alta calidad a partir de imágenes."
},
"meta/llama-3.2-1b": {
"description": "Modelo solo de texto, compatible con casos de uso en dispositivos, como recuperación de conocimiento local multilingüe, resumen y reescritura."
},
"meta/llama-3.2-1b-instruct": {
"description": "Modelo de lenguaje pequeño de última generación, con comprensión del lenguaje, excelente capacidad de razonamiento y generación de texto."
},
"meta/llama-3.2-3b": {
"description": "Modelo solo de texto, ajustado cuidadosamente para soportar casos de uso en dispositivos, como recuperación de conocimiento local multilingüe, resumen y reescritura."
},
"meta/llama-3.2-3b-instruct": {
"description": "Modelo de lenguaje pequeño de última generación, con comprensión del lenguaje, excelente capacidad de razonamiento y generación de texto."
},
"meta/llama-3.2-90b": {
"description": "Modelo de generación de razonamiento visual ajustado por instrucciones (entrada de texto + imagen / salida de texto), optimizado para reconocimiento visual, razonamiento de imágenes, generación de títulos y respuestas a preguntas generales sobre imágenes."
},
"meta/llama-3.2-90b-vision-instruct": {
"description": "Modelo de visión-lenguaje de vanguardia, experto en razonamiento de alta calidad a partir de imágenes."
},
"meta/llama-3.3-70b": {
"description": "Combinación perfecta de rendimiento y eficiencia. Este modelo soporta IA conversacional de alto rendimiento, diseñado para creación de contenido, aplicaciones empresariales e investigación, ofreciendo capacidades avanzadas de comprensión del lenguaje, incluyendo resumen de texto, clasificación, análisis de sentimientos y generación de código."
},
"meta/llama-3.3-70b-instruct": {
"description": "Modelo LLM avanzado, experto en razonamiento, matemáticas, sentido común y llamadas a funciones."
},
"meta/llama-4-maverick": {
"description": "La colección de modelos Llama 4 es una IA multimodal nativa que soporta experiencias de texto y multimodales. Estos modelos utilizan una arquitectura de expertos mixtos para ofrecer un rendimiento líder en la industria en comprensión de texto e imágenes. Llama 4 Maverick, un modelo de 17 mil millones de parámetros con 128 expertos. Proporcionado por DeepInfra."
},
"meta/llama-4-scout": {
"description": "La colección de modelos Llama 4 es una IA multimodal nativa que soporta experiencias de texto y multimodales. Estos modelos utilizan una arquitectura de expertos mixtos para ofrecer un rendimiento líder en la industria en comprensión de texto e imágenes. Llama 4 Scout, un modelo de 17 mil millones de parámetros con 16 expertos. Proporcionado por DeepInfra."
},
"microsoft/Phi-3-medium-128k-instruct": {
"description": "El mismo modelo Phi-3-medium, pero con un tamaño de contexto mayor, adecuado para RAG o indicaciones breves."
},
@@ -2100,6 +2255,48 @@
"mistral-small-latest": {
"description": "Mistral Small es una opción rentable, rápida y confiable, adecuada para casos de uso como traducción, resumen y análisis de sentimientos."
},
"mistral/codestral": {
"description": "Mistral Codestral 25.01 es un modelo de codificación de última generación optimizado para casos de uso de baja latencia y alta frecuencia. Domina más de 80 lenguajes de programación y sobresale en tareas como relleno intermedio (FIM), corrección de código y generación de pruebas."
},
"mistral/codestral-embed": {
"description": "Modelo de incrustación de código que puede integrarse en bases de datos y repositorios de código para apoyar asistentes de codificación."
},
"mistral/devstral-small": {
"description": "Devstral es un modelo de lenguaje grande agente para tareas de ingeniería de software, ideal para agentes de ingeniería de software."
},
"mistral/magistral-medium": {
"description": "Pensamiento complejo respaldado por comprensión profunda, con razonamiento transparente que puede seguir y verificar. Este modelo mantiene un razonamiento de alta fidelidad en múltiples idiomas, incluso cuando cambia de idioma a mitad de tarea."
},
"mistral/magistral-small": {
"description": "Pensamiento complejo respaldado por comprensión profunda, con razonamiento transparente que puede seguir y verificar. Este modelo mantiene un razonamiento de alta fidelidad en múltiples idiomas, incluso cuando cambia de idioma a mitad de tarea."
},
"mistral/ministral-3b": {
"description": "Un modelo compacto y eficiente para tareas en dispositivos como asistentes inteligentes y análisis local, que ofrece un rendimiento de baja latencia."
},
"mistral/ministral-8b": {
"description": "Un modelo más potente con inferencia más rápida y eficiente en memoria, ideal para flujos de trabajo complejos y aplicaciones exigentes en el borde."
},
"mistral/mistral-embed": {
"description": "Modelo de incrustación de texto universal para búsqueda semántica, similitud, agrupamiento y flujos de trabajo RAG."
},
"mistral/mistral-large": {
"description": "Mistral Large es ideal para tareas complejas que requieren capacidades de inferencia grandes o altamente especializadas, como generación de texto sintético, generación de código, RAG o agentes."
},
"mistral/mistral-saba-24b": {
"description": "Mistral Saba 24B es un modelo de código abierto de 24 mil millones de parámetros desarrollado por Mistral.ai. Saba es un modelo especializado entrenado para un rendimiento sobresaliente en árabe, persa, urdu, hebreo y lenguas indias. Operado por Groq con su hardware personalizado de unidad de procesamiento de lenguaje (LPU) para ofrecer inferencia rápida y eficiente."
},
"mistral/mistral-small": {
"description": "Mistral Small es ideal para tareas simples que pueden procesarse en lotes, como clasificación, soporte al cliente o generación de texto. Ofrece un rendimiento excelente a un precio asequible."
},
"mistral/mixtral-8x22b-instruct": {
"description": "Modelo 8x22b Instruct. 8x22b es un modelo de expertos mixtos de código abierto operado por Mistral."
},
"mistral/pixtral-12b": {
"description": "Un modelo de 12B con capacidades de comprensión de imágenes además de texto."
},
"mistral/pixtral-large": {
"description": "Pixtral Large es el segundo modelo de nuestra familia multimodal, demostrando un nivel avanzado de comprensión de imágenes. En particular, el modelo puede entender documentos, gráficos y imágenes naturales, manteniendo la capacidad líder en comprensión de texto de Mistral Large 2."
},
"mistralai/Mistral-7B-Instruct-v0.1": {
"description": "Mistral (7B) Instruct es conocido por su alto rendimiento, adecuado para diversas tareas de lenguaje."
},
@@ -2163,8 +2360,23 @@
"moonshotai/Kimi-K2-Instruct": {
"description": "Kimi K2 es un modelo base con arquitectura MoE que posee capacidades avanzadas de codificación y agentes, con un total de 1 billón de parámetros y 32 mil millones de parámetros activados. En pruebas de referencia en categorías principales como razonamiento general, programación, matemáticas y agentes, el rendimiento del modelo K2 supera a otros modelos de código abierto populares."
},
"moonshotai/kimi-k2-instruct": {
"description": "kimi-k2 es un modelo base con arquitectura MoE que cuenta con capacidades avanzadas de código y agentes, con un total de 1T parámetros y 32B parámetros activados. En pruebas de referencia en categorías principales como razonamiento de conocimiento general, programación, matemáticas y agentes, el modelo K2 supera el rendimiento de otros modelos de código abierto populares."
"moonshotai/Kimi-K2-Instruct-0905": {
"description": "Kimi K2-Instruct-0905 es la versión más reciente y potente de Kimi K2. Es un modelo de lenguaje de expertos mixtos (MoE) de primer nivel, con un total de un billón de parámetros y 32 mil millones de parámetros activados. Las principales características de este modelo incluyen: inteligencia mejorada para agentes de codificación, mostrando un rendimiento notable en pruebas de referencia públicas y en tareas reales de agentes de codificación; y una experiencia mejorada en la codificación frontend, con avances tanto en la estética como en la funcionalidad de la programación frontend."
},
"moonshotai/kimi-k2": {
"description": "Kimi K2 es un modelo de lenguaje de expertos mixtos (MoE) a gran escala desarrollado por Moonshot AI, con un total de un billón de parámetros y 32 mil millones de parámetros activos por pasada. Está optimizado para capacidades de agente, incluyendo uso avanzado de herramientas, razonamiento y síntesis de código."
},
"moonshotai/kimi-k2-0905": {
"description": "El modelo kimi-k2-0905-preview tiene una longitud de contexto de 256k, con una mayor capacidad de codificación agentiva, una estética y funcionalidad mejoradas en el código frontend, y una mejor comprensión del contexto."
},
"moonshotai/kimi-k2-instruct-0905": {
"description": "El modelo kimi-k2-0905-preview tiene una longitud de contexto de 256k, con una mayor capacidad de codificación agentiva, una estética y funcionalidad mejoradas en el código frontend, y una mejor comprensión del contexto."
},
"morph/morph-v3-fast": {
"description": "Morph ofrece un modelo de IA especializado que aplica rápidamente los cambios de código sugeridos por modelos de vanguardia como Claude o GPT-4o a sus archivos de código existentes, con una velocidad de más de 4500 tokens por segundo. Actúa como el último paso en el flujo de trabajo de codificación de IA. Soporta 16k tokens de entrada y 16k tokens de salida."
},
"morph/morph-v3-large": {
"description": "Morph ofrece un modelo de IA especializado que aplica cambios de código sugeridos por modelos de vanguardia como Claude o GPT-4o a sus archivos de código existentes, con una velocidad de más de 2500 tokens por segundo. Actúa como el último paso en el flujo de trabajo de codificación de IA. Soporta 16k tokens de entrada y 16k tokens de salida."
},
"nousresearch/hermes-2-pro-llama-3-8b": {
"description": "Hermes 2 Pro Llama 3 8B es una versión mejorada de Nous Hermes 2, que incluye los conjuntos de datos más recientes desarrollados internamente."
@@ -2193,6 +2405,9 @@
"o3": {
"description": "o3 es un modelo versátil y potente, que destaca en múltiples campos. Establece un nuevo estándar para tareas de matemáticas, ciencia, programación y razonamiento visual. También es hábil en redacción técnica y seguimiento de instrucciones. Los usuarios pueden utilizarlo para analizar texto, código e imágenes, resolviendo problemas complejos de múltiples pasos."
},
"o3-2025-04-16": {
"description": "o3 es el nuevo modelo de razonamiento de OpenAI, soporta entrada de texto e imagen y salida de texto, adecuado para tareas complejas que requieren conocimiento general amplio."
},
"o3-deep-research": {
"description": "o3-deep-research es nuestro modelo de investigación profunda más avanzado, diseñado específicamente para manejar tareas complejas de investigación en múltiples pasos. Puede buscar y sintetizar información de Internet, así como acceder y utilizar tus propios datos a través del conector MCP."
},
@@ -2202,9 +2417,15 @@
"o3-pro": {
"description": "El modelo o3-pro utiliza más capacidad computacional para pensar más profundamente y siempre ofrecer mejores respuestas, y solo está disponible para uso bajo la API de Responses."
},
"o3-pro-2025-06-10": {
"description": "o3 Pro es el nuevo modelo de razonamiento de OpenAI, soporta entrada de texto e imagen y salida de texto, adecuado para tareas complejas que requieren conocimiento general amplio."
},
"o4-mini": {
"description": "o4-mini es nuestro último modelo de la serie o en formato pequeño. Está optimizado para una inferencia rápida y efectiva, mostrando una alta eficiencia y rendimiento en tareas de codificación y visuales."
},
"o4-mini-2025-04-16": {
"description": "o4-mini es un modelo de razonamiento de OpenAI, soporta entrada de texto e imagen y salida de texto, adecuado para tareas complejas que requieren conocimiento general amplio. Este modelo tiene un contexto de 200K."
},
"o4-mini-deep-research": {
"description": "o4-mini-deep-research es nuestro modelo de investigación profunda más rápido y asequible, ideal para manejar tareas complejas de investigación en múltiples pasos. Puede buscar y sintetizar información de Internet, así como acceder y utilizar tus propios datos a través del conector MCP."
},
@@ -2223,29 +2444,47 @@
"open-mixtral-8x7b": {
"description": "Mixtral 8x7B es un modelo de expertos dispersos que utiliza múltiples parámetros para mejorar la velocidad de razonamiento, adecuado para el procesamiento de tareas de múltiples idiomas y generación de código."
},
"openai/gpt-3.5-turbo": {
"description": "El modelo más competente y rentable de la serie GPT-3.5 de OpenAI, optimizado para propósitos de chat, pero que también funciona bien en tareas tradicionales de completado."
},
"openai/gpt-3.5-turbo-instruct": {
"description": "Capacidades similares a los modelos de la era GPT-3. Compatible con puntos finales de completado tradicionales en lugar de puntos finales de completado de chat."
},
"openai/gpt-4-turbo": {
"description": "gpt-4-turbo de OpenAI posee un amplio conocimiento general y experiencia en dominios, permitiéndole seguir instrucciones complejas en lenguaje natural y resolver problemas difíciles con precisión. Su fecha de corte de conocimiento es abril de 2023 y tiene una ventana de contexto de 128,000 tokens."
},
"openai/gpt-4.1": {
"description": "GPT-4.1 es nuestro modelo insignia para tareas complejas. Es especialmente adecuado para resolver problemas interdisciplinarios."
"description": "GPT 4.1 es el modelo insignia de OpenAI, adecuado para tareas complejas. Es excelente para resolver problemas interdisciplinarios."
},
"openai/gpt-4.1-mini": {
"description": "GPT-4.1 mini ofrece un equilibrio entre inteligencia, velocidad y costo, lo que lo convierte en un modelo atractivo para muchos casos de uso."
"description": "GPT 4.1 mini equilibra inteligencia, velocidad y costo, convirtiéndolo en un modelo atractivo para muchos casos de uso."
},
"openai/gpt-4.1-nano": {
"description": "GPT-4.1 nano es el modelo GPT-4.1 más rápido y rentable."
"description": "GPT-4.1 nano es el modelo GPT 4.1 más rápido y rentable."
},
"openai/gpt-4o": {
"description": "ChatGPT-4o es un modelo dinámico que se actualiza en tiempo real para mantener la versión más actual. Combina una poderosa comprensión y generación de lenguaje, adecuado para escenarios de aplicación a gran escala, incluyendo servicio al cliente, educación y soporte técnico."
"description": "GPT-4o de OpenAI tiene un amplio conocimiento general y experiencia en dominios, capaz de seguir instrucciones complejas en lenguaje natural y resolver problemas difíciles con precisión. Ofrece un rendimiento equivalente a GPT-4 Turbo con una API más rápida y económica."
},
"openai/gpt-4o-mini": {
"description": "GPT-4o mini es el modelo más reciente de OpenAI, lanzado después de GPT-4 Omni, que admite entradas de texto e imagen y genera texto como salida. Como su modelo más avanzado de tamaño pequeño, es mucho más económico que otros modelos de vanguardia recientes y más de un 60% más barato que GPT-3.5 Turbo. Mantiene una inteligencia de vanguardia mientras ofrece una relación calidad-precio notable. GPT-4o mini obtuvo un puntaje del 82% en la prueba MMLU y actualmente se clasifica por encima de GPT-4 en preferencias de chat."
"description": "GPT-4o mini de OpenAI es su modelo pequeño más avanzado y rentable. Es multimodal (acepta entradas de texto o imagen y produce texto) y es más inteligente que gpt-3.5-turbo, manteniendo la misma velocidad."
},
"openai/gpt-5": {
"description": "GPT-5 es el modelo de lenguaje insignia de OpenAI, sobresaliendo en razonamiento complejo, amplio conocimiento del mundo real, tareas intensivas en código y tareas de agente de múltiples pasos."
},
"openai/gpt-5-mini": {
"description": "GPT-5 mini es un modelo optimizado en costos que sobresale en tareas de razonamiento y chat. Ofrece el mejor equilibrio entre velocidad, costo y capacidad."
},
"openai/gpt-5-nano": {
"description": "GPT-5 nano es un modelo de alto rendimiento que sobresale en tareas simples de instrucciones o clasificación."
},
"openai/gpt-oss-120b": {
"description": "OpenAI GPT-OSS 120B es un modelo de lenguaje de vanguardia con 120 mil millones de parámetros, que incorpora funciones de búsqueda en navegador y ejecución de código, además de capacidades de razonamiento."
"description": "Modelo de lenguaje grande universal extremadamente competente con capacidades de razonamiento potentes y controlables."
},
"openai/gpt-oss-20b": {
"description": "OpenAI GPT-OSS 20B es un modelo de lenguaje de vanguardia con 20 mil millones de parámetros, que incorpora funciones de búsqueda en navegador y ejecución de código, además de capacidades de razonamiento."
"description": "Modelo de lenguaje compacto con pesos de código abierto, optimizado para baja latencia y entornos con recursos limitados, incluyendo despliegues locales y en el borde."
},
"openai/o1": {
"description": "o1 es el nuevo modelo de razonamiento de OpenAI, que admite entradas de texto e imagen y produce texto, adecuado para tareas complejas que requieren un conocimiento general amplio. Este modelo cuenta con un contexto de 200K y una fecha de corte de conocimiento en octubre de 2023."
"description": "o1 de OpenAI es un modelo de inferencia insignia diseñado para problemas complejos que requieren pensamiento profundo. Proporciona capacidades de razonamiento potentes y mayor precisión para tareas complejas de múltiples pasos."
},
"openai/o1-mini": {
"description": "o1-mini es un modelo de inferencia rápido y rentable diseñado para aplicaciones de programación, matemáticas y ciencias. Este modelo tiene un contexto de 128K y una fecha de corte de conocimiento en octubre de 2023."
@@ -2254,23 +2493,44 @@
"description": "o1 es el nuevo modelo de inferencia de OpenAI, adecuado para tareas complejas que requieren un amplio conocimiento general. Este modelo tiene un contexto de 128K y una fecha de corte de conocimiento en octubre de 2023."
},
"openai/o3": {
"description": "o3 es un modelo versátil y potente que destaca en múltiples campos. Establece un nuevo estándar para tareas de matemáticas, ciencias, programación y razonamiento visual. También es hábil en redacción técnica y seguimiento de instrucciones. Los usuarios pueden utilizarlo para analizar texto, código e imágenes, resolviendo problemas complejos de múltiples pasos."
"description": "o3 de OpenAI es el modelo de inferencia más potente, estableciendo nuevos estándares en codificación, matemáticas, ciencias y percepción visual. Sobresale en consultas complejas que requieren análisis multifacético, con ventajas especiales en análisis de imágenes, gráficos y diagramas."
},
"openai/o3-mini": {
"description": "o3-mini ofrece alta inteligencia con los mismos objetivos de costo y latencia que o1-mini."
"description": "o3-mini es el modelo de inferencia pequeño más reciente de OpenAI, que ofrece alta inteligencia con los mismos objetivos de costo y latencia que o1-mini."
},
"openai/o3-mini-high": {
"description": "o3-mini de alto nivel de razonamiento proporciona alta inteligencia con los mismos objetivos de costo y latencia que o1-mini."
},
"openai/o4-mini": {
"description": "o4-mini está optimizado para una inferencia rápida y efectiva, mostrando una alta eficiencia y rendimiento en tareas de codificación y visuales."
"description": "o4-mini de OpenAI ofrece inferencia rápida y rentable, con un rendimiento sobresaliente para su tamaño, especialmente en matemáticas (destacando en la prueba de referencia AIME), codificación y tareas visuales."
},
"openai/o4-mini-high": {
"description": "Versión de alto nivel de inferencia de o4-mini, optimizada para una inferencia rápida y efectiva, mostrando una alta eficiencia y rendimiento en tareas de codificación y visuales."
},
"openai/text-embedding-3-large": {
"description": "El modelo de incrustaciones más competente de OpenAI, adecuado para tareas en inglés y otros idiomas."
},
"openai/text-embedding-3-small": {
"description": "Versión mejorada y de mayor rendimiento del modelo de incrustaciones ada de OpenAI."
},
"openai/text-embedding-ada-002": {
"description": "Modelo tradicional de incrustaciones de texto de OpenAI."
},
"openrouter/auto": {
"description": "Según la longitud del contexto, el tema y la complejidad, tu solicitud se enviará a Llama 3 70B Instruct, Claude 3.5 Sonnet (autoajuste) o GPT-4o."
},
"perplexity/sonar": {
"description": "Producto ligero de Perplexity con capacidad de búsqueda fundamentada, más rápido y económico que Sonar Pro."
},
"perplexity/sonar-pro": {
"description": "Producto insignia de Perplexity con capacidad de búsqueda fundamentada, que soporta consultas avanzadas y operaciones de seguimiento."
},
"perplexity/sonar-reasoning": {
"description": "Modelo enfocado en razonamiento que produce cadenas de pensamiento (CoT) en las respuestas, ofreciendo explicaciones detalladas con búsqueda fundamentada."
},
"perplexity/sonar-reasoning-pro": {
"description": "Modelo avanzado enfocado en razonamiento que produce cadenas de pensamiento (CoT) en las respuestas, ofreciendo explicaciones integrales con capacidades de búsqueda mejoradas y múltiples consultas de búsqueda por solicitud."
},
"phi3": {
"description": "Phi-3 es un modelo abierto ligero lanzado por Microsoft, adecuado para una integración eficiente y razonamiento de conocimiento a gran escala."
},
@@ -2311,7 +2571,7 @@
"description": "Qwen-Image es un modelo de generación de imágenes de uso general que admite diversos estilos artísticos y destaca por su capacidad para renderizar textos complejos, especialmente textos en chino e inglés. El modelo soporta maquetación en varias líneas, generación de texto a nivel de párrafo y representación de detalles finos, lo que permite crear diseños complejos que combinan texto e imagen."
},
"qwen-image-edit": {
"description": "Modelo profesional de edición de imágenes lanzado por el equipo Qwen. Admite edición semántica y de apariencia, puede editar con precisión texto en chino e inglés y realizar ediciones de alta calidad, como transferencia de estilo y rotación de objetos."
"description": "Qwen Image Edit es un modelo de generación de imágenes que permite la edición y modificación de imágenes basándose en una imagen de entrada y un texto indicativo, capaz de realizar ajustes precisos y transformaciones creativas en la imagen original según las necesidades del usuario."
},
"qwen-long": {
"description": "Qwen es un modelo de lenguaje a gran escala que admite contextos de texto largos y funciones de conversación basadas en documentos largos y múltiples."
@@ -2547,6 +2807,15 @@
"qwen3-coder-plus": {
"description": "Modelo de código Tongyi Qianwen. La última serie de modelos Qwen3-Coder está basada en Qwen3 para generación de código, con una potente capacidad de agente de codificación, experta en llamadas a herramientas e interacción con el entorno, capaz de programación autónoma, combinando una excelente habilidad en código con capacidades generales."
},
"qwen3-max-preview": {
"description": "Versión preliminar del modelo Max de la serie Qwen 3, que presenta una mejora significativa en la capacidad general en comparación con la serie 2.5, incluyendo comprensión de texto en chino e inglés, cumplimiento de instrucciones complejas, tareas abiertas subjetivas, capacidades multilingües y llamadas a herramientas; además, reduce notablemente las alucinaciones de conocimiento del modelo."
},
"qwen3-next-80b-a3b-instruct": {
"description": "Modelo de código abierto de nueva generación basado en Qwen3 en modo no reflexivo, que ofrece una mejor comprensión del texto en chino, mayor capacidad de razonamiento lógico y un mejor desempeño en tareas de generación de texto en comparación con la versión anterior (Tongyi Qianwen 3-235B-A22B-Instruct-2507)."
},
"qwen3-next-80b-a3b-thinking": {
"description": "Modelo de código abierto de nueva generación basado en Qwen3 en modo reflexivo, que mejora la capacidad de seguir instrucciones y ofrece respuestas más concisas en comparación con la versión anterior (Tongyi Qianwen 3-235B-A22B-Thinking-2507)."
},
"qwq": {
"description": "QwQ es un modelo de investigación experimental que se centra en mejorar la capacidad de razonamiento de la IA."
},
@@ -2727,6 +2996,12 @@
"v0-1.5-md": {
"description": "El modelo v0-1.5-md es adecuado para tareas cotidianas y generación de interfaces de usuario (UI)"
},
"vercel/v0-1.0-md": {
"description": "Acceso al modelo detrás de v0 para generar, reparar y optimizar aplicaciones web modernas, con razonamiento específico para frameworks y conocimiento actualizado."
},
"vercel/v0-1.5-md": {
"description": "Acceso al modelo detrás de v0 para generar, reparar y optimizar aplicaciones web modernas, con razonamiento específico para frameworks y conocimiento actualizado."
},
"wan2.2-t2i-flash": {
"description": "Versión ultra rápida Wanxiang 2.2, el modelo más reciente. Mejora integral en creatividad, estabilidad y realismo, con velocidad de generación rápida y alta relación calidad-precio."
},
@@ -2757,6 +3032,27 @@
"x1": {
"description": "El modelo Spark X1 se actualizará aún más, logrando resultados en tareas generales como razonamiento, generación de texto y comprensión del lenguaje que se comparan con OpenAI o1 y DeepSeek R1, además de liderar en tareas matemáticas en el país."
},
"xai/grok-2": {
"description": "Grok 2 es un modelo de lenguaje de vanguardia con capacidades de razonamiento avanzadas. Sobresale en chat, codificación y razonamiento, superando a Claude 3.5 Sonnet y GPT-4-Turbo en la clasificación LMSYS."
},
"xai/grok-2-vision": {
"description": "El modelo visual Grok 2 sobresale en tareas basadas en visión, ofreciendo un rendimiento de vanguardia en razonamiento matemático visual (MathVista) y preguntas y respuestas basadas en documentos (DocVQA). Puede procesar diversos tipos de información visual, incluyendo documentos, gráficos, diagramas, capturas de pantalla y fotografías."
},
"xai/grok-3": {
"description": "Modelo insignia de xAI que sobresale en casos de uso empresariales como extracción de datos, codificación y resumen de texto. Posee un profundo conocimiento en finanzas, salud, derecho y ciencias."
},
"xai/grok-3-fast": {
"description": "Modelo insignia de xAI que sobresale en casos de uso empresariales como extracción de datos, codificación y resumen de texto. La variante rápida del modelo opera en infraestructura más veloz, ofreciendo tiempos de respuesta mucho más rápidos que el estándar, a un costo mayor por token de salida."
},
"xai/grok-3-mini": {
"description": "Modelo ligero de xAI que piensa antes de responder. Ideal para tareas simples o basadas en lógica que no requieren profundo conocimiento especializado. La trayectoria de pensamiento original es accesible."
},
"xai/grok-3-mini-fast": {
"description": "Modelo ligero de xAI que piensa antes de responder. Ideal para tareas simples o basadas en lógica que no requieren profundo conocimiento especializado. La trayectoria de pensamiento original es accesible. La variante rápida del modelo opera en infraestructura más veloz, ofreciendo tiempos de respuesta mucho más rápidos que el estándar, a un costo mayor por token de salida."
},
"xai/grok-4": {
"description": "El modelo insignia más reciente y avanzado de xAI, que ofrece un rendimiento inigualable en lenguaje natural, matemáticas y razonamiento, siendo un competidor perfecto y versátil."
},
"yi-1.5-34b-chat": {
"description": "Yi-1.5 es una versión mejorada de Yi. Utiliza un corpus de alta calidad de 500B tokens para continuar el preentrenamiento de Yi y se微调 en 3M muestras de ajuste fino diversificadas."
},
@@ -2804,5 +3100,14 @@
},
"zai-org/GLM-4.5V": {
"description": "GLM-4.5V es la última generación de modelo de lenguaje visual (VLM) publicada por Zhipu AI. Este modelo se basa en el modelo de texto insignia GLM-4.5-Air, que cuenta con 106.000 millones de parámetros totales y 12.000 millones de parámetros de activación, y emplea una arquitectura de expertos mixtos (MoE) para lograr un rendimiento excelente con un coste de inferencia reducido. Técnicamente, GLM-4.5V continúa la línea de GLM-4.1V-Thinking e introduce innovaciones como el codificado rotacional de posiciones en 3D (3D-RoPE), que mejora de forma notable la percepción y el razonamiento sobre las relaciones en el espacio tridimensional. Gracias a optimizaciones en preentrenamiento, ajuste supervisado y aprendizaje por refuerzo, este modelo es capaz de procesar diversos tipos de contenido visual, como imágenes, vídeo y documentos largos, y ha alcanzado niveles punteros entre los modelos open source de su categoría en 41 benchmarks multimodales públicos. Además, el modelo incorpora un interruptor de 'modo de pensamiento' que permite a los usuarios alternar entre respuestas rápidas y razonamiento profundo para equilibrar eficiencia y rendimiento."
},
"zai/glm-4.5": {
"description": "La serie de modelos GLM-4.5 está diseñada específicamente como modelos base para agentes inteligentes. El modelo insignia GLM-4.5 integra 355 mil millones de parámetros totales (32 mil millones activos), unificando razonamiento, codificación y capacidades de agente para abordar demandas complejas de aplicaciones. Como sistema de razonamiento híbrido, ofrece modos de operación dual."
},
"zai/glm-4.5-air": {
"description": "GLM-4.5 y GLM-4.5-Air son nuestros modelos insignia más recientes, diseñados específicamente como modelos base para aplicaciones de agentes. Ambos utilizan una arquitectura de expertos mixtos (MoE). GLM-4.5 tiene un total de 355 mil millones de parámetros con 32 mil millones activos por pasada, mientras que GLM-4.5-Air presenta un diseño más simplificado con 106 mil millones de parámetros totales y 12 mil millones activos."
},
"zai/glm-4.5v": {
"description": "GLM-4.5V está construido sobre el modelo base GLM-4.5-Air, heredando la tecnología verificada de GLM-4.1V-Thinking y logrando una escalabilidad eficiente mediante una potente arquitectura MoE de 106 mil millones de parámetros."
}
}
+6
View File
@@ -38,6 +38,9 @@
"cohere": {
"description": "Cohere le ofrece los modelos multilingües más avanzados, potentes funciones de búsqueda y un espacio de trabajo de IA diseñado a medida para empresas modernas, todo integrado en una plataforma segura."
},
"cometapi": {
"description": "CometAPI es una plataforma de servicios que ofrece múltiples interfaces de modelos avanzados, compatible con OpenAI, Anthropic, Google y más, ideal para diversas necesidades de desarrollo y aplicación. Los usuarios pueden elegir de manera flexible el modelo y precio óptimos según sus necesidades, facilitando una mejor experiencia con IA."
},
"deepseek": {
"description": "DeepSeek es una empresa centrada en la investigación y aplicación de tecnologías de inteligencia artificial, cuyo modelo más reciente, DeepSeek-V2.5, combina capacidades de diálogo general y procesamiento de código, logrando mejoras significativas en alineación con preferencias humanas, tareas de escritura y seguimiento de instrucciones."
},
@@ -158,6 +161,9 @@
"v0": {
"description": "v0 es un asistente de programación en pareja; solo necesitas describir tus ideas en lenguaje natural y él generará código e interfaces de usuario (UI) para tu proyecto."
},
"vercelaigateway": {
"description": "Vercel AI Gateway ofrece una API unificada para acceder a más de 100 modelos, permitiendo el uso de modelos de varios proveedores como OpenAI, Anthropic y Google a través de un único punto de acceso. Soporta configuración de presupuesto, monitoreo de uso, balanceo de carga de solicitudes y conmutación por error."
},
"vertexai": {
"description": "La serie Gemini de Google es su modelo de IA más avanzado y versátil, desarrollado por Google DeepMind, diseñado específicamente para ser multimodal, soportando la comprensión y procesamiento sin interrupciones de texto, código, imágenes, audio y video. Es adecuado para una variedad de entornos, desde centros de datos hasta dispositivos móviles, mejorando enormemente la eficiencia y la aplicabilidad de los modelos de IA."
},
+10 -3
View File
@@ -70,12 +70,15 @@
"input": {
"addAi": "افزودن یک پیام AI",
"addUser": "افزودن یک پیام کاربر",
"disclaimer": "هوش مصنوعی نیز ممکن است اشتباه کند، لطفاً اطلاعات مهم را بررسی کنید",
"errorMsg": "ارسال پیام ناموفق بود، لطفاً پس از بررسی شبکه دوباره تلاش کنید: {{errorMsg}}",
"more": "بیشتر",
"send": "ارسال",
"sendWithCmdEnter": "فشار دهید {{meta}} + Enter برای ارسال",
"sendWithEnter": "فشار دهید Enter برای ارسال",
"sendWithCmdEnter": "برای ارسال، کلید <key/> را فشار دهید",
"sendWithEnter": "برای ارسال، کلید <key/> را فشار دهید",
"stop": "توقف",
"warp": "خط جدید"
"warp": "خط جدید",
"warpWithKey": "با فشار دادن کلید <key/> خط جدید ایجاد کنید"
},
"intentUnderstanding": {
"title": "در حال درک و تحلیل نیت شما..."
@@ -232,6 +235,10 @@
"threadMessageCount": "{{messageCount}} پیام",
"title": "زیرموضوع"
},
"toggleWideScreen": {
"off": "حالت صفحه‌نمایش عریض را غیرفعال کنید",
"on": "حالت صفحه‌نمایش عریض را فعال کنید"
},
"tokenDetails": {
"chats": "پیام‌های گفتگو",
"historySummary": "خلاصه تاریخ",
+62
View File
@@ -0,0 +1,62 @@
{
"actions": {
"expand": {
"off": "جمع کردن",
"on": "باز کردن"
},
"typobar": {
"off": "مخفی کردن نوار ابزار قالب‌بندی",
"on": "نمایش نوار ابزار قالب‌بندی"
}
},
"cancel": "لغو",
"confirm": "تأیید",
"file": {
"error": "خطا: {{message}}",
"uploading": "در حال بارگذاری فایل..."
},
"image": {
"broken": "تصویر خراب است"
},
"link": {
"edit": "ویرایش پیوند",
"open": "باز کردن پیوند",
"placeholder": "آدرس URL پیوند را وارد کنید",
"unlink": "حذف پیوند"
},
"math": {
"placeholder": "لطفاً فرمول TeX را وارد کنید"
},
"slash": {
"h1": "عنوان سطح یک",
"h2": "عنوان سطح دو",
"h3": "عنوان سطح سه",
"hr": "خط جداکننده",
"table": "جدول",
"tex": "فرمول TeX"
},
"table": {
"delete": "حذف جدول",
"deleteColumn": "حذف ستون",
"deleteRow": "حذف ردیف",
"insertColumnLeft": "درج {{count}} ستون در سمت چپ",
"insertColumnRight": "درج {{count}} ستون در سمت راست",
"insertRowAbove": "درج {{count}} ردیف در بالا",
"insertRowBelow": "درج {{count}} ردیف در پایین"
},
"typobar": {
"blockquote": "نقل قول",
"bold": "پررنگ",
"bulletList": "فهرست نشانه‌دار",
"code": "کد درون‌خطی",
"codeblock": "بلوک کد",
"italic": "ایتالیک",
"link": "پیوند",
"numberList": "فهرست شماره‌دار",
"strikethrough": "خط خورده",
"table": "جدول",
"taskList": "فهرست وظایف",
"tex": "فرمول TeX",
"underline": "زیرخط"
}
}
+3
View File
@@ -5,6 +5,9 @@
"lock": "قفل نسبت ابعاد",
"unlock": "باز کردن قفل نسبت ابعاد"
},
"cfg": {
"label": "شدت راهنمایی"
},
"header": {
"desc": "توضیح ساده، خلق فوری",
"title": "نقاشی"
+355 -52
View File
@@ -53,6 +53,9 @@
"Baichuan4-Turbo": {
"description": "توانایی مدل در کشور اول است و در وظایف چینی مانند دانشنامه، متن‌های طولانی و تولید خلاقانه از مدل‌های اصلی خارجی پیشی می‌گیرد. همچنین دارای قابلیت‌های چندرسانه‌ای پیشرفته در صنعت است و در چندین معیار ارزیابی معتبر عملکرد عالی دارد."
},
"ByteDance-Seed/Seed-OSS-36B-Instruct": {
"description": "Seed-OSS مجموعه‌ای از مدل‌های زبان بزرگ متن‌باز است که توسط تیم Seed شرکت بایت‌دنس توسعه یافته‌اند و به‌طور خاص برای پردازش متن‌های طولانی، استدلال، عامل‌ها (agent) و قابلیت‌های عمومی طراحی شده‌اند. مدل Seed-OSS-36B-Instruct در این مجموعه، یک مدل تنظیم‌شده با ۳۶ میلیارد پارامتر است که به‌طور بومی از طول متن بسیار طولانی پشتیبانی می‌کند و قادر است حجم عظیمی از اسناد یا کدهای پیچیده را به‌صورت یکجا پردازش کند. این مدل به‌طور ویژه برای استدلال، تولید کد و وظایف عامل (مانند استفاده از ابزارها) بهینه شده و در عین حال تعادل و توانایی عمومی برجسته‌ای را حفظ می‌کند. یکی از ویژگی‌های برجسته این مدل، قابلیت «بودجه تفکر» است که به کاربران اجازه می‌دهد طول استدلال را به‌صورت انعطاف‌پذیر تنظیم کنند و بدین ترتیب کارایی استدلال در کاربردهای عملی به‌طور مؤثری افزایش یابد."
},
"DeepSeek-R1": {
"description": "مدل LLM پیشرفته و کارآمد که در استدلال، ریاضیات و برنامه‌نویسی تخصص دارد."
},
@@ -81,7 +84,13 @@
"description": "تأمین‌کننده مدل: پلتفرم sophnet. DeepSeek V3 Fast نسخه‌ای با TPS بالا و سرعت بسیار زیاد از نسخه DeepSeek V3 0324 است، بدون کمیت‌سازی، با توانایی‌های کد و ریاضی قوی‌تر و پاسخ‌دهی سریع‌تر!"
},
"DeepSeek-V3.1": {
"description": "DeepSeek-V3.1 یک مدل استدلال ترکیبی جدید از DeepSeek است که از دو حالت استدلال تفکری و غیرتفکری پشتیبانی می‌کند و نسبت به DeepSeek-R1-0528 در حالت تفکری کارایی بالاتری دارد. پس از آموزش تکمیلی، استفاده از ابزارهای Agent و عملکرد وظایف هوشمند به طور قابل توجهی بهبود یافته است."
"description": "DeepSeek-V3.1 حالت غیرتفکری؛ DeepSeek-V3.1 مدل استدلال ترکیبی جدیدی از DeepSeek است که از دو حالت استدلال تفکری و غیرتفکری پشتیبانی می‌کند و نسبت به DeepSeek-R1-0528 در حالت تفکری کارایی بالاتری دارد. پس از آموزش تکمیلی، استفاده از ابزارهای عامل و عملکرد در وظایف عامل بهطور قابل توجهی بهبود یافته است."
},
"DeepSeek-V3.1-Fast": {
"description": "DeepSeek V3.1 Fast نسخه پرسرعت و با TPS بالا از نسخه DeepSeek V3.1 است. حالت استدلال ترکیبی: با تغییر قالب گفتگو، یک مدل می‌تواند همزمان از حالت تفکری و غیرتفکری پشتیبانی کند. فراخوانی هوشمندتر ابزارها: با بهینه‌سازی پس از آموزش، عملکرد مدل در استفاده از ابزارها و وظایف عامل به‌طور چشمگیری بهبود یافته است."
},
"DeepSeek-V3.1-Think": {
"description": "DeepSeek-V3.1 حالت تفکری؛ DeepSeek-V3.1 مدل استدلال ترکیبی جدیدی از DeepSeek است که از دو حالت استدلال تفکری و غیرتفکری پشتیبانی می‌کند و نسبت به DeepSeek-R1-0528 در حالت تفکری کارایی بالاتری دارد. پس از آموزش تکمیلی، استفاده از ابزارهای عامل و عملکرد در وظایف عامل به‌طور قابل توجهی بهبود یافته است."
},
"Doubao-lite-128k": {
"description": "Doubao-lite دارای سرعت پاسخگویی بی‌نظیر و نسبت قیمت به کارایی بهتر است و گزینه‌های انعطاف‌پذیرتری را برای سناریوهای مختلف مشتریان ارائه می‌دهد. از پنجره متنی 128k برای استدلال و تنظیم دقیق پشتیبانی می‌کند."
@@ -281,6 +290,9 @@
"Pro/moonshotai/Kimi-K2-Instruct": {
"description": "Kimi K2 یک مدل پایه با معماری MoE است که دارای توانایی‌های بسیار قوی در کدنویسی و عامل است، با 1 تریلیون پارامتر کل و 32 میلیارد پارامتر فعال. در آزمون‌های معیار عملکرد در حوزه‌های دانش عمومی، برنامه‌نویسی، ریاضیات و عامل، مدل K2 عملکردی فراتر از سایر مدل‌های متن‌باز اصلی دارد."
},
"Pro/moonshotai/Kimi-K2-Instruct-0905": {
"description": "Kimi K2-Instruct-0905 جدیدترین و قدرتمندترین نسخه Kimi K2 است. این مدل یک مدل زبان برتر با معماری متخصص ترکیبی (MoE) است که دارای ۱ تریلیون پارامتر کل و ۳۲ میلیارد پارامتر فعال می‌باشد. ویژگی‌های اصلی این مدل شامل: هوش کدگذاری عامل بهبود یافته که در آزمون‌های معیار عمومی و وظایف واقعی کدگذاری عامل عملکرد قابل توجهی نشان می‌دهد؛ تجربه کدگذاری فرانت‌اند بهبود یافته که از نظر زیبایی و کاربردی بودن برنامه‌نویسی فرانت‌اند پیشرفت داشته است."
},
"QwQ-32B-Preview": {
"description": "QwQ-32B-Preview یک مدل پردازش زبان طبیعی نوآورانه است که قادر به پردازش کارآمد مکالمات پیچیده و درک زمینه است."
},
@@ -590,6 +602,33 @@
"ai21-labs/AI21-Jamba-1.5-Mini": {
"description": "یک مدل چندزبانه با ۵۲ میلیارد پارامتر (۱۲ میلیارد فعال) که پنجره زمینه ۲۵۶ هزار توکنی، فراخوانی توابع، خروجی ساختاریافته و تولید مبتنی بر واقعیت را ارائه می‌دهد."
},
"alibaba/qwen-3-14b": {
"description": "Qwen3 جدیدترین نسل از مدل‌های زبان بزرگ در سری Qwen است که مجموعه‌ای جامع از مدل‌های متراکم و متخصص ترکیبی (MoE) را ارائه می‌دهد. بر اساس آموزش گسترده ساخته شده، Qwen3 پیشرفت‌های چشمگیری در استدلال، پیروی از دستورالعمل‌ها، توانایی‌های نمایندگی و پشتیبانی چندزبانه ارائه می‌دهد."
},
"alibaba/qwen-3-235b": {
"description": "Qwen3 جدیدترین نسل از مدل‌های زبان بزرگ در سری Qwen است که مجموعه‌ای جامع از مدل‌های متراکم و متخصص ترکیبی (MoE) را ارائه می‌دهد. بر اساس آموزش گسترده ساخته شده، Qwen3 پیشرفت‌های چشمگیری در استدلال، پیروی از دستورالعمل‌ها، توانایی‌های نمایندگی و پشتیبانی چندزبانه ارائه می‌دهد."
},
"alibaba/qwen-3-30b": {
"description": "Qwen3 جدیدترین نسل از مدل‌های زبان بزرگ در سری Qwen است که مجموعه‌ای جامع از مدل‌های متراکم و متخصص ترکیبی (MoE) را ارائه می‌دهد. بر اساس آموزش گسترده ساخته شده، Qwen3 پیشرفت‌های چشمگیری در استدلال، پیروی از دستورالعمل‌ها، توانایی‌های نمایندگی و پشتیبانی چندزبانه ارائه می‌دهد."
},
"alibaba/qwen-3-32b": {
"description": "Qwen3 جدیدترین نسل از مدل‌های زبان بزرگ در سری Qwen است که مجموعه‌ای جامع از مدل‌های متراکم و متخصص ترکیبی (MoE) را ارائه می‌دهد. بر اساس آموزش گسترده ساخته شده، Qwen3 پیشرفت‌های چشمگیری در استدلال، پیروی از دستورالعمل‌ها، توانایی‌های نمایندگی و پشتیبانی چندزبانه ارائه می‌دهد."
},
"alibaba/qwen3-coder": {
"description": "Qwen3-Coder-480B-A35B-Instruct مدل کدگذاری با بالاترین توان نمایندگی در Qwen است که در کدنویسی نمایندگی، استفاده از مرورگر نمایندگی و سایر وظایف پایه کدنویسی عملکرد قابل توجهی دارد و نتایجی معادل Claude Sonnet ارائه می‌دهد."
},
"amazon/nova-lite": {
"description": "یک مدل چندرسانه‌ای بسیار کم‌هزینه که سرعت بسیار بالایی در پردازش ورودی‌های تصویر، ویدئو و متن دارد."
},
"amazon/nova-micro": {
"description": "یک مدل فقط متنی که با هزینه بسیار پایین پاسخ‌هایی با کمترین تأخیر ارائه می‌دهد."
},
"amazon/nova-pro": {
"description": "یک مدل چندرسانه‌ای بسیار توانمند با ترکیب بهینه دقت، سرعت و هزینه که برای طیف گسترده‌ای از وظایف مناسب است."
},
"amazon/titan-embed-text-v2": {
"description": "Amazon Titan Text Embeddings V2 یک مدل جاسازی چندزبانه سبک و کارآمد است که از ابعاد 1024، 512 و 256 پشتیبانی می‌کند."
},
"anthropic.claude-3-5-sonnet-20240620-v1:0": {
"description": "Claude 3.5 Sonnet استانداردهای صنعت را ارتقا داده است، عملکردی بهتر از مدل‌های رقیب و Claude 3 Opus دارد، در ارزیابی‌های گسترده به خوبی عمل کرده و در عین حال سرعت و هزینه مدل‌های سطح متوسط ما را حفظ می‌کند."
},
@@ -615,25 +654,28 @@
"description": "نسخه به‌روزرسانی شده Claude 2، با دو برابر پنجره متنی و بهبود در قابلیت اطمینان، کاهش توهمات و دقت مبتنی بر شواهد در اسناد طولانی و زمینه‌های RAG."
},
"anthropic/claude-3-haiku": {
"description": "Claude 3 Haiku سریع‌ترین و فشرده‌ترین مدل Anthropic است که برای ارائه پاسخ‌های تقریباً فوری طراحی شده است. این مدل دارای عملکرد سریع و دقیق جهت‌دار است."
"description": "Claude 3 Haiku سریع‌ترین مدل Anthropic تا به امروز است که برای بارهای کاری شرکتی که معمولاً شامل ورودی‌های طولانی است طراحی شده است. Haiku می‌تواند حجم زیادی از اسناد مانند گزارش‌های فصلی، قراردادها یا پرونده‌های حقوقی را به سرعت تحلیل کند و هزینه آن نصف مدل‌های هم‌رده خود است."
},
"anthropic/claude-3-opus": {
"description": "Claude 3 Opus قدرتمندترین مدل Anthropic برای انجام وظایف بسیار پیچیده است. این مدل در عملکرد، هوش، روانی و درک عالی عمل می‌کند."
"description": "Claude 3 Opus هوشمندترین مدل Anthropic است که در وظایف بسیار پیچیده عملکرد پیشرو در بازار دارد. این مدل می‌تواند با روانی و درک انسانی برجسته، ورودی‌های باز و سناریوهای ناآشنا را مدیریت کند."
},
"anthropic/claude-3.5-haiku": {
"description": "Claude 3.5 Haiku سریع‌ترین مدل نسل بعدی Anthropic است. در مقایسه با Claude 3 Haiku، Claude 3.5 Haiku در تمام مهارت‌ها بهبود یافته و در بسیاری از آزمون‌های هوش از بزرگترین مدل نسل قبلی، Claude 3 Opus پیشی گرفته است."
"description": "Claude 3.5 Haiku نسل بعدی سریع‌ترین مدل ما است. با سرعتی مشابه Claude 3 Haiku، در هر مجموعه مهارتی بهبود یافته و در بسیاری از آزمون‌های هوشمندی از مدل بزرگ قبلی ما Claude 3 Opus پیشی گرفته است."
},
"anthropic/claude-3.5-sonnet": {
"description": "Claude 3.5 Sonnet توانایی‌هایی فراتر از Opus ارائه می‌دهد و سرعتی سریع‌تر از Sonnet دارد، در حالی که قیمت آن با Sonnet یکسان است. Sonnet به‌ویژه در برنامه‌نویسی، علم داده، پردازش بصری و وظایف نمایندگی مهارت دارد."
"description": "Claude 3.5 Sonnet تعادل ایده‌آلی بین هوشمندی و سرعت برقرار می‌کند - به ویژه برای بارهای کاری شرکتی. در مقایسه با محصولات مشابه، عملکرد قدرتمندی با هزینه کمتر ارائه می‌دهد و برای دوام بالا در استقرارهای گسترده هوش مصنوعی طراحی شده است."
},
"anthropic/claude-3.7-sonnet": {
"description": "Claude 3.7 Sonnet هو هوش مصنوعی پیشرفته‌ترین مدل Anthropic است و همچنین اولین مدل استدلال ترکیبی در بازار به شمار می‌رود. Claude 3.7 Sonnet می‌تواند پاسخ‌های تقریباً آنی یا تفکر تدریجی و طولانی‌تری تولید کند که کاربران می‌توانند این فرآیندها را به وضوح مشاهده کنند. Sonnet به‌ویژه در برنامه‌نویسی، علم داده، پردازش بصری و وظایف نمایندگی مهارت دارد."
"description": "Claude 3.7 Sonnet اولین مدل استدلال ترکیبی و هوشمندترین مدل Anthropic تا به امروز است. این مدل عملکرد پیشرفته‌ای در کدنویسی، تولید محتوا، تحلیل داده و برنامه‌ریزی ارائه می‌دهد و بر پایه توانایی‌های مهندسی نرم‌افزار و استفاده از کامپیوتر مدل پیشین خود Claude 3.5 Sonnet ساخته شده است."
},
"anthropic/claude-opus-4": {
"description": "Claude Opus 4 قوی‌ترین مدل Anthropic برای انجام وظایف بسیار پیچیده است. این مدل در عملکرد، هوش، روانی و درک برتری چشمگیری دارد."
"description": "Claude Opus 4 قدرتمندترین مدل Anthropic تا به امروز و بهترین مدل کدنویسی جهان است که در آزمون‌های SWE-bench (72.5%) و Terminal-bench (43.2%) پیشتاز است. این مدل عملکرد مداومی برای وظایف طولانی‌مدت که نیازمند تمرکز و هزاران مرحله هستند ارائه می‌دهد و توانایی‌های نمایندگی هوش مصنوعی را به طور قابل توجهی گسترش می‌دهد."
},
"anthropic/claude-opus-4.1": {
"description": "Claude Opus 4.1 جایگزینی plug-and-play برای Opus 4 است که عملکرد و دقت برجسته‌ای در وظایف کدنویسی و نمایندگی واقعی ارائه می‌دهد. Opus 4.1 عملکرد پیشرفته کدنویسی را به 74.5% در SWE-bench Verified ارتقا داده و مسائل چندمرحله‌ای پیچیده را با دقت و توجه بیشتر به جزئیات مدیریت می‌کند."
},
"anthropic/claude-sonnet-4": {
"description": "Claude Sonnet 4 می‌تواند پاسخ‌های تقریباً فوری یا تفکر گام به گام طولانی‌مدت تولید کند که کاربران می‌توانند این فرآیندها را به وضوح مشاهده کنند. کاربران API همچنین می‌توانند زمان تفکر مدل را به دقت کنترل کنند."
"description": "Claude Sonnet 4 بهبود قابل توجهی بر توانایی‌های پیشرو در صنعت Sonnet 3.7 دارد و در کدنویسی عملکرد برجسته‌ای با 72.7% در SWE-bench ارائه می‌دهد. این مدل تعادل بین عملکرد و کارایی را حفظ کرده و برای موارد استفاده داخلی و خارجی مناسب است و با کنترل‌پذیری بهبود یافته، کنترل بیشتری بر نتایج فراهم می‌کند."
},
"ascend-tribe/pangu-pro-moe": {
"description": "Pangu-Pro-MoE 72B-A16B یک مدل زبان بزرگ پراکنده با 72 میلیارد پارامتر و 16 میلیارد پارامتر فعال است که بر اساس معماری متخصصان ترکیبی گروه‌بندی شده (MoGE) ساخته شده است. در مرحله انتخاب متخصص، متخصصان به گروه‌هایی تقسیم می‌شوند و توکن‌ها در هر گروه به تعداد مساوی متخصصان فعال می‌شوند تا تعادل بار متخصصان حفظ شود، که به طور قابل توجهی کارایی استقرار مدل را در پلتفرم Ascend افزایش می‌دهد."
@@ -689,6 +731,9 @@
"claude-3-5-haiku-20241022": {
"description": "Claude 3.5 Haiku سریع‌ترین مدل نسل بعدی Anthropic است. در مقایسه با Claude 3 Haiku، Claude 3.5 Haiku در تمام مهارت‌ها بهبود یافته و در بسیاری از آزمون‌های استاندارد هوش، از بزرگ‌ترین مدل نسل قبلی یعنی Claude 3 Opus پیشی گرفته است."
},
"claude-3-5-haiku-latest": {
"description": "Claude 3.5 Haiku پاسخ‌های سریع ارائه می‌دهد و برای وظایف سبک مناسب است."
},
"claude-3-5-sonnet-20240620": {
"description": "Claude 3.5 Sonnet توانایی‌هایی فراتر از Opus ارائه می‌دهد و سرعتی سریع‌تر از Sonnet دارد، در حالی که قیمت آن با Sonnet یکسان است. Sonnet به‌ویژه در برنامه‌نویسی، علم داده، پردازش بصری و وظایف نمایندگی مهارت دارد."
},
@@ -698,6 +743,9 @@
"claude-3-7-sonnet-20250219": {
"description": "Claude 3.7 Sonnet توانایی‌هایی فراتر از Opus ارائه می‌دهد و سرعتی سریع‌تر از Sonnet دارد، در حالی که قیمت آن با Sonnet یکسان است. Sonnet به‌ویژه در برنامه‌نویسی، علم داده، پردازش بصری و وظایف نمایندگی مهارت دارد."
},
"claude-3-7-sonnet-latest": {
"description": "Claude 3.7 Sonnet جدیدترین و قدرتمندترین مدل Anthropic برای پردازش وظایف بسیار پیچیده است. این مدل در عملکرد، هوش، روانی و درک برتری دارد."
},
"claude-3-haiku-20240307": {
"description": "Claude 3 Haiku سریع‌ترین و فشرده‌ترین مدل Anthropic است که برای ارائه پاسخ‌های تقریباً فوری طراحی شده است. این مدل دارای عملکرد سریع و دقیق جهت‌گیری است."
},
@@ -710,11 +758,17 @@
"claude-opus-4-1-20250805": {
"description": "Claude Opus 4.1 جدیدترین و قدرتمندترین مدل Anthropic برای انجام وظایف بسیار پیچیده است. این مدل در عملکرد، هوشمندی، روانی و درک توانایی برجسته‌ای دارد."
},
"claude-opus-4-1-20250805-thinking": {
"description": "مدل تفکر Claude Opus 4.1 نسخه پیشرفته‌ای است که می‌تواند فرآیند استدلال خود را نمایش دهد."
},
"claude-opus-4-20250514": {
"description": "Claude Opus 4 قدرتمندترین مدل Anthropic برای پردازش وظایف بسیار پیچیده است. این مدل در زمینه‌های عملکرد، هوش، روانی و درک فوق‌العاده عمل می‌کند."
},
"claude-sonnet-4-20250514": {
"description": "Claude 4 Sonnet می‌تواند پاسخ‌های تقریباً آنی یا تفکر تدریجی و طولانی‌مدت را تولید کند، کاربران می‌توانند این فرآیندها را به وضوح مشاهده کنند. کاربران API همچنین می‌توانند زمان تفکر مدل را به دقت کنترل کنند."
"description": "Claude Sonnet 4 می‌تواند پاسخ‌های تقریباً فوری یا تفکر گام به گام طولانی‌مدت تولید کند که کاربران می‌توانند این فرآیندها را به وضوح مشاهده کنند."
},
"claude-sonnet-4-20250514-thinking": {
"description": "مدل تفکر Claude Sonnet 4 می‌تواند پاسخ‌های تقریباً فوری یا تفکر گام به گام طولانی‌مدت تولید کند که کاربران می‌توانند این فرآیندها را به وضوح مشاهده کنند."
},
"codegeex-4": {
"description": "CodeGeeX-4 یک دستیار برنامه‌نویسی قدرتمند مبتنی بر هوش مصنوعی است که از پرسش و پاسخ هوشمند و تکمیل کد در زبان‌های برنامه‌نویسی مختلف پشتیبانی می‌کند و بهره‌وری توسعه را افزایش می‌دهد."
@@ -773,6 +827,18 @@
"cohere/Cohere-command-r-plus": {
"description": "Command R+ یک مدل بهینه‌سازی شده پیشرفته برای RAG است که برای بارهای کاری سازمانی طراحی شده است."
},
"cohere/command-a": {
"description": "Command A قوی‌ترین مدل Cohere تا به امروز است که در استفاده از ابزارها، نمایندگی، تولید تقویت‌شده با بازیابی (RAG) و موارد چندزبانه عملکرد برجسته‌ای دارد. طول زمینه Command A برابر با 256K است و با تنها دو GPU اجرا می‌شود و نسبت به Command R+ 08-2024، توان عملیاتی 150% افزایش یافته است."
},
"cohere/command-r": {
"description": "Command R یک مدل زبان بزرگ بهینه‌شده برای تعاملات مکالمه‌ای و وظایف با زمینه طولانی است. این مدل در دسته \"قابل مقیاس\" قرار دارد و تعادل بین عملکرد بالا و دقت قوی را برقرار می‌کند تا شرکت‌ها را قادر سازد از مرحله اثبات مفهوم به تولید برسند."
},
"cohere/command-r-plus": {
"description": "Command R+ جدیدترین مدل زبان بزرگ Cohere است که برای تعاملات مکالمه‌ای و وظایف با زمینه طولانی بهینه شده است. هدف آن ارائه عملکرد بسیار برجسته است تا شرکت‌ها بتوانند از مرحله اثبات مفهوم به تولید برسند."
},
"cohere/embed-v4.0": {
"description": "مدلی که امکان دسته‌بندی یا تبدیل متن، تصویر یا محتوای ترکیبی به جاسازی را فراهم می‌کند."
},
"command": {
"description": "یک مدل گفتگوی پیروی از دستور که در وظایف زبانی کیفیت بالاتر و قابلیت اطمینان بیشتری را ارائه می‌دهد و نسبت به مدل‌های تولید پایه ما دارای طول زمینه بیشتری است."
},
@@ -809,12 +875,6 @@
"command-r7b-12-2024": {
"description": "command-r7b-12-2024 یک نسخه کوچک و کارآمد به‌روزرسانی شده است که در دسامبر 2024 منتشر شد. این مدل در RAG، استفاده از ابزارها، نمایندگی و سایر وظایفی که نیاز به استدلال پیچیده و پردازش چند مرحله‌ای دارند، عملکرد فوق‌العاده‌ای دارد."
},
"compound-beta": {
"description": "Compound-beta یک سیستم هوش مصنوعی ترکیبی است که توسط چندین مدل قابل دسترس و پشتیبانی شده در GroqCloud پشتیبانی می‌شود و می‌تواند به‌طور هوشمند و انتخابی از ابزارها برای پاسخ به پرسش‌های کاربران استفاده کند."
},
"compound-beta-mini": {
"description": "Compound-beta-mini یک سیستم هوش مصنوعی ترکیبی است که توسط مدل‌های عمومی قابل دسترس در GroqCloud پشتیبانی می‌شود و می‌تواند به‌طور هوشمند و انتخابی از ابزارها برای پاسخ به پرسش‌های کاربران استفاده کند."
},
"computer-use-preview": {
"description": "مدل computer-use-preview به‌طور اختصاصی برای «ابزارهای استفاده از کامپیوتر» طراحی شده و آموزش دیده است تا وظایف مرتبط با کامپیوتر را درک و اجرا کند."
},
@@ -957,7 +1017,7 @@
"description": "DeepSeek-V3.1 یک مدل بزرگ استدلال ترکیبی است که از زمینه طولانی 128K و تغییر حالت کارآمد پشتیبانی می‌کند و در فراخوانی ابزارها، تولید کد و وظایف استدلال پیچیده عملکرد و سرعت برجسته‌ای دارد."
},
"deepseek/deepseek-r1": {
"description": "DeepSeek-R1 با وجود داده‌های برچسب‌گذاری شده بسیار کم، توانایی استدلال مدل را به طرز چشمگیری افزایش می‌دهد. قبل از ارائه پاسخ نهایی، مدل ابتدا یک زنجیره تفکر را تولید می‌کند تا دقت پاسخ نهایی را افزایش دهد."
"description": "مدل DeepSeek R1 به‌روزرسانی‌های جزئی دریافت کرده و نسخه فعلی DeepSeek-R1-0528 است. در آخرین به‌روزرسانی، DeepSeek R1 با بهره‌گیری از منابع محاسباتی افزایش‌یافته و مکانیزم‌های بهینه‌سازی الگوریتمی پس از آموزش، عمق و توان استدلال خود را به طور قابل توجهی بهبود بخشیده است. این مدل در ارزیابی‌های معیار مختلف مانند ریاضیات، برنامه‌نویسی و منطق عمومی عملکرد برجسته‌ای دارد و عملکرد کلی آن اکنون به مدل‌های پیشرو مانند O3 و Gemini 2.5 Pro نزدیک شده است."
},
"deepseek/deepseek-r1-0528": {
"description": "DeepSeek-R1 با داشتن داده‌های برچسب‌خورده بسیار محدود، توانایی استدلال مدل را به طور چشمگیری افزایش داده است. قبل از ارائه پاسخ نهایی، مدل ابتدا یک زنجیره فکری را تولید می‌کند تا دقت پاسخ نهایی را بهبود بخشد."
@@ -966,7 +1026,7 @@
"description": "DeepSeek-R1 با داشتن داده‌های برچسب‌خورده بسیار محدود، توانایی استدلال مدل را به طور چشمگیری افزایش داده است. قبل از ارائه پاسخ نهایی، مدل ابتدا یک زنجیره فکری را تولید می‌کند تا دقت پاسخ نهایی را بهبود بخشد."
},
"deepseek/deepseek-r1-distill-llama-70b": {
"description": "DeepSeek R1 Distill Llama 70B یک مدل زبان بزرگ مبتنی بر Llama3.3 70B است که با استفاده از تنظیمات DeepSeek R1 به عملکرد رقابتی معادل مدل‌های پیشرفته بزرگ دست یافته است."
"description": "DeepSeek-R1-Distill-Llama-70B نسخه تقطیر شده و بهینه‌تر مدل 70B Llama است. این مدل در وظایف تولید متن عملکرد قوی خود را حفظ کرده و هزینه محاسباتی را کاهش داده تا استقرار و پژوهش را تسهیل کند. توسط Groq با استفاده از سخت‌افزار واحد پردازش زبان سفارشی (LPU) ارائه می‌شود تا استدلال سریع و کارآمد فراهم کند."
},
"deepseek/deepseek-r1-distill-llama-8b": {
"description": "DeepSeek R1 Distill Llama 8B یک مدل زبان بزرگ تقطیر شده مبتنی بر Llama-3.1-8B-Instruct است که با استفاده از خروجی DeepSeek R1 آموزش دیده است."
@@ -984,7 +1044,10 @@
"description": "DeepSeek-R1 با وجود داده‌های برچسب‌گذاری شده بسیار کم، توانایی استدلال مدل را به طرز چشمگیری افزایش می‌دهد. قبل از ارائه پاسخ نهایی، مدل ابتدا یک زنجیره تفکر را تولید می‌کند تا دقت پاسخ نهایی را افزایش دهد."
},
"deepseek/deepseek-v3": {
"description": "DeepSeek-V3 در سرعت استدلال به یک پیشرفت عمده نسبت به مدل‌های قبلی دست یافته است. این مدل در بین مدل‌های متن باز رتبه اول را دارد و می‌تواند با پیشرفته‌ترین مدل‌های بسته جهانی رقابت کند. DeepSeek-V3 از معماری توجه چندسر (MLA) و DeepSeekMoE استفاده می‌کند که این معماری‌ها در DeepSeek-V2 به طور کامل تأیید شده‌اند. علاوه بر این، DeepSeek-V3 یک استراتژی کمکی بدون ضرر برای تعادل بار معرفی کرده و اهداف آموزشی پیش‌بینی چند برچسبی را برای بهبود عملکرد تعیین کرده است."
"description": "مدل زبان بزرگ سریع و عمومی با توان استدلال بهبود یافته."
},
"deepseek/deepseek-v3.1-base": {
"description": "DeepSeek V3.1 Base نسخه بهبود یافته مدل DeepSeek V3 است."
},
"deepseek/deepseek-v3/community": {
"description": "DeepSeek-V3 در سرعت استدلال به یک پیشرفت عمده نسبت به مدل‌های قبلی دست یافته است. این مدل در بین مدل‌های متن باز رتبه اول را دارد و می‌تواند با پیشرفته‌ترین مدل‌های بسته جهانی رقابت کند. DeepSeek-V3 از معماری توجه چندسر (MLA) و DeepSeekMoE استفاده می‌کند که این معماری‌ها در DeepSeek-V2 به طور کامل تأیید شده‌اند. علاوه بر این، DeepSeek-V3 یک استراتژی کمکی بدون ضرر برای تعادل بار معرفی کرده و اهداف آموزشی پیش‌بینی چند برچسبی را برای بهبود عملکرد تعیین کرده است."
@@ -1055,8 +1118,17 @@
"doubao-seed-1.6-thinking": {
"description": "مدل Doubao-Seed-1.6-thinking با توانایی تفکر به‌طور قابل توجهی تقویت شده است، نسبت به Doubao-1.5-thinking-pro در مهارت‌های پایه‌ای مانند برنامه‌نویسی، ریاضیات و استدلال منطقی پیشرفت داشته و از درک تصویری پشتیبانی می‌کند. از پنجره متنی ۲۵۶ هزار توکنی پشتیبانی می‌کند و طول خروجی تا ۱۶ هزار توکن را امکان‌پذیر می‌سازد."
},
"doubao-seed-1.6-vision": {
"description": "مدل تفکر عمیق بصری Doubao-Seed-1.6-vision در زمینه‌هایی مانند آموزش، بازبینی تصاویر، بازرسی و امنیت و پرسش و پاسخ جستجوی هوش مصنوعی، توانایی درک و استدلال چندرسانه‌ای عمومی قوی‌تری را نشان می‌دهد. از پنجره متنی ۲۵۶ هزار توکنی پشتیبانی می‌کند و طول خروجی تا ۶۴ هزار توکن قابل افزایش است."
},
"doubao-seededit-3-0-i2i-250628": {
"description": "مدل تولید تصویر Doubao توسط تیم Seed شرکت ByteDance توسعه یافته است، از ورودی متن و تصویر پشتیبانی می‌کند و تجربه‌ای با کنترل بالا و کیفیت عالی در تولید تصویر ارائه می‌دهد. امکان ویرایش تصویر با دستور متنی وجود دارد و طول ضلع تصویر تولید شده بین 512 تا 1536 پیکسل است."
},
"doubao-seedream-3-0-t2i-250415": {
"description": "مدل تولید تصویر Doubao توسط تیم Seed شرکت بایت‌دنس توسعه یافته است و از ورودی‌های متن و تصویر پشتیبانی می‌کند و تجربه تولید تصویر با کنترل بالا و کیفیت عالی را ارائه می‌دهد. تصاویر بر اساس متن توصیفی تولید می‌شوند."
"description": "مدل تولید تصویر Seedream 3.0 توسط تیم Seed شرکت ByteDance توسعه یافته است، از ورودی متن و تصویر پشتیبانی می‌کند و تجربه‌ای با کنترل بالا و کیفیت عالی در تولید تصویر ارائه می‌دهد. تصاویر بر اساس متن توصیفی تولید می‌شوند."
},
"doubao-seedream-4-0-250828": {
"description": "مدل تولید تصویر Seedream 4.0 توسط تیم Seed شرکت ByteDance توسعه یافته است، از ورودی متن و تصویر پشتیبانی می‌کند و تجربه‌ای با کنترل بالا و کیفیت عالی در تولید تصویر ارائه می‌دهد. تصاویر بر اساس متن توصیفی تولید می‌شوند."
},
"doubao-vision-lite-32k": {
"description": "مدل Doubao-vision یک مدل چندرسانه‌ای بزرگ است که توسط Doubao ارائه شده و دارای توانایی‌های قوی در درک و استدلال تصاویر و همچنین درک دقیق دستورات است. این مدل در استخراج اطلاعات متنی از تصاویر و وظایف استدلال مبتنی بر تصویر عملکرد قدرتمندی نشان داده و می‌تواند در وظایف پیچیده‌تر و گسترده‌تر پرسش و پاسخ بصری به کار رود."
@@ -1139,6 +1211,33 @@
"ernie-x1-turbo-32k": {
"description": "مدل نسبت به ERNIE-X1-32K از نظر عملکرد و کارایی بهتر است."
},
"fal-ai/bytedance/seedream/v4": {
"description": "مدل تولید تصویر Seedream 4.0 توسط تیم Seed شرکت ByteDance توسعه یافته است، از ورودی متن و تصویر پشتیبانی می‌کند و تجربه‌ای با کنترل بالا و کیفیت عالی در تولید تصویر ارائه می‌دهد. تصاویر بر اساس متن توصیفی تولید می‌شوند."
},
"fal-ai/flux-kontext/dev": {
"description": "مدل FLUX.1 متمرکز بر وظایف ویرایش تصویر است و از ورودی متن و تصویر پشتیبانی می‌کند."
},
"fal-ai/flux-pro/kontext": {
"description": "FLUX.1 Kontext [pro] قادر است متن و تصویر مرجع را به عنوان ورودی پردازش کند و ویرایش‌های هدفمند محلی و تغییرات پیچیده در صحنه‌های کلی را به صورت یکپارچه انجام دهد."
},
"fal-ai/flux/krea": {
"description": "Flux Krea [dev] یک مدل تولید تصویر با سلیقه زیبایی‌شناسانه است که هدف آن تولید تصاویر واقعی‌تر و طبیعی‌تر است."
},
"fal-ai/flux/schnell": {
"description": "FLUX.1 [schnell] یک مدل تولید تصویر با 12 میلیارد پارامتر است که بر تولید سریع تصاویر با کیفیت بالا تمرکز دارد."
},
"fal-ai/imagen4/preview": {
"description": "مدل تولید تصویر با کیفیت بالا ارائه شده توسط گوگل"
},
"fal-ai/nano-banana": {
"description": "Nano Banana جدیدترین، سریع‌ترین و کارآمدترین مدل چندرسانه‌ای بومی گوگل است که به شما امکان می‌دهد از طریق گفتگو تصاویر را تولید و ویرایش کنید."
},
"fal-ai/qwen-image": {
"description": "مدل قدرتمند تولید تصویر خام تیم Qwen با توانایی چشمگیر در تولید متن‌های چینی و سبک‌های بصری متنوع تصاویر."
},
"fal-ai/qwen-image-edit": {
"description": "مدل ویرایش تصویر حرفه‌ای منتشر شده توسط تیم Qwen که از ویرایش معنایی و ظاهری پشتیبانی می‌کند، قادر به ویرایش دقیق متن‌های چینی و انگلیسی، تبدیل سبک، چرخش اشیاء و سایر ویرایش‌های با کیفیت تصویر است."
},
"flux-1-schnell": {
"description": "مدل تولید تصویر از متن با 12 میلیارد پارامتر که توسط Black Forest Labs توسعه یافته است و از تکنولوژی تقطیر انتشار متخاصم نهفته استفاده می‌کند و قادر است در 1 تا 4 مرحله تصاویر با کیفیت بالا تولید کند. این مدل عملکردی مشابه نمونه‌های بسته دارد و تحت مجوز Apache-2.0 برای استفاده شخصی، تحقیقاتی و تجاری منتشر شده است."
},
@@ -1151,9 +1250,6 @@
"flux-kontext-pro": {
"description": "پیشرفته‌ترین تولید و ویرایش تصاویر زمینه‌ای — ترکیب متن و تصویر برای به‌دست آوردن نتایجی دقیق و منسجم."
},
"flux-kontext/dev": {
"description": "مدل FLUX.1 متمرکز بر وظایف ویرایش تصویر، با پشتیبانی از ورودی‌های متنی و تصویری."
},
"flux-merged": {
"description": "مدل FLUX.1-merged ترکیبی از ویژگی‌های عمیق کشف شده در مرحله توسعه \"DEV\" و مزایای اجرای سریع \"Schnell\" است. این اقدام باعث افزایش مرزهای عملکرد مدل و گسترش دامنه کاربردهای آن شده است."
},
@@ -1166,21 +1262,12 @@
"flux-pro-1.1-ultra": {
"description": "تولید تصاویر هوش مصنوعی با رزولوشن فوق‌العاده — پشتیبانی از خروجی ۴ مگاپیکسلی و تولید تصاویر با وضوح بالا در کمتر از ۱۰ ثانیه."
},
"flux-pro/kontext": {
"description": "FLUX.1 Kontext [pro] قادر است متن و تصاویر مرجع را به عنوان ورودی پردازش کند و ویرایش‌های موضعی هدفمند و تغییرات پیچیده در کل صحنه را به‌صورت یکپارچه انجام دهد."
},
"flux-schnell": {
"description": "FLUX.1 [schnell] به عنوان پیشرفته‌ترین مدل متن‌باز با گام‌های کم، نه تنها از رقبا پیشی گرفته بلکه از مدل‌های غیرتقطیر قدرتمندی مانند Midjourney v6.0 و DALL·E 3 (HD) نیز بهتر است. این مدل به طور خاص تنظیم شده تا تنوع کامل خروجی‌های پیش‌آموزش را حفظ کند و نسبت به مدل‌های پیشرفته بازار، بهبودهای قابل توجهی در کیفیت بصری، پیروی از دستورالعمل، تغییر اندازه/نسبت، پردازش فونت و تنوع خروجی ارائه می‌دهد و تجربه تولید تصاویر خلاقانه و متنوع‌تری را برای کاربران فراهم می‌کند."
},
"flux.1-schnell": {
"description": "ترنسفورمر جریان اصلاح‌شده با 12 میلیارد پارامتر که قادر است تصاویر را بر اساس توصیف متنی تولید کند."
},
"flux/krea": {
"description": "Flux Krea [dev] مدلی برای تولید تصویر با سلیقه زیبایی‌شناسانه است که هدف آن تولید تصاویر واقعی‌تر و طبیعی‌تر می‌باشد."
},
"flux/schnell": {
"description": "FLUX.1 [schnell] مدلی با 12 میلیارد پارامتر برای تولید تصویر است که بر تولید سریع تصاویر با کیفیت بالا تمرکز دارد."
},
"gemini-1.0-pro-001": {
"description": "Gemini 1.0 Pro 001 (تنظیم) عملکردی پایدار و قابل تنظیم ارائه می‌دهد و انتخابی ایده‌آل برای راه‌حل‌های وظایف پیچیده است."
},
@@ -1388,20 +1475,26 @@
"glm-zero-preview": {
"description": "GLM-Zero-Preview دارای توانایی‌های پیچیده استدلال است و در زمینه‌های استدلال منطقی، ریاضیات، برنامه‌نویسی و غیره عملکرد عالی دارد."
},
"google/gemini-2.0-flash": {
"description": "Gemini 2.0 Flash ویژگی‌ها و قابلیت‌های نسل بعدی را ارائه می‌دهد، از جمله سرعت عالی، استفاده داخلی از ابزارها، تولید چندرسانه‌ای و پنجره زمینه 1 میلیون توکن."
},
"google/gemini-2.0-flash-001": {
"description": "Gemini 2.0 Flash ویژگی‌ها و بهبودهای نسل بعدی را ارائه می‌دهد، از جمله سرعت عالی، استفاده از ابزارهای بومی، تولید چندرسانه‌ای و پنجره متن 1M توکن."
},
"google/gemini-2.0-flash-exp:free": {
"description": "Gemini 2.0 Flash Experimental جدیدترین مدل هوش مصنوعی چندرسانه‌ای آزمایشی گوگل است که نسبت به نسخه‌های قبلی خود بهبود کیفیت قابل توجهی دارد، به ویژه در زمینه دانش جهانی، کد و زمینه‌های طولانی."
},
"google/gemini-2.0-flash-lite": {
"description": "Gemini 2.0 Flash Lite ویژگی‌ها و قابلیت‌های نسل بعدی را ارائه می‌دهد، از جمله سرعت عالی، استفاده داخلی از ابزارها، تولید چندرسانه‌ای و پنجره زمینه 1 میلیون توکن."
},
"google/gemini-2.5-flash": {
"description": "Gemini 2.5 Flash پیشرفته‌ترین مدل اصلی گوگل است که به‌طور خاص برای استدلال پیشرفته، کدنویسی، ریاضیات و وظایف علمی طراحی شده است. این مدل دارای قابلیت «تفکر» داخلی است که به آن امکان می‌دهد پاسخ‌هایی با دقت بالاتر و پردازش دقیق‌تر زمینه ارائه دهد.\n\nتوجه: این مدل دو نسخه دارد: تفکری و غیرتفکری. قیمت‌گذاری خروجی به طور قابل توجهی بسته به فعال بودن قابلیت تفکر متفاوت است. اگر نسخه استاندارد (بدون پسوند «:thinking») را انتخاب کنید، مدل به‌طور صریح از تولید توکن‌های تفکر خودداری می‌کند.\n\nبرای بهره‌مندی از قابلیت تفکر و دریافت توکن‌های تفکر، باید نسخه «:thinking» را انتخاب کنید که منجر به قیمت‌گذاری بالاتر برای خروجی تفکر می‌شود.\n\nعلاوه بر این، Gemini 2.5 Flash را می‌توان از طریق پارامتر «حداکثر توکن‌های استدلال» پیکربندی کرد، همان‌طور که در مستندات آمده است (https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning)."
"description": "Gemini 2.5 Flash یک مدل تفکر است که توانایی‌های جامع برجسته‌ای ارائه می‌دهد. این مدل برای تعادل بین قیمت و عملکرد طراحی شده و از ورودی‌های چندرسانه‌ای و پنجره زمینه 1 میلیون توکن پشتیبانی می‌کند."
},
"google/gemini-2.5-flash-image-preview": {
"description": "مدل آزمایشی Gemini 2.5 Flash با پشتیبانی از تولید تصویر"
},
"google/gemini-2.5-flash-image-preview:free": {
"description": "مدل آزمایشی Gemini 2.5 Flash با پشتیبانی از تولید تصویر"
"google/gemini-2.5-flash-lite": {
"description": "Gemini 2.5 Flash-Lite یک مدل متعادل و با تأخیر کم است که بودجه تفکر و اتصال ابزار قابل تنظیم (مانند جستجوی Google و اجرای کد) دارد. این مدل از ورودی‌های چندرسانه‌ای پشتیبانی می‌کند و پنجره زمینه 1 میلیون توکن ارائه می‌دهد."
},
"google/gemini-2.5-flash-preview": {
"description": "Gemini 2.5 Flash مدل اصلی پیشرفته گوگل است که به طور خاص برای استدلال پیشرفته، کدنویسی، ریاضیات و وظایف علمی طراحی شده است. این مدل دارای قابلیت «تفکر» داخلی است که به آن اجازه می‌دهد پاسخ‌هایی با دقت بالاتر و پردازش زمینه‌ای دقیق‌تری ارائه دهد.\n\nتوجه: این مدل دارای دو واریانت است: تفکر و غیرتفکر. قیمت‌گذاری خروجی بسته به فعال بودن قابلیت تفکر به طور قابل توجهی متفاوت است. اگر شما واریانت استاندارد (بدون پسوند «:thinking») را انتخاب کنید، مدل به وضوح از تولید توکن‌های تفکر اجتناب خواهد کرد.\n\nبرای استفاده از قابلیت تفکر و دریافت توکن‌های تفکر، شما باید واریانت «:thinking» را انتخاب کنید که منجر به قیمت‌گذاری بالاتر خروجی تفکر خواهد شد.\n\nعلاوه بر این، Gemini 2.5 Flash می‌تواند از طریق پارامتر «حداکثر تعداد توکن‌های استدلال» پیکربندی شود، همانطور که در مستندات توضیح داده شده است (https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning)."
@@ -1410,11 +1503,14 @@
"description": "Gemini 2.5 Flash مدل اصلی پیشرفته گوگل است که به طور خاص برای استدلال پیشرفته، کدنویسی، ریاضیات و وظایف علمی طراحی شده است. این مدل دارای قابلیت «تفکر» داخلی است که به آن اجازه می‌دهد پاسخ‌هایی با دقت بالاتر و پردازش زمینه‌ای دقیق‌تری ارائه دهد.\n\nتوجه: این مدل دارای دو واریانت است: تفکر و غیرتفکر. قیمت‌گذاری خروجی بسته به فعال بودن قابلیت تفکر به طور قابل توجهی متفاوت است. اگر شما واریانت استاندارد (بدون پسوند «:thinking») را انتخاب کنید، مدل به وضوح از تولید توکن‌های تفکر اجتناب خواهد کرد.\n\nبرای استفاده از قابلیت تفکر و دریافت توکن‌های تفکر، شما باید واریانت «:thinking» را انتخاب کنید که منجر به قیمت‌گذاری بالاتر خروجی تفکر خواهد شد.\n\nعلاوه بر این، Gemini 2.5 Flash می‌تواند از طریق پارامتر «حداکثر تعداد توکن‌های استدلال» پیکربندی شود، همانطور که در مستندات توضیح داده شده است (https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning)."
},
"google/gemini-2.5-pro": {
"description": "Gemini 2.5 Pro پیشرفته‌ترین مدل تفکری گوگل است که قادر به استدلال درباره مسائل پیچیده در حوزه کد، ریاضیات و STEM بوده و می‌تواند با استفاده از زمینه طولانی، دادههای بزرگ، مخازن کد و مستندات را تحلیل کند."
"description": "Gemini 2.5 Pro پیشرفته‌ترین مدل استدلال Gemini ما است که قادر به حل مسائل پیچیده است. این مدل دارای پنجره زمینه 2 میلیون توکن بوده و از ورودی‌های چندرسانه‌ای شامل متن، تصویر، صدا، ویدئو و اسناد PDF پشتیبانی می‌کند."
},
"google/gemini-2.5-pro-preview": {
"description": "Gemini 2.5 Pro Preview پیشرفته‌ترین مدل فکری گوگل است که قادر به استدلال درباره مسائل پیچیده در زمینه کد، ریاضیات و حوزه‌های STEM بوده و همچنین می‌تواند با استفاده از متن‌های طولانی، مجموعه‌های داده بزرگ، کدها و مستندات را تحلیل کند."
},
"google/gemini-embedding-001": {
"description": "مدل جاسازی پیشرفته با عملکرد برجسته در وظایف زبان انگلیسی، چندزبانه و کد."
},
"google/gemini-flash-1.5": {
"description": "Gemini 1.5 Flash قابلیت پردازش چندوجهی بهینه‌شده را ارائه می‌دهد و برای انواع سناریوهای پیچیده مناسب است."
},
@@ -1442,12 +1538,21 @@
"google/gemma-2b-it": {
"description": "Gemma Instruct (2B) توانایی پردازش دستورات پایه را فراهم می‌کند و برای برنامه‌های سبک مناسب است."
},
"google/gemma-3-12b-it": {
"description": "Gemma 3 12B یک مدل زبان متن‌باز از گوگل است که استانداردهای جدیدی در زمینه کارایی و عملکرد ایجاد کرده است."
},
"google/gemma-3-1b-it": {
"description": "Gemma 3 1B یک مدل زبان متن‌باز از گوگل است که استانداردهای جدیدی در کارایی و عملکرد ایجاد کرده است."
},
"google/gemma-3-27b-it": {
"description": "Gemma 3 27B یک مدل زبان متن باز از گوگل است که استانداردهای جدیدی را در زمینه کارایی و عملکرد تعیین کرده است."
},
"google/text-embedding-005": {
"description": "مدل جاسازی متن متمرکز بر زبان انگلیسی بهینه شده برای وظایف کد و زبان انگلیسی."
},
"google/text-multilingual-embedding-002": {
"description": "مدل جاسازی متن چندزبانه بهینه شده برای وظایف بین‌زبانی با پشتیبانی از زبان‌های متعدد."
},
"gpt-3.5-turbo": {
"description": "GPT 3.5 توربو، مناسب برای انواع وظایف تولید و درک متن، در حال حاضر به gpt-3.5-turbo-0125 اشاره می‌کند"
},
@@ -1604,9 +1709,18 @@
"grok-4": {
"description": "جدیدترین و قدرتمندترین مدل پرچمدار ما که در پردازش زبان طبیعی، محاسبات ریاضی و استدلال عملکردی برجسته دارد — یک انتخاب همه‌کاره بی‌نظیر است."
},
"grok-4-0709": {
"description": "Grok 4 از xAI با توانایی استدلال قدرتمند."
},
"grok-code-fast-1": {
"description": "ما خوشحالیم که grok-code-fast-1 را معرفی کنیم، مدلی سریع و مقرون‌به‌صرفه برای استنتاج که در کدگذاری نماینده عملکرد برجسته‌ای دارد."
},
"groq/compound": {
"description": "Compound یک سیستم هوش مصنوعی ترکیبی است که توسط چندین مدل متن‌باز موجود در GroqCloud پشتیبانی می‌شود و می‌تواند به‌صورت هوشمند و انتخابی از ابزارها برای پاسخ به پرسش‌های کاربران استفاده کند."
},
"groq/compound-mini": {
"description": "Compound-mini یک سیستم هوش مصنوعی ترکیبی است که توسط مدل‌های متن‌باز موجود در GroqCloud پشتیبانی می‌شود و می‌تواند به‌صورت هوشمند و انتخابی از ابزارها برای پاسخ به پرسش‌های کاربران استفاده کند."
},
"gryphe/mythomax-l2-13b": {
"description": "MythoMax l2 13B یک مدل زبانی است که خلاقیت و هوش را با ترکیب چندین مدل برتر به هم پیوند می‌دهد."
},
@@ -1662,7 +1776,7 @@
"description": "افزایش قابل توجه در توانایی‌های ریاضی، منطقی و کدنویسی پیچیده، بهینه‌سازی پایداری خروجی مدل و ارتقاء توانایی مدل در پردازش متون طولانی."
},
"hunyuan-t1-latest": {
"description": "اولین مدل استدلال هیبریدی-ترنسفورمر-مامبا با مقیاس فوق‌العاده بزرگ در صنعت، که توانایی استدلال را گسترش می‌دهد و سرعت رمزگشایی فوق‌العاده‌ای دارد و به طور بیشتری با ترجیحات انسانی هم‌راستا می‌شود."
"description": "توانایی‌های مدل اصلی تفکر کند به‌طور قابل توجهی در زمینه‌های ریاضیات پیشرفته، استدلال پیچیده، کدهای دشوار، پیروی از دستورالعمل‌ها و کیفیت تولید متن بهبود یافته است."
},
"hunyuan-t1-vision": {
"description": "مدل تفکر عمیق چندرسانه‌ای Hunyuan که از زنجیره تفکر بلند بومی چندرسانه‌ای پشتیبانی می‌کند، در پردازش انواع سناریوهای استدلال تصویری مهارت دارد و در مسائل علمی نسبت به مدل تفکر سریع بهبود قابل توجهی دارد."
@@ -1730,8 +1844,11 @@
"imagen-4.0-ultra-generate-preview-06-06": {
"description": "نسخه اولترا سری مدل متن به تصویر نسل چهارم Imagen"
},
"imagen4/preview": {
"description": "مدل تولید تصویر با کیفیت بالا ارائه شده توسط گوگل."
"inception/mercury-coder-small": {
"description": "Mercury Coder Small انتخاب ایده‌آل برای تولید، اشکال‌زدایی و بازسازی کد با کمترین تأخیر است."
},
"inclusionAI/Ling-mini-2.0": {
"description": "Ling-mini-2.0 یک مدل زبان بزرگ کوچک‌حجم و با عملکرد بالا مبتنی بر معماری MoE است. این مدل دارای ۱۶ میلیارد پارامتر کل است، اما برای هر توکن تنها ۱.۴ میلیارد پارامتر فعال (بدون در نظر گرفتن تعبیه ۷۸۹ میلیون) فعال می‌شود، که منجر به سرعت تولید بسیار بالا می‌شود. به لطف طراحی کارآمد MoE و داده‌های آموزشی بزرگ و با کیفیت، با وجود پارامترهای فعال تنها ۱.۴ میلیارد، Ling-mini-2.0 در وظایف پایین‌دستی عملکردی در حد مدل‌های LLM متراکم زیر ۱۰ میلیارد و مدل‌های MoE بزرگ‌تر ارائه می‌دهد."
},
"internlm/internlm2_5-7b-chat": {
"description": "InternLM2.5 راه‌حل‌های گفتگوی هوشمند در چندین سناریو ارائه می‌دهد."
@@ -1766,6 +1883,9 @@
"kimi-k2-0711-preview": {
"description": "kimi-k2 یک مدل پایه با معماری MoE است که دارای توانایی‌های بسیار قوی در کدنویسی و عامل‌سازی است، با مجموع یک تریلیون پارامتر و 32 میلیارد پارامتر فعال. در تست‌های معیار عملکرد در حوزه‌های دانش عمومی، برنامه‌نویسی، ریاضیات و عامل‌ها، مدل K2 عملکردی فراتر از سایر مدل‌های متن‌باز اصلی دارد."
},
"kimi-k2-0905-preview": {
"description": "مدل پیش‌نمایش kimi-k2-0905 دارای طول متن ۲۵۶ هزار توکنی است و توانایی‌های قوی‌تری در برنامه‌نویسی عامل‌محور، زیبایی و کاربردی بودن کدهای فرانت‌اند و درک بهتر متن دارد."
},
"kimi-k2-turbo-preview": {
"description": "kimi-k2 یک مدل پایه با معماری MoE است که دارای توانمندی‌های بسیار قوی در حوزهٔ برنامه‌نویسی و عامل‌ها (Agent) می‌باشد. مجموع پارامترها 1T و پارامترهای فعال‌شده 32B است. در آزمون‌های بنچمارک در دسته‌های اصلی مانند استدلال دانش عمومی، برنامه‌نویسی، ریاضیات و Agent، عملکرد مدل K2 از سایر مدل‌های متن‌باز مرسوم پیشی گرفته است."
},
@@ -2003,30 +2123,63 @@
"meta/Meta-Llama-3.1-8B-Instruct": {
"description": "مدل متنی تنظیم شده برای دستورالعمل Llama 3.1 که برای موارد استفاده گفتگوهای چندزبانه بهینه شده و در بسیاری از مدل‌های چت متن‌باز و بسته موجود، در معیارهای صنعتی رایج عملکرد برجسته‌ای دارد."
},
"meta/llama-3-70b": {
"description": "مدل متن‌باز 70 میلیارد پارامتری که توسط Meta برای پیروی از دستورالعمل‌ها به دقت تنظیم شده است. توسط Groq با استفاده از سخت‌افزار واحد پردازش زبان سفارشی (LPU) ارائه می‌شود تا استدلال سریع و کارآمد فراهم کند."
},
"meta/llama-3-8b": {
"description": "مدل متن‌باز 8 میلیارد پارامتری که توسط Meta برای پیروی از دستورالعمل‌ها به دقت تنظیم شده است. توسط Groq با استفاده از سخت‌افزار واحد پردازش زبان سفارشی (LPU) ارائه می‌شود تا استدلال سریع و کارآمد فراهم کند."
},
"meta/llama-3.1-405b-instruct": {
"description": "مدل LLM پیشرفته که از تولید داده‌های ترکیبی، تقطیر دانش و استدلال پشتیبانی می‌کند و برای ربات‌های چت، برنامه‌نویسی و وظایف خاص مناسب است."
},
"meta/llama-3.1-70b": {
"description": "نسخه به‌روزشده Meta Llama 3 70B Instruct با طول زمینه 128K گسترش یافته، چندزبانه و توان استدلال بهبود یافته."
},
"meta/llama-3.1-70b-instruct": {
"description": "توانمندسازی گفتگوهای پیچیده با درک زمینه‌ای عالی، توانایی استدلال و قابلیت تولید متن."
},
"meta/llama-3.1-8b": {
"description": "Llama 3.1 8B از پنجره زمینه 128K پشتیبانی می‌کند که آن را برای رابط‌های گفتگوی بلادرنگ و تحلیل داده ایده‌آل می‌سازد و در عین حال صرفه‌جویی قابل توجهی در هزینه نسبت به مدل‌های بزرگ‌تر ارائه می‌دهد. توسط Groq با استفاده از سخت‌افزار واحد پردازش زبان سفارشی (LPU) ارائه می‌شود تا استدلال سریع و کارآمد فراهم کند."
},
"meta/llama-3.1-8b-instruct": {
"description": "مدل پیشرفته و پیشرفته که دارای درک زبان، توانایی استدلال عالی و قابلیت تولید متن است."
},
"meta/llama-3.2-11b": {
"description": "مدل تولید استدلال تصویری تنظیم شده با دستورالعمل (ورودی متن + تصویر / خروجی متن) که برای شناسایی بصری، استدلال تصویری، تولید عنوان و پاسخ به سوالات عمومی درباره تصاویر بهینه شده است."
},
"meta/llama-3.2-11b-vision-instruct": {
"description": "مدل بینایی-زبان پیشرفته که در استدلال با کیفیت بالا از تصاویر مهارت دارد."
},
"meta/llama-3.2-1b": {
"description": "مدل فقط متنی که از موارد استفاده روی دستگاه مانند بازیابی دانش محلی چندزبانه، خلاصه‌سازی و بازنویسی پشتیبانی می‌کند."
},
"meta/llama-3.2-1b-instruct": {
"description": "مدل زبان کوچک پیشرفته و پیشرفته که دارای درک زبان، توانایی استدلال عالی و قابلیت تولید متن است."
},
"meta/llama-3.2-3b": {
"description": "مدل فقط متنی که به دقت برای پشتیبانی از موارد استفاده روی دستگاه مانند بازیابی دانش محلی چندزبانه، خلاصه‌سازی و بازنویسی تنظیم شده است."
},
"meta/llama-3.2-3b-instruct": {
"description": "مدل زبان کوچک پیشرفته و پیشرفته که دارای درک زبان، توانایی استدلال عالی و قابلیت تولید متن است."
},
"meta/llama-3.2-90b": {
"description": "مدل تولید استدلال تصویری تنظیم شده با دستورالعمل (ورودی متن + تصویر / خروجی متن) که برای شناسایی بصری، استدلال تصویری، تولید عنوان و پاسخ به سوالات عمومی درباره تصاویر بهینه شده است."
},
"meta/llama-3.2-90b-vision-instruct": {
"description": "مدل بینایی-زبان پیشرفته که در استدلال با کیفیت بالا از تصاویر مهارت دارد."
},
"meta/llama-3.3-70b": {
"description": "ترکیب کامل عملکرد و کارایی. این مدل از گفتگوی هوش مصنوعی با عملکرد بالا پشتیبانی می‌کند و برای ایجاد محتوا، برنامه‌های شرکتی و پژوهش طراحی شده است و توانایی‌های پیشرفته درک زبان از جمله خلاصه‌سازی متن، دسته‌بندی، تحلیل احساسات و تولید کد را ارائه می‌دهد."
},
"meta/llama-3.3-70b-instruct": {
"description": "مدل LLM پیشرفته که در استدلال، ریاضیات، دانش عمومی و فراخوانی توابع مهارت دارد."
},
"meta/llama-4-maverick": {
"description": "مجموعه مدل‌های Llama 4 مدل‌های هوش مصنوعی چندرسانه‌ای بومی هستند که از تجربه‌های متنی و چندرسانه‌ای پشتیبانی می‌کنند. این مدل‌ها با استفاده از معماری متخصص ترکیبی عملکرد پیشرو در صنعت در درک متن و تصویر ارائه می‌دهند. Llama 4 Maverick، مدلی با 17 میلیارد پارامتر و 128 متخصص است. توسط DeepInfra ارائه می‌شود."
},
"meta/llama-4-scout": {
"description": "مجموعه مدل‌های Llama 4 مدل‌های هوش مصنوعی چندرسانه‌ای بومی هستند که از تجربه‌های متنی و چندرسانه‌ای پشتیبانی می‌کنند. این مدل‌ها با استفاده از معماری متخصص ترکیبی عملکرد پیشرو در صنعت در درک متن و تصویر ارائه می‌دهند. Llama 4 Scout، مدلی با 17 میلیارد پارامتر و 16 متخصص است. توسط DeepInfra ارائه می‌شود."
},
"microsoft/Phi-3-medium-128k-instruct": {
"description": "همان مدل Phi-3-medium با اندازه زمینه بزرگ‌تر، مناسب برای RAG یا تعداد کمی از پرامپت‌ها."
},
@@ -2102,6 +2255,48 @@
"mistral-small-latest": {
"description": "Mistral Small یک گزینه مقرون‌به‌صرفه، سریع و قابل‌اعتماد است که برای موارد استفاده‌ای مانند ترجمه، خلاصه‌سازی و تحلیل احساسات مناسب است."
},
"mistral/codestral": {
"description": "Mistral Codestral 25.01 مدل کدنویسی پیشرفته‌ای است که برای موارد استفاده با تأخیر کم و فرکانس بالا بهینه شده است. این مدل به بیش از 80 زبان برنامه‌نویسی مسلط است و در وظایفی مانند پر کردن میانی (FIM)، اصلاح کد و تولید تست عملکرد برجسته‌ای دارد."
},
"mistral/codestral-embed": {
"description": "مدل جاسازی کد که می‌تواند در پایگاه‌های داده و مخازن کد جاسازی شود تا از دستیارهای کدنویسی پشتیبانی کند."
},
"mistral/devstral-small": {
"description": "Devstral یک مدل زبان بزرگ نمایندگی برای وظایف مهندسی نرم‌افزار است که آن را به انتخابی عالی برای نمایندگان مهندسی نرم‌افزار تبدیل می‌کند."
},
"mistral/magistral-medium": {
"description": "تفکر پیچیده با درک عمیق که استدلال شفاف قابل پیگیری و تأیید را ارائه می‌دهد. این مدل حتی هنگام تغییر زبان در میانه وظیفه، استدلال با وفاداری بالا را در زبان‌های متعدد حفظ می‌کند."
},
"mistral/magistral-small": {
"description": "تفکر پیچیده با درک عمیق که استدلال شفاف قابل پیگیری و تأیید را ارائه می‌دهد. این مدل حتی هنگام تغییر زبان در میانه وظیفه، استدلال با وفاداری بالا را در زبان‌های متعدد حفظ می‌کند."
},
"mistral/ministral-3b": {
"description": "مدلی جمع‌وجور و کارآمد برای وظایف روی دستگاه مانند دستیار هوشمند و تحلیل محلی که عملکرد با تأخیر کم ارائه می‌دهد."
},
"mistral/ministral-8b": {
"description": "مدلی قدرتمندتر با استدلال سریع‌تر و بهینه‌تر از نظر حافظه که برای جریان‌های کاری پیچیده و برنامه‌های لبه‌ای با نیازهای بالا ایده‌آل است."
},
"mistral/mistral-embed": {
"description": "مدل جاسازی متن عمومی برای جستجوی معنایی، تشابه، خوشه‌بندی و جریان‌های کاری RAG."
},
"mistral/mistral-large": {
"description": "Mistral Large انتخاب ایده‌آل برای وظایف پیچیده است که نیازمند توان استدلال بزرگ یا تخصص بالا هستند — مانند تولید متن ترکیبی، تولید کد، RAG یا نمایندگی."
},
"mistral/mistral-saba-24b": {
"description": "Mistral Saba 24B مدل متن‌باز 24 میلیارد پارامتری توسعه یافته توسط Mistral.ai است. Saba مدلی تخصصی است که برای عملکرد برجسته در زبان‌های عربی، فارسی، اردو، عبری و زبان‌های هندی آموزش دیده است. توسط Groq با استفاده از سخت‌افزار واحد پردازش زبان سفارشی (LPU) ارائه می‌شود تا استدلال سریع و کارآمد فراهم کند."
},
"mistral/mistral-small": {
"description": "Mistral Small انتخاب ایده‌آل برای وظایف ساده‌ای است که می‌توانند به صورت دسته‌ای انجام شوند — مانند دسته‌بندی، پشتیبانی مشتری یا تولید متن. این مدل عملکرد عالی را با قیمت مقرون‌به‌صرفه ارائه می‌دهد."
},
"mistral/mixtral-8x22b-instruct": {
"description": "مدل 8x22b Instruct. 8x22b مدل متن‌باز متخصص ترکیبی است که توسط Mistral ارائه می‌شود."
},
"mistral/pixtral-12b": {
"description": "مدل 12 میلیارد پارامتری با توانایی درک تصویر و متن."
},
"mistral/pixtral-large": {
"description": "Pixtral Large دومین مدل خانواده چندرسانه‌ای ما است که سطح پیشرفته‌ای از درک تصویر را نشان می‌دهد. به طور خاص، این مدل قادر به درک اسناد، نمودارها و تصاویر طبیعی است و در عین حال توانایی پیشرو در درک متن مدل Mistral Large 2 را حفظ می‌کند."
},
"mistralai/Mistral-7B-Instruct-v0.1": {
"description": "Mistral (7B) Instruct به دلیل عملکرد بالا شناخته شده است و برای وظایف مختلف زبانی مناسب است."
},
@@ -2165,8 +2360,23 @@
"moonshotai/Kimi-K2-Instruct": {
"description": "Kimi K2 یک مدل پایه با معماری MoE است که دارای توانایی‌های بسیار قوی در کدنویسی و عامل است، با 1 تریلیون پارامتر کل و 32 میلیارد پارامتر فعال. در آزمون‌های معیار عملکرد در حوزه‌های دانش عمومی، برنامه‌نویسی، ریاضیات و عامل، مدل K2 عملکردی فراتر از سایر مدل‌های متن‌باز اصلی دارد."
},
"moonshotai/kimi-k2-instruct": {
"description": "kimi-k2 یک مدل پایه با معماری MoE است که دارای توانایی‌های بسیار قوی در کدنویسی و عامل‌ها می‌باشد، با مجموع پارامتر ۱ تریلیون و پارامترهای فعال ۳۲ میلیارد. در آزمون‌های معیار عملکرد در دسته‌های اصلی مانند استدلال دانش عمومی، برنامه‌نویسی، ریاضیات و عامل‌ها، مدل K2 عملکردی فراتر از سایر مدل‌های متن‌باز رایج دارد."
"moonshotai/Kimi-K2-Instruct-0905": {
"description": "Kimi K2-Instruct-0905 جدیدترین و قدرتمندترین نسخه Kimi K2 است. این مدل یک مدل زبان برتر با معماری متخصص ترکیبی (MoE) است که دارای ۱ تریلیون پارامتر کل و ۳۲ میلیارد پارامتر فعال می‌باشد. ویژگی‌های اصلی این مدل شامل: هوش کدگذاری عامل بهبود یافته که در آزمون‌های معیار عمومی و وظایف واقعی کدگذاری عامل عملکرد قابل توجهی نشان می‌دهد؛ تجربه کدگذاری فرانت‌اند بهبود یافته که از نظر زیبایی و کاربردی بودن برنامه‌نویسی فرانت‌اند پیشرفت داشته است."
},
"moonshotai/kimi-k2": {
"description": "Kimi K2 مدل زبان بزرگ متخصص ترکیبی (MoE) با مقیاس بزرگ توسعه یافته توسط Moonshot AI است که دارای 1 تریلیون پارامتر کل و 32 میلیارد پارامتر فعال در هر عبور جلو است. این مدل برای توانایی نمایندگی بهینه شده است، از جمله استفاده پیشرفته از ابزارها، استدلال و ترکیب کد."
},
"moonshotai/kimi-k2-0905": {
"description": "مدل پیش‌نمایش kimi-k2-0905 دارای طول متن ۲۵۶ هزار توکنی است و توانایی‌های قوی‌تری در برنامه‌نویسی عامل‌محور، زیبایی و کاربردی بودن کدهای فرانت‌اند و درک بهتر متن دارد."
},
"moonshotai/kimi-k2-instruct-0905": {
"description": "مدل پیش‌نمایش kimi-k2-0905 دارای طول متن ۲۵۶ هزار توکنی است و توانایی‌های قوی‌تری در برنامه‌نویسی عامل‌محور، زیبایی و کاربردی بودن کدهای فرانت‌اند و درک بهتر متن دارد."
},
"morph/morph-v3-fast": {
"description": "Morph مدل هوش مصنوعی تخصصی است که تغییرات کد پیشنهادی مدل‌های پیشرفته مانند Claude یا GPT-4o را به فایل‌های کد موجود شما به سرعت اعمال می‌کند — بیش از 4500 توکن در ثانیه. این مدل به عنوان مرحله نهایی در جریان کاری کدنویسی هوش مصنوعی عمل می‌کند و از ورودی و خروجی 16k توکن پشتیبانی می‌کند."
},
"morph/morph-v3-large": {
"description": "Morph مدل هوش مصنوعی تخصصی است که تغییرات کد پیشنهادی مدل‌های پیشرفته مانند Claude یا GPT-4o را به فایل‌های کد موجود شما با سرعت بیش از 2500 توکن در ثانیه اعمال می‌کند. این مدل به عنوان مرحله نهایی در جریان کاری کدنویسی هوش مصنوعی عمل می‌کند و از ورودی و خروجی 16k توکن پشتیبانی می‌کند."
},
"nousresearch/hermes-2-pro-llama-3-8b": {
"description": "هرمس ۲ پرو لاما ۳ ۸B نسخه ارتقاء یافته Nous Hermes 2 است که شامل جدیدترین مجموعه داده‌های توسعه‌یافته داخلی می‌باشد."
@@ -2195,6 +2405,9 @@
"o3": {
"description": "o3 یک مدل همه‌کاره و قدرتمند است که در چندین حوزه عملکرد عالی دارد. این مدل استاندارد جدیدی برای وظایف ریاضی، علمی، برنامه‌نویسی و استدلال بصری تعیین کرده است. همچنین در نوشتن فنی و پیروی از دستورات نیز مهارت دارد. کاربران می‌توانند از آن برای تحلیل متن، کد و تصاویر و حل مسائل پیچیده چند مرحله‌ای استفاده کنند."
},
"o3-2025-04-16": {
"description": "o3 مدل استدلال جدید OpenAI است که از ورودی تصویر و متن پشتیبانی می‌کند و خروجی متنی ارائه می‌دهد، مناسب برای وظایف پیچیده با دانش عمومی گسترده."
},
"o3-deep-research": {
"description": "o3-deep-research پیشرفته‌ترین مدل تحقیق عمیق ما است که به‌طور خاص برای انجام وظایف تحقیقاتی پیچیده و چندمرحله‌ای طراحی شده است. این مدل می‌تواند از اینترنت جستجو و اطلاعات را ترکیب کند و همچنین از طریق اتصال MCP به داده‌های اختصاصی شما دسترسی پیدا کرده و از آن‌ها بهره‌برداری کند."
},
@@ -2204,9 +2417,15 @@
"o3-pro": {
"description": "مدل o3-pro با استفاده از محاسبات بیشتر، تفکر عمیق‌تری انجام می‌دهد و همواره پاسخ‌های بهتری ارائه می‌کند. فقط در API پاسخ‌ها قابل استفاده است."
},
"o3-pro-2025-06-10": {
"description": "o3 Pro مدل استدلال جدید OpenAI است که از ورودی تصویر و متن پشتیبانی می‌کند و خروجی متنی ارائه می‌دهد، مناسب برای وظایف پیچیده با دانش عمومی گسترده."
},
"o4-mini": {
"description": "o4-mini جدیدترین مدل کوچک از سری o ما است. این مدل به‌طور خاص برای استدلال سریع و مؤثر بهینه‌سازی شده و در وظایف کدنویسی و بصری عملکرد بسیار بالایی دارد."
},
"o4-mini-2025-04-16": {
"description": "o4-mini مدل استدلال OpenAI است که از ورودی تصویر و متن پشتیبانی می‌کند و خروجی متنی ارائه می‌دهد، مناسب برای وظایف پیچیده با دانش عمومی گسترده. این مدل دارای زمینه متنی 200 هزار توکن است."
},
"o4-mini-deep-research": {
"description": "o4-mini-deep-research مدل تحقیق عمیق سریع‌تر و مقرون‌به‌صرفه‌تر ما است که برای انجام وظایف تحقیقاتی پیچیده و چندمرحله‌ای بسیار مناسب است. این مدل می‌تواند از اینترنت جستجو و اطلاعات را ترکیب کند و همچنین از طریق اتصال MCP به داده‌های اختصاصی شما دسترسی پیدا کرده و از آن‌ها بهره‌برداری کند."
},
@@ -2225,29 +2444,47 @@
"open-mixtral-8x7b": {
"description": "Mixtral 8x7B یک مدل متخصص پراکنده است که با استفاده از پارامترهای متعدد سرعت استنتاج را افزایش می‌دهد و برای پردازش وظایف چندزبانه و تولید کد مناسب است."
},
"openai/gpt-3.5-turbo": {
"description": "توانمندترین و مقرون‌به‌صرفه‌ترین مدل در سری GPT-3.5 از OpenAI که برای اهداف مکالمه بهینه شده است، اما در وظایف تکمیل سنتی نیز عملکرد خوبی دارد."
},
"openai/gpt-3.5-turbo-instruct": {
"description": "توانایی مشابه مدل‌های دوره GPT-3. با نقاط انتهایی تکمیل سنتی سازگار است، نه نقاط انتهایی تکمیل مکالمه."
},
"openai/gpt-4-turbo": {
"description": "gpt-4-turbo از OpenAI دانش عمومی گسترده و تخصص حوزه‌ای دارد که آن را قادر می‌سازد دستورالعمل‌های پیچیده زبان طبیعی را دنبال کرده و مسائل دشوار را با دقت حل کند. تاریخ قطع دانش آن آوریل 2023 است و پنجره زمینه آن 128,000 توکن است."
},
"openai/gpt-4.1": {
"description": "GPT-4.1 پرچمدار مدل‌های ما برای وظایف پیچیده است. این مدل برای حل مسائل بین‌رشته‌ای بسیار مناسب است."
"description": "GPT 4.1 مدل پرچمدار OpenAI برای وظایف پیچیده است. این مدل برای حل مسائل چندرشته‌ای بسیار مناسب است."
},
"openai/gpt-4.1-mini": {
"description": "GPT-4.1 mini تعادلی بین هوش، سرعت و هزینه ارائه می‌دهد و آن را به مدلی جذاب در بسیاری از موارد استفاده تبدیل می‌کند."
"description": "GPT 4.1 mini تعادل بین هوشمندی، سرعت و هزینه را برقرار می‌کند و آن را به مدلی جذاب برای بسیاری از موارد استفاده تبدیل می‌کند."
},
"openai/gpt-4.1-nano": {
"description": "GPT-4.1 nano سریع‌ترین و مقرون به صرفه‌ترین مدل GPT-4.1 است."
"description": "GPT-4.1 nano سریع‌ترین و مقرونبهصرفه‌ترین مدل GPT 4.1 است."
},
"openai/gpt-4o": {
"description": "ChatGPT-4o یک مدل پویا است که به‌صورت زنده به‌روزرسانی می‌شود تا همیشه نسخه‌ی جدید و به‌روز باشد. این مدل ترکیبی از توانایی‌های قدرتمند درک و تولید زبان را ارائه می‌دهد و برای کاربردهای گسترده مانند خدمات مشتری، آموزش و پشتیبانی فنی مناسب است."
"description": "GPT-4o از OpenAI دانش عمومی گسترده و تخصص حوزه‌ای دارد که آن را قادر می‌سازد دستورالعمل‌های پیچیده زبان طبیعی را دنبال کرده و مسائل دشوار را با دقت حل کند. این مدل عملکرد GPT-4 Turbo را با API سریع‌تر و ارزان‌تر ارائه می‌دهد."
},
"openai/gpt-4o-mini": {
"description": "GPT-4o mini جدیدترین مدل OpenAI است که پس از GPT-4 Omni عرضه شده و از ورودی‌های تصویری و متنی پشتیبانی می‌کند و خروجی متنی ارائه می‌دهد. به عنوان پیشرفته‌ترین مدل کوچک آن‌ها، این مدل بسیار ارزان‌تر از سایر مدل‌های پیشرفته اخیر است و بیش از ۶۰٪ ارزان‌تر از GPT-3.5 Turbo می‌باشد. این مدل هوشمندی پیشرفته را حفظ کرده و در عین حال از نظر اقتصادی بسیار مقرون به صرفه است. GPT-4o mini در آزمون MMLU امتیاز ۸۲٪ را کسب کرده و در حال حاضر در ترجیحات چت بالاتر از GPT-4 رتبه‌بندی شده است."
"description": "GPT-4o mini از OpenAI کوچک‌ترین مدل پیشرفته و مقرون‌به‌صرفه آن‌ها است. این مدل چندرسانه‌ای است (ورودی متن یا تصویر را می‌پذیرد و خروجی متن ارائه می‌دهد) و هوشمندتر از gpt-3.5-turbo است، اما سرعت مشابهی دارد."
},
"openai/gpt-5": {
"description": "GPT-5 مدل زبان پرچمدار OpenAI است که در استدلال پیچیده، دانش گسترده دنیای واقعی، وظایف کدمحور و نمایندگی چندمرحله‌ای عملکرد برجسته‌ای دارد."
},
"openai/gpt-5-mini": {
"description": "GPT-5 mini مدلی بهینه‌شده از نظر هزینه است که در وظایف استدلال/مکالمه عملکرد خوبی دارد. این مدل تعادل بهینه‌ای بین سرعت، هزینه و توانایی ارائه می‌دهد."
},
"openai/gpt-5-nano": {
"description": "GPT-5 nano مدلی با توان عملیاتی بالا است که در وظایف دستورالعمل ساده یا دسته‌بندی عملکرد خوبی دارد."
},
"openai/gpt-oss-120b": {
"description": "OpenAI GPT-OSS 120B یک مدل زبان پیشرفته با 120 میلیارد پارامتر است که دارای قابلیت جستجوی مرورگر و اجرای کد می‌باشد و توانایی استدلال دارد."
"description": "مدل زبان بزرگ عمومی بسیار توانمند با توان استدلال قوی و قابل کنترل."
},
"openai/gpt-oss-20b": {
"description": "OpenAI GPT-OSS 20B یک مدل زبان پیشرفته با 20 میلیارد پارامتر است که دارای قابلیت جستجوی مرورگر و اجرای کد می‌باشد و توانایی استدلال دارد."
"description": "مدل زبان جمع‌وجور با وزن‌های متن‌باز که برای تأخیر کم و محیط‌های محدود منابع بهینه شده است، شامل استقرار محلی و لبه."
},
"openai/o1": {
"description": "o1 مدل استدلال جدید OpenAI است که از ورودی‌های تصویری و متنی پشتیبانی می‌کند و خروجی متنی ارائه می‌دهد، مناسب برای وظایف پیچیده‌ای که نیاز به دانش عمومی گسترده دارند. این مدل دارای زمینه ۲۰۰ هزار توکنی و تاریخ قطع دانش در اکتبر ۲۰۲۳ است."
"description": "o1 از OpenAI مدل استدلال پرچمدار است که برای مسائل پیچیده نیازمند تفکر عمیق طراحی شده است. این مدل توان استدلال قوی و دقت بالاتری برای وظایف چندمرحله‌ای پیچیده ارائه می‌دهد."
},
"openai/o1-mini": {
"description": "o1-mini یک مدل استنتاج سریع و مقرون‌به‌صرفه است که برای برنامه‌نویسی، ریاضیات و کاربردهای علمی طراحی شده است. این مدل دارای ۱۲۸ هزار بایت زمینه و تاریخ قطع دانش تا اکتبر ۲۰۲۳ می‌باشد."
@@ -2256,23 +2493,44 @@
"description": "o1 مدل جدید استنتاج OpenAI است که برای وظایف پیچیده‌ای که به دانش عمومی گسترده نیاز دارند، مناسب است. این مدل دارای 128K زمینه و تاریخ قطع دانش تا اکتبر 2023 است."
},
"openai/o3": {
"description": "o3 یک مدل قدرتمند و چندمنظوره است که در زمینه‌های مختلف عملکرد عالی دارد. این مدل استانداردهای جدیدی را برای وظایف ریاضی، علمی، برنامه‌نویسی و استدلال بصری تعیین کرده است. همچنین در نوشتن فنی و پیروی از دستورالعمل‌ها مهارت دارد. کاربران می‌توانند از آن برای تحلیل متن، کد و تصویر و حل مسائل پیچیده چند مرحله‌ای استفاده کنند."
"description": "o3 از OpenAI قدرتمندترین مدل استدلال است که سطوح پیشرفته جدیدی در کدنویسی، ریاضیات، علوم و درک بصری ایجاد کرده است. این مدل در پرسش‌های پیچیده که نیازمند تحلیل چندجانبه هستند مهارت دارد و در تحلیل تصاویر، نمودارها و گراف‌ها برتری خاصی دارد."
},
"openai/o3-mini": {
"description": "o3-mini هوش بالایی را در همان هزینه و هدف تأخیر o1-mini ارائه می‌دهد."
"description": "o3-mini جدیدترین مدل استدلال کوچک OpenAI است که هوشمندی بالایی را با همان اهداف هزینه و تأخیر o1-mini ارائه می‌دهد."
},
"openai/o3-mini-high": {
"description": "نسخه o3-mini با سطح استدلال بالا، هوش بالایی را در همان هزینه و هدف تأخیر o1-mini ارائه می‌دهد."
},
"openai/o4-mini": {
"description": "o4-mini به‌طور خاص برای استدلال سریع و مؤثر بهینه‌سازی شده و در وظایف کدنویسی و بصری عملکرد بسیار بالایی دارد."
"description": "o4-mini از OpenAI استدلال سریع و مقرون‌به‌صرفه ارائه می‌دهد و در اندازه خود عملکرد برجسته‌ای دارد، به ویژه در ریاضیات (بهترین عملکرد در آزمون AIME)، کدنویسی و وظایف بصری."
},
"openai/o4-mini-high": {
"description": "نسخه با سطح استدلال بالا o4-mini، که به‌طور خاص برای استدلال سریع و مؤثر بهینه‌سازی شده و در وظایف کدنویسی و بصری عملکرد بسیار بالایی دارد."
},
"openai/text-embedding-3-large": {
"description": "توانمندترین مدل جاسازی OpenAI برای وظایف انگلیسی و غیرانگلیسی."
},
"openai/text-embedding-3-small": {
"description": "نسخه بهبود یافته و با عملکرد بالاتر مدل جاسازی ada از OpenAI."
},
"openai/text-embedding-ada-002": {
"description": "مدل جاسازی متن سنتی OpenAI."
},
"openrouter/auto": {
"description": "با توجه به طول متن، موضوع و پیچیدگی، درخواست شما به Llama 3 70B Instruct، Claude 3.5 Sonnet (تنظیم خودکار) یا GPT-4o ارسال خواهد شد."
},
"perplexity/sonar": {
"description": "محصول سبک Perplexity با قابلیت جستجوی مبتنی بر زمینه، سریع‌تر و ارزان‌تر از Sonar Pro."
},
"perplexity/sonar-pro": {
"description": "محصول پرچمدار Perplexity با قابلیت جستجوی مبتنی بر زمینه که از پرسش‌های پیشرفته و عملیات پیگیری پشتیبانی می‌کند."
},
"perplexity/sonar-reasoning": {
"description": "مدلی متمرکز بر استدلال که زنجیره تفکر (CoT) را در پاسخ‌ها ارائه می‌دهد و توضیحات مفصل با جستجوی مبتنی بر زمینه فراهم می‌کند."
},
"perplexity/sonar-reasoning-pro": {
"description": "مدل پیشرفته متمرکز بر استدلال که زنجیره تفکر (CoT) را در پاسخ‌ها ارائه می‌دهد و توضیحات جامع با قابلیت جستجوی پیشرفته و چندین پرس‌وجوی جستجو برای هر درخواست فراهم می‌کند."
},
"phi3": {
"description": "Phi-3 یک مدل سبک و باز از مایکروسافت است که برای یکپارچه‌سازی کارآمد و استدلال دانش در مقیاس بزرگ مناسب است."
},
@@ -2313,7 +2571,7 @@
"description": "Qwen-Image یک مدل عمومی تولید تصویر است که از سبک‌های هنری متنوعی پشتیبانی می‌کند و به‌ویژه در رندر متن‌های پیچیده تبحر دارد، به‌خصوص رندر متن‌های چینی و انگلیسی. این مدل از چینش چندخطی، تولید متن در سطح پاراگراف و بازنمایی جزئیات ریز پشتیبانی می‌کند و قادر است طراحی‌های پیچیده ترکیبی متن و تصویر را تحقق بخشد."
},
"qwen-image-edit": {
"description": "مدل ویرایش تصویر حرفه‌ای منتشرشده توسط تیم Qwen که از ویرایش معنایی و ویرایش ظاهر پشتیبانی می‌کند، قادر به ویرایش دقیق متن‌های چینی و انگلیسی بوده و امکان تبدیل سبک، چرخش اشیاء و دیگر ویرایش‌های تصویری با کیفیت بالا را فراهم می‌آورد."
"description": "Qwen Image Edit یک مدل تصویر به تصویر است که از ویرایش و اصلاح تصویر بر اساس تصویر ورودی و راهنمای متنی پشتیبانی می‌کند و قادر است بر اساس نیازهای کاربر، تصویر اصلی را به دقت تنظیم و به صورت خلاقانه تغییر دهد."
},
"qwen-long": {
"description": "مدل زبانی بسیار بزرگ Tongyi Qianwen که از متن‌های طولانی و همچنین قابلیت مکالمه در چندین سناریو مانند اسناد طولانی و چندین سند پشتیبانی می‌کند."
@@ -2549,6 +2807,15 @@
"qwen3-coder-plus": {
"description": "مدل کد نویسی Tongyi Qianwen. جدیدترین مدل‌های سری Qwen3-Coder بر پایه Qwen3 ساخته شده‌اند و دارای توانایی‌های قدرتمند Coding Agent هستند، در فراخوانی ابزارها و تعامل با محیط مهارت دارند، قادر به برنامه‌نویسی خودکار هستند و در کنار توانایی‌های کدنویسی برجسته، قابلیت‌های عمومی نیز دارند."
},
"qwen3-max-preview": {
"description": "نسخه پیش‌نمایش مدل Max از سری Qwen 3، نسبت به سری 2.5 بهبود قابل توجهی در توانایی‌های عمومی، درک متن‌های چندزبانه چینی و انگلیسی، پیروی از دستورات پیچیده، انجام وظایف باز و ذهنی، پشتیبانی چندزبانه و فراخوانی ابزارها دارد؛ همچنین خطاهای دانش مدل کاهش یافته است."
},
"qwen3-next-80b-a3b-instruct": {
"description": "مدل متن‌باز نسل جدید بدون حالت تفکر مبتنی بر Qwen3، که نسبت به نسخه قبلی (Tongyi Qianwen 3-235B-A22B-Instruct-2507) در درک متن‌های چینی بهتر است، توانایی استدلال منطقی بهبود یافته و عملکرد بهتری در وظایف تولید متن دارد."
},
"qwen3-next-80b-a3b-thinking": {
"description": "مدل متن‌باز نسل جدید با حالت تفکر مبتنی بر Qwen3، که نسبت به نسخه قبلی (Tongyi Qianwen 3-235B-A22B-Thinking-2507) در پیروی از دستورات پیشرفت داشته و پاسخ‌های مدل خلاصه‌تر شده‌اند."
},
"qwq": {
"description": "QwQ یک مدل تحقیقاتی تجربی است که بر بهبود توانایی استدلال AI تمرکز دارد."
},
@@ -2729,6 +2996,12 @@
"v0-1.5-md": {
"description": "مدل v0-1.5-md برای وظایف روزمره و تولید رابط کاربری (UI) مناسب است"
},
"vercel/v0-1.0-md": {
"description": "دسترسی به مدل پشت v0 برای تولید، رفع اشکال و بهینه‌سازی برنامه‌های وب مدرن با استدلال چارچوب خاص و دانش به‌روز."
},
"vercel/v0-1.5-md": {
"description": "دسترسی به مدل پشت v0 برای تولید، رفع اشکال و بهینه‌سازی برنامه‌های وب مدرن با استدلال چارچوب خاص و دانش به‌روز."
},
"wan2.2-t2i-flash": {
"description": "نسخه سریع Wanxiang 2.2، جدیدترین مدل فعلی. در خلاقیت، پایداری و واقع‌گرایی به طور کامل ارتقا یافته، سرعت تولید بالا و نسبت قیمت به کیفیت عالی دارد."
},
@@ -2759,6 +3032,27 @@
"x1": {
"description": "مدل Spark X1 به‌زودی ارتقا خواهد یافت و در زمینه وظایف ریاضی که در کشور پیشرو است، عملکردهای استدلال، تولید متن و درک زبان را با OpenAI o1 و DeepSeek R1 مقایسه خواهد کرد."
},
"xai/grok-2": {
"description": "Grok 2 مدل زبان پیشرفته با توان استدلال پیشرفته است. این مدل در مکالمه، کدنویسی و استدلال توانایی‌های پیشرفته دارد و در رتبه‌بندی LMSYS بالاتر از Claude 3.5 Sonnet و GPT-4-Turbo قرار دارد."
},
"xai/grok-2-vision": {
"description": "مدل بصری Grok 2 در وظایف مبتنی بر دید عملکرد برجسته‌ای دارد و در استدلال ریاضی بصری (MathVista) و پرسش و پاسخ مبتنی بر سند (DocVQA) عملکرد پیشرفته ارائه می‌دهد. این مدل قادر به پردازش انواع اطلاعات بصری از جمله اسناد، نمودارها، جداول، اسکرین‌شات‌ها و عکس‌ها است."
},
"xai/grok-3": {
"description": "مدل پرچمدار xAI که در موارد استفاده شرکتی مانند استخراج داده، کدنویسی و خلاصه‌سازی متن عملکرد برجسته‌ای دارد. دارای دانش عمیق حوزه در مالی، مراقبت‌های بهداشتی، حقوقی و علوم است."
},
"xai/grok-3-fast": {
"description": "مدل پرچمدار xAI که در موارد استفاده شرکتی مانند استخراج داده، کدنویسی و خلاصه‌سازی متن عملکرد برجسته‌ای دارد. نسخه سریع‌تر مدل روی زیرساخت سریع‌تر ارائه می‌شود و زمان پاسخ بسیار کوتاه‌تری دارد. افزایش سرعت با هزینه بالاتر به ازای هر توکن خروجی همراه است."
},
"xai/grok-3-mini": {
"description": "مدل سبک وزن xAI که قبل از پاسخ دادن تفکر می‌کند. برای وظایف ساده یا مبتنی بر منطق که نیاز به دانش عمیق حوزه ندارند بسیار مناسب است. مسیر تفکر خام قابل دسترسی است."
},
"xai/grok-3-mini-fast": {
"description": "مدل سبک وزن xAI که قبل از پاسخ دادن تفکر می‌کند. برای وظایف ساده یا مبتنی بر منطق که نیاز به دانش عمیق حوزه ندارند بسیار مناسب است. مسیر تفکر خام قابل دسترسی است. نسخه سریع‌تر مدل روی زیرساخت سریع‌تر ارائه می‌شود و زمان پاسخ بسیار کوتاه‌تری دارد. افزایش سرعت با هزینه بالاتر به ازای هر توکن خروجی همراه است."
},
"xai/grok-4": {
"description": "جدیدترین و بزرگ‌ترین مدل پرچمدار xAI که عملکرد بی‌نظیری در زبان طبیعی، ریاضیات و استدلال ارائه می‌دهد — انتخابی کامل و همه‌کاره."
},
"yi-1.5-34b-chat": {
"description": "Yi-1.5 نسخه‌ی به‌روزرسانی شده‌ی Yi است. این مدل با استفاده از یک مجموعه داده با کیفیت بالا شامل 500 میلیارد توکن برای پیش‌آموزی و 3 میلیون نمونه متنوع برای آموزش ریزی مجدداً آموزش داده شده است."
},
@@ -2806,5 +3100,14 @@
},
"zai-org/GLM-4.5V": {
"description": "GLM-4.5V نسل جدیدی از مدل‌های زبان-بینایی (VLM) است که توسط Zhipu AI (智谱 AI) منتشر شده. این مدل بر پایهٔ مدل متنی پرچم‌دار GLM-4.5-Air ساخته شده که دارای 106 میلیارد پارامتر کل و 12 میلیارد پارامتر فعال‌سازی است؛ از معماری متخصصان ترکیبی (MoE) بهره می‌برد و هدفش ارائهٔ عملکرد برجسته با هزینهٔ استدلال کمتر است. از منظر فناوری، GLM-4.5V راهبرد GLM-4.1V-Thinking را ادامه می‌دهد و نوآوری‌هایی مانند کدگذاری موقعیت چرخشی سه‌بعدی (3D-RoPE) را معرفی کرده که به‌طور چشمگیری درک و استدلال نسبت‌های فضایی سه‌بعدی را تقویت می‌کند. با بهینه‌سازی در مراحل پیش‌آموزش، ریزتنظیم نظارتی و یادگیری تقویتی، این مدل قادر به پردازش انواع محتواهای بصری از جمله تصویر، ویدیو و اسناد بلند شده و در 41 معیار چندوجهی عمومی به سطح برتر مدل‌های متن‌باز هم‌رده دست یافته است. علاوه بر این، یک سوئیچ «حالت تفکر» به مدل افزوده شده که به کاربران اجازه می‌دهد بین پاسخ‌دهی سریع و استدلال عمیق به‌صورت انعطاف‌پذیر انتخاب کنند تا تعادل بین کارایی و کیفیت برقرار شود."
},
"zai/glm-4.5": {
"description": "مجموعه مدل‌های GLM-4.5 مدل‌های پایه طراحی شده برای نمایندگان هوشمند هستند. مدل پرچمدار GLM-4.5 با 355 میلیارد پارامتر کل (32 میلیارد فعال) یکپارچه‌سازی استدلال، کدنویسی و توانایی‌های نمایندگی را برای حل نیازهای پیچیده برنامه‌ها ارائه می‌دهد. به عنوان یک سیستم استدلال ترکیبی، دو حالت عملیاتی دارد."
},
"zai/glm-4.5-air": {
"description": "GLM-4.5 و GLM-4.5-Air مدل‌های پرچمدار جدید ما هستند که به عنوان مدل‌های پایه برای برنامه‌های نمایندگی طراحی شده‌اند. هر دو از معماری متخصص ترکیبی (MoE) بهره می‌برند. GLM-4.5 دارای 355 میلیارد پارامتر کل و 32 میلیارد پارامتر فعال در هر عبور جلو است، در حالی که GLM-4.5-Air طراحی ساده‌تری دارد با 106 میلیارد پارامتر کل و 12 میلیارد پارامتر فعال."
},
"zai/glm-4.5v": {
"description": "GLM-4.5V بر پایه مدل پایه GLM-4.5-Air ساخته شده است، فناوری اثبات شده GLM-4.1V-Thinking را به ارث برده و در عین حال با معماری قدرتمند MoE با 106 میلیارد پارامتر به طور مؤثر مقیاس‌پذیر شده است."
}
}
+6
View File
@@ -38,6 +38,9 @@
"cohere": {
"description": "Cohere جدیدترین مدل‌های چند زبانه، قابلیت‌های پیشرفته جستجو و فضای کاری هوش مصنوعی سفارشی برای کسب‌وکارهای مدرن را به شما ارائه می‌دهد - همه این‌ها در یک پلتفرم امن یکپارچه شده‌اند."
},
"cometapi": {
"description": "CometAPI یک پلتفرم خدماتی است که انواع مختلفی از رابط‌های مدل‌های پیشرفته را ارائه می‌دهد و از OpenAI، Anthropic، Google و سایرین پشتیبانی می‌کند. این پلتفرم برای نیازهای متنوع توسعه و کاربرد مناسب است. کاربران می‌توانند بر اساس نیازهای خود بهترین مدل و قیمت را به‌صورت انعطاف‌پذیر انتخاب کنند و به بهبود تجربه هوش مصنوعی کمک کنند."
},
"deepseek": {
"description": "DeepSeek یک شرکت متمرکز بر تحقیق و کاربرد فناوری هوش مصنوعی است. مدل جدید آن، DeepSeek-V2.5، توانایی‌های مکالمه عمومی و پردازش کد را ترکیب کرده و در زمینه‌هایی مانند هم‌ترازی با ترجیحات انسانی، وظایف نوشتاری و پیروی از دستورات بهبود قابل توجهی داشته است."
},
@@ -158,6 +161,9 @@
"v0": {
"description": "v0 یک دستیار برنامه‌نویسی جفتی است که تنها با توصیف ایده‌ها به زبان طبیعی، می‌تواند کد و رابط کاربری (UI) را برای پروژه شما تولید کند"
},
"vercelaigateway": {
"description": "دروازه هوش مصنوعی Vercel یک API یکپارچه برای دسترسی به بیش از ۱۰۰ مدل ارائه می‌دهد که از طریق یک نقطه انتهایی واحد می‌توان از مدل‌های ارائه‌دهندگان مختلفی مانند OpenAI، Anthropic، Google و غیره استفاده کرد. این سرویس از تنظیم بودجه، نظارت بر استفاده، تعادل بار درخواست‌ها و انتقال خطا پشتیبانی می‌کند."
},
"vertexai": {
"description": "سری Gemini گوگل پیشرفته‌ترین و عمومی‌ترین مدل‌های هوش مصنوعی است که توسط Google DeepMind طراحی شده و به‌طور خاص برای چندرسانه‌ای طراحی شده است و از درک و پردازش بی‌وقفه متن، کد، تصویر، صدا و ویدیو پشتیبانی می‌کند. این مدل‌ها برای محیط‌های مختلف از مراکز داده تا دستگاه‌های همراه مناسب هستند و به‌طور قابل توجهی کارایی و کاربردهای مدل‌های هوش مصنوعی را افزایش می‌دهند."
},
+10 -3
View File
@@ -70,12 +70,15 @@
"input": {
"addAi": "Ajouter un message AI",
"addUser": "Ajouter un message utilisateur",
"disclaimer": "L'IA peut également faire des erreurs, veuillez vérifier les informations importantes",
"errorMsg": "Échec de l'envoi du message, veuillez vérifier votre connexion réseau et réessayer : {{errorMsg}}",
"more": "Plus",
"send": "Envoyer",
"sendWithCmdEnter": "Envoyer avec {{meta}} + Entrée",
"sendWithEnter": "Envoyer avec Entrée",
"sendWithCmdEnter": "Appuyez sur <key/> pour envoyer",
"sendWithEnter": "Appuyez sur <key/> pour envoyer",
"stop": "Arrêter",
"warp": "Saut de ligne"
"warp": "Saut de ligne",
"warpWithKey": "Appuyez sur la touche <key/> pour un retour à la ligne"
},
"intentUnderstanding": {
"title": "En train de comprendre et d'analyser votre intention..."
@@ -232,6 +235,10 @@
"threadMessageCount": "{{messageCount}} messages",
"title": "Sous-sujet"
},
"toggleWideScreen": {
"off": "Désactiver le mode écran large",
"on": "Activer le mode écran large"
},
"tokenDetails": {
"chats": "Messages de discussion",
"historySummary": "Résumé historique",
+62
View File
@@ -0,0 +1,62 @@
{
"actions": {
"expand": {
"off": "Réduire",
"on": "Développer"
},
"typobar": {
"off": "Masquer la barre d'outils de formatage",
"on": "Afficher la barre d'outils de formatage"
}
},
"cancel": "Annuler",
"confirm": "Confirmer",
"file": {
"error": "Erreur : {{message}}",
"uploading": "Téléversement du fichier en cours..."
},
"image": {
"broken": "Image endommagée"
},
"link": {
"edit": "Modifier le lien",
"open": "Ouvrir le lien",
"placeholder": "Entrez l'URL du lien",
"unlink": "Supprimer le lien"
},
"math": {
"placeholder": "Veuillez saisir une formule TeX"
},
"slash": {
"h1": "Titre de niveau 1",
"h2": "Titre de niveau 2",
"h3": "Titre de niveau 3",
"hr": "Ligne de séparation",
"table": "Tableau",
"tex": "Formule TeX"
},
"table": {
"delete": "Supprimer le tableau",
"deleteColumn": "Supprimer la colonne",
"deleteRow": "Supprimer la ligne",
"insertColumnLeft": "Insérer {{count}} colonne(s) à gauche",
"insertColumnRight": "Insérer {{count}} colonne(s) à droite",
"insertRowAbove": "Insérer {{count}} ligne(s) au-dessus",
"insertRowBelow": "Insérer {{count}} ligne(s) en dessous"
},
"typobar": {
"blockquote": "Citation",
"bold": "Gras",
"bulletList": "Liste à puces",
"code": "Code en ligne",
"codeblock": "Bloc de code",
"italic": "Italique",
"link": "Lien",
"numberList": "Liste numérotée",
"strikethrough": "Barré",
"table": "tableau",
"taskList": "Liste des tâches",
"tex": "Formule TeX",
"underline": "Souligné"
}
}
+3
View File
@@ -5,6 +5,9 @@
"lock": "Verrouiller le rapport hauteur/largeur",
"unlock": "Déverrouiller le rapport hauteur/largeur"
},
"cfg": {
"label": "Intensité de guidage"
},
"header": {
"desc": "Description simple, création immédiate",
"title": "Peinture"
+355 -52
View File
@@ -53,6 +53,9 @@
"Baichuan4-Turbo": {
"description": "Le modèle le plus performant en Chine, surpassant les modèles dominants étrangers dans les tâches en chinois telles que les encyclopédies, les longs textes et la création. Il possède également des capacités multimodales de pointe, avec d'excellentes performances dans plusieurs évaluations de référence."
},
"ByteDance-Seed/Seed-OSS-36B-Instruct": {
"description": "Seed-OSS est une série de grands modèles de langage open source développée par l'équipe Seed de ByteDance, conçue pour une gestion puissante des contextes longs, le raisonnement, les agents intelligents et les capacités générales. Le modèle Seed-OSS-36B-Instruct de cette série est un modèle affiné par instruction avec 36 milliards de paramètres, prenant en charge nativement des contextes ultra-longs, ce qui lui permet de traiter en une seule fois d'énormes documents ou des bases de code complexes. Ce modèle est spécialement optimisé pour le raisonnement, la génération de code et les tâches d'agents (comme l'utilisation d'outils), tout en maintenant un équilibre et une excellente capacité générale. Une caractéristique majeure de ce modèle est la fonction « budget de réflexion » (Thinking Budget), qui permet aux utilisateurs d'ajuster de manière flexible la longueur du raisonnement selon leurs besoins, améliorant ainsi efficacement l'efficacité du raisonnement en application pratique."
},
"DeepSeek-R1": {
"description": "LLM efficace à la pointe de la technologie, spécialisé dans le raisonnement, les mathématiques et la programmation."
},
@@ -81,7 +84,13 @@
"description": "Fournisseur du modèle : plateforme sophnet. DeepSeek V3 Fast est la version ultra-rapide à TPS élevé de DeepSeek V3 0324, entièrement non quantifiée, avec des capacités de code et mathématiques renforcées, offrant une réactivité accrue !"
},
"DeepSeek-V3.1": {
"description": "DeepSeek-V3.1 est un nouveau modèle d'inférence hybride lancé par DeepSeek, prenant en charge deux modes d'inférence : réfléchi et non réfléchi, avec une efficacité de réflexion supérieure à celle de DeepSeek-R1-0528. Optimisé par post-entraînement, l'utilisation des outils Agent et les performances des tâches des agents ont été grandement améliorées."
"description": "DeepSeek-V3.1 - mode sans réflexion ; DeepSeek-V3.1 est un nouveau modèle de raisonnement hybride lancé par DeepSeek, supportant deux modes de raisonnement : avec et sans réflexion, avec une efficacité de réflexion supérieure à celle de DeepSeek-R1-0528. Optimisé par post-entraînement, l'utilisation des outils Agent et les performances dans les tâches d'agents ont été grandement améliorées."
},
"DeepSeek-V3.1-Fast": {
"description": "DeepSeek V3.1 Fast est la version ultra-rapide à TPS élevé de DeepSeek V3.1. Mode de réflexion hybride : en modifiant le modèle de conversation, un seul modèle peut supporter à la fois les modes avec et sans réflexion. Appel d'outils plus intelligent : grâce à l'optimisation post-entraînement, les performances du modèle dans l'utilisation des outils et les tâches d'agents sont significativement améliorées."
},
"DeepSeek-V3.1-Think": {
"description": "DeepSeek-V3.1 - mode réflexion ; DeepSeek-V3.1 est un nouveau modèle de raisonnement hybride lancé par DeepSeek, supportant deux modes de raisonnement : avec et sans réflexion, avec une efficacité de réflexion supérieure à celle de DeepSeek-R1-0528. Optimisé par post-entraînement, l'utilisation des outils Agent et les performances dans les tâches d'agents ont été grandement améliorées."
},
"Doubao-lite-128k": {
"description": "Doubao-lite offre une vitesse de réponse exceptionnelle et un excellent rapport qualité-prix, offrant aux clients une flexibilité accrue pour différents scénarios. Prend en charge l'inférence et le fine-tuning avec une fenêtre contextuelle de 128k."
@@ -281,6 +290,9 @@
"Pro/moonshotai/Kimi-K2-Instruct": {
"description": "Kimi K2 est un modèle de base à architecture MoE doté de capacités exceptionnelles en codage et agents, avec 1 000 milliards de paramètres au total et 32 milliards activés. Il surpasse les autres modèles open source majeurs dans les tests de performance sur les connaissances générales, la programmation, les mathématiques et les agents."
},
"Pro/moonshotai/Kimi-K2-Instruct-0905": {
"description": "Kimi K2-Instruct-0905 est la version la plus récente et la plus puissante de Kimi K2. Il s'agit d'un modèle linguistique de pointe à experts mixtes (MoE), avec un total de 1 000 milliards de paramètres et 32 milliards de paramètres activés. Les principales caractéristiques de ce modèle incluent : une intelligence de codage d'agents améliorée, démontrant des performances significatives dans les tests de référence publics et les tâches réelles d'agents de codage ; une expérience de codage frontale améliorée, avec des progrès tant en esthétique qu'en praticité pour la programmation frontale."
},
"QwQ-32B-Preview": {
"description": "QwQ-32B-Preview est un modèle de traitement du langage naturel innovant, capable de gérer efficacement des tâches complexes de génération de dialogues et de compréhension contextuelle."
},
@@ -590,6 +602,33 @@
"ai21-labs/AI21-Jamba-1.5-Mini": {
"description": "Un modèle multilingue de 52 milliards de paramètres (12 milliards actifs), offrant une fenêtre contextuelle longue de 256K, des appels de fonctions, une sortie structurée et une génération factuelle."
},
"alibaba/qwen-3-14b": {
"description": "Qwen3 est la dernière génération de grands modèles de langage de la série Qwen, offrant un ensemble complet de modèles experts denses et hybrides (MoE). Basé sur un entraînement étendu, Qwen3 réalise des avancées majeures en matière de raisonnement, de suivi des instructions, de capacités d'agent et de support multilingue."
},
"alibaba/qwen-3-235b": {
"description": "Qwen3 est la dernière génération de grands modèles de langage de la série Qwen, offrant un ensemble complet de modèles experts denses et hybrides (MoE). Basé sur un entraînement étendu, Qwen3 réalise des avancées majeures en matière de raisonnement, de suivi des instructions, de capacités d'agent et de support multilingue."
},
"alibaba/qwen-3-30b": {
"description": "Qwen3 est la dernière génération de grands modèles de langage de la série Qwen, offrant un ensemble complet de modèles experts denses et hybrides (MoE). Basé sur un entraînement étendu, Qwen3 réalise des avancées majeures en matière de raisonnement, de suivi des instructions, de capacités d'agent et de support multilingue."
},
"alibaba/qwen-3-32b": {
"description": "Qwen3 est la dernière génération de grands modèles de langage de la série Qwen, offrant un ensemble complet de modèles experts denses et hybrides (MoE). Basé sur un entraînement étendu, Qwen3 réalise des avancées majeures en matière de raisonnement, de suivi des instructions, de capacités d'agent et de support multilingue."
},
"alibaba/qwen3-coder": {
"description": "Qwen3-Coder-480B-A35B-Instruct est le modèle de code le plus agentif de Qwen, avec des performances remarquables en codage agent, utilisation d'agents navigateurs et autres tâches de codage fondamentales, atteignant des résultats comparables à Claude Sonnet."
},
"amazon/nova-lite": {
"description": "Un modèle multimodal à très faible coût, traitant les entrées d'images, vidéos et textes à une vitesse extrêmement rapide."
},
"amazon/nova-micro": {
"description": "Un modèle uniquement textuel offrant des réponses à latence minimale à très faible coût."
},
"amazon/nova-pro": {
"description": "Un modèle multimodal très performant, offrant le meilleur compromis entre précision, vitesse et coût, adapté à une large gamme de tâches."
},
"amazon/titan-embed-text-v2": {
"description": "Amazon Titan Text Embeddings V2 est un modèle d'embedding multilingue léger et efficace, supportant des dimensions de 1024, 512 et 256."
},
"anthropic.claude-3-5-sonnet-20240620-v1:0": {
"description": "Claude 3.5 Sonnet élève les normes de l'industrie, surpassant les modèles concurrents et Claude 3 Opus, avec d'excellentes performances dans une large gamme d'évaluations, tout en offrant la vitesse et le coût de nos modèles de niveau intermédiaire."
},
@@ -615,25 +654,28 @@
"description": "Version mise à jour de Claude 2, avec une fenêtre contextuelle doublée, ainsi que des améliorations en fiabilité, taux d'hallucination et précision basée sur des preuves dans des documents longs et des contextes RAG."
},
"anthropic/claude-3-haiku": {
"description": "Claude 3 Haiku est le modèle le plus rapide et le plus compact d'Anthropic, conçu pour offrir des réponses quasi instantanées. Il présente des performances directionnelles rapides et précises."
"description": "Claude 3 Haiku est le modèle le plus rapide d'Anthropic à ce jour, conçu pour les charges de travail d'entreprise impliquant généralement des invites longues. Haiku peut analyser rapidement de nombreux documents, tels que rapports trimestriels, contrats ou dossiers juridiques, à un coût moitié moindre que d'autres modèles de sa catégorie."
},
"anthropic/claude-3-opus": {
"description": "Claude 3 Opus est le modèle le plus puissant d'Anthropic pour traiter des tâches hautement complexes. Il excelle en termes de performance, d'intelligence, de fluidité et de compréhension."
"description": "Claude 3 Opus est le modèle le plus intelligent d'Anthropic, offrant des performances de pointe sur des tâches très complexes. Il maîtrise avec fluidité et compréhension humaine les invites ouvertes et les scénarios inédits."
},
"anthropic/claude-3.5-haiku": {
"description": "Claude 3.5 Haiku est le modèle de nouvelle génération le plus rapide d'Anthropic. Par rapport à Claude 3 Haiku, Claude 3.5 Haiku présente des améliorations dans toutes les compétences et surpasse le plus grand modèle de la génération précédente, Claude 3 Opus, dans de nombreux tests de référence intellectuels."
"description": "Claude 3.5 Haiku est la nouvelle génération de notre modèle le plus rapide. Avec une vitesse comparable à Claude 3 Haiku, il améliore chaque compétence et dépasse dans de nombreux benchmarks intelligents notre plus grand modèle précédent, Claude 3 Opus."
},
"anthropic/claude-3.5-sonnet": {
"description": "Claude 3.5 Sonnet offre des capacités supérieures à celles d'Opus et une vitesse plus rapide que Sonnet, tout en maintenant le même prix que Sonnet. Sonnet excelle particulièrement dans la programmation, la science des données, le traitement visuel et les tâches d'agent."
"description": "Claude 3.5 Sonnet atteint un équilibre idéal entre intelligence et vitesse, particulièrement adapté aux charges de travail d'entreprise. Par rapport à ses pairs, il offre des performances puissantes à moindre coût, conçu pour une haute durabilité dans les déploiements d'IA à grande échelle."
},
"anthropic/claude-3.7-sonnet": {
"description": "Claude 3.7 Sonnet est le modèle le plus intelligent d'Anthropic à ce jour, et le premier modèle de raisonnement hybride sur le marché. Claude 3.7 Sonnet peut produire des réponses quasi instantanées ou un raisonnement prolongé, permettant aux utilisateurs de voir clairement ces processus. Sonnet excelle particulièrement dans la programmation, la science des données, le traitement visuel et les tâches d'agent."
"description": "Claude 3.7 Sonnet est le premier modèle hybride de raisonnement et le plus intelligent d'Anthropic à ce jour. Il offre des performances de pointe en codage, génération de contenu, analyse de données et planification, s'appuyant sur les capacités en ingénierie logicielle et informatique de son prédécesseur Claude 3.5 Sonnet."
},
"anthropic/claude-opus-4": {
"description": "Claude Opus 4 est le modèle le plus puissant d'Anthropic pour traiter des tâches hautement complexes. Il excelle en performance, intelligence, fluidité et compréhension."
"description": "Claude Opus 4 est le modèle le plus puissant d'Anthropic et le meilleur modèle de codage au monde, en tête sur SWE-bench (72,5 %) et Terminal-bench (43,2 %). Il assure des performances durables pour des tâches longues nécessitant concentration et milliers d'étapes, capable de fonctionner plusieurs heures d'affilée, étendant significativement les capacités des agents IA."
},
"anthropic/claude-opus-4.1": {
"description": "Claude Opus 4.1 est une alternative plug-and-play à Opus 4, offrant des performances et une précision exceptionnelles pour les tâches de codage et d'agent. Il porte la performance de codage à 74,5 % sur SWE-bench Verified, traitant les problèmes complexes à plusieurs étapes avec rigueur et souci du détail accrus."
},
"anthropic/claude-sonnet-4": {
"description": "Claude Sonnet 4 peut générer des réponses quasi instantanées ou des réflexions prolongées étape par étape, que l'utilisateur peut suivre clairement. Les utilisateurs de l'API peuvent également contrôler précisément la durée de réflexion du modèle."
"description": "Claude Sonnet 4 améliore significativement les capacités de Sonnet 3.7, excelle en codage avec un score de pointe de 72,7 % sur SWE-bench. Ce modèle équilibre performance et efficacité, adapté aux cas d'usage internes et externes, avec un contrôle accru grâce à une meilleure contrôlabilité."
},
"ascend-tribe/pangu-pro-moe": {
"description": "Pangu-Pro-MoE 72B-A16B est un grand modèle de langage sparse à 72 milliards de paramètres, avec 16 milliards de paramètres activés. Il repose sur une architecture Mixture of Experts groupée (MoGE), qui regroupe les experts lors de la sélection et contraint chaque token à activer un nombre égal d'experts dans chaque groupe, assurant ainsi un équilibre de charge entre les experts et améliorant considérablement l'efficacité de déploiement sur la plateforme Ascend."
@@ -689,6 +731,9 @@
"claude-3-5-haiku-20241022": {
"description": "Claude 3.5 Haiku est le modèle de prochaine génération le plus rapide d'Anthropic. Par rapport à Claude 3 Haiku, Claude 3.5 Haiku a amélioré ses compétences dans tous les domaines et a surpassé le plus grand modèle de la génération précédente, Claude 3 Opus, dans de nombreux tests de référence intellectuels."
},
"claude-3-5-haiku-latest": {
"description": "Claude 3.5 Haiku offre des réponses rapides, idéal pour les tâches légères."
},
"claude-3-5-sonnet-20240620": {
"description": "Claude 3.5 Sonnet offre des capacités dépassant celles d'Opus et une vitesse plus rapide que Sonnet, tout en maintenant le même prix que Sonnet. Sonnet excelle particulièrement dans la programmation, la science des données, le traitement visuel et les tâches d'agent."
},
@@ -698,6 +743,9 @@
"claude-3-7-sonnet-20250219": {
"description": "Claude 3.7 Sonnet élève les normes de l'industrie, surpassant les modèles concurrents et Claude 3 Opus, avec d'excellentes performances dans une large gamme d'évaluations, tout en offrant la vitesse et le coût de nos modèles de niveau intermédiaire."
},
"claude-3-7-sonnet-latest": {
"description": "Claude 3.7 Sonnet est le modèle le plus puissant d'Anthropic pour traiter des tâches très complexes. Il excelle en performance, intelligence, fluidité et compréhension."
},
"claude-3-haiku-20240307": {
"description": "Claude 3 Haiku est le modèle le plus rapide et le plus compact d'Anthropic, conçu pour des réponses quasi instantanées. Il présente des performances directionnelles rapides et précises."
},
@@ -710,11 +758,17 @@
"claude-opus-4-1-20250805": {
"description": "Claude Opus 4.1 est le modèle le plus puissant d'Anthropic pour traiter des tâches hautement complexes. Il se distingue par ses performances, son intelligence, sa fluidité et sa capacité de compréhension exceptionnelles."
},
"claude-opus-4-1-20250805-thinking": {
"description": "Claude Opus 4.1 est un modèle de réflexion capable de démontrer un raisonnement avancé."
},
"claude-opus-4-20250514": {
"description": "Claude Opus 4 est le modèle le plus puissant d'Anthropic pour traiter des tâches hautement complexes. Il excelle en performance, intelligence, fluidité et compréhension."
},
"claude-sonnet-4-20250514": {
"description": "Claude 4 Sonnet peut générer des réponses presque instantanées ou des réflexions prolongées, permettant aux utilisateurs de voir clairement ces processus. Les utilisateurs de l'API peuvent également contrôler avec précision le temps de réflexion du modèle."
"description": "Claude Sonnet 4 peut générer des réponses quasi instantanées ou des réflexions prolongées étape par étape, visibles clairement par l'utilisateur."
},
"claude-sonnet-4-20250514-thinking": {
"description": "Le modèle de réflexion Claude Sonnet 4 produit des réponses quasi instantanées ou des raisonnements prolongés étape par étape, clairement visibles par l'utilisateur."
},
"codegeex-4": {
"description": "CodeGeeX-4 est un puissant assistant de programmation AI, prenant en charge des questions intelligentes et l'achèvement de code dans divers langages de programmation, améliorant l'efficacité du développement."
@@ -773,6 +827,18 @@
"cohere/Cohere-command-r-plus": {
"description": "Command R+ est un modèle optimisé RAG de pointe, conçu pour gérer des charges de travail d'entreprise."
},
"cohere/command-a": {
"description": "Command A est le modèle le plus performant de Cohere à ce jour, excellent dans l'utilisation d'outils, les agents, la génération augmentée par récupération (RAG) et les cas multilingues. Avec une longueur de contexte de 256K, il fonctionne sur seulement deux GPU, offrant un débit 150 % supérieur à Command R+ 08-2024."
},
"cohere/command-r": {
"description": "Command R est un grand modèle de langage optimisé pour les interactions conversationnelles et les tâches à long contexte. Il se positionne dans la catégorie \"scalable\", équilibrant haute performance et forte précision, permettant aux entreprises de dépasser la preuve de concept pour la production."
},
"cohere/command-r-plus": {
"description": "Command R+ est le dernier grand modèle de langage de Cohere, optimisé pour les interactions conversationnelles et les tâches à long contexte. Il vise une performance exceptionnelle, permettant aux entreprises de passer de la preuve de concept à la production."
},
"cohere/embed-v4.0": {
"description": "Un modèle permettant de classifier ou de transformer en embeddings des textes, images ou contenus mixtes."
},
"command": {
"description": "Un modèle de dialogue qui suit des instructions, offrant une haute qualité et une fiabilité accrue dans les tâches linguistiques, avec une longueur de contexte plus longue que notre modèle de génération de base."
},
@@ -809,12 +875,6 @@
"command-r7b-12-2024": {
"description": "command-r7b-12-2024 est une version mise à jour, petite et efficace, publiée en décembre 2024. Il excelle dans les tâches nécessitant un raisonnement complexe et un traitement en plusieurs étapes, comme RAG, l'utilisation d'outils et l'agent."
},
"compound-beta": {
"description": "Compound-beta est un système d'IA composite, soutenu par plusieurs modèles disponibles en open source dans GroqCloud, capable d'utiliser intelligemment et sélectivement des outils pour répondre aux requêtes des utilisateurs."
},
"compound-beta-mini": {
"description": "Compound-beta-mini est un système d'IA composite, soutenu par des modèles disponibles en open source dans GroqCloud, capable d'utiliser intelligemment et sélectivement des outils pour répondre aux requêtes des utilisateurs."
},
"computer-use-preview": {
"description": "Le modèle computer-use-preview est un modèle dédié conçu pour les « outils d'utilisation informatique », entraîné pour comprendre et exécuter des tâches liées à l'informatique."
},
@@ -957,7 +1017,7 @@
"description": "DeepSeek-V3.1 est un grand modèle d'inférence hybride supportant un contexte long de 128K et un changement de mode efficace, offrant des performances et une rapidité exceptionnelles dans l'appel d'outils, la génération de code et les tâches de raisonnement complexes."
},
"deepseek/deepseek-r1": {
"description": "DeepSeek-R1 améliore considérablement les capacités de raisonnement du modèle avec très peu de données annotées. Avant de fournir la réponse finale, le modèle génère d'abord une chaîne de pensée pour améliorer l'exactitude de la réponse finale."
"description": "Le modèle DeepSeek R1 a bénéficié d'une mise à jour mineure, version actuelle DeepSeek-R1-0528. Cette mise à jour améliore significativement la profondeur et la capacité de raisonnement grâce à des ressources de calcul accrues et des optimisations algorithmiques post-entraînement. Il excelle dans plusieurs benchmarks en mathématiques, programmation et logique générale, approchant les performances des modèles leaders comme O3 et Gemini 2.5 Pro."
},
"deepseek/deepseek-r1-0528": {
"description": "DeepSeek-R1 améliore considérablement les capacités de raisonnement du modèle avec très peu de données annotées. Avant de fournir la réponse finale, le modèle génère une chaîne de pensée pour améliorer la précision de la réponse."
@@ -966,7 +1026,7 @@
"description": "DeepSeek-R1 améliore considérablement les capacités de raisonnement du modèle avec très peu de données annotées. Avant de fournir la réponse finale, le modèle génère une chaîne de pensée pour améliorer la précision de la réponse."
},
"deepseek/deepseek-r1-distill-llama-70b": {
"description": "DeepSeek R1 Distill Llama 70B est un modèle de langage de grande taille basé sur Llama3.3 70B, qui utilise le fine-tuning des sorties de DeepSeek R1 pour atteindre des performances compétitives comparables aux grands modèles de pointe."
"description": "DeepSeek-R1-Distill-Llama-70B est une variante distillée et plus efficace du modèle Llama 70B. Il conserve de solides performances en génération de texte tout en réduisant les coûts de calcul pour faciliter le déploiement et la recherche. Il est servi par Groq avec son matériel personnalisé LPU pour un raisonnement rapide et efficace."
},
"deepseek/deepseek-r1-distill-llama-8b": {
"description": "DeepSeek R1 Distill Llama 8B est un modèle de langage distillé basé sur Llama-3.1-8B-Instruct, entraîné en utilisant les sorties de DeepSeek R1."
@@ -984,7 +1044,10 @@
"description": "DeepSeek-R1 améliore considérablement les capacités de raisonnement du modèle avec très peu de données annotées. Avant de fournir la réponse finale, le modèle génère d'abord une chaîne de pensée pour améliorer l'exactitude de la réponse finale."
},
"deepseek/deepseek-v3": {
"description": "DeepSeek-V3 a réalisé une percée majeure en termes de vitesse d'inférence par rapport aux modèles précédents. Il se classe au premier rang des modèles open source et peut rivaliser avec les modèles fermés les plus avancés au monde. DeepSeek-V3 utilise une architecture d'attention multi-tête (MLA) et DeepSeekMoE, qui ont été entièrement validées dans DeepSeek-V2. De plus, DeepSeek-V3 a introduit une stratégie auxiliaire sans perte pour l'équilibrage de charge et a établi des objectifs d'entraînement de prédiction multi-étiquettes pour obtenir de meilleures performances."
"description": "Un grand modèle de langage universel rapide avec des capacités de raisonnement améliorées."
},
"deepseek/deepseek-v3.1-base": {
"description": "DeepSeek V3.1 Base est une version améliorée du modèle DeepSeek V3."
},
"deepseek/deepseek-v3/community": {
"description": "DeepSeek-V3 a réalisé une percée majeure en termes de vitesse d'inférence par rapport aux modèles précédents. Il se classe au premier rang des modèles open source et peut rivaliser avec les modèles fermés les plus avancés au monde. DeepSeek-V3 utilise une architecture d'attention multi-tête (MLA) et DeepSeekMoE, qui ont été entièrement validées dans DeepSeek-V2. De plus, DeepSeek-V3 a introduit une stratégie auxiliaire sans perte pour l'équilibrage de charge et a établi des objectifs d'entraînement de prédiction multi-étiquettes pour obtenir de meilleures performances."
@@ -1055,8 +1118,17 @@
"doubao-seed-1.6-thinking": {
"description": "Le modèle Doubao-Seed-1.6-thinking a une capacité de réflexion considérablement renforcée. Par rapport à Doubao-1.5-thinking-pro, il améliore davantage les compétences fondamentales telles que le codage, les mathématiques et le raisonnement logique, tout en supportant la compréhension visuelle. Il prend en charge une fenêtre contextuelle de 256k et une longueur de sortie maximale de 16k tokens."
},
"doubao-seed-1.6-vision": {
"description": "Doubao-Seed-1.6-vision est un modèle de réflexion profonde visuelle, démontrant une compréhension multimodale générale et des capacités de raisonnement renforcées dans des scénarios tels que l'éducation, la modération d'images, l'inspection, la sécurité et la recherche de questions-réponses AI. Il supporte une fenêtre contextuelle de 256k et une longueur de sortie maximale de 64k tokens."
},
"doubao-seededit-3-0-i2i-250628": {
"description": "Le modèle de génération d'images Doubao, développé par l'équipe Seed de ByteDance, prend en charge les entrées texte et image, offrant une expérience de génération d'images de haute qualité et très contrôlable. Il permet d'éditer des images via des instructions textuelles, avec des dimensions d'image entre 512 et 1536 pixels."
},
"doubao-seedream-3-0-t2i-250415": {
"description": "Le modèle de génération d'images Doubao développé par l'équipe Seed de ByteDance supporte les entrées texte et image, offrant une expérience de génération d'images hautement contrôlable et de haute qualité. Il génère des images à partir d'invites textuelles."
"description": "Le modèle de génération d'images Seedream 3.0, développé par l'équipe Seed de ByteDance, prend en charge les entrées texte et image, offrant une expérience de génération d'images de haute qualité et très contrôlable. Il génère des images à partir d'invites textuelles."
},
"doubao-seedream-4-0-250828": {
"description": "Le modèle de génération d'images Seedream 4.0, développé par l'équipe Seed de ByteDance, prend en charge les entrées texte et image, offrant une expérience de génération d'images de haute qualité et très contrôlable. Il génère des images à partir d'invites textuelles."
},
"doubao-vision-lite-32k": {
"description": "Le modèle Doubao-vision est un grand modèle multimodal développé par Doubao, doté de puissantes capacités de compréhension et de raisonnement d'images, ainsi que d'une compréhension précise des instructions. Il excelle dans l'extraction d'informations texte-image et les tâches de raisonnement basées sur l'image, pouvant être appliqué à des tâches de questions-réponses visuelles plus complexes et étendues."
@@ -1139,6 +1211,33 @@
"ernie-x1-turbo-32k": {
"description": "Par rapport à ERNIE-X1-32K, le modèle offre de meilleures performances et résultats."
},
"fal-ai/bytedance/seedream/v4": {
"description": "Le modèle de génération d'images Seedream 4.0, développé par l'équipe Seed de ByteDance, prend en charge les entrées texte et image, offrant une expérience de génération d'images de haute qualité et très contrôlable. Il génère des images à partir d'invites textuelles."
},
"fal-ai/flux-kontext/dev": {
"description": "Modèle FLUX.1 dédié aux tâches d'édition d'images, prenant en charge les entrées texte et image."
},
"fal-ai/flux-pro/kontext": {
"description": "FLUX.1 Kontext [pro] peut traiter du texte et des images de référence en entrée, permettant des éditions locales ciblées et des transformations complexes de scènes globales de manière fluide."
},
"fal-ai/flux/krea": {
"description": "Flux Krea [dev] est un modèle de génération d'images avec une préférence esthétique, visant à produire des images plus réalistes et naturelles."
},
"fal-ai/flux/schnell": {
"description": "FLUX.1 [schnell] est un modèle de génération d'images de 12 milliards de paramètres, spécialisé dans la génération rapide d'images de haute qualité."
},
"fal-ai/imagen4/preview": {
"description": "Modèle de génération d'images de haute qualité fourni par Google."
},
"fal-ai/nano-banana": {
"description": "Nano Banana est le modèle multimodal natif le plus récent, rapide et efficace de Google, permettant de générer et d'éditer des images par conversation."
},
"fal-ai/qwen-image": {
"description": "Modèle puissant de génération d'images brutes de l'équipe Qwen, avec une capacité impressionnante de génération de texte en chinois et une grande diversité de styles visuels."
},
"fal-ai/qwen-image-edit": {
"description": "Modèle professionnel d'édition d'images publié par l'équipe Qwen, supportant l'édition sémantique et esthétique, capable d'éditer précisément les textes en chinois et en anglais, et réalisant des transformations de style, rotations d'objets et autres éditions d'images de haute qualité."
},
"flux-1-schnell": {
"description": "Modèle de génération d'images à partir de texte de 12 milliards de paramètres développé par Black Forest Labs, utilisant la distillation par diffusion antagoniste latente, capable de générer des images de haute qualité en 1 à 4 étapes. Ses performances rivalisent avec des alternatives propriétaires et il est publié sous licence Apache-2.0, adapté à un usage personnel, scientifique et commercial."
},
@@ -1151,9 +1250,6 @@
"flux-kontext-pro": {
"description": "Génération et édition d'images contextuelles de pointe — alliant texte et image pour des résultats précis et cohérents."
},
"flux-kontext/dev": {
"description": "Modèle FLUX.1 spécialisé dans les tâches d'édition d'images, prenant en charge les entrées texte et image."
},
"flux-merged": {
"description": "Le modèle FLUX.1-merged combine les caractéristiques approfondies explorées durant la phase de développement « DEV » et les avantages d'exécution rapide représentés par « Schnell ». Cette fusion améliore non seulement les performances du modèle mais étend également son champ d'application."
},
@@ -1166,21 +1262,12 @@
"flux-pro-1.1-ultra": {
"description": "Génération d'images IA en ultra haute résolution — prise en charge d'une sortie jusqu'à 4 mégapixels, création d'images ultra-nettes en moins de 10 secondes."
},
"flux-pro/kontext": {
"description": "FLUX.1 Kontext [pro] peut traiter du texte et des images de référence en entrée, réalisant de manière fluide des modifications locales ciblées ainsi que des transformations complexes de scènes globales."
},
"flux-schnell": {
"description": "FLUX.1 [schnell], actuellement le modèle open source le plus avancé à faible nombre d'étapes, dépasse non seulement ses concurrents mais aussi des modèles puissants non affinés tels que Midjourney v6.0 et DALL·E 3 (HD). Ce modèle est spécialement affiné pour conserver toute la diversité de sortie de la phase de pré-entraînement. Par rapport aux modèles les plus avancés du marché, FLUX.1 [schnell] améliore significativement la qualité visuelle, l'adhérence aux instructions, la gestion des dimensions/proportions, le traitement des polices et la diversité des sorties, offrant une expérience de génération d'images créatives plus riche et variée."
},
"flux.1-schnell": {
"description": "Transformateur de flux rectifié de 12 milliards de paramètres capable de générer des images à partir de descriptions textuelles."
},
"flux/krea": {
"description": "Flux Krea [dev] est un modèle de génération d'images avec une préférence esthétique, visant à produire des images plus réalistes et naturelles."
},
"flux/schnell": {
"description": "FLUX.1 [schnell] est un modèle de génération d'images de 12 milliards de paramètres, axé sur la génération rapide d'images de haute qualité."
},
"gemini-1.0-pro-001": {
"description": "Gemini 1.0 Pro 001 (Ajustement) offre des performances stables et ajustables, ce qui en fait un choix idéal pour des solutions de tâches complexes."
},
@@ -1388,20 +1475,26 @@
"glm-zero-preview": {
"description": "GLM-Zero-Preview possède de puissantes capacités de raisonnement complexe, se distinguant dans les domaines du raisonnement logique, des mathématiques et de la programmation."
},
"google/gemini-2.0-flash": {
"description": "Gemini 2.0 Flash offre des fonctionnalités de nouvelle génération et des améliorations, incluant une vitesse exceptionnelle, l'utilisation d'outils intégrés, la génération multimodale et une fenêtre de contexte de 1 million de tokens."
},
"google/gemini-2.0-flash-001": {
"description": "Gemini 2.0 Flash propose des fonctionnalités et des améliorations de nouvelle génération, y compris une vitesse exceptionnelle, l'utilisation d'outils natifs, la génération multimodale et une fenêtre de contexte de 1M tokens."
},
"google/gemini-2.0-flash-exp:free": {
"description": "Gemini 2.0 Flash Experimental est le dernier modèle d'IA multimodal expérimental de Google, offrant une amélioration de qualité par rapport aux versions précédentes, en particulier pour les connaissances générales, le code et les longs contextes."
},
"google/gemini-2.0-flash-lite": {
"description": "Gemini 2.0 Flash Lite offre des fonctionnalités de nouvelle génération et des améliorations, incluant une vitesse exceptionnelle, l'utilisation d'outils intégrés, la génération multimodale et une fenêtre de contexte de 1 million de tokens."
},
"google/gemini-2.5-flash": {
"description": "Gemini 2.5 Flash est le modèle principal le plus avancé de Google, conçu pour des tâches avancées de raisonnement, de codage, de mathématiques et de sciences. Il intègre une capacité de « réflexion » intégrée, lui permettant de fournir des réponses avec une précision accrue et un traitement contextuel plus détaillé.\n\nRemarque : ce modèle existe en deux variantes : avec réflexion et sans réflexion. Le tarif de sortie varie considérablement selon que la capacité de réflexion est activée ou non. Si vous choisissez la variante standard (sans le suffixe « :thinking »), le modèle évitera explicitement de générer des jetons de réflexion.\n\nPour exploiter la capacité de réflexion et recevoir des jetons de réflexion, vous devez sélectionner la variante « :thinking », ce qui entraînera un tarif de sortie plus élevé pour la réflexion.\n\nDe plus, Gemini 2.5 Flash peut être configuré via le paramètre « nombre maximal de jetons pour le raisonnement », comme décrit dans la documentation (https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning)."
"description": "Gemini 2.5 Flash est un modèle de réflexion offrant d'excellentes capacités globales. Il vise un équilibre entre prix et performance, supportant le multimodal et une fenêtre de contexte de 1 million de tokens."
},
"google/gemini-2.5-flash-image-preview": {
"description": "Modèle expérimental Gemini 2.5 Flash, supportant la génération d'images."
},
"google/gemini-2.5-flash-image-preview:free": {
"description": "Modèle expérimental Gemini 2.5 Flash, supportant la génération d'images."
"google/gemini-2.5-flash-lite": {
"description": "Gemini 2.5 Flash-Lite est un modèle équilibré à faible latence, avec un budget de réflexion configurable et une connectivité aux outils (par exemple, recherche Google ancrée et exécution de code). Il supporte les entrées multimodales et offre une fenêtre de contexte de 1 million de tokens."
},
"google/gemini-2.5-flash-preview": {
"description": "Gemini 2.5 Flash est le modèle phare le plus avancé de Google, conçu pour des tâches de raisonnement avancé, de codage, de mathématiques et de sciences. Il comprend des capacités de 'pensée' intégrées, lui permettant de fournir des réponses avec une plus grande précision et un traitement contextuel détaillé.\n\nRemarque : ce modèle a deux variantes : pensée et non-pensée. La tarification de sortie varie considérablement en fonction de l'activation de la capacité de pensée. Si vous choisissez la variante standard (sans le suffixe ':thinking'), le modèle évitera explicitement de générer des jetons de pensée.\n\nPour tirer parti de la capacité de pensée et recevoir des jetons de pensée, vous devez choisir la variante ':thinking', ce qui entraînera une tarification de sortie de pensée plus élevée.\n\nDe plus, Gemini 2.5 Flash peut être configuré via le paramètre 'nombre maximal de jetons de raisonnement', comme décrit dans la documentation (https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning)."
@@ -1410,11 +1503,14 @@
"description": "Gemini 2.5 Flash est le modèle phare le plus avancé de Google, conçu pour des tâches de raisonnement avancé, de codage, de mathématiques et de sciences. Il comprend des capacités de 'pensée' intégrées, lui permettant de fournir des réponses avec une plus grande précision et un traitement contextuel détaillé.\n\nRemarque : ce modèle a deux variantes : pensée et non-pensée. La tarification de sortie varie considérablement en fonction de l'activation de la capacité de pensée. Si vous choisissez la variante standard (sans le suffixe ':thinking'), le modèle évitera explicitement de générer des jetons de pensée.\n\nPour tirer parti de la capacité de pensée et recevoir des jetons de pensée, vous devez choisir la variante ':thinking', ce qui entraînera une tarification de sortie de pensée plus élevée.\n\nDe plus, Gemini 2.5 Flash peut être configuré via le paramètre 'nombre maximal de jetons de raisonnement', comme décrit dans la documentation (https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning)."
},
"google/gemini-2.5-pro": {
"description": "Gemini 2.5 Pro est le modèle de réflexion le plus avancé de Google, capable de raisonner sur des problèmes complexes en code, mathématiques et domaines STEM, ainsi que danalyser de grands ensembles de données, des bases de code et des documents en utilisant un contexte étendu."
"description": "Gemini 2.5 Pro est notre modèle Gemini de raisonnement le plus avancé, capable de résoudre des problèmes complexes. Il dispose d'une fenêtre de contexte de 2 millions de tokens et supporte des entrées multimodales incluant texte, images, audio, vidéo et documents PDF."
},
"google/gemini-2.5-pro-preview": {
"description": "Gemini 2.5 Pro Preview est le modèle de pensée le plus avancé de Google, capable de raisonner sur des problèmes complexes en code, mathématiques et domaines STEM, ainsi que d'analyser de grands ensembles de données, des bases de code et des documents en utilisant un contexte étendu."
},
"google/gemini-embedding-001": {
"description": "Modèle d'embedding de pointe, performant en anglais, multilingue et tâches de code."
},
"google/gemini-flash-1.5": {
"description": "Gemini 1.5 Flash propose des capacités de traitement multimodal optimisées, adaptées à divers scénarios de tâches complexes."
},
@@ -1442,12 +1538,21 @@
"google/gemma-2b-it": {
"description": "Gemma Instruct (2B) offre des capacités de traitement d'instructions de base, adapté aux applications légères."
},
"google/gemma-3-12b-it": {
"description": "Gemma 3 12B est un modèle de langage open source de Google, établissant de nouvelles normes en matière d'efficacité et de performance."
},
"google/gemma-3-1b-it": {
"description": "Gemma 3 1B est un modèle de langage open source de Google, établissant de nouvelles normes en matière d'efficacité et de performance."
},
"google/gemma-3-27b-it": {
"description": "Gemma 3 27B est un modèle de langage open source de Google, qui a établi de nouvelles normes en matière d'efficacité et de performance."
},
"google/text-embedding-005": {
"description": "Modèle d'embedding textuel focalisé sur l'anglais, optimisé pour les tâches de code et de langue anglaise."
},
"google/text-multilingual-embedding-002": {
"description": "Modèle d'embedding textuel multilingue optimisé pour les tâches interlinguistiques, supportant plusieurs langues."
},
"gpt-3.5-turbo": {
"description": "GPT 3.5 Turbo, adapté à diverses tâches de génération et de compréhension de texte, pointe actuellement vers gpt-3.5-turbo-0125."
},
@@ -1604,9 +1709,18 @@
"grok-4": {
"description": "Notre tout dernier modèle phare, le plus puissant, excelle dans le traitement du langage naturel, le calcul mathématique et le raisonnement — un véritable champion polyvalent."
},
"grok-4-0709": {
"description": "Grok 4 de xAI, doté de puissantes capacités de raisonnement."
},
"grok-code-fast-1": {
"description": "Nous sommes ravis de présenter grok-code-fast-1, un modèle d'inférence rapide et économique, excellent dans le codage des agents."
},
"groq/compound": {
"description": "Compound est un système d'IA composite, soutenu par plusieurs modèles ouverts déjà disponibles dans GroqCloud, capable d'utiliser intelligemment et sélectivement des outils pour répondre aux requêtes des utilisateurs."
},
"groq/compound-mini": {
"description": "Compound-mini est un système d'IA composite, soutenu par des modèles publics déjà disponibles dans GroqCloud, capable d'utiliser intelligemment et sélectivement des outils pour répondre aux requêtes des utilisateurs."
},
"gryphe/mythomax-l2-13b": {
"description": "MythoMax l2 13B est un modèle linguistique combinant créativité et intelligence, intégrant plusieurs modèles de pointe."
},
@@ -1662,7 +1776,7 @@
"description": "Amélioration significative des capacités en mathématiques complexes, logique et codage, optimisation de la stabilité des sorties du modèle et amélioration des capacités de traitement de longs textes."
},
"hunyuan-t1-latest": {
"description": "Le premier modèle d'inférence Hybrid-Transformer-Mamba à grande échelle de l'industrie, qui étend les capacités d'inférence, offre une vitesse de décodage exceptionnelle et aligne davantage les préférences humaines."
"description": "Amélioration significative des capacités du modèle principal de réflexion lente dans les domaines des mathématiques avancées, du raisonnement complexe, du code difficile, du respect des instructions et de la qualité de la création textuelle."
},
"hunyuan-t1-vision": {
"description": "Modèle de réflexion profonde multimodal Hunyuan, supportant des chaînes de pensée natives multimodales longues, excellent dans divers scénarios d'inférence d'images, avec une amélioration globale par rapport aux modèles de pensée rapide dans les problèmes scientifiques."
@@ -1730,8 +1844,11 @@
"imagen-4.0-ultra-generate-preview-06-06": {
"description": "Série de modèles de génération d'images à partir de texte Imagen 4e génération version Ultra"
},
"imagen4/preview": {
"description": "Modèle de génération d'images de haute qualité fourni par Google."
"inception/mercury-coder-small": {
"description": "Mercury Coder Small est idéal pour les tâches de génération, débogage et refactorisation de code, avec une latence minimale."
},
"inclusionAI/Ling-mini-2.0": {
"description": "Ling-mini-2.0 est un modèle linguistique de grande taille à haute performance et petite taille basé sur l'architecture MoE. Il possède 16 milliards de paramètres au total, mais n'active que 1,4 milliard par token (789 millions hors embeddings), ce qui permet une vitesse de génération extrêmement élevée. Grâce à une conception MoE efficace et à un entraînement à grande échelle avec des données de haute qualité, malgré seulement 1,4 milliard de paramètres activés, Ling-mini-2.0 affiche des performances de pointe comparables à celles des modèles denses de moins de 10 milliards de paramètres et des modèles MoE de plus grande taille dans les tâches en aval."
},
"internlm/internlm2_5-7b-chat": {
"description": "InternLM2.5 fournit des solutions de dialogue intelligent dans divers scénarios."
@@ -1766,6 +1883,9 @@
"kimi-k2-0711-preview": {
"description": "kimi-k2 est un modèle de base à architecture MoE doté de capacités exceptionnelles en code et Agent, avec un total de 1T de paramètres et 32B de paramètres activés. Dans les tests de performance sur les principales catégories telles que le raisonnement général, la programmation, les mathématiques et les Agents, le modèle K2 surpasse les autres modèles open source majeurs."
},
"kimi-k2-0905-preview": {
"description": "Le modèle kimi-k2-0905-preview dispose d'une longueur de contexte de 256k, offrant une capacité renforcée de codage agentique, une meilleure esthétique et utilité du code front-end, ainsi qu'une compréhension contextuelle améliorée."
},
"kimi-k2-turbo-preview": {
"description": "kimi-k2 est un modèle de base à architecture MoE doté de capacités remarquables en programmation et en agents autonomes, avec 1T de paramètres au total et 32B de paramètres activés. Dans les principaux tests de référence couvrant le raisonnement général, la programmation, les mathématiques et les agents, le modèle K2 surpasse les autres modèles open source majeurs."
},
@@ -2003,30 +2123,63 @@
"meta/Meta-Llama-3.1-8B-Instruct": {
"description": "Modèle textuel Llama 3.1 ajusté aux instructions, optimisé pour les cas d'usage de dialogue multilingue, performant sur de nombreux benchmarks industriels parmi les modèles de chat open source et propriétaires disponibles."
},
"meta/llama-3-70b": {
"description": "Modèle open source de 70 milliards de paramètres finement ajusté par Meta pour le suivi des instructions. Servi par Groq avec son matériel personnalisé LPU pour un raisonnement rapide et efficace."
},
"meta/llama-3-8b": {
"description": "Modèle open source de 8 milliards de paramètres finement ajusté par Meta pour le suivi des instructions. Servi par Groq avec son matériel personnalisé LPU pour un raisonnement rapide et efficace."
},
"meta/llama-3.1-405b-instruct": {
"description": "LLM avancé, prenant en charge la génération de données synthétiques, la distillation de connaissances et le raisonnement, adapté aux chatbots, à la programmation et aux tâches spécifiques."
},
"meta/llama-3.1-70b": {
"description": "Version mise à jour de Meta Llama 3 70B Instruct, incluant une longueur de contexte étendue à 128K, multilingue et capacités de raisonnement améliorées."
},
"meta/llama-3.1-70b-instruct": {
"description": "Permet des dialogues complexes, avec une excellente compréhension du contexte, des capacités de raisonnement et de génération de texte."
},
"meta/llama-3.1-8b": {
"description": "Llama 3.1 8B supporte une fenêtre de contexte de 128K, idéal pour les interfaces de dialogue en temps réel et l'analyse de données, tout en offrant des économies de coûts significatives par rapport aux modèles plus grands. Servi par Groq avec son matériel personnalisé LPU pour un raisonnement rapide et efficace."
},
"meta/llama-3.1-8b-instruct": {
"description": "Modèle de pointe avancé, doté de compréhension linguistique, d'excellentes capacités de raisonnement et de génération de texte."
},
"meta/llama-3.2-11b": {
"description": "Modèle de génération d'inférence d'image ajusté par instruction (entrée texte + image / sortie texte), optimisé pour la reconnaissance visuelle, l'inférence d'image, la génération de légendes et la réponse aux questions générales sur les images."
},
"meta/llama-3.2-11b-vision-instruct": {
"description": "Modèle visuel-linguistique de pointe, spécialisé dans le raisonnement de haute qualité à partir d'images."
},
"meta/llama-3.2-1b": {
"description": "Modèle uniquement textuel, supportant les cas d'usage sur appareil tels que la recherche locale multilingue, le résumé et la réécriture."
},
"meta/llama-3.2-1b-instruct": {
"description": "Modèle de langage de pointe de petite taille, doté de compréhension linguistique, d'excellentes capacités de raisonnement et de génération de texte."
},
"meta/llama-3.2-3b": {
"description": "Modèle uniquement textuel, finement ajusté pour supporter les cas d'usage sur appareil tels que la recherche locale multilingue, le résumé et la réécriture."
},
"meta/llama-3.2-3b-instruct": {
"description": "Modèle de langage de pointe de petite taille, doté de compréhension linguistique, d'excellentes capacités de raisonnement et de génération de texte."
},
"meta/llama-3.2-90b": {
"description": "Modèle de génération d'inférence d'image ajusté par instruction (entrée texte + image / sortie texte), optimisé pour la reconnaissance visuelle, l'inférence d'image, la génération de légendes et la réponse aux questions générales sur les images."
},
"meta/llama-3.2-90b-vision-instruct": {
"description": "Modèle visuel-linguistique de pointe, spécialisé dans le raisonnement de haute qualité à partir d'images."
},
"meta/llama-3.3-70b": {
"description": "Combinaison parfaite de performance et d'efficacité. Ce modèle supporte une IA conversationnelle haute performance, conçu pour la création de contenu, les applications d'entreprise et la recherche, offrant des capacités avancées de compréhension du langage, incluant résumé de texte, classification, analyse de sentiment et génération de code."
},
"meta/llama-3.3-70b-instruct": {
"description": "LLM avancé, spécialisé dans le raisonnement, les mathématiques, le bon sens et les appels de fonction."
},
"meta/llama-4-maverick": {
"description": "La collection de modèles Llama 4 est une IA multimodale native, supportant les expériences textuelles et multimodales. Ces modèles utilisent une architecture d'experts hybrides pour offrir des performances de pointe en compréhension de texte et d'image. Llama 4 Maverick, un modèle de 17 milliards de paramètres avec 128 experts, est servi par DeepInfra."
},
"meta/llama-4-scout": {
"description": "La collection de modèles Llama 4 est une IA multimodale native, supportant les expériences textuelles et multimodales. Ces modèles utilisent une architecture d'experts hybrides pour offrir des performances de pointe en compréhension de texte et d'image. Llama 4 Scout, un modèle de 17 milliards de paramètres avec 16 experts, est servi par DeepInfra."
},
"microsoft/Phi-3-medium-128k-instruct": {
"description": "Même modèle Phi-3-medium, mais avec une taille de contexte plus grande, adapté au RAG ou aux prompts courts."
},
@@ -2102,6 +2255,48 @@
"mistral-small-latest": {
"description": "Mistral Small est une option rentable, rapide et fiable, adaptée aux cas d'utilisation tels que la traduction, le résumé et l'analyse des sentiments."
},
"mistral/codestral": {
"description": "Mistral Codestral 25.01 est un modèle de codage de pointe, optimisé pour les cas d'usage à faible latence et haute fréquence. Maîtrisant plus de 80 langages de programmation, il excelle dans les tâches de remplissage intermédiaire (FIM), correction de code et génération de tests."
},
"mistral/codestral-embed": {
"description": "Modèle d'embedding de code pouvant être intégré dans des bases de données et dépôts de code pour soutenir les assistants de codage."
},
"mistral/devstral-small": {
"description": "Devstral est un grand modèle de langage agent pour les tâches d'ingénierie logicielle, en faisant un excellent choix pour les agents en ingénierie logicielle."
},
"mistral/magistral-medium": {
"description": "Pensée complexe soutenue par une compréhension profonde, avec un raisonnement transparent que vous pouvez suivre et vérifier. Ce modèle maintient un raisonnement fidèle dans de nombreuses langues, même lors de changements de langue en cours de tâche."
},
"mistral/magistral-small": {
"description": "Pensée complexe soutenue par une compréhension profonde, avec un raisonnement transparent que vous pouvez suivre et vérifier. Ce modèle maintient un raisonnement fidèle dans de nombreuses langues, même lors de changements de langue en cours de tâche."
},
"mistral/ministral-3b": {
"description": "Un modèle compact et efficace pour les tâches sur appareil telles qu'assistants intelligents et analyses locales, offrant une faible latence."
},
"mistral/ministral-8b": {
"description": "Un modèle plus puissant avec un raisonnement plus rapide et économe en mémoire, idéal pour les flux de travail complexes et les applications exigeantes en périphérie."
},
"mistral/mistral-embed": {
"description": "Modèle d'embedding textuel universel pour la recherche sémantique, la similarité, le clustering et les workflows RAG."
},
"mistral/mistral-large": {
"description": "Mistral Large est idéal pour les tâches complexes nécessitant une grande capacité de raisonnement ou une spécialisation élevée, telles que la génération de texte synthétique, le codage, le RAG ou les agents."
},
"mistral/mistral-saba-24b": {
"description": "Mistral Saba 24B est un modèle open source de 24 milliards de paramètres développé par Mistral.ai. Saba est un modèle spécialisé entraîné pour exceller en arabe, persan, ourdou, hébreu et langues indiennes. Servi par Groq avec son matériel personnalisé LPU pour un raisonnement rapide et efficace."
},
"mistral/mistral-small": {
"description": "Mistral Small est idéal pour les tâches simples pouvant être traitées en lots, telles que la classification, le support client ou la génération de texte. Il offre d'excellentes performances à un prix abordable."
},
"mistral/mixtral-8x22b-instruct": {
"description": "Modèle 8x22b Instruct. 8x22b est un modèle open source à experts hybrides servi par Mistral."
},
"mistral/pixtral-12b": {
"description": "Un modèle de 12 milliards de paramètres avec capacités de compréhension d'image et de texte."
},
"mistral/pixtral-large": {
"description": "Pixtral Large est le deuxième modèle de notre famille multimodale, démontrant un niveau avancé de compréhension d'image. En particulier, il peut comprendre documents, graphiques et images naturelles, tout en conservant les capacités de compréhension textuelle de pointe de Mistral Large 2."
},
"mistralai/Mistral-7B-Instruct-v0.1": {
"description": "Mistral (7B) Instruct est réputé pour ses performances élevées, adapté à diverses tâches linguistiques."
},
@@ -2165,8 +2360,23 @@
"moonshotai/Kimi-K2-Instruct": {
"description": "Kimi K2 est un modèle de base à architecture MoE doté de capacités exceptionnelles en codage et agents, avec 1 000 milliards de paramètres au total et 32 milliards activés. Il surpasse les autres modèles open source majeurs dans les tests de performance sur les connaissances générales, la programmation, les mathématiques et les agents."
},
"moonshotai/kimi-k2-instruct": {
"description": "kimi-k2 est un modèle de base à architecture MoE doté de capacités exceptionnelles en code et Agent, avec un total de 1T paramètres et 32B paramètres activés. Dans les tests de performance de référence couvrant les principales catégories telles que le raisonnement général, la programmation, les mathématiques et les Agents, le modèle K2 surpasse les autres modèles open source majeurs."
"moonshotai/Kimi-K2-Instruct-0905": {
"description": "Kimi K2-Instruct-0905 est la version la plus récente et la plus puissante de Kimi K2. Il s'agit d'un modèle linguistique de pointe à experts mixtes (MoE), avec un total de 1 000 milliards de paramètres et 32 milliards de paramètres activés. Les principales caractéristiques de ce modèle incluent : une intelligence de codage d'agents améliorée, démontrant des performances significatives dans les tests de référence publics et les tâches réelles d'agents de codage ; une expérience de codage frontale améliorée, avec des progrès tant en esthétique qu'en praticité pour la programmation frontale."
},
"moonshotai/kimi-k2": {
"description": "Kimi K2 est un modèle de langage à experts hybrides (MoE) à grande échelle développé par Moonshot AI, avec un total de 1 000 milliards de paramètres et 32 milliards de paramètres activés par passage avant. Il est optimisé pour les capacités d'agent, incluant l'utilisation avancée d'outils, le raisonnement et la synthèse de code."
},
"moonshotai/kimi-k2-0905": {
"description": "Le modèle kimi-k2-0905-preview dispose d'une longueur de contexte de 256k, offrant une capacité renforcée de codage agentique, une meilleure esthétique et utilité du code front-end, ainsi qu'une compréhension contextuelle améliorée."
},
"moonshotai/kimi-k2-instruct-0905": {
"description": "Le modèle kimi-k2-0905-preview dispose d'une longueur de contexte de 256k, offrant une capacité renforcée de codage agentique, une meilleure esthétique et utilité du code front-end, ainsi qu'une compréhension contextuelle améliorée."
},
"morph/morph-v3-fast": {
"description": "Morph propose un modèle IA spécialisé qui applique rapidement les modifications de code suggérées par des modèles de pointe (comme Claude ou GPT-4o) à vos fichiers de code existants - RAPIDE - plus de 4500 tokens/seconde. Il agit comme la dernière étape dans le flux de travail de codage IA. Supporte 16k tokens d'entrée et 16k tokens de sortie."
},
"morph/morph-v3-large": {
"description": "Morph propose un modèle IA spécialisé qui applique les modifications de code suggérées par des modèles de pointe (comme Claude ou GPT-4o) à vos fichiers de code existants - RAPIDE - plus de 2500 tokens/seconde. Il agit comme la dernière étape dans le flux de travail de codage IA. Supporte 16k tokens d'entrée et 16k tokens de sortie."
},
"nousresearch/hermes-2-pro-llama-3-8b": {
"description": "Hermes 2 Pro Llama 3 8B est une version améliorée de Nous Hermes 2, intégrant les derniers ensembles de données développés en interne."
@@ -2195,6 +2405,9 @@
"o3": {
"description": "o3 est un modèle polyvalent et puissant, performant dans de nombreux domaines. Il établit de nouvelles normes pour les tâches de mathématiques, de sciences, de programmation et de raisonnement visuel. Il excelle également dans la rédaction technique et le respect des instructions. Les utilisateurs peuvent l'utiliser pour analyser des textes, du code et des images, et résoudre des problèmes complexes en plusieurs étapes."
},
"o3-2025-04-16": {
"description": "o3 est le nouveau modèle de raisonnement d'OpenAI, supportant les entrées texte et image et produisant du texte, adapté aux tâches complexes nécessitant des connaissances générales étendues."
},
"o3-deep-research": {
"description": "o3-deep-research est notre modèle de recherche approfondie le plus avancé, conçu spécialement pour gérer des tâches de recherche complexes en plusieurs étapes. Il peut rechercher et synthétiser des informations sur Internet, ainsi qu'accéder et exploiter vos propres données via le connecteur MCP."
},
@@ -2204,9 +2417,15 @@
"o3-pro": {
"description": "Le modèle o3-pro utilise davantage de calculs pour réfléchir plus profondément et fournir constamment de meilleures réponses, uniquement disponible via l'API Responses."
},
"o3-pro-2025-06-10": {
"description": "o3 Pro est le nouveau modèle de raisonnement d'OpenAI, supportant les entrées texte et image et produisant du texte, adapté aux tâches complexes nécessitant des connaissances générales étendues."
},
"o4-mini": {
"description": "o4-mini est notre dernier modèle de la série o de petite taille. Il est optimisé pour une inférence rapide et efficace, offrant une grande efficacité et performance dans les tâches de codage et visuelles."
},
"o4-mini-2025-04-16": {
"description": "o4-mini est un modèle de raisonnement d'OpenAI, supportant les entrées texte et image et produisant du texte, adapté aux tâches complexes nécessitant des connaissances générales étendues. Ce modèle dispose d'un contexte de 200 000 tokens."
},
"o4-mini-deep-research": {
"description": "o4-mini-deep-research est notre modèle de recherche approfondie plus rapide et plus abordable — idéal pour traiter des tâches de recherche complexes en plusieurs étapes. Il peut rechercher et synthétiser des informations sur Internet, ainsi qu'accéder et exploiter vos propres données via le connecteur MCP."
},
@@ -2225,29 +2444,47 @@
"open-mixtral-8x7b": {
"description": "Mixtral 8x7B est un modèle d'expert épars, utilisant plusieurs paramètres pour améliorer la vitesse de raisonnement, adapté au traitement de tâches multilingues et de génération de code."
},
"openai/gpt-3.5-turbo": {
"description": "Le modèle le plus performant et rentable de la série GPT-3.5 d'OpenAI, optimisé pour le chat mais également performant pour les tâches de complétion traditionnelles."
},
"openai/gpt-3.5-turbo-instruct": {
"description": "Capacités similaires aux modèles de l'ère GPT-3. Compatible avec les points de terminaison de complétion traditionnels, pas les complétions de chat."
},
"openai/gpt-4-turbo": {
"description": "gpt-4-turbo d'OpenAI possède une vaste connaissance générale et une expertise sectorielle, capable de suivre des instructions complexes en langage naturel et de résoudre précisément des problèmes difficiles. Sa date de coupure des connaissances est avril 2023, avec une fenêtre de contexte de 128 000 tokens."
},
"openai/gpt-4.1": {
"description": "GPT-4.1 est notre modèle phare pour les tâches complexes. Il est particulièrement adapté à la résolution de problèmes interdomaines."
"description": "GPT 4.1 est le modèle phare d'OpenAI, adapté aux tâches complexes. Il excelle dans la résolution de problèmes interdomaines."
},
"openai/gpt-4.1-mini": {
"description": "GPT-4.1 mini offre un équilibre entre intelligence, rapidité et coût, ce qui en fait un modèle attrayant pour de nombreux cas d'utilisation."
"description": "GPT 4.1 mini équilibre intelligence, vitesse et coût, en faisant un modèle attractif pour de nombreux cas d'usage."
},
"openai/gpt-4.1-nano": {
"description": "GPT-4.1 nano est le modèle GPT-4.1 le plus rapide et le plus rentable."
"description": "GPT-4.1 nano est le modèle GPT 4.1 le plus rapide et le plus rentable."
},
"openai/gpt-4o": {
"description": "ChatGPT-4o est un modèle dynamique, mis à jour en temps réel pour rester à jour avec la dernière version. Il combine une compréhension et une génération de langage puissantes, adapté à des scénarios d'application à grande échelle, y compris le service client, l'éducation et le support technique."
"description": "GPT-4o d'OpenAI possède une vaste connaissance générale et une expertise sectorielle, capable de suivre des instructions complexes en langage naturel et de résoudre précisément des problèmes difficiles. Il offre des performances équivalentes à GPT-4 Turbo avec une API plus rapide et moins coûteuse."
},
"openai/gpt-4o-mini": {
"description": "GPT-4o mini est le dernier modèle d'OpenAI lancé après GPT-4 Omni, prenant en charge les entrées d'images et de texte et produisant du texte en sortie. En tant que leur modèle compact le plus avancé, il est beaucoup moins cher que d'autres modèles de pointe récents et coûte plus de 60 % de moins que GPT-3.5 Turbo. Il maintient une intelligence de pointe tout en offrant un rapport qualité-prix significatif. GPT-4o mini a obtenu un score de 82 % au test MMLU et se classe actuellement au-dessus de GPT-4 en termes de préférences de chat."
"description": "GPT-4o mini d'OpenAI est leur modèle petit, avancé et rentable. Il est multimodal (accepte texte ou image en entrée et produit du texte), plus intelligent que gpt-3.5-turbo tout en étant aussi rapide."
},
"openai/gpt-5": {
"description": "GPT-5 est le modèle de langage phare d'OpenAI, excellent en raisonnement complexe, vaste connaissance du monde réel, tâches intensives en code et agents multi-étapes."
},
"openai/gpt-5-mini": {
"description": "GPT-5 mini est un modèle optimisé pour le coût, performant en raisonnement et tâches de chat. Il offre un équilibre optimal entre vitesse, coût et capacité."
},
"openai/gpt-5-nano": {
"description": "GPT-5 nano est un modèle à haut débit, performant pour les instructions simples ou les tâches de classification."
},
"openai/gpt-oss-120b": {
"description": "OpenAI GPT-OSS 120B est un modèle linguistique de pointe doté de 120 milliards de paramètres, intégrant des fonctions de recherche via navigateur et d'exécution de code, ainsi que des capacités de raisonnement."
"description": "Modèle de langage général extrêmement performant avec des capacités de raisonnement puissantes et contrôlables."
},
"openai/gpt-oss-20b": {
"description": "OpenAI GPT-OSS 20B est un modèle linguistique de pointe doté de 20 milliards de paramètres, intégrant des fonctions de recherche via navigateur et d'exécution de code, ainsi que des capacités de raisonnement."
"description": "Modèle de langage compact avec poids open source, optimisé pour la faible latence et les environnements à ressources limitées, incluant le déploiement local et en périphérie."
},
"openai/o1": {
"description": "o1 est le nouveau modèle d'inférence d'OpenAI, prenant en charge les entrées multimodales (texte et image) et produisant du texte, adapté aux tâches complexes nécessitant des connaissances générales étendues. Ce modèle dispose d'un contexte de 200K et d'une date de coupure des connaissances en octobre 2023."
"description": "o1 d'OpenAI est un modèle de raisonnement phare, conçu pour les problèmes complexes nécessitant une réflexion approfondie. Il offre un raisonnement puissant et une précision accrue pour les tâches complexes à plusieurs étapes."
},
"openai/o1-mini": {
"description": "o1-mini est un modèle de raisonnement rapide et économique conçu pour les applications de programmation, de mathématiques et de sciences. Ce modèle dispose d'un contexte de 128K et d'une date limite de connaissance en octobre 2023."
@@ -2256,23 +2493,44 @@
"description": "o1 est le nouveau modèle de raisonnement d'OpenAI, adapté aux tâches complexes nécessitant une vaste connaissance générale. Ce modèle dispose d'un contexte de 128K et d'une date limite de connaissance en octobre 2023."
},
"openai/o3": {
"description": "o3 est un modèle polyvalent et puissant, qui excelle dans de nombreux domaines. Il établit de nouvelles normes pour les tâches de mathématiques, de sciences, de programmation et de raisonnement visuel. Il est également doué pour la rédaction technique et le respect des instructions. Les utilisateurs peuvent l'utiliser pour analyser des textes, du code et des images, et résoudre des problèmes complexes en plusieurs étapes."
"description": "o3 d'OpenAI est le modèle de raisonnement le plus puissant, établissant de nouveaux standards en codage, mathématiques, sciences et perception visuelle. Il excelle dans les requêtes complexes nécessitant une analyse multidimensionnelle, avec un avantage particulier pour l'analyse d'images, graphiques et diagrammes."
},
"openai/o3-mini": {
"description": "o3-mini offre une grande intelligence avec les mêmes objectifs de coût et de latence que o1-mini."
"description": "o3-mini est le dernier petit modèle de raisonnement d'OpenAI, offrant une intelligence élevée avec les mêmes objectifs de coût et latence que o1-mini."
},
"openai/o3-mini-high": {
"description": "o3-mini haute version de raisonnement, offrant une grande intelligence avec les mêmes objectifs de coût et de latence que o1-mini."
},
"openai/o4-mini": {
"description": "o4-mini est optimisé pour une inférence rapide et efficace, offrant une grande efficacité et performance dans les tâches de codage et visuelles."
"description": "o4-mini d'OpenAI offre un raisonnement rapide et rentable, avec des performances exceptionnelles pour sa taille, notamment en mathématiques (meilleur sur le benchmark AIME), codage et tâches visuelles."
},
"openai/o4-mini-high": {
"description": "Version à haut niveau d'inférence d'o4-mini, optimisée pour une inférence rapide et efficace, offrant une grande efficacité et performance dans les tâches de codage et visuelles."
},
"openai/text-embedding-3-large": {
"description": "Le modèle d'embedding le plus performant d'OpenAI, adapté aux tâches en anglais et non anglaises."
},
"openai/text-embedding-3-small": {
"description": "Version améliorée et plus performante du modèle d'embedding ada d'OpenAI."
},
"openai/text-embedding-ada-002": {
"description": "Modèle d'embedding textuel traditionnel d'OpenAI."
},
"openrouter/auto": {
"description": "En fonction de la longueur du contexte, du sujet et de la complexité, votre demande sera envoyée à Llama 3 70B Instruct, Claude 3.5 Sonnet (auto-régulé) ou GPT-4o."
},
"perplexity/sonar": {
"description": "Produit léger de Perplexity avec capacité de recherche ancrée, plus rapide et moins cher que Sonar Pro."
},
"perplexity/sonar-pro": {
"description": "Produit phare de Perplexity avec capacité de recherche ancrée, supportant des requêtes avancées et des suivis."
},
"perplexity/sonar-reasoning": {
"description": "Modèle axé sur le raisonnement, produisant des chaînes de pensée (CoT) dans les réponses, offrant des explications détaillées avec recherche ancrée."
},
"perplexity/sonar-reasoning-pro": {
"description": "Modèle avancé axé sur le raisonnement, produisant des chaînes de pensée (CoT) dans les réponses, offrant des explications complètes avec capacités de recherche améliorées et multiples requêtes de recherche par demande."
},
"phi3": {
"description": "Phi-3 est un modèle ouvert léger lancé par Microsoft, adapté à une intégration efficace et à un raisonnement de connaissances à grande échelle."
},
@@ -2313,7 +2571,7 @@
"description": "Qwen-Image est un modèle polyvalent de génération d'images, prenant en charge de nombreux styles artistiques et excelling particulièrement dans le rendu de textes complexes, notamment en chinois et en anglais. Le modèle gère les mises en page multilignes, la génération de texte au niveau des paragraphes et le rendu de détails fins, permettant de créer des compositions complexes mêlant texte et image."
},
"qwen-image-edit": {
"description": "Un modèle professionnel d'édition d'images publié par l'équipe Qwen, prenant en charge l'édition sémantique et l'édition de l'apparence, capable d'éditer avec précision les textes en chinois et en anglais, et permettant la conversion de styles, la rotation d'objets et d'autres opérations d'édition d'images de haute qualité."
"description": "Qwen Image Edit est un modèle de génération d'images à partir d'images, permettant l'édition et la modification d'images basées sur une image d'entrée et des indications textuelles. Il peut ajuster précisément et transformer de manière créative l'image originale selon les besoins de l'utilisateur."
},
"qwen-long": {
"description": "Qwen est un modèle de langage à grande échelle, prenant en charge un contexte de texte long, ainsi que des fonctionnalités de dialogue basées sur des documents longs et multiples."
@@ -2549,6 +2807,15 @@
"qwen3-coder-plus": {
"description": "Modèle de code Tongyi Qianwen. La dernière série de modèles Qwen3-Coder est basée sur Qwen3 pour la génération de code, avec une puissante capacité d'agent de codage, maîtrisant l'appel d'outils et l'interaction avec l'environnement, capable de programmation autonome, alliant excellence en codage et polyvalence."
},
"qwen3-max-preview": {
"description": "Version Preview du modèle Max de la série Qwen 3, avec une amélioration significative des capacités générales par rapport à la série 2.5, notamment en compréhension de texte général bilingue (chinois et anglais), respect des instructions complexes, tâches ouvertes subjectives, capacités multilingues et appels d'outils ; le modèle présente également moins d'hallucinations de connaissances."
},
"qwen3-next-80b-a3b-instruct": {
"description": "Modèle open source de nouvelle génération en mode non réflexif basé sur Qwen3, offrant une meilleure compréhension du texte en chinois, des capacités de raisonnement logique renforcées et de meilleures performances dans les tâches de génération de texte par rapport à la version précédente (Tongyi Qianwen 3-235B-A22B-Instruct-2507)."
},
"qwen3-next-80b-a3b-thinking": {
"description": "Modèle open source de nouvelle génération en mode réflexif basé sur Qwen3, avec une meilleure conformité aux instructions et des réponses plus concises dans les résumés par rapport à la version précédente (Tongyi Qianwen 3-235B-A22B-Thinking-2507)."
},
"qwq": {
"description": "QwQ est un modèle de recherche expérimental, axé sur l'amélioration des capacités de raisonnement de l'IA."
},
@@ -2729,6 +2996,12 @@
"v0-1.5-md": {
"description": "Le modèle v0-1.5-md convient aux tâches quotidiennes et à la génération d'interfaces utilisateur (UI)"
},
"vercel/v0-1.0-md": {
"description": "Accès au modèle derrière v0 pour générer, réparer et optimiser des applications Web modernes, avec raisonnement spécifique aux frameworks et connaissances à jour."
},
"vercel/v0-1.5-md": {
"description": "Accès au modèle derrière v0 pour générer, réparer et optimiser des applications Web modernes, avec raisonnement spécifique aux frameworks et connaissances à jour."
},
"wan2.2-t2i-flash": {
"description": "Version ultra-rapide Wanxiang 2.2, le modèle le plus récent à ce jour. Améliorations globales en créativité, stabilité et réalisme, avec une vitesse de génération rapide et un excellent rapport qualité-prix."
},
@@ -2759,6 +3032,27 @@
"x1": {
"description": "Le modèle Spark X1 sera mis à niveau, et sur la base de ses performances déjà leaders dans les tâches mathématiques, il atteindra des résultats comparables dans des tâches générales telles que le raisonnement, la génération de texte et la compréhension du langage, en se mesurant à OpenAI o1 et DeepSeek R1."
},
"xai/grok-2": {
"description": "Grok 2 est un modèle de langage de pointe avec des capacités de raisonnement avancées. Il excelle en chat, codage et raisonnement, surpassant Claude 3.5 Sonnet et GPT-4-Turbo dans le classement LMSYS."
},
"xai/grok-2-vision": {
"description": "Le modèle visuel Grok 2 excelle dans les tâches basées sur la vision, offrant des performances de pointe en raisonnement mathématique visuel (MathVista) et en questions-réponses basées sur documents (DocVQA). Il peut traiter diverses informations visuelles, y compris documents, graphiques, diagrammes, captures d'écran et photos."
},
"xai/grok-3": {
"description": "Modèle phare de xAI, performant pour les cas d'usage d'entreprise tels que l'extraction de données, le codage et le résumé de texte. Il possède une expertise approfondie dans les domaines financier, médical, juridique et scientifique."
},
"xai/grok-3-fast": {
"description": "Modèle phare de xAI, performant pour les cas d'usage d'entreprise tels que l'extraction de données, le codage et le résumé de texte. La variante rapide est servie sur une infrastructure plus rapide, offrant des temps de réponse bien supérieurs au standard, au coût accru par token de sortie."
},
"xai/grok-3-mini": {
"description": "Modèle léger de xAI, réfléchissant avant de répondre. Idéal pour les tâches simples ou logiques ne nécessitant pas une expertise approfondie. La trajectoire de pensée brute est accessible."
},
"xai/grok-3-mini-fast": {
"description": "Modèle léger de xAI, réfléchissant avant de répondre. Idéal pour les tâches simples ou logiques ne nécessitant pas une expertise approfondie. La trajectoire de pensée brute est accessible. La variante rapide est servie sur une infrastructure plus rapide, offrant des temps de réponse bien supérieurs au standard, au coût accru par token de sortie."
},
"xai/grok-4": {
"description": "Le dernier et meilleur modèle phare de xAI, offrant des performances inégalées en langage naturel, mathématiques et raisonnement — un véritable modèle polyvalent."
},
"yi-1.5-34b-chat": {
"description": "Yi-1.5 est une version améliorée de Yi. Il utilise un corpus de haute qualité de 500 milliards de tokens pour poursuivre l'entraînement préalable de Yi, et est affiné sur 3 millions d'exemples de fine-tuning variés."
},
@@ -2806,5 +3100,14 @@
},
"zai-org/GLM-4.5V": {
"description": "GLM-4.5V est la dernière génération de modèle langage-visuel (VLM) publiée par Zhipu AI. Ce modèle est construit sur le modèle texte phare GLM-4.5-Air, qui compte 106 milliards de paramètres au total et 12 milliards de paramètres d'activation, et adopte une architecture de mixture d'experts (MoE) afin d'obtenir des performances excellentes à un coût d'inférence réduit. Sur le plan technique, GLM-4.5V prolonge la lignée de GLM-4.1V-Thinking et introduit des innovations telles que l'encodage de position rotatif en 3D (3D-RoPE), renforçant de façon significative la perception et le raisonnement des relations spatiales tridimensionnelles. Grâce aux optimisations apportées lors des phases de pré-entraînement, d'affinage supervisé et d'apprentissage par renforcement, ce modèle est capable de traiter divers contenus visuels, notamment des images, des vidéos et des documents longs, et atteint un niveau de pointe parmi les modèles open source de la même catégorie sur 41 benchmarks multimodaux publics. De plus, le modèle intègre un interrupteur « mode réflexion » permettant aux utilisateurs de choisir de manière flexible entre réponses rapides et raisonnement approfondi, pour équilibrer efficacité et qualité."
},
"zai/glm-4.5": {
"description": "La série de modèles GLM-4.5 est conçue spécifiquement pour les agents. Le modèle phare GLM-4.5 intègre 355 milliards de paramètres totaux (32 milliards actifs), unifiant raisonnement, codage et capacités d'agent pour répondre à des besoins applicatifs complexes. En tant que système de raisonnement hybride, il offre deux modes d'opération."
},
"zai/glm-4.5-air": {
"description": "GLM-4.5 et GLM-4.5-Air sont nos derniers modèles phares, conçus comme modèles de base pour les applications d'agents. Les deux utilisent une architecture d'experts hybrides (MoE). GLM-4.5 compte 355 milliards de paramètres totaux avec 32 milliards actifs par passage avant, tandis que GLM-4.5-Air adopte une conception plus simplifiée avec 106 milliards de paramètres totaux et 12 milliards actifs."
},
"zai/glm-4.5v": {
"description": "GLM-4.5V est construit sur le modèle de base GLM-4.5-Air, héritant des techniques éprouvées de GLM-4.1V-Thinking, tout en réalisant une mise à l'échelle efficace grâce à une puissante architecture MoE de 106 milliards de paramètres."
}
}
+6
View File
@@ -38,6 +38,9 @@
"cohere": {
"description": "Cohere vous apporte les modèles multilingues les plus avancés, des fonctionnalités de recherche sophistiquées et un espace de travail AI sur mesure pour les entreprises modernes - le tout intégré dans une plateforme sécurisée."
},
"cometapi": {
"description": "CometAPI est une plateforme de services offrant diverses interfaces de modèles avancés, prenant en charge OpenAI, Anthropic, Google et bien d'autres, adaptée à des besoins de développement et d'application variés. Les utilisateurs peuvent choisir librement le modèle et le tarif optimaux selon leurs besoins, favorisant ainsi une meilleure expérience en IA."
},
"deepseek": {
"description": "DeepSeek est une entreprise spécialisée dans la recherche et l'application des technologies d'intelligence artificielle, dont le dernier modèle, DeepSeek-V2.5, combine des capacités de dialogue général et de traitement de code, réalisant des améliorations significatives dans l'alignement des préférences humaines, les tâches d'écriture et le suivi des instructions."
},
@@ -158,6 +161,9 @@
"v0": {
"description": "v0 est un assistant de programmation en binôme. Il vous suffit de décrire vos idées en langage naturel, et il génère le code et l'interface utilisateur (UI) pour votre projet."
},
"vercelaigateway": {
"description": "Vercel AI Gateway offre une API unifiée pour accéder à plus de 100 modèles, permettant d'utiliser les modèles de plusieurs fournisseurs tels qu'OpenAI, Anthropic, Google, via un point de terminaison unique. Il prend en charge la gestion du budget, la surveillance de l'utilisation, l'équilibrage de charge des requêtes et la tolérance aux pannes."
},
"vertexai": {
"description": "La série Gemini de Google est son modèle d'IA le plus avancé et polyvalent, développé par Google DeepMind, conçu pour être multimodal, prenant en charge la compréhension et le traitement sans couture de texte, de code, d'images, d'audio et de vidéo. Adapté à divers environnements, des centres de données aux appareils mobiles, il améliore considérablement l'efficacité et l'applicabilité des modèles d'IA."
},
+10 -3
View File
@@ -70,12 +70,15 @@
"input": {
"addAi": "Aggiungi un messaggio AI",
"addUser": "Aggiungi un messaggio utente",
"disclaimer": "L'IA può anche commettere errori, si prega di verificare le informazioni importanti",
"errorMsg": "Invio del messaggio fallito, controlla la rete e riprova: {{errorMsg}}",
"more": "Ulteriori",
"send": "Invia",
"sendWithCmdEnter": "Invia premendo {{meta}} + Invio",
"sendWithEnter": "Invia premendo Invio",
"sendWithCmdEnter": "Premi <key/> per inviare",
"sendWithEnter": "Premi <key/> per inviare",
"stop": "Ferma",
"warp": "A capo"
"warp": "A capo",
"warpWithKey": "Vai a capo premendo il tasto <key/>"
},
"intentUnderstanding": {
"title": "Stiamo comprendendo e analizzando la tua intenzione..."
@@ -232,6 +235,10 @@
"threadMessageCount": "{{messageCount}} messaggi",
"title": "Sottoargomento"
},
"toggleWideScreen": {
"off": "Disattiva modalità schermo ampio",
"on": "Attiva modalità schermo ampio"
},
"tokenDetails": {
"chats": "Chat",
"historySummary": "Riepilogo storico",
+62
View File
@@ -0,0 +1,62 @@
{
"actions": {
"expand": {
"off": "Comprimi",
"on": "Espandi"
},
"typobar": {
"off": "Nascondi barra degli strumenti di formattazione",
"on": "Mostra barra degli strumenti di formattazione"
}
},
"cancel": "Annulla",
"confirm": "Conferma",
"file": {
"error": "Errore: {{message}}",
"uploading": "Caricamento file in corso..."
},
"image": {
"broken": "Immagine danneggiata"
},
"link": {
"edit": "Modifica link",
"open": "Apri link",
"placeholder": "Inserisci URL del link",
"unlink": "Rimuovi link"
},
"math": {
"placeholder": "Inserisci la formula TeX"
},
"slash": {
"h1": "Titolo di primo livello",
"h2": "Titolo di secondo livello",
"h3": "Titolo di terzo livello",
"hr": "Linea di separazione",
"table": "Tabella",
"tex": "Formula TeX"
},
"table": {
"delete": "Elimina tabella",
"deleteColumn": "Elimina colonna",
"deleteRow": "Elimina riga",
"insertColumnLeft": "Inserisci {{count}} colonne a sinistra",
"insertColumnRight": "Inserisci {{count}} colonne a destra",
"insertRowAbove": "Inserisci {{count}} righe sopra",
"insertRowBelow": "Inserisci {{count}} righe sotto"
},
"typobar": {
"blockquote": "Citazione",
"bold": "Grassetto",
"bulletList": "Elenco puntato",
"code": "Codice in linea",
"codeblock": "Blocco di codice",
"italic": "Corsivo",
"link": "Collegamento",
"numberList": "Elenco numerato",
"strikethrough": "Testo barrato",
"table": "tabella",
"taskList": "Elenco attività",
"tex": "Formula TeX",
"underline": "Sottolineato"
}
}
+3
View File
@@ -5,6 +5,9 @@
"lock": "Blocca rapporto d'aspetto",
"unlock": "Sblocca rapporto d'aspetto"
},
"cfg": {
"label": "Intensità guida"
},
"header": {
"desc": "Descrizione semplice, crea subito",
"title": "Pittura"
+355 -52
View File
@@ -53,6 +53,9 @@
"Baichuan4-Turbo": {
"description": "Il modello con le migliori capacità in patria, supera i modelli principali esteri in compiti cinesi come enciclopedie, testi lunghi e creazione di contenuti. Possiede anche capacità multimodali leader del settore, con prestazioni eccellenti in vari benchmark di valutazione."
},
"ByteDance-Seed/Seed-OSS-36B-Instruct": {
"description": "Seed-OSS è una serie di modelli linguistici di grandi dimensioni open source sviluppati dal team Seed di ByteDance, progettati specificamente per la gestione di contesti lunghi, ragionamento, agenti intelligenti e capacità generali. Il modello Seed-OSS-36B-Instruct di questa serie è un modello di fine-tuning con 36 miliardi di parametri, che supporta nativamente contesti ultra lunghi, permettendo di elaborare grandi quantità di documenti o complessi repository di codice in un'unica volta. Questo modello è ottimizzato per il ragionamento, la generazione di codice e i compiti degli agenti (come l'uso di strumenti), mantenendo un equilibrio e un'eccellente capacità generale. Una caratteristica distintiva di questo modello è la funzione \"Thinking Budget\" (budget di pensiero), che consente agli utenti di regolare flessibilmente la lunghezza del ragionamento secondo necessità, migliorando così l'efficienza del ragionamento nelle applicazioni pratiche."
},
"DeepSeek-R1": {
"description": "LLM avanzato ed efficiente, specializzato in ragionamento, matematica e programmazione."
},
@@ -81,7 +84,13 @@
"description": "Il fornitore del modello è la piattaforma sophnet. DeepSeek V3 Fast è la versione ad alta velocità TPS del modello DeepSeek V3 0324, completamente non quantificata, con capacità di codice e matematica potenziate e risposte più rapide!"
},
"DeepSeek-V3.1": {
"description": "DeepSeek-V3.1 è il nuovo modello di ragionamento ibrido lanciato da DeepSeek, che supporta due modalità di ragionamento: con pensiero e senza pensiero, con un'efficienza di pensiero superiore rispetto a DeepSeek-R1-0528. Ottimizzato tramite post-addestramento, l'uso degli strumenti Agent e le prestazioni nelle attività degli agenti sono notevolmente migliorate."
"description": "DeepSeek-V3.1 - modalità senza pensiero; DeepSeek-V3.1 è un nuovo modello di ragionamento ibrido lanciato da DeepSeek, che supporta due modalità di ragionamento: con e senza pensiero, con un'efficienza di pensiero superiore rispetto a DeepSeek-R1-0528. Ottimizzato post-addestramento, l'uso degli strumenti Agent e le prestazioni nei compiti degli agenti sono notevolmente migliorati."
},
"DeepSeek-V3.1-Fast": {
"description": "DeepSeek V3.1 Fast è la versione ad alta TPS e alta velocità del modello DeepSeek V3.1. Modalità di pensiero ibrida: modificando il template di chat, un singolo modello può supportare sia la modalità con pensiero che quella senza pensiero. Chiamata degli strumenti più intelligente: grazie all'ottimizzazione post-addestramento, le prestazioni del modello nell'uso degli strumenti e nei compiti degli agenti sono significativamente migliorate."
},
"DeepSeek-V3.1-Think": {
"description": "DeepSeek-V3.1 - modalità con pensiero; DeepSeek-V3.1 è un nuovo modello di ragionamento ibrido lanciato da DeepSeek, che supporta due modalità di ragionamento: con e senza pensiero, con un'efficienza di pensiero superiore rispetto a DeepSeek-R1-0528. Ottimizzato post-addestramento, l'uso degli strumenti Agent e le prestazioni nei compiti degli agenti sono notevolmente migliorati."
},
"Doubao-lite-128k": {
"description": "Doubao-lite offre una velocità di risposta eccezionale e un miglior rapporto qualità-prezzo, fornendo ai clienti scelte più flessibili per diversi scenari. Supporta inferenza e fine-tuning con una finestra contestuale di 128k."
@@ -281,6 +290,9 @@
"Pro/moonshotai/Kimi-K2-Instruct": {
"description": "Kimi K2 è un modello base con architettura MoE dotato di potenti capacità di codice e agenti, con 1 trilione di parametri totali e 32 miliardi di parametri attivi. Nei test di benchmark su ragionamento generale, programmazione, matematica e agenti, il modello K2 supera altri modelli open source principali."
},
"Pro/moonshotai/Kimi-K2-Instruct-0905": {
"description": "Kimi K2-Instruct-0905 è l'ultima e più potente versione di Kimi K2. Si tratta di un modello linguistico di esperti misti (MoE) all'avanguardia, con un totale di 1 trilione di parametri e 32 miliardi di parametri attivi. Le caratteristiche principali del modello includono: intelligenza potenziata per la codifica degli agenti, con miglioramenti significativi nelle prestazioni sia nei test di riferimento pubblici sia nelle attività di codifica degli agenti nel mondo reale; esperienza di codifica frontend migliorata, con progressi sia nell'estetica che nella praticità della programmazione frontend."
},
"QwQ-32B-Preview": {
"description": "QwQ-32B-Preview è un modello di elaborazione del linguaggio naturale innovativo, in grado di gestire in modo efficiente compiti complessi di generazione di dialoghi e comprensione del contesto."
},
@@ -590,6 +602,33 @@
"ai21-labs/AI21-Jamba-1.5-Mini": {
"description": "Un modello multilingue con 52 miliardi di parametri (12 miliardi attivi), offre una finestra contestuale lunga 256K token, chiamate di funzione, output strutturati e generazione basata su fatti."
},
"alibaba/qwen-3-14b": {
"description": "Qwen3 è l'ultima generazione della serie Qwen di grandi modelli linguistici, che offre un set completo di modelli densi e a esperti misti (MoE). Basato su un ampio addestramento, Qwen3 rappresenta un progresso rivoluzionario in ragionamento, aderenza alle istruzioni, capacità di agente e supporto multilingue."
},
"alibaba/qwen-3-235b": {
"description": "Qwen3 è l'ultima generazione della serie Qwen di grandi modelli linguistici, che offre un set completo di modelli densi e a esperti misti (MoE). Basato su un ampio addestramento, Qwen3 rappresenta un progresso rivoluzionario in ragionamento, aderenza alle istruzioni, capacità di agente e supporto multilingue."
},
"alibaba/qwen-3-30b": {
"description": "Qwen3 è l'ultima generazione della serie Qwen di grandi modelli linguistici, che offre un set completo di modelli densi e a esperti misti (MoE). Basato su un ampio addestramento, Qwen3 rappresenta un progresso rivoluzionario in ragionamento, aderenza alle istruzioni, capacità di agente e supporto multilingue."
},
"alibaba/qwen-3-32b": {
"description": "Qwen3 è l'ultima generazione della serie Qwen di grandi modelli linguistici, che offre un set completo di modelli densi e a esperti misti (MoE). Basato su un ampio addestramento, Qwen3 rappresenta un progresso rivoluzionario in ragionamento, aderenza alle istruzioni, capacità di agente e supporto multilingue."
},
"alibaba/qwen3-coder": {
"description": "Qwen3-Coder-480B-A35B-Instruct è il modello di codice più agente di Qwen, con prestazioni significative nella codifica agente, nell'uso di browser agente e in altri compiti di codifica di base, raggiungendo risultati comparabili a Claude Sonnet."
},
"amazon/nova-lite": {
"description": "Un modello multimodale a bassissimo costo, estremamente veloce nell'elaborazione di input di immagini, video e testo."
},
"amazon/nova-micro": {
"description": "Un modello solo testo che offre risposte a latenza minima a costi molto bassi."
},
"amazon/nova-pro": {
"description": "Un modello multimodale altamente capace, con la migliore combinazione di accuratezza, velocità e costo, adatto a una vasta gamma di compiti."
},
"amazon/titan-embed-text-v2": {
"description": "Amazon Titan Text Embeddings V2 è un modello di embedding multilingue leggero ed efficiente, disponibile in dimensioni da 1024, 512 e 256."
},
"anthropic.claude-3-5-sonnet-20240620-v1:0": {
"description": "Claude 3.5 Sonnet ha elevato gli standard del settore, superando i modelli concorrenti e Claude 3 Opus, dimostrando prestazioni eccezionali in una vasta gamma di valutazioni, mantenendo la velocità e i costi dei nostri modelli di livello medio."
},
@@ -615,25 +654,28 @@
"description": "Versione aggiornata di Claude 2, con una finestra di contesto doppia e miglioramenti nella affidabilità, nel tasso di allucinazione e nell'accuratezza basata su prove nei contesti di documenti lunghi e RAG."
},
"anthropic/claude-3-haiku": {
"description": "Claude 3 Haiku è il modello più veloce e compatto di Anthropic, progettato per fornire risposte quasi istantanee. Ha prestazioni direzionali rapide e accurate."
"description": "Claude 3 Haiku è il modello più veloce di Anthropic finora, progettato per carichi di lavoro aziendali che solitamente coinvolgono prompt lunghi. Haiku può analizzare rapidamente grandi quantità di documenti, come report trimestrali, contratti o casi legali, a metà del costo rispetto ad altri modelli della sua classe di prestazioni."
},
"anthropic/claude-3-opus": {
"description": "Claude 3 Opus è il modello più potente di Anthropic per gestire compiti altamente complessi. Eccelle in prestazioni, intelligenza, fluidità e comprensione."
"description": "Claude 3 Opus è il modello più intelligente di Anthropic, con prestazioni leader di mercato in compiti altamente complessi. Gestisce prompt aperti e scenari mai visti con fluidità eccezionale e comprensione simile a quella umana."
},
"anthropic/claude-3.5-haiku": {
"description": "Claude 3.5 Haiku è il modello di nuova generazione più veloce di Anthropic. Rispetto a Claude 3 Haiku, Claude 3.5 Haiku ha migliorato le proprie capacità e ha superato il modello più grande della generazione precedente, Claude 3 Opus, in molti test di intelligenza."
"description": "Claude 3.5 Haiku è la nuova generazione del nostro modello più veloce. Con velocità simile a Claude 3 Haiku, Claude 3.5 Haiku migliora ogni set di competenze e supera in molti benchmark intelligenti il nostro modello più grande della generazione precedente, Claude 3 Opus."
},
"anthropic/claude-3.5-sonnet": {
"description": "Claude 3.5 Sonnet offre capacità superiori rispetto a Opus e una velocità maggiore rispetto a Sonnet, mantenendo lo stesso prezzo di Sonnet. Sonnet è particolarmente abile in programmazione, scienza dei dati, elaborazione visiva e compiti di agenzia."
"description": "Claude 3.5 Sonnet raggiunge un equilibrio ideale tra intelligenza e velocità, particolarmente adatto per carichi di lavoro aziendali. Offre prestazioni potenti a costi inferiori rispetto ai concorrenti ed è progettato per alta durabilità nelle implementazioni AI su larga scala."
},
"anthropic/claude-3.7-sonnet": {
"description": "Claude 3.7 Sonnet è il modello più intelligente di Anthropic fino ad oggi ed è il primo modello di ragionamento ibrido sul mercato. Claude 3.7 Sonnet può generare risposte quasi istantanee o pensieri prolungati e graduali, consentendo agli utenti di vedere chiaramente questi processi. Sonnet è particolarmente abile nella programmazione, nella scienza dei dati, nell'elaborazione visiva e nei compiti di agenzia."
"description": "Claude 3.7 Sonnet è il primo modello di ragionamento ibrido ed è il modello più intelligente di Anthropic finora. Offre prestazioni all'avanguardia in codifica, generazione di contenuti, analisi dati e pianificazione, costruito sulle capacità di ingegneria del software e uso informatico del suo predecessore Claude 3.5 Sonnet."
},
"anthropic/claude-opus-4": {
"description": "Claude Opus 4 è il modello più potente di Anthropic per gestire compiti altamente complessi. Eccelle in prestazioni, intelligenza, fluidità e capacità di comprensione."
"description": "Claude Opus 4 è il modello più potente di Anthropic e il miglior modello di codifica al mondo, leader nei benchmark SWE-bench (72,5%) e Terminal-bench (43,2%). Fornisce prestazioni continue per compiti a lungo termine che richiedono sforzi concentrati e migliaia di passaggi, lavorando per ore consecutive e ampliando significativamente le capacità degli agenti AI."
},
"anthropic/claude-opus-4.1": {
"description": "Claude Opus 4.1 è un'alternativa plug-and-play a Opus 4, offrendo prestazioni e precisione eccezionali per compiti di codifica e agenti pratici. Opus 4.1 porta le prestazioni di codifica all'avanguardia al 74,5% verificato da SWE-bench, gestendo problemi complessi a più passaggi con maggiore rigore e attenzione ai dettagli."
},
"anthropic/claude-sonnet-4": {
"description": "Claude Sonnet 4 può generare risposte quasi istantanee o un ragionamento esteso e graduale, che gli utenti possono osservare chiaramente. Gli utenti API possono anche controllare con precisione il tempo di riflessione del modello."
"description": "Claude Sonnet 4 migliora significativamente le capacità leader del settore di Sonnet 3.7, eccellendo nella codifica con un punteggio all'avanguardia del 72,7% su SWE-bench. Il modello bilancia prestazioni ed efficienza, adatto a casi d'uso interni ed esterni, e offre un controllo maggiore sull'implementazione grazie a una controllabilità migliorata."
},
"ascend-tribe/pangu-pro-moe": {
"description": "Pangu-Pro-MoE 72B-A16B è un modello linguistico di grandi dimensioni a parametri sparsi con 72 miliardi di parametri totali e 16 miliardi di parametri attivati, basato sull'architettura Mixture of Group Experts (MoGE). Durante la fase di selezione degli esperti, gli esperti sono raggruppati e il token attiva un numero uguale di esperti all'interno di ogni gruppo, garantendo un bilanciamento del carico degli esperti e migliorando significativamente l'efficienza di distribuzione del modello sulla piattaforma Ascend."
@@ -689,6 +731,9 @@
"claude-3-5-haiku-20241022": {
"description": "Claude 3.5 Haiku è il modello di prossima generazione più veloce di Anthropic. Rispetto a Claude 3 Haiku, Claude 3.5 Haiku ha migliorato le proprie capacità in vari ambiti e ha superato il modello di generazione precedente, Claude 3 Opus, in molti test di intelligenza."
},
"claude-3-5-haiku-latest": {
"description": "Claude 3.5 Haiku offre risposte rapide, ideale per compiti leggeri."
},
"claude-3-5-sonnet-20240620": {
"description": "Claude 3.5 Sonnet offre capacità superiori a Opus e velocità più elevate rispetto a Sonnet, mantenendo lo stesso prezzo. Sonnet è particolarmente abile in programmazione, scienza dei dati, elaborazione visiva e compiti di agenti."
},
@@ -698,6 +743,9 @@
"claude-3-7-sonnet-20250219": {
"description": "Claude 3.7 Sonnet è il modello più recente di Anthropic, con prestazioni all'avanguardia in una vasta gamma di valutazioni, superando i modelli concorrenti e Claude 3.5 Sonnet, dimostrando eccellenza in una vasta gamma di valutazioni, mantenendo al contempo la velocità e i costi dei nostri modelli di livello medio."
},
"claude-3-7-sonnet-latest": {
"description": "Claude 3.7 Sonnet è l'ultimo e più potente modello di Anthropic per gestire compiti altamente complessi. Eccelle in prestazioni, intelligenza, fluidità e comprensione."
},
"claude-3-haiku-20240307": {
"description": "Claude 3 Haiku è il modello più veloce e compatto di Anthropic, progettato per risposte quasi istantanee. Ha prestazioni di orientamento rapide e accurate."
},
@@ -710,11 +758,17 @@
"claude-opus-4-1-20250805": {
"description": "Claude Opus 4.1 è l'ultimo e più potente modello di Anthropic per la gestione di compiti altamente complessi. Si distingue per prestazioni, intelligenza, fluidità e capacità di comprensione eccezionali."
},
"claude-opus-4-1-20250805-thinking": {
"description": "Modello di pensiero Claude Opus 4.1, una versione avanzata che mostra il processo di ragionamento."
},
"claude-opus-4-20250514": {
"description": "Claude Opus 4 è il modello più potente di Anthropic per gestire compiti altamente complessi. Eccelle in prestazioni, intelligenza, fluidità e comprensione."
},
"claude-sonnet-4-20250514": {
"description": "Claude 4 Sonnet può generare risposte quasi istantanee o pensieri graduali prolungati, consentendo agli utenti di vedere chiaramente questi processi. Gli utenti dell'API possono anche controllare in modo dettagliato il tempo di riflessione del modello."
"description": "Claude Sonnet 4 può generare risposte quasi istantanee o un pensiero graduale prolungato, permettendo all'utente di vedere chiaramente questi processi."
},
"claude-sonnet-4-20250514-thinking": {
"description": "Modello di pensiero Claude Sonnet 4 che può generare risposte quasi istantanee o un pensiero graduale prolungato, permettendo all'utente di vedere chiaramente questi processi."
},
"codegeex-4": {
"description": "CodeGeeX-4 è un potente assistente di programmazione AI, supporta domande intelligenti e completamento del codice in vari linguaggi di programmazione, migliorando l'efficienza dello sviluppo."
@@ -773,6 +827,18 @@
"cohere/Cohere-command-r-plus": {
"description": "Command R+ è un modello ottimizzato all'avanguardia per RAG, progettato per gestire carichi di lavoro aziendali."
},
"cohere/command-a": {
"description": "Command A è il modello più performante di Cohere finora, eccellente nell'uso di strumenti, agenti, generazione potenziata da recupero (RAG) e casi d'uso multilingue. Command A supporta una lunghezza di contesto di 256K e può essere eseguito con solo due GPU, offrendo un throughput superiore del 150% rispetto a Command R+ 08-2024."
},
"cohere/command-r": {
"description": "Command R è un grande modello linguistico ottimizzato per interazioni conversazionali e compiti con contesti lunghi. Si colloca nella categoria \"scalabile\", bilanciando alte prestazioni e forte accuratezza, permettendo alle aziende di superare la fase di prova concettuale e passare alla produzione."
},
"cohere/command-r-plus": {
"description": "Command R+ è l'ultimo grande modello linguistico di Cohere, ottimizzato per interazioni conversazionali e compiti con contesti lunghi. Mira a prestazioni eccezionali, consentendo alle aziende di superare la prova concettuale e passare alla produzione."
},
"cohere/embed-v4.0": {
"description": "Un modello che consente di classificare o trasformare testo, immagini o contenuti misti in embedding."
},
"command": {
"description": "Un modello di dialogo che segue le istruzioni, con alta qualità e maggiore affidabilità nelle attività linguistiche, e una lunghezza di contesto più lunga rispetto ai nostri modelli generativi di base."
},
@@ -809,12 +875,6 @@
"command-r7b-12-2024": {
"description": "command-r7b-12-2024 è una versione aggiornata, piccola ed efficiente, rilasciata nel dicembre 2024. Eccelle in compiti che richiedono ragionamento complesso e elaborazione in più passaggi, come RAG, uso di strumenti e agenzia."
},
"compound-beta": {
"description": "Compound-beta è un sistema AI composito, supportato da diversi modelli disponibili pubblicamente su GroqCloud, in grado di utilizzare strumenti in modo intelligente e selettivo per rispondere alle domande degli utenti."
},
"compound-beta-mini": {
"description": "Compound-beta-mini è un sistema AI composito, supportato da modelli pubblicamente disponibili su GroqCloud, in grado di utilizzare strumenti in modo intelligente e selettivo per rispondere alle domande degli utenti."
},
"computer-use-preview": {
"description": "Il modello computer-use-preview è un modello dedicato progettato per \"strumenti di utilizzo del computer\", addestrato per comprendere ed eseguire compiti correlati al computer."
},
@@ -957,7 +1017,7 @@
"description": "DeepSeek-V3.1 è un grande modello di ragionamento ibrido che supporta contesti lunghi fino a 128K e un cambio efficiente di modalità. Offre prestazioni e velocità eccellenti nell'uso di strumenti, generazione di codice e compiti di ragionamento complessi."
},
"deepseek/deepseek-r1": {
"description": "DeepSeek-R1 ha notevolmente migliorato le capacità di ragionamento del modello con pochissimi dati etichettati. Prima di fornire la risposta finale, il modello genera una catena di pensiero per migliorare l'accuratezza della risposta finale."
"description": "Il modello DeepSeek R1 ha ricevuto un aggiornamento minore, attualmente versione DeepSeek-R1-0528. Nell'ultimo aggiornamento, DeepSeek R1 ha migliorato significativamente la profondità e la capacità di ragionamento sfruttando risorse computazionali aumentate e introducendo meccanismi di ottimizzazione algoritmica post-addestramento. Il modello eccelle in benchmark di matematica, programmazione e logica generale, avvicinandosi alle prestazioni di modelli leader come O3 e Gemini 2.5 Pro."
},
"deepseek/deepseek-r1-0528": {
"description": "DeepSeek-R1 migliora notevolmente la capacità di ragionamento del modello anche con pochissimi dati annotati. Prima di fornire la risposta finale, il modello genera una catena di pensieri per aumentare la precisione della risposta."
@@ -966,7 +1026,7 @@
"description": "DeepSeek-R1 migliora notevolmente la capacità di ragionamento del modello anche con pochissimi dati annotati. Prima di fornire la risposta finale, il modello genera una catena di pensieri per aumentare la precisione della risposta."
},
"deepseek/deepseek-r1-distill-llama-70b": {
"description": "DeepSeek R1 Distill Llama 70B è un grande modello di linguaggio basato su Llama3.3 70B, che utilizza il fine-tuning dell'output di DeepSeek R1 per raggiungere prestazioni competitive paragonabili a quelle dei modelli all'avanguardia di grandi dimensioni."
"description": "DeepSeek-R1-Distill-Llama-70B è una variante distillata e più efficiente del modello Llama da 70B. Mantiene prestazioni robuste nelle attività di generazione testuale, riducendo il carico computazionale per facilitare il deployment e la ricerca. Servito da Groq con il suo hardware personalizzato Language Processing Unit (LPU) per inferenze rapide ed efficienti."
},
"deepseek/deepseek-r1-distill-llama-8b": {
"description": "DeepSeek R1 Distill Llama 8B è un modello di linguaggio distillato basato su Llama-3.1-8B-Instruct, addestrato utilizzando l'output di DeepSeek R1."
@@ -984,7 +1044,10 @@
"description": "DeepSeek-R1 ha notevolmente migliorato le capacità di ragionamento del modello con pochissimi dati etichettati. Prima di fornire la risposta finale, il modello genera una catena di pensiero per migliorare l'accuratezza della risposta finale."
},
"deepseek/deepseek-v3": {
"description": "DeepSeek-V3 ha realizzato un significativo progresso nella velocità di inferenza rispetto ai modelli precedenti. Si posiziona al primo posto tra i modelli open source e può competere con i modelli closed source più avanzati al mondo. DeepSeek-V3 utilizza l'architettura Multi-Head Latent Attention (MLA) e DeepSeekMoE, che sono state ampiamente validate in DeepSeek-V2. Inoltre, DeepSeek-V3 ha introdotto una strategia ausiliaria senza perdita per il bilanciamento del carico e ha stabilito obiettivi di addestramento per la previsione multi-etichetta per ottenere prestazioni superiori."
"description": "Un modello linguistico grande universale veloce con capacità di ragionamento potenziate."
},
"deepseek/deepseek-v3.1-base": {
"description": "DeepSeek V3.1 Base è una versione migliorata del modello DeepSeek V3."
},
"deepseek/deepseek-v3/community": {
"description": "DeepSeek-V3 ha realizzato un significativo progresso nella velocità di inferenza rispetto ai modelli precedenti. Si posiziona al primo posto tra i modelli open source e può competere con i modelli closed source più avanzati al mondo. DeepSeek-V3 utilizza l'architettura Multi-Head Latent Attention (MLA) e DeepSeekMoE, che sono state ampiamente validate in DeepSeek-V2. Inoltre, DeepSeek-V3 ha introdotto una strategia ausiliaria senza perdita per il bilanciamento del carico e ha stabilito obiettivi di addestramento per la previsione multi-etichetta per ottenere prestazioni superiori."
@@ -1055,8 +1118,17 @@
"doubao-seed-1.6-thinking": {
"description": "Il modello Doubao-Seed-1.6-thinking ha capacità di pensiero notevolmente potenziate; rispetto a Doubao-1.5-thinking-pro, migliora ulteriormente le capacità di base come coding, matematica e ragionamento logico, supportando anche la comprensione visiva. Supporta una finestra contestuale di 256k e una lunghezza massima di output di 16k token."
},
"doubao-seed-1.6-vision": {
"description": "Doubao-Seed-1.6-vision è un modello di pensiero profondo visivo che dimostra una più forte capacità di comprensione e ragionamento multimodale generale in scenari come educazione, revisione delle immagini, ispezione e sicurezza, e ricerca e risposta AI. Supporta una finestra di contesto di 256k e una lunghezza di output fino a 64k token."
},
"doubao-seededit-3-0-i2i-250628": {
"description": "Il modello di generazione immagini Doubao è sviluppato dal team Seed di ByteDance, supporta input di testo e immagini, offrendo un'esperienza di generazione immagini altamente controllabile e di alta qualità. Supporta l'editing delle immagini tramite comandi testuali, con dimensioni dell'immagine generate tra 512 e 1536 pixel."
},
"doubao-seedream-3-0-t2i-250415": {
"description": "Il modello di generazione immagini Doubao è sviluppato dal team Seed di ByteDance, supporta input di testo e immagini, offrendo un'esperienza di generazione immagini altamente controllabile e di alta qualità. Genera immagini basate su prompt testuali."
"description": "Il modello di generazione immagini Seedream 3.0, sviluppato dal team Seed di ByteDance, supporta input di testo e immagini, offrendo un'esperienza di generazione immagini altamente controllabile e di alta qualità. Genera immagini basate su prompt testuali."
},
"doubao-seedream-4-0-250828": {
"description": "Il modello di generazione immagini Seedream 4.0, sviluppato dal team Seed di ByteDance, supporta input di testo e immagini, offrendo un'esperienza di generazione immagini altamente controllabile e di alta qualità. Genera immagini basate su prompt testuali."
},
"doubao-vision-lite-32k": {
"description": "Il modello Doubao-vision è un modello multimodale lanciato da Doubao, con potenti capacità di comprensione e ragionamento delle immagini e una precisa comprensione delle istruzioni. Il modello mostra prestazioni eccellenti nell'estrazione di informazioni da testo e immagini e in compiti di ragionamento basati su immagini, applicabile a compiti di domande visive più complessi e ampi."
@@ -1139,6 +1211,33 @@
"ernie-x1-turbo-32k": {
"description": "Rispetto a ERNIE-X1-32K, il modello offre prestazioni e risultati migliori."
},
"fal-ai/bytedance/seedream/v4": {
"description": "Il modello di generazione immagini Seedream 4.0, sviluppato dal team Seed di ByteDance, supporta input di testo e immagini, offrendo un'esperienza di generazione immagini altamente controllabile e di alta qualità. Genera immagini basate su prompt testuali."
},
"fal-ai/flux-kontext/dev": {
"description": "Modello FLUX.1 focalizzato su compiti di editing immagini, supporta input di testo e immagini."
},
"fal-ai/flux-pro/kontext": {
"description": "FLUX.1 Kontext [pro] può gestire testo e immagini di riferimento come input, realizzando senza soluzione di continuità modifiche locali mirate e trasformazioni complesse di scene complete."
},
"fal-ai/flux/krea": {
"description": "Flux Krea [dev] è un modello di generazione immagini con preferenze estetiche, mirato a creare immagini più realistiche e naturali."
},
"fal-ai/flux/schnell": {
"description": "FLUX.1 [schnell] è un modello di generazione immagini con 12 miliardi di parametri, focalizzato sulla generazione rapida di immagini di alta qualità."
},
"fal-ai/imagen4/preview": {
"description": "Modello di generazione immagini di alta qualità fornito da Google."
},
"fal-ai/nano-banana": {
"description": "Nano Banana è l'ultimo modello multimodale nativo di Google, il più veloce ed efficiente, che consente di generare e modificare immagini tramite conversazione."
},
"fal-ai/qwen-image": {
"description": "Potente modello di immagini grezze del team Qwen, con impressionante capacità di generazione di testo in cinese e stili visivi di immagini diversificati."
},
"fal-ai/qwen-image-edit": {
"description": "Modello professionale di editing immagini rilasciato dal team Qwen, supporta editing semantico e di aspetto, può modificare con precisione testi in cinese e inglese, realizzare trasformazioni di stile, rotazioni di oggetti e altre modifiche di alta qualità."
},
"flux-1-schnell": {
"description": "Modello di generazione immagini da testo con 12 miliardi di parametri sviluppato da Black Forest Labs, che utilizza la tecnologia di distillazione di diffusione antagonista latente, capace di generare immagini di alta qualità in 1-4 passaggi. Le prestazioni sono comparabili a soluzioni proprietarie, rilasciato sotto licenza Apache-2.0 per uso personale, di ricerca e commerciale."
},
@@ -1151,9 +1250,6 @@
"flux-kontext-pro": {
"description": "Generazione e modifica di immagini contestuali all'avanguardia — combina testo e immagini per ottenere risultati precisi e coerenti."
},
"flux-kontext/dev": {
"description": "Modello FLUX.1 focalizzato su compiti di modifica delle immagini, supporta input di testo e immagini."
},
"flux-merged": {
"description": "Il modello FLUX.1-merged combina le caratteristiche approfondite esplorate nella fase di sviluppo \"DEV\" con i vantaggi di esecuzione rapida rappresentati da \"Schnell\". Questa combinazione non solo estende i limiti di prestazione del modello, ma ne amplia anche l'ambito di applicazione."
},
@@ -1166,21 +1262,12 @@
"flux-pro-1.1-ultra": {
"description": "Generazione di immagini AI ad altissima risoluzione — supporta output fino a 4 megapixel, genera immagini in altissima definizione in meno di 10 secondi."
},
"flux-pro/kontext": {
"description": "FLUX.1 Kontext [pro] è in grado di elaborare testo e immagini di riferimento come input, realizzando senza soluzione di continuità modifiche locali mirate e complesse trasformazioni dell'intera scena."
},
"flux-schnell": {
"description": "FLUX.1 [schnell], attualmente il modello open source più avanzato a pochi passaggi, supera non solo i concorrenti simili ma anche potenti modelli non raffinati come Midjourney v6.0 e DALL·E 3 (HD). Ottimizzato per mantenere tutta la diversità di output della fase di pre-addestramento, migliora significativamente qualità visiva, aderenza alle istruzioni, variazioni di dimensione/proporzione, gestione dei font e diversità di output rispetto ai modelli più avanzati sul mercato, offrendo un'esperienza creativa più ricca e variegata."
},
"flux.1-schnell": {
"description": "Trasformatore di flusso rettificato con 12 miliardi di parametri, capace di generare immagini basate su descrizioni testuali."
},
"flux/krea": {
"description": "Flux Krea [dev] è un modello di generazione di immagini con preferenze estetiche, progettato per creare immagini più realistiche e naturali."
},
"flux/schnell": {
"description": "FLUX.1 [schnell] è un modello di generazione di immagini con 12 miliardi di parametri, focalizzato sulla generazione rapida di immagini di alta qualità."
},
"gemini-1.0-pro-001": {
"description": "Gemini 1.0 Pro 001 (Tuning) offre prestazioni stabili e ottimizzabili, è la scelta ideale per soluzioni a compiti complessi."
},
@@ -1388,20 +1475,26 @@
"glm-zero-preview": {
"description": "GLM-Zero-Preview possiede potenti capacità di ragionamento complesso, eccellendo nei campi del ragionamento logico, della matematica e della programmazione."
},
"google/gemini-2.0-flash": {
"description": "Gemini 2.0 Flash offre funzionalità di nuova generazione e miglioramenti, inclusa velocità eccezionale, uso integrato di strumenti, generazione multimodale e una finestra di contesto di 1 milione di token."
},
"google/gemini-2.0-flash-001": {
"description": "Gemini 2.0 Flash offre funzionalità e miglioramenti di nuova generazione, tra cui velocità eccezionale, utilizzo di strumenti nativi, generazione multimodale e una finestra di contesto di 1M token."
},
"google/gemini-2.0-flash-exp:free": {
"description": "Gemini 2.0 Flash Experimental è il più recente modello AI multimodale sperimentale di Google, con un miglioramento della qualità rispetto alle versioni storiche, in particolare per quanto riguarda la conoscenza del mondo, il codice e il lungo contesto."
},
"google/gemini-2.0-flash-lite": {
"description": "Gemini 2.0 Flash Lite offre funzionalità di nuova generazione e miglioramenti, inclusa velocità eccezionale, uso integrato di strumenti, generazione multimodale e una finestra di contesto di 1 milione di token."
},
"google/gemini-2.5-flash": {
"description": "Gemini 2.5 Flash è il modello principale più avanzato di Google, progettato per compiti avanzati di ragionamento, codifica, matematica e scienze. Include capacità di “pensiero” integrate, che gli permettono di fornire risposte con maggiore accuratezza e una gestione più dettagliata del contesto.\n\nNota: questo modello ha due varianti: con pensiero e senza pensiero. Il prezzo di output varia significativamente a seconda che la capacità di pensiero sia attivata o meno. Se scegli la variante standard (senza il suffisso “:thinking”), il modello eviterà esplicitamente di generare token di pensiero.\n\nPer sfruttare la capacità di pensiero e ricevere token di pensiero, devi selezionare la variante “:thinking”, che comporta un prezzo di output più elevato per il pensiero.\n\nInoltre, Gemini 2.5 Flash può essere configurato tramite il parametro “max tokens for reasoning”, come descritto nella documentazione (https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning)."
"description": "Gemini 2.5 Flash è un modello di ragionamento che offre capacità eccellenti e complete. È progettato per bilanciare prezzo e prestazioni, supportando input multimodali e una finestra di contesto di 1 milione di token."
},
"google/gemini-2.5-flash-image-preview": {
"description": "Modello sperimentale Gemini 2.5 Flash, supporta la generazione di immagini."
},
"google/gemini-2.5-flash-image-preview:free": {
"description": "Modello sperimentale Gemini 2.5 Flash, supporta la generazione di immagini."
"google/gemini-2.5-flash-lite": {
"description": "Gemini 2.5 Flash-Lite è un modello bilanciato a bassa latenza con budget di ragionamento configurabile e connettività agli strumenti (ad esempio, Google Search grounding ed esecuzione di codice). Supporta input multimodali e offre una finestra di contesto di 1 milione di token."
},
"google/gemini-2.5-flash-preview": {
"description": "Gemini 2.5 Flash è il modello principale più avanzato di Google, progettato per ragionamenti avanzati, codifica, matematica e compiti scientifici. Include capacità di 'pensiero' integrate, permettendo di fornire risposte con maggiore accuratezza e una gestione contestuale più dettagliata.\n\nNota: questo modello ha due varianti: pensiero e non pensiero. I prezzi di output variano significativamente a seconda che la capacità di pensiero sia attivata o meno. Se scegli la variante standard (senza il suffisso ':thinking'), il modello eviterà esplicitamente di generare token di pensiero.\n\nPer sfruttare la capacità di pensiero e ricevere token di pensiero, devi scegliere la variante ':thinking', che comporterà un prezzo di output di pensiero più elevato.\n\nInoltre, Gemini 2.5 Flash può essere configurato tramite il parametro 'numero massimo di token per il ragionamento', come descritto nella documentazione (https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning)."
@@ -1410,11 +1503,14 @@
"description": "Gemini 2.5 Flash è il modello principale più avanzato di Google, progettato per ragionamenti avanzati, codifica, matematica e compiti scientifici. Include capacità di 'pensiero' integrate, permettendo di fornire risposte con maggiore accuratezza e una gestione contestuale più dettagliata.\n\nNota: questo modello ha due varianti: pensiero e non pensiero. I prezzi di output variano significativamente a seconda che la capacità di pensiero sia attivata o meno. Se scegli la variante standard (senza il suffisso ':thinking'), il modello eviterà esplicitamente di generare token di pensiero.\n\nPer sfruttare la capacità di pensiero e ricevere token di pensiero, devi scegliere la variante ':thinking', che comporterà un prezzo di output di pensiero più elevato.\n\nInoltre, Gemini 2.5 Flash può essere configurato tramite il parametro 'numero massimo di token per il ragionamento', come descritto nella documentazione (https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning)."
},
"google/gemini-2.5-pro": {
"description": "Gemini 2.5 Pro è il modello di pensiero più avanzato di Google, capace di ragionare su problemi complessi nel codice, nella matematica e nei campi STEM, nonché di analizzare grandi set di dati, codebase e documenti utilizzando un contesto esteso."
"description": "Gemini 2.5 Pro è il nostro modello Gemini di ragionamento più avanzato, capace di risolvere problemi complessi. Ha una finestra di contesto di 2 milioni di token e supporta input multimodali tra cui testo, immagini, audio, video e documenti PDF."
},
"google/gemini-2.5-pro-preview": {
"description": "Gemini 2.5 Pro Preview è il modello di pensiero più avanzato di Google, in grado di ragionare su problemi complessi nel campo del codice, della matematica e delle STEM, oltre a utilizzare un contesto esteso per analizzare grandi set di dati, repository di codice e documenti."
},
"google/gemini-embedding-001": {
"description": "Modello di embedding all'avanguardia con prestazioni eccellenti in compiti in inglese, multilingue e codice."
},
"google/gemini-flash-1.5": {
"description": "Gemini 1.5 Flash offre capacità di elaborazione multimodale ottimizzate, adatte a vari scenari di compiti complessi."
},
@@ -1442,12 +1538,21 @@
"google/gemma-2b-it": {
"description": "Gemma Instruct (2B) offre capacità di elaborazione di istruzioni di base, adatta per applicazioni leggere."
},
"google/gemma-3-12b-it": {
"description": "Gemma 3 12B è un modello linguistico open source di Google che ha stabilito nuovi standard in termini di efficienza e prestazioni."
},
"google/gemma-3-1b-it": {
"description": "Gemma 3 1B è un modello linguistico open source di Google che ha stabilito nuovi standard in termini di efficienza e prestazioni."
},
"google/gemma-3-27b-it": {
"description": "Gemma 3 27B è un modello linguistico open source di Google, che ha stabilito nuovi standard in termini di efficienza e prestazioni."
},
"google/text-embedding-005": {
"description": "Modello di embedding testuale focalizzato sull'inglese, ottimizzato per compiti di codice e linguaggio inglese."
},
"google/text-multilingual-embedding-002": {
"description": "Modello di embedding testuale multilingue ottimizzato per compiti cross-lingua, supporta molte lingue."
},
"gpt-3.5-turbo": {
"description": "GPT 3.5 Turbo, adatto a una varietà di compiti di generazione e comprensione del testo, attualmente punta a gpt-3.5-turbo-0125."
},
@@ -1604,9 +1709,18 @@
"grok-4": {
"description": "Il nostro modello di punta più recente e potente, eccellente nell'elaborazione del linguaggio naturale, nel calcolo matematico e nel ragionamento — un vero campione versatile e completo."
},
"grok-4-0709": {
"description": "Grok 4 di xAI, dotato di potenti capacità di ragionamento."
},
"grok-code-fast-1": {
"description": "Siamo lieti di presentare grok-code-fast-1, un modello di inferenza rapido ed economico, eccellente nella codifica degli agenti."
},
"groq/compound": {
"description": "Compound è un sistema AI composito supportato da diversi modelli open source disponibili su GroqCloud, che può utilizzare strumenti in modo intelligente e selettivo per rispondere alle richieste degli utenti."
},
"groq/compound-mini": {
"description": "Compound-mini è un sistema AI composito supportato da modelli open source disponibili su GroqCloud, che può utilizzare strumenti in modo intelligente e selettivo per rispondere alle richieste degli utenti."
},
"gryphe/mythomax-l2-13b": {
"description": "MythoMax l2 13B è un modello linguistico che combina creatività e intelligenza, unendo diversi modelli di punta."
},
@@ -1662,7 +1776,7 @@
"description": "Miglioramento significativo delle capacità in matematica avanzata, logica e codice, ottimizzazione della stabilità dell'output e potenziamento della capacità di gestione di testi lunghi."
},
"hunyuan-t1-latest": {
"description": "Il primo modello di inferenza ibrido su larga scala Hybrid-Transformer-Mamba del settore, che espande le capacità di inferenza, offre una velocità di decodifica eccezionale e allinea ulteriormente le preferenze umane."
"description": "Migliora significativamente le capacità del modello principale e del modello di pensiero lento in matematica avanzata, ragionamento complesso, codice difficile, rispetto delle istruzioni e qualità della creazione testuale."
},
"hunyuan-t1-vision": {
"description": "Modello di comprensione multimodale profonda Hunyuan, supporta catene di pensiero native multimodali, eccelle in vari scenari di ragionamento visivo e migliora significativamente rispetto ai modelli di pensiero rapido nei problemi scientifici."
@@ -1730,8 +1844,11 @@
"imagen-4.0-ultra-generate-preview-06-06": {
"description": "Serie di modelli di generazione di immagini da testo di quarta generazione Imagen versione Ultra"
},
"imagen4/preview": {
"description": "Modello di generazione di immagini di alta qualità fornito da Google."
"inception/mercury-coder-small": {
"description": "Mercury Coder Small è la scelta ideale per compiti di generazione, debug e refactoring di codice, con latenza minima."
},
"inclusionAI/Ling-mini-2.0": {
"description": "Ling-mini-2.0 è un modello linguistico di grandi dimensioni ad alte prestazioni e di piccole dimensioni basato sull'architettura MoE. Possiede 16 miliardi di parametri totali, ma per ogni token ne attiva solo 1,4 miliardi (non embedding 789 milioni), consentendo così una velocità di generazione estremamente elevata. Grazie a un design MoE efficiente e a dati di addestramento di alta qualità su larga scala, nonostante i soli 1,4 miliardi di parametri attivi, Ling-mini-2.0 dimostra prestazioni di punta in compiti downstream comparabili a modelli LLM densi sotto i 10 miliardi e a modelli MoE di dimensioni maggiori."
},
"internlm/internlm2_5-7b-chat": {
"description": "InternLM2.5 offre soluzioni di dialogo intelligente in vari scenari."
@@ -1766,6 +1883,9 @@
"kimi-k2-0711-preview": {
"description": "kimi-k2 è un modello base con architettura MoE dotato di potenti capacità di codice e Agent, con un totale di 1T parametri e 32B parametri attivi. Nei test di benchmark per ragionamento generale, programmazione, matematica e Agent, il modello K2 supera altri modelli open source principali."
},
"kimi-k2-0905-preview": {
"description": "Il modello kimi-k2-0905-preview ha una lunghezza di contesto di 256k, con capacità di Agentic Coding più forti, una migliore estetica e praticità del codice frontend, e una migliore comprensione del contesto."
},
"kimi-k2-turbo-preview": {
"description": "kimi-k2 è un modello di base con architettura MoE che offre potenti capacità di programmazione e di agent, con 1T di parametri totali e 32B di parametri attivi. Nei benchmark delle principali categorie — ragionamento su conoscenze generali, programmazione, matematica e agent — il modello K2 supera gli altri modelli open source più diffusi."
},
@@ -2003,30 +2123,63 @@
"meta/Meta-Llama-3.1-8B-Instruct": {
"description": "Modello testuale Llama 3.1 ottimizzato per istruzioni, progettato per casi d'uso di dialogo multilingue, con prestazioni eccellenti in molti benchmark industriali rispetto a numerosi modelli di chat open source e proprietari."
},
"meta/llama-3-70b": {
"description": "Modello open source da 70 miliardi di parametri finemente ottimizzato da Meta per l'aderenza alle istruzioni. Servito da Groq con il suo hardware personalizzato Language Processing Unit (LPU) per inferenze rapide ed efficienti."
},
"meta/llama-3-8b": {
"description": "Modello open source da 8 miliardi di parametri finemente ottimizzato da Meta per l'aderenza alle istruzioni. Servito da Groq con il suo hardware personalizzato Language Processing Unit (LPU) per inferenze rapide ed efficienti."
},
"meta/llama-3.1-405b-instruct": {
"description": "LLM avanzato, supporta la generazione di dati sintetici, la distillazione della conoscenza e il ragionamento, adatto per chatbot, programmazione e compiti specifici."
},
"meta/llama-3.1-70b": {
"description": "Versione aggiornata di Meta Llama 3 70B Instruct, con lunghezza di contesto estesa a 128K, supporto multilingue e capacità di ragionamento migliorate."
},
"meta/llama-3.1-70b-instruct": {
"description": "Abilita conversazioni complesse, con eccellenti capacità di comprensione del contesto, ragionamento e generazione di testo."
},
"meta/llama-3.1-8b": {
"description": "Llama 3.1 8B supporta una finestra di contesto di 128K, ideale per interfacce di dialogo in tempo reale e analisi dati, offrendo risparmi significativi sui costi rispetto a modelli più grandi. Servito da Groq con il suo hardware personalizzato Language Processing Unit (LPU) per inferenze rapide ed efficienti."
},
"meta/llama-3.1-8b-instruct": {
"description": "Modello all'avanguardia, dotato di comprensione del linguaggio, eccellenti capacità di ragionamento e generazione di testo."
},
"meta/llama-3.2-11b": {
"description": "Modello di generazione di ragionamento visivo regolato con istruzioni (input testo + immagine / output testo), ottimizzato per riconoscimento visivo, ragionamento su immagini, generazione di didascalie e risposte a domande generali sulle immagini."
},
"meta/llama-3.2-11b-vision-instruct": {
"description": "Modello visivo-linguistico all'avanguardia, specializzato nel ragionamento di alta qualità a partire dalle immagini."
},
"meta/llama-3.2-1b": {
"description": "Modello solo testo, supporta casi d'uso on-device come recupero di conoscenza locale multilingue, sintesi e riscrittura."
},
"meta/llama-3.2-1b-instruct": {
"description": "Modello linguistico all'avanguardia di piccole dimensioni, dotato di comprensione del linguaggio, eccellenti capacità di ragionamento e generazione di testo."
},
"meta/llama-3.2-3b": {
"description": "Modello solo testo, finemente ottimizzato per supportare casi d'uso on-device come recupero di conoscenza locale multilingue, sintesi e riscrittura."
},
"meta/llama-3.2-3b-instruct": {
"description": "Modello linguistico all'avanguardia di piccole dimensioni, dotato di comprensione del linguaggio, eccellenti capacità di ragionamento e generazione di testo."
},
"meta/llama-3.2-90b": {
"description": "Modello di generazione di ragionamento visivo regolato con istruzioni (input testo + immagine / output testo), ottimizzato per riconoscimento visivo, ragionamento su immagini, generazione di didascalie e risposte a domande generali sulle immagini."
},
"meta/llama-3.2-90b-vision-instruct": {
"description": "Modello visivo-linguistico all'avanguardia, specializzato nel ragionamento di alta qualità a partire dalle immagini."
},
"meta/llama-3.3-70b": {
"description": "Combinazione perfetta di prestazioni ed efficienza. Il modello supporta AI conversazionale ad alte prestazioni, progettato per creazione di contenuti, applicazioni aziendali e ricerca, offrendo capacità avanzate di comprensione linguistica, inclusi riassunti testuali, classificazione, analisi del sentiment e generazione di codice."
},
"meta/llama-3.3-70b-instruct": {
"description": "LLM avanzato, specializzato in ragionamento, matematica, conoscenze generali e chiamate di funzione."
},
"meta/llama-4-maverick": {
"description": "La collezione di modelli Llama 4 è un AI multimodale nativa che supporta esperienze testuali e multimodali. Questi modelli utilizzano un'architettura a esperti misti per offrire prestazioni leader nel settore nella comprensione di testo e immagini. Llama 4 Maverick, un modello da 17 miliardi di parametri con 128 esperti. Servito da DeepInfra."
},
"meta/llama-4-scout": {
"description": "La collezione di modelli Llama 4 è un AI multimodale nativa che supporta esperienze testuali e multimodali. Questi modelli utilizzano un'architettura a esperti misti per offrire prestazioni leader nel settore nella comprensione di testo e immagini. Llama 4 Scout, un modello da 17 miliardi di parametri con 16 esperti. Servito da DeepInfra."
},
"microsoft/Phi-3-medium-128k-instruct": {
"description": "Stesso modello Phi-3-medium, ma con una dimensione del contesto maggiore, adatto per RAG o pochi prompt."
},
@@ -2102,6 +2255,48 @@
"mistral-small-latest": {
"description": "Mistral Small è un'opzione economica, veloce e affidabile, adatta per casi d'uso come traduzione, sintesi e analisi del sentiment."
},
"mistral/codestral": {
"description": "Mistral Codestral 25.01 è un modello di codifica all'avanguardia, ottimizzato per casi d'uso a bassa latenza e alta frequenza. Esperto in oltre 80 linguaggi di programmazione, eccelle in compiti come filling intermedio (FIM), correzione del codice e generazione di test."
},
"mistral/codestral-embed": {
"description": "Modello di embedding di codice che può essere integrato in database e repository di codice per supportare assistenti di codifica."
},
"mistral/devstral-small": {
"description": "Devstral è un grande modello linguistico agente per compiti di ingegneria del software, rendendolo una scelta eccellente per agenti di ingegneria del software."
},
"mistral/magistral-medium": {
"description": "Pensiero complesso supportato da una profonda comprensione, con ragionamento trasparente che puoi seguire e verificare. Il modello mantiene un ragionamento ad alta fedeltà in molte lingue, anche quando cambia lingua a metà compito."
},
"mistral/magistral-small": {
"description": "Pensiero complesso supportato da una profonda comprensione, con ragionamento trasparente che puoi seguire e verificare. Il modello mantiene un ragionamento ad alta fedeltà in molte lingue, anche quando cambia lingua a metà compito."
},
"mistral/ministral-3b": {
"description": "Un modello compatto ed efficiente per compiti on-device come assistenti intelligenti e analisi locali, che offre prestazioni a bassa latenza."
},
"mistral/ministral-8b": {
"description": "Un modello più potente con inferenza più veloce e efficiente in memoria, ideale per flussi di lavoro complessi e applicazioni edge esigenti."
},
"mistral/mistral-embed": {
"description": "Modello di embedding testuale universale per ricerca semantica, similarità, clustering e flussi di lavoro RAG."
},
"mistral/mistral-large": {
"description": "Mistral Large è la scelta ideale per compiti complessi che richiedono grandi capacità di ragionamento o alta specializzazione, come generazione di testo sintetico, generazione di codice, RAG o agenti."
},
"mistral/mistral-saba-24b": {
"description": "Mistral Saba 24B è un modello open source da 24 miliardi di parametri sviluppato da Mistral.ai. Saba è un modello specializzato addestrato per eccellere in arabo, persiano, urdu, ebraico e lingue indiane. Servito da Groq con il suo hardware personalizzato Language Processing Unit (LPU) per inferenze rapide ed efficienti."
},
"mistral/mistral-small": {
"description": "Mistral Small è la scelta ideale per compiti semplici che possono essere eseguiti in batch, come classificazione, supporto clienti o generazione di testo. Offre ottime prestazioni a un prezzo accessibile."
},
"mistral/mixtral-8x22b-instruct": {
"description": "Modello 8x22b Instruct. 8x22b è un modello open source a esperti misti servito da Mistral."
},
"mistral/pixtral-12b": {
"description": "Un modello da 12 miliardi con capacità di comprensione delle immagini, oltre al testo."
},
"mistral/pixtral-large": {
"description": "Pixtral Large è il secondo modello della nostra famiglia multimodale, che dimostra capacità di comprensione delle immagini all'avanguardia. In particolare, il modello è in grado di comprendere documenti, grafici e immagini naturali, mantenendo le capacità di comprensione testuale leader di Mistral Large 2."
},
"mistralai/Mistral-7B-Instruct-v0.1": {
"description": "Mistral (7B) Instruct è noto per le sue alte prestazioni, adatto per vari compiti linguistici."
},
@@ -2165,8 +2360,23 @@
"moonshotai/Kimi-K2-Instruct": {
"description": "Kimi K2 è un modello base con architettura MoE dotato di potenti capacità di codice e agenti, con 1 trilione di parametri totali e 32 miliardi di parametri attivi. Nei test di benchmark su ragionamento generale, programmazione, matematica e agenti, il modello K2 supera altri modelli open source principali."
},
"moonshotai/kimi-k2-instruct": {
"description": "kimi-k2 è un modello di base con architettura MoE dotato di potenti capacità di codice e agenti, con un totale di 1T parametri e 32B parametri attivi. Nei test di benchmark per categorie principali come ragionamento generale, programmazione, matematica e agenti, il modello K2 supera le altre principali soluzioni open source."
"moonshotai/Kimi-K2-Instruct-0905": {
"description": "Kimi K2-Instruct-0905 è l'ultima e più potente versione di Kimi K2. Si tratta di un modello linguistico di esperti misti (MoE) all'avanguardia, con un totale di 1 trilione di parametri e 32 miliardi di parametri attivi. Le caratteristiche principali del modello includono: intelligenza potenziata per la codifica degli agenti, con miglioramenti significativi nelle prestazioni sia nei test di riferimento pubblici sia nelle attività di codifica degli agenti nel mondo reale; esperienza di codifica frontend migliorata, con progressi sia nell'estetica che nella praticità della programmazione frontend."
},
"moonshotai/kimi-k2": {
"description": "Kimi K2 è un modello linguistico a esperti misti (MoE) su larga scala sviluppato da Moonshot AI, con un totale di 1 trilione di parametri e 32 miliardi di parametri attivi per ogni passaggio in avanti. Ottimizzato per capacità di agente, inclusi uso avanzato di strumenti, ragionamento e sintesi di codice."
},
"moonshotai/kimi-k2-0905": {
"description": "Il modello kimi-k2-0905-preview ha una lunghezza di contesto di 256k, con capacità di Agentic Coding più forti, una migliore estetica e praticità del codice frontend, e una migliore comprensione del contesto."
},
"moonshotai/kimi-k2-instruct-0905": {
"description": "Il modello kimi-k2-0905-preview ha una lunghezza di contesto di 256k, con capacità di Agentic Coding più forti, una migliore estetica e praticità del codice frontend, e una migliore comprensione del contesto."
},
"morph/morph-v3-fast": {
"description": "Morph offre un modello AI specializzato che applica rapidamente le modifiche al codice suggerite da modelli all'avanguardia come Claude o GPT-4o ai tuoi file di codice esistenti - VELOCE - oltre 4500 token al secondo. Funziona come l'ultimo passo nel flusso di lavoro di codifica AI. Supporta 16k token in input e 16k token in output."
},
"morph/morph-v3-large": {
"description": "Morph offre un modello AI specializzato che applica le modifiche al codice suggerite da modelli all'avanguardia come Claude o GPT-4o ai tuoi file di codice esistenti - VELOCE - oltre 2500 token al secondo. Funziona come l'ultimo passo nel flusso di lavoro di codifica AI. Supporta 16k token in input e 16k token in output."
},
"nousresearch/hermes-2-pro-llama-3-8b": {
"description": "Hermes 2 Pro Llama 3 8B è una versione aggiornata di Nous Hermes 2, contenente i più recenti dataset sviluppati internamente."
@@ -2195,6 +2405,9 @@
"o3": {
"description": "o3 è un modello versatile e potente, che si distingue in vari campi. Stabilisce nuovi standard per compiti di matematica, scienza, programmazione e ragionamento visivo. È anche abile nella scrittura tecnica e nel seguire istruzioni. Gli utenti possono utilizzarlo per analizzare testi, codici e immagini, risolvendo problemi complessi in più passaggi."
},
"o3-2025-04-16": {
"description": "o3 è il nuovo modello di ragionamento di OpenAI, supporta input di testo e immagini e produce testo in output, adatto a compiti complessi che richiedono conoscenze ampie e generali."
},
"o3-deep-research": {
"description": "o3-deep-research è il nostro modello di ricerca approfondita più avanzato, progettato specificamente per gestire compiti di ricerca complessi e articolati. Può cercare e sintetizzare informazioni da Internet, oltre a poter accedere e utilizzare i tuoi dati tramite il connettore MCP."
},
@@ -2204,9 +2417,15 @@
"o3-pro": {
"description": "Il modello o3-pro utilizza maggiori risorse computazionali per un pensiero più profondo e fornisce sempre risposte migliori, supportato solo tramite l'API Responses."
},
"o3-pro-2025-06-10": {
"description": "o3 Pro è il nuovo modello di ragionamento di OpenAI, supporta input di testo e immagini e produce testo in output, adatto a compiti complessi che richiedono conoscenze ampie e generali."
},
"o4-mini": {
"description": "o4-mini è il nostro ultimo modello della serie o in formato ridotto. È ottimizzato per un'inferenza rapida ed efficace, mostrando un'elevata efficienza e prestazioni in compiti di codifica e visivi."
},
"o4-mini-2025-04-16": {
"description": "o4-mini è un modello di ragionamento di OpenAI, supporta input di testo e immagini e produce testo in output, adatto a compiti complessi che richiedono conoscenze ampie e generali. Questo modello ha un contesto di 200K token."
},
"o4-mini-deep-research": {
"description": "o4-mini-deep-research è il nostro modello di ricerca approfondita più rapido ed economico, ideale per gestire compiti di ricerca complessi e articolati. Può cercare e sintetizzare informazioni da Internet, oltre a poter accedere e utilizzare i tuoi dati tramite il connettore MCP."
},
@@ -2225,29 +2444,47 @@
"open-mixtral-8x7b": {
"description": "Mixtral 8x7B è un modello di esperti sparsi, che utilizza più parametri per aumentare la velocità di ragionamento, adatto per gestire compiti di generazione di linguaggio e codice multilingue."
},
"openai/gpt-3.5-turbo": {
"description": "Il modello più capace e conveniente della serie GPT-3.5 di OpenAI, ottimizzato per scopi di chat ma con buone prestazioni anche in compiti di completamento tradizionali."
},
"openai/gpt-3.5-turbo-instruct": {
"description": "Capacità simili ai modelli dell'era GPT-3. Compatibile con endpoint di completamento tradizionali, non con endpoint di completamento chat."
},
"openai/gpt-4-turbo": {
"description": "gpt-4-turbo di OpenAI possiede una vasta conoscenza generale e competenze settoriali, permettendogli di seguire istruzioni complesse in linguaggio naturale e risolvere problemi difficili con precisione. La sua conoscenza è aggiornata ad aprile 2023 e ha una finestra di contesto di 128.000 token."
},
"openai/gpt-4.1": {
"description": "GPT-4.1 è il nostro modello di punta per compiti complessi. È particolarmente adatto per risolvere problemi trasversali."
"description": "GPT 4.1 è il modello di punta di OpenAI, adatto a compiti complessi. È eccellente nella risoluzione di problemi interdisciplinari."
},
"openai/gpt-4.1-mini": {
"description": "GPT-4.1 mini offre un equilibrio tra intelligenza, velocità e costo, rendendolo un modello attraente per molti casi d'uso."
"description": "GPT 4.1 mini bilancia intelligenza, velocità e costo, rendendolo un modello attraente per molti casi d'uso."
},
"openai/gpt-4.1-nano": {
"description": "GPT-4.1 nano è il modello GPT-4.1 più veloce e conveniente."
"description": "GPT-4.1 nano è il modello GPT 4.1 più veloce e conveniente."
},
"openai/gpt-4o": {
"description": "ChatGPT-4o è un modello dinamico, aggiornato in tempo reale per mantenere la versione più recente. Combina potenti capacità di comprensione e generazione del linguaggio, adatto a scenari di applicazione su larga scala, tra cui assistenza clienti, istruzione e supporto tecnico."
"description": "GPT-4o di OpenAI possiede una vasta conoscenza generale e competenze settoriali, capace di seguire istruzioni complesse in linguaggio naturale e risolvere problemi difficili con precisione. Offre prestazioni equivalenti a GPT-4 Turbo con un'API più veloce e meno costosa."
},
"openai/gpt-4o-mini": {
"description": "GPT-4o mini è il modello più recente di OpenAI, lanciato dopo GPT-4 Omni, che supporta input visivi e testuali e produce output testuali. Come il loro modello di piccole dimensioni più avanzato, è molto più economico rispetto ad altri modelli all'avanguardia recenti e costa oltre il 60% in meno rispetto a GPT-3.5 Turbo. Mantiene un'intelligenza all'avanguardia, offrendo un notevole rapporto qualità-prezzo. GPT-4o mini ha ottenuto un punteggio dell'82% nel test MMLU e attualmente è classificato più in alto di GPT-4 per preferenze di chat."
"description": "GPT-4o mini di OpenAI è il loro modello piccolo più avanzato e conveniente. È multimodale (accetta input di testo o immagini e produce testo) ed è più intelligente di gpt-3.5-turbo, mantenendo la stessa velocità."
},
"openai/gpt-5": {
"description": "GPT-5 è il modello linguistico di punta di OpenAI, eccellente in ragionamento complesso, ampia conoscenza del mondo reale, compiti intensivi di codice e agenti a più passaggi."
},
"openai/gpt-5-mini": {
"description": "GPT-5 mini è un modello ottimizzato per i costi, con ottime prestazioni in compiti di ragionamento e chat. Offre il miglior equilibrio tra velocità, costo e capacità."
},
"openai/gpt-5-nano": {
"description": "GPT-5 nano è un modello ad alto throughput, eccellente in compiti semplici di istruzioni o classificazione."
},
"openai/gpt-oss-120b": {
"description": "OpenAI GPT-OSS 120B è un modello linguistico di punta con 120 miliardi di parametri, dotato di funzionalità integrate di ricerca browser e esecuzione di codice, oltre a capacità di ragionamento."
"description": "Modello linguistico grande universale estremamente capace, con potenti capacità di ragionamento controllabile."
},
"openai/gpt-oss-20b": {
"description": "OpenAI GPT-OSS 20B è un modello linguistico di punta con 20 miliardi di parametri, dotato di funzionalità integrate di ricerca browser e esecuzione di codice, oltre a capacità di ragionamento."
"description": "Modello linguistico compatto con pesi open source, ottimizzato per bassa latenza e ambienti con risorse limitate, inclusi deployment locali e edge."
},
"openai/o1": {
"description": "o1 è il nuovo modello di ragionamento di OpenAI, supporta input di testo e immagini e produce output testuali, adatto a compiti complessi che richiedono una vasta conoscenza generale. Il modello ha un contesto di 200K token e una data di cut-off della conoscenza a ottobre 2023."
"description": "o1 di OpenAI è un modello di ragionamento di punta, progettato per problemi complessi che richiedono pensiero profondo. Offre potenti capacità di ragionamento e maggiore accuratezza per compiti complessi a più passaggi."
},
"openai/o1-mini": {
"description": "o1-mini è un modello di inferenza rapido ed economico progettato per applicazioni di programmazione, matematica e scienza. Questo modello ha un contesto di 128K e una data di cutoff della conoscenza di ottobre 2023."
@@ -2256,23 +2493,44 @@
"description": "o1 è il nuovo modello di inferenza di OpenAI, adatto a compiti complessi che richiedono una vasta conoscenza generale. Questo modello ha un contesto di 128K e una data di cutoff della conoscenza di ottobre 2023."
},
"openai/o3": {
"description": "o3 è un modello potente e versatile, che si distingue in diversi ambiti. Stabilisce nuovi standard per compiti di matematica, scienza, programmazione e ragionamento visivo. È anche abile nella scrittura tecnica e nel seguire istruzioni. Gli utenti possono utilizzarlo per analizzare testi, codici e immagini, risolvendo problemi complessi in più passaggi."
"description": "o3 di OpenAI è il modello di ragionamento più potente, stabilendo nuovi standard in codifica, matematica, scienza e percezione visiva. Eccelle in query complesse che richiedono analisi multidisciplinari, con vantaggi speciali nell'analisi di immagini, grafici e diagrammi."
},
"openai/o3-mini": {
"description": "o3-mini offre alta intelligenza mantenendo gli stessi obiettivi di costo e latenza di o1-mini."
"description": "o3-mini è l'ultimo modello di ragionamento piccolo di OpenAI, che offre alta intelligenza con gli stessi obiettivi di costo e latenza di o1-mini."
},
"openai/o3-mini-high": {
"description": "o3-mini alta versione di ragionamento, offre alta intelligenza mantenendo gli stessi obiettivi di costo e latenza di o1-mini."
},
"openai/o4-mini": {
"description": "o4-mini è ottimizzato per un'inferenza rapida ed efficace, mostrando un'elevata efficienza e prestazioni in compiti di codifica e visivi."
"description": "o4-mini di OpenAI offre ragionamento veloce e conveniente, con prestazioni eccezionali per la sua dimensione, specialmente in matematica (eccellente nel benchmark AIME), codifica e compiti visivi."
},
"openai/o4-mini-high": {
"description": "Versione ad alta capacità di inferenza di o4-mini, ottimizzata per un'inferenza rapida ed efficace, mostrando un'elevata efficienza e prestazioni in compiti di codifica e visivi."
},
"openai/text-embedding-3-large": {
"description": "Il modello di embedding più capace di OpenAI, adatto a compiti in inglese e non inglese."
},
"openai/text-embedding-3-small": {
"description": "Versione migliorata e più performante del modello di embedding ada di OpenAI."
},
"openai/text-embedding-ada-002": {
"description": "Modello tradizionale di embedding testuale di OpenAI."
},
"openrouter/auto": {
"description": "In base alla lunghezza del contesto, al tema e alla complessità, la tua richiesta verrà inviata a Llama 3 70B Instruct, Claude 3.5 Sonnet (auto-regolato) o GPT-4o."
},
"perplexity/sonar": {
"description": "Prodotto leggero di Perplexity con capacità di ricerca integrata, più veloce e meno costoso di Sonar Pro."
},
"perplexity/sonar-pro": {
"description": "Prodotto di punta di Perplexity con capacità di ricerca integrata, supporta query avanzate e operazioni successive."
},
"perplexity/sonar-reasoning": {
"description": "Modello focalizzato sul ragionamento che produce catene di pensiero (CoT) nelle risposte, offrendo spiegazioni dettagliate con ricerca integrata."
},
"perplexity/sonar-reasoning-pro": {
"description": "Modello avanzato focalizzato sul ragionamento che produce catene di pensiero (CoT) nelle risposte, offrendo spiegazioni complete con capacità di ricerca potenziata e molteplici query di ricerca per richiesta."
},
"phi3": {
"description": "Phi-3 è un modello open source leggero lanciato da Microsoft, adatto per integrazioni efficienti e ragionamento su larga scala."
},
@@ -2313,7 +2571,7 @@
"description": "Qwen-Image è un modello universale per la generazione di immagini che supporta molteplici stili artistici ed è particolarmente efficace nel rendering di testi complessi, in particolare nella resa di testi in cinese e in inglese. Il modello supporta layout a più righe, generazione di testo a livello di paragrafo e rappresentazione di dettagli ad alta precisione, permettendo la realizzazione di layout misti e design complessi che integrano testo e immagini."
},
"qwen-image-edit": {
"description": "Il team Qwen ha pubblicato un modello professionale per l'editing delle immagini, che supporta sia l'editing semantico sia quello dell'aspetto visivo; è in grado di modificare con precisione il testo in cinese e in inglese e di eseguire operazioni di alta qualità come la trasformazione di stile e la rotazione di oggetti."
"description": "Qwen Image Edit è un modello di generazione di immagini che supporta la modifica e l'editing delle immagini basati su input di immagini e suggerimenti testuali, in grado di effettuare regolazioni precise e trasformazioni creative dell'immagine originale secondo le esigenze dell'utente."
},
"qwen-long": {
"description": "Qwen è un modello di linguaggio su larga scala che supporta contesti di testo lunghi e funzionalità di dialogo basate su documenti lunghi e multipli."
@@ -2549,6 +2807,15 @@
"qwen3-coder-plus": {
"description": "Modello di codice Tongyi Qianwen. L'ultima serie di modelli Qwen3-Coder si basa su Qwen3 per la generazione di codice, con potenti capacità di Coding Agent, eccellente nell'invocazione di strumenti e interazione con l'ambiente, in grado di programmare autonomamente, con capacità di codice eccezionali e abilità generali."
},
"qwen3-max-preview": {
"description": "Versione preview del modello Max della serie Qwen 3, che presenta un miglioramento significativo rispetto alla serie 2.5 nelle capacità generali, comprensione del testo in cinese e inglese, rispetto di istruzioni complesse, compiti soggettivi aperti, capacità multilingue e chiamata di strumenti; il modello presenta meno allucinazioni di conoscenza."
},
"qwen3-next-80b-a3b-instruct": {
"description": "Modello open source di nuova generazione basato su Qwen3 in modalità non riflessiva, con una migliore comprensione del testo in cinese rispetto alla versione precedente (Tongyi Qianwen 3-235B-A22B-Instruct-2507), capacità di ragionamento logico potenziate e prestazioni superiori nelle attività di generazione di testo."
},
"qwen3-next-80b-a3b-thinking": {
"description": "Modello open source di nuova generazione basato su Qwen3 in modalità riflessiva, con migliorata capacità di seguire le istruzioni rispetto alla versione precedente (Tongyi Qianwen 3-235B-A22B-Thinking-2507) e risposte di sintesi più concise."
},
"qwq": {
"description": "QwQ è un modello di ricerca sperimentale, focalizzato sul miglioramento delle capacità di ragionamento dell'IA."
},
@@ -2729,6 +2996,12 @@
"v0-1.5-md": {
"description": "Il modello v0-1.5-md è adatto per compiti quotidiani e generazione di interfacce utente (UI)"
},
"vercel/v0-1.0-md": {
"description": "Accesso al modello dietro v0 per generare, correggere e ottimizzare applicazioni web moderne, con ragionamento specifico per framework e conoscenze aggiornate."
},
"vercel/v0-1.5-md": {
"description": "Accesso al modello dietro v0 per generare, correggere e ottimizzare applicazioni web moderne, con ragionamento specifico per framework e conoscenze aggiornate."
},
"wan2.2-t2i-flash": {
"description": "Versione ultra-veloce Wanxiang 2.2, modello più recente. Miglioramenti completi in creatività, stabilità e realismo, con velocità di generazione elevata e ottimo rapporto qualità-prezzo."
},
@@ -2759,6 +3032,27 @@
"x1": {
"description": "Il modello Spark X1 sarà ulteriormente aggiornato, raggiungendo risultati in compiti generali come ragionamento, generazione di testo e comprensione del linguaggio, in linea con OpenAI o1 e DeepSeek R1, partendo da una posizione di leadership nei compiti matematici."
},
"xai/grok-2": {
"description": "Grok 2 è un modello linguistico all'avanguardia con capacità di ragionamento avanzate. Eccelle in chat, codifica e ragionamento, superando Claude 3.5 Sonnet e GPT-4-Turbo nella classifica LMSYS."
},
"xai/grok-2-vision": {
"description": "Il modello visivo Grok 2 eccelle in compiti basati sulla visione, offrendo prestazioni all'avanguardia in ragionamento matematico visivo (MathVista) e domande e risposte basate su documenti (DocVQA). È in grado di elaborare varie informazioni visive, inclusi documenti, grafici, diagrammi, screenshot e fotografie."
},
"xai/grok-3": {
"description": "Modello di punta di xAI, eccellente in casi d'uso aziendali come estrazione dati, codifica e sintesi testuale. Possiede una profonda conoscenza settoriale in finanza, sanità, legale e scienza."
},
"xai/grok-3-fast": {
"description": "Modello di punta di xAI, eccellente in casi d'uso aziendali come estrazione dati, codifica e sintesi testuale. La variante veloce del modello è servita su infrastrutture più rapide, offrendo tempi di risposta molto più brevi a un costo maggiore per token in output."
},
"xai/grok-3-mini": {
"description": "Modello leggero di xAI che riflette prima di rispondere. Ideale per compiti semplici o logici che non richiedono profonda conoscenza settoriale. La traccia di pensiero grezza è accessibile."
},
"xai/grok-3-mini-fast": {
"description": "Modello leggero di xAI che riflette prima di rispondere. Ideale per compiti semplici o logici che non richiedono profonda conoscenza settoriale. La traccia di pensiero grezza è accessibile. La variante veloce del modello è servita su infrastrutture più rapide, offrendo tempi di risposta molto più brevi a un costo maggiore per token in output."
},
"xai/grok-4": {
"description": "Il modello di punta più recente e migliore di xAI, che offre prestazioni senza pari in linguaggio naturale, matematica e ragionamento — il perfetto tuttofare."
},
"yi-1.5-34b-chat": {
"description": "Yi-1.5 è una versione aggiornata di Yi. Utilizza un corpus di alta qualità di 500B token per il pre-addestramento continuo di Yi e viene finetunato su 3M campioni di micro-tuning diversificati."
},
@@ -2806,5 +3100,14 @@
},
"zai-org/GLM-4.5V": {
"description": "GLM-4.5V è lultima generazione di modelli visivolinguistici (VLM) rilasciata da Zhipu AI (智谱 AI). Il modello è costruito sul modello testuale di punta GLM-4.5Air, che dispone di 106 miliardi di parametri totali e 12 miliardi di parametri di attivazione, e adotta unarchitettura mixture-of-experts (MoE) con lobiettivo di offrire prestazioni eccellenti a un costo di inferenza ridotto. Dal punto di vista tecnico, GLM-4.5V prosegue la linea di GLM-4.1VThinking e introduce innovazioni come il codificatore di posizione rotazionale tridimensionale (3DRoPE), migliorando in modo significativo la percezione e il ragionamento sulle relazioni spaziali 3D. Grazie allottimizzazione nelle fasi di preaddestramento, finetuning supervisionato e apprendimento per rinforzo, il modello è in grado di gestire diversi tipi di contenuti visivi — immagini, video e documenti lunghi — e ha raggiunto livelli di eccellenza tra i modelli open source della stessa categoria in 41 benchmark multimodali pubblici. Inoltre, il modello introduce un interruttore per la “modalità pensiero” che consente allutente di scegliere con flessibilità tra risposte rapide e ragionamenti approfonditi, bilanciando efficienza ed efficacia."
},
"zai/glm-4.5": {
"description": "La serie di modelli GLM-4.5 è progettata specificamente come modelli base per agenti intelligenti. Il modello di punta GLM-4.5 integra 355 miliardi di parametri totali (32 miliardi attivi), unificando capacità di ragionamento, codifica e agenti per soddisfare esigenze applicative complesse. Come sistema di ragionamento ibrido, offre modalità operative doppie."
},
"zai/glm-4.5-air": {
"description": "GLM-4.5 e GLM-4.5-Air sono i nostri modelli di punta più recenti, progettati specificamente come modelli base per applicazioni agenti. Entrambi utilizzano un'architettura a esperti misti (MoE). GLM-4.5 ha 355 miliardi di parametri totali con 32 miliardi attivi per passaggio in avanti, mentre GLM-4.5-Air ha un design più snello con 106 miliardi di parametri totali e 12 miliardi attivi."
},
"zai/glm-4.5v": {
"description": "GLM-4.5V è costruito sul modello base GLM-4.5-Air, eredita la tecnologia verificata di GLM-4.1V-Thinking e si espande efficacemente con una potente architettura MoE da 106 miliardi di parametri."
}
}
+6
View File
@@ -38,6 +38,9 @@
"cohere": {
"description": "Cohere ti offre i modelli multilingue più all'avanguardia, funzionalità di ricerca avanzate e uno spazio di lavoro AI su misura per le moderne imprese - il tutto integrato in una piattaforma sicura."
},
"cometapi": {
"description": "CometAPI è una piattaforma di servizi che offre molteplici interfacce per modelli avanzati, supportando OpenAI, Anthropic, Google e altri ancora, adatta a esigenze di sviluppo e applicazione diversificate. Gli utenti possono scegliere in modo flessibile il modello e il prezzo più adatti alle proprie necessità, contribuendo a migliorare l'esperienza AI."
},
"deepseek": {
"description": "DeepSeek è un'azienda focalizzata sulla ricerca e applicazione della tecnologia AI, il cui ultimo modello DeepSeek-V2.5 combina capacità di dialogo generico e elaborazione del codice, realizzando miglioramenti significativi nell'allineamento delle preferenze umane, nei compiti di scrittura e nel rispetto delle istruzioni."
},
@@ -158,6 +161,9 @@
"v0": {
"description": "v0 è un assistente di programmazione in coppia: basta descrivere le tue idee in linguaggio naturale e lui genererà codice e interfacce utente (UI) per il tuo progetto"
},
"vercelaigateway": {
"description": "Vercel AI Gateway offre un'API unificata per accedere a oltre 100 modelli, consentendo l'utilizzo di modelli di diversi fornitori come OpenAI, Anthropic, Google tramite un unico endpoint. Supporta impostazioni di budget, monitoraggio dell'utilizzo, bilanciamento del carico delle richieste e failover."
},
"vertexai": {
"description": "La serie Gemini di Google è il suo modello AI più avanzato e versatile, sviluppato da Google DeepMind, progettato per essere multimodale e supportare la comprensione e l'elaborazione senza soluzione di continuità di testo, codice, immagini, audio e video. Adatta a una varietà di ambienti, dai data center ai dispositivi mobili, migliora notevolmente l'efficienza e l'ampia applicabilità dei modelli AI."
},

Some files were not shown because too many files have changed in this diff Show More