update e2e test

📝 docs(bot): Auto sync agents & plugin to readme
🔖 chore(release): v2.0.10 [skip ci]
2026-06-14 03:30:19 +00:00 · 2026-01-29 16:25:39 +08:00 · 2026-01-29 04:00:48 +00:00 · 2026-01-29 03:59:14 +00:00 · 2026-01-29 11:41:38 +08:00 · 2026-01-29 03:18:12 +00:00
110 changed files with 2267 additions and 1053 deletions
@@ -20,6 +20,7 @@ config.rules['unicorn/no-array-for-each'] = 0;
 config.rules['unicorn/prefer-number-properties'] = 0;
 config.rules['unicorn/prefer-query-selector'] = 0;
 config.rules['unicorn/no-array-callback-reference'] = 0;
+config.rules['@typescript-eslint/no-use-before-define'] = 0;
 // FIXME: Linting error in src/app/[variants]/(main)/chat/features/Migration/DBReader.ts, the fundamental solution should be upgrading typescript-eslint
 config.rules['@typescript-eslint/no-useless-constructor'] = 0;
 config.rules['@next/next/no-img-element'] = 0;
@@ -29,9 +29,9 @@ jobs:
        id: sync
        uses: aormsby/Fork-Sync-With-Upstream-action@v3.4
        with:
-          upstream_sync_repo: lobehub/lobe-chat
-          upstream_sync_branch: next
-          target_sync_branch: next
+          upstream_sync_repo: lobehub/lobehub
+          upstream_sync_branch: main
+          target_sync_branch: main
          target_repo_token: ${{ secrets.GITHUB_TOKEN }} # automatically generated, no need to set
          test_mode: false

@@ -2,6 +2,156 @@

 # Changelog

+### [Version 2.0.10](https://github.com/lobehub/lobe-chat/compare/v2.0.9...v2.0.10)
+
+<sup>Released on **2026-01-29**</sup>
+
+#### 🐛 Bug Fixes
+
+- **misc**: Add ExtendParamsTypeSchema for enhanced model settings.
+
+<br/>
+
+<details>
+<summary><kbd>Improvements and Fixes</kbd></summary>
+
+#### What's fixed
+
+- **misc**: Add ExtendParamsTypeSchema for enhanced model settings, closes [#11437](https://github.com/lobehub/lobe-chat/issues/11437) ([f58c980](https://github.com/lobehub/lobe-chat/commit/f58c980))
+
+</details>
+
+<div align="right">
+
+[![](https://img.shields.io/badge/-BACK_TO_TOP-151515?style=flat-square)](#readme-top)
+
+</div>
+
+### [Version 2.0.9](https://github.com/lobehub/lobe-chat/compare/v2.0.8...v2.0.9)
+
+<sup>Released on **2026-01-29**</sup>
+
+#### 🐛 Bug Fixes
+
+- **model-bank**: Fix ZenMux model IDs by adding provider prefixes.
+
+<br/>
+
+<details>
+<summary><kbd>Improvements and Fixes</kbd></summary>
+
+#### What's fixed
+
+- **model-bank**: Fix ZenMux model IDs by adding provider prefixes, closes [#11947](https://github.com/lobehub/lobe-chat/issues/11947) ([17f8a5c](https://github.com/lobehub/lobe-chat/commit/17f8a5c))
+
+</details>
+
+<div align="right">
+
+[![](https://img.shields.io/badge/-BACK_TO_TOP-151515?style=flat-square)](#readme-top)
+
+</div>
+
+### [Version 2.0.8](https://github.com/lobehub/lobe-chat/compare/v2.0.7...v2.0.8)
+
+<sup>Released on **2026-01-28**</sup>
+
+#### 🐛 Bug Fixes
+
+- **misc**: Fix inbox agent in mobile.
+
+<br/>
+
+<details>
+<summary><kbd>Improvements and Fixes</kbd></summary>
+
+#### What's fixed
+
+- **misc**: Fix inbox agent in mobile, closes [#11929](https://github.com/lobehub/lobe-chat/issues/11929) ([42f5c0b](https://github.com/lobehub/lobe-chat/commit/42f5c0b))
+
+</details>
+
+<div align="right">
+
+[![](https://img.shields.io/badge/-BACK_TO_TOP-151515?style=flat-square)](#readme-top)
+
+</div>
+
+### [Version 2.0.7](https://github.com/lobehub/lobe-chat/compare/v2.0.6...v2.0.7)
+
+<sup>Released on **2026-01-28**</sup>
+
+#### 🐛 Bug Fixes
+
+- **model-runtime**: Include tool_calls in speed metrics & add getActiveTraceId.
+
+<br/>
+
+<details>
+<summary><kbd>Improvements and Fixes</kbd></summary>
+
+#### What's fixed
+
+- **model-runtime**: Include tool_calls in speed metrics & add getActiveTraceId, closes [#11927](https://github.com/lobehub/lobe-chat/issues/11927) ([b24da44](https://github.com/lobehub/lobe-chat/commit/b24da44))
+
+</details>
+
+<div align="right">
+
+[![](https://img.shields.io/badge/-BACK_TO_TOP-151515?style=flat-square)](#readme-top)
+
+</div>
+
+### [Version 2.0.6](https://github.com/lobehub/lobe-chat/compare/v2.0.5...v2.0.6)
+
+<sup>Released on **2026-01-27**</sup>
+
+#### 🐛 Bug Fixes
+
+- **misc**: The klavis in onboarding connect timeout fixed.
+
+<br/>
+
+<details>
+<summary><kbd>Improvements and Fixes</kbd></summary>
+
+#### What's fixed
+
+- **misc**: The klavis in onboarding connect timeout fixed, closes [#11918](https://github.com/lobehub/lobe-chat/issues/11918) ([bc165be](https://github.com/lobehub/lobe-chat/commit/bc165be))
+
+</details>
+
+<div align="right">
+
+[![](https://img.shields.io/badge/-BACK_TO_TOP-151515?style=flat-square)](#readme-top)
+
+</div>
+
+### [Version 2.0.5](https://github.com/lobehub/lobe-chat/compare/v2.0.4...v2.0.5)
+
+<sup>Released on **2026-01-27**</sup>
+
+#### 🐛 Bug Fixes
+
+- **misc**: Update the artifact prompt.
+
+<br/>
+
+<details>
+<summary><kbd>Improvements and Fixes</kbd></summary>
+
+#### What's fixed
+
+- **misc**: Update the artifact prompt, closes [#11907](https://github.com/lobehub/lobe-chat/issues/11907) ([217e689](https://github.com/lobehub/lobe-chat/commit/217e689))
+
+</details>
+
+<div align="right">
+
+[![](https://img.shields.io/badge/-BACK_TO_TOP-151515?style=flat-square)](#readme-top)
+
+</div>
+
 ### [Version 2.0.4](https://github.com/lobehub/lobe-chat/compare/v2.0.3...v2.0.4)

 <sup>Released on **2026-01-27**</sup>
@@ -1,4 +1,49 @@
 [
+  {
+    "children": {
+      "fixes": ["Add ExtendParamsTypeSchema for enhanced model settings."]
+    },
+    "date": "2026-01-29",
+    "version": "2.0.10"
+  },
+  {
+    "children": {},
+    "date": "2026-01-29",
+    "version": "2.0.9"
+  },
+  {
+    "children": {
+      "fixes": ["Fix inbox agent in mobile."]
+    },
+    "date": "2026-01-28",
+    "version": "2.0.8"
+  },
+  {
+    "children": {},
+    "date": "2026-01-28",
+    "version": "2.0.7"
+  },
+  {
+    "children": {
+      "fixes": ["The klavis in onboarding connect timeout fixed."]
+    },
+    "date": "2026-01-27",
+    "version": "2.0.6"
+  },
+  {
+    "children": {
+      "fixes": ["Update the artifact prompt."]
+    },
+    "date": "2026-01-27",
+    "version": "2.0.5"
+  },
+  {
+    "children": {
+      "fixes": ["Rename docker image and update docs for v2."]
+    },
+    "date": "2026-01-27",
+    "version": "2.0.4"
+  },
  {
    "children": {
      "fixes": [
@@ -63,6 +63,8 @@ For small self-hosted deployments, the simplest approach is to let users reset t

   Remove Clerk variables and add Better Auth variables:

+   <GenerateSecret envName="AUTH_SECRET" />
+
   ```bash
   # Remove these
   # NEXT_PUBLIC_CLERK_PUBLISHABLE_KEY=xxx
@@ -61,6 +61,8 @@ tags:

   移除 Clerk 变量并添加 Better Auth 变量：

+   <GenerateSecret envName="AUTH_SECRET" />
+
   ```bash
   # 移除这些
   # NEXT_PUBLIC_CLERK_PUBLISHABLE_KEY=xxx
@@ -116,6 +116,8 @@ For small self-hosted deployments, the simplest approach is to let users re-logi

   Remove NextAuth variables and add Better Auth variables:

+   <GenerateSecret envName="AUTH_SECRET" />
+
   ```bash
   # Remove these
   # NEXT_AUTH_SECRET=xxx
@@ -111,6 +111,8 @@ Better Auth 支持更多功能，以下是新增的环境变量：

   移除 NextAuth 变量并添加 Better Auth 变量：

+   <GenerateSecret envName="AUTH_SECRET" />
+
   ```bash
   # 移除这些
   # NEXT_AUTH_SECRET=xxx
@@ -58,6 +58,12 @@ Here is the process for deploying the LobeHub server database version on a Linux

  ### Create a file named `lobe-chat.env` to store environment variables:

+  Click the buttons below to generate required secrets:
+
+  <GenerateSecret envName="KEY_VAULTS_SECRET" />
+
+  <GenerateSecret envName="AUTH_SECRET" />
+
  ```shell
  # Website domain
  APP_URL=https://your-prod-domain.com
@@ -54,6 +54,12 @@ tags:

  ### 创建名为 `lobe-chat.env` 文件用于存放环境变量：

+  点击下方按钮生成所需密钥：
+
+  <GenerateSecret envName="KEY_VAULTS_SECRET" />
+
+  <GenerateSecret envName="AUTH_SECRET" />
+
  ```shell
  # 网站域名
  APP_URL=https://your-prod-domain.com
@@ -114,55 +114,6 @@ The server-side database needs to be paired with a user authentication service t
  <Callout type={'info'}>
    For advanced features like SSO providers, magic link login, and email verification, see [Authentication Service](/docs/self-hosting/advanced/auth).
  </Callout>
-
-  ### Add Public and Private Key Environment Variables in Vercel
-
-  In Vercel's deployment environment variables, add the `NEXT_PUBLIC_CLERK_PUBLISHABLE_KEY` and `CLERK_SECRET_KEY` environment variables. You can click on "API Keys" in the menu, then copy the corresponding values and paste them into Vercel's environment variables.
-
-  <Image alt={'Find the corresponding public and private key environment variables in Clerk'} src={'/blog/assets28616219/89883703-7a1a-4a11-b944-5d804544e57c.webp'} />
-
-  The environment variables required for this step are as follows:
-
-  ```shell
-  NEXT_PUBLIC_CLERK_PUBLISHABLE_KEY=pk_live_xxxxxxxxxxx
-  CLERK_SECRET_KEY=sk_live_xxxxxxxxxxxxxxxxxxxxxx
-  ```
-
-  Add the above variables to Vercel:
-
-  <Image alt={'Add Clerk public and private key environment variables in Vercel'} src={'/blog/assets28616219/2bfa13df-6e20-4768-97c0-4dad06c85a2f.webp'} />
-
-  ### Create and Configure Webhook in Clerk
-
-  Since we let Clerk fully handle user authentication and management, we need Clerk to notify our application and store data in the database when there are changes in the user's lifecycle (create, update, delete). We achieve this requirement through the Webhook provided by Clerk.
-
-  We need to add an endpoint in Clerk's Webhooks to inform Clerk to send notifications to this endpoint when a user's information changes.
-
-  <Image alt={'Add Webhooks endpoint in Clerk'} src={'/blog/assets28616219/f50f47fb-5e8e-4930-bf4e-8cf6f5b8afb9.webp'} />
-
-  Fill in the endpoint with the URL of your Vercel project, such as `https://your-project.vercel.app/api/webhooks/clerk`. Then, subscribe to events by checking the three user events (`user.created`, `user.deleted`, `user.updated`), and click create.
-
-  <Callout type={'warning'}>
-    The `https://` in the URL is essential to maintain the integrity of the URL.
-  </Callout>
-
-  <Image alt={'Configure URL and user events when adding Clerk Webhooks'} src={'/blog/assets28616219/0249ea56-ab17-4aa9-a56c-9ebd556c2645.webp'} />
-
-  ### Add Webhook Secret to Vercel Environment Variables
-
-  After creation, you can find the secret of this Webhook in the bottom right corner:
-
-  <Image alt={'View Clerk Webhooks secret'} src={'/blog/assets28616219/fab4abb2-584b-49de-9340-813382951635.webp'} />
-
-  The environment variable corresponding to this secret is `CLERK_WEBHOOK_SECRET`:
-
-  ```shell
-  CLERK_WEBHOOK_SECRET=whsec_xxxxxxxxxxxxxxxxxxxxxx
-  ```
-
-  Add it to Vercel's environment variables:
-
-  <Image alt={'Add Clerk Webhooks secret in Vercel'} src={'/blog/assets28616219/5fdc9479-007f-46ab-9d6e-a9603e949116.webp'} />
 </Steps>

 By completing these steps, you have successfully configured the authentication service. Next, we will configure the S3 storage service.
@@ -114,53 +114,6 @@ tags:
  <Callout type={'info'}>
    如需 SSO 登录、魔法链接登录、邮箱验证等高级功能，请参阅 [身份验证服务](/zh/docs/self-hosting/advanced/auth)。
  </Callout>
-
-  ### 在 Vercel 中添加公、私钥环境变量
-
-  在 Vercel 的部署环境变量中，添加 `NEXT_PUBLIC_CLERK_PUBLISHABLE_KEY` 和 `CLERK_SECRET_KEY` 环境变量。你可以在菜单中点击「API Keys」，然后复制对应的值填入 Vercel 的环境变量中。
-
-  <Image alt={'在 Clerk 中找到对应的公私钥环境变量'} src={'/blog/assets28616219/89883703-7a1a-4a11-b944-5d804544e57c.webp'} />
-
-  此步骤所需的环境变量如下：
-
-  ```shell
-  NEXT_PUBLIC_CLERK_PUBLISHABLE_KEY=pk_live_xxxxxxxxxxx
-  CLERK_SECRET_KEY=sk_live_xxxxxxxxxxxxxxxxxxxxxx
-  ```
-
-  添加上述变量到 Vercel 中：
-
-  <Image alt={'在 Vercel 中添加 Clerk 公私钥环境变量'} src={'/blog/assets28616219/2bfa13df-6e20-4768-97c0-4dad06c85a2f.webp'} />
-
-  ### 在 Clerk 中创建并配置 Webhook
-
-  由于我们让 Clerk 完全接管用户鉴权与管理，因此我们需要在 Clerk 用户生命周期变更时（创建、更新、删除）中通知我们的应用并存储落库。我们通过 Clerk 提供的 Webhook 来实现这一诉求。
-
-  我们需要在 Clerk 的 Webhooks 中添加一个端点（Endpoint），告诉 Clerk 当用户发生变更时，向这个端点发送通知。
-
-  <Image alt={'Clerk 添加 Webhooks 端点'} src={'/blog/assets28616219/f50f47fb-5e8e-4930-bf4e-8cf6f5b8afb9.webp'} />
-
-  在 endpoint 中填写你的 Vercel 项目的 URL，如 `https://your-project.vercel.app/api/webhooks/clerk`。然后在订阅事件（Subscribe to events）中，勾选 user 的三个事件（`user.created` 、`user.deleted`、`user.updated`），然后点击创建。
-
-  <Callout type={'warning'}>URL 的`https://`不可缺失，须保持 URL 的完整性</Callout>
-
-  <Image alt={'添加 Clerk Webhooks 时，配置 URL 和用户事件'} src={'/blog/assets28616219/0249ea56-ab17-4aa9-a56c-9ebd556c2645.webp'} />
-
-  ### 将 Webhook 秘钥添加到 Vercel 环境变量
-
-  创建完毕后，可以在右下角找到该 Webhook 的秘钥：
-
-  <Image alt={'查看 Clerk Webhooks 秘钥'} src={'/blog/assets28616219/fab4abb2-584b-49de-9340-813382951635.webp'} />
-
-  这个秘钥所对应的环境变量名为 `CLERK_WEBHOOK_SECRET`：
-
-  ```shell
-  CLERK_WEBHOOK_SECRET=whsec_xxxxxxxxxxxxxxxxxxxxxx
-  ```
-
-  将其添加到 Vercel 的环境变量中：
-
-  <Image alt={'在 Vercel 中 添加 Clerk Webhooks 秘钥'} src={'/blog/assets28616219/5fdc9479-007f-46ab-9d6e-a9603e949116.webp'} />
 </Steps>

 这样，你已经成功配置了身份验证服务。接下来我们将配置 S3 存储服务。
@@ -1,157 +0,0 @@
---
-title: Deploying Server-Side Database for LobeHub
-description: Learn how to deploy LobeHub's server-side database using Postgres.
-tags:
-  - LobeHub
-  - Server-Side Database
-  - Postgres
-  - Deployment Guide
---
-
-# Deploying Server-Side Database
-
-LobeHub defaults to using a client-side database (IndexedDB) but also supports deploying a server-side database. LobeHub uses Postgres as the backend storage database.
-
-<Callout>
-  PostgreSQL is a powerful open-source relational database management system with high scalability
-  and standard SQL support. It provides rich data types, concurrency control, data integrity,
-  security, and programmability, making it suitable for complex applications and large-scale data
-  management.
-</Callout>
-
-This guide will introduce the process and principles of deploying the server-side database version of LobeHub on any platform from a framework perspective, so you can understand both the what and the why, and then deploy according to your specific needs.
-
-If you are already familiar with the complete principles, you can quickly get started by checking the deployment guides for each platform:
-
-<PlatformCards urlPrefix={'platform'} />
-
---
-
-For the server-side database version of LobeHub, a normal deployment process typically involves configuring three modules:
-
-1. Database configuration;
-2. Authentication service configuration;
-3. S3 storage service configuration.
-
-## Configure the Database
-
-Before deployment, make sure you have a Postgres database instance ready. You can choose from the following instances:
-
- `A.` Use Serverless Postgres instances like Vercel/Neon;
- `B.` Use self-deployed Postgres instances like Docker/Railway/Zeabur, collectively referred to as Node Postgres instances;
-
-<Callout>
-  There is a slight difference in the way they are configured in terms of environment variables.
-</Callout>
-
-Since we support file-based conversations/knowledge base conversations, we need to install the `pgvector` plugin for Postgres. This plugin provides vector search capabilities and is a key component for LobeHub to implement RAG.
-
-<Steps>
-  ### `NEXT_PUBLIC_SERVICE_MODE`
-
-  LobeHub supports both client-side and server-side databases, so we provide an environment variable for switching modes, which is `NEXT_PUBLIC_SERVICE_MODE`, with a default value of `client`.
-
-  For server-side database deployment scenarios, you need to set `NEXT_PUBLIC_SERVICE_MODE` to `server`.
-
-  <Callout type={'info'}>
-    In the official `lobehub` Docker image, this environment variable is already set to
-    `server` by default. Therefore, if you deploy using the Docker image, you do not need to configure
-    this environment variable again.
-  </Callout>
-
-  <Callout type={'tip'}>
-    Since environment variables starting with `NEXT_PUBLIC` take effect in the front-end code, they cannot be modified through container runtime injection. (Refer to the `next.js` documentation [Configuring: Environment Variables | Next.js (nextjs.org)](https://nextjs.org/docs/pages/building-your-application/configuring/environment-variables)). This is why we chose to create a separate DB version image.
-
-    If you need to modify variables with the `NEXT_PUBLIC` prefix in a Docker deployment, you must build the image yourself and inject your own `NEXT_PUBLIC` prefixed environment variables during the build.
-  </Callout>
-
-  ### `DATABASE_URL`
-
-  The core of configuring the database is to add the `DATABASE_URL` environment variable and fill in the Postgres database connection URL you have prepared. The typical format of the database connection URL is `postgres://username:password@host:port/database`.
-
-  <Callout type={'info'}>
-    If you want to enable SSL when connecting to the database, please refer to the
-    [documentation](https://stackoverflow.com/questions/14021998/using-psql-to-connect-to-postgresql-in-ssl-mode)
-    for setup instructions.
-  </Callout>
-
-  ### `DATABASE_DRIVER`
-
-  The `DATABASE_DRIVER` environment variable is used to distinguish between the two types of Postgres database instances, with values of `node` or `neon`.
-
-  To streamline deployment, we have set default values based on the characteristics of different platforms:
-
-  - On the Vercel platform, `DATABASE_DRIVER` defaults to `neon`;
-  - In our provided Docker image `lobehub`, `DATABASE_DRIVER` defaults to `node`.
-
-  Therefore, if you follow the standard deployment methods below, you do not need to manually configure the `DATABASE_DRIVER` environment variable:
-
-  - Vercel + Serverless Postgres
-  - Docker image + Node Postgres
-
-  ### `KEY_VAULTS_SECRET`
-
-  Considering that users will store sensitive information such as their API Key and baseURL in the database, we need a key to encrypt this information to prevent leakage in case of a database breach. Hence, the `KEY_VAULTS_SECRET` environment variable is used to encrypt sensitive information like user-stored apikeys.
-
-  <Callout type={'info'}>
-    You can generate a random 32-character string as the value of `KEY_VAULTS_SECRET` using `openssl
-                                                                                                                                                                                                  rand -base64 32`.
-  </Callout>
-</Steps>
-
-## Configuring Authentication Services
-
-In the server-side database mode, we need an authentication service to distinguish the identities of different users. There are many well-developed authentication solutions in the open-source community. We have integrated two different authentication services to meet the demands of different scenarios, one is Clerk, and the other is NextAuth.
-
-### Clerk
-
-[Clerk](https://clerk.com?utm_source=lobehub\&utm_medium=docs) is an authentication SaaS service that provides out-of-the-box authentication capabilities with high productization, low integration costs, and a great user experience. For those who offer SaaS products, Clerk is a good choice. Our official [LobeHub Cloud](https://LobeHub.com) uses Clerk as the authentication service.
-
-The integration of Clerk is relatively simple, requiring only the configuration of these environment variables:
-
- `NEXT_PUBLIC_CLERK_PUBLISHABLE_KEY` and `CLERK_SECRET_KEY`, which can be obtained from the Clerk console
- `CLERK_WEBHOOK_SECRET`, which is generated by following these instructions: [Configure Clerk Authentication Service](/docs/self-hosting/advanced/auth/clerk#create-and-configure-webhook-in-clerk).
-
-<Callout type={'tip'}>
-  In Vercel deployment mode, we recommend using Clerk as the authentication service for a better
-  user experience.
-</Callout>
-
-However, this type of authentication relies on Clerk's official service, so there may be some limitations in certain scenarios:
-
- For example, when using Clerk in China, it may be affected by the network environment.
- Clerk is not suitable for scenarios that require complete private deployment.
- It relies on `NEXT_PUBLIC_CLERK_PUBLISHABLE_KEY`, which may not be readily usable with public Docker images.
-
-Therefore, for the above scenarios, we also provide NextAuth as an alternative solution.
-
-### NextAuth
-
-NextAuth is an open-source authentication library that supports multiple identity providers, including Auth0, Cognito, GitHub, Google, Facebook, Apple, Twitter, and more. NextAuth itself provides a complete authentication solution, including user registration, login, password recovery, integration with various identity providers, and more.
-
-For information on configuring NextAuth, you can refer to the [Authentication](/docs/self-hosting/advanced/authentication) documentation.
-
-<Callout type={'tip'}>
-  In the official Docker image `lobehub`, we recommend using NextAuth as the
-  authentication service.
-</Callout>
-
-## Configuring S3 Storage Service
-
-LobeHub has supported multimodal AI conversations since [a long time ago](https://x.com/lobehub/status/1724289575672291782), involving the function of uploading images to large models. In the client-side database solution, image files are stored as binary data directly in the browser's IndexedDB database. However, this solution is not feasible in the server-side database. Storing file-like data directly in Postgres will greatly waste valuable database storage space and slow down computational performance.
-
-The best practice in this area is to use a file storage service (S3) to store image files, which is also the storage solution relied upon for subsequent file uploads/knowledge base functions.
-
-<Callout type={'info'}>
-  In this documentation, S3 refers to a compatible S3 storage solution, which supports the Amazon S3
-  API-compatible object storage system. Common examples include Cloudflare R2, Alibaba Cloud OSS,
-  and self-deployable RustFS, ceph, all of which support the S3-compatible API.
-</Callout>
-
-For detailed configuration guidelines on S3, please refer to [S3 Object Storage](/docs/self-hosting/advanced/s3) for more information.
-
-## Getting Started with Deployment
-
-The above is a detailed explanation of configuring LobeHub with a server-side database. You can configure it according to your actual situation and then choose a deployment platform that suits you to start deployment:
-
-<PlatformCards urlPrefix={'platform'} />
@@ -1,146 +0,0 @@
---
-title: 使用服务端数据库部署 - 配置数据库、身份验证服务和 S3 存储服务
-description: 本文将介绍服务端数据库版 LobeHub 的部署思路，解释如何配置数据库、身份验证服务和 S3 存储服务。
-tags:
-  - 服务端数据库
-  - Postgres
-  - S3存储服务
-  - 数据库配置
-  - 身份验证服务
-  - 环境变量配置
---
-
-# 使用服务端数据库部署
-
-LobeHub 默认使用客户端数据库（IndexedDB），同时也支持使用服务端数据库（下简称 DB 版）。LobeHub 采用了 Postgres 作为后端存储数据库。
-
-<Callout>
-  PostgreSQL 是一种强大的开源关系型数据库管理系统，具备高度扩展性和标准 SQL
-  支持。它提供了丰富的数据类型、并发处理、数据完整性、安全性及可编程性，适用于复杂应用和大规模数据管理。
-</Callout>
-
-本文将从框架角度介绍在任何一个平台中部署 DB 版 LobeHub 的流程和原理，让你知其然也知其所以然，最后可以根据自己的实际情况进行部署。
-
-如你已经熟悉完整原理，可以查看各个平台的部署指南快速开始：
-
-<PlatformCards urlPrefix={'platform'} />
-
---
-
-对于 LobeHub 的 DB 版，正常的部署流程都需要包含三个模块的配置：
-
-1. 数据库配置；
-2. 身份验证服务配置；
-3. S3 存储服务配置。
-
-## 配置数据库
-
-在部署之前，请确保你已经准备好 Postgres 数据库实例，你可以选择以下任一实例：
-
- `A.` 使用 Vercel / Neon 等 Serverless Postgres 实例；
- `B.` 使用 Docker / Railway / Zeabur 等自部署 Postgres 实例，下统称 Node Postgres 实例；
-
-<Callout>两者的配置方式在环境变量的取值上会略有一点区别，其他方面是一样的。</Callout>
-
-同时，由于我们支持了文件对话 / 知识库对话的能力，因此我们需要为 Postgres 安装 `pgvector` 插件，该插件提供了向量搜索的能力，是 LobeHub 实现 RAG 的重要构件之一。
-
-<Steps>
-  ### `NEXT_PUBLIC_SERVICE_MODE`
-
-  LobeHub 同时支持了客户端数据库和服务端数据库，因此我们提供了一个环境变量用于切换模式，这个变量为 `NEXT_PUBLIC_SERVICE_MODE`，该值默认为 `client`。
-
-  针对服务端数据库部署场景，你需要将 `NEXT_PUBLIC_SERVICE_MODE` 设置为 `server`。
-
-  <Callout type={'info'}>
-    在官方的 `lobehub` Docker 镜像中，已经默认将该环境变量设为 `server`，因此如果你使用
-    Docker 镜像部署，则无需再配置该环境变量。
-  </Callout>
-
-  <Callout type={'tip'}>
-    由于 `NEXT_PUBLIC` 开头的环境变量是在前端代码中生效的，而因此无法通过容器运行时注入进行修改。 （`next.js`的参考文档 [Configuring: Environment Variables | Next.js (nextjs.org)](https://nextjs.org/docs/pages/building-your-application/configuring/environment-variables) ) 这也是为什么我们选择再打一个 DB 版镜像的原因。
-
-    如果你需要在 Docker 部署中修改 `NEXT_PUBLIC` 前缀的变量，你必须自行构建镜像，在 build 时就把自己的 `NEXT_PUBLIC` 开头的环境变量打进去。
-  </Callout>
-
-  ### `DATABASE_URL`
-
-  配置数据库，核心是添加 `DATABASE_URL` 环境变量，将你准备好的 Postgres 数据库连接 URL 填入其中。数据库连接 URL 的通常格式为 `postgres://username:password@host:port/database`。
-
-  <Callout type={'info'}>
-    如果希望连接数据库时启用 SSL
-    ，请自行参考[文档](https://stackoverflow.com/questions/14021998/using-psql-to-connect-to-postgresql-in-ssl-mode)进行设置
-  </Callout>
-
-  ### `DATABASE_DRIVER`
-
-  `DATABASE_DRIVER` 环境变量用于区分两种 Postgres 数据库实例，`DATABASE_DRIVER` 的取值为 `node` 或 `neon`。
-
-  为提升部署便捷性，我们根据不同的平台特点设置了默认值：
-
-  - 在 Vercel 平台下，`DATABASE_DRIVER` 默认为 `neon`；
-  - 在我们提供的 Docker 镜像 `lobehub` 中，`DATABASE_DRIVER` 默认为 `node`。
-
-  因此如果你采用了以下标准的部署方式，你无需手动配置 `DATABASE_DRIVER` 环境变量：
-
-  - Vercel + Serverless Postgres
-  - Docker 镜像 + Node Postgres
-
-  ### `KEY_VAULTS_SECRET`
-
-  考虑到用户会存储自己的 API Key 和 baseURL 等敏感信息到数据库中，因此我们需要一个密钥来加密这些信息，避免数据库被爆破 / 脱库时这些关键信息被泄露。 因此有了 `KEY_VAULTS_SECRET` 环境变量，用于加密用户存储的 apikey 等敏感信息。
-
-  <Callout type={'info'}>
-    你可以使用 `openssl rand -base64 32` 生成一个随机的 32 位字符串作为 `KEY_VAULTS_SECRET` 的值。
-  </Callout>
-</Steps>
-
-## 配置身份验证服务
-
-在服务端数据库模式下，我们要为不同用户区分身份，因此需要一个身份验证服务。开源社区中已经存在较多完善的身份验证解决方案。我们在实现过程中集成了两种不同的身份验证服务，用于满足不同场景的诉求，一种是 Clerk ，另外一种是 NextAuth。
-
-### Clerk
-
-[Clerk](https://clerk.com?utm_source=lobehub\&utm_medium=docs) 是一个身份验证 SaaS 服务，提供了开箱即用的身份验证能力，产品化程度很高，集成成本较低，体验很好。对于提供 SaaS 化产品的诉求来说，Clerk 是一个不错的选择。我们官方提供的 [LobeHub Cloud](https://LobeHub.com)，就是使用了 Clerk 作为身份验证服务。
-
-Clerk 的集成也相对简单，只需要配置 `NEXT_PUBLIC_CLERK_PUBLISHABLE_KEY` 、 `CLERK_SECRET_KEY` 和 `CLERK_WEBHOOK_SECRET` 环境变量即可，这三个环境变量可以在 Clerk 控制台中获取。
-
-<Callout type={'tip'}>
-  在 Vercel 部署模式下，我们推荐使用 Clerk 作为身份验证服务，可以获得更好的用户体验。
-</Callout>
-
-但是这种身份验证依赖了 Clerk 官方的服务，因此在一些场景下可能会有一些限制：
-
- 比如在国内使用 Clerk 时，可能会受到网络环境的影响；
- 需要完全私有化部署的场景下，Clerk 并不适用；
- 必须依赖 `NEXT_PUBLIC_CLERK_PUBLISHABLE_KEY`，对于公共 Docker 镜像无法开箱即用；
-
-因此针对上述场景，我们也提供了 NextAuth 作为备选方案。
-
-### NextAuth
-
-NextAuth 是一个开源的身份验证库，支持多种身份验证提供商，包括 Auth0、Cognito、GitHub、Google、Facebook、Apple、Twitter 等。NextAuth 本身提供了一套完整的身份验证解决方案，包括用户注册、登录、密码找回、多种身份验证提供商的集成等。
-
-关于 NextAuth 的配置，你可以参考 [身份验证](/zh/docs/self-hosting/advanced/authentication) 的文档获取更多信息。
-
-<Callout type={'tip'}>
-  在官方的 Docker 镜像 `lobehub` 中，我们推荐使用 NextAuth 作为身份验证服务。
-</Callout>
-
-## 配置 S3 存储服务
-
-LobeHub 在 [很早以前](https://x.com/lobehub/status/1724289575672291782) 就支持了多模态的 AI 会话，其中涉及到图片上传给大模型的功能。在客户端数据库方案中，图片文件直接以二进制数据存储在浏览器 IndexedDB 数据库，但在服务端数据库中这个方案并不可行。因为在 Postgres 中直接存储文件类二进制数据会大大浪费宝贵的数据库存储空间，并拖慢计算性能。
-
-这块最佳实践是使用文件存储服务（S3）来存储图片文件，同时 S3 也是文件上传 / 知识库功能所依赖的大容量静态文件存储方案。
-
-<Callout type={'info'}>
-  在本文档库中，S3 所指代的是指兼容 S3 存储方案，即支持 Amazon S3 API 的对象存储系统，常见例如
-  Cloudflare R2 、阿里云 OSS，可以自部署的 RustFS、ceph 等均支持 S3 兼容 API。
-</Callout>
-
-关于 S3 的详细配置指南，请参阅 [S3 对象存储](/zh/docs/self-hosting/advanced/s3) 了解详情。
-
-## 开始部署
-
-以上就是关于服务端数据库版 LobeHub 的配置详解，你可以根据自己的实际情况进行配置，然后选择适合自己的部署平台开始部署：
-
-<PlatformCards urlPrefix={'platform'} />
@@ -16,24 +16,4 @@ tags:

 LobeHub supports various deployment platforms, including Vercel, Docker, and Docker Compose. You can choose a deployment platform that suits you to build your own Lobe Chat.

-## Quick Deployment
-
-For users who are new to LobeHub, we recommend using the client-side database mode for quick deployment. The advantage of this mode is that deployment can be quickly completed with just one command/button, making it easy for you to quickly get started and experience LobeHub.
-
-You can follow the guide below for quick deployment of LobeHub:
-
 <PlatformCards urlPrefix={'platform'} />
-
-<Callout>
-  In the client-side database mode, data is stored locally on the user's device, without
-  cross-device synchronization, and does not support advanced features such as file uploads and
-  knowledge base.
-</Callout>
-
-## Advanced Mode: Server-Side Database
-
-For users who are already familiar with LobeHub or need cross-device synchronization, you can deploy a version with a server-side database to access a more complete and powerful LobeHub.
-
-<Cards>
-  <Card href={'/docs/self-hosting/server-database'} title={'Server-Side Database Deployment Guide'} />
-</Cards>
@@ -20,22 +20,4 @@ tags:

 LobeHub 支持多种部署平台，包括 Vercel、Docker、 Docker Compose 、阿里云计算巢 和腾讯轻量云 等，你可以选择适合自己的部署平台进行部署，构建属于自己的 Lobe Chat。

-## 快速部署
-
-对于第一次了解 LobeHub 的用户，我们推荐使用客户端数据库的模式快速部署，该模式的优势是一行指令 / 一个按钮即可快捷完成部署，便于你快速上手与体验 LobeHub。
-
-你可以通过以下指南快速部署 LobeHub：
-
 <PlatformCards urlPrefix={'platform'} />
-
-<Callout>
-  客户端数据库模式下数据均保留在用户本地，不会跨多端同步，也不支持文件上传、知识库等进阶功能。
-</Callout>
-
-## 进阶模式：服务端数据库
-
-针对已经了解 LobeHub 的用户，或需要多端同步的用户，可以自行部署带有服务端数据库的版本，进而获得更完整、功能更强大的 LobeHub。
-
-<Cards rows={1}>
-  <Card href={'/zh/docs/self-hosting/server-database'} title={'服务端数据库部署指南'} />
-</Cards>
@@ -150,69 +150,99 @@ Given('用户在 Home 页面有一个 Agent', async function (this: CustomWorld)
  console.log(`   ✅ 找到 Agent: ${agentLabel}, id: ${agentId}`);
 });

-Given('该 Agent 未被置顶', async function (this: CustomWorld) {
+Given('该 Agent 未被置顶', { timeout: 30_000 }, async function (this: CustomWorld) {
  console.log('   📍 Step: 检查 Agent 未被置顶...');
  // Check if the agent has a pin icon - if so, unpin it first
  const targetItem = this.page.locator(this.testContext.targetItemSelector).first();
-  const pinIcon = targetItem.locator('svg.lucide-pin');
+  // Pin icon uses lucide-react which adds class "lucide lucide-pin"
+  const pinIcon = targetItem.locator('svg[class*="lucide-pin"]');

  if ((await pinIcon.count()) > 0) {
+    console.log('   📍 Agent 已置顶，开始取消置顶操作...');
    // Unpin it first
-    await targetItem.click({ button: 'right' });
-    await this.page.waitForTimeout(300);
+    await targetItem.hover();
+    await this.page.waitForTimeout(200);
+    await targetItem.click({ button: 'right', force: true });
+    await this.page.waitForTimeout(500);
    const unpinOption = this.page.getByRole('menuitem', { name: /取消置顶|unpin/i });
+    await unpinOption.waitFor({ state: 'visible', timeout: 5000 }).catch(() => {
+      console.log('   ⚠️ 取消置顶选项未找到');
+    });
    if ((await unpinOption.count()) > 0) {
      await unpinOption.click();
      await this.page.waitForTimeout(500);
    }
    // Close menu if still open
-    await this.page.click('body', { position: { x: 10, y: 10 } });
+    await this.page.keyboard.press('Escape');
+    await this.page.waitForTimeout(300);
  }

  console.log('   ✅ Agent 未被置顶');
 });

-Given('该 Agent 已被置顶', async function (this: CustomWorld) {
+Given('该 Agent 已被置顶', { timeout: 30_000 }, async function (this: CustomWorld) {
  console.log('   📍 Step: 确保 Agent 已被置顶...');
  // Check if the agent has a pin icon - if not, pin it first
  const targetItem = this.page.locator(this.testContext.targetItemSelector).first();
-  const pinIcon = targetItem.locator('svg.lucide-pin');
+  // Pin icon uses lucide-react which adds class "lucide lucide-pin"
+  const pinIcon = targetItem.locator('svg[class*="lucide-pin"]');

  if ((await pinIcon.count()) === 0) {
-    // Pin it first
-    await targetItem.click({ button: 'right' });
-    await this.page.waitForTimeout(300);
+    console.log('   📍 Agent 未置顶，开始置顶操作...');
+    // Pin it first - right-click on the NavItem Block inside the Link
+    // The ContextMenuTrigger is attached to the Block component inside the Link
+    await targetItem.hover();
+    await this.page.waitForTimeout(200);
+    await targetItem.click({ button: 'right', force: true });
+    await this.page.waitForTimeout(500);
+
+    // Debug: check menu visibility
+    const menuItems = await this.page.locator('[role="menuitem"]').count();
+    console.log(`   📍 Debug: 发现 ${menuItems} 个菜单项`);
+
    const pinOption = this.page.getByRole('menuitem', { name: /置顶|pin/i });
+    await pinOption.waitFor({ state: 'visible', timeout: 5000 }).catch(() => {
+      console.log('   ⚠️ 置顶选项未找到');
+    });
    if ((await pinOption.count()) > 0) {
      await pinOption.click();
      await this.page.waitForTimeout(500);
+      console.log('   ✅ 已点击置顶选项');
    }
    // Close menu if still open
-    await this.page.click('body', { position: { x: 10, y: 10 } });
+    await this.page.keyboard.press('Escape');
+    await this.page.waitForTimeout(300);
  }

-  console.log('   ✅ Agent 已被置顶');
+  // Verify pin is now visible
+  await this.page.waitForTimeout(500);
+  const pinIconAfter = targetItem.locator('svg[class*="lucide-pin"]');
+  const isPinned = (await pinIconAfter.count()) > 0;
+  console.log(`   ✅ Agent 已被置顶: ${isPinned}`);
 });

 // ============================================
 // When Steps
 // ============================================

-When('用户右键点击该 Agent', async function (this: CustomWorld) {
+When('用户右键点击该 Agent', { timeout: 30_000 }, async function (this: CustomWorld) {
  console.log('   📍 Step: 右键点击 Agent...');

  const targetItem = this.page.locator(this.testContext.targetItemSelector).first();

-  // Right-click on the inner content (the NavItem Block component)
-  // The ContextMenuTrigger wraps the Block, not the Link
-  const innerBlock = targetItem.locator('> div').first();
-  if ((await innerBlock.count()) > 0) {
-    await innerBlock.click({ button: 'right' });
-  } else {
-    await targetItem.click({ button: 'right' });
-  }
+  // Hover first to ensure element is interactive
+  await targetItem.hover();
+  await this.page.waitForTimeout(200);

-  await this.page.waitForTimeout(800);
+  // Right-click with force option to ensure it triggers
+  await targetItem.click({ button: 'right', force: true });
+  await this.page.waitForTimeout(500);
+
+  // Wait for context menu to appear
+  const menuItem = this.page.locator('[role="menuitem"]').first();
+  await menuItem.waitFor({ state: 'visible', timeout: 5000 }).catch(() => {
+    console.log('   ⚠️ 菜单未出现，重试右键点击...');
+  });

  // Debug: check what menus are visible
  const menuItems = await this.page.locator('[role="menuitem"]').count();
@@ -339,7 +369,8 @@ Then('Agent 应该显示置顶图标', async function (this: CustomWorld) {

  await this.page.waitForTimeout(500);
  const targetItem = this.page.locator(this.testContext.targetItemSelector).first();
-  const pinIcon = targetItem.locator('svg.lucide-pin');
+  // Pin icon uses lucide-react which adds class "lucide lucide-pin"
+  const pinIcon = targetItem.locator('svg[class*="lucide-pin"]');
  await expect(pinIcon).toBeVisible({ timeout: 5000 });

  console.log('   ✅ 置顶图标已显示');
@@ -350,7 +381,8 @@ Then('Agent 不应该显示置顶图标', async function (this: CustomWorld) {

  await this.page.waitForTimeout(500);
  const targetItem = this.page.locator(this.testContext.targetItemSelector).first();
-  const pinIcon = targetItem.locator('svg.lucide-pin');
+  // Pin icon uses lucide-react which adds class "lucide lucide-pin"
+  const pinIcon = targetItem.locator('svg[class*="lucide-pin"]');
  await expect(pinIcon).not.toBeVisible({ timeout: 5000 });

  console.log('   ✅ 置顶图标未显示');
@@ -825,6 +825,7 @@
  "meta.llama3-1-405b-instruct-v1:0.description": "Meta Llama 3.1 405B Instruct هو أكبر وأقوى نموذج Llama 3.1 Instruct، نموذج متقدم للغاية للحوار والاستدلال وتوليد البيانات الاصطناعية، ويشكل قاعدة قوية للتدريب المخصص أو التخصيص حسب المجال. نماذج Llama 3.1 متعددة اللغات هي مجموعة من النماذج المدربة مسبقًا والمضبوطة بالتعليمات بأحجام 8B و70B و405B (نص داخل/نص خارج). تم تحسين النماذج المضبوطة للحوار متعدد اللغات وتتجاوز العديد من نماذج الدردشة المفتوحة في المعايير الصناعية. تم تصميم Llama 3.1 للاستخدام التجاري والبحثي عبر اللغات. النماذج المضبوطة مناسبة للدردشة على نمط المساعد، بينما النماذج المدربة مسبقًا تناسب مهام توليد اللغة الطبيعية الأوسع. يمكن أيضًا استخدام مخرجات Llama 3.1 لتحسين نماذج أخرى، بما في ذلك توليد البيانات الاصطناعية وتحسينها. Llama 3.1 هو نموذج Transformer توليدي ذاتي مع بنية محسّنة. تستخدم الإصدارات المضبوطة التخصيص الخاضع للإشراف (SFT) والتعلم المعزز من تغذية راجعة بشرية (RLHF) لتتماشى مع تفضيلات البشر من حيث الفائدة والسلامة.",
  "meta.llama3-1-70b-instruct-v1:0.description": "Meta Llama 3.1 70B Instruct المحدث مع نافذة سياق ممتدة إلى 128K، ودعم متعدد اللغات، واستدلال محسن. نماذج Llama 3.1 متعددة اللغات هي مجموعة من النماذج المدربة مسبقًا والمضبوطة بالتعليمات بأحجام 8B و70B و405B (نص داخل/نص خارج). تم تحسين النماذج المضبوطة للحوار متعدد اللغات وتتجاوز العديد من نماذج الدردشة المفتوحة في المعايير الصناعية. تم تصميم Llama 3.1 للاستخدام التجاري والبحثي عبر اللغات. النماذج المضبوطة مناسبة للدردشة على نمط المساعد، بينما النماذج المدربة مسبقًا تناسب مهام توليد اللغة الطبيعية الأوسع. يمكن أيضًا استخدام مخرجات Llama 3.1 لتحسين نماذج أخرى، بما في ذلك توليد البيانات الاصطناعية وتحسينها. Llama 3.1 هو نموذج Transformer توليدي ذاتي مع بنية محسّنة. تستخدم الإصدارات المضبوطة التخصيص الخاضع للإشراف (SFT) والتعلم المعزز من تغذية راجعة بشرية (RLHF) لتتماشى مع تفضيلات البشر من حيث الفائدة والسلامة.",
  "meta.llama3-1-8b-instruct-v1:0.description": "Meta Llama 3.1 8B Instruct المحدث مع نافذة سياق 128K، ودعم متعدد اللغات، واستدلال محسن. عائلة Llama 3.1 تشمل نماذج نصية مضبوطة بأحجام 8B و70B و405B، محسّنة للدردشة متعددة اللغات وأداء قوي في المعايير. تم تصميمه للاستخدام التجاري والبحثي عبر اللغات؛ النماذج المضبوطة تناسب الدردشة على نمط المساعد، بينما النماذج المدربة مسبقًا تناسب مهام التوليد الأوسع. يمكن أيضًا استخدام مخرجات Llama 3.1 لتحسين نماذج أخرى (مثل البيانات الاصطناعية والتحسين). إنه نموذج Transformer توليدي ذاتي، مع SFT وRLHF للتوافق مع الفائدة والسلامة.",
+  "meta.llama3-70b-instruct-v1:0.description": "Meta Llama 3 هو نموذج لغوي مفتوح المصدر مخصص للمطورين والباحثين والشركات، صُمم لمساعدتهم في بناء أفكار الذكاء الاصطناعي التوليدي، وتجربتها، وتوسيع نطاقها بشكل مسؤول. ويُعد جزءًا من البنية التحتية للابتكار المجتمعي العالمي، مما يجعله مناسبًا لإنشاء المحتوى، والذكاء الاصطناعي الحواري، وفهم اللغة، والبحث والتطوير، وتطبيقات المؤسسات.",
  "meta.llama3-8b-instruct-v1:0.description": "ميتا لاما 3 هو نموذج لغوي مفتوح المصدر مخصص للمطورين والباحثين والشركات، صُمم لمساعدتهم في بناء أفكار الذكاء الاصطناعي التوليدي، وتجربتها، وتوسيع نطاقها بشكل مسؤول. يُعد جزءًا من البنية التحتية للابتكار المجتمعي العالمي، وهو مناسب للبيئات ذات الموارد المحدودة، والأجهزة الطرفية، وأوقات التدريب الأسرع.",
  "meta/Llama-3.2-11B-Vision-Instruct.description": "قدرات قوية في الاستدلال الصوري على الصور عالية الدقة، مناسب لتطبيقات الفهم البصري.",
  "meta/Llama-3.2-90B-Vision-Instruct.description": "استدلال صوري متقدم لتطبيقات الوكلاء المعتمدين على الفهم البصري.",
@@ -853,6 +854,58 @@
  "meta/llama-3.3-70b.description": "توازن مثالي بين الأداء والكفاءة. مصمم للذكاء الاصطناعي الحواري عالي الأداء في إنشاء المحتوى، وتطبيقات المؤسسات، والبحث، مع فهم لغوي قوي للتلخيص، والتصنيف، وتحليل المشاعر، وتوليد الشيفرة.",
  "meta/llama-4-maverick.description": "عائلة لاما 4 هي مجموعة نماذج ذكاء اصطناعي متعددة الوسائط تدعم النص والتجارب متعددة الوسائط، وتستخدم MoE لفهم متقدم للنصوص والصور. لاما 4 مافريك هو نموذج يحتوي على 17 مليار معامل و128 خبيرًا، يُقدَّم عبر DeepInfra.",
  "meta/llama-4-scout.description": "عائلة لاما 4 هي مجموعة نماذج ذكاء اصطناعي متعددة الوسائط تدعم النص والتجارب متعددة الوسائط، وتستخدم MoE لفهم متقدم للنصوص والصور. لاما 4 سكاوت هو نموذج يحتوي على 17 مليار معامل و16 خبيرًا، يُقدَّم عبر DeepInfra.",
+  "microsoft/Phi-3-medium-128k-instruct.description": "نفس نموذج Phi-3-medium ولكن مع نافذة سياق أكبر لدعم استرجاع المعلومات أو التعليمات القليلة.",
+  "microsoft/Phi-3-medium-4k-instruct.description": "نموذج يحتوي على 14 مليار معامل بجودة أعلى من Phi-3-mini، يركز على البيانات عالية الجودة التي تتطلب استدلالًا عميقًا.",
+  "microsoft/Phi-3-mini-128k-instruct.description": "نفس نموذج Phi-3-mini ولكن مع نافذة سياق أكبر لدعم استرجاع المعلومات أو التعليمات القليلة.",
+  "microsoft/Phi-3-mini-4k-instruct.description": "أصغر عضو في عائلة Phi-3، مُحسّن للجودة وانخفاض زمن الاستجابة.",
+  "microsoft/Phi-3-small-128k-instruct.description": "نفس نموذج Phi-3-small ولكن مع نافذة سياق أكبر لدعم استرجاع المعلومات أو التعليمات القليلة.",
+  "microsoft/Phi-3-small-8k-instruct.description": "نموذج يحتوي على 7 مليارات معامل بجودة أعلى من Phi-3-mini، يركز على البيانات عالية الجودة التي تتطلب استدلالًا عميقًا.",
+  "microsoft/Phi-3.5-mini-instruct.description": "إصدار محدث من نموذج Phi-3-mini.",
+  "microsoft/Phi-3.5-vision-instruct.description": "إصدار محدث من نموذج Phi-3-vision.",
+  "microsoft/WizardLM-2-8x22B.description": "WizardLM 2 هو نموذج لغوي من Microsoft AI يتميز بالحوار المعقد، والمهام متعددة اللغات، والاستدلال، والمساعدات الذكية.",
+  "microsoft/wizardlm-2-8x22b.description": "WizardLM-2 8x22B هو النموذج الأكثر تقدمًا من Microsoft AI ضمن سلسلة Wizard، ويتميز بأداء تنافسي عالي.",
+  "mimo-v2-flash.description": "MiMo-V2-Flash: نموذج فعال للاستدلال، والبرمجة، وبناء الأسس للوكيل الذكي.",
+  "minicpm-v.description": "MiniCPM-V هو نموذج متعدد الوسائط من الجيل التالي من OpenBMB يتميز بقدرات ممتازة في التعرف البصري للنصوص وفهم الوسائط المتعددة لمجموعة واسعة من الاستخدامات.",
+  "minimax-m2.1.description": "MiniMax-M2.1 هو أحدث إصدار من سلسلة MiniMax، مُحسّن للبرمجة متعددة اللغات والمهام المعقدة الواقعية. كنموذج أصلي للذكاء الاصطناعي، يحقق MiniMax-M2.1 تحسينات كبيرة في الأداء، ودعم أطر الوكلاء، والتكيف مع سيناريوهات متعددة، بهدف مساعدة الأفراد والشركات على تبني نمط حياة وعمل قائم على الذكاء الاصطناعي بسرعة أكبر.",
+  "minimax-m2.description": "MiniMax M2 هو نموذج لغوي كبير وفعّال صُمم خصيصًا للبرمجة وسير عمل الوكلاء.",
+  "minimax/minimax-m2.1.description": "MiniMax-M2.1 هو نموذج لغوي كبير وخفيف الوزن ومتطور، مُحسّن للبرمجة وسير عمل الوكلاء وتطوير التطبيقات الحديثة، ويقدم مخرجات أنظف وأكثر إيجازًا واستجابة أسرع.",
+  "minimax/minimax-m2.description": "MiniMax-M2 هو نموذج عالي القيمة يتميز في مهام البرمجة والوكلاء في العديد من سيناريوهات الهندسة.",
+  "minimaxai/minimax-m2.description": "MiniMax-M2 هو نموذج MoE مدمج وسريع وفعّال من حيث التكلفة (230 مليار إجمالي، 10 مليارات نشطة) صُمم لتحقيق أداء رفيع المستوى في البرمجة ومهام الوكلاء مع الحفاظ على ذكاء عام قوي. يتميز بتحرير ملفات متعددة، وتشغيل الكود وتصحيحه، والتحقق من الاختبارات، وسلاسل أدوات معقدة.",
+  "ministral-3b-latest.description": "Ministral 3B هو النموذج الرائد من Mistral للأجهزة الطرفية.",
+  "ministral-8b-latest.description": "Ministral 8B هو نموذج فعال من حيث التكلفة من Mistral للأجهزة الطرفية.",
+  "mistral-ai/Mistral-Large-2411.description": "النموذج الرئيسي من Mistral للمهام المعقدة التي تتطلب استدلالًا واسع النطاق أو تخصصًا (توليد نصوص اصطناعية، توليد كود، استرجاع معلومات، أو وكلاء).",
+  "mistral-ai/Mistral-Nemo.description": "Mistral Nemo هو نموذج لغوي متقدم يتميز بأحدث تقنيات الاستدلال والمعرفة العالمية والبرمجة بالنسبة لحجمه.",
+  "mistral-ai/mistral-small-2503.description": "Mistral Small مناسب لأي مهمة لغوية تتطلب كفاءة عالية وزمن استجابة منخفض.",
+  "mistral-large-instruct.description": "Mistral-Large-Instruct-2407 هو نموذج لغوي كثيف متقدم يحتوي على 123 مليار معامل، يتميز بأحدث تقنيات الاستدلال والمعرفة والبرمجة.",
+  "mistral-large-latest.description": "Mistral Large هو النموذج الرئيسي، قوي في المهام متعددة اللغات، والاستدلال المعقد، وتوليد الكود—مثالي للتطبيقات المتقدمة.",
+  "mistral-large.description": "Mixtral Large هو النموذج الرئيسي من Mistral، يجمع بين توليد الكود، والرياضيات، والاستدلال مع نافذة سياق 128K.",
+  "mistral-medium-latest.description": "Mistral Medium 3 يقدم أداءً متقدمًا بتكلفة أقل 8 مرات، ويسهّل النشر المؤسسي.",
+  "mistral-nemo-instruct.description": "Mistral-Nemo-Instruct-2407 هو الإصدار الموجه بالتعليمات من Mistral-Nemo-Base-2407.",
+  "mistral-nemo.description": "Mistral Nemo هو نموذج فعال يحتوي على 12 مليار معامل من Mistral AI وNVIDIA.",
+  "mistral-small-latest.description": "Mistral Small هو خيار سريع وموثوق وفعال من حيث التكلفة للترجمة، والتلخيص، وتحليل المشاعر.",
+  "mistral-small.description": "Mistral Small مناسب لأي مهمة لغوية تتطلب كفاءة عالية وزمن استجابة منخفض.",
+  "mistral.description": "Mistral هو نموذج 7B من Mistral AI، مناسب لمهام لغوية متنوعة.",
+  "mistral/codestral-embed.description": "نموذج تضمين الكود مخصص لتضمين قواعد الكود والمستودعات لدعم مساعدي البرمجة.",
+  "mistral/codestral.description": "Mistral Codestral 25.01 هو نموذج برمجة متقدم يتميز بزمن استجابة منخفض واستخدام عالي التكرار. يدعم أكثر من 80 لغة ويتفوق في FIM، وتصحيح الكود، وتوليد الاختبارات.",
+  "mistral/devstral-small.description": "Devstral هو نموذج لغوي وكيل لمهام هندسة البرمجيات، مما يجعله خيارًا قويًا لوكلاء البرمجيات.",
+  "mistral/magistral-medium.description": "تفكير معقد مدعوم بفهم عميق واستدلال شفاف يمكن تتبعه والتحقق منه. يحافظ على استدلال عالي الدقة عبر اللغات حتى أثناء المهمة.",
+  "mistral/magistral-small.description": "تفكير معقد مدعوم بفهم عميق واستدلال شفاف يمكن تتبعه والتحقق منه. يحافظ على استدلال عالي الدقة عبر اللغات حتى أثناء المهمة.",
+  "mistral/ministral-3b.description": "نموذج مدمج وفعّال للمهام على الأجهزة مثل المساعدات والتحليلات المحلية، يقدم أداءً بزمن استجابة منخفض.",
+  "mistral/ministral-8b.description": "نموذج أقوى مع استدلال أسرع وكفاءة في استخدام الذاكرة، مثالي لسير العمل المعقد وتطبيقات الأجهزة الطرفية المتطلبة.",
+  "mistral/mistral-embed.description": "نموذج تضمين نصوص عام للبحث الدلالي، والتشابه، والتجميع، وسير عمل استرجاع المعلومات.",
+  "mistral/mistral-large.description": "Mistral Large مثالي للمهام المعقدة التي تتطلب استدلالًا قويًا أو تخصصًا—مثل توليد النصوص الاصطناعية، وتوليد الكود، واسترجاع المعلومات، أو الوكلاء.",
+  "mistral/mistral-small.description": "Mistral Small مثالي للمهام البسيطة القابلة للتجميع مثل التصنيف، ودعم العملاء، أو توليد النصوص، ويقدم أداءً ممتازًا بسعر مناسب.",
+  "mistral/mixtral-8x22b-instruct.description": "نموذج Instruct 8x22B. نموذج MoE مفتوح المصدر مقدم من Mistral.",
+  "mistral/pixtral-12b.description": "نموذج يحتوي على 12 مليار معامل يتميز بفهم الصور والنصوص.",
+  "mistral/pixtral-large.description": "Pixtral Large هو النموذج الثاني في عائلة النماذج متعددة الوسائط لدينا، يتميز بفهم متقدم للصور. يتعامل مع المستندات، والمخططات، والصور الطبيعية مع الحفاظ على فهم نصوص رائد كما في Mistral Large 2.",
+  "mistralai/Mistral-7B-Instruct-v0.1.description": "Mistral (7B) Instruct معروف بأدائه القوي في العديد من المهام اللغوية.",
+  "mistralai/Mistral-7B-Instruct-v0.2.description": "Mistral (7B) Instruct v0.2 يحسن التعامل مع التعليمات ودقة النتائج.",
+  "mistralai/Mistral-7B-Instruct-v0.3.description": "Mistral (7B) Instruct v0.3 يقدم كفاءة في الحوسبة وفهم لغوي قوي لمجموعة واسعة من الاستخدامات.",
+  "mistralai/Mistral-7B-v0.1.description": "Mistral 7B هو نموذج مدمج وعالي الأداء، قوي في المعالجة الدفعية والمهام البسيطة مثل التصنيف وتوليد النصوص، مع استدلال متين.",
+  "mistralai/Mixtral-8x22B-Instruct-v0.1.description": "Mixtral-8x22B Instruct (141B) هو نموذج لغوي كبير جدًا للمهام الثقيلة.",
+  "mistralai/Mixtral-8x7B-Instruct-v0.1.description": "Mixtral-8x7B Instruct (46.7B) يوفر قدرة عالية لمعالجة البيانات على نطاق واسع.",
+  "mistralai/Mixtral-8x7B-v0.1.description": "Mixtral 8x7B هو نموذج MoE متفرق يعزز سرعة الاستدلال، مناسب للمهام متعددة اللغات وتوليد الكود.",
+  "mistralai/mistral-nemo.description": "Mistral Nemo هو نموذج يحتوي على 7.3 مليار معامل يدعم لغات متعددة ويتميز بأداء قوي في البرمجة.",
  "moonshot-v1-128k-vision-preview.description": "نماذج Kimi للرؤية (بما في ذلك moonshot-v1-8k-vision-preview/moonshot-v1-32k-vision-preview/moonshot-v1-128k-vision-preview) قادرة على فهم محتوى الصور مثل النصوص، الألوان، وأشكال الكائنات.",
  "moonshot-v1-128k.description": "Moonshot V1 128K يوفر سياقًا طويلًا للغاية لتوليد نصوص طويلة جدًا، حيث يتعامل مع ما يصل إلى 128,000 رمز، مما يجعله مثاليًا للبحث، والأكاديميا، والوثائق الكبيرة.",
  "moonshot-v1-32k-vision-preview.description": "نماذج Kimi للرؤية (بما في ذلك moonshot-v1-8k-vision-preview/moonshot-v1-32k-vision-preview/moonshot-v1-128k-vision-preview) قادرة على فهم محتوى الصور مثل النصوص، الألوان، وأشكال الكائنات.",
@@ -446,6 +446,8 @@
  "settingImage.defaultCount.desc": "تحديد عدد الصور الافتراضي الذي يتم إنشاؤه عند بدء مهمة جديدة في لوحة توليد الصور.",
  "settingImage.defaultCount.label": "عدد الصور الافتراضي",
  "settingImage.defaultCount.title": "فن الذكاء الاصطناعي",
+  "settingModel.enableContextCompression.desc": "ضغط الرسائل التاريخية تلقائيًا إلى ملخصات عند تجاوز المحادثة 64,000 رمز، مما يوفر من 60٪ إلى 80٪ من استخدام الرموز",
+  "settingModel.enableContextCompression.title": "تفعيل ضغط السياق التلقائي",
  "settingModel.enableMaxTokens.title": "تفعيل حد الرموز القصوى",
  "settingModel.enableReasoningEffort.title": "تفعيل ضبط جهد الاستدلال",
  "settingModel.frequencyPenalty.desc": "كلما زادت القيمة، زادت تنوع وغنى المفردات؛ وكلما انخفضت، أصبحت اللغة أبسط وأكثر مباشرة.",
@@ -140,6 +140,8 @@
  "models.output": "إخراج",
  "models.title": "النماذج",
  "payDiffPrice": "دفع الفرق",
+  "payDiffPriceApprox": "تقريبًا",
+  "payDiffPriceTip": "المبلغ الفعلي يعتمد على صفحة الدفع",
  "payment.error.actions.billing": "إدارة الفوترة",
  "payment.error.actions.home": "العودة إلى الصفحة الرئيسية",
  "payment.error.desc": "معرّف الاشتراك: {{id}} غير موجود. إذا كانت لديك أسئلة، يرجى التواصل معنا عبر البريد الإلكتروني",
@@ -355,6 +355,7 @@
  "deepseek-ai/deepseek-v3.1-terminus.description": "DeepSeek V3.1 е модел за разсъждение от ново поколение с по-силни способности за сложни разсъждения и верига от мисли за задълбочени аналитични задачи.",
  "deepseek-ai/deepseek-v3.1.description": "DeepSeek V3.1 е модел за разсъждение от ново поколение с по-силни способности за сложни разсъждения и верига от мисли за задълбочени аналитични задачи.",
  "deepseek-ai/deepseek-vl2.description": "DeepSeek-VL2 е MoE модел за визия и език, базиран на DeepSeekMoE-27B със слаба активация, постигайки висока производителност с едва 4.5 милиарда активни параметъра. Отличава се в визуални въпроси и отговори, OCR, разбиране на документи/таблици/графики и визуално привързване.",
+  "deepseek-chat.description": "DeepSeek V3.2 постига баланс между логическо мислене и дължина на отговорите за ежедневни въпроси и задачи на агенти. Публичните бенчмаркове достигат нивата на GPT-5, а това е първият модел, който интегрира мислене при използване на инструменти, водещ до водещи резултати в оценките на отворените агенти.",
  "deepseek-coder-33B-instruct.description": "DeepSeek Coder 33B е езиков модел за програмиране, обучен върху 2 трилиона токени (87% код, 13% китайски/английски текст). Въвежда 16K контекстен прозорец и задачи за попълване в средата, осигурявайки допълване на код на ниво проект и попълване на фрагменти.",
  "deepseek-coder-v2.description": "DeepSeek Coder V2 е отворен MoE модел за програмиране, който се представя на ниво GPT-4 Turbo.",
  "deepseek-coder-v2:236b.description": "DeepSeek Coder V2 е отворен MoE модел за програмиране, който се представя на ниво GPT-4 Turbo.",
@@ -377,6 +378,7 @@
  "deepseek-r1-fast-online.description": "Пълна бърза версия на DeepSeek R1 с търсене в реално време в уеб, комбинираща възможности от мащаб 671B и по-бърз отговор.",
  "deepseek-r1-online.description": "Пълна версия на DeepSeek R1 с 671 милиарда параметъра и търсене в реално време в уеб, предлагаща по-силно разбиране и генериране.",
  "deepseek-r1.description": "DeepSeek-R1 използва данни от студен старт преди подсиленото обучение и се представя наравно с OpenAI-o1 в математика, програмиране и разсъждение.",
+  "deepseek-reasoner.description": "DeepSeek V3.2 Thinking е модел за дълбоко разсъждение, който генерира верига от мисли преди отговорите за по-висока точност, с водещи резултати в състезания и логика, сравнима с Gemini-3.0-Pro.",
  "deepseek-v2.description": "DeepSeek V2 е ефективен MoE модел за икономична обработка.",
  "deepseek-v2:236b.description": "DeepSeek V2 236B е модел на DeepSeek, фокусиран върху програмиране, с висока производителност при генериране на код.",
  "deepseek-v3-0324.description": "DeepSeek-V3-0324 е MoE модел с 671 милиарда параметъра, с изключителни способности в програмиране, технически задачи, разбиране на контекст и обработка на дълги текстове.",
@@ -470,6 +472,8 @@
  "ernie-tiny-8k.description": "ERNIE Tiny 8K е ултралек модел за прости QA, класификация и нискоразходно извеждане.",
  "ernie-x1-turbo-32k.description": "ERNIE X1 Turbo 32K е бърз мислещ модел с 32K контекст за сложни разсъждения и многозавойни разговори.",
  "ernie-x1.1-preview.description": "ERNIE X1.1 Preview е предварителен модел за мислене, предназначен за оценка и тестване.",
+  "fal-ai/bytedance/seedream/v4.5.description": "Seedream 4.5, разработен от екипа Seed на ByteDance, поддържа редактиране и композиране на множество изображения. Отличава се с подобрена консистентност на обектите, точно следване на инструкции, разбиране на пространствена логика, естетическо изразяване, оформление на плакати и дизайн на лога с високопрецизно рендиране на текст и изображения.",
+  "fal-ai/bytedance/seedream/v4.description": "Seedream 4.0, създаден от ByteDance Seed, поддържа вход от текст и изображения за висококачествено и контролируемо генериране на изображения по подадени подсказки.",
  "fal-ai/flux-kontext/dev.description": "FLUX.1 модел, фокусиран върху редактиране на изображения, поддържащ вход от текст и изображения.",
  "fal-ai/flux-pro/kontext.description": "FLUX.1 Kontext [pro] приема текст и референтни изображения като вход, позволявайки целенасочени локални редакции и сложни глобални трансформации на сцени.",
  "fal-ai/flux/krea.description": "Flux Krea [dev] е модел за генериране на изображения с естетично предпочитание към по-реалистични и естествени изображения.",
@@ -477,6 +481,8 @@
  "fal-ai/hunyuan-image/v3.description": "Мощен роден мултимодален модел за генериране на изображения.",
  "fal-ai/imagen4/preview.description": "Модел за висококачествено генериране на изображения от Google.",
  "fal-ai/nano-banana.description": "Nano Banana е най-новият, най-бърз и най-ефективен роден мултимодален модел на Google, позволяващ генериране и редактиране на изображения чрез разговор.",
+  "fal-ai/qwen-image-edit.description": "Професионален модел за редактиране на изображения от екипа на Qwen, поддържащ семантични и визуални промени, прецизно редактиране на текст на китайски/английски, трансфер на стил, завъртане и други.",
+  "fal-ai/qwen-image.description": "Мощен модел за генериране на изображения от екипа на Qwen с отлична визуализация на китайски текст и разнообразни визуални стилове.",
  "flux-1-schnell.description": "Модел за преобразуване на текст в изображение с 12 милиарда параметъра от Black Forest Labs, използващ латентна дифузионна дестилация за генериране на висококачествени изображения в 1–4 стъпки. Съперничи на затворени алтернативи и е пуснат под лиценз Apache-2.0 за лична, изследователска и търговска употреба.",
  "flux-dev.description": "FLUX.1 [dev] е дестилиран модел с отворени тегла за нетърговска употреба. Запазва почти професионално качество на изображенията и следване на инструкции, като същевременно работи по-ефективно и използва ресурсите по-добре от стандартни модели със същия размер.",
  "flux-kontext-max.description": "Съвременно генериране и редактиране на изображения с контекст, комбиниращо текст и изображения за прецизни и последователни резултати.",
@@ -508,6 +514,8 @@
  "gemini-2.0-flash-lite-001.description": "Вариант на Gemini 2.0 Flash, оптимизиран за ниска цена и ниска латентност.",
  "gemini-2.0-flash-lite.description": "Вариант на Gemini 2.0 Flash, оптимизиран за ниска цена и ниска латентност.",
  "gemini-2.0-flash.description": "Gemini 2.0 Flash предлага функции от ново поколение, включително изключителна скорост, вградена употреба на инструменти, мултимодално генериране и контекстен прозорец от 1 милион токена.",
+  "gemini-2.5-flash-image-preview.description": "Nano Banana е най-новият, най-бърз и най-ефективен роден мултимодален модел на Google, позволяващ разговорно генериране и редактиране на изображения.",
+  "gemini-2.5-flash-image-preview:image.description": "Nano Banana е най-новият, най-бърз и най-ефективен роден мултимодален модел на Google, позволяващ разговорно генериране и редактиране на изображения.",
  "gemini-2.5-flash-image.description": "Nano Banana е най-новият, най-бърз и най-ефективен роден мултимодален модел на Google, позволяващ разговорно генериране и редактиране на изображения.",
  "gemini-2.5-flash-image:image.description": "Nano Banana е най-новият, най-бърз и най-ефективен роден мултимодален модел на Google, позволяващ разговорно генериране и редактиране на изображения.",
  "gemini-2.5-flash-lite-preview-06-17.description": "Gemini 2.5 Flash-Lite Preview е най-малкият и най-изгоден модел на Google, проектиран за мащабна употреба.",
@@ -522,6 +530,7 @@
  "gemini-2.5-pro.description": "Gemini 2.5 Pro е най-усъвършенстваният модел за разсъждение на Google, способен да разсъждава върху код, математика и STEM проблеми и да анализира големи набори от данни, кодови бази и документи с дълъг контекст.",
  "gemini-3-flash-preview.description": "Gemini 3 Flash е най-интелигентният модел, създаден за скорост, съчетаващ авангардна интелигентност с отлично търсене и обоснованост.",
  "gemini-3-pro-image-preview.description": "Gemini 3 Pro Image（Nano Banana Pro）е модел на Google за генериране на изображения, който също така поддържа мултимодален диалог.",
+  "gemini-3-pro-image-preview:image.description": "Gemini 3 Pro Image (Nano Banana Pro) е модел на Google за генериране на изображения, който също поддържа мултимодален чат.",
  "gemini-3-pro-preview.description": "Gemini 3 Pro е най-мощният агентен и „vibe-coding“ модел на Google, който предлага по-богати визуализации и по-дълбоко взаимодействие, базирано на съвременно логическо мислене.",
  "gemini-flash-latest.description": "Най-новата версия на Gemini Flash",
  "gemini-flash-lite-latest.description": "Най-новата версия на Gemini Flash-Lite",
@@ -692,6 +701,29 @@
  "hunyuan-t1-latest.description": "Значително подобрява модела с бавно мислене при трудна математика, сложна логика, трудни задачи по програмиране, следване на инструкции и качество на креативното писане.",
  "hunyuan-t1-vision-20250619.description": "Най-новият мултимодален модел t1-vision с дълбоко логическо мислене и вградена верига на мисълта, значително подобрен спрямо предишната версия по подразбиране.",
  "hunyuan-t1-vision-20250916.description": "Най-новият модел t1-vision с дълбоко логическо мислене и големи подобрения във VQA, визуално привързване, OCR, диаграми, решаване на заснети задачи и създаване на съдържание от изображения, както и по-силна поддръжка на английски и езици с ограничени ресурси.",
+  "hunyuan-turbo-20241223.description": "Тази версия подобрява мащабирането на инструкции за по-добра генерализация, значително подобрява логическото мислене в математика/код/логика, засилва разбирането на думи и повишава качеството на писане.",
+  "hunyuan-turbo-latest.description": "Общи подобрения в NLP разбирането, писането, чата, въпросите и отговорите, превода и специализираните области; по-човешки отговори, по-добро изясняване на неясни намерения, подобрен синтактичен анализ, по-високо творческо качество и интерактивност, както и по-силни многозавойни разговори.",
+  "hunyuan-turbo-vision.description": "Флагмански модел от ново поколение за визия и език с нова MoE архитектура, с широки подобрения в разпознаването, създаването на съдържание, въпроси и отговори по знания и аналитично мислене.",
+  "hunyuan-turbo.description": "Преглед на следващото поколение LLM на Hunyuan с нова MoE архитектура, осигуряваща по-бързо разсъждение и по-силни резултати от hunyuan-pro.",
+  "hunyuan-turbos-20250313.description": "Унифицира стила на решаване на математически задачи и засилва многозавойните въпроси и отговори в математиката. Стилът на писане е усъвършенстван, за да намали изкуствения тон и да добави изтънченост.",
+  "hunyuan-turbos-20250416.description": "Подобрен базов модел за предварително обучение за по-добро разбиране и следване на инструкции; подобрено съгласуване в математика, код, логика и наука; подобрено качество на писане, разбиране, точност на превода и въпроси и отговори по знания; засилени способности на агентите, особено при многозавойно разбиране.",
+  "hunyuan-turbos-20250604.description": "Подобрен базов модел за предварително обучение с по-добро писане и четене с разбиране, значителни подобрения в кода и STEM, както и по-добро следване на сложни инструкции.",
+  "hunyuan-turbos-20250926.description": "Подобрено качество на предварителните данни и стратегията за последващо обучение, подобряваща агентите, английския език/езиците с ограничени ресурси, следването на инструкции, кода и STEM възможностите.",
+  "hunyuan-turbos-latest.description": "Най-новият флагмански модел Hunyuan TurboS с по-силно разсъждение и по-добро цялостно изживяване.",
+  "hunyuan-turbos-longtext-128k-20250325.description": "Изключителен при задачи с дълги документи като обобщение и въпроси и отговори, като същевременно се справя с общо генериране. Силен при анализ и генериране на дълги текстове за сложни и детайлни съдържания.",
+  "hunyuan-turbos-role-plus.description": "Най-новият модел за ролеви игри, официално фино настроен върху ролеви набори от данни, осигуряващ по-силна базова производителност за ролеви сценарии.",
+  "hunyuan-turbos-vision-20250619.description": "Най-новият флагмански модел TurboS за визия и език с големи подобрения при задачи с изображения и текст като разпознаване на обекти, въпроси и отговори по знания, копирайтинг и решаване на задачи по снимки.",
+  "hunyuan-turbos-vision.description": "Флагмански модел от ново поколение за визия и език, базиран на най-новия TurboS, фокусиран върху задачи с разбиране на изображения и текст като разпознаване на обекти, въпроси и отговори по знания, копирайтинг и решаване на задачи по снимки.",
+  "hunyuan-vision-1.5-instruct.description": "Модел за бързо мислене, генериращ текст от изображения, базиран на текстовия TurboS. В сравнение с предишната версия, има значителни подобрения в основното разпознаване и анализ на изображения.",
+  "hunyuan-vision.description": "Най-новият мултимодален модел, поддържащ вход от изображения и текст за генериране на текст.",
+  "image-01-live.description": "Модел за генериране на изображения с фини детайли, поддържащ преобразуване от текст към изображение и контролируеми стилови настройки.",
+  "image-01.description": "Нов модел за генериране на изображения с фини детайли, поддържащ преобразуване от текст към изображение и от изображение към изображение.",
+  "imagen-4.0-fast-generate-001.description": "Бързата версия от четвъртото поколение модели Imagen за преобразуване от текст към изображение.",
+  "imagen-4.0-generate-001.description": "Четвърто поколение модели Imagen за преобразуване от текст към изображение.",
+  "imagen-4.0-generate-preview-06-06.description": "Семейство модели от четвърто поколение Imagen за преобразуване от текст към изображение.",
+  "imagen-4.0-ultra-generate-001.description": "Ultra версията от четвъртото поколение модели Imagen за преобразуване от текст към изображение.",
+  "imagen-4.0-ultra-generate-preview-06-06.description": "Ultra вариант от четвъртото поколение модели Imagen за преобразуване от текст към изображение.",
+  "inception/mercury-coder-small.description": "Mercury Coder Small е идеален за генериране на код, отстраняване на грешки и рефакториране с минимално закъснение.",
  "meta.llama3-8b-instruct-v1:0.description": "Meta Llama 3 е отворен LLM, предназначен за разработчици, изследователи и предприятия, създаден да им помага да изграждат, експериментират и отговорно мащабират идеи за генеративен ИИ. Като част от основата за глобални иновации в общността, той е подходящ за среди с ограничени изчислителни ресурси, крайни устройства и по-бързо обучение.",
  "meta/Llama-3.2-11B-Vision-Instruct.description": "Силен визуален анализ на изображения с висока резолюция, подходящ за приложения за визуално разбиране.",
  "meta/Llama-3.2-90B-Vision-Instruct.description": "Разширен визуален анализ за приложения с агенти за визуално разбиране.",
@@ -446,6 +446,8 @@
  "settingImage.defaultCount.desc": "Задайте броя изображения по подразбиране, които се генерират при създаване на нова задача в панела за генериране на изображения.",
  "settingImage.defaultCount.label": "Брой изображения по подразбиране",
  "settingImage.defaultCount.title": "AI Изкуство",
+  "settingModel.enableContextCompression.desc": "Автоматично компресиране на исторически съобщения в обобщения, когато разговорът надвиши 64 000 токена, спестявайки 60–80% от използваните токени",
+  "settingModel.enableContextCompression.title": "Активирай автоматично компресиране на контекста",
  "settingModel.enableMaxTokens.title": "Активиране на лимит за максимален брой токени",
  "settingModel.enableReasoningEffort.title": "Активиране на настройка за усилие при разсъждение",
  "settingModel.frequencyPenalty.desc": "Колкото по-висока е стойността, толкова по-богат и разнообразен е речникът; по-ниска стойност води до по-прост и ясен език.",
@@ -140,6 +140,8 @@
  "models.output": "Изход",
  "models.title": "Модели",
  "payDiffPrice": "Плати разликата",
+  "payDiffPriceApprox": "Приблизително",
+  "payDiffPriceTip": "Действителната сума се определя на страницата за плащане",
  "payment.error.actions.billing": "Управление на плащания",
  "payment.error.actions.home": "Обратно към началната страница",
  "payment.error.desc": "Абонамент с ID: {{id}} не е намерен. Ако имаш въпроси, свържи се с нас по имейл",
@@ -975,6 +975,17 @@
  "openai/o3-mini-high.description": "o3-mini (High Reasoning) bietet höhere Intelligenz bei gleichen Kosten- und Latenzzielen wie o1-mini.",
  "openai/o3-mini.description": "o3-mini ist OpenAIs neuestes kleines Modell für logisches Denken und bietet höhere Intelligenz bei gleichen Kosten- und Latenzzielen wie o1-mini.",
  "openai/o3.description": "OpenAI o3 ist das leistungsstärkste Modell für logisches Denken und setzt neue Maßstäbe in den Bereichen Programmierung, Mathematik, Naturwissenschaften und visuelle Wahrnehmung. Es brilliert bei komplexen, facettenreichen Anfragen und ist besonders stark in der Analyse von Bildern, Diagrammen und Grafiken.",
+  "openai/o4-mini-high.description": "o4-mini High-Reasoning-Stufe, optimiert für schnelle, effiziente Schlussfolgerungen mit starker Leistung in den Bereichen Programmierung und visuelle Verarbeitung.",
+  "openai/o4-mini.description": "OpenAI o4-mini ist ein kleines, effizientes Modell für logisches Denken in latenzkritischen Szenarien.",
+  "openai/text-embedding-3-large.description": "OpenAIs leistungsfähigstes Embedding-Modell für Aufgaben in englischer und nicht-englischer Sprache.",
+  "openai/text-embedding-3-small.description": "OpenAIs verbesserte, leistungsstärkere Variante des ada-Embedding-Modells.",
+  "openai/text-embedding-ada-002.description": "OpenAIs älteres Text-Embedding-Modell.",
+  "openrouter/auto.description": "Basierend auf Kontextlänge, Thema und Komplexität wird Ihre Anfrage an Llama 3 70B Instruct, Claude 3.5 Sonnet (selbstmoderiert) oder GPT-4o weitergeleitet.",
+  "perplexity/sonar-pro.description": "Perplexitys Flaggschiffprodukt mit Suchverankerung, unterstützt komplexe Anfragen und Folgefragen.",
+  "perplexity/sonar-reasoning-pro.description": "Ein fortschrittliches Modell mit Fokus auf logisches Denken, das CoT mit erweiterter Suche ausgibt, einschließlich mehrerer Suchanfragen pro Anfrage.",
+  "perplexity/sonar-reasoning.description": "Ein Modell mit Fokus auf logisches Denken, das Chain-of-Thought (CoT) mit detaillierten, suchbasierten Erklärungen liefert.",
+  "perplexity/sonar.description": "Perplexitys leichtgewichtiges Produkt mit Suchverankerung, schneller und günstiger als Sonar Pro.",
+  "phi3.description": "Phi-3 ist Microsofts leichtgewichtiges Open-Model für effiziente Integration und groß angelegte Schlussfolgerungen.",
  "phi3:14b.description": "Phi-3 ist Microsofts leichtgewichtiges Open-Model für effiziente Integration und groß angelegte Schlussfolgerungen.",
  "pixtral-12b-2409.description": "Pixtral überzeugt bei der Analyse von Diagrammen/Bildern, Dokumenten-QA, multimodaler Schlussfolgerung und Befolgen von Anweisungen. Es verarbeitet Bilder in nativer Auflösung und Seitenverhältnis und unterstützt beliebig viele Bilder im 128K-Kontextfenster.",
  "pixtral-large-latest.description": "Pixtral Large ist ein multimodales Open-Model mit 124 Milliarden Parametern, basierend auf Mistral Large 2 – dem zweiten Modell unserer multimodalen Familie mit fortschrittlichem Bildverständnis.",
@@ -1025,6 +1036,28 @@
  "qwen-vl-v1.description": "Vortrainiertes Modell, initialisiert von Qwen-7B mit zusätzlichem Vision-Modul und 448er Bildauflösung.",
  "qwen/qwen-2-7b-instruct.description": "Qwen2 ist die neue Qwen-LLM-Serie. Qwen2 7B ist ein Transformer-basiertes Modell, das in Sprachverständnis, Mehrsprachigkeit, Programmierung, Mathematik und Schlussfolgerung überzeugt.",
  "qwen/qwen-2-7b-instruct:free.description": "Qwen2 ist eine neue Familie großer Sprachmodelle mit verbessertem Verständnis und Generierung.",
+  "qwen/qwen-2-vl-72b-instruct.description": "Qwen2-VL ist die neueste Version von Qwen-VL und erreicht Spitzenleistungen in visuellen Benchmarks wie MathVista, DocVQA, RealWorldQA und MTVQA. Es versteht über 20 Minuten Video für hochwertige Video-Q&A, Dialoge und Inhaltserstellung. Es bewältigt komplexe Schlussfolgerungen und Entscheidungsfindung, integriert sich in mobile Geräte und Roboter und agiert basierend auf visuellen Kontexten und Textanweisungen. Neben Englisch und Chinesisch erkennt es auch Texte in Bildern in vielen weiteren Sprachen, darunter die meisten europäischen Sprachen, Japanisch, Koreanisch, Arabisch und Vietnamesisch.",
+  "qwen/qwen-2.5-72b-instruct.description": "Qwen2.5-72B-Instruct ist eines der neuesten LLMs von Alibaba Cloud. Das 72B-Modell bietet deutliche Verbesserungen in den Bereichen Programmierung und Mathematik, unterstützt über 29 Sprachen (darunter Chinesisch und Englisch) und verbessert die Befolgung von Anweisungen, das Verständnis strukturierter Daten und strukturierte Ausgaben (insbesondere JSON) erheblich.",
+  "qwen/qwen2.5-32b-instruct.description": "Qwen2.5-32B-Instruct ist eines der neuesten LLMs von Alibaba Cloud. Das 32B-Modell bietet deutliche Verbesserungen in den Bereichen Programmierung und Mathematik, unterstützt über 29 Sprachen (darunter Chinesisch und Englisch) und verbessert die Befolgung von Anweisungen, das Verständnis strukturierter Daten und strukturierte Ausgaben (insbesondere JSON) erheblich.",
+  "qwen/qwen2.5-7b-instruct.description": "Ein zweisprachiges LLM für Chinesisch und Englisch in den Bereichen Sprache, Programmierung, Mathematik und logisches Denken.",
+  "qwen/qwen2.5-coder-32b-instruct.description": "Ein fortschrittliches LLM für Codegenerierung, logisches Denken und Fehlerbehebung in gängigen Programmiersprachen.",
+  "qwen/qwen2.5-coder-7b-instruct.description": "Ein starkes mittelgroßes Codemodell mit 32K Kontext, hervorragend für mehrsprachige Programmierung geeignet.",
+  "qwen/qwen3-14b.description": "Qwen3-14B ist die 14B-Variante für allgemeine Schlussfolgerungen und Chat-Szenarien.",
+  "qwen/qwen3-14b:free.description": "Qwen3-14B ist ein dichtes kausales LLM mit 14,8 Milliarden Parametern, entwickelt für komplexes logisches Denken und effizienten Chat. Es wechselt zwischen einem Denkmodus für Mathematik, Programmierung und Logik und einem Nicht-Denkmodus für allgemeinen Chat. Feinabgestimmt für Anweisungsbefolgung, Agenten-Tool-Nutzung und kreatives Schreiben in über 100 Sprachen und Dialekten. Unterstützt nativ 32K Kontext und skaliert mit YaRN auf 131K.",
+  "qwen/qwen3-235b-a22b-2507.description": "Qwen3-235B-A22B-Instruct-2507 ist die Instruct-Variante der Qwen3-Serie, die mehrsprachige Anwendungsfälle mit Langkontext-Szenarien ausbalanciert.",
+  "qwen/qwen3-235b-a22b-thinking-2507.description": "Qwen3-235B-A22B-Thinking-2507 ist die Thinking-Variante von Qwen3, verstärkt für komplexe Mathematik- und Denkaufgaben.",
+  "qwen/qwen3-235b-a22b.description": "Qwen3-235B-A22B ist ein MoE-Modell mit 235 Milliarden Parametern von Qwen, mit 22 Milliarden aktiven Parametern pro Durchlauf. Es wechselt zwischen einem Denkmodus für komplexes logisches Denken, Mathematik und Code und einem Nicht-Denkmodus für effizienten Chat. Es bietet starke Denkfähigkeiten, mehrsprachige Unterstützung (100+ Sprachen/Dialekte), fortschrittliche Anweisungsbefolgung und Agenten-Tool-Nutzung. Unterstützt nativ 32K Kontext und skaliert mit YaRN auf 131K.",
+  "qwen/qwen3-235b-a22b:free.description": "Qwen3-235B-A22B ist ein MoE-Modell mit 235 Milliarden Parametern von Qwen, mit 22 Milliarden aktiven Parametern pro Durchlauf. Es wechselt zwischen einem Denkmodus für komplexes logisches Denken, Mathematik und Code und einem Nicht-Denkmodus für effizienten Chat. Es bietet starke Denkfähigkeiten, mehrsprachige Unterstützung (100+ Sprachen/Dialekte), fortschrittliche Anweisungsbefolgung und Agenten-Tool-Nutzung. Unterstützt nativ 32K Kontext und skaliert mit YaRN auf 131K.",
+  "qwen/qwen3-30b-a3b.description": "Qwen3 ist die neueste LLM-Generation von Qwen mit dichten und MoE-Architekturen, hervorragend in den Bereichen logisches Denken, mehrsprachige Unterstützung und fortgeschrittene Agentenaufgaben. Die einzigartige Fähigkeit, zwischen Denkmodus für komplexe Aufgaben und Nicht-Denkmodus für effizienten Chat zu wechseln, sorgt für vielseitige, hochwertige Leistung.\n\nQwen3 übertrifft frühere Modelle wie QwQ und Qwen2.5 deutlich und liefert exzellente Ergebnisse in Mathematik, Programmierung, Alltagslogik, kreativem Schreiben und interaktivem Chat. Die Variante Qwen3-30B-A3B verfügt über 30,5 Milliarden Parameter (3,3B aktiv), 48 Schichten, 128 Experten (8 aktiv pro Aufgabe) und unterstützt bis zu 131K Kontext mit YaRN – ein neuer Maßstab für Open-Modelle.",
+  "qwen/qwen3-30b-a3b:free.description": "Qwen3 ist die neueste LLM-Generation von Qwen mit dichten und MoE-Architekturen, hervorragend in den Bereichen logisches Denken, mehrsprachige Unterstützung und fortgeschrittene Agentenaufgaben. Die einzigartige Fähigkeit, zwischen Denkmodus für komplexe Aufgaben und Nicht-Denkmodus für effizienten Chat zu wechseln, sorgt für vielseitige, hochwertige Leistung.\n\nQwen3 übertrifft frühere Modelle wie QwQ und Qwen2.5 deutlich und liefert exzellente Ergebnisse in Mathematik, Programmierung, Alltagslogik, kreativem Schreiben und interaktivem Chat. Die Variante Qwen3-30B-A3B verfügt über 30,5 Milliarden Parameter (3,3B aktiv), 48 Schichten, 128 Experten (8 aktiv pro Aufgabe) und unterstützt bis zu 131K Kontext mit YaRN – ein neuer Maßstab für Open-Modelle.",
+  "qwen/qwen3-32b.description": "Qwen3-32B ist ein dichtes kausales LLM mit 32,8 Milliarden Parametern, optimiert für komplexes logisches Denken und effizienten Chat. Es wechselt zwischen einem Denkmodus für Mathematik, Programmierung und Logik und einem Nicht-Denkmodus für schnelleren allgemeinen Chat. Es überzeugt bei Anweisungsbefolgung, Agenten-Tool-Nutzung und kreativem Schreiben in über 100 Sprachen und Dialekten. Unterstützt nativ 32K Kontext und skaliert mit YaRN auf 131K.",
+  "qwen/qwen3-32b:free.description": "Qwen3-32B ist ein dichtes kausales LLM mit 32,8 Milliarden Parametern, optimiert für komplexes logisches Denken und effizienten Chat. Es wechselt zwischen einem Denkmodus für Mathematik, Programmierung und Logik und einem Nicht-Denkmodus für schnelleren allgemeinen Chat. Es überzeugt bei Anweisungsbefolgung, Agenten-Tool-Nutzung und kreativem Schreiben in über 100 Sprachen und Dialekten. Unterstützt nativ 32K Kontext und skaliert mit YaRN auf 131K.",
+  "qwen/qwen3-8b:free.description": "Qwen3-8B ist ein dichtes kausales LLM mit 8,2 Milliarden Parametern, entwickelt für aufschlussreiche Aufgaben und effizienten Chat. Es wechselt zwischen einem Denkmodus für Mathematik, Programmierung und Logik und einem Nicht-Denkmodus für allgemeinen Chat. Feinabgestimmt für Anweisungsbefolgung, Agentenintegration und kreatives Schreiben in über 100 Sprachen und Dialekten. Unterstützt nativ 32K Kontext und skaliert mit YaRN auf 131K.",
+  "qwen/qwen3-coder-plus.description": "Qwen3-Coder-Plus ist ein Modell der Qwen-Serie für Codegenerierung, optimiert für komplexe Tool-Nutzung und lang andauernde Sitzungen.",
+  "qwen/qwen3-coder.description": "Qwen3-Coder ist die Codegenerierungsfamilie von Qwen3, stark im Verständnis und der Generierung von Code in langen Dokumenten.",
+  "qwen/qwen3-max-preview.description": "Qwen3 Max (Vorschau) ist die Max-Variante für fortgeschrittenes logisches Denken und Tool-Integration.",
+  "qwen/qwen3-max.description": "Qwen3 Max ist das High-End-Modell für logisches Denken in der Qwen3-Serie, mit Fokus auf mehrsprachige Schlussfolgerungen und Tool-Integration.",
+  "qwen/qwen3-vl-plus.description": "Qwen3 VL-Plus ist die visuell erweiterte Qwen3-Variante mit verbessertem multimodalem Denken und Videobearbeitung.",
  "qwen2.5-14b-instruct-1m.description": "Qwen2.5 Open-Source-Modell mit 72 Milliarden Parametern.",
  "qwen2.5-14b-instruct.description": "Qwen2.5 Open-Source-Modell mit 14 Milliarden Parametern.",
  "qwen2.5-32b-instruct.description": "Qwen2.5 Open-Source-Modell mit 32 Milliarden Parametern.",
@@ -446,6 +446,8 @@
  "settingImage.defaultCount.desc": "Standardanzahl der Bilder festlegen, die beim Erstellen einer neuen Aufgabe im Bildgenerierungsbereich erzeugt werden.",
  "settingImage.defaultCount.label": "Standardanzahl Bilder",
  "settingImage.defaultCount.title": "KI-Kunst",
+  "settingModel.enableContextCompression.desc": "Komprimiert automatisch frühere Nachrichten zu Zusammenfassungen, wenn das Gespräch 64.000 Tokens überschreitet, und spart dabei 60–80 % an Token-Nutzung",
+  "settingModel.enableContextCompression.title": "Automatische Kontextkomprimierung aktivieren",
  "settingModel.enableMaxTokens.title": "Begrenzung der maximalen Tokens aktivieren",
  "settingModel.enableReasoningEffort.title": "Anpassung des Denkaufwands aktivieren",
  "settingModel.frequencyPenalty.desc": "Je höher der Wert, desto vielfältiger der Wortschatz; je niedriger, desto einfacher die Sprache.",
@@ -140,6 +140,8 @@
  "models.output": "Ausgabe",
  "models.title": "Modelle",
  "payDiffPrice": "Differenz bezahlen",
+  "payDiffPriceApprox": "Ca.",
+  "payDiffPriceTip": "Der tatsächliche Betrag richtet sich nach der Zahlungsseite",
  "payment.error.actions.billing": "Abrechnungsverwaltung",
  "payment.error.actions.home": "Zur Startseite",
  "payment.error.desc": "Abonnement-ID: {{id}} nicht gefunden. Bei Fragen kontaktieren Sie uns bitte per E-Mail",
@@ -140,6 +140,8 @@
  "models.output": "Output",
  "models.title": "Models",
  "payDiffPrice": "Pay Difference",
+  "payDiffPriceApprox": "Approx.",
+  "payDiffPriceTip": "Actual amount subject to payment page",
  "payment.error.actions.billing": "Billing Management",
  "payment.error.actions.home": "Back to Home",
  "payment.error.desc": "Subscription ID: {{id}} not found. If you have questions, please contact us via email",
@@ -919,6 +919,29 @@
  "moonshotai/Kimi-Dev-72B.description": "Kimi-Dev-72B es un modelo de código de código abierto optimizado con aprendizaje por refuerzo a gran escala para generar parches robustos y listos para producción. Obtiene un 60.4% en SWE-bench Verified, estableciendo un nuevo récord entre modelos abiertos para tareas de ingeniería de software automatizada como corrección de errores y revisión de código.",
  "moonshotai/Kimi-K2-Instruct-0905.description": "Kimi K2-Instruct-0905 es la versión más nueva y potente de Kimi K2. Es un modelo MoE de primer nivel con 1T total y 32B de parámetros activos. Sus características clave incluyen mayor inteligencia en programación de agentes con mejoras significativas en benchmarks y tareas reales, además de mejor estética y usabilidad en código frontend.",
  "moonshotai/Kimi-K2-Thinking.description": "Kimi K2 Thinking es el modelo de razonamiento de código abierto más potente hasta la fecha. Amplía considerablemente la profundidad del razonamiento multietapa y mantiene un uso estable de herramientas en 200–300 llamadas consecutivas, estableciendo nuevos récords en Humanity's Last Exam (HLE), BrowseComp y otros benchmarks. Destaca en programación, matemáticas, lógica y escenarios de agentes. Basado en una arquitectura MoE con ~1T de parámetros totales, admite una ventana de contexto de 256K y llamadas a herramientas.",
+  "moonshotai/kimi-k2-0711.description": "Kimi K2 0711 es la variante instructiva de la serie Kimi, adecuada para el uso de herramientas y generación de código de alta calidad.",
+  "moonshotai/kimi-k2-0905.description": "Kimi K2 0905 es una actualización que amplía el contexto y mejora el rendimiento en razonamiento con optimizaciones para programación.",
+  "moonshotai/kimi-k2-instruct-0905.description": "El modelo kimi-k2-0905-preview admite una ventana de contexto de 256k, con programación más autónoma, código frontend más pulido y práctico, y mejor comprensión del contexto.",
+  "moonshotai/kimi-k2-thinking-turbo.description": "Kimi K2 Thinking Turbo es una versión de alta velocidad de Kimi K2 Thinking, que reduce significativamente la latencia sin sacrificar el razonamiento profundo.",
+  "moonshotai/kimi-k2-thinking.description": "Kimi K2 Thinking es el modelo de razonamiento de Moonshot optimizado para tareas de razonamiento profundo, con capacidades generales de agente.",
+  "moonshotai/kimi-k2.description": "Kimi K2 es un modelo MoE de gran escala de Moonshot AI con 1T de parámetros totales y 32B activos por paso, optimizado para capacidades de agente como uso avanzado de herramientas, razonamiento y síntesis de código.",
+  "morph/morph-v3-fast.description": "Morph ofrece un modelo especializado para aplicar cambios de código sugeridos por modelos avanzados (por ejemplo, Claude o GPT-4o) a tus archivos existentes a una velocidad RÁPIDA de más de 4500 tokens/seg. Es el paso final en un flujo de trabajo de codificación con IA y admite 16k tokens de entrada/salida.",
+  "morph/morph-v3-large.description": "Morph ofrece un modelo especializado para aplicar cambios de código sugeridos por modelos avanzados (por ejemplo, Claude o GPT-4o) a tus archivos existentes a una velocidad RÁPIDA de más de 2500 tokens/seg. Es el paso final en un flujo de trabajo de codificación con IA y admite 16k tokens de entrada/salida.",
+  "nousresearch/hermes-2-pro-llama-3-8b.description": "Hermes 2 Pro Llama 3 8B es una versión actualizada de Nous Hermes 2 con los últimos conjuntos de datos desarrollados internamente.",
+  "nvidia/Llama-3.1-Nemotron-70B-Instruct-HF.description": "Llama 3.1 Nemotron 70B es un modelo LLM personalizado por NVIDIA para mejorar la utilidad. Tiene un rendimiento destacado en Arena Hard, AlpacaEval 2 LC y GPT-4-Turbo MT-Bench, ocupando el puesto #1 en los tres benchmarks de autoalineación al 1 de octubre de 2024. Está entrenado a partir de Llama-3.1-70B-Instruct usando RLHF (REINFORCE), Llama-3.1-Nemotron-70B-Reward y prompts de HelpSteer2-Preference.",
+  "nvidia/llama-3.1-nemotron-51b-instruct.description": "Un modelo de lenguaje distintivo que ofrece precisión y eficiencia excepcionales.",
+  "nvidia/llama-3.1-nemotron-70b-instruct.description": "Llama-3.1-Nemotron-70B-Instruct es un modelo personalizado de NVIDIA diseñado para mejorar la utilidad de las respuestas de los LLM.",
+  "o1-mini.description": "Más pequeño y rápido que o1-preview, con un costo 80% menor, fuerte en generación de código y tareas de contexto corto.",
+  "o1-preview.description": "Enfocado en razonamiento avanzado y resolución de problemas complejos, incluyendo matemáticas y ciencia. Ideal para aplicaciones que requieren comprensión profunda del contexto y flujos de trabajo autónomos.",
+  "o1-pro.description": "La serie o1 está entrenada con aprendizaje por refuerzo para pensar antes de responder y manejar razonamiento complejo. o1-pro utiliza más recursos computacionales para un pensamiento más profundo y respuestas de mayor calidad de forma constante.",
+  "o1.description": "o1 es el nuevo modelo de razonamiento de OpenAI con entrada de texto+imagen y salida de texto, adecuado para tareas complejas que requieren conocimiento amplio. Tiene una ventana de contexto de 200K y un límite de conocimiento de octubre de 2023.",
+  "o3-2025-04-16.description": "o3 es el nuevo modelo de razonamiento de OpenAI con entrada de texto+imagen y salida de texto para tareas complejas que requieren conocimiento amplio.",
+  "o3-deep-research.description": "o3-deep-research es nuestro modelo más avanzado para investigación profunda en tareas complejas de múltiples pasos. Puede buscar en la web y acceder a tus datos mediante conectores MCP.",
+  "o3-mini.description": "o3-mini es nuestro último modelo pequeño de razonamiento, que ofrece mayor inteligencia con el mismo costo y latencia que o1-mini.",
+  "o3-pro-2025-06-10.description": "o3 Pro es el nuevo modelo de razonamiento de OpenAI con entrada de texto+imagen y salida de texto para tareas complejas que requieren conocimiento amplio.",
+  "o3-pro.description": "o3-pro utiliza más recursos computacionales para pensar más profundamente y ofrecer respuestas de mejor calidad de forma constante; disponible solo a través de la API de Respuestas.",
+  "o3.description": "o3 es un modelo versátil y potente que establece un nuevo estándar en matemáticas, ciencia, programación y razonamiento visual. Destaca en redacción técnica y seguimiento de instrucciones, y puede analizar texto, código e imágenes para resolver problemas de múltiples pasos.",
+  "o4-mini-2025-04-16.description": "o4-mini es un modelo de razonamiento de OpenAI con entrada de texto+imagen y salida de texto, adecuado para tareas complejas que requieren conocimiento amplio, con una ventana de contexto de 200K.",
  "o4-mini-deep-research.description": "o4-mini-deep-research es un modelo de investigación profunda más rápido y asequible para investigaciones complejas de múltiples pasos. Puede buscar en la web y también acceder a tus datos mediante conectores MCP.",
  "o4-mini.description": "o4-mini es el último modelo pequeño de la serie o, optimizado para razonamiento rápido y eficaz con alta eficiencia en tareas de codificación y visión.",
  "open-codestral-mamba.description": "Codestral Mamba es un modelo de lenguaje Mamba 2 enfocado en la generación de código, compatible con tareas avanzadas de programación y razonamiento.",
@@ -969,6 +992,48 @@
  "pro-128k.description": "Spark Pro 128K ofrece una capacidad de contexto muy grande, manejando hasta 128K, ideal para documentos extensos que requieren análisis de texto completo y coherencia a largo plazo, con lógica fluida y soporte diverso de citas en discusiones complejas.",
  "pro-deepseek-r1.description": "Modelo de servicio dedicado empresarial con concurrencia incluida.",
  "pro-deepseek-v3.description": "Modelo de servicio dedicado empresarial con concurrencia incluida.",
+  "qianfan-70b.description": "Qianfan 70B es un modelo chino de gran escala para generación de alta calidad y razonamiento complejo.",
+  "qianfan-8b.description": "Qianfan 8B es un modelo general de tamaño medio que equilibra costo y calidad para generación de texto y preguntas y respuestas.",
+  "qianfan-agent-intent-32k.description": "Qianfan Agent Intent 32K está orientado al reconocimiento de intención y orquestación de agentes con soporte para contexto largo.",
+  "qianfan-agent-lite-8k.description": "Qianfan Agent Lite 8K es un modelo de agente ligero para diálogos de múltiples turnos y flujos de trabajo de bajo costo.",
+  "qianfan-agent-speed-32k.description": "Qianfan Agent Speed 32K es un modelo de agente de alto rendimiento para aplicaciones de agentes a gran escala y múltiples tareas.",
+  "qianfan-agent-speed-8k.description": "Qianfan Agent Speed 8K es un modelo de agente de alta concurrencia para conversaciones cortas a medias y respuestas rápidas.",
+  "qianfan-check-vl.description": "Qianfan Check VL es un modelo de revisión de contenido multimodal para tareas de cumplimiento y reconocimiento de imagen-texto.",
+  "qianfan-composition.description": "Qianfan Composition es un modelo de creación multimodal para comprensión y generación combinada de imagen y texto.",
+  "qianfan-engcard-vl.description": "Qianfan EngCard VL es un modelo de reconocimiento multimodal enfocado en escenarios en inglés.",
+  "qianfan-lightning-128b-a19b.description": "Qianfan Lightning 128B A19B es un modelo general chino de alto rendimiento para preguntas complejas y razonamiento a gran escala.",
+  "qianfan-llama-vl-8b.description": "Qianfan Llama VL 8B es un modelo multimodal basado en Llama para comprensión general de imagen y texto.",
+  "qianfan-multipicocr.description": "Qianfan MultiPicOCR es un modelo OCR para múltiples imágenes que detecta y reconoce texto en varias imágenes.",
+  "qianfan-qi-vl.description": "Qianfan QI VL es un modelo de preguntas y respuestas multimodal para recuperación precisa y QA en escenarios complejos de imagen y texto.",
+  "qianfan-singlepicocr.description": "Qianfan SinglePicOCR es un modelo OCR para una sola imagen con reconocimiento de caracteres de alta precisión.",
+  "qianfan-vl-70b.description": "Qianfan VL 70B es un modelo VLM de gran escala para comprensión compleja de imagen y texto.",
+  "qianfan-vl-8b.description": "Qianfan VL 8B es un VLM ligero para preguntas y respuestas diarias de imagen y texto y análisis.",
+  "qvq-72b-preview.description": "QVQ-72B-Preview es un modelo de investigación experimental de Qwen enfocado en mejorar el razonamiento visual.",
+  "qvq-max.description": "El modelo de razonamiento visual Qwen QVQ admite entrada visual y salida con cadena de pensamiento, con mejor rendimiento en matemáticas, programación, análisis visual, creatividad y tareas generales.",
+  "qvq-plus.description": "Modelo de razonamiento visual con entrada visual y salida con cadena de pensamiento. La serie qvq-plus sigue a qvq-max y ofrece razonamiento más rápido con mejor equilibrio entre calidad y costo.",
+  "qwen-3-32b.description": "Qwen 3 32B: fuerte en tareas multilingües y de programación, adecuado para uso en producción de escala media.",
+  "qwen-coder-plus.description": "Modelo de código Qwen.",
+  "qwen-coder-turbo-latest.description": "Modelo de código Qwen.",
+  "qwen-coder-turbo.description": "Modelo de código Qwen.",
+  "qwen-flash.description": "El modelo Qwen más rápido y económico, ideal para tareas simples.",
+  "qwen-image-edit.description": "Qwen Image Edit es un modelo de imagen a imagen que edita imágenes basándose en imágenes de entrada y prompts de texto, permitiendo ajustes precisos y transformaciones creativas.",
+  "qwen-image.description": "Qwen-Image es un modelo general de generación de imágenes que admite múltiples estilos artísticos y una sólida representación de texto complejo, especialmente en chino e inglés. Soporta diseños de múltiples líneas, texto a nivel de párrafo y detalles finos para composiciones complejas de texto e imagen.",
+  "qwen-long.description": "Modelo Qwen ultra grande con contexto largo y chat en escenarios de múltiples documentos.",
+  "qwen-math-plus-latest.description": "Qwen Math es un modelo de lenguaje especializado en resolver problemas matemáticos.",
+  "qwen-math-plus.description": "Qwen Math es un modelo de lenguaje especializado en resolver problemas matemáticos.",
+  "qwen-math-turbo-latest.description": "Qwen Math es un modelo de lenguaje especializado en resolver problemas matemáticos.",
+  "qwen-math-turbo.description": "Qwen Math es un modelo de lenguaje especializado en resolver problemas matemáticos.",
+  "qwen-max.description": "Modelo Qwen ultra grande a escala de cientos de miles de millones que admite chino, inglés y otros idiomas; es el modelo API detrás de los productos actuales Qwen2.5.",
+  "qwen-omni-turbo.description": "Los modelos Qwen-Omni admiten entradas multimodales (video, audio, imágenes, texto) y salida de audio y texto.",
+  "qwen-plus.description": "Modelo Qwen ultra grande mejorado que admite chino, inglés y otros idiomas.",
+  "qwen-turbo.description": "Qwen Turbo ya no se actualizará; reemplázalo con Qwen Flash. Modelo Qwen ultra grande que admite chino, inglés y otros idiomas.",
+  "qwen-vl-chat-v1.description": "Qwen VL admite interacciones flexibles, incluyendo entrada de múltiples imágenes, preguntas y respuestas de múltiples turnos y tareas creativas.",
+  "qwen-vl-max-latest.description": "Modelo Qwen visión-lenguaje ultra grande. En comparación con la versión mejorada, mejora aún más el razonamiento visual y el seguimiento de instrucciones para una percepción y cognición más sólidas.",
+  "qwen-vl-max.description": "Modelo Qwen visión-lenguaje ultra grande. En comparación con la versión mejorada, mejora aún más el razonamiento visual y el seguimiento de instrucciones para una percepción y cognición visual más sólidas.",
+  "qwen-vl-ocr.description": "Qwen OCR es un modelo de extracción de texto para documentos, tablas, imágenes de exámenes y escritura a mano. Admite chino, inglés, francés, japonés, coreano, alemán, ruso, italiano, vietnamita y árabe.",
+  "qwen-vl-plus-latest.description": "Modelo Qwen visión-lenguaje mejorado a gran escala con importantes mejoras en detalle y reconocimiento de texto, compatible con resoluciones superiores a un megapíxel y relaciones de aspecto arbitrarias.",
+  "qwen-vl-plus.description": "Modelo Qwen visión-lenguaje mejorado a gran escala con importantes mejoras en detalle y reconocimiento de texto, compatible con resoluciones superiores a un megapíxel y relaciones de aspecto arbitrarias.",
+  "qwen-vl-v1.description": "Modelo preentrenado inicializado desde Qwen-7B con un módulo de visión añadido y entrada de imagen de resolución 448.",
  "qwen/qwen3-235b-a22b.description": "Qwen3-235B-A22B es un modelo MoE de 235 mil millones de parámetros de Qwen, con 22 mil millones activos por pasada. Alterna entre un modo de pensamiento para razonamiento complejo, matemáticas y programación, y un modo sin pensamiento para chats eficientes. Ofrece un razonamiento sólido, soporte multilingüe (más de 100 idiomas y dialectos), seguimiento avanzado de instrucciones y uso de herramientas de agentes. Maneja de forma nativa contextos de 32K y escala hasta 131K con YaRN.",
  "qwen/qwen3-235b-a22b:free.description": "Qwen3-235B-A22B es un modelo MoE de 235 mil millones de parámetros de Qwen, con 22 mil millones activos por pasada. Alterna entre un modo de pensamiento para razonamiento complejo, matemáticas y programación, y un modo sin pensamiento para chats eficientes. Ofrece un razonamiento sólido, soporte multilingüe (más de 100 idiomas y dialectos), seguimiento avanzado de instrucciones y uso de herramientas de agentes. Maneja de forma nativa contextos de 32K y escala hasta 131K con YaRN.",
  "qwen/qwen3-30b-a3b.description": "Qwen3 es la última generación de modelos LLM de Qwen con arquitecturas densas y MoE, destacando en razonamiento, soporte multilingüe y tareas avanzadas de agentes. Su capacidad única de alternar entre un modo de pensamiento para razonamiento complejo y un modo sin pensamiento para chats eficientes garantiza un rendimiento versátil y de alta calidad.\n\nQwen3 supera significativamente a modelos anteriores como QwQ y Qwen2.5, ofreciendo excelentes resultados en matemáticas, programación, razonamiento de sentido común, escritura creativa y chat interactivo. La variante Qwen3-30B-A3B tiene 30.5 mil millones de parámetros (3.3 mil millones activos), 48 capas, 128 expertos (8 activos por tarea) y admite contextos de hasta 131K con YaRN, estableciendo un nuevo estándar para modelos abiertos.",
@@ -446,6 +446,8 @@
  "settingImage.defaultCount.desc": "Establece el número predeterminado de imágenes generadas al crear una nueva tarea en el panel de generación de imágenes.",
  "settingImage.defaultCount.label": "Cantidad de Imágenes Predeterminada",
  "settingImage.defaultCount.title": "Arte con IA",
+  "settingModel.enableContextCompression.desc": "Comprime automáticamente los mensajes históricos en resúmenes cuando la conversación supera los 64.000 tokens, ahorrando entre un 60 % y un 80 % en el uso de tokens",
+  "settingModel.enableContextCompression.title": "Activar compresión automática de contexto",
  "settingModel.enableMaxTokens.title": "Activar Límite de Tokens Máximos",
  "settingModel.enableReasoningEffort.title": "Activar Ajuste de Esfuerzo de Razonamiento",
  "settingModel.frequencyPenalty.desc": "Cuanto mayor sea el valor, más diverso y rico será el vocabulario; cuanto menor, más simple y directo.",
@@ -140,6 +140,8 @@
  "models.output": "Salida",
  "models.title": "Modelos",
  "payDiffPrice": "Pagar Diferencia",
+  "payDiffPriceApprox": "Aprox.",
+  "payDiffPriceTip": "El importe real se mostrará en la página de pago",
  "payment.error.actions.billing": "Gestión de Facturación",
  "payment.error.actions.home": "Volver al Inicio",
  "payment.error.desc": "ID de suscripción: {{id}} no encontrado. Si tienes preguntas, contáctanos por correo electrónico",
@@ -969,6 +969,25 @@
  "openai/gpt-5.description": "GPT-5 مدل قدرتمند OpenAI برای طیف وسیعی از وظایف تولیدی و پژوهشی است.",
  "openai/gpt-oss-120b.description": "یک مدل زبانی بزرگ چندمنظوره با قابلیت استدلال قوی و قابل‌کنترل.",
  "openai/gpt-oss-20b.description": "مدلی جمع‌وجور با وزن‌های باز که برای تأخیر پایین و محیط‌های با منابع محدود، از جمله اجراهای محلی و لبه‌ای بهینه شده است.",
+  "openai/o1-mini.description": "مدل o1-mini یک مدل استدلالی سریع و مقرون‌به‌صرفه است که برای برنامه‌نویسی، ریاضیات و علوم طراحی شده است. این مدل دارای حافظه متنی ۱۲۸ هزار توکن و دانش به‌روز تا اکتبر ۲۰۲۳ است.",
+  "openai/o1-preview.description": "مدل o1 پیش‌نمایشی از مدل استدلالی جدید OpenAI برای انجام وظایف پیچیده با نیاز به دانش گسترده است. این مدل دارای حافظه متنی ۱۲۸ هزار توکن و دانش به‌روز تا اکتبر ۲۰۲۳ است.",
+  "openai/o1.description": "مدل o1 پرچم‌دار OpenAI در حوزه استدلال است که برای حل مسائل پیچیده با نیاز به تفکر عمیق طراحی شده و دقت بالایی در انجام وظایف چندمرحله‌ای ارائه می‌دهد.",
+  "openai/o3-mini-high.description": "مدل o3-mini (با توان استدلال بالا) هوشمندی بیشتری را با همان هزینه و تأخیر مدل o1-mini ارائه می‌دهد.",
+  "openai/o3-mini.description": "مدل o3-mini جدیدترین مدل کوچک استدلالی OpenAI است که با همان هزینه و تأخیر مدل o1-mini، هوشمندی بیشتری ارائه می‌دهد.",
+  "openai/o3.description": "مدل o3 قدرتمندترین مدل استدلالی OpenAI است که استاندارد جدیدی در برنامه‌نویسی، ریاضیات، علوم و درک بصری ایجاد کرده است. این مدل در پاسخ به پرسش‌های پیچیده و چندوجهی، به‌ویژه در تحلیل تصاویر، نمودارها و دیاگرام‌ها بسیار توانمند است.",
+  "openai/o4-mini-high.description": "مدل o4-mini در سطح استدلال بالا، برای استدلال سریع و کارآمد با عملکرد قوی در برنامه‌نویسی و بینایی بهینه‌سازی شده است.",
+  "openai/o4-mini.description": "مدل o4-mini یک مدل کوچک و کارآمد از OpenAI برای سناریوهای با تأخیر پایین است.",
+  "openai/text-embedding-3-large.description": "قوی‌ترین مدل تعبیه متن OpenAI برای وظایف انگلیسی و غیرانگلیسی.",
+  "openai/text-embedding-3-small.description": "نسخه بهبودیافته و با عملکرد بالاتر مدل تعبیه ada از OpenAI.",
+  "openai/text-embedding-ada-002.description": "مدل تعبیه متن قدیمی OpenAI.",
+  "openrouter/auto.description": "بر اساس طول متن، موضوع و پیچیدگی، درخواست شما به یکی از مدل‌های Llama 3 70B Instruct، Claude 3.5 Sonnet (با خودنظارتی) یا GPT-4o هدایت می‌شود.",
+  "perplexity/sonar-pro.description": "محصول پرچم‌دار Perplexity با اتصال به جستجو، پشتیبانی از پرسش‌های پیشرفته و پیگیری‌های بعدی.",
+  "perplexity/sonar-reasoning-pro.description": "مدلی پیشرفته با تمرکز بر استدلال که خروجی زنجیره تفکر (CoT) را با جستجوی تقویت‌شده و چند پرس‌وجو در هر درخواست ارائه می‌دهد.",
+  "perplexity/sonar-reasoning.description": "مدلی با تمرکز بر استدلال که زنجیره تفکر (CoT) را با توضیحات دقیق و مبتنی بر جستجو تولید می‌کند.",
+  "perplexity/sonar.description": "محصول سبک Perplexity با اتصال به جستجو، سریع‌تر و ارزان‌تر از Sonar Pro.",
+  "phi3.description": "Phi-3 مدل سبک و متن‌باز مایکروسافت برای یکپارچه‌سازی کارآمد و استدلال در مقیاس بزرگ است.",
+  "phi3:14b.description": "Phi-3 مدل سبک و متن‌باز مایکروسافت برای یکپارچه‌سازی کارآمد و استدلال در مقیاس بزرگ است.",
+  "pixtral-12b-2409.description": "Pixtral در درک نمودار/تصویر، پاسخ به پرسش‌های اسنادی، استدلال چندوجهی و پیروی از دستورالعمل‌ها بسیار توانمند است. این مدل تصاویر را با وضوح و نسبت تصویر اصلی دریافت کرده و هر تعداد تصویر را در پنجره متنی ۱۲۸ هزار توکن پردازش می‌کند.",
  "pixtral-large-latest.description": "Pixtral Large یک مدل چندوجهی باز با ۱۲۴ میلیارد پارامتر است که بر پایه Mistral Large 2 ساخته شده و دومین مدل در خانواده چندوجهی ما با درک پیشرفته تصویر در سطح مرزی است.",
  "pro-128k.description": "Spark Pro 128K ظرفیت بسیار بالایی برای زمینه‌سازی دارد و تا ۱۲۸ هزار توکن را پشتیبانی می‌کند. این مدل برای اسناد بلند که نیاز به تحلیل کامل متن و انسجام بلندمدت دارند، ایده‌آل است و از منطق روان و ارجاع‌های متنوع در بحث‌های پیچیده پشتیبانی می‌کند.",
  "pro-deepseek-r1.description": "مدل خدمات اختصاصی سازمانی با هم‌زمانی بسته‌بندی‌شده.",
@@ -1018,6 +1037,18 @@
  "qwen/qwen-2-7b-instruct.description": "Qwen2 نسل جدید مدل‌های زبانی Qwen است. Qwen2 7B یک مدل مبتنی بر ترنسفورمر است که در درک زبان، توانایی چندزبانه، برنامه‌نویسی، ریاضی و استدلال عملکرد بالایی دارد.",
  "qwen/qwen-2-7b-instruct:free.description": "Qwen2 یک خانواده جدید از مدل‌های زبانی بزرگ با درک و تولید قوی‌تر است.",
  "qwen/qwen-2-vl-72b-instruct.description": "Qwen2-VL جدیدترین نسخه Qwen-VL است که به عملکرد پیشرفته در بنچمارک‌های بینایی مانند MathVista، DocVQA، RealWorldQA و MTVQA دست یافته است. این مدل می‌تواند بیش از ۲۰ دقیقه ویدیو را برای پرسش‌وپاسخ، گفت‌وگو و تولید محتوا با کیفیت بالا درک کند. همچنین استدلال و تصمیم‌گیری پیچیده را انجام می‌دهد و با دستگاه‌های همراه و ربات‌ها برای اقدام بر اساس زمینه بصری و دستور متنی یکپارچه می‌شود. فراتر از زبان‌های انگلیسی و چینی، متن در تصاویر را به زبان‌های مختلف از جمله بیشتر زبان‌های اروپایی، ژاپنی، کره‌ای، عربی و ویتنامی می‌خواند.",
+  "qwen/qwen-2.5-72b-instruct.description": "Qwen2.5-72B-Instruct یکی از جدیدترین مدل‌های LLM شرکت Alibaba Cloud است. این مدل ۷۲ میلیارد پارامتری پیشرفت‌های قابل‌توجهی در برنامه‌نویسی و ریاضیات دارد، از بیش از ۲۹ زبان (از جمله چینی و انگلیسی) پشتیبانی می‌کند و در پیروی از دستورالعمل‌ها، درک داده‌های ساختاریافته و تولید خروجی ساختاریافته (به‌ویژه JSON) بسیار بهبود یافته است.",
+  "qwen/qwen2.5-32b-instruct.description": "Qwen2.5-32B-Instruct یکی از جدیدترین مدل‌های LLM شرکت Alibaba Cloud است. این مدل ۳۲ میلیارد پارامتری پیشرفت‌های قابل‌توجهی در برنامه‌نویسی و ریاضیات دارد، از بیش از ۲۹ زبان (از جمله چینی و انگلیسی) پشتیبانی می‌کند و در پیروی از دستورالعمل‌ها، درک داده‌های ساختاریافته و تولید خروجی ساختاریافته (به‌ویژه JSON) بسیار بهبود یافته است.",
+  "qwen/qwen2.5-7b-instruct.description": "یک مدل LLM دوزبانه برای زبان چینی و انگلیسی در حوزه‌های زبان، برنامه‌نویسی، ریاضیات و استدلال.",
+  "qwen/qwen2.5-coder-32b-instruct.description": "مدلی پیشرفته برای تولید، استدلال و اصلاح کد در زبان‌های برنامه‌نویسی رایج.",
+  "qwen/qwen2.5-coder-7b-instruct.description": "مدل کد میان‌رده قدرتمند با حافظه متنی ۳۲ هزار توکن، توانمند در برنامه‌نویسی چندزبانه.",
+  "qwen/qwen3-14b.description": "Qwen3-14B نسخه ۱۴ میلیارد پارامتری برای استدلال عمومی و سناریوهای چت است.",
+  "qwen/qwen3-14b:free.description": "Qwen3-14B یک مدل LLM علّی با ۱۴.۸ میلیارد پارامتر است که برای استدلال پیچیده و چت کارآمد طراحی شده است. این مدل بین حالت تفکر (برای ریاضی، کدنویسی و منطق) و حالت غیرتفکر (برای چت عمومی) جابجا می‌شود. برای پیروی از دستورالعمل‌ها، استفاده از ابزارهای عامل و نوشتن خلاقانه در بیش از ۱۰۰ زبان و گویش تنظیم شده است. به‌صورت بومی از حافظه متنی ۳۲ هزار توکن پشتیبانی می‌کند و با YaRN تا ۱۳۱ هزار توکن گسترش می‌یابد.",
+  "qwen/qwen3-235b-a22b-2507.description": "Qwen3-235B-A22B-Instruct-2507 نسخه Instruct از سری Qwen3 است که بین استفاده چندزبانه از دستورالعمل‌ها و سناریوهای با حافظه بلند تعادل برقرار می‌کند.",
+  "qwen/qwen3-235b-a22b-thinking-2507.description": "Qwen3-235B-A22B-Thinking-2507 نسخه تفکری Qwen3 است که برای وظایف پیچیده ریاضی و استدلال تقویت شده است.",
+  "qwen/qwen3-235b-a22b.description": "Qwen3-235B-A22B یک مدل MoE با ۲۳۵ میلیارد پارامتر از Qwen است که در هر عبور رو به جلو ۲۲ میلیارد پارامتر فعال دارد. این مدل بین حالت تفکر (برای استدلال پیچیده، ریاضی و کدنویسی) و حالت غیرتفکر (برای چت کارآمد) جابجا می‌شود. از استدلال قوی، پشتیبانی چندزبانه (بیش از ۱۰۰ زبان/گویش)، پیروی پیشرفته از دستورالعمل‌ها و استفاده از ابزارهای عامل پشتیبانی می‌کند. به‌صورت بومی از حافظه متنی ۳۲ هزار توکن پشتیبانی می‌کند و با YaRN تا ۱۳۱ هزار توکن گسترش می‌یابد.",
+  "qwen/qwen3-235b-a22b:free.description": "Qwen3-235B-A22B یک مدل MoE با ۲۳۵ میلیارد پارامتر از Qwen است که در هر عبور رو به جلو ۲۲ میلیارد پارامتر فعال دارد. این مدل بین حالت تفکر (برای استدلال پیچیده، ریاضی و کدنویسی) و حالت غیرتفکر (برای چت کارآمد) جابجا می‌شود. از استدلال قوی، پشتیبانی چندزبانه (بیش از ۱۰۰ زبان/گویش)، پیروی پیشرفته از دستورالعمل‌ها و استفاده از ابزارهای عامل پشتیبانی می‌کند. به‌صورت بومی از حافظه متنی ۳۲ هزار توکن پشتیبانی می‌کند و با YaRN تا ۱۳۱ هزار توکن گسترش می‌یابد.",
+  "qwen/qwen3-30b-a3b.description": "Qwen3 جدیدترین نسل مدل‌های LLM Qwen با معماری‌های متراکم و MoE است که در استدلال، پشتیبانی چندزبانه و وظایف پیشرفته عامل بسیار توانمند است. توانایی منحصربه‌فرد آن در جابجایی بین حالت تفکر برای استدلال پیچیده و حالت غیرتفکر برای چت کارآمد، عملکردی همه‌جانبه و با کیفیت بالا را تضمین می‌کند.\n\nQwen3 به‌طور قابل‌توجهی از مدل‌های قبلی مانند QwQ و Qwen2.5 پیشی می‌گیرد و عملکردی عالی در ریاضی، برنامه‌نویسی، استدلال عقل سلیم، نوشتن خلاقانه و چت تعاملی ارائه می‌دهد. نسخه Qwen3-30B-A3B دارای ۳۰.۵ میلیارد پارامتر (۳.۳ میلیارد فعال)، ۴۸ لایه، ۱۲۸ متخصص (۸ فعال در هر وظیفه) است و از حافظه متنی تا ۱۳۱ هزار توکن با YaRN پشتیبانی می‌کند و استاندارد جدیدی برای مدل‌های متن‌باز تعیین می‌کند.",
  "qwen2.5-omni-7b.description": "مدل‌های Qwen-Omni از ورودی‌های چندرسانه‌ای (ویدیو، صدا، تصویر، متن) پشتیبانی می‌کنند و خروجی آن‌ها به صورت صوتی و متنی است.",
  "qwen2.5-vl-32b-instruct.description": "Qwen2.5 VL 32B Instruct یک مدل چندرسانه‌ای متن‌باز است که برای استقرار خصوصی و استفاده در سناریوهای مختلف مناسب می‌باشد.",
  "qwen2.5-vl-72b-instruct.description": "بهبود در پیروی از دستورالعمل‌ها، ریاضیات، حل مسئله و برنامه‌نویسی، با توانایی قوی‌تر در شناسایی اشیاء عمومی. از مکان‌یابی دقیق عناصر بصری در قالب‌های مختلف، درک ویدیوهای طولانی (تا ۱۰ دقیقه) با زمان‌بندی رویداد در سطح ثانیه، ترتیب زمانی و درک سرعت، و عامل‌هایی که می‌توانند سیستم‌عامل یا موبایل را از طریق تجزیه و تحلیل و مکان‌یابی کنترل کنند، پشتیبانی می‌کند. استخراج اطلاعات کلیدی قوی و خروجی JSON. این نسخه ۷۲B، قوی‌ترین نسخه در این سری است.",
@@ -446,6 +446,8 @@
  "settingImage.defaultCount.desc": "تعداد پیش‌فرض تصاویر تولیدشده هنگام ایجاد یک وظیفه جدید در پنل تولید تصویر را تنظیم کنید.",
  "settingImage.defaultCount.label": "تعداد پیش‌فرض تصویر",
  "settingImage.defaultCount.title": "هنر هوش مصنوعی",
+  "settingModel.enableContextCompression.desc": "هنگامی که گفتگو از ۶۴٬۰۰۰ توکن فراتر رود، پیام‌های پیشین به‌صورت خودکار خلاصه می‌شوند تا ۶۰ تا ۸۰ درصد در مصرف توکن صرفه‌جویی شود.",
+  "settingModel.enableContextCompression.title": "فعال‌سازی فشرده‌سازی خودکار زمینه",
  "settingModel.enableMaxTokens.title": "فعال‌سازی محدودیت حداکثر توکن",
  "settingModel.enableReasoningEffort.title": "فعال‌سازی تنظیم تلاش استدلالی",
  "settingModel.frequencyPenalty.desc": "هرچه مقدار بیشتر باشد، واژگان متنوع‌تر و غنی‌تر خواهد بود؛ مقدار کمتر منجر به زبان ساده‌تر و مستقیم‌تر می‌شود.",
@@ -140,6 +140,8 @@
  "models.output": "خروجی",
  "models.title": "مدل‌ها",
  "payDiffPrice": "پرداخت مابه‌التفاوت",
+  "payDiffPriceApprox": "تقریباً",
+  "payDiffPriceTip": "مبلغ نهایی در صفحه پرداخت مشخص می‌شود",
  "payment.error.actions.billing": "مدیریت صورتحساب",
  "payment.error.actions.home": "بازگشت به خانه",
  "payment.error.desc": "شناسه اشتراک: {{id}} یافت نشد. در صورت وجود سوال، لطفاً از طریق ایمیل با ما تماس بگیرید",
@@ -783,6 +783,40 @@
  "llava.description": "LLaVA est un modèle multimodal combinant un encodeur visuel et Vicuna pour une compréhension solide vision-langage.",
  "llava:13b.description": "LLaVA est un modèle multimodal combinant un encodeur visuel et Vicuna pour une compréhension solide vision-langage.",
  "llava:34b.description": "LLaVA est un modèle multimodal combinant un encodeur visuel et Vicuna pour une compréhension solide vision-langage.",
+  "magistral-medium-latest.description": "Magistral Medium 1.2 est un modèle de raisonnement de pointe de Mistral AI (septembre 2025) avec prise en charge de la vision.",
+  "magistral-small-2509.description": "Magistral Small 1.2 est un petit modèle de raisonnement open source de Mistral AI (septembre 2025) avec prise en charge de la vision.",
+  "mathstral.description": "MathΣtral est conçu pour la recherche scientifique et le raisonnement mathématique, avec de solides capacités de calcul et d'explication.",
+  "max-32k.description": "Spark Max 32K offre un traitement de contexte étendu avec une meilleure compréhension contextuelle et un raisonnement logique renforcé, prenant en charge des entrées de 32 000 jetons pour la lecture de longs documents et les questions-réponses sur des connaissances privées.",
+  "megrez-3b-instruct.description": "Megrez 3B Instruct est un petit modèle efficace développé par Wuwen Xinqiong.",
+  "meituan/longcat-flash-chat.description": "Un modèle de base open source sans raisonnement de Meituan, optimisé pour les dialogues et les tâches d'agents, performant dans l'utilisation d'outils et les interactions complexes à plusieurs tours.",
+  "meta-llama-3-70b-instruct.description": "Un puissant modèle de 70 milliards de paramètres, excellent en raisonnement, programmation et traitement de tâches linguistiques variées.",
+  "meta-llama-3-8b-instruct.description": "Un modèle polyvalent de 8 milliards de paramètres, optimisé pour la conversation et la génération de texte.",
+  "meta-llama-3.1-405b-instruct.description": "Llama 3.1, modèle textuel ajusté par instruction, optimisé pour la conversation multilingue, performant sur les principaux benchmarks industriels parmi les modèles ouverts et fermés.",
+  "meta-llama-3.1-70b-instruct.description": "Llama 3.1, modèle textuel ajusté par instruction, optimisé pour la conversation multilingue, performant sur les principaux benchmarks industriels parmi les modèles ouverts et fermés.",
+  "meta-llama-3.1-8b-instruct.description": "Llama 3.1, modèle textuel ajusté par instruction, optimisé pour la conversation multilingue, performant sur les principaux benchmarks industriels parmi les modèles ouverts et fermés.",
+  "meta-llama/Llama-2-13b-chat-hf.description": "LLaMA-2 Chat (13B) offre une gestion linguistique robuste et une expérience de conversation fluide.",
+  "meta-llama/Llama-2-70b-hf.description": "LLaMA-2 offre une gestion linguistique robuste et une expérience d’interaction solide.",
+  "meta-llama/Llama-3-70b-chat-hf.description": "Llama 3 70B Instruct Reference est un modèle de conversation puissant pour les dialogues complexes.",
+  "meta-llama/Llama-3-8b-chat-hf.description": "Llama 3 8B Instruct Reference offre un support multilingue et une vaste connaissance des domaines.",
+  "meta-llama/Llama-3.2-11B-Vision-Instruct-Turbo.description": "LLaMA 3.2 est conçu pour les tâches combinant vision et texte. Il excelle en légendage d’images et en questions-réponses visuelles, reliant génération de langage et raisonnement visuel.",
+  "meta-llama/Llama-3.2-3B-Instruct-Turbo.description": "LLaMA 3.2 est conçu pour les tâches combinant vision et texte. Il excelle en légendage d’images et en questions-réponses visuelles, reliant génération de langage et raisonnement visuel.",
+  "meta-llama/Llama-3.2-90B-Vision-Instruct-Turbo.description": "LLaMA 3.2 est conçu pour les tâches combinant vision et texte. Il excelle en légendage d’images et en questions-réponses visuelles, reliant génération de langage et raisonnement visuel.",
+  "meta-llama/Llama-3.3-70B-Instruct-Turbo.description": "Meta Llama 3.3 est un LLM multilingue de 70B (texte en/texte hors) préentraîné et ajusté par instruction. La version textuelle ajustée est optimisée pour la conversation multilingue et surpasse de nombreux modèles ouverts et fermés sur les benchmarks industriels.",
+  "meta-llama/Llama-Vision-Free.description": "LLaMA 3.2 est conçu pour les tâches combinant vision et texte. Il excelle en légendage d’images et en questions-réponses visuelles, reliant génération de langage et raisonnement visuel.",
+  "meta-llama/Meta-Llama-3-70B-Instruct-Lite.description": "Llama 3 70B Instruct Lite est conçu pour des performances élevées avec une latence réduite.",
+  "meta-llama/Meta-Llama-3-70B-Instruct-Turbo.description": "Llama 3 70B Instruct Turbo offre une compréhension et une génération puissantes pour les charges de travail les plus exigeantes.",
+  "meta-llama/Meta-Llama-3-8B-Instruct-Lite.description": "Llama 3 8B Instruct Lite équilibre performance et efficacité pour les environnements à ressources limitées.",
+  "meta-llama/Meta-Llama-3-8B-Instruct-Turbo.description": "Llama 3 8B Instruct Turbo est un LLM haute performance pour un large éventail de cas d’usage.",
+  "meta-llama/Meta-Llama-3.1-405B-Instruct-Turbo.description": "Le modèle Turbo Llama 3.1 405B offre une capacité de contexte massive pour le traitement de données volumineuses et excelle dans les applications d’IA à très grande échelle.",
+  "meta-llama/Meta-Llama-3.1-405B-Instruct.description": "Llama 3.1 est la famille de modèles phare de Meta, atteignant jusqu’à 405 milliards de paramètres pour les dialogues complexes, la traduction multilingue et l’analyse de données.",
+  "meta-llama/Meta-Llama-3.1-70B-Instruct-Turbo.description": "Llama 3.1 70B est finement ajusté pour les applications à forte charge ; la quantification FP8 permet un calcul efficace et précis dans des scénarios complexes.",
+  "meta-llama/Meta-Llama-3.1-70B.description": "Llama 3.1 est la famille de modèles phare de Meta, atteignant jusqu’à 405 milliards de paramètres pour les dialogues complexes, la traduction multilingue et l’analyse de données.",
+  "meta-llama/Meta-Llama-3.1-8B-Instruct-Turbo.description": "Llama 3.1 8B utilise la quantification FP8, prend en charge jusqu’à 131 072 jetons de contexte et se classe parmi les meilleurs modèles ouverts pour les tâches complexes sur de nombreux benchmarks.",
+  "meta-llama/llama-3-70b-instruct.description": "Llama 3 70B Instruct est optimisé pour des dialogues de haute qualité et obtient d’excellents résultats dans les évaluations humaines.",
+  "meta-llama/llama-3-8b-instruct.description": "Llama 3 8B Instruct est optimisé pour des dialogues de haute qualité, surpassant de nombreux modèles fermés.",
+  "meta-llama/llama-3.1-70b-instruct.description": "La dernière série Llama 3.1 de Meta, la variante 70B ajustée par instruction, est optimisée pour des dialogues de haute qualité. Elle affiche de solides performances face aux modèles fermés leaders dans les évaluations industrielles. (Disponible uniquement pour les entités vérifiées en entreprise.)",
+  "meta-llama/llama-3.1-8b-instruct.description": "La dernière série Llama 3.1 de Meta, la variante 8B ajustée par instruction, est particulièrement rapide et efficace. Elle offre de solides performances dans les évaluations industrielles, surpassant de nombreux modèles fermés leaders. (Disponible uniquement pour les entités vérifiées en entreprise.)",
+  "meta-llama/llama-3.1-8b-instruct:free.description": "LLaMA 3.1 offre un support multilingue et fait partie des modèles génératifs les plus performants.",
  "meta.llama3-8b-instruct-v1:0.description": "Meta Llama 3 est un modèle LLM ouvert destiné aux développeurs, chercheurs et entreprises, conçu pour les aider à créer, expérimenter et faire évoluer de manière responsable des idées d'IA générative. Faisant partie de la base de l'innovation communautaire mondiale, il est particulièrement adapté aux environnements à ressources limitées, aux appareils en périphérie et aux temps d'entraînement réduits.",
  "meta/Llama-3.2-11B-Vision-Instruct.description": "Raisonnement visuel performant sur des images haute résolution, idéal pour les applications de compréhension visuelle.",
  "meta/Llama-3.2-90B-Vision-Instruct.description": "Raisonnement visuel avancé pour les agents d'applications de compréhension visuelle.",
@@ -446,6 +446,8 @@
  "settingImage.defaultCount.desc": "Définissez le nombre d’images générées par défaut lors de la création d’une nouvelle tâche dans le panneau de génération d’images.",
  "settingImage.defaultCount.label": "Nombre d’images par défaut",
  "settingImage.defaultCount.title": "Art IA",
+  "settingModel.enableContextCompression.desc": "Compresse automatiquement les messages historiques en résumés lorsque la conversation dépasse 64 000 jetons, permettant d’économiser 60 à 80 % de l’utilisation des jetons",
+  "settingModel.enableContextCompression.title": "Activer la compression automatique du contexte",
  "settingModel.enableMaxTokens.title": "Activer la limite de jetons",
  "settingModel.enableReasoningEffort.title": "Activer l’ajustement de l’effort de raisonnement",
  "settingModel.frequencyPenalty.desc": "Plus la valeur est élevée, plus le vocabulaire est riche et varié ; plus la valeur est faible, plus le langage est simple et direct.",
@@ -140,6 +140,8 @@
  "models.output": "Sortie",
  "models.title": "Modèles",
  "payDiffPrice": "Payer la différence",
+  "payDiffPriceApprox": "Env.",
+  "payDiffPriceTip": "Montant réel selon la page de paiement",
  "payment.error.actions.billing": "Gestion de la facturation",
  "payment.error.actions.home": "Retour à l'accueil",
  "payment.error.desc": "ID d’abonnement : {{id}} introuvable. Si vous avez des questions, veuillez nous contacter par e-mail",
@@ -723,6 +723,43 @@
  "imagen-4.0-generate-preview-06-06.description": "Famiglia di modelli di generazione immagini da testo di quarta generazione Imagen.",
  "imagen-4.0-ultra-generate-001.description": "Versione Ultra della serie di modelli di generazione immagini da testo di quarta generazione Imagen",
  "imagen-4.0-ultra-generate-preview-06-06.description": "Variante Ultra della quarta generazione di modelli di generazione immagini da testo Imagen.",
+  "inception/mercury-coder-small.description": "Mercury Coder Small è ideale per la generazione di codice, il debug e il refactoring con una latenza minima.",
+  "inclusionAI/Ling-flash-2.0.description": "Ling-flash-2.0 è il terzo modello dell'architettura Ling 2.0 del team Bailing di Ant Group. È un modello MoE con 100 miliardi di parametri totali, ma solo 6,1 miliardi attivi per token (4,8 miliardi esclusi gli embedding). Nonostante la configurazione leggera, eguaglia o supera modelli densi da 40 miliardi e MoE ancora più grandi in diversi benchmark, esplorando l'efficienza attraverso architettura e strategia di addestramento.",
+  "inclusionAI/Ling-mini-2.0.description": "Ling-mini-2.0 è un piccolo LLM MoE ad alte prestazioni con 16 miliardi di parametri totali e solo 1,4 miliardi attivi per token (789 milioni esclusi gli embedding), offrendo una generazione molto rapida. Grazie a un design MoE efficiente e a un ampio dataset di addestramento di alta qualità, raggiunge prestazioni di livello superiore comparabili a modelli densi sotto i 10 miliardi e a MoE più grandi.",
+  "inclusionAI/Ring-flash-2.0.description": "Ring-flash-2.0 è un modello di ragionamento ad alte prestazioni ottimizzato a partire da Ling-flash-2.0-base. Utilizza un'architettura MoE con 100 miliardi di parametri totali e solo 6,1 miliardi attivi per inferenza. Il suo algoritmo icepop stabilizza l'addestramento RL per i modelli MoE, consentendo progressi continui nel ragionamento complesso. Ottiene risultati eccezionali in benchmark difficili (gare di matematica, generazione di codice, ragionamento logico), superando i migliori modelli densi sotto i 40 miliardi e rivaleggiando con MoE aperti più grandi e modelli chiusi di ragionamento. Eccelle anche nella scrittura creativa e la sua architettura efficiente consente inferenze rapide a costi di distribuzione ridotti per scenari ad alta concorrenza.",
+  "inclusionai/ling-1t.description": "Ling-1T è il modello MoE da 1 trilione di parametri di inclusionAI, ottimizzato per compiti di ragionamento intensivo e contesti di grandi dimensioni.",
+  "inclusionai/ling-flash-2.0.description": "Ling-flash-2.0 è il modello MoE di inclusionAI ottimizzato per efficienza e prestazioni di ragionamento, adatto a compiti di media e grande scala.",
+  "inclusionai/ling-mini-2.0.description": "Ling-mini-2.0 è il modello MoE leggero di inclusionAI, che riduce significativamente i costi mantenendo la capacità di ragionamento.",
+  "inclusionai/ming-flash-omini-preview.description": "Ming-flash-omni Preview è il modello multimodale di inclusionAI, che supporta input vocali, immagini e video, con rendering delle immagini migliorato e riconoscimento vocale avanzato.",
+  "inclusionai/ring-1t.description": "Ring-1T è il modello MoE da un trilione di parametri di inclusionAI per il ragionamento, adatto a compiti di ricerca e ragionamento su larga scala.",
+  "inclusionai/ring-flash-2.0.description": "Ring-flash-2.0 è una variante del modello Ring di inclusionAI per scenari ad alto throughput, con enfasi su velocità ed efficienza dei costi.",
+  "inclusionai/ring-mini-2.0.description": "Ring-mini-2.0 è il modello MoE leggero ad alto throughput di inclusionAI, progettato per la concorrenza elevata.",
+  "internlm/internlm2_5-7b-chat.description": "InternLM2.5-7B-Chat è un modello di chat open-source basato sull'architettura InternLM2. Il modello da 7 miliardi è focalizzato sulla generazione di dialoghi con supporto per cinese e inglese, utilizzando tecniche di addestramento moderne per conversazioni fluide e intelligenti. È adatto a molti scenari di chat come assistenza clienti e assistenti personali.",
+  "internlm2.5-latest.description": "Modelli legacy ancora mantenuti con prestazioni eccellenti e stabili dopo numerose iterazioni. Disponibili nelle versioni da 7B e 20B, supportano contesti da 1M e una maggiore capacità di seguire istruzioni e utilizzare strumenti. Impostato di default sulla serie InternLM2.5 più recente (attualmente internlm2.5-20b-chat).",
+  "internlm3-latest.description": "La nostra serie di modelli più recente con prestazioni di ragionamento eccellenti, leader tra i modelli open-source della sua categoria. Impostato di default sulla serie InternLM3 più recente (attualmente internlm3-8b-instruct).",
+  "internvl2.5-38b-mpo.description": "InternVL2.5 38B MPO è un modello multimodale preaddestrato per il ragionamento complesso immagine-testo.",
+  "internvl2.5-latest.description": "InternVL2.5 è ancora mantenuto con prestazioni forti e stabili. Impostato di default sulla serie InternVL2.5 più recente (attualmente internvl2.5-78b).",
+  "internvl3-14b.description": "InternVL3 14B è un modello multimodale di medie dimensioni che bilancia prestazioni e costi.",
+  "internvl3-1b.description": "InternVL3 1B è un modello multimodale leggero per distribuzioni con risorse limitate.",
+  "internvl3-38b.description": "InternVL3 38B è un grande modello multimodale open-source per una comprensione immagine-testo ad alta precisione.",
+  "internvl3-latest.description": "Il nostro modello multimodale più recente con una comprensione immagine-testo più avanzata e capacità di analisi di immagini in sequenza lunga, comparabile ai migliori modelli chiusi. Impostato di default sulla serie InternVL più recente (attualmente internvl3-78b).",
+  "irag-1.0.description": "ERNIE iRAG è un modello di generazione aumentata dal recupero di immagini per la ricerca visiva, il recupero immagine-testo e la generazione di contenuti.",
+  "jamba-large.description": "Il nostro modello più potente e avanzato, progettato per compiti aziendali complessi con prestazioni eccezionali.",
+  "jamba-mini.description": "Il modello più efficiente della sua categoria, che bilancia velocità e qualità con un ingombro ridotto.",
+  "jina-deepsearch-v1.description": "DeepSearch combina ricerca web, lettura e ragionamento per indagini approfondite. Pensalo come un agente che prende il tuo compito di ricerca, esegue ricerche ampie con più iterazioni e solo dopo produce una risposta. Il processo prevede ricerca continua, ragionamento e risoluzione di problemi da più angolazioni, fondamentalmente diverso dai LLM standard che rispondono dai dati di preaddestramento o dai sistemi RAG tradizionali che si basano su una ricerca superficiale one-shot.",
+  "kimi-k2-0711-preview.description": "kimi-k2 è un modello base MoE con forti capacità di programmazione e agenti (1T di parametri totali, 32B attivi), che supera altri modelli open-source mainstream nei benchmark di ragionamento, programmazione, matematica e agenti.",
+  "kimi-k2-0905-preview.description": "kimi-k2-0905-preview offre una finestra di contesto da 256k, una programmazione agentica più forte, una qualità del codice front-end migliorata e una comprensione del contesto più profonda.",
+  "kimi-k2-instruct.description": "Kimi K2 Instruct è il modello ufficiale di ragionamento di Kimi con contesto esteso per codice, domande e risposte e altro.",
+  "kimi-k2-thinking-turbo.description": "Variante K2 long-thinking ad alta velocità con contesto da 256k, ragionamento profondo avanzato e output da 60–100 token/sec.",
+  "kimi-k2-thinking.description": "kimi-k2-thinking è un modello di ragionamento di Moonshot AI con capacità generali di agenti e ragionamento. Eccelle nel ragionamento profondo e può risolvere problemi complessi tramite l'uso di strumenti multi-step.",
+  "kimi-k2-turbo-preview.description": "kimi-k2 è un modello base MoE con forti capacità di programmazione e agenti (1T di parametri totali, 32B attivi), che supera altri modelli open-source mainstream nei benchmark di ragionamento, programmazione, matematica e agenti.",
+  "kimi-k2.description": "Kimi-K2 è un modello base MoE di Moonshot AI con forti capacità di programmazione e agenti, per un totale di 1T di parametri con 32B attivi. Nei benchmark per ragionamento generale, programmazione, matematica e compiti agentici, supera altri modelli open-source mainstream.",
+  "kimi-k2:1t.description": "Kimi K2 è un grande LLM MoE di Moonshot AI con 1T di parametri totali e 32B attivi per passaggio. È ottimizzato per capacità agentiche tra cui uso avanzato di strumenti, ragionamento e sintesi di codice.",
+  "kimi-latest.description": "Kimi Latest utilizza il modello Kimi più recente e può includere funzionalità sperimentali. Supporta la comprensione delle immagini e seleziona automaticamente i modelli di fatturazione 8k/32k/128k in base alla lunghezza del contesto.",
+  "kuaishou/kat-coder-pro-v1.description": "KAT-Coder-Pro-V1 (gratuito per un periodo limitato) è focalizzato sulla comprensione del codice e sull'automazione per agenti di programmazione efficienti.",
+  "learnlm-1.5-pro-experimental.description": "LearnLM è un modello sperimentale e specifico per compiti, addestrato secondo i principi della scienza dell'apprendimento per seguire istruzioni di sistema in scenari di insegnamento/apprendimento, agendo come un tutor esperto.",
+  "learnlm-2.0-flash-experimental.description": "LearnLM è un modello sperimentale e specifico per compiti, addestrato secondo i principi della scienza dell'apprendimento per seguire istruzioni di sistema in scenari di insegnamento/apprendimento, agendo come un tutor esperto.",
+  "lite.description": "Spark Lite è un LLM leggero con latenza ultra-bassa ed elaborazione efficiente. È completamente gratuito e supporta la ricerca web in tempo reale. Le sue risposte rapide si comportano bene su dispositivi a bassa potenza e per il fine-tuning dei modelli, offrendo un'esperienza intelligente e conveniente, soprattutto per domande e risposte, generazione di contenuti e scenari di ricerca.",
  "meta.llama3-8b-instruct-v1:0.description": "Meta Llama 3 è un LLM open-source pensato per sviluppatori, ricercatori e aziende, progettato per supportare la creazione, la sperimentazione e la scalabilità responsabile di idee basate su IA generativa. Parte integrante dell’ecosistema globale per l’innovazione comunitaria, è ideale per ambienti con risorse limitate, dispositivi edge e tempi di addestramento ridotti.",
  "meta/Llama-3.2-11B-Vision-Instruct.description": "Solido ragionamento visivo su immagini ad alta risoluzione, ideale per applicazioni di comprensione visiva.",
  "meta/Llama-3.2-90B-Vision-Instruct.description": "Ragionamento visivo avanzato per applicazioni agenti di comprensione visiva.",
@@ -446,6 +446,8 @@
  "settingImage.defaultCount.desc": "Imposta il numero predefinito di immagini generate quando si crea un nuovo compito nel pannello di generazione immagini.",
  "settingImage.defaultCount.label": "Numero Immagini Predefinito",
  "settingImage.defaultCount.title": "Arte AI",
+  "settingModel.enableContextCompression.desc": "Comprimi automaticamente i messaggi storici in riepiloghi quando la conversazione supera i 64.000 token, risparmiando dal 60 all'80% nell'uso dei token",
+  "settingModel.enableContextCompression.title": "Abilita Compressione Automatica del Contesto",
  "settingModel.enableMaxTokens.title": "Abilita Limite Massimo Token",
  "settingModel.enableReasoningEffort.title": "Abilita Regolazione Sforzo di Ragionamento",
  "settingModel.frequencyPenalty.desc": "Valori più alti aumentano la varietà del vocabolario; valori più bassi rendono il linguaggio più semplice e diretto.",
@@ -140,6 +140,8 @@
  "models.output": "Output",
  "models.title": "Modelli",
  "payDiffPrice": "Paga la differenza",
+  "payDiffPriceApprox": "Circa",
+  "payDiffPriceTip": "Importo effettivo soggetto alla pagina di pagamento",
  "payment.error.actions.billing": "Gestione fatturazione",
  "payment.error.actions.home": "Torna alla home",
  "payment.error.desc": "ID abbonamento: {{id}} non trovato. In caso di domande, contattaci via email",
@@ -807,6 +807,26 @@
  "meta-llama/Meta-Llama-3-70B-Instruct-Turbo.description": "Llama 3 70B Instruct Turboは、最も要求の厳しいワークロードに対応する強力な理解力と生成能力を提供します。",
  "meta-llama/Meta-Llama-3-8B-Instruct-Lite.description": "Llama 3 8B Instruct Liteは、リソース制約のある環境向けにパフォーマンスを最適化しています。",
  "meta-llama/Meta-Llama-3-8B-Instruct-Turbo.description": "Llama 3 8B Instruct Turboは、幅広いユースケースに対応する高性能LLMです。",
+  "meta-llama/Meta-Llama-3.1-405B-Instruct-Turbo.description": "405B Llama 3.1 Turboモデルは、大規模なデータ処理に対応する膨大なコンテキスト容量を提供し、超大規模AIアプリケーションにおいて卓越した性能を発揮します。",
+  "meta-llama/Meta-Llama-3.1-405B-Instruct.description": "Llama 3.1はMetaの最先端モデルファミリーであり、405Bパラメータまでスケーリング可能で、複雑な対話、多言語翻訳、データ分析に対応します。",
+  "meta-llama/Meta-Llama-3.1-70B-Instruct-Turbo.description": "Llama 3.1 70Bは高負荷アプリケーション向けに最適化されており、FP8量子化により複雑なシナリオでも効率的な計算と高精度を実現します。",
+  "meta-llama/Meta-Llama-3.1-70B.description": "Llama 3.1はMetaの最先端モデルファミリーであり、405Bパラメータまでスケーリング可能で、複雑な対話、多言語翻訳、データ分析に対応します。",
+  "meta-llama/Meta-Llama-3.1-8B-Instruct-Turbo.description": "Llama 3.1 8BはFP8量子化を採用し、最大131,072トークンのコンテキストをサポート。多くのベンチマークで複雑なタスクにおいてトップクラスのオープンモデルとして評価されています。",
+  "meta-llama/llama-3-70b-instruct.description": "Llama 3 70B Instructは高品質な対話に最適化されており、人間による評価でも高いパフォーマンスを示します。",
+  "meta-llama/llama-3-8b-instruct.description": "Llama 3 8B Instructは高品質な対話に最適化されており、多くのクローズドモデルを上回る性能を発揮します。",
+  "meta-llama/llama-3.1-70b-instruct.description": "Metaの最新Llama 3.1シリーズの70B命令調整バージョンで、高品質な対話に最適化されています。業界評価において、主要なクローズドモデルに対して優れた性能を示しています。（企業認証済みの組織のみ利用可能）",
+  "meta-llama/llama-3.1-8b-instruct.description": "Metaの最新Llama 3.1シリーズの8B命令調整バージョンで、特に高速かつ効率的です。業界評価において、多くの主要なクローズドモデルを上回る性能を発揮します。（企業認証済みの組織のみ利用可能）",
+  "meta-llama/llama-3.1-8b-instruct:free.description": "LLaMA 3.1は多言語対応を備えた、最先端の生成モデルの一つです。",
+  "meta-llama/llama-3.2-11b-vision-instruct.description": "LLaMA 3.2は視覚と言語を組み合わせたタスク向けに設計されており、画像キャプション生成や視覚的質問応答に優れ、言語生成と視覚的推論の橋渡しを行います。",
+  "meta-llama/llama-3.2-3b-instruct.description": "meta-llama/llama-3.2-3b-instruct",
+  "meta-llama/llama-3.2-90b-vision-instruct.description": "LLaMA 3.2は視覚と言語を組み合わせたタスク向けに設計されており、画像キャプション生成や視覚的質問応答に優れ、言語生成と視覚的推論の橋渡しを行います。",
+  "meta-llama/llama-3.3-70b-instruct.description": "Llama 3.3は最も高度な多言語対応のオープンソースLlamaモデルで、非常に低コストで405Bに近い性能を提供します。Transformerベースで、SFTとRLHFにより有用性と安全性が向上。命令調整版は多言語チャットに最適化され、業界ベンチマークで多くのオープン・クローズドチャットモデルを上回ります。知識カットオフ：2023年12月。",
+  "meta-llama/llama-3.3-70b-instruct:free.description": "Llama 3.3は最も高度な多言語対応のオープンソースLlamaモデルで、非常に低コストで405Bに近い性能を提供します。Transformerベースで、SFTとRLHFにより有用性と安全性が向上。命令調整版は多言語チャットに最適化され、業界ベンチマークで多くのオープン・クローズドチャットモデルを上回ります。知識カットオフ：2023年12月。",
+  "meta.llama3-1-405b-instruct-v1:0.description": "Meta Llama 3.1 405B Instructは、Llama 3.1 Instructモデルの中で最大かつ最も強力なモデルであり、対話推論や合成データ生成に優れ、ドメイン特化の事前学習やファインチューニングの基盤としても最適です。Llama 3.1の多言語LLMは、8B、70B、405Bのサイズで事前学習および命令調整された生成モデル（テキスト入力/出力）です。命令調整モデルは多言語対話に最適化され、業界標準のベンチマークで多くのオープンチャットモデルを上回ります。Llama 3.1は商用および研究用途に対応しており、命令調整モデルはアシスタント型チャットに、事前学習モデルはより広範な自然言語生成タスクに適しています。Llama 3.1の出力は、合成データ生成や精緻化など、他のモデルの改善にも活用可能です。Llama 3.1は自己回帰型Transformerモデルで、最適化されたアーキテクチャを採用。命令調整版はSFT（教師ありファインチューニング）とRLHF（人間のフィードバックによる強化学習）を用いて、人間の好みに沿った有用性と安全性を実現しています。",
+  "meta.llama3-1-70b-instruct-v1:0.description": "Meta Llama 3.1 70B Instructのアップデート版で、128Kの拡張コンテキストウィンドウ、多言語対応、推論能力の向上を備えています。Llama 3.1の多言語LLMは、8B、70B、405Bのサイズで事前学習および命令調整された生成モデル（テキスト入力/出力）です。命令調整モデルは多言語対話に最適化され、業界標準のベンチマークで多くのオープンチャットモデルを上回ります。Llama 3.1は商用および研究用途に対応しており、命令調整モデルはアシスタント型チャットに、事前学習モデルはより広範な自然言語生成タスクに適しています。Llama 3.1の出力は、合成データ生成や精緻化など、他のモデルの改善にも活用可能です。Llama 3.1は自己回帰型Transformerモデルで、最適化されたアーキテクチャを採用。命令調整版はSFT（教師ありファインチューニング）とRLHF（人間のフィードバックによる強化学習）を用いて、人間の好みに沿った有用性と安全性を実現しています。",
+  "meta.llama3-1-8b-instruct-v1:0.description": "Meta Llama 3.1 8B Instructのアップデート版で、128Kのコンテキストウィンドウ、多言語対応、推論能力の向上を備えています。Llama 3.1ファミリーには、8B、70B、405Bの命令調整テキストモデルが含まれ、多言語チャットと高いベンチマーク性能に最適化されています。商用および研究用途に対応し、命令調整モデルはアシスタント型チャットに、事前学習モデルはより広範な生成タスクに適しています。Llama 3.1の出力は、合成データ生成や精緻化など、他のモデルの改善にも活用可能です。自己回帰型Transformerモデルであり、SFTとRLHFにより有用性と安全性を実現しています。",
+  "meta.llama3-70b-instruct-v1:0.description": "Meta Llama 3は、開発者、研究者、企業向けのオープンLLMであり、生成AIのアイデアを構築・実験・拡張するための基盤です。グローバルなコミュニティによるイノベーションの基礎として、コンテンツ生成、対話型AI、言語理解、研究開発、企業アプリケーションに最適です。",
+  "meta.llama3-8b-instruct-v1:0.description": "Meta Llama 3は、開発者、研究者、企業向けのオープンLLMであり、生成AIのアイデアを構築・実験・拡張するための基盤です。限られた計算資源やエッジデバイス、短時間のトレーニングに適しており、効率的な運用が可能です。",
  "meta/Llama-3.2-90B-Vision-Instruct.description": "視覚理解エージェント向けの高度な画像推論機能。",
  "meta/Llama-3.3-70B-Instruct.description": "Llama 3.3 は、最先端の多言語対応オープンソース Llama モデルであり、非常に低コストで 405B に近い性能を実現します。Transformer ベースで、SFT および RLHF により有用性と安全性が向上しています。命令調整版は多言語チャットに最適化されており、業界ベンチマークで多くのオープン・クローズドチャットモデルを上回ります。知識カットオフ：2023年12月。",
  "meta/Meta-Llama-3-70B-Instruct.description": "推論、コーディング、幅広い言語タスクに優れた 70B パラメータの強力なモデル。",
@@ -446,6 +446,8 @@
  "settingImage.defaultCount.desc": "新しいタスクを作成する際に、画像生成パネルでのデフォルト画像数を設定します。",
  "settingImage.defaultCount.label": "デフォルト画像数",
  "settingImage.defaultCount.title": "AI画像設定",
+  "settingModel.enableContextCompression.desc": "会話が64,000トークンを超えた場合に、過去のメッセージを自動的に要約して圧縮し、トークン使用量を60〜80％節約します",
+  "settingModel.enableContextCompression.title": "自動コンテキスト圧縮を有効にする",
  "settingModel.enableMaxTokens.title": "単一応答制限を有効にする",
  "settingModel.enableReasoningEffort.title": "推論強度の調整を有効にする",
  "settingModel.frequencyPenalty.desc": "値が大きいほど、言葉がより豊かで多様になります。値が小さいほど、言葉はより素朴でシンプルになります。",
@@ -140,6 +140,8 @@
  "models.output": "出力",
  "models.title": "モデル",
  "payDiffPrice": "差額を支払う",
+  "payDiffPriceApprox": "約",
+  "payDiffPriceTip": "実際の金額は支払いページでご確認ください",
  "payment.error.actions.billing": "請求管理",
  "payment.error.actions.home": "ホームに戻る",
  "payment.error.desc": "サブスクリプションID：{{id}} が見つかりません。ご不明な点がある場合は、メールでお問い合わせください。",
@@ -771,6 +771,57 @@
  "llama-3.3-70b-versatile.description": "Meta Llama 3.3은 70B 파라미터를 가진 다국어 LLM으로, 사전 학습 및 인스트럭션 튜닝 버전을 제공합니다. 텍스트 전용 인스트럭션 튜닝 모델은 다국어 대화에 최적화되어 있으며, 업계 공통 벤치마크에서 다수의 오픈 및 클로즈드 채팅 모델을 능가합니다.",
  "llama-3.3-70b.description": "Llama 3.3 70B는 추론과 처리량의 균형을 갖춘 중대형 Llama 모델입니다.",
  "llama-3.3-instruct.description": "Llama 3.3 인스트럭션 튜닝 모델은 채팅에 최적화되어 있으며, 업계 공통 벤치마크에서 다수의 오픈 채팅 모델을 능가합니다.",
+  "llama3-70b-8192.description": "Meta Llama 3 70B는 복잡한 프로젝트를 위한 탁월한 복잡성 처리 능력을 제공합니다.",
+  "llama3-8b-8192.description": "Meta Llama 3 8B는 다양한 상황에서 강력한 추론 성능을 발휘합니다.",
+  "llama3-groq-70b-8192-tool-use-preview.description": "Llama 3 Groq 70B Tool Use는 복잡한 작업을 효율적으로 처리하기 위한 강력한 도구 호출 기능을 제공합니다.",
+  "llama3-groq-8b-8192-tool-use-preview.description": "Llama 3 Groq 8B Tool Use는 빠른 병렬 연산을 통해 효율적인 도구 사용에 최적화되어 있습니다.",
+  "llama3.1-8b.description": "Llama 3.1 8B: 경량 온라인 추론 및 채팅을 위한 소형 저지연 Llama 변형 모델입니다.",
+  "llama3.1.description": "Llama 3.1은 Meta의 대표 모델로, 복잡한 대화, 다국어 번역, 데이터 분석을 위해 최대 405B 파라미터까지 확장됩니다.",
+  "llama3.1:405b.description": "Llama 3.1은 Meta의 대표 모델로, 복잡한 대화, 다국어 번역, 데이터 분석을 위해 최대 405B 파라미터까지 확장됩니다.",
+  "llama3.1:70b.description": "Llama 3.1은 Meta의 대표 모델로, 복잡한 대화, 다국어 번역, 데이터 분석을 위해 최대 405B 파라미터까지 확장됩니다.",
+  "llava-v1.5-7b-4096-preview.description": "LLaVA 1.5 7B는 시각 정보를 처리하여 복잡한 출력을 생성하는 모델입니다.",
+  "llava.description": "LLaVA는 비쿠나와 비전 인코더를 결합한 멀티모달 모델로, 강력한 시각-언어 이해 능력을 갖추고 있습니다.",
+  "llava:13b.description": "LLaVA는 비쿠나와 비전 인코더를 결합한 멀티모달 모델로, 강력한 시각-언어 이해 능력을 갖추고 있습니다.",
+  "llava:34b.description": "LLaVA는 비쿠나와 비전 인코더를 결합한 멀티모달 모델로, 강력한 시각-언어 이해 능력을 갖추고 있습니다.",
+  "magistral-medium-latest.description": "Magistral Medium 1.2는 Mistral AI가 개발한 최첨단 추론 모델로, 시각 기능을 지원합니다. (2025년 9월)",
+  "magistral-small-2509.description": "Magistral Small 1.2는 Mistral AI가 개발한 오픈소스 소형 추론 모델로, 시각 기능을 지원합니다. (2025년 9월)",
+  "mathstral.description": "MathΣtral은 과학 연구 및 수학적 추론을 위해 설계되었으며, 강력한 계산 및 설명 능력을 갖추고 있습니다.",
+  "max-32k.description": "Spark Max 32K는 32K 토큰 입력을 지원하여 긴 문서 읽기 및 개인 지식 기반 질의응답에 적합한 대용량 문맥 처리와 논리적 추론 능력을 제공합니다.",
+  "megrez-3b-instruct.description": "Megrez 3B Instruct는 Wuwen Xinqiong이 개발한 소형 고효율 모델입니다.",
+  "meituan/longcat-flash-chat.description": "Meituan이 개발한 오픈소스 기반 모델로, 대화 및 에이전트 작업에 최적화되어 있으며, 도구 사용 및 복잡한 다중 턴 상호작용에 강점을 보입니다.",
+  "meta-llama-3-70b-instruct.description": "70B 파라미터를 가진 강력한 모델로, 추론, 코딩, 다양한 언어 작업에 탁월한 성능을 발휘합니다.",
+  "meta-llama-3-8b-instruct.description": "8B 파라미터를 가진 다재다능한 모델로, 채팅 및 텍스트 생성에 최적화되어 있습니다.",
+  "meta-llama-3.1-405b-instruct.description": "Llama 3.1은 다국어 채팅에 최적화된 인스트럭션 튜닝 텍스트 모델로, 오픈 및 클로즈드 챗 모델 중 업계 표준 벤치마크에서 우수한 성능을 보입니다.",
+  "meta-llama-3.1-70b-instruct.description": "Llama 3.1은 다국어 채팅에 최적화된 인스트럭션 튜닝 텍스트 모델로, 오픈 및 클로즈드 챗 모델 중 업계 표준 벤치마크에서 우수한 성능을 보입니다.",
+  "meta-llama-3.1-8b-instruct.description": "Llama 3.1은 다국어 채팅에 최적화된 인스트럭션 튜닝 텍스트 모델로, 오픈 및 클로즈드 챗 모델 중 업계 표준 벤치마크에서 우수한 성능을 보입니다.",
+  "meta-llama/Llama-2-13b-chat-hf.description": "LLaMA-2 Chat (13B)은 강력한 언어 처리 능력과 안정적인 채팅 경험을 제공합니다.",
+  "meta-llama/Llama-2-70b-hf.description": "LLaMA-2는 강력한 언어 처리 능력과 안정적인 상호작용 경험을 제공합니다.",
+  "meta-llama/Llama-3-70b-chat-hf.description": "Llama 3 70B Instruct Reference는 복잡한 대화를 위한 강력한 챗 모델입니다.",
+  "meta-llama/Llama-3-8b-chat-hf.description": "Llama 3 8B Instruct Reference는 다국어 지원과 폭넓은 도메인 지식을 제공합니다.",
+  "meta-llama/Llama-3.2-11B-Vision-Instruct-Turbo.description": "LLaMA 3.2는 시각과 텍스트를 결합한 작업을 위해 설계되었으며, 이미지 캡셔닝과 시각적 질의응답에 탁월합니다.",
+  "meta-llama/Llama-3.2-3B-Instruct-Turbo.description": "LLaMA 3.2는 시각과 텍스트를 결합한 작업을 위해 설계되었으며, 이미지 캡셔닝과 시각적 질의응답에 탁월합니다.",
+  "meta-llama/Llama-3.2-90B-Vision-Instruct-Turbo.description": "LLaMA 3.2는 시각과 텍스트를 결합한 작업을 위해 설계되었으며, 이미지 캡셔닝과 시각적 질의응답에 탁월합니다.",
+  "meta-llama/Llama-3.3-70B-Instruct-Turbo.description": "Meta Llama 3.3 다국어 LLM은 70B 파라미터의 사전학습 및 인스트럭션 튜닝 모델로, 다국어 채팅에 최적화되어 있으며 업계 벤치마크에서 많은 오픈 및 클로즈드 챗 모델을 능가합니다.",
+  "meta-llama/Llama-Vision-Free.description": "LLaMA 3.2는 시각과 텍스트를 결합한 작업을 위해 설계되었으며, 이미지 캡셔닝과 시각적 질의응답에 탁월합니다.",
+  "meta-llama/Meta-Llama-3-70B-Instruct-Lite.description": "Llama 3 70B Instruct Lite는 낮은 지연 시간으로 높은 성능을 제공하도록 설계되었습니다.",
+  "meta-llama/Meta-Llama-3-70B-Instruct-Turbo.description": "Llama 3 70B Instruct Turbo는 가장 까다로운 작업 부하를 위한 강력한 이해 및 생성 능력을 제공합니다.",
+  "meta-llama/Meta-Llama-3-8B-Instruct-Lite.description": "Llama 3 8B Instruct Lite는 자원이 제한된 환경에서도 균형 잡힌 성능을 제공합니다.",
+  "meta-llama/Meta-Llama-3-8B-Instruct-Turbo.description": "Llama 3 8B Instruct Turbo는 다양한 사용 사례에 적합한 고성능 LLM입니다.",
+  "meta-llama/Meta-Llama-3.1-405B-Instruct-Turbo.description": "405B Llama 3.1 Turbo 모델은 대규모 데이터 처리를 위한 방대한 문맥 용량을 제공하며, 초대형 AI 애플리케이션에 탁월한 성능을 발휘합니다.",
+  "meta-llama/Meta-Llama-3.1-405B-Instruct.description": "Llama 3.1은 Meta의 대표 모델군으로, 복잡한 대화, 다국어 번역, 데이터 분석을 위해 최대 405B 파라미터까지 확장됩니다.",
+  "meta-llama/Meta-Llama-3.1-70B-Instruct-Turbo.description": "Llama 3.1 70B는 고부하 애플리케이션에 정밀하게 튜닝되었으며, FP8 양자화를 통해 복잡한 시나리오에서도 효율적인 연산과 정확도를 제공합니다.",
+  "meta-llama/Meta-Llama-3.1-70B.description": "Llama 3.1은 Meta의 대표 모델군으로, 복잡한 대화, 다국어 번역, 데이터 분석을 위해 최대 405B 파라미터까지 확장됩니다.",
+  "meta-llama/Meta-Llama-3.1-8B-Instruct-Turbo.description": "Llama 3.1 8B는 FP8 양자화를 사용하며 최대 131,072 컨텍스트 토큰을 지원하고, 다양한 벤치마크에서 복잡한 작업에 대해 상위권 성능을 보입니다.",
+  "meta-llama/llama-3-70b-instruct.description": "Llama 3 70B Instruct는 고품질 대화에 최적화되어 있으며, 인간 평가에서 우수한 성능을 보입니다.",
+  "meta-llama/llama-3-8b-instruct.description": "Llama 3 8B Instruct는 고품질 대화에 최적화되어 있으며, 많은 클로즈드 모델을 능가합니다.",
+  "meta-llama/llama-3.1-70b-instruct.description": "Meta의 최신 Llama 3.1 시리즈 중 70B 인스트럭션 튜닝 버전으로, 고품질 대화에 최적화되어 있습니다. 업계 평가에서 주요 클로즈드 모델과 비교해 강력한 성능을 보입니다. (기업 인증 사용자만 이용 가능)",
+  "meta-llama/llama-3.1-8b-instruct.description": "Meta의 최신 Llama 3.1 시리즈 중 8B 인스트럭션 튜닝 버전으로, 빠르고 효율적입니다. 업계 평가에서 주요 클로즈드 모델을 능가하는 성능을 보입니다. (기업 인증 사용자만 이용 가능)",
+  "meta-llama/llama-3.1-8b-instruct:free.description": "LLaMA 3.1은 다국어 지원을 제공하며, 선도적인 생성 모델 중 하나입니다.",
+  "meta-llama/llama-3.2-11b-vision-instruct.description": "LLaMA 3.2는 시각과 텍스트를 결합한 작업을 위해 설계되었으며, 이미지 캡셔닝과 시각적 질의응답에 탁월합니다.",
+  "meta-llama/llama-3.2-3b-instruct.description": "meta-llama/llama-3.2-3b-instruct",
+  "meta-llama/llama-3.2-90b-vision-instruct.description": "LLaMA 3.2는 시각과 텍스트를 결합한 작업을 위해 설계되었으며, 이미지 캡셔닝과 시각적 질의응답에 탁월합니다.",
+  "meta-llama/llama-3.3-70b-instruct.description": "Llama 3.3은 가장 진보된 다국어 오픈소스 Llama 모델로, 매우 낮은 비용으로 405B에 근접한 성능을 제공합니다. Transformer 기반이며, SFT 및 RLHF를 통해 유용성과 안전성이 향상되었습니다. 인스트럭션 튜닝 버전은 다국어 채팅에 최적화되어 있으며, 업계 벤치마크에서 많은 오픈 및 클로즈드 챗 모델을 능가합니다. 지식 기준일: 2023년 12월",
+  "meta-llama/llama-3.3-70b-instruct:free.description": "Llama 3.3은 가장 진보된 다국어 오픈소스 Llama 모델로, 매우 낮은 비용으로 405B에 근접한 성능을 제공합니다. Transformer 기반이며, SFT 및 RLHF를 통해 유용성과 안전성이 향상되었습니다. 인스트럭션 튜닝 버전은 다국어 채팅에 최적화되어 있으며, 업계 벤치마크에서 많은 오픈 및 클로즈드 챗 모델을 능가합니다. 지식 기준일: 2023년 12월",
  "meta/Llama-3.2-90B-Vision-Instruct.description": "시각 이해 에이전트 애플리케이션을 위한 고급 이미지 추론 기능.",
  "meta/Llama-3.3-70B-Instruct.description": "Llama 3.3은 가장 진보된 다국어 오픈소스 Llama 모델로, 매우 낮은 비용으로 405B에 근접한 성능을 제공합니다. Transformer 기반이며, 유용성과 안전성을 위해 SFT 및 RLHF로 개선되었습니다. 명령어 튜닝 버전은 다국어 채팅에 최적화되어 있으며, 산업 벤치마크에서 많은 오픈 및 클로즈드 채팅 모델을 능가합니다. 지식 기준일: 2023년 12월.",
  "meta/Meta-Llama-3-70B-Instruct.description": "추론, 코딩, 다양한 언어 작업에 뛰어난 성능을 보이는 강력한 70B 파라미터 모델.",
@@ -446,6 +446,8 @@
  "settingImage.defaultCount.desc": "새 작업을 생성할 때 이미지 생성 패널의 기본 이미지 수를 설정합니다.",
  "settingImage.defaultCount.label": "기본 이미지 수",
  "settingImage.defaultCount.title": "AI 그림 설정",
+  "settingModel.enableContextCompression.desc": "대화가 64,000 토큰을 초과할 경우 이전 메시지를 자동으로 요약하여 토큰 사용량을 60~80% 절감합니다",
+  "settingModel.enableContextCompression.title": "자동 컨텍스트 압축 활성화",
  "settingModel.enableMaxTokens.title": "단일 응답 제한 활성화",
  "settingModel.enableReasoningEffort.title": "추론 강도 조정 활성화",
  "settingModel.frequencyPenalty.desc": "값이 클수록 단어 선택이 더 다양하고 풍부해지며, 값이 작을수록 단어 선택이 더 간단하고 소박해집니다.",
@@ -140,6 +140,8 @@
  "models.output": "출력",
  "models.title": "모델",
  "payDiffPrice": "차액 결제",
+  "payDiffPriceApprox": "약",
+  "payDiffPriceTip": "실제 결제 금액은 결제 페이지에서 확인하세요",
  "payment.error.actions.billing": "결제 관리",
  "payment.error.actions.home": "홈으로 돌아가기",
  "payment.error.desc": "구독 ID: {{id}}를 찾을 수 없습니다. 문의 사항이 있으시면 이메일로 연락해 주세요.",
@@ -817,6 +817,15 @@
  "meta-llama/llama-3.1-70b-instruct.description": "De nieuwste Llama 3.1-serie van Meta, de 70B instructie-afgestemde variant, geoptimaliseerd voor hoogwaardige dialogen. In industriële evaluaties toont het sterke prestaties ten opzichte van toonaangevende gesloten modellen. (Alleen beschikbaar voor geverifieerde zakelijke gebruikers.)",
  "meta-llama/llama-3.1-8b-instruct.description": "De nieuwste Llama 3.1-serie van Meta, de 8B instructie-afgestemde variant, is bijzonder snel en efficiënt. In industriële evaluaties levert het sterke prestaties en overtreft het veel toonaangevende gesloten modellen. (Alleen beschikbaar voor geverifieerde zakelijke gebruikers.)",
  "meta-llama/llama-3.1-8b-instruct:free.description": "LLaMA 3.1 biedt meertalige ondersteuning en is een van de toonaangevende generatieve modellen.",
+  "meta-llama/llama-3.2-11b-vision-instruct.description": "LLaMA 3.2 is ontworpen voor taken die visie en tekst combineren. Het blinkt uit in beeldonderschrijving en visuele vraagbeantwoording, en overbrugt taalproductie en visueel redeneren.",
+  "meta-llama/llama-3.2-3b-instruct.description": "meta-llama/llama-3.2-3b-instruct",
+  "meta-llama/llama-3.2-90b-vision-instruct.description": "LLaMA 3.2 is ontworpen voor taken die visie en tekst combineren. Het blinkt uit in beeldonderschrijving en visuele vraagbeantwoording, en overbrugt taalproductie en visueel redeneren.",
+  "meta-llama/llama-3.3-70b-instruct.description": "Llama 3.3 is het meest geavanceerde meertalige open-source Llama-model, met prestaties vergelijkbaar met 405B tegen zeer lage kosten. Het is gebaseerd op een Transformer-architectuur en verbeterd met SFT en RLHF voor bruikbaarheid en veiligheid. De instructie-afgestemde versie is geoptimaliseerd voor meertalige gesprekken en overtreft veel open en gesloten chatmodellen op industriestandaarden. Kennisgrens: dec 2023.",
+  "meta-llama/llama-3.3-70b-instruct:free.description": "Llama 3.3 is het meest geavanceerde meertalige open-source Llama-model, met prestaties vergelijkbaar met 405B tegen zeer lage kosten. Het is gebaseerd op een Transformer-architectuur en verbeterd met SFT en RLHF voor bruikbaarheid en veiligheid. De instructie-afgestemde versie is geoptimaliseerd voor meertalige gesprekken en overtreft veel open en gesloten chatmodellen op industriestandaarden. Kennisgrens: dec 2023.",
+  "meta.llama3-1-405b-instruct-v1:0.description": "Meta Llama 3.1 405B Instruct is het grootste en krachtigste Llama 3.1 Instruct-model, een zeer geavanceerd model voor dialoogredenering en synthetische datageneratie, en een sterke basis voor domeinspecifieke voortgezette pretraining of fine-tuning. De meertalige Llama 3.1 LLMs zijn een reeks voorgetrainde en instructie-afgestemde generatiemodellen in 8B-, 70B- en 405B-varianten (tekst in/tekst uit). De instructie-afgestemde modellen zijn geoptimaliseerd voor meertalige dialogen en presteren beter dan veel beschikbare open chatmodellen op gangbare benchmarks. Llama 3.1 is ontworpen voor commercieel en onderzoeksgebruik in meerdere talen. Instructie-afgestemde modellen zijn geschikt voor assistentachtige gesprekken, terwijl voorgetrainde modellen breder inzetbaar zijn voor natuurlijke taalproductie. De output van Llama 3.1 kan ook worden gebruikt om andere modellen te verbeteren, waaronder synthetische datageneratie en verfijning. Llama 3.1 is een autoregressief Transformer-model met een geoptimaliseerde architectuur. De afgestemde versies gebruiken gesuperviseerde fine-tuning (SFT) en reinforcement learning op basis van menselijke feedback (RLHF) om af te stemmen op menselijke voorkeuren voor behulpzaamheid en veiligheid.",
+  "meta.llama3-1-70b-instruct-v1:0.description": "Een bijgewerkte Meta Llama 3.1 70B Instruct met een uitgebreid contextvenster van 128K, meertalige ondersteuning en verbeterd redeneervermogen. De meertalige Llama 3.1 LLMs zijn een reeks voorgetrainde en instructie-afgestemde generatiemodellen in 8B-, 70B- en 405B-varianten (tekst in/tekst uit). De instructie-afgestemde modellen zijn geoptimaliseerd voor meertalige dialogen en presteren beter dan veel beschikbare open chatmodellen op gangbare benchmarks. Llama 3.1 is ontworpen voor commercieel en onderzoeksgebruik in meerdere talen. Instructie-afgestemde modellen zijn geschikt voor assistentachtige gesprekken, terwijl voorgetrainde modellen breder inzetbaar zijn voor natuurlijke taalproductie. De output van Llama 3.1 kan ook worden gebruikt om andere modellen te verbeteren, waaronder synthetische datageneratie en verfijning. Llama 3.1 is een autoregressief Transformer-model met een geoptimaliseerde architectuur. De afgestemde versies gebruiken gesuperviseerde fine-tuning (SFT) en reinforcement learning op basis van menselijke feedback (RLHF) om af te stemmen op menselijke voorkeuren voor behulpzaamheid en veiligheid.",
+  "meta.llama3-1-8b-instruct-v1:0.description": "Een bijgewerkte Meta Llama 3.1 8B Instruct met een contextvenster van 128K, meertalige ondersteuning en verbeterd redeneervermogen. De Llama 3.1-familie omvat 8B-, 70B- en 405B-instructie-afgestemde tekstmodellen die geoptimaliseerd zijn voor meertalige gesprekken en sterke benchmarkprestaties leveren. Het is ontworpen voor commercieel en onderzoeksgebruik in meerdere talen; instructie-afgestemde modellen zijn geschikt voor assistentachtige gesprekken, terwijl voorgetrainde modellen breder inzetbaar zijn voor tekstgeneratie. De output van Llama 3.1 kan ook worden gebruikt om andere modellen te verbeteren (bijv. synthetische data en verfijning). Het is een autoregressief Transformer-model, met SFT en RLHF om af te stemmen op behulpzaamheid en veiligheid.",
+  "meta.llama3-70b-instruct-v1:0.description": "Meta Llama 3 is een open LLM voor ontwikkelaars, onderzoekers en bedrijven, ontworpen om hen te helpen generatieve AI-ideeën te bouwen, te experimenteren en verantwoord op te schalen. Als onderdeel van de basis voor wereldwijde gemeenschapsinnovatie is het goed geschikt voor contentcreatie, conversatie-AI, taalbegrip, R&D en zakelijke toepassingen.",
  "meta.llama3-8b-instruct-v1:0.description": "Meta Llama 3 is een open LLM voor ontwikkelaars, onderzoekers en bedrijven, ontworpen om hen te helpen bij het bouwen, experimenteren en verantwoord opschalen van generatieve AI-ideeën. Als onderdeel van de basis voor wereldwijde gemeenschapsinnovatie is het goed geschikt voor beperkte rekenkracht en middelen, edge-apparaten en snellere trainingstijden.",
  "meta/Llama-3.2-11B-Vision-Instruct.description": "Sterke beeldredenering op afbeeldingen met hoge resolutie, geschikt voor toepassingen voor visueel begrip.",
  "meta/Llama-3.2-90B-Vision-Instruct.description": "Geavanceerde beeldredenering voor toepassingen met visueel begrip en agentfunctionaliteit.",
@@ -446,6 +446,8 @@
  "settingImage.defaultCount.desc": "Stel het standaard aantal afbeeldingen in dat wordt gegenereerd bij het aanmaken van een nieuwe taak in het afbeeldingspaneel.",
  "settingImage.defaultCount.label": "Standaard aantal afbeeldingen",
  "settingImage.defaultCount.title": "AI-kunst",
+  "settingModel.enableContextCompression.desc": "Comprimeer automatisch historische berichten tot samenvattingen wanneer het gesprek meer dan 64.000 tokens bevat, wat 60-80% aan tokengebruik bespaart",
+  "settingModel.enableContextCompression.title": "Automatische Contextcompressie Inschakelen",
  "settingModel.enableMaxTokens.title": "Maximaal aantal tokens inschakelen",
  "settingModel.enableReasoningEffort.title": "Redeneerinspanning aanpassen",
  "settingModel.frequencyPenalty.desc": "Hoe hoger de waarde, hoe rijker en gevarieerder de woordenschat; hoe lager, hoe eenvoudiger de taal.",
@@ -140,6 +140,8 @@
  "models.output": "Uitvoer",
  "models.title": "Modellen",
  "payDiffPrice": "Betaal Verschil",
+  "payDiffPriceApprox": "Ca.",
+  "payDiffPriceTip": "Het werkelijke bedrag wordt getoond op de betaalpagina",
  "payment.error.actions.billing": "Facturatiebeheer",
  "payment.error.actions.home": "Terug naar Startpagina",
  "payment.error.desc": "Abonnement-ID: {{id}} niet gevonden. Neem bij vragen contact met ons op via e-mail",
@@ -727,6 +727,39 @@
  "inclusionAI/Ling-flash-2.0.description": "Ling-flash-2.0 to trzeci model architektury Ling 2.0 od zespołu Bailing firmy Ant Group. Jest to model MoE z łączną liczbą 100 miliardów parametrów, z których tylko 6,1 miliarda jest aktywnych na token (4,8 miliarda bez osadzania). Pomimo lekkiej konfiguracji dorównuje lub przewyższa modele gęste 40B i większe modele MoE w wielu testach, eksplorując wysoką wydajność dzięki architekturze i strategii treningowej.",
  "inclusionAI/Ling-mini-2.0.description": "Ling-mini-2.0 to mały, wydajny model MoE LLM z 16 miliardami parametrów i tylko 1,4 miliarda aktywnych na token (789 milionów bez osadzania), zapewniający bardzo szybkie generowanie. Dzięki wydajnej konstrukcji MoE i dużym, wysokiej jakości danym treningowym osiąga wydajność porównywalną z modelami gęstymi poniżej 10B i większymi modelami MoE.",
  "inclusionAI/Ring-flash-2.0.description": "Ring-flash-2.0 to wydajny model rozumowania zoptymalizowany z Ling-flash-2.0-base. Wykorzystuje architekturę MoE z łączną liczbą 100 miliardów parametrów i tylko 6,1 miliarda aktywnych na jedno wnioskowanie. Jego algorytm icepop stabilizuje trening RL dla modeli MoE, umożliwiając dalsze postępy w złożonym rozumowaniu. Osiąga przełomowe wyniki w trudnych testach (konkursy matematyczne, generowanie kodu, rozumowanie logiczne), przewyższając czołowe modele gęste poniżej 40B i rywalizując z większymi otwartymi i zamkniętymi modelami rozumowania. Dobrze radzi sobie również w twórczym pisaniu, a jego wydajna architektura zapewnia szybkie wnioskowanie przy niższych kosztach wdrożenia i wysokiej współbieżności.",
+  "inclusionai/ling-1t.description": "Ling-1T to model MoE firmy inclusionAI zoptymalizowany pod kątem zadań wymagających intensywnego rozumowania i pracy z dużym kontekstem.",
+  "inclusionai/ling-flash-2.0.description": "Ling-flash-2.0 to model MoE firmy inclusionAI zoptymalizowany pod kątem wydajności i efektywności rozumowania, odpowiedni do zadań średniego i dużego rozmiaru.",
+  "inclusionai/ling-mini-2.0.description": "Ling-mini-2.0 to lekki model MoE firmy inclusionAI, który znacząco obniża koszty przy zachowaniu zdolności rozumowania.",
+  "inclusionai/ming-flash-omini-preview.description": "Ming-flash-omni Preview to multimodalny model inclusionAI obsługujący mowę, obrazy i wideo, z ulepszonym renderowaniem obrazów i rozpoznawaniem mowy.",
+  "inclusionai/ring-1t.description": "Ring-1T to model MoE firmy inclusionAI z bilionem parametrów, przeznaczony do zadań badawczych i rozumowania na dużą skalę.",
+  "inclusionai/ring-flash-2.0.description": "Ring-flash-2.0 to wariant modelu Ring firmy inclusionAI, zaprojektowany do scenariuszy o wysokiej przepustowości, z naciskiem na szybkość i efektywność kosztową.",
+  "inclusionai/ring-mini-2.0.description": "Ring-mini-2.0 to lekki model MoE firmy inclusionAI o wysokiej przepustowości, stworzony z myślą o równoczesnym przetwarzaniu.",
+  "internlm/internlm2_5-7b-chat.description": "InternLM2.5-7B-Chat to otwartoźródłowy model konwersacyjny oparty na architekturze InternLM2. Model 7B koncentruje się na generowaniu dialogów w języku chińskim i angielskim, wykorzystując nowoczesne techniki treningowe do płynnych i inteligentnych rozmów. Nadaje się do wielu scenariuszy, takich jak obsługa klienta czy asystenci osobowi.",
+  "internlm2.5-latest.description": "Modele starszej generacji, nadal utrzymywane i oferujące doskonałą, stabilną wydajność po wielu iteracjach. Dostępne w wersjach 7B i 20B, obsługujące kontekst 1M, z lepszym podążaniem za instrukcjami i obsługą narzędzi. Domyślnie wybierany jest najnowszy model z serii InternLM2.5 (obecnie internlm2.5-20b-chat).",
+  "internlm3-latest.description": "Nasza najnowsza seria modeli z doskonałą wydajnością w zakresie rozumowania, przewodząca wśród otwartych modeli w swojej klasie rozmiarowej. Domyślnie wybierany jest najnowszy model z serii InternLM3 (obecnie internlm3-8b-instruct).",
+  "internvl2.5-38b-mpo.description": "InternVL2.5 38B MPO to multimodalny model wstępnie wytrenowany do złożonego rozumowania obraz-tekst.",
+  "internvl2.5-latest.description": "InternVL2.5 nadal utrzymuje silną i stabilną wydajność. Domyślnie wybierany jest najnowszy model z serii InternVL2.5 (obecnie internvl2.5-78b).",
+  "internvl3-14b.description": "InternVL3 14B to multimodalny model średniej wielkości, łączący wydajność i efektywność kosztową.",
+  "internvl3-1b.description": "InternVL3 1B to lekki model multimodalny przeznaczony do wdrożeń w środowiskach o ograniczonych zasobach.",
+  "internvl3-38b.description": "InternVL3 38B to duży, otwartoźródłowy model multimodalny do precyzyjnego rozumienia obrazów i tekstu.",
+  "internvl3-latest.description": "Nasz najnowszy model multimodalny z ulepszonym rozumieniem obraz-tekst i długosekwencyjną analizą obrazów, porównywalny z najlepszymi zamkniętymi modelami. Domyślnie wybierany jest najnowszy model z serii InternVL (obecnie internvl3-78b).",
+  "irag-1.0.description": "ERNIE iRAG to model generatywny wspomagany wyszukiwaniem obrazów, przeznaczony do wyszukiwania obrazów, wyszukiwania obraz-tekst i generowania treści.",
+  "jamba-large.description": "Nasz najbardziej zaawansowany model, zaprojektowany do złożonych zadań korporacyjnych, oferujący wyjątkową wydajność.",
+  "jamba-mini.description": "Najbardziej efektywny model w swojej klasie, łączący szybkość i jakość przy mniejszym zużyciu zasobów.",
+  "jina-deepsearch-v1.description": "DeepSearch łączy wyszukiwanie w sieci, czytanie i rozumowanie w celu przeprowadzania dogłębnych analiz. Działa jak agent, który przyjmuje zadanie badawcze, przeprowadza szerokie wyszukiwanie z wieloma iteracjami, a dopiero potem generuje odpowiedź. Proces obejmuje ciągłe badanie, rozumowanie i rozwiązywanie problemów z różnych perspektyw, co zasadniczo różni się od standardowych LLM, które odpowiadają na podstawie danych treningowych lub tradycyjnych systemów RAG opartych na jednorazowym wyszukiwaniu powierzchownym.",
+  "kimi-k2-0711-preview.description": "kimi-k2 to model bazowy MoE o silnych możliwościach programistycznych i agentowych (1T parametrów, 32B aktywnych), przewyższający inne popularne otwarte modele w testach rozumowania, programowania, matematyki i agentów.",
+  "kimi-k2-0905-preview.description": "kimi-k2-0905-preview oferuje okno kontekstu 256k, lepsze kodowanie agentowe, wyższą jakość kodu front-end i lepsze rozumienie kontekstu.",
+  "kimi-k2-instruct.description": "Kimi K2 Instruct to oficjalny model rozumowania Kimi z długim kontekstem, przeznaczony do kodu, pytań i odpowiedzi oraz innych zastosowań.",
+  "kimi-k2-thinking-turbo.description": "Szybka wersja K2 z długim myśleniem, oknem kontekstu 256k, silnym głębokim rozumowaniem i szybkością generowania 60–100 tokenów/sek.",
+  "kimi-k2-thinking.description": "kimi-k2-thinking to model rozumowania Moonshot AI z ogólnymi zdolnościami agentowymi i rozumowania. Doskonale radzi sobie z głębokim rozumowaniem i potrafi rozwiązywać trudne problemy za pomocą wieloetapowego użycia narzędzi.",
+  "kimi-k2-turbo-preview.description": "kimi-k2 to model bazowy MoE o silnych możliwościach programistycznych i agentowych (1T parametrów, 32B aktywnych), przewyższający inne popularne otwarte modele w testach rozumowania, programowania, matematyki i agentów.",
+  "kimi-k2.description": "Kimi-K2 to model bazowy MoE firmy Moonshot AI o silnych możliwościach programistycznych i agentowych, z łączną liczbą 1T parametrów i 32B aktywnych. W testach ogólnego rozumowania, kodowania, matematyki i zadań agentowych przewyższa inne popularne otwarte modele.",
+  "kimi-k2:1t.description": "Kimi K2 to duży model MoE LLM firmy Moonshot AI z 1T parametrów i 32B aktywnych na każde przejście. Zoptymalizowany pod kątem zdolności agentowych, w tym zaawansowanego użycia narzędzi, rozumowania i syntezy kodu.",
+  "kimi-latest.description": "Kimi Latest korzysta z najnowszego modelu Kimi i może zawierać funkcje eksperymentalne. Obsługuje rozumienie obrazów i automatycznie wybiera modele rozliczeniowe 8k/32k/128k w zależności od długości kontekstu.",
+  "kuaishou/kat-coder-pro-v1.description": "KAT-Coder-Pro-V1 (dostępny za darmo przez ograniczony czas) koncentruje się na rozumieniu kodu i automatyzacji dla wydajnych agentów programistycznych.",
+  "learnlm-1.5-pro-experimental.description": "LearnLM to eksperymentalny model zadaniowy, trenowany zgodnie z zasadami nauki o uczeniu się, aby podążać za instrukcjami systemowymi w scenariuszach edukacyjnych, działając jako ekspert-nauczyciel.",
+  "learnlm-2.0-flash-experimental.description": "LearnLM to eksperymentalny model zadaniowy, trenowany zgodnie z zasadami nauki o uczeniu się, aby podążać za instrukcjami systemowymi w scenariuszach edukacyjnych, działając jako ekspert-nauczyciel.",
+  "lite.description": "Spark Lite to lekki LLM o ultraniskim opóźnieniu i wydajnym przetwarzaniu. Jest całkowicie darmowy i obsługuje wyszukiwanie w czasie rzeczywistym. Szybkie odpowiedzi sprawdzają się na urządzeniach o niskiej mocy obliczeniowej i przy dostrajaniu modeli, zapewniając wysoką efektywność kosztową i inteligentne doświadczenie, szczególnie w scenariuszach pytań i odpowiedzi, generowania treści i wyszukiwania.",
  "meta.llama3-8b-instruct-v1:0.description": "Meta Llama 3 to otwarty model językowy (LLM) stworzony z myślą o programistach, naukowcach i przedsiębiorstwach, zaprojektowany, by wspierać ich w budowaniu, eksperymentowaniu i odpowiedzialnym skalowaniu pomysłów z zakresu generatywnej sztucznej inteligencji. Jako fundament globalnej innowacji społecznościowej, doskonale sprawdza się przy ograniczonych zasobach obliczeniowych, na urządzeniach brzegowych oraz przy szybszym czasie trenowania.",
  "meta/Llama-3.2-11B-Vision-Instruct.description": "Zaawansowane rozumowanie obrazów w wysokiej rozdzielczości, idealne do aplikacji zrozumienia wizualnego.",
  "meta/Llama-3.2-90B-Vision-Instruct.description": "Zaawansowane rozumowanie obrazów dla aplikacji agentów opartych na zrozumieniu wizualnym.",
@@ -446,6 +446,8 @@
  "settingImage.defaultCount.desc": "Ustaw domyślną liczbę obrazów generowanych podczas tworzenia nowego zadania w panelu generowania obrazów.",
  "settingImage.defaultCount.label": "Domyślna liczba obrazów",
  "settingImage.defaultCount.title": "Sztuka AI",
+  "settingModel.enableContextCompression.desc": "Automatycznie kompresuj wcześniejsze wiadomości do podsumowań, gdy rozmowa przekroczy 64 000 tokenów, oszczędzając 60–80% zużycia tokenów",
+  "settingModel.enableContextCompression.title": "Włącz automatyczną kompresję kontekstu",
  "settingModel.enableMaxTokens.title": "Włącz limit tokenów",
  "settingModel.enableReasoningEffort.title": "Włącz regulację wysiłku rozumowania",
  "settingModel.frequencyPenalty.desc": "Im wyższa wartość, tym bardziej zróżnicowane i bogate słownictwo; im niższa, tym prostszy i bardziej bezpośredni język.",
@@ -140,6 +140,8 @@
  "models.output": "Wyjście",
  "models.title": "Modele",
  "payDiffPrice": "Dopłać różnicę",
+  "payDiffPriceApprox": "Około",
+  "payDiffPriceTip": "Rzeczywista kwota zgodna ze stroną płatności",
  "payment.error.actions.billing": "Zarządzanie rozliczeniami",
  "payment.error.actions.home": "Powrót do strony głównej",
  "payment.error.desc": "Nie znaleziono ID subskrypcji: {{id}}. W razie pytań skontaktuj się z nami mailowo",
@@ -944,6 +944,15 @@
  "o4-mini-2025-04-16.description": "o4-mini é um modelo de raciocínio da OpenAI com entrada de texto+imagem e saída de texto, adequado para tarefas complexas que exigem amplo conhecimento, com janela de contexto de 200K.",
  "o4-mini-deep-research.description": "o4-mini-deep-research é um modelo de pesquisa profunda mais rápido e acessível para tarefas complexas em múltiplas etapas. Pode buscar na web e acessar seus dados via conectores MCP.",
  "o4-mini.description": "o4-mini é o mais novo modelo pequeno da série o, otimizado para raciocínio rápido e eficaz com alta eficiência em tarefas de codificação e visão.",
+  "open-codestral-mamba.description": "Codestral Mamba é um modelo de linguagem Mamba 2 voltado para geração de código, com suporte a tarefas avançadas de programação e raciocínio.",
+  "open-mistral-7b.description": "Mistral 7B é compacto, mas de alto desempenho, ideal para processamento em lote e tarefas simples como classificação e geração de texto, com raciocínio sólido.",
+  "open-mistral-nemo.description": "Mistral Nemo é um modelo de 12B co-desenvolvido com a Nvidia, oferecendo desempenho robusto em raciocínio e programação com fácil integração.",
+  "open-mixtral-8x22b.description": "Mixtral 8x22B é um modelo MoE de grande porte para tarefas complexas, com raciocínio avançado e alta capacidade de processamento.",
+  "open-mixtral-8x7b.description": "Mixtral 8x7B é um modelo MoE esparso que acelera a inferência, adequado para tarefas multilíngues e de geração de código.",
+  "openai/gpt-3.5-turbo-instruct.description": "Capacidades semelhantes aos modelos da era GPT-3, compatível com endpoints legados de completions em vez de chat.",
+  "openai/gpt-3.5-turbo.description": "O modelo GPT-3.5 mais capaz e econômico da OpenAI, otimizado para chat, mas ainda eficaz em completions clássicos.",
+  "openai/gpt-4-turbo.description": "O gpt-4-turbo da OpenAI possui amplo conhecimento geral e expertise em domínios, segue instruções complexas em linguagem natural e resolve problemas difíceis com precisão. O corte de conhecimento é abril de 2023, com janela de contexto de 128k.",
+  "openai/gpt-4.1-mini.description": "GPT-4.1 Mini oferece menor latência e melhor custo-benefício para cargas de trabalho de contexto médio.",
  "openai/gpt-4.1-nano.description": "GPT-4.1 Nano é uma opção de custo ultrabaixo e baixa latência para conversas curtas de alta frequência ou tarefas de classificação.",
  "openai/gpt-4.1.description": "A série GPT-4.1 oferece janelas de contexto maiores e capacidades aprimoradas de engenharia e raciocínio.",
  "openai/gpt-4o-mini.description": "GPT-4o-mini é uma variante rápida e compacta do GPT-4o para uso multimodal com baixa latência.",
@@ -999,6 +1008,46 @@
  "qianfan-singlepicocr.description": "Qianfan SinglePicOCR é um modelo de OCR para imagem única com reconhecimento de caracteres de alta precisão.",
  "qianfan-vl-70b.description": "Qianfan VL 70B é um grande modelo de linguagem visual para compreensão complexa de imagem e texto.",
  "qianfan-vl-8b.description": "Qianfan VL 8B é um modelo leve de linguagem visual para perguntas e respostas e análise de imagem e texto no dia a dia.",
+  "qvq-72b-preview.description": "QVQ-72B-Preview é um modelo experimental da Qwen focado em aprimorar o raciocínio visual.",
+  "qvq-max.description": "O modelo de raciocínio visual Qwen QVQ aceita entrada visual e gera saídas com cadeia de raciocínio, com desempenho superior em matemática, programação, análise visual, criatividade e tarefas gerais.",
+  "qvq-plus.description": "Modelo de raciocínio visual com entrada de imagem e saída com cadeia de raciocínio. A série qvq-plus sucede a qvq-max, oferecendo raciocínio mais rápido com melhor equilíbrio entre qualidade e custo.",
+  "qwen-3-32b.description": "Qwen 3 32B: forte em tarefas multilíngues e de programação, adequado para uso em produção de médio porte.",
+  "qwen-coder-plus.description": "Modelo de código Qwen.",
+  "qwen-coder-turbo-latest.description": "Modelo de código Qwen.",
+  "qwen-coder-turbo.description": "Modelo de código Qwen.",
+  "qwen-flash.description": "Modelo Qwen mais rápido e de menor custo, ideal para tarefas simples.",
+  "qwen-image-edit.description": "Qwen Image Edit é um modelo de imagem para imagem que edita imagens com base em imagens de entrada e comandos de texto, permitindo ajustes precisos e transformações criativas.",
+  "qwen-image.description": "Qwen-Image é um modelo geral de geração de imagens que suporta múltiplos estilos artísticos e renderização complexa de texto, especialmente em chinês e inglês. Suporta layouts em várias linhas, texto em nível de parágrafo e detalhes refinados para composições complexas de texto e imagem.",
+  "qwen-long.description": "Modelo Qwen ultra-grande com contexto longo e suporte a chat em cenários com múltiplos documentos.",
+  "qwen-math-plus-latest.description": "Qwen Math é um modelo de linguagem especializado na resolução de problemas matemáticos.",
+  "qwen-math-plus.description": "Qwen Math é um modelo de linguagem especializado na resolução de problemas matemáticos.",
+  "qwen-math-turbo-latest.description": "Qwen Math é um modelo de linguagem especializado na resolução de problemas matemáticos.",
+  "qwen-math-turbo.description": "Qwen Math é um modelo de linguagem especializado na resolução de problemas matemáticos.",
+  "qwen-max.description": "Modelo Qwen ultra-grande com escala de centenas de bilhões, com suporte a chinês, inglês e outros idiomas; é o modelo de API por trás dos produtos Qwen2.5 atuais.",
+  "qwen-omni-turbo.description": "Os modelos Qwen-Omni aceitam entradas multimodais (vídeo, áudio, imagens, texto) e geram saídas em áudio e texto.",
+  "qwen-plus.description": "Modelo Qwen ultra-grande aprimorado com suporte a chinês, inglês e outros idiomas.",
+  "qwen-turbo.description": "Qwen Turbo não será mais atualizado; substitua pelo Qwen Flash. Modelo Qwen ultra-grande com suporte a chinês, inglês e outros idiomas.",
+  "qwen-vl-chat-v1.description": "Qwen VL permite interações flexíveis, incluindo entrada com múltiplas imagens, perguntas e respostas em múltiplas etapas e tarefas criativas.",
+  "qwen-vl-max-latest.description": "Modelo Qwen de visão e linguagem ultra-grande. Em comparação com a versão aprimorada, melhora ainda mais o raciocínio visual e o seguimento de instruções para percepção e cognição mais fortes.",
+  "qwen-vl-max.description": "Modelo Qwen de visão e linguagem ultra-grande. Em comparação com a versão aprimorada, melhora ainda mais o raciocínio visual e o seguimento de instruções para percepção visual e cognição mais fortes.",
+  "qwen-vl-ocr.description": "Qwen OCR é um modelo de extração de texto para documentos, tabelas, imagens de exames e escrita manual. Suporta chinês, inglês, francês, japonês, coreano, alemão, russo, italiano, vietnamita e árabe.",
+  "qwen-vl-plus-latest.description": "Modelo Qwen de visão e linguagem em larga escala aprimorado, com grandes avanços em reconhecimento de detalhes e texto, suportando resolução acima de um megapixel e proporções arbitrárias.",
+  "qwen-vl-plus.description": "Modelo Qwen de visão e linguagem em larga escala aprimorado, com grandes avanços em reconhecimento de detalhes e texto, suportando resolução acima de um megapixel e proporções arbitrárias.",
+  "qwen-vl-v1.description": "Modelo pré-treinado inicializado a partir do Qwen-7B com módulo de visão adicionado e entrada de imagem com resolução de 448.",
+  "qwen/qwen-2-7b-instruct.description": "Qwen2 é a nova série de LLMs da Qwen. Qwen2 7B é um modelo baseado em transformador que se destaca em compreensão de linguagem, capacidade multilíngue, programação, matemática e raciocínio.",
+  "qwen/qwen-2-7b-instruct:free.description": "Qwen2 é uma nova família de modelos de linguagem de grande porte com melhor compreensão e geração.",
+  "qwen/qwen-2-vl-72b-instruct.description": "Qwen2-VL é a iteração mais recente do Qwen-VL, atingindo desempenho de ponta em benchmarks de visão como MathVista, DocVQA, RealWorldQA e MTVQA. Compreende mais de 20 minutos de vídeo para perguntas e respostas, diálogos e criação de conteúdo de alta qualidade. Também lida com raciocínio complexo e tomada de decisão, integrando-se a dispositivos móveis e robôs para agir com base em contexto visual e instruções de texto. Além do inglês e chinês, também lê texto em imagens em diversos idiomas, incluindo a maioria das línguas europeias, japonês, coreano, árabe e vietnamita.",
+  "qwen/qwen-2.5-72b-instruct.description": "Qwen2.5-72B-Instruct é um dos lançamentos mais recentes de LLMs da Alibaba Cloud. O modelo de 72B traz melhorias notáveis em programação e matemática, suporta mais de 29 idiomas (incluindo chinês e inglês) e melhora significativamente o seguimento de instruções, compreensão de dados estruturados e geração de saídas estruturadas (especialmente JSON).",
+  "qwen/qwen2.5-32b-instruct.description": "Qwen2.5-32B-Instruct é um dos lançamentos mais recentes de LLMs da Alibaba Cloud. O modelo de 32B traz melhorias notáveis em programação e matemática, suporta mais de 29 idiomas (incluindo chinês e inglês) e melhora significativamente o seguimento de instruções, compreensão de dados estruturados e geração de saídas estruturadas (especialmente JSON).",
+  "qwen/qwen2.5-7b-instruct.description": "Um LLM bilíngue para chinês e inglês com foco em linguagem, programação, matemática e raciocínio.",
+  "qwen/qwen2.5-coder-32b-instruct.description": "Um LLM avançado para geração, raciocínio e correção de código em linguagens de programação populares.",
+  "qwen/qwen2.5-coder-7b-instruct.description": "Um modelo de código robusto de porte médio com contexto de 32K, excelente em programação multilíngue.",
+  "qwen/qwen3-14b.description": "Qwen3-14B é a variante de 14B para raciocínio geral e cenários de chat.",
+  "qwen/qwen3-14b:free.description": "Qwen3-14B é um LLM denso com 14,8B de parâmetros, projetado para raciocínio complexo e chat eficiente. Alterna entre modo de pensamento para matemática, programação e lógica, e modo não-pensante para conversas gerais. Ajustado para seguir instruções, usar ferramentas de agentes e escrita criativa em mais de 100 idiomas e dialetos. Suporta nativamente contexto de 32K e escala até 131K com YaRN.",
+  "qwen/qwen3-235b-a22b-2507.description": "Qwen3-235B-A22B-Instruct-2507 é a variante Instruct da série Qwen3, equilibrando uso multilíngue com cenários de contexto longo.",
+  "qwen/qwen3-235b-a22b-thinking-2507.description": "Qwen3-235B-A22B-Thinking-2507 é a variante de raciocínio da Qwen3, reforçada para tarefas complexas de matemática e raciocínio.",
+  "qwen/qwen3-235b-a22b.description": "Qwen3-235B-A22B é um modelo MoE com 235B parâmetros da Qwen, com 22B ativos por passagem. Alterna entre modo de pensamento para raciocínio complexo, matemática e código, e modo não-pensante para chat eficiente. Oferece raciocínio forte, suporte multilíngue (100+ idiomas/dialetos), seguimento avançado de instruções e uso de ferramentas de agentes. Suporta nativamente contexto de 32K e escala até 131K com YaRN.",
+  "qwen/qwen3-235b-a22b:free.description": "Qwen3-235B-A22B é um modelo MoE com 235B parâmetros da Qwen, com 22B ativos por passagem. Alterna entre modo de pensamento para raciocínio complexo, matemática e código, e modo não-pensante para chat eficiente. Oferece raciocínio forte, suporte multilíngue (100+ idiomas/dialetos), seguimento avançado de instruções e uso de ferramentas de agentes. Suporta nativamente contexto de 32K e escala até 131K com YaRN.",
  "qwen/qwen3-30b-a3b.description": "Qwen3 é a mais recente geração de modelos LLM da série Qwen, com arquiteturas densas e MoE, destacando-se em raciocínio, suporte multilíngue e tarefas avançadas de agentes. Sua capacidade única de alternar entre um modo de pensamento para raciocínio complexo e um modo sem pensamento para conversas eficientes garante desempenho versátil e de alta qualidade.\n\nQwen3 supera significativamente modelos anteriores como QwQ e Qwen2.5, oferecendo excelente desempenho em matemática, programação, raciocínio lógico, escrita criativa e conversas interativas. A variante Qwen3-30B-A3B possui 30,5 bilhões de parâmetros (3,3 bilhões ativos), 48 camadas, 128 especialistas (8 ativos por tarefa) e suporta até 131 mil tokens de contexto com YaRN, estabelecendo um novo padrão para modelos abertos.",
  "qwen/qwen3-30b-a3b:free.description": "Qwen3 é a mais recente geração de modelos LLM da série Qwen, com arquiteturas densas e MoE, destacando-se em raciocínio, suporte multilíngue e tarefas avançadas de agentes. Sua capacidade única de alternar entre um modo de pensamento para raciocínio complexo e um modo sem pensamento para conversas eficientes garante desempenho versátil e de alta qualidade.\n\nQwen3 supera significativamente modelos anteriores como QwQ e Qwen2.5, oferecendo excelente desempenho em matemática, programação, raciocínio lógico, escrita criativa e conversas interativas. A variante Qwen3-30B-A3B possui 30,5 bilhões de parâmetros (3,3 bilhões ativos), 48 camadas, 128 especialistas (8 ativos por tarefa) e suporta até 131 mil tokens de contexto com YaRN, estabelecendo um novo padrão para modelos abertos.",
  "qwen/qwen3-32b.description": "Qwen3-32B é um modelo LLM denso com 32,8 bilhões de parâmetros, otimizado para raciocínio complexo e conversas eficientes. Alterna entre um modo de pensamento para matemática, programação e lógica, e um modo sem pensamento para conversas gerais mais rápidas. Apresenta forte desempenho em seguir instruções, uso de ferramentas por agentes e escrita criativa em mais de 100 idiomas e dialetos. Suporta nativamente 32 mil tokens de contexto e escala até 131 mil com YaRN.",
@@ -446,6 +446,8 @@
  "settingImage.defaultCount.desc": "Defina o número padrão de imagens geradas ao criar uma nova tarefa no painel de geração de imagens.",
  "settingImage.defaultCount.label": "Quantidade Padrão de Imagens",
  "settingImage.defaultCount.title": "Arte com IA",
+  "settingModel.enableContextCompression.desc": "Comprime automaticamente mensagens anteriores em resumos quando a conversa ultrapassa 64.000 tokens, economizando de 60% a 80% no uso de tokens",
+  "settingModel.enableContextCompression.title": "Ativar Compressão Automática de Contexto",
  "settingModel.enableMaxTokens.title": "Ativar Limite Máximo de Tokens",
  "settingModel.enableReasoningEffort.title": "Ativar Ajuste de Esforço de Raciocínio",
  "settingModel.frequencyPenalty.desc": "Quanto maior o valor, mais diversificado e rico será o vocabulário; quanto menor, mais simples e direto.",
@@ -140,6 +140,8 @@
  "models.output": "Saída",
  "models.title": "Modelos",
  "payDiffPrice": "Pagar Diferença",
+  "payDiffPriceApprox": "Aprox.",
+  "payDiffPriceTip": "Valor real sujeito à página de pagamento",
  "payment.error.actions.billing": "Gerenciar Cobrança",
  "payment.error.actions.home": "Voltar para Início",
  "payment.error.desc": "ID da assinatura: {{id}} não encontrado. Se tiver dúvidas, entre em contato conosco por e-mail",
@@ -355,6 +355,7 @@
  "deepseek-ai/deepseek-v3.1-terminus.description": "DeepSeek V3.1 — модель нового поколения для рассуждений, обладающая улучшенными возможностями для сложных рассуждений и цепочек размышлений, подходящая для задач глубокого анализа.",
  "deepseek-ai/deepseek-v3.1.description": "DeepSeek V3.1 — модель нового поколения для рассуждений, обладающая улучшенными возможностями для сложных рассуждений и цепочек размышлений, подходящая для задач глубокого анализа.",
  "deepseek-ai/deepseek-vl2.description": "DeepSeek-VL2 — модель визуально-языкового типа MoE на базе DeepSeekMoE-27B с разреженной активацией, достигающая высокой производительности при использовании всего 4.5B активных параметров. Отличается в задачах визуального QA, OCR, понимания документов/таблиц/диаграмм и визуального связывания.",
+  "deepseek-chat.description": "DeepSeek V3.2 обеспечивает баланс между логическим мышлением и длиной вывода для повседневных задач вопросов-ответов и агентов. На публичных бенчмарках достигает уровня GPT-5 и первым интегрирует мышление в использование инструментов, лидируя в оценках среди open-source агентов.",
  "deepseek-coder-33B-instruct.description": "DeepSeek Coder 33B — языковая модель для программирования, обученная на 2 триллионах токенов (87% кода, 13% китайского/английского текста). Поддерживает контекстное окно 16K и задачи заполнения в середине, обеспечивая автодополнение на уровне проекта и вставку фрагментов кода.",
  "deepseek-coder-v2.description": "DeepSeek Coder V2 — модель кода с открытым исходным кодом, демонстрирующая высокую производительность в задачах программирования, сопоставимую с GPT-4 Turbo.",
  "deepseek-coder-v2:236b.description": "DeepSeek Coder V2 — модель кода с открытым исходным кодом, демонстрирующая высокую производительность в задачах программирования, сопоставимую с GPT-4 Turbo.",
@@ -377,6 +378,7 @@
  "deepseek-r1-fast-online.description": "Быстрая полная версия DeepSeek R1 с поиском в интернете в реальном времени, объединяющая возможности масштаба 671B и ускоренный отклик.",
  "deepseek-r1-online.description": "Полная версия DeepSeek R1 с 671B параметрами и поиском в интернете в реальном времени, обеспечивающая улучшенное понимание и генерацию.",
  "deepseek-r1.description": "DeepSeek-R1 использует данные холодного старта до этапа RL и демонстрирует сопоставимую с OpenAI-o1 производительность в математике, программировании и логическом мышлении.",
+  "deepseek-reasoner.description": "DeepSeek V3.2 Thinking — это модель глубокого рассуждения, которая генерирует цепочку размышлений перед выводом для повышения точности. Демонстрирует выдающиеся результаты в соревнованиях и уровень логики, сопоставимый с Gemini-3.0-Pro.",
  "deepseek-v2.description": "DeepSeek V2 — эффективная модель MoE для экономичной обработки.",
  "deepseek-v2:236b.description": "DeepSeek V2 236B — модель DeepSeek, ориентированная на программирование, с высокой способностью к генерации кода.",
  "deepseek-v3-0324.description": "DeepSeek-V3-0324 — модель MoE с 671B параметрами, выделяющаяся в программировании, технических задачах, понимании контекста и работе с длинными текстами.",
@@ -470,6 +472,8 @@
  "ernie-tiny-8k.description": "ERNIE Tiny 8K — ультралегкая модель для простых задач Вопрос-Ответ, классификации и недорогого вывода.",
  "ernie-x1-turbo-32k.description": "ERNIE X1 Turbo 32K — быстрая модель мышления с контекстом 32K для сложного рассуждения и многотурового общения.",
  "ernie-x1.1-preview.description": "ERNIE X1.1 Preview — предварительная версия модели мышления для оценки и тестирования.",
+  "fal-ai/bytedance/seedream/v4.5.description": "Seedream 4.5, разработанная командой ByteDance Seed, поддерживает редактирование и компоновку нескольких изображений. Обеспечивает улучшенную согласованность объектов, точное следование инструкциям, понимание пространственной логики, эстетическое выражение, макет постеров и дизайн логотипов с высокоточной визуализацией текста и изображений.",
+  "fal-ai/bytedance/seedream/v4.description": "Seedream 4.0, разработанная ByteDance Seed, поддерживает ввод текста и изображений для высококачественной генерации изображений с высокой степенью управляемости.",
  "fal-ai/flux-kontext/dev.description": "Модель FLUX.1, ориентированная на редактирование изображений, поддерживает ввод текста и изображений.",
  "fal-ai/flux-pro/kontext.description": "FLUX.1 Kontext [pro] принимает текст и эталонные изображения, позволяя выполнять локальные правки и сложные глобальные трансформации сцены.",
  "fal-ai/flux/krea.description": "Flux Krea [dev] — модель генерации изображений с эстетическим уклоном в сторону более реалистичных и естественных изображений.",
@@ -477,6 +481,8 @@
  "fal-ai/hunyuan-image/v3.description": "Мощная нативная мультимодальная модель генерации изображений.",
  "fal-ai/imagen4/preview.description": "Модель генерации изображений высокого качества от Google.",
  "fal-ai/nano-banana.description": "Nano Banana — новейшая, самая быстрая и эффективная нативная мультимодальная модель от Google, поддерживающая генерацию и редактирование изображений в диалоговом режиме.",
+  "fal-ai/qwen-image-edit.description": "Профессиональная модель редактирования изображений от команды Qwen, поддерживающая семантические и визуальные правки, точное редактирование текста на китайском и английском языках, перенос стиля, поворот и многое другое.",
+  "fal-ai/qwen-image.description": "Мощная модель генерации изображений от команды Qwen с высокой точностью отображения китайского текста и разнообразием визуальных стилей.",
  "flux-1-schnell.description": "Модель преобразования текста в изображение с 12 миллиардами параметров от Black Forest Labs, использующая латентную диффузию с дистилляцией для генерации качественных изображений за 1–4 шага. Конкурирует с закрытыми аналогами и распространяется по лицензии Apache-2.0 для личного, исследовательского и коммерческого использования.",
  "flux-dev.description": "FLUX.1 [dev] — модель с открытыми весами для некоммерческого использования. Сохраняет почти профессиональное качество изображений и следование инструкциям при более эффективной работе и лучшем использовании ресурсов по сравнению со стандартными моделями аналогичного размера.",
  "flux-kontext-max.description": "Передовая генерация и редактирование изображений с учётом контекста, объединяющая текст и изображения для точных и согласованных результатов.",
@@ -508,6 +514,8 @@
  "gemini-2.0-flash-lite-001.description": "Вариант Gemini 2.0 Flash, оптимизированный по стоимости и задержке.",
  "gemini-2.0-flash-lite.description": "Вариант Gemini 2.0 Flash, оптимизированный по стоимости и задержке.",
  "gemini-2.0-flash.description": "Gemini 2.0 Flash предлагает функции следующего поколения, включая исключительную скорость, нативное использование инструментов, мультимодальную генерацию и контекст до 1 миллиона токенов.",
+  "gemini-2.5-flash-image-preview.description": "Nano Banana — новейшая, самая быстрая и эффективная нативная мультимодальная модель от Google, обеспечивающая генерацию и редактирование изображений в диалоговом формате.",
+  "gemini-2.5-flash-image-preview:image.description": "Nano Banana — новейшая, самая быстрая и эффективная нативная мультимодальная модель от Google, обеспечивающая генерацию и редактирование изображений в диалоговом формате.",
  "gemini-2.5-flash-image.description": "Nano Banana — новейшая, самая быстрая и эффективная нативная мультимодальная модель от Google, поддерживающая генерацию и редактирование изображений в диалоговом режиме.",
  "gemini-2.5-flash-image:image.description": "Nano Banana — новейшая, самая быстрая и эффективная нативная мультимодальная модель от Google, поддерживающая генерацию и редактирование изображений в диалоговом режиме.",
  "gemini-2.5-flash-lite-preview-06-17.description": "Gemini 2.5 Flash-Lite Preview — самая компактная и экономичная модель от Google, предназначенная для масштабного использования.",
@@ -522,6 +530,7 @@
  "gemini-2.5-pro.description": "Gemini 2.5 Pro — флагманская модель рассуждения от Google с поддержкой длинного контекста для сложных задач.",
  "gemini-3-flash-preview.description": "Gemini 3 Flash — самая быстрая и интеллектуальная модель, сочетающая передовые ИИ-возможности с точной привязкой к поисковым данным.",
  "gemini-3-pro-image-preview.description": "Gemini 3 Pro Image (Nano Banana Pro) — модель генерации изображений от Google с поддержкой мультимодального диалога.",
+  "gemini-3-pro-image-preview:image.description": "Gemini 3 Pro Image (Nano Banana Pro) — модель генерации изображений от Google, также поддерживающая мультимодальный чат.",
  "gemini-3-pro-preview.description": "Gemini 3 Pro — самая мощная агентная модель от Google с поддержкой визуализации и глубокой интерактивности, основанная на передовых возможностях рассуждения.",
  "gemini-flash-latest.description": "Последний выпуск Gemini Flash",
  "gemini-flash-lite-latest.description": "Последний выпуск Gemini Flash-Lite",
@@ -738,6 +747,42 @@
  "jamba-large.description": "Наша самая мощная и продвинутая модель, предназначенная для сложных корпоративных задач с выдающейся производительностью.",
  "jamba-mini.description": "Самая эффективная модель в своем классе, обеспечивающая баланс между скоростью и качеством при минимальных ресурсах.",
  "jina-deepsearch-v1.description": "DeepSearch объединяет веб-поиск, чтение и логический анализ для глубокого исследования. Представьте себе агента, который берет вашу исследовательскую задачу, проводит многократный поиск, анализирует и только потом выдает ответ. Этот процесс включает непрерывное исследование, логическое мышление и многогранное решение задач, что принципиально отличается от стандартных LLM, отвечающих на основе предобученных данных или традиционных RAG-систем с одноразовым поиском.",
+  "kimi-k2-0711-preview.description": "kimi-k2 — базовая модель MoE с мощными возможностями программирования и агентных задач (1T параметров, 32B активных), превосходящая другие открытые модели в логике, программировании, математике и агентных бенчмарках.",
+  "kimi-k2-0905-preview.description": "kimi-k2-0905-preview предлагает окно контекста 256k, улучшенное агентное программирование, более качественный фронтенд-код и лучшее понимание контекста.",
+  "kimi-k2-instruct.description": "Kimi K2 Instruct — официальная модель логического мышления от Kimi с поддержкой длинного контекста для кода, вопросов-ответов и других задач.",
+  "kimi-k2-thinking-turbo.description": "Высокоскоростной вариант K2 с длинным мышлением, поддержкой контекста 256k, мощной логикой и скоростью вывода 60–100 токенов/сек.",
+  "kimi-k2-thinking.description": "kimi-k2-thinking — модель мышления от Moonshot AI с общими агентными и логическими возможностями. Отличается глубоким рассуждением и способна решать сложные задачи с помощью многошагового использования инструментов.",
+  "kimi-k2-turbo-preview.description": "kimi-k2 — базовая модель MoE с мощными возможностями программирования и агентных задач (1T параметров, 32B активных), превосходящая другие открытые модели в логике, программировании, математике и агентных бенчмарках.",
+  "kimi-k2.description": "Kimi-K2 — базовая модель MoE от Moonshot AI с мощными возможностями программирования и агентных задач, всего 1T параметров и 32B активных. Превосходит другие открытые модели в логике, программировании, математике и агентных задачах.",
+  "kimi-k2:1t.description": "Kimi K2 — крупная модель MoE LLM от Moonshot AI с 1T параметров и 32B активных на проход. Оптимизирована для агентных задач, включая продвинутое использование инструментов, логическое мышление и синтез кода.",
+  "kimi-latest.description": "Kimi Latest использует новейшую модель Kimi и может включать экспериментальные функции. Поддерживает понимание изображений и автоматически выбирает модели тарификации 8k/32k/128k в зависимости от длины контекста.",
+  "kuaishou/kat-coder-pro-v1.description": "KAT-Coder-Pro-V1 (бесплатно на ограниченное время) ориентирован на понимание кода и автоматизацию для эффективных кодирующих агентов.",
+  "learnlm-1.5-pro-experimental.description": "LearnLM — экспериментальная специализированная модель, обученная на принципах педагогики для выполнения системных инструкций в образовательных сценариях, выступая в роли эксперта-наставника.",
+  "learnlm-2.0-flash-experimental.description": "LearnLM — экспериментальная специализированная модель, обученная на принципах педагогики для выполнения системных инструкций в образовательных сценариях, выступая в роли эксперта-наставника.",
+  "lite.description": "Spark Lite — легковесная LLM с ультранизкой задержкой и эффективной обработкой. Полностью бесплатна и поддерживает поиск в интернете в реальном времени. Быстрые ответы хорошо работают на устройствах с низкой вычислительной мощностью и при дообучении модели, обеспечивая высокую экономичность и интеллектуальный опыт, особенно в задачах вопросов-ответов, генерации контента и поиска.",
+  "llama-3.1-70b-versatile.description": "Llama 3.1 70B обеспечивает улучшенное логическое мышление для сложных приложений, поддерживая высокую вычислительную нагрузку с высокой эффективностью и точностью.",
+  "llama-3.1-8b-instant.description": "Llama 3.1 8B — высокоэффективная модель с быстрой генерацией текста, идеально подходящая для масштабных и экономичных приложений.",
+  "llama-3.1-instruct.description": "Модель Llama 3.1, настроенная на выполнение инструкций, оптимизирована для чатов и превосходит многие открытые модели чатов по отраслевым бенчмаркам.",
+  "llama-3.2-11b-vision-instruct.description": "Мощное логическое мышление по изображениям высокого разрешения, подходит для приложений визуального понимания.",
+  "llama-3.2-11b-vision-preview.description": "Llama 3.2 разработана для задач, сочетающих зрение и текст, превосходно справляется с описанием изображений и визуальными вопросами-ответами, объединяя генерацию языка и визуальное мышление.",
+  "llama-3.2-90b-vision-instruct.description": "Продвинутое логическое мышление по изображениям для приложений агентов визуального понимания.",
+  "llama-3.2-90b-vision-preview.description": "Llama 3.2 разработана для задач, сочетающих зрение и текст, превосходно справляется с описанием изображений и визуальными вопросами-ответами, объединяя генерацию языка и визуальное мышление.",
+  "llama-3.2-vision-instruct.description": "Модель Llama 3.2-Vision, настроенная на выполнение инструкций, оптимизирована для визуального распознавания, логики по изображениям, описания и общих визуальных вопросов-ответов.",
+  "llama-3.3-70b-versatile.description": "Meta Llama 3.3 — многоязычная LLM с 70B параметров (ввод/вывод текста), доступна в вариантах предварительного обучения и настройки на инструкции. Вариант, настроенный на инструкции, оптимизирован для многоязычного диалога и превосходит многие открытые и закрытые модели чатов по отраслевым бенчмаркам.",
+  "llama-3.3-70b.description": "Llama 3.3 70B: модель среднего и крупного размера, обеспечивающая баланс между логикой и пропускной способностью.",
+  "llama-3.3-instruct.description": "Модель Llama 3.3, настроенная на выполнение инструкций, оптимизирована для чатов и превосходит многие открытые модели чатов по отраслевым бенчмаркам.",
+  "llama3-70b-8192.description": "Meta Llama 3 70B обеспечивает исключительную обработку сложных задач для требовательных проектов.",
+  "llama3-8b-8192.description": "Meta Llama 3 8B демонстрирует высокую логическую производительность в различных сценариях.",
+  "llama3-groq-70b-8192-tool-use-preview.description": "Llama 3 Groq 70B Tool Use обеспечивает мощный вызов инструментов для эффективной обработки сложных задач.",
+  "llama3-groq-8b-8192-tool-use-preview.description": "Llama 3 Groq 8B Tool Use оптимизирована для эффективного использования инструментов с быстрой параллельной обработкой.",
+  "llama3.1-8b.description": "Llama 3.1 8B: компактный вариант Llama с низкой задержкой для легких онлайн-инференций и чатов.",
+  "llama3.1.description": "Llama 3.1 — флагманская модель Meta, масштабируемая до 405B параметров для сложных диалогов, многоязычного перевода и анализа данных.",
+  "llama3.1:405b.description": "Llama 3.1 — флагманская модель Meta, масштабируемая до 405B параметров для сложных диалогов, многоязычного перевода и анализа данных.",
+  "llama3.1:70b.description": "Llama 3.1 — флагманская модель Meta, масштабируемая до 405B параметров для сложных диалогов, многоязычного перевода и анализа данных.",
+  "llava-v1.5-7b-4096-preview.description": "LLaVA 1.5 7B объединяет визуальную обработку для генерации сложных выводов на основе визуального ввода.",
+  "llava.description": "LLaVA — мультимодальная модель, объединяющая визуальный энкодер и Vicuna для мощного понимания связки зрение-язык.",
+  "llava:13b.description": "LLaVA — мультимодальная модель, объединяющая визуальный энкодер и Vicuna для мощного понимания связки зрение-язык.",
+  "llava:34b.description": "LLaVA — мультимодальная модель, объединяющая визуальный энкодер и Vicuna для мощного понимания связки зрение-язык.",
  "meta.llama3-8b-instruct-v1:0.description": "Meta Llama 3 — это открытая LLM для разработчиков, исследователей и предприятий, созданная для поддержки создания, экспериментов и ответственного масштабирования идей генеративного ИИ. Являясь частью основы для глобальных инноваций сообщества, она хорошо подходит для ограниченных вычислительных ресурсов, устройств на периферии и ускоренного обучения.",
  "meta/Llama-3.2-11B-Vision-Instruct.description": "Модель с высокой способностью к визуальному рассуждению на изображениях высокого разрешения, подходящая для приложений визуального понимания.",
  "meta/Llama-3.2-90B-Vision-Instruct.description": "Продвинутая модель визуального рассуждения для агентов, ориентированных на визуальное понимание.",
@@ -446,6 +446,8 @@
  "settingImage.defaultCount.desc": "Установите количество изображений по умолчанию, создаваемых при запуске новой задачи в панели генерации изображений.",
  "settingImage.defaultCount.label": "Количество изображений по умолчанию",
  "settingImage.defaultCount.title": "ИИ-арт",
+  "settingModel.enableContextCompression.desc": "Автоматически сжимать историю сообщений в виде кратких сводок, когда диалог превышает 64 000 токенов, экономя 60–80% токенов",
+  "settingModel.enableContextCompression.title": "Включить автоматическое сжатие контекста",
  "settingModel.enableMaxTokens.title": "Включить ограничение токенов",
  "settingModel.enableReasoningEffort.title": "Включить настройку усилий рассуждения",
  "settingModel.frequencyPenalty.desc": "Чем выше значение, тем разнообразнее и богаче словарный запас; чем ниже значение, тем проще и прямолинейнее язык.",
@@ -140,6 +140,8 @@
  "models.output": "Вывод",
  "models.title": "Модели",
  "payDiffPrice": "Оплатить разницу",
+  "payDiffPriceApprox": "Приблизительно",
+  "payDiffPriceTip": "Фактическая сумма указывается на странице оплаты",
  "payment.error.actions.billing": "Управление оплатой",
  "payment.error.actions.home": "На главную",
  "payment.error.desc": "Подписка с ID: {{id}} не найдена. Если у вас есть вопросы, свяжитесь с нами по электронной почте",
@@ -355,6 +355,7 @@
  "deepseek-ai/deepseek-v3.1-terminus.description": "DeepSeek V3.1, karmaşık akıl yürütme ve düşünce zinciriyle derin analiz görevleri için geliştirilmiş yeni nesil bir modeldir.",
  "deepseek-ai/deepseek-v3.1.description": "DeepSeek V3.1, karmaşık akıl yürütme ve düşünce zinciriyle derin analiz görevleri için geliştirilmiş yeni nesil bir modeldir.",
  "deepseek-ai/deepseek-vl2.description": "DeepSeek-VL2, DeepSeekMoE-27B tabanlı, seyrek etkinleştirme kullanan bir MoE görsel-dil modelidir. Sadece 4.5B aktif parametreyle güçlü performans sunar. Görsel Soru-Cevap, OCR, belge/tablo/grafik anlama ve görsel eşleme konularında öne çıkar.",
+  "deepseek-chat.description": "DeepSeek V3.2, günlük soru-cevap ve ajan görevleri için akıl yürütme ve çıktı uzunluğu arasında denge kurar. Genel testlerde GPT-5 seviyelerine ulaşır ve araç kullanımına düşünme sürecini entegre eden ilk modeldir; bu da açık kaynaklı ajan değerlendirmelerinde öne çıkmasını sağlar.",
  "deepseek-coder-33B-instruct.description": "DeepSeek Coder 33B, 2T token (%%87 kod, %%13 Çince/İngilizce metin) ile eğitilmiş bir kodlama dil modelidir. 16K bağlam penceresi ve ortadan doldurma görevleri sunar; proje düzeyinde kod tamamlama ve kod parçacığı doldurma sağlar.",
  "deepseek-coder-v2.description": "DeepSeek Coder V2, GPT-4 Turbo ile karşılaştırılabilir güçlü performansa sahip açık kaynaklı bir MoE kod modeli.",
  "deepseek-coder-v2:236b.description": "DeepSeek Coder V2, GPT-4 Turbo ile karşılaştırılabilir güçlü performansa sahip açık kaynaklı bir MoE kod modeli.",
@@ -377,6 +378,7 @@
  "deepseek-r1-fast-online.description": "Gerçek zamanlı web aramasıyla 671B ölçekli yetenek ve hızlı yanıtları birleştiren DeepSeek R1 hızlı tam sürüm.",
  "deepseek-r1-online.description": "671B parametreli ve gerçek zamanlı web aramasına sahip DeepSeek R1 tam sürüm; güçlü anlama ve üretim sunar.",
  "deepseek-r1.description": "DeepSeek-R1, RL öncesi soğuk başlangıç verileri kullanır ve matematik, kodlama ve akıl yürütmede OpenAI-o1 ile karşılaştırılabilir performans sunar.",
+  "deepseek-reasoner.description": "DeepSeek V3.2 Thinking, çıktılardan önce düşünce zinciri oluşturarak daha yüksek doğruluk sağlayan derin akıl yürütme modelidir. En iyi yarışma sonuçlarına ulaşır ve Gemini-3.0-Pro ile karşılaştırılabilir akıl yürütme yeteneğine sahiptir.",
  "deepseek-v2.description": "DeepSeek V2, maliyet etkin işlem için verimli bir MoE modelidir.",
  "deepseek-v2:236b.description": "DeepSeek V2 236B, güçlü kod üretimi sunan DeepSeek’in kod odaklı modelidir.",
  "deepseek-v3-0324.description": "DeepSeek-V3-0324, programlama ve teknik yetenek, bağlam anlama ve uzun metin işleme konularında öne çıkan 671B parametreli bir MoE modelidir.",
@@ -470,6 +472,8 @@
  "ernie-tiny-8k.description": "ERNIE Tiny 8K, basit QA, sınıflandırma ve düşük maliyetli çıkarım için ultra hafif bir modeldir.",
  "ernie-x1-turbo-32k.description": "ERNIE X1 Turbo 32K, karmaşık akıl yürütme ve çoklu dönüşlü sohbetler için 32K bağlamlı hızlı düşünme modelidir.",
  "ernie-x1.1-preview.description": "ERNIE X1.1 Önizleme, değerlendirme ve test için bir düşünme modeli önizlemesidir.",
+  "fal-ai/bytedance/seedream/v4.5.description": "ByteDance Seed ekibi tarafından geliştirilen Seedream 4.5, çoklu görsel düzenleme ve kompozisyonu destekler. Geliştirilmiş konu tutarlılığı, talimatlara hassas uyum, mekânsal mantık anlayışı, estetik ifade, afiş yerleşimi ve logo tasarımı gibi özelliklerle yüksek hassasiyetli metin-görsel oluşturma sunar.",
+  "fal-ai/bytedance/seedream/v4.description": "ByteDance Seed tarafından geliştirilen Seedream 4.0, metin ve görsel girdileri destekleyerek yönlendirmelerden yüksek kaliteli ve kontrol edilebilir görseller üretir.",
  "fal-ai/flux-kontext/dev.description": "FLUX.1 modeli, metin ve görsel girdileri destekleyen görsel düzenleme odaklı bir modeldir.",
  "fal-ai/flux-pro/kontext.description": "FLUX.1 Kontext [pro], metin ve referans görselleri girdi olarak alarak hedefe yönelik yerel düzenlemeler ve karmaşık sahne dönüşümleri sağlar.",
  "fal-ai/flux/krea.description": "Flux Krea [dev], daha gerçekçi ve doğal görseller üretmeye eğilimli estetik önyargıya sahip bir görsel üretim modelidir.",
@@ -477,6 +481,8 @@
  "fal-ai/hunyuan-image/v3.description": "Güçlü bir yerel çok modlu görsel üretim modelidir.",
  "fal-ai/imagen4/preview.description": "Google tarafından geliştirilen yüksek kaliteli görsel üretim modeli.",
  "fal-ai/nano-banana.description": "Nano Banana, Google’ın en yeni, en hızlı ve en verimli yerel çok modlu modelidir. Konuşma yoluyla görsel üretim ve düzenleme sağlar.",
+  "fal-ai/qwen-image-edit.description": "Qwen ekibinden profesyonel bir görsel düzenleme modeli; anlamsal ve görünüm düzenlemeleri, Çince/İngilizce metin düzenleme, stil aktarımı, döndürme ve daha fazlasını destekler.",
+  "fal-ai/qwen-image.description": "Qwen ekibinden güçlü bir görsel üretim modeli; Çince metin oluşturma ve çeşitli görsel stillerde yüksek performans sunar.",
  "flux-1-schnell.description": "Black Forest Labs tarafından geliştirilen 12 milyar parametreli metinden görsele model. Latent adversarial diffusion distillation yöntemiyle 1-4 adımda yüksek kaliteli görseller üretir. Kapalı kaynaklı alternatiflerle rekabet eder ve kişisel, araştırma ve ticari kullanım için Apache-2.0 lisansı ile sunulur.",
  "flux-dev.description": "FLUX.1 [dev], açık ağırlıklı ve ticari olmayan kullanım için damıtılmış bir modeldir. Neredeyse profesyonel görsel kalitesini ve yönerge takibini korurken daha verimli çalışır ve aynı boyuttaki standart modellere göre kaynakları daha iyi kullanır.",
  "flux-kontext-max.description": "Metin ve görselleri birleştirerek hassas ve tutarlı sonuçlar sunan son teknoloji bağlamsal görsel üretim ve düzenleme.",
@@ -508,6 +514,8 @@
  "gemini-2.0-flash-lite-001.description": "Maliyet verimliliği ve düşük gecikme için optimize edilmiş bir Gemini 2.0 Flash varyantı.",
  "gemini-2.0-flash-lite.description": "Maliyet verimliliği ve düşük gecikme için optimize edilmiş bir Gemini 2.0 Flash varyantı.",
  "gemini-2.0-flash.description": "Gemini 2.0 Flash, olağanüstü hız, yerel araç kullanımı, çok modlu üretim ve 1M-token bağlam penceresi gibi yeni nesil özellikler sunar.",
+  "gemini-2.5-flash-image-preview.description": "Nano Banana, Google’ın en yeni, en hızlı ve en verimli yerel çok modlu modelidir; sohbet tabanlı görsel üretim ve düzenlemeyi mümkün kılar.",
+  "gemini-2.5-flash-image-preview:image.description": "Nano Banana, Google’ın en yeni, en hızlı ve en verimli yerel çok modlu modelidir; sohbet tabanlı görsel üretim ve düzenlemeyi mümkün kılar.",
  "gemini-2.5-flash-image.description": "Nano Banana, Google’ın en yeni, en hızlı ve en verimli yerel çok modlu modelidir. Konuşma tabanlı görsel üretim ve düzenleme sağlar.",
  "gemini-2.5-flash-image:image.description": "Nano Banana, Google’ın en yeni, en hızlı ve en verimli yerel çok modlu modelidir. Konuşma tabanlı görsel üretim ve düzenleme sağlar.",
  "gemini-2.5-flash-lite-preview-06-17.description": "Gemini 2.5 Flash-Lite Preview, Google’ın büyük ölçekli kullanım için tasarlanmış en küçük ve en uygun fiyatlı modelidir.",
@@ -522,6 +530,7 @@
  "gemini-2.5-pro.description": "Gemini 2.5 Pro, Google’ın en gelişmiş akıl yürütme modelidir. Uzun bağlam desteğiyle karmaşık görevleri analiz edebilir.",
  "gemini-3-flash-preview.description": "Gemini 3 Flash, hız için tasarlanmış en akıllı modeldir. En son yapay zeka zekasını mükemmel arama temellendirmesiyle birleştirir.",
  "gemini-3-pro-image-preview.description": "Gemini 3 Pro Image (Nano Banana Pro), Google’ın görsel üretim modelidir ve çok modlu sohbeti destekler.",
+  "gemini-3-pro-image-preview:image.description": "Gemini 3 Pro Image (Nano Banana Pro), Google’ın görsel üretim modelidir ve çok modlu sohbeti de destekler.",
  "gemini-3-pro-preview.description": "Gemini 3 Pro, Google’ın en güçlü ajan ve vibe-coding modelidir. En yeni akıl yürütme yeteneklerinin üzerine zengin görseller ve derin etkileşim sunar.",
  "gemini-flash-latest.description": "Gemini Flash'ın en son sürümü",
  "gemini-flash-lite-latest.description": "Gemini Flash-Lite'ın en son sürümü",
@@ -803,6 +812,20 @@
  "meta-llama/Meta-Llama-3.1-70B-Instruct-Turbo.description": "Llama 3.1 70B, yüksek yük uygulamaları için hassas şekilde ayarlanmıştır; FP8 kuantizasyonu, karmaşık senaryolar için verimli hesaplama ve doğruluk sağlar.",
  "meta-llama/Meta-Llama-3.1-70B.description": "Llama 3.1, Meta’nın öncü model ailesidir; karmaşık diyaloglar, çok dilli çeviri ve veri analizi için 405B parametreye kadar ölçeklenebilir.",
  "meta-llama/Meta-Llama-3.1-8B-Instruct-Turbo.description": "Llama 3.1 8B, FP8 kuantizasyonu kullanır, 131.072 bağlam token'ına kadar destekler ve birçok kıyaslamada karmaşık görevler için en iyi açık modeller arasında yer alır.",
+  "meta-llama/llama-3-70b-instruct.description": "Llama 3 70B Instruct, yüksek kaliteli diyaloglar için optimize edilmiştir ve insan değerlendirmelerinde güçlü performans sergiler.",
+  "meta-llama/llama-3-8b-instruct.description": "Llama 3 8B Instruct, yüksek kaliteli diyaloglar için optimize edilmiştir ve birçok kapalı modeli geride bırakır.",
+  "meta-llama/llama-3.1-70b-instruct.description": "Meta’nın en yeni Llama 3.1 serisinden 70B talimat odaklı varyantı, yüksek kaliteli diyaloglar için optimize edilmiştir. Sektör değerlendirmelerinde önde gelen kapalı modellere karşı güçlü performans gösterir. (Yalnızca kurumsal doğrulamalı kullanıcılar için mevcuttur.)",
+  "meta-llama/llama-3.1-8b-instruct.description": "Meta’nın en yeni Llama 3.1 serisinden 8B talimat odaklı varyantı, özellikle hızlı ve verimlidir. Sektör değerlendirmelerinde güçlü performans sunar ve birçok önde gelen kapalı modeli geride bırakır. (Yalnızca kurumsal doğrulamalı kullanıcılar için mevcuttur.)",
+  "meta-llama/llama-3.1-8b-instruct:free.description": "LLaMA 3.1 çok dilli desteğe sahiptir ve önde gelen üretken modellerden biridir.",
+  "meta-llama/llama-3.2-11b-vision-instruct.description": "LLaMA 3.2, görsel ve metin görevlerini birleştirmek için tasarlanmıştır. Görsel açıklama ve görsel soru-cevapta mükemmeldir; dil üretimi ile görsel akıl yürütme arasında köprü kurar.",
+  "meta-llama/llama-3.2-3b-instruct.description": "meta-llama/llama-3.2-3b-instruct",
+  "meta-llama/llama-3.2-90b-vision-instruct.description": "LLaMA 3.2, görsel ve metin görevlerini birleştirmek için tasarlanmıştır. Görsel açıklama ve görsel soru-cevapta mükemmeldir; dil üretimi ile görsel akıl yürütme arasında köprü kurar.",
+  "meta-llama/llama-3.3-70b-instruct.description": "Llama 3.3, en gelişmiş çok dilli açık kaynaklı Llama modelidir; düşük maliyetle neredeyse 405B performansı sunar. Transformer tabanlıdır ve faydalılık ve güvenlik için SFT ve RLHF ile geliştirilmiştir. Talimat odaklı sürüm çok dilli sohbet için optimize edilmiştir ve sektör testlerinde birçok açık ve kapalı sohbet modelini geride bırakır. Bilgi kesimi: Aralık 2023.",
+  "meta-llama/llama-3.3-70b-instruct:free.description": "Llama 3.3, en gelişmiş çok dilli açık kaynaklı Llama modelidir; düşük maliyetle neredeyse 405B performansı sunar. Transformer tabanlıdır ve faydalılık ve güvenlik için SFT ve RLHF ile geliştirilmiştir. Talimat odaklı sürüm çok dilli sohbet için optimize edilmiştir ve sektör testlerinde birçok açık ve kapalı sohbet modelini geride bırakır. Bilgi kesimi: Aralık 2023.",
+  "meta.llama3-1-405b-instruct-v1:0.description": "Meta Llama 3.1 405B Instruct, Llama 3.1 serisinin en büyük ve en güçlü talimat modeli olup, diyalog akıl yürütme ve sentetik veri üretimi için ileri düzeyde bir modeldir. 8B, 70B ve 405B boyutlarında önceden eğitilmiş ve talimatla ayarlanmış çok dilli üretim modelleri içerir (metin girdi/çıktı). Talimatla ayarlanmış metin modelleri çok dilli sohbet için optimize edilmiştir ve sektör testlerinde birçok açık sohbet modelini geride bırakır. Llama 3.1, ticari ve araştırma amaçlı çok dilli kullanım için tasarlanmıştır. Talimat modelleri asistan tarzı sohbet için uygundur; önceden eğitilmiş modeller ise daha geniş doğal dil üretim görevlerine yöneliktir. Llama 3.1 çıktıları, sentetik veri üretimi ve iyileştirme dahil olmak üzere diğer modelleri geliştirmek için de kullanılabilir. Llama 3.1, optimize edilmiş mimariye sahip otoregresif bir Transformer modelidir. Ayarlanmış sürümler, insan tercihleriyle uyumlu hale getirmek için denetimli ince ayar (SFT) ve insan geri bildirimiyle pekiştirmeli öğrenme (RLHF) kullanır.",
+  "meta.llama3-1-70b-instruct-v1:0.description": "Genişletilmiş 128K bağlam penceresi, çok dilli destek ve geliştirilmiş akıl yürütme ile güncellenmiş Meta Llama 3.1 70B Instruct. Llama 3.1 çok dilli LLM'ler, 8B, 70B ve 405B boyutlarında önceden eğitilmiş ve talimatla ayarlanmış üretim modellerinden oluşur (metin girdi/çıktı). Talimatla ayarlanmış metin modelleri çok dilli sohbet için optimize edilmiştir ve sektör testlerinde birçok açık sohbet modelini geride bırakır. Llama 3.1, ticari ve araştırma amaçlı çok dilli kullanım için tasarlanmıştır. Talimat modelleri asistan tarzı sohbet için uygundur; önceden eğitilmiş modeller ise daha geniş üretim görevlerine yöneliktir. Llama 3.1 çıktıları, sentetik veri üretimi ve iyileştirme dahil olmak üzere diğer modelleri geliştirmek için de kullanılabilir. Llama 3.1, optimize edilmiş mimariye sahip otoregresif bir Transformer modelidir. Ayarlanmış sürümler, insan tercihleriyle uyumlu hale getirmek için denetimli ince ayar (SFT) ve insan geri bildirimiyle pekiştirmeli öğrenme (RLHF) kullanır.",
+  "meta.llama3-1-8b-instruct-v1:0.description": "128K bağlam penceresi, çok dilli destek ve geliştirilmiş akıl yürütme ile güncellenmiş Meta Llama 3.1 8B Instruct. Llama 3.1 ailesi, çok dilli sohbet ve güçlü test performansı için optimize edilmiş 8B, 70B ve 405B talimatla ayarlanmış metin modellerini içerir. Çok dilli ticari ve araştırma kullanımı için tasarlanmıştır; talimat modelleri asistan tarzı sohbet için, önceden eğitilmiş modeller ise daha geniş üretim görevleri için uygundur. Llama 3.1 çıktıları, diğer modelleri geliştirmek için de kullanılabilir (örneğin, sentetik veri ve iyileştirme). Otoregresif bir Transformer modelidir ve faydalılık ve güvenlik için SFT ve RLHF ile hizalanmıştır.",
+  "meta.llama3-70b-instruct-v1:0.description": "Meta Llama 3, geliştiriciler, araştırmacılar ve işletmeler için açık bir LLM'dir; üretken yapay zeka fikirlerini oluşturmak, denemek ve sorumlu bir şekilde ölçeklendirmek için tasarlanmıştır. Küresel topluluk inovasyonunun temelini oluşturan bu model, içerik üretimi, sohbet yapay zekası, dil anlama, Ar-Ge ve kurumsal uygulamalar için uygundur.",
  "meta.llama3-8b-instruct-v1:0.description": "Meta Llama 3, geliştiriciler, araştırmacılar ve işletmeler için açık bir büyük dil modeli (LLM) olup, üretken yapay zeka fikirlerini oluşturma, deneme ve sorumlu bir şekilde ölçeklendirme süreçlerinde yardımcı olmak üzere tasarlanmıştır. Küresel topluluk inovasyonunun temel taşlarından biri olarak, sınırlı bilgi işlem gücü ve kaynaklara sahip ortamlar, uç cihazlar ve daha hızlı eğitim süreleri için uygundur.",
  "mistral-small-latest.description": "Mistral Small, çeviri, özetleme ve duygu analizi için uygun maliyetli, hızlı ve güvenilir bir seçenektir.",
  "mistral-small.description": "Mistral Small, yüksek verimlilik ve düşük gecikme gerektiren her türlü dil tabanlı görev için uygundur.",
@@ -446,6 +446,8 @@
  "settingImage.defaultCount.desc": "Görsel oluşturma panelinde yeni bir görev oluştururken varsayılan olarak üretilecek görsel sayısını ayarlayın.",
  "settingImage.defaultCount.label": "Varsayılan Görsel Sayısı",
  "settingImage.defaultCount.title": "Yapay Zeka Sanatı",
+  "settingModel.enableContextCompression.desc": "Konuşma 64.000 token'ı aştığında geçmiş mesajları otomatik olarak özetlere dönüştürerek %60-80 oranında token tasarrufu sağlar",
+  "settingModel.enableContextCompression.title": "Otomatik Bağlam Sıkıştırmayı Etkinleştir",
  "settingModel.enableMaxTokens.title": "Maksimum Token Sınırını Etkinleştir",
  "settingModel.enableReasoningEffort.title": "Akıl Yürütme Çabası Ayarını Etkinleştir",
  "settingModel.frequencyPenalty.desc": "Değer ne kadar yüksekse, kelime dağarcığı o kadar çeşitli ve zengin olur; değer ne kadar düşükse, dil o kadar sade ve doğrudan olur.",
@@ -140,6 +140,8 @@
  "models.output": "Çıktı",
  "models.title": "Modeller",
  "payDiffPrice": "Farkı Öde",
+  "payDiffPriceApprox": "Yaklaşık",
+  "payDiffPriceTip": "Gerçek tutar ödeme sayfasında geçerlidir",
  "payment.error.actions.billing": "Fatura Yönetimi",
  "payment.error.actions.home": "Ana Sayfaya Dön",
  "payment.error.desc": "Abonelik ID'si: {{id}} bulunamadı. Sorularınız varsa lütfen e-posta yoluyla bizimle iletişime geçin",
@@ -514,6 +514,55 @@
  "gemini-2.0-flash-lite-001.description": "Biến thể Gemini 2.0 Flash được tối ưu hóa cho hiệu quả chi phí và độ trễ thấp.",
  "gemini-2.0-flash-lite.description": "Biến thể Gemini 2.0 Flash được tối ưu hóa cho hiệu quả chi phí và độ trễ thấp.",
  "gemini-2.0-flash.description": "Gemini 2.0 Flash mang đến các tính năng thế hệ mới bao gồm tốc độ vượt trội, sử dụng công cụ gốc, tạo nội dung đa phương thức và cửa sổ ngữ cảnh 1 triệu token.",
+  "gemini-2.5-flash-image-preview.description": "Nano Banana là mô hình đa phương thức gốc mới nhất, nhanh nhất và hiệu quả nhất của Google, cho phép tạo và chỉnh sửa hình ảnh thông qua hội thoại.",
+  "gemini-2.5-flash-image-preview:image.description": "Nano Banana là mô hình đa phương thức gốc mới nhất, nhanh nhất và hiệu quả nhất của Google, cho phép tạo và chỉnh sửa hình ảnh thông qua hội thoại.",
+  "gemini-2.5-flash-image.description": "Nano Banana là mô hình đa phương thức gốc mới nhất, nhanh nhất và hiệu quả nhất của Google, cho phép tạo và chỉnh sửa hình ảnh thông qua hội thoại.",
+  "gemini-2.5-flash-image:image.description": "Nano Banana là mô hình đa phương thức gốc mới nhất, nhanh nhất và hiệu quả nhất của Google, cho phép tạo và chỉnh sửa hình ảnh thông qua hội thoại.",
+  "gemini-2.5-flash-lite-preview-06-17.description": "Gemini 2.5 Flash-Lite Preview là mô hình nhỏ nhất và có giá trị tốt nhất của Google, được thiết kế cho các trường hợp sử dụng quy mô lớn.",
+  "gemini-2.5-flash-lite-preview-09-2025.description": "Phiên bản xem trước (25 tháng 9, 2025) của Gemini 2.5 Flash-Lite",
+  "gemini-2.5-flash-lite.description": "Gemini 2.5 Flash-Lite là mô hình nhỏ nhất và có giá trị tốt nhất của Google, được thiết kế cho các trường hợp sử dụng quy mô lớn.",
+  "gemini-2.5-flash-preview-04-17.description": "Gemini 2.5 Flash Preview là mô hình có giá trị tốt nhất của Google với đầy đủ tính năng.",
+  "gemini-2.5-flash-preview-09-2025.description": "Phiên bản xem trước (25 tháng 9, 2025) của Gemini 2.5 Flash",
+  "gemini-2.5-flash.description": "Gemini 2.5 Flash là mô hình có giá trị tốt nhất của Google với đầy đủ tính năng.",
+  "gemini-2.5-pro-preview-03-25.description": "Gemini 2.5 Pro Preview là mô hình suy luận tiên tiến nhất của Google, có khả năng suy luận trên mã, toán học và các vấn đề STEM, cũng như phân tích tập dữ liệu lớn, mã nguồn và tài liệu với ngữ cảnh dài.",
+  "gemini-2.5-pro-preview-05-06.description": "Gemini 2.5 Pro Preview là mô hình suy luận tiên tiến nhất của Google, có khả năng suy luận trên mã, toán học và các vấn đề STEM, cũng như phân tích tập dữ liệu lớn, mã nguồn và tài liệu với ngữ cảnh dài.",
+  "gemini-2.5-pro-preview-06-05.description": "Gemini 2.5 Pro Preview là mô hình suy luận tiên tiến nhất của Google, có khả năng suy luận trên mã, toán học và các vấn đề STEM, cũng như phân tích tập dữ liệu lớn, mã nguồn và tài liệu với ngữ cảnh dài.",
+  "gemini-2.5-pro.description": "Gemini 2.5 Pro là mô hình suy luận tiên tiến nhất của Google, có khả năng suy luận trên mã, toán học và các vấn đề STEM, cũng như phân tích tập dữ liệu lớn, mã nguồn và tài liệu với ngữ cảnh dài.",
+  "gemini-3-flash-preview.description": "Gemini 3 Flash là mô hình thông minh nhất được xây dựng để tối ưu tốc độ, kết hợp trí tuệ tiên tiến với khả năng tìm kiếm chính xác.",
+  "gemini-3-pro-image-preview.description": "Gemini 3 Pro Image（Nano Banana Pro）là mô hình tạo hình ảnh của Google, đồng thời hỗ trợ hội thoại đa phương thức.",
+  "gemini-3-pro-image-preview:image.description": "Gemini 3 Pro Image (Nano Banana Pro) là mô hình tạo hình ảnh của Google và cũng hỗ trợ trò chuyện đa phương thức.",
+  "gemini-3-pro-preview.description": "Gemini 3 Pro là mô hình mạnh mẽ nhất của Google, kết hợp khả năng mã hóa cảm xúc và suy luận tiên tiến, mang đến hình ảnh phong phú và tương tác sâu sắc.",
+  "gemini-flash-latest.description": "Phiên bản mới nhất của Gemini Flash",
+  "gemini-flash-lite-latest.description": "Phiên bản mới nhất của Gemini Flash-Lite",
+  "gemini-pro-latest.description": "Phiên bản mới nhất của Gemini Pro",
+  "gemma-7b-it.description": "Gemma 7B là lựa chọn tiết kiệm chi phí cho các tác vụ quy mô nhỏ đến trung bình.",
+  "gemma2-9b-it.description": "Gemma 2 9B được tối ưu hóa cho các tác vụ cụ thể và tích hợp công cụ.",
+  "gemma2.description": "Gemma 2 là mô hình hiệu quả của Google, phục vụ từ ứng dụng nhỏ đến xử lý dữ liệu phức tạp.",
+  "gemma2:27b.description": "Gemma 2 là mô hình hiệu quả của Google, phục vụ từ ứng dụng nhỏ đến xử lý dữ liệu phức tạp.",
+  "gemma2:2b.description": "Gemma 2 là mô hình hiệu quả của Google, phục vụ từ ứng dụng nhỏ đến xử lý dữ liệu phức tạp.",
+  "generalv3.5.description": "Spark Max là phiên bản đầy đủ tính năng nhất, hỗ trợ tìm kiếm web và nhiều plugin tích hợp. Các khả năng cốt lõi được tối ưu hóa hoàn toàn, vai trò hệ thống và gọi hàm mang lại hiệu suất vượt trội trong các tình huống ứng dụng phức tạp.",
+  "generalv3.description": "Spark Pro là mô hình LLM hiệu suất cao được tối ưu cho các lĩnh vực chuyên môn, tập trung vào toán học, lập trình, y tế và giáo dục, với tìm kiếm web và các plugin tích hợp như thời tiết và ngày tháng. Nó mang lại hiệu suất mạnh mẽ và hiệu quả trong hỏi đáp kiến thức phức tạp, hiểu ngôn ngữ và sáng tạo văn bản nâng cao, là lựa chọn lý tưởng cho các trường hợp sử dụng chuyên nghiệp.",
+  "glm-4-0520.description": "GLM-4-0520 là phiên bản mô hình mới nhất, được thiết kế cho các tác vụ phức tạp và đa dạng với hiệu suất vượt trội.",
+  "glm-4-32b-0414.description": "GLM-4 32B 0414 là mô hình GLM tổng quát hỗ trợ tạo và hiểu văn bản đa nhiệm.",
+  "glm-4-9b-chat.description": "GLM-4-9B-Chat thể hiện hiệu suất mạnh mẽ trong ngữ nghĩa, toán học, suy luận, mã hóa và kiến thức. Nó cũng hỗ trợ duyệt web, thực thi mã, gọi công cụ tùy chỉnh và suy luận văn bản dài, hỗ trợ 26 ngôn ngữ bao gồm tiếng Nhật, Hàn và Đức.",
+  "glm-4-air-250414.description": "GLM-4-Air là lựa chọn có giá trị cao với hiệu suất gần GLM-4, tốc độ nhanh và chi phí thấp hơn.",
+  "glm-4-air.description": "GLM-4-Air là lựa chọn có giá trị cao với hiệu suất gần GLM-4, tốc độ nhanh và chi phí thấp hơn.",
+  "glm-4-airx.description": "GLM-4-AirX là biến thể hiệu quả hơn của GLM-4-Air với khả năng suy luận nhanh hơn đến 2.6 lần.",
+  "glm-4-alltools.description": "GLM-4-AllTools là mô hình tác tử đa năng được tối ưu hóa cho lập kế hoạch hướng dẫn phức tạp và sử dụng công cụ như duyệt web, giải thích mã và tạo văn bản, phù hợp cho thực thi đa nhiệm.",
+  "glm-4-flash-250414.description": "GLM-4-Flash lý tưởng cho các tác vụ đơn giản: nhanh nhất và miễn phí.",
+  "glm-4-flash.description": "GLM-4-Flash lý tưởng cho các tác vụ đơn giản: nhanh nhất và miễn phí.",
+  "glm-4-flashx.description": "GLM-4-FlashX là phiên bản Flash nâng cao với khả năng suy luận siêu nhanh.",
+  "glm-4-long.description": "GLM-4-Long hỗ trợ đầu vào siêu dài cho các tác vụ kiểu ghi nhớ và xử lý tài liệu quy mô lớn.",
+  "glm-4-plus.description": "GLM-4-Plus là mô hình cao cấp với trí tuệ vượt trội, xử lý tốt văn bản dài và tác vụ phức tạp, hiệu suất tổng thể được nâng cấp.",
+  "glm-4.1v-thinking-flash.description": "GLM-4.1V-Thinking là mô hình VLM ~10B mạnh nhất hiện nay, bao phủ các tác vụ SOTA như hiểu video, hỏi đáp hình ảnh, giải đề, OCR, đọc tài liệu và biểu đồ, tác tử GUI, lập trình giao diện và liên kết ngữ nghĩa. Với học tăng cường tiên tiến, nó sử dụng suy luận chuỗi tư duy để cải thiện độ chính xác và độ phong phú, vượt trội hơn các mô hình không suy nghĩ truyền thống cả về kết quả và khả năng giải thích.",
+  "glm-4.1v-thinking-flashx.description": "GLM-4.1V-Thinking là mô hình VLM ~10B mạnh nhất hiện nay, bao phủ các tác vụ SOTA như hiểu video, hỏi đáp hình ảnh, giải đề, OCR, đọc tài liệu và biểu đồ, tác tử GUI, lập trình giao diện và liên kết ngữ nghĩa. Với học tăng cường tiên tiến, nó sử dụng suy luận chuỗi tư duy để cải thiện độ chính xác và độ phong phú, vượt trội hơn các mô hình không suy nghĩ truyền thống cả về kết quả và khả năng giải thích.",
+  "glm-4.5-air.description": "Phiên bản nhẹ của GLM-4.5 cân bằng giữa hiệu suất và chi phí, với chế độ suy nghĩ kết hợp linh hoạt.",
+  "glm-4.5-airx.description": "Phiên bản nhanh của GLM-4.5-Air với phản hồi nhanh hơn cho các trường hợp sử dụng quy mô lớn, tốc độ cao.",
+  "glm-4.5-flash.description": "Phiên bản miễn phí của GLM-4.5 với hiệu suất mạnh mẽ trong suy luận, mã hóa và tác vụ tác tử.",
+  "glm-4.5-x.description": "Phiên bản nhanh của GLM-4.5, mang lại hiệu suất mạnh mẽ với tốc độ tạo lên đến 100 token/giây.",
+  "glm-4.5.description": "Mô hình hàng đầu của Zhipu với chế độ suy nghĩ có thể chuyển đổi, cung cấp SOTA mã nguồn mở tổng thể và hỗ trợ ngữ cảnh lên đến 128K.",
+  "glm-4.5v.description": "Mô hình suy luận thị giác thế hệ tiếp theo của Zhipu với tổng 106B tham số, 12B hoạt động, đạt SOTA trong các mô hình đa phương thức mã nguồn mở cùng kích thước về hình ảnh, video, hiểu tài liệu và tác vụ GUI.",
+  "glm-4.6.description": "GLM-4.6 là mô hình hàng đầu mới nhất của Zhipu (355B), vượt trội hoàn toàn so với các phiên bản trước về mã hóa nâng cao, xử lý văn bản dài, suy luận và khả năng tác tử. Đặc biệt phù hợp với Claude Sonnet 4 về khả năng lập trình, trở thành mô hình mã hóa hàng đầu tại Trung Quốc.",
  "meta.llama3-8b-instruct-v1:0.description": "Meta Llama 3 là một mô hình ngôn ngữ mở dành cho nhà phát triển, nhà nghiên cứu và doanh nghiệp, được thiết kế để hỗ trợ xây dựng, thử nghiệm và mở rộng các ý tưởng AI sinh ngữ một cách có trách nhiệm. Là một phần trong nền tảng đổi mới cộng đồng toàn cầu, mô hình này phù hợp với môi trường có tài nguyên hạn chế, thiết bị biên và yêu cầu thời gian huấn luyện nhanh hơn.",
  "meta/Llama-3.2-11B-Vision-Instruct.description": "Khả năng suy luận hình ảnh mạnh mẽ trên ảnh độ phân giải cao, phù hợp cho các ứng dụng hiểu thị giác.",
  "meta/Llama-3.2-90B-Vision-Instruct.description": "Khả năng suy luận hình ảnh tiên tiến dành cho các ứng dụng tác tử hiểu thị giác.",
@@ -446,6 +446,8 @@
  "settingImage.defaultCount.desc": "Đặt số lượng hình ảnh mặc định được tạo khi tạo tác vụ mới trong bảng tạo hình ảnh.",
  "settingImage.defaultCount.label": "Số Lượng Hình Ảnh Mặc Định",
  "settingImage.defaultCount.title": "Nghệ Thuật AI",
+  "settingModel.enableContextCompression.desc": "Tự động nén các tin nhắn lịch sử thành bản tóm tắt khi cuộc trò chuyện vượt quá 64.000 token, giúp tiết kiệm 60-80% lượng token sử dụng",
+  "settingModel.enableContextCompression.title": "Bật Tự Động Nén Ngữ Cảnh",
  "settingModel.enableMaxTokens.title": "Bật Giới Hạn Số Token",
  "settingModel.enableReasoningEffort.title": "Bật Điều Chỉnh Nỗ Lực Lý Luận",
  "settingModel.frequencyPenalty.desc": "Giá trị càng cao, từ vựng càng phong phú và đa dạng; giá trị càng thấp, ngôn ngữ càng đơn giản và trực tiếp.",
@@ -140,6 +140,8 @@
  "models.output": "Đầu ra",
  "models.title": "Mô hình",
  "payDiffPrice": "Thanh toán phần chênh lệch",
+  "payDiffPriceApprox": "Xấp xỉ",
+  "payDiffPriceTip": "Số tiền thực tế sẽ hiển thị trên trang thanh toán",
  "payment.error.actions.billing": "Quản lý thanh toán",
  "payment.error.actions.home": "Quay về trang chủ",
  "payment.error.desc": "Không tìm thấy ID gói đăng ký: {{id}}. Nếu bạn có thắc mắc, vui lòng liên hệ với chúng tôi qua email",
@@ -140,6 +140,8 @@
  "models.output": "输出",
  "models.title": "模型",
  "payDiffPrice": "支付差价",
+  "payDiffPriceApprox": "约",
+  "payDiffPriceTip": "实际金额以支付页面为准",
  "payment.error.actions.billing": "账单管理",
  "payment.error.actions.home": "返回首页",
  "payment.error.desc": "未找到订阅 ID：{{id}}。如有疑问，请通过电子邮件联系我们",
@@ -446,6 +446,8 @@
  "settingImage.defaultCount.desc": "設定圖像生成面板在建立新任務時的預設圖片數量。",
  "settingImage.defaultCount.label": "預設圖片數量",
  "settingImage.defaultCount.title": "AI 繪圖設定",
+  "settingModel.enableContextCompression.desc": "當對話超過 64,000 個標記時，自動將歷史訊息壓縮為摘要，可節省 60-80% 的標記使用量",
+  "settingModel.enableContextCompression.title": "啟用自動上下文壓縮",
  "settingModel.enableMaxTokens.title": "啟用單次回覆限制",
  "settingModel.enableReasoningEffort.title": "開啟推理強度調整",
  "settingModel.frequencyPenalty.desc": "值越大，用詞越豐富多樣；值越低，用詞更樸實簡單",
@@ -140,6 +140,8 @@
  "models.output": "輸出",
  "models.title": "模型",
  "payDiffPrice": "支付差額",
+  "payDiffPriceApprox": "約",
+  "payDiffPriceTip": "實際金額以付款頁面為準",
  "payment.error.actions.billing": "帳單管理",
  "payment.error.actions.home": "返回首頁",
  "payment.error.desc": "找不到訂閱 ID：{{id}}。如有疑問，請透過電子郵件與我們聯繫",
@@ -1,6 +1,6 @@
 {
  "name": "@lobehub/lobehub",
-  "version": "2.0.4",
+  "version": "2.0.10",
  "description": "LobeHub - an open-source,comprehensive AI Agent framework that supports speech synthesis, multimodal, and extensible Function Call plugin system. Supports one-click free deployment of your private ChatGPT/LLM web application.",
  "keywords": [
    "framework",
@@ -2,6 +2,7 @@ import type {
  AiProviderDetailItem,
  AiProviderListItem,
  AiProviderRuntimeConfig,
+  AiProviderRuntimeState,
  EnabledProvider,
 } from '@lobechat/types';
 import { AiProviderModelListItem, EnabledAiModel, ExtendParamsType } from 'model-bank';
@@ -1774,4 +1775,55 @@ describe('AiInfraRepos', () => {
      });
    });
  });
+
+  describe('AiInfraRepos.tryMatchingProviderFrom', () => {
+    const createRuntimeState = (models: EnabledAiModel[]): AiProviderRuntimeState => ({
+      enabledAiModels: models,
+      enabledAiProviders: [],
+      enabledChatAiProviders: [],
+      enabledImageAiProviders: [],
+      runtimeConfig: {},
+    });
+
+    it('prefers provider order when multiple providers have model', async () => {
+      const runtimeState = createRuntimeState([
+        { abilities: {}, enabled: true, id: 'm-1', type: 'chat', providerId: 'provider-b' },
+        { abilities: {}, enabled: true, id: 'm-1', type: 'chat', providerId: 'provider-a' },
+      ]);
+
+      const providerId = await AiInfraRepos.tryMatchingProviderFrom(runtimeState, {
+        modelId: 'm-1',
+        preferredProviders: ['provider-b', 'provider-a'],
+      });
+
+      expect(providerId).toBe('provider-b');
+    });
+
+    it('ignores disabled models when matching', async () => {
+      const runtimeState = createRuntimeState([
+        { abilities: {}, enabled: false, id: 'm-1', type: 'chat', providerId: 'provider-disabled' },
+        { abilities: {}, enabled: true, id: 'm-1', type: 'chat', providerId: 'provider-a' },
+      ]);
+
+      const providerId = await AiInfraRepos.tryMatchingProviderFrom(runtimeState, {
+        modelId: 'm-1',
+        preferredProviders: ['provider-disabled', 'provider-a'],
+      });
+
+      expect(providerId).toBe('provider-a');
+    });
+
+    it('falls back to provided fallback provider when no match', async () => {
+      const warnSpy = vi.spyOn(console, 'warn').mockImplementation(() => {});
+      const runtimeState = createRuntimeState([]);
+
+      const providerId = await AiInfraRepos.tryMatchingProviderFrom(runtimeState, {
+        modelId: 'm-1',
+        fallbackProvider: 'provider-fallback',
+      });
+
+      expect(providerId).toBe('provider-fallback');
+      warnSpy.mockRestore();
+    });
+  });
 });
@@ -24,6 +24,8 @@ import { LobeChatDatabase } from '../../type';

 type DecryptUserKeyVaults = (encryptKeyVaultsStr: string | null) => Promise<any>;

+const normalizeProvider = (provider: string) => provider.toLowerCase();
+
 /**
 * Provider-level search defaults (only used when built-in models don't provide settings.searchImpl and settings.searchProvider)
 * Note: Not stored in DB, only injected during read
@@ -282,6 +284,107 @@ export class AiInfraRepos {
    };
  };

+  /**
+   * Resolve the best provider for a given model.
+   *
+   * Matching pipeline:
+   * 1) Build a map of provider -> enabled model ids (disabled models are ignored).
+   * 2) Walk providers in priority order: preferred providers (if any) -> explicit fallback provider -> remaining providers that have enabled models.
+   * 3) For each provider, look for an exact modelId match or any preferred model alias.
+   * 4) If nothing matches, fall back to the configured provider (with a warning) or throw when no fallback exists.
+   *
+   * Handles:
+   * - Preferred provider ordering (case-insensitive).
+   * - Preferred model aliases.
+   * - Disabled models are skipped.
+   * - Missing matches: falls back when possible, otherwise surfaces an error.
+   *
+   * Edge cases to note:
+   * - If preferredProviders are set, non-preferred providers are skipped unless they are also the explicit fallback.
+   * - If fallbackProvider lacks enabled models, it is still returned (caller should ensure runtimeConfig has credentials).
+   */
+  static async tryMatchingProviderFrom(
+    runtimeState: AiProviderRuntimeState,
+    options: {
+      fallbackProvider?: string;
+      label?: string;
+      modelId: string;
+      preferredModels?: string[];
+      preferredProviders?: string[];
+    },
+  ): Promise<string> {
+    const { modelId, fallbackProvider, preferredModels, preferredProviders, label } = options;
+
+    // Build a map of provider -> enabled model ids for quick membership checks; skip disabled models entirely
+    const providerModels = runtimeState.enabledAiModels.reduce<Record<string, Set<string>>>(
+      (acc, model) => {
+        if (model.enabled === false) return acc;
+
+        const providerId = normalizeProvider(model.providerId);
+        acc[providerId] = acc[providerId] || new Set<string>();
+        acc[providerId].add(model.id);
+
+        return acc;
+      },
+      {},
+    );
+
+    // Normalize preferred providers so ordering is stable and comparisons are case-insensitive
+    const normalizedPreferredProviders = (preferredProviders || [])
+      .map(normalizeProvider)
+      .filter(Boolean);
+
+    // Provider search pipeline:
+    // 1) iterate preferred providers (if given)
+    // 2) fall back to the explicitly configured fallback provider
+    // 3) consider any provider that has enabled models
+    const providerOrder = Array.from(
+      new Set(
+        [
+          ...normalizedPreferredProviders,
+          fallbackProvider ? normalizeProvider(fallbackProvider) : undefined,
+          ...Object.keys(providerModels),
+        ].filter(Boolean) as string[],
+      ),
+    );
+
+    // Candidate models include the requested modelId plus any preferred model aliases
+    const modelTargets = new Set([modelId, ...(preferredModels || [])]);
+
+    for (const providerId of providerOrder) {
+      // If preferred providers are specified, skip non-preferred providers unless they are the explicit fallback
+      if (
+        normalizedPreferredProviders.length > 0 &&
+        providerId !== normalizeProvider(fallbackProvider || '') &&
+        !normalizedPreferredProviders.includes(providerId)
+      ) {
+        continue;
+      }
+
+      const models = providerModels[providerId];
+      if (!models) {
+        continue;
+      }
+
+      // Accept the first provider in order whose enabled models contain either the requested id or any preferred alias
+      const match = Array.from(modelTargets).find((target) => models.has(target));
+      if (match) {
+        return providerId;
+      }
+    }
+
+    if (fallbackProvider) {
+      console.warn(
+        `[ai-infra] no enabled provider found for ${label || 'model'} "${modelId}" (preferred ${preferredProviders}), falling back to server-configured provider "${fallbackProvider}".`,
+      );
+      return normalizeProvider(fallbackProvider);
+    }
+
+    throw new Error(
+      `Unable to resolve provider for ${label || 'model'} "${modelId}". Check preferred providers/models configuration.`,
+    );
+  }
+
  getAiProviderModelList = async (
    providerId: string,
    options?: {
@@ -1,27 +1,6 @@
 import { AIChatModelCard } from '../types/aiModel';

 const cerebrasModels: AIChatModelCard[] = [
-  {
-    abilities: {
-      functionCall: true,
-      reasoning: true,
-      structuredOutput: true,
-    },
-    contextWindowTokens: 131_072,
-    description:
-      'Performs well on coding and reasoning tasks, supports streaming and tool calls, and fits agentic coding and complex reasoning.',
-    displayName: 'GLM-4.6',
-    enabled: true,
-    id: 'zai-glm-4.6',
-    maxOutput: 40_000,
-    pricing: {
-      units: [
-        { name: 'textInput', rate: 2.25, strategy: 'fixed', unit: 'millionTokens' },
-        { name: 'textOutput', rate: 2.75, strategy: 'fixed', unit: 'millionTokens' },
-      ],
-    },
-    type: 'chat',
-  },
  {
    abilities: {
      functionCall: true,
@@ -96,7 +75,8 @@ const cerebrasModels: AIChatModelCard[] = [
      functionCall: true,
    },
    contextWindowTokens: 32_768,
-    description: 'Llama 3.1 8B: a small, low-latency Llama variant for lightweight online inference and chat.',
+    description:
+      'Llama 3.1 8B: a small, low-latency Llama variant for lightweight online inference and chat.',
    displayName: 'Llama 3.1 8B',
    id: 'llama3.1-8b',
    pricing: {
@@ -1,4 +1,4 @@
-import { CHAT_MODEL_IMAGE_GENERATION_PARAMS, ModelParamsSchema } from '../standard-parameters';
+import { ModelParamsSchema } from '../standard-parameters';
 import { AIChatModelCard, AIImageModelCard } from '../types';

 /**
@@ -485,32 +485,6 @@ const googleChatModels: AIChatModelCard[] = [
    },
    type: 'chat',
  },
-  {
-    abilities: {
-      imageOutput: true,
-      vision: true,
-    },
-    contextWindowTokens: 32_768 + 8192,
-    description:
-      'Nano Banana is Google’s newest, fastest, and most efficient native multimodal model, enabling conversational image generation and editing.',
-    displayName: 'Nano Banana (Preview)',
-    id: 'gemini-2.5-flash-image-preview',
-    maxOutput: 8192,
-    pricing: {
-      approximatePricePerImage: 0.039,
-      units: [
-        { name: 'textInput', rate: 0.3, strategy: 'fixed', unit: 'millionTokens' },
-        { name: 'imageInput', rate: 0.3, strategy: 'fixed', unit: 'millionTokens' },
-        { name: 'textOutput', rate: 2.5, strategy: 'fixed', unit: 'millionTokens' },
-        { name: 'imageOutput', rate: 30, strategy: 'fixed', unit: 'millionTokens' },
-      ],
-    },
-    releasedAt: '2025-08-26',
-    settings: {
-      extendParams: ['imageAspectRatio'],
-    },
-    type: 'chat',
-  },
  {
    abilities: {
      functionCall: true,
@@ -967,23 +941,6 @@ const googleImageModels: AIImageModelCard[] = [
      ],
    },
  },
-  {
-    displayName: 'Nano Banana (Preview)',
-    id: 'gemini-2.5-flash-image-preview:image',
-    type: 'image',
-    description:
-      'Nano Banana is Google’s newest, fastest, and most efficient native multimodal model, enabling conversational image generation and editing.',
-    releasedAt: '2025-08-26',
-    parameters: CHAT_MODEL_IMAGE_GENERATION_PARAMS,
-    pricing: {
-      approximatePricePerImage: 0.039,
-      units: [
-        { name: 'textInput', rate: 0.3, strategy: 'fixed', unit: 'millionTokens' },
-        { name: 'textOutput', rate: 2.5, strategy: 'fixed', unit: 'millionTokens' },
-        { name: 'imageOutput', rate: 30, strategy: 'fixed', unit: 'millionTokens' },
-      ],
-    },
-  },
  {
    displayName: 'Imagen 4',
    id: 'imagen-4.0-generate-001',
@@ -79,7 +79,8 @@ const nvidiaChatModels: AIChatModelCard[] = [
      vision: true,
    },
    contextWindowTokens: 128_000,
-    description: 'A frontier vision-language model that excels at high-quality reasoning from images.',
+    description:
+      'A frontier vision-language model that excels at high-quality reasoning from images.',
    displayName: 'Llama 3.2 11B Vision Instruct',
    id: 'meta/llama-3.2-11b-vision-instruct',
    type: 'chat',
@@ -89,7 +90,8 @@ const nvidiaChatModels: AIChatModelCard[] = [
      vision: true,
    },
    contextWindowTokens: 128_000,
-    description: 'A frontier vision-language model that excels at high-quality reasoning from images.',
+    description:
+      'A frontier vision-language model that excels at high-quality reasoning from images.',
    displayName: 'Llama 3.2 90B Vision Instruct',
    id: 'meta/llama-3.2-90b-vision-instruct',
    type: 'chat',
@@ -151,41 +153,35 @@ const nvidiaChatModels: AIChatModelCard[] = [
  },
  {
    contextWindowTokens: 8192,
-    description: 'A frontier text generation model strong in understanding, transformation, and code generation.',
+    description:
+      'A frontier text generation model strong in understanding, transformation, and code generation.',
    displayName: 'Gemma 2 9B Instruct',
    id: 'google/gemma-2-9b-it',
    type: 'chat',
  },
  {
    contextWindowTokens: 8192,
-    description: 'A frontier text generation model strong in understanding, transformation, and code generation.',
+    description:
+      'A frontier text generation model strong in understanding, transformation, and code generation.',
    displayName: 'Gemma 2 27B Instruct',
    id: 'google/gemma-2-27b-it',
    type: 'chat',
  },
-  {
-    abilities: {
-      reasoning: true,
-    },
-    contextWindowTokens: 128_000,
-    description: 'A state-of-the-art efficient LLM strong in reasoning, math, and programming.',
-    displayName: 'DeepSeek R1',
-    id: 'deepseek-ai/deepseek-r1',
-    type: 'chat',
-  },
  {
    abilities: {
      functionCall: true,
    },
    contextWindowTokens: 32_768,
-    description: 'A bilingual LLM for Chinese and English across language, coding, math, and reasoning.',
+    description:
+      'A bilingual LLM for Chinese and English across language, coding, math, and reasoning.',
    displayName: 'Qwen2.5 7B Instruct',
    id: 'qwen/qwen2.5-7b-instruct',
    type: 'chat',
  },
  {
    contextWindowTokens: 32_768,
-    description: 'A strong mid-sized code model with 32K context, excelling at multilingual programming.',
+    description:
+      'A strong mid-sized code model with 32K context, excelling at multilingual programming.',
    displayName: 'Qwen2.5 Coder 7B Instruct',
    id: 'qwen/qwen2.5-coder-7b-instruct',
    type: 'chat',
@@ -2,6 +2,26 @@ import { AIChatModelCard, AIImageModelCard } from '../types/aiModel';

 // https://siliconflow.cn/zh-cn/models
 const siliconcloudChatModels: AIChatModelCard[] = [
+  {
+    abilities: {
+      functionCall: true,
+      reasoning: true,
+    },
+    contextWindowTokens: 192_000,
+    description:
+      'MiniMax-M2.1 is an open-source large language model optimized for agent capabilities, excelling in programming, tool usage, instruction following, and long-term planning. The model supports multilingual software development and complex multi-step workflow execution, achieving a score of 74.0 on SWE-bench Verified and surpassing Claude Sonnet 4.5 in multilingual scenarios.',
+    displayName: 'MiniMax-M2.1 (Pro)',
+    id: 'Pro/MiniMaxAI/MiniMax-M2.1',
+    pricing: {
+      currency: 'CNY',
+      units: [
+        { name: 'textInput', rate: 2.1, strategy: 'fixed', unit: 'millionTokens' },
+        { name: 'textOutput', rate: 8.4, strategy: 'fixed', unit: 'millionTokens' },
+      ],
+    },
+    releasedAt: '2025-12-23',
+    type: 'chat',
+  },
  {
    abilities: {
      functionCall: true,
@@ -117,6 +117,75 @@ const doubaoChatModels: AIChatModelCard[] = [
    },
    type: 'chat',
  },
+  {
+    abilities: {
+      functionCall: true,
+      reasoning: true,
+    },
+    config: {
+      deploymentName: 'glm-4-7-251222',
+    },
+    contextWindowTokens: 200_000,
+    description:
+      'GLM-4.7 is the latest flagship model from Zhipu AI. GLM-4.7 enhances coding capabilities, long-term task planning, and tool collaboration for Agentic Coding scenarios, achieving leading performance among open-source models in multiple public benchmarks. General capabilities are improved, with more concise and natural responses, and more immersive writing. In complex agent tasks, instruction following is stronger during tool calls, and the aesthetics of Artifacts and Agentic Coding frontend, as well as long-term task completion efficiency, are further enhanced. • Stronger programming capabilities: Significantly improved multi-language coding and terminal agent performance; GLM-4.7 can now implement "think first, then act" mechanisms in programming frameworks like Claude Code, Kilo Code, TRAE, Cline, and Roo Code, with more stable performance on complex tasks. • Frontend aesthetics improvement: GLM-4.7 shows significant progress in frontend generation quality, capable of generating websites, PPTs, and posters with better visual appeal. • Stronger tool calling capabilities: GLM-4.7 enhances tool calling abilities, scoring 67 in BrowseComp web task evaluation; achieving 84.7 in τ²-Bench interactive tool calling evaluation, surpassing Claude Sonnet 4.5 as the open-source SOTA. • Reasoning capability improvement: Significantly enhanced math and reasoning abilities, scoring 42.8% in the HLE ("Humanity\'s Last Exam") benchmark, a 41% improvement over GLM-4.6, surpassing GPT-5.1. • General capability enhancement: GLM-4.7 conversations are more concise, intelligent, and humane; writing and role-playing are more literary and immersive.',
+    displayName: 'GLM-4.7',
+    id: 'glm-4-7',
+    maxOutput: 128_000,
+    pricing: {
+      currency: 'CNY',
+      units: [
+        {
+          lookup: {
+            prices: {
+              '[0, 0.032]_[0, 0.0002]': 2,
+              '[0, 0.032]_[0.0002, infinity]': 3,
+              '[0.032, 0.2]_[0, infinity]': 4,
+            },
+            pricingParams: ['textInputRange', 'textOutputRange'],
+          },
+          name: 'textInput',
+          strategy: 'lookup',
+          unit: 'millionTokens',
+        },
+        {
+          lookup: {
+            prices: {
+              '[0, 0.032]_[0, 0.0002]': 8,
+              '[0, 0.032]_[0.0002, infinity]': 14,
+              '[0.032, 0.2]_[0, infinity]': 16,
+            },
+            pricingParams: ['textInputRange', 'textOutputRange'],
+          },
+          name: 'textOutput',
+          strategy: 'lookup',
+          unit: 'millionTokens',
+        },
+        {
+          lookup: {
+            prices: {
+              '[0, 0.032]_[0, 0.0002]': 0.4,
+              '[0, 0.032]_[0.0002, infinity]': 0.6,
+              '[0.032, 0.2]_[0, infinity]': 0.8,
+            },
+            pricingParams: ['textInputRange', 'textOutputRange'],
+          },
+          name: 'textInput_cacheRead',
+          strategy: 'lookup',
+          unit: 'millionTokens',
+        },
+        {
+          lookup: { prices: { '1h': 0.017 }, pricingParams: ['ttl'] },
+          name: 'textInput_cacheWrite',
+          strategy: 'lookup',
+          unit: 'millionTokens',
+        },
+      ],
+    },
+    settings: {
+      extendParams: ['enableReasoning'],
+    },
+    type: 'chat',
+  },
  {
    abilities: {
      functionCall: true,
@@ -193,7 +193,8 @@ const wenxinChatModels: AIChatModelCard[] = [
  },
  {
    contextWindowTokens: 131_072,
-    description: 'ERNIE Speed 128K is a no-I/O-fee model for long-text understanding and large-scale trials.',
+    description:
+      'ERNIE Speed 128K is a no-I/O-fee model for long-text understanding and large-scale trials.',
    displayName: 'ERNIE Speed 128K',
    id: 'ernie-speed-128k',
    maxOutput: 4096,
@@ -274,7 +275,8 @@ const wenxinChatModels: AIChatModelCard[] = [
  },
  {
    contextWindowTokens: 8192,
-    description: 'ERNIE Tiny 8K is ultra-lightweight for simple QA, classification, and low-cost inference.',
+    description:
+      'ERNIE Tiny 8K is ultra-lightweight for simple QA, classification, and low-cost inference.',
    displayName: 'ERNIE Tiny 8K',
    id: 'ernie-tiny-8k',
    maxOutput: 2048,
@@ -337,7 +339,8 @@ const wenxinChatModels: AIChatModelCard[] = [
  },
  {
    contextWindowTokens: 8192,
-    description: 'ERNIE Novel 8K is built for long-form novels and IP plots with multi-character narratives.',
+    description:
+      'ERNIE Novel 8K is built for long-form novels and IP plots with multi-character narratives.',
    displayName: 'ERNIE Novel 8K',
    id: 'ernie-novel-8k',
    maxOutput: 2048,
@@ -352,7 +355,8 @@ const wenxinChatModels: AIChatModelCard[] = [
  },
  {
    contextWindowTokens: 131_072,
-    description: 'ERNIE 4.5 0.3B is an open-source lightweight model for local and customized deployment.',
+    description:
+      'ERNIE 4.5 0.3B is an open-source lightweight model for local and customized deployment.',
    displayName: 'ERNIE 4.5 0.3B',
    id: 'ernie-4.5-0.3b',
    maxOutput: 8192,
@@ -443,7 +447,8 @@ const wenxinChatModels: AIChatModelCard[] = [
  },
  {
    contextWindowTokens: 32_768,
-    description: 'Qianfan 70B is a large Chinese model for high-quality generation and complex reasoning.',
+    description:
+      'Qianfan 70B is a large Chinese model for high-quality generation and complex reasoning.',
    displayName: 'Qianfan 70B',
    id: 'qianfan-70b',
    maxOutput: 16_384,
@@ -628,7 +633,8 @@ const wenxinChatModels: AIChatModelCard[] = [
      vision: true,
    },
    contextWindowTokens: 32_768,
-    description: 'Qianfan Composition is a multimodal creation model for mixed image-text understanding and generation.',
+    description:
+      'Qianfan Composition is a multimodal creation model for mixed image-text understanding and generation.',
    displayName: 'Qianfan Composition',
    id: 'qianfan-composition',
    maxOutput: 8192,
@@ -758,7 +764,8 @@ const wenxinChatModels: AIChatModelCard[] = [
      vision: true,
    },
    contextWindowTokens: 4096,
-    description: 'Qianfan EngCard VL is a multimodal recognition model focused on English scenarios.',
+    description:
+      'Qianfan EngCard VL is a multimodal recognition model focused on English scenarios.',
    displayName: 'Qianfan EngCard VL',
    id: 'qianfan-engcard-vl',
    maxOutput: 4000,
@@ -776,7 +783,8 @@ const wenxinChatModels: AIChatModelCard[] = [
      vision: true,
    },
    contextWindowTokens: 4096,
-    description: 'Qianfan SinglePicOCR is a single-image OCR model with high-accuracy character recognition.',
+    description:
+      'Qianfan SinglePicOCR is a single-image OCR model with high-accuracy character recognition.',
    displayName: 'Qianfan SinglePicOCR',
    id: 'qianfan-singlepicocr',
    maxOutput: 4096,
@@ -794,7 +802,8 @@ const wenxinChatModels: AIChatModelCard[] = [
      vision: true,
    },
    contextWindowTokens: 32_768,
-    description: 'InternVL3 38B is a large open-source multimodal model for high-accuracy image-text understanding.',
+    description:
+      'InternVL3 38B is a large open-source multimodal model for high-accuracy image-text understanding.',
    displayName: 'InternVL3 38B',
    id: 'internvl3-38b',
    maxOutput: 8192,
@@ -830,7 +839,8 @@ const wenxinChatModels: AIChatModelCard[] = [
      vision: true,
    },
    contextWindowTokens: 32_768,
-    description: 'InternVL3 1B is a lightweight multimodal model for resource-constrained deployment.',
+    description:
+      'InternVL3 1B is a lightweight multimodal model for resource-constrained deployment.',
    displayName: 'InternVL3 1B',
    id: 'internvl3-1b',
    maxOutput: 8192,
@@ -848,7 +858,8 @@ const wenxinChatModels: AIChatModelCard[] = [
      vision: true,
    },
    contextWindowTokens: 32_768,
-    description: 'InternVL2.5 38B MPO is a multimodal pretrained model for complex image-text reasoning.',
+    description:
+      'InternVL2.5 38B MPO is a multimodal pretrained model for complex image-text reasoning.',
    displayName: 'InternVL2.5 38B MPO',
    id: 'internvl2.5-38b-mpo',
    maxOutput: 4096,
@@ -1056,7 +1067,8 @@ const wenxinChatModels: AIChatModelCard[] = [
      vision: true,
    },
    contextWindowTokens: 65_536,
-    description: 'GLM-4.5V is a multimodal vision-language model for general image understanding and QA.',
+    description:
+      'GLM-4.5V is a multimodal vision-language model for general image understanding and QA.',
    displayName: 'GLM-4.5V',
    id: 'glm-4.5v',
    maxOutput: 16_384,
@@ -1096,7 +1108,8 @@ const wenxinChatModels: AIChatModelCard[] = [
      vision: true,
    },
    contextWindowTokens: 4096,
-    description: 'DeepSeek VL2 is a multimodal model for image-text understanding and fine-grained visual QA.',
+    description:
+      'DeepSeek VL2 is a multimodal model for image-text understanding and fine-grained visual QA.',
    displayName: 'DeepSeek VL2',
    id: 'deepseek-vl2',
    maxOutput: 2048,
@@ -1114,7 +1127,8 @@ const wenxinChatModels: AIChatModelCard[] = [
      vision: true,
    },
    contextWindowTokens: 4096,
-    description: 'DeepSeek VL2 Small is a lightweight multimodal version for resource-constrained and high-concurrency use.',
+    description:
+      'DeepSeek VL2 Small is a lightweight multimodal version for resource-constrained and high-concurrency use.',
    displayName: 'DeepSeek VL2 Small',
    id: 'deepseek-vl2-small',
    maxOutput: 2048,
@@ -1181,7 +1195,8 @@ const wenxinChatModels: AIChatModelCard[] = [
      search: true,
    },
    contextWindowTokens: 144_000,
-    description: 'DeepSeek V3.2 Think is a full deep-thinking model with stronger long-chain reasoning.',
+    description:
+      'DeepSeek V3.2 Think is a full deep-thinking model with stronger long-chain reasoning.',
    displayName: 'DeepSeek V3.2 Think',
    enabled: true,
    id: 'deepseek-v3.2-think',
@@ -1334,8 +1349,7 @@ const wenxinChatModels: AIChatModelCard[] = [
      reasoning: true,
    },
    contextWindowTokens: 32_768,
-    description:
-      'DeepSeek R1 Distill Llama 70B combines R1 reasoning with the Llama ecosystem.',
+    description: 'DeepSeek R1 Distill Llama 70B combines R1 reasoning with the Llama ecosystem.',
    displayName: 'DeepSeek R1 Distill Llama 70B',
    id: 'deepseek-r1-distill-llama-70b',
    maxOutput: 8192,
@@ -1440,7 +1454,8 @@ const wenxinChatModels: AIChatModelCard[] = [
      reasoning: true,
    },
    contextWindowTokens: 131_072,
-    description: 'Qwen3 235B A22B Thinking 2507 is an ultra-large thinking model for hard reasoning.',
+    description:
+      'Qwen3 235B A22B Thinking 2507 is an ultra-large thinking model for hard reasoning.',
    displayName: 'Qwen3 235B A22B Thinking 2507',
    id: 'qwen3-235b-a22b-thinking-2507',
    maxOutput: 32_768,
@@ -1675,7 +1690,8 @@ const wenxinChatModels: AIChatModelCard[] = [
  },
  {
    contextWindowTokens: 32_768,
-    description: 'Qwen3 8B is a lightweight model with flexible deployment for high-concurrency workloads.',
+    description:
+      'Qwen3 8B is a lightweight model with flexible deployment for high-concurrency workloads.',
    displayName: 'Qwen3 8B',
    id: 'qwen3-8b',
    maxOutput: 8192,
@@ -1729,7 +1745,8 @@ const wenxinChatModels: AIChatModelCard[] = [
  },
  {
    contextWindowTokens: 32_768,
-    description: 'Qwen3 0.6B is an entry-level model for simple reasoning and very constrained environments.',
+    description:
+      'Qwen3 0.6B is an entry-level model for simple reasoning and very constrained environments.',
    displayName: 'Qwen3 0.6B',
    id: 'qwen3-0.6b',
    maxOutput: 8192,
@@ -1747,7 +1764,8 @@ const wenxinChatModels: AIChatModelCard[] = [
  },
  {
    contextWindowTokens: 32_768,
-    description: 'Qwen2.5 7B Instruct is a mature open-source instruct model for multi-scenario chat and generation.',
+    description:
+      'Qwen2.5 7B Instruct is a mature open-source instruct model for multi-scenario chat and generation.',
    displayName: 'Qwen2.5 7B Instruct',
    id: 'qwen2.5-7b-instruct',
    maxOutput: 8192,
@@ -1760,22 +1778,6 @@ const wenxinChatModels: AIChatModelCard[] = [
    },
    type: 'chat',
  },
-  {
-    contextWindowTokens: 32_768,
-    description:
-      'GLM-4 32B 0414 is a general GLM model supporting multi-task text generation and understanding.',
-    displayName: 'GLM-4 32B 0414',
-    id: 'glm-4-32b-0414',
-    maxOutput: 8192,
-    pricing: {
-      currency: 'CNY',
-      units: [
-        { name: 'textInput', rate: 1, strategy: 'fixed', unit: 'millionTokens' },
-        { name: 'textOutput', rate: 4, strategy: 'fixed', unit: 'millionTokens' },
-      ],
-    },
-    type: 'chat',
-  },
 ];

 const wenxinImageModels: AIImageModelCard[] = [
@@ -1851,7 +1853,8 @@ const wenxinImageModels: AIImageModelCard[] = [
    type: 'image',
  },
  {
-    description: 'FLUX.1-schnell is a high-performance image generation model for fast multi-style outputs.',
+    description:
+      'FLUX.1-schnell is a high-performance image generation model for fast multi-style outputs.',
    displayName: 'FLUX.1-schnell',
    enabled: true,
    id: 'flux.1-schnell',
@@ -21,7 +21,7 @@ const zenmuxChatModels: AIChatModelCard[] = [
      'GPT-5.2 is a flagship model for coding and agentic workflows with stronger reasoning and long-context performance.',
    displayName: 'GPT-5.2',
    enabled: true,
-    id: 'gpt-5.2',
+    id: 'openai/gpt-5.2',
    maxOutput: 128_000,
    pricing: {
      units: [
@@ -48,7 +48,7 @@ const zenmuxChatModels: AIChatModelCard[] = [
    description:
      'GPT-5.2 Pro: a smarter, more precise GPT-5.2 variant (Responses API only), suited for harder problems and longer multi-turn reasoning.',
    displayName: 'GPT-5.2 pro',
-    id: 'gpt-5.2-pro',
+    id: 'openai/gpt-5.2-pro',
    maxOutput: 128_000,
    pricing: {
      units: [
@@ -69,10 +69,10 @@ const zenmuxChatModels: AIChatModelCard[] = [
    },
    contextWindowTokens: 128_000,
    description:
-      'GPT-5.2 Chat is the ChatGPT variant (chat-latest) for experiencing the newest conversation improvements.',
+      'GPT-5.2 Chat is the ChatGPT variant for experiencing the newest conversation improvements.',
    displayName: 'GPT-5.2 Chat',
    enabled: true,
-    id: 'gpt-5.2-chat-latest',
+    id: 'openai/gpt-5.2-chat',
    maxOutput: 16_384,
    pricing: {
      units: [
@@ -67,6 +67,60 @@ const zhipuChatModels: AIChatModelCard[] = [
    },
    type: 'chat',
  },
+  {
+    abilities: {
+      functionCall: true,
+      reasoning: true,
+      search: true,
+    },
+    contextWindowTokens: 200_000,
+    description:
+      'GLM-4.7-Flash, as a 30B-level SOTA model, offers a new choice that balances performance and efficiency. It enhances coding capabilities, long-term task planning, and tool collaboration for Agentic Coding scenarios, achieving leading performance among open-source models of the same size in multiple current benchmark leaderboards. In executing complex intelligent agent tasks, it has stronger instruction compliance during tool calls, and further improves the aesthetics of front-end and the efficiency of long-term task completion for Artifacts and Agentic Coding.',
+    displayName: 'GLM-4.7-Flash',
+    enabled: true,
+    id: 'glm-4.7-flash',
+    maxOutput: 131_072,
+    pricing: {
+      currency: 'CNY',
+      units: [
+        { name: 'textInput_cacheRead', rate: 0, strategy: 'fixed', unit: 'millionTokens' },
+        { name: 'textInput', rate: 0, strategy: 'fixed', unit: 'millionTokens' },
+        { name: 'textOutput', rate: 0, strategy: 'fixed', unit: 'millionTokens' },
+      ],
+    },
+    settings: {
+      extendParams: ['enableReasoning'],
+      searchImpl: 'params',
+    },
+    type: 'chat',
+  },
+  {
+    abilities: {
+      functionCall: true,
+      reasoning: true,
+      search: true,
+    },
+    contextWindowTokens: 200_000,
+    description:
+      'GLM-4.7-Flash, as a 30B-level SOTA model, offers a new choice that balances performance and efficiency. It enhances coding capabilities, long-term task planning, and tool collaboration for Agentic Coding scenarios, achieving leading performance among open-source models of the same size in multiple current benchmark leaderboards. In executing complex intelligent agent tasks, it has stronger instruction compliance during tool calls, and further improves the aesthetics of front-end and the efficiency of long-term task completion for Artifacts and Agentic Coding.',
+    displayName: 'GLM-4.7-FlashX',
+    enabled: true,
+    id: 'glm-4.7-flashx',
+    maxOutput: 131_072,
+    pricing: {
+      currency: 'CNY',
+      units: [
+        { name: 'textInput_cacheRead', rate: 0.1, strategy: 'fixed', unit: 'millionTokens' },
+        { name: 'textInput', rate: 0.5, strategy: 'fixed', unit: 'millionTokens' },
+        { name: 'textOutput', rate: 3, strategy: 'fixed', unit: 'millionTokens' },
+      ],
+    },
+    settings: {
+      extendParams: ['enableReasoning'],
+      searchImpl: 'params',
+    },
+    type: 'chat',
+  },
  {
    abilities: {
      functionCall: true,
@@ -433,32 +487,6 @@ const zhipuChatModels: AIChatModelCard[] = [
    },
    type: 'chat',
  },
-  {
-    abilities: {
-      functionCall: true,
-      reasoning: true,
-      search: true,
-    },
-    contextWindowTokens: 131_072,
-    description: 'Free GLM-4.5 tier with strong performance in reasoning, coding, and agent tasks.',
-    displayName: 'GLM-4.5-Flash',
-    enabled: true,
-    id: 'glm-4.5-flash',
-    maxOutput: 98_304,
-    pricing: {
-      currency: 'CNY',
-      units: [
-        { name: 'textInput_cacheRead', rate: 0, strategy: 'fixed', unit: 'millionTokens' },
-        { name: 'textInput', rate: 0, strategy: 'fixed', unit: 'millionTokens' },
-        { name: 'textOutput', rate: 0, strategy: 'fixed', unit: 'millionTokens' },
-      ],
-    },
-    settings: {
-      extendParams: ['enableReasoning'],
-      searchImpl: 'params',
-    },
-    type: 'chat',
-  },
  {
    abilities: {
      reasoning: true,
@@ -567,7 +595,8 @@ const zhipuChatModels: AIChatModelCard[] = [
      search: true,
    },
    contextWindowTokens: 131_072,
-    description: 'Fast and low-cost: Flash-enhanced with ultra-fast reasoning and higher concurrency.',
+    description:
+      'Fast and low-cost: Flash-enhanced with ultra-fast reasoning and higher concurrency.',
    displayName: 'GLM-Z1-FlashX',
    id: 'glm-z1-flashx',
    maxOutput: 32_768,
@@ -789,7 +818,8 @@ const zhipuChatModels: AIChatModelCard[] = [
      vision: true,
    },
    contextWindowTokens: 16_000,
-    description: 'GLM-4V-Plus understands video and multiple images, suitable for multimodal tasks.',
+    description:
+      'GLM-4V-Plus understands video and multiple images, suitable for multimodal tasks.',
    displayName: 'GLM-4V-Plus-0111',
    id: 'glm-4v-plus-0111',
    pricing: {
@@ -259,6 +259,33 @@ export interface AiModelSettings {
  searchProvider?: string;
 }

+export const ExtendParamsTypeSchema = z.enum([
+  'reasoningBudgetToken',
+  'enableReasoning',
+  'disableContextCaching',
+  'reasoningEffort',
+  'gpt5ReasoningEffort',
+  'gpt5_1ReasoningEffort',
+  'gpt5_2ReasoningEffort',
+  'gpt5_2ProReasoningEffort',
+  'textVerbosity',
+  'thinking',
+  'thinkingBudget',
+  'thinkingLevel',
+  'thinkingLevel2',
+  'imageAspectRatio',
+  'imageResolution',
+  'urlContext',
+]);
+
+export const ModelSearchImplementTypeSchema = z.enum(['tool', 'params', 'internal']);
+
+export const AiModelSettingsSchema = z.object({
+  extendParams: z.array(ExtendParamsTypeSchema).optional(),
+  searchImpl: ModelSearchImplementTypeSchema.optional(),
+  searchProvider: z.string().optional(),
+});
+
 export interface AIChatModelCard extends AIBaseModelCard {
  abilities?: ModelAbilities;
  config?: AiModelConfig;
@@ -344,6 +371,7 @@ export const CreateAiModelSchema = z.object({
  id: z.string(),
  providerId: z.string(),
  releasedAt: z.string().optional(),
+  settings: AiModelSettingsSchema.optional(),
  type: AiModelTypeSchema.optional(),

  // checkModel: z.string().optional(),
@@ -380,6 +408,7 @@ export const UpdateAiModelSchema = z.object({
    .optional(),
  contextWindowTokens: z.number().nullable().optional(),
  displayName: z.string().nullable().optional(),
+  settings: AiModelSettingsSchema.optional(),
  type: AiModelTypeSchema.optional(),
 });

@@ -472,12 +472,14 @@ export const createTokenSpeedCalculator = (
    // - text/reasoning: standard text output events
    // - content_part/reasoning_part: multimodal output events used by Gemini 3+ models
    //   which emit structured parts instead of plain text events
+    // - tool_calls: function calling output events
    if (
      !outputStartAt &&
      (chunk.type === 'text' ||
        chunk.type === 'reasoning' ||
        chunk.type === 'content_part' ||
-        chunk.type === 'reasoning_part')
+        chunk.type === 'reasoning_part' ||
+        chunk.type === 'tool_calls')
    ) {
      outputStartAt = Date.now();
    }
@@ -179,7 +179,7 @@ describe('computeChatPricing', () => {

    it('supports multi-modal fixed units for Gemini 2.5 Flash Image Preview', () => {
      const pricing = googleChatModels.find(
-        (model: { id: string }) => model.id === 'gemini-2.5-flash-image-preview',
+        (model: { id: string }) => model.id === 'gemini-2.5-flash-image',
      )?.pricing;
      expect(pricing).toBeDefined();

@@ -207,7 +207,7 @@ describe('computeChatPricing', () => {

    it('handles multi-modal image generation for Nano Banana', () => {
      const pricing = googleChatModels.find(
-        (model: { id: string }) => model.id === 'gemini-2.5-flash-image-preview',
+        (model: { id: string }) => model.id === 'gemini-2.5-flash-image',
      )?.pricing;
      expect(pricing).toBeDefined();

@@ -18,6 +18,7 @@ export { LobeComfyUI } from './providers/comfyui';
 export { LobeDeepSeekAI } from './providers/deepseek';
 export { LobeGoogleAI } from './providers/google';
 export { LobeGroq } from './providers/groq';
+export { LobeHubAI } from './providers/lobehub';
 export { LobeMinimaxAI } from './providers/minimax';
 export { LobeMistralAI } from './providers/mistral';
 export { LobeMoonshotAI } from './providers/moonshot';
@@ -36,7 +37,6 @@ export { LobeXiaomiMiMoAI } from './providers/xiaomimimo';
 export { LobeZenMuxAI } from './providers/zenmux';
 export { LobeZeroOneAI } from './providers/zeroone';
 export { LobeZhipuAI } from './providers/zhipu';
-export { LobeHubAI } from './providers/lobehub';
 export * from './types';
 export * from './types/error';
 export { consumeStreamUntilDone } from './utils/consumeStream';
@@ -12,7 +12,7 @@ const noImageErrorType = 'ProviderNoImageGenerated';
 const invalidErrorType = 'InvalidProviderAPIKey';

 // Mock the console.error to avoid polluting test output
-vi.spyOn(console, 'error').mockImplementation(() => {});
+vi.spyOn(console, 'error').mockImplementation(() => { });

 let mockClient: GoogleGenAI;

@@ -361,7 +361,7 @@ describe('createGoogleImage', () => {
      vi.spyOn(mockClient.models, 'generateContent').mockResolvedValue(mockContentResponse as any);

      const payload: CreateImagePayload = {
-        model: 'gemini-2.5-flash-image-preview:image',
+        model: 'gemini-2.5-flash-image:image',
        params: {
          prompt: 'Create a beautiful sunset landscape',
        },
@@ -378,7 +378,7 @@ describe('createGoogleImage', () => {
            parts: [{ text: 'Create a beautiful sunset landscape' }],
          },
        ],
-        model: 'gemini-2.5-flash-image-preview',
+        model: 'gemini-2.5-flash-image',
        config: {
          responseModalities: ['Image'],
        },
@@ -414,7 +414,7 @@ describe('createGoogleImage', () => {
      vi.spyOn(mockClient.models, 'generateContent').mockResolvedValue(mockContentResponse as any);

      const payload: CreateImagePayload = {
-        model: 'gemini-2.5-flash-image-preview:image',
+        model: 'gemini-2.5-flash-image:image',
        params: {
          prompt: 'Add a red rose to this image',
          imageUrl: `data:image/png;base64,${inputImageBase64}`,
@@ -440,7 +440,7 @@ describe('createGoogleImage', () => {
            ],
          },
        ],
-        model: 'gemini-2.5-flash-image-preview',
+        model: 'gemini-2.5-flash-image',
        config: {
          responseModalities: ['Image'],
        },
@@ -482,7 +482,7 @@ describe('createGoogleImage', () => {
      vi.spyOn(mockClient.models, 'generateContent').mockResolvedValue(mockContentResponse as any);

      const payload: CreateImagePayload = {
-        model: 'gemini-2.5-flash-image-preview:image',
+        model: 'gemini-2.5-flash-image:image',
        params: {
          prompt: 'Change the background to blue sky',
          imageUrl: 'https://example.com/image.jpg',
@@ -511,7 +511,7 @@ describe('createGoogleImage', () => {
            ],
          },
        ],
-        model: 'gemini-2.5-flash-image-preview',
+        model: 'gemini-2.5-flash-image',
        config: {
          responseModalities: ['Image'],
        },
@@ -545,7 +545,7 @@ describe('createGoogleImage', () => {
      vi.spyOn(mockClient.models, 'generateContent').mockResolvedValue(mockContentResponse as any);

      const payload: CreateImagePayload = {
-        model: 'gemini-2.5-flash-image-preview:image',
+        model: 'gemini-2.5-flash-image:image',
        params: {
          prompt: 'Generate a colorful abstract pattern',
          imageUrl: null,
@@ -563,7 +563,7 @@ describe('createGoogleImage', () => {
            parts: [{ text: 'Generate a colorful abstract pattern' }],
          },
        ],
-        model: 'gemini-2.5-flash-image-preview',
+        model: 'gemini-2.5-flash-image',
        config: {
          responseModalities: ['Image'],
        },
@@ -594,7 +594,7 @@ describe('createGoogleImage', () => {
        );

        const payload: CreateImagePayload = {
-          model: 'gemini-2.5-flash-image-preview:image',
+          model: 'gemini-2.5-flash-image:image',
          params: {
            prompt: 'Create inappropriate content',
          },
@@ -619,7 +619,7 @@ describe('createGoogleImage', () => {
        );

        const payload: CreateImagePayload = {
-          model: 'gemini-2.5-flash-image-preview:image',
+          model: 'gemini-2.5-flash-image:image',
          params: {
            prompt: 'Generate an image',
          },
@@ -637,7 +637,7 @@ describe('createGoogleImage', () => {
      it('should throw error for unsupported image URL format', async () => {
        // Arrange
        const payload: CreateImagePayload = {
-          model: 'gemini-2.5-flash-image-preview:image',
+          model: 'gemini-2.5-flash-image:image',
          params: {
            prompt: 'Edit this image',
            imageUrl: 'ftp://example.com/image.jpg',
@@ -34,6 +34,7 @@ beforeEach(() => {
 });

 afterEach(() => {
+  vi.unstubAllGlobals();
  vi.clearAllMocks();
 });

@@ -333,6 +334,107 @@ describe('LobeOpenRouterAI - custom features', () => {
        expect.anything(),
      );
    });
+
+    it('should map thinkingLevel to reasoning effort', async () => {
+      await instance.chat({
+        messages: [{ content: 'Think level', role: 'user' }],
+        model: 'openai/gpt-4',
+        thinkingLevel: 'medium',
+      } as any);
+
+      expect(instance['client'].chat.completions.create).toHaveBeenCalledWith(
+        expect.objectContaining({ reasoning: { effort: 'medium' } }),
+        expect.anything(),
+      );
+    });
+  });
+
+  describe('models mapping', () => {
+    it('should map extendParams for gpt-5.x reasoning and verbosity', async () => {
+      const mockModels = [
+        {
+          architecture: { input_modalities: ['text'] },
+          created: 1_700_000_000,
+          description: 'Test model',
+          id: 'openai/gpt-5.2-mini',
+          name: 'openai/gpt-5.2-mini',
+          pricing: { completion: '0.00001', prompt: '0.00001' },
+          supported_parameters: ['reasoning'],
+          top_provider: { context_length: 8192, max_completion_tokens: 1024 },
+        },
+        {
+          architecture: { input_modalities: ['text'] },
+          created: 1_700_000_000,
+          description: 'Test model',
+          id: 'openai/gpt-5.1-mini',
+          name: 'openai/gpt-5.1-mini',
+          pricing: { completion: '0.00001', prompt: '0.00001' },
+          supported_parameters: ['reasoning'],
+          top_provider: { context_length: 8192, max_completion_tokens: 1024 },
+        },
+      ];
+
+      vi.stubGlobal(
+        'fetch',
+        vi.fn().mockResolvedValue({
+          ok: true,
+          json: async () => ({ data: mockModels }),
+        } as any),
+      );
+
+      const models = await params.models();
+      const gpt52 = models.find((m) => m.id === 'openai/gpt-5.2-mini');
+      const gpt51 = models.find((m) => m.id === 'openai/gpt-5.1-mini');
+
+      expect(gpt52?.settings?.extendParams).toEqual(
+        expect.arrayContaining(['gpt5_2ReasoningEffort', 'textVerbosity']),
+      );
+      expect(gpt51?.settings?.extendParams).toEqual(
+        expect.arrayContaining(['gpt5_1ReasoningEffort', 'textVerbosity']),
+      );
+    });
+
+    it('should map thinkingLevel for gemini-3 flash/pro reasoning', async () => {
+      const mockModels = [
+        {
+          architecture: { input_modalities: ['text'] },
+          created: 1_700_000_000,
+          description: 'Test model',
+          id: 'google/gemini-3-pro',
+          name: 'google/gemini-3-pro',
+          pricing: { completion: '0.00001', prompt: '0.00001' },
+          supported_parameters: ['reasoning'],
+          top_provider: { context_length: 8192, max_completion_tokens: 1024 },
+        },
+        {
+          architecture: { input_modalities: ['text'] },
+          created: 1_700_000_000,
+          description: 'Test model',
+          id: 'google/gemini-3-flash',
+          name: 'google/gemini-3-flash',
+          pricing: { completion: '0.00001', prompt: '0.00001' },
+          supported_parameters: ['reasoning'],
+          top_provider: { context_length: 8192, max_completion_tokens: 1024 },
+        },
+      ];
+
+      vi.stubGlobal(
+        'fetch',
+        vi.fn().mockResolvedValue({
+          ok: true,
+          json: async () => ({ data: mockModels }),
+        } as any),
+      );
+
+      const models = await params.models();
+      const geminiPro = models.find((m) => m.id === 'google/gemini-3-pro');
+      const geminiFlash = models.find((m) => m.id === 'google/gemini-3-flash');
+
+      expect(geminiPro?.settings?.extendParams).toEqual(expect.arrayContaining(['thinkingLevel2']));
+      expect(geminiFlash?.settings?.extendParams).toEqual(
+        expect.arrayContaining(['thinkingLevel']),
+      );
+    });
  });

  describe('models', () => {
@@ -17,11 +17,11 @@ export const params = {
  chatCompletion: {
    handlePayload: (payload) => {
      // eslint-disable-next-line @typescript-eslint/no-unused-vars
-      const { reasoning_effort, thinking, reasoning: _reasoning, ...rest } = payload;
+      const { reasoning_effort, thinking, reasoning: _reasoning, thinkingLevel, ...rest } = payload;

      let reasoning: OpenRouterReasoning | undefined;

-      if (thinking?.type || thinking?.budget_tokens !== undefined || reasoning_effort) {
+      if (thinking?.type || thinking?.budget_tokens !== undefined || reasoning_effort || thinkingLevel) {
        if (thinking?.type === 'disabled') {
          reasoning = { enabled: false };
        } else if (thinking?.budget_tokens !== undefined) {
@@ -31,6 +31,9 @@ export const params = {
        } else if (reasoning_effort) {
          reasoning = { effort: reasoning_effort };
        }
+        else if (thinkingLevel) {
+          reasoning = { effort: thinkingLevel };
+        }
      }

      return {
@@ -126,11 +129,14 @@ export const params = {
          if (model.description && model.description.includes('`reasoning` `enabled`')) {
            extendParams.push('enableReasoning');
          }
-          if (hasReasoning && model.id.includes('gpt-5')) {
-            extendParams.push('gpt5ReasoningEffort');
-          }
-          if (hasReasoning && model.id.includes('openai') && !model.id.includes('gpt-5')) {
-            extendParams.push('reasoningEffort');
+          if (hasReasoning && model.id.includes('gpt-5.2')) {
+            extendParams.push('gpt5_2ReasoningEffort', 'textVerbosity');
+          } else if (hasReasoning && model.id.includes('gpt-5.1')) {
+            extendParams.push('gpt5_1ReasoningEffort', 'textVerbosity');
+          } else if (hasReasoning && model.id.includes('gpt-5')) {
+            extendParams.push('gpt5ReasoningEffort', 'textVerbosity');
+          } else if (hasReasoning && model.id.includes('openai')) {
+            extendParams.push('reasoningEffort', 'textVerbosity');
          }
          if (hasReasoning && model.id.includes('claude')) {
            extendParams.push('enableReasoning', 'reasoningBudgetToken');
@@ -141,6 +147,12 @@ export const params = {
          if (hasReasoning && model.id.includes('gemini-2.5')) {
            extendParams.push('reasoningBudgetToken');
          }
+          if (hasReasoning && model.id.includes('gemini-3-pro')) {
+            extendParams.push('thinkingLevel2');
+          }
+          if (hasReasoning && model.id.includes('gemini-3-flash')) {
+            extendParams.push('thinkingLevel');
+          }
          return extendParams.length > 0 ? { settings: { extendParams } } : {};
        })(),
      };
@@ -245,6 +245,53 @@ describe('LobeVercelAIGatewayAI - custom features', () => {
      expect(Array.isArray(model?.pricing?.units)).toBe(true);
    });

+    it('should map extendParams for gpt-5.x reasoning models', async () => {
+      const mockModelData: VercelAIGatewayModelCard[] = [
+        {
+          id: 'openai/gpt-5.2-mini',
+          name: 'GPT-5.2 Mini',
+          pricing: { input: 0.000_003, output: 0.000_015 },
+          tags: ['reasoning'],
+          type: 'chat',
+        },
+        {
+          id: 'openai/gpt-5.1-mini',
+          name: 'GPT-5.1 Mini',
+          pricing: { input: 0.000_003, output: 0.000_015 },
+          tags: ['reasoning'],
+          type: 'chat',
+        },
+        {
+          id: 'openai/gpt-5-mini',
+          name: 'GPT-5 Mini',
+          pricing: { input: 0.000_003, output: 0.000_015 },
+          tags: ['reasoning'],
+          type: 'chat',
+        },
+      ];
+
+      const mockClient = {
+        models: {
+          list: vi.fn().mockResolvedValue({ data: mockModelData }),
+        },
+      };
+
+      const models = await params.models({ client: mockClient as any });
+      const gpt52 = models.find((m) => m.id === 'openai/gpt-5.2-mini');
+      const gpt51 = models.find((m) => m.id === 'openai/gpt-5.1-mini');
+      const gpt5 = models.find((m) => m.id === 'openai/gpt-5-mini');
+
+      expect(gpt52?.settings?.extendParams).toEqual(
+        expect.arrayContaining(['gpt5_2ReasoningEffort', 'textVerbosity']),
+      );
+      expect(gpt51?.settings?.extendParams).toEqual(
+        expect.arrayContaining(['gpt5_1ReasoningEffort', 'textVerbosity']),
+      );
+      expect(gpt5?.settings?.extendParams).toEqual(
+        expect.arrayContaining(['gpt5ReasoningEffort', 'textVerbosity']),
+      );
+    });
+
    it('should handle models with missing pricing', async () => {
      const mockModelData: VercelAIGatewayModelCard[] = [
        {
@@ -125,9 +125,15 @@ export const params = {
        // Merge all applicable extendParams for settings
        ...(() => {
          const extendParams: string[] = [];
-          if (tags.includes('reasoning') && m.id.includes('gpt-5')) {
+          if (tags.includes('reasoning') && m.id.includes('gpt-5') && !m.id.includes('gpt-5.1') && !m.id.includes('gpt-5.2')) {
            extendParams.push('gpt5ReasoningEffort', 'textVerbosity');
          }
+          if (tags.includes('reasoning') && m.id.includes('gpt-5.1') && !m.id.includes('gpt-5.2')) {
+            extendParams.push('gpt5_1ReasoningEffort', 'textVerbosity');
+          }
+          if (tags.includes('reasoning') && m.id.includes('gpt-5.2')) {
+            extendParams.push('gpt5_2ReasoningEffort', 'textVerbosity');
+          }
          if (tags.includes('reasoning') && m.id.includes('openai') && !m.id.includes('gpt-5')) {
            extendParams.push('reasoningEffort', 'textVerbosity');
          }
@@ -88,7 +88,6 @@ export const providerRuntimeMap = {
  deepseek: LobeDeepSeekAI,
  fal: LobeFalAI,
  fireworksai: LobeFireworksAI,
-  lobehub: LobeHubAI,
  giteeai: LobeGiteeAI,
  github: LobeGithubAI,
  google: LobeGoogleAI,
@@ -100,6 +99,7 @@ export const providerRuntimeMap = {
  internlm: LobeInternLMAI,
  jina: LobeJinaAI,
  lmstudio: LobeLMStudioAI,
+  lobehub: LobeHubAI,
  minimax: LobeMinimaxAI,
  mistral: LobeMistralAI,
  modelscope: LobeModelScopeAI,
@@ -8,39 +8,39 @@ import {
 } from '@/server/services/memory/userMemory/persona/service';

 const workflowPayloadSchema = z.object({
-  userId: z.string().optional(),
  userIds: z.array(z.string()).optional(),
 });

 export const { POST } = serve(async (context) => {
-  const payload = workflowPayloadSchema.parse(context.requestPayload || {});
+  const payload = await context.run('memory:pipelines:persona:update-writing:parse-payload', () =>
+    workflowPayloadSchema.parse(context.requestPayload || {}),
+  );
  const db = await getServerDB();

-  const userIds = Array.from(
-    new Set([...(payload.userIds || []), ...(payload.userId ? [payload.userId] : [])]),
-  ).filter(Boolean);
-
+  const userIds = Array.from(new Set(payload.userIds || [])).filter(Boolean);
  if (userIds.length === 0) {
-    return { message: 'userId or userIds is required', processedUsers: 0 };
+    throw new Error('No user IDs provided for persona update.');
  }

  const service = new UserPersonaService(db);
-  const results = [];

-  for (const userId of userIds) {
-    const context = await buildUserPersonaJobInput(db, userId);
-    const result = await service.composeWriting({ ...context, userId });
-    results.push({
-      diffId: result.diff?.id,
-      documentId: result.document.id,
-      userId,
-      version: result.document.version,
-    });
-  }
+  await Promise.all(
+    userIds.map(async (userId) =>
+      context.run(`memory:pipelines:persona:update-writing:users:${userId}`, async () => {
+        const context = await buildUserPersonaJobInput(db, userId);
+        const result = await service.composeWriting({ ...context, userId });
+        return {
+          diffId: result.diff?.id,
+          documentId: result.document.id,
+          userId,
+          version: result.document.version,
+        };
+      }),
+    ),
+  );

  return {
    message: 'User persona processed via workflow.',
    processedUsers: userIds.length,
-    results,
  };
 });
@@ -104,7 +104,7 @@ const KlavisToolAuthItem = memo<KlavisToolAuthItemProps>(({ tool, onAuthComplete
        try {
          await refreshKlavisServerTools(identifier);
        } catch (error) {
-          console.error('[Klavis] Failed to check auth status:', error);
+          console.debug('[Klavis] Polling check (expected during auth):', error);
        }
      }, POLL_INTERVAL_MS);

@@ -129,7 +129,8 @@ const KlavisToolAuthItem = memo<KlavisToolAuthItemProps>(({ tool, onAuthComplete
              windowCheckIntervalRef.current = null;
            }
            oauthWindowRef.current = null;
-            refreshKlavisServerTools(identifier);
+            // Start polling after window closes
+            startFallbackPolling(identifier);
          }
        } catch {
          if (windowCheckIntervalRef.current) {
@@ -120,7 +120,7 @@ const KlavisSkillItem = memo<KlavisSkillItemProps>(({ serverType, server }) => {
        try {
          await refreshKlavisServerTools(serverName);
        } catch (error) {
-          console.error('[Klavis] Failed to check auth status:', error);
+          console.debug('[Klavis] Polling check (expected during auth):', error);
        }
      }, POLL_INTERVAL_MS);

@@ -145,8 +145,8 @@ const KlavisSkillItem = memo<KlavisSkillItemProps>(({ serverType, server }) => {
              windowCheckIntervalRef.current = null;
            }
            oauthWindowRef.current = null;
-            await refreshKlavisServerTools(serverName);
-            setIsWaitingAuth(false);
+            // Start polling after window closes
+            startFallbackPolling(serverName);
          }
        } catch {
          console.log('[Klavis] COOP blocked window.closed access, falling back to polling');
@@ -2,45 +2,35 @@ import { memo } from 'react';
 import { Link } from 'react-router-dom';

 import { DEFAULT_INBOX_AVATAR } from '@/const/meta';
-import { INBOX_SESSION_ID } from '@/const/session';
 import { SESSION_CHAT_URL } from '@/const/url';
 import { useNavigateToAgent } from '@/hooks/useNavigateToAgent';
-import { getChatStoreState, useChatStore } from '@/store/chat';
-import { chatSelectors } from '@/store/chat/selectors';
+import { useAgentStore } from '@/store/agent';
+import { builtinAgentSelectors } from '@/store/agent/selectors';
 import { useServerConfigStore } from '@/store/serverConfig';
 import { useSessionStore } from '@/store/session';
+import { sessionSelectors } from '@/store/session/selectors';

 import ListItem from '../ListItem';

 const Inbox = memo(() => {
  const mobile = useServerConfigStore((s) => s.isMobile);
-  const activeId = useSessionStore((s) => s.activeId);
+  const isInboxActive = useSessionStore(sessionSelectors.isInboxSession);
  const navigateToAgent = useNavigateToAgent();
-
-  const openNewTopicOrSaveTopic = useChatStore((s) => s.openNewTopicOrSaveTopic);
+  const inboxAgentId = useAgentStore(builtinAgentSelectors.inboxAgentId);

  return (
    <Link
      aria-label={'Lobe AI'}
-      onClick={async (e) => {
+      onClick={(e) => {
        e.preventDefault();
-        if (activeId === INBOX_SESSION_ID && !mobile) {
-          // If user tap the inbox again, open a new topic.
-          // Only for desktop.
-          const inboxMessages = chatSelectors.inboxActiveTopicMessages(getChatStoreState());
-          if (inboxMessages.length > 0) {
-            await openNewTopicOrSaveTopic();
-          }
-        } else {
-          navigateToAgent(INBOX_SESSION_ID);
-        }
+        navigateToAgent(inboxAgentId);
      }}
-      to={SESSION_CHAT_URL(INBOX_SESSION_ID, mobile)}
+      to={SESSION_CHAT_URL(inboxAgentId, mobile)}
    >
      <ListItem
-        active={activeId === INBOX_SESSION_ID}
+        active={isInboxActive}
        avatar={DEFAULT_INBOX_AVATAR}
-        key={INBOX_SESSION_ID}
+        key={'inbox'}
        styles={{
          container: {
            gap: 12,
@@ -5,6 +5,7 @@ import { KlavisServerStatus } from '@/store/tool/slices/klavisStore';

 const POLL_INTERVAL_MS = 1000;
 const POLL_TIMEOUT_MS = 15_000;
+const WINDOW_CLOSED_POLL_TIMEOUT_MS = 4000; // Shorter timeout when window is closed

 interface UseKlavisOAuthProps {
  serverStatus?: KlavisServerStatus;
@@ -50,14 +51,14 @@ export const useKlavisOAuth = ({ serverStatus }: UseKlavisOAuthProps) => {
  }, [serverStatus, isWaitingAuth, cleanup]);

  const startFallbackPolling = useCallback(
-    (serverName: string) => {
+    (serverName: string, timeoutMs: number = POLL_TIMEOUT_MS) => {
      if (pollIntervalRef.current) return;

      pollIntervalRef.current = setInterval(async () => {
        try {
          await refreshKlavisServerTools(serverName);
        } catch (error) {
-          console.error('[Klavis] Failed to check auth status:', error);
+          console.debug('[Klavis] Polling check (expected during auth):', error);
        }
      }, POLL_INTERVAL_MS);

@@ -67,7 +68,7 @@ export const useKlavisOAuth = ({ serverStatus }: UseKlavisOAuthProps) => {
          pollIntervalRef.current = null;
        }
        setIsWaitingAuth(false);
-      }, POLL_TIMEOUT_MS);
+      }, timeoutMs);
    },
    [refreshKlavisServerTools],
  );
@@ -77,23 +78,29 @@ export const useKlavisOAuth = ({ serverStatus }: UseKlavisOAuthProps) => {
      windowCheckIntervalRef.current = setInterval(() => {
        try {
          if (oauthWindow.closed) {
+            // Stop monitoring window
            if (windowCheckIntervalRef.current) {
              clearInterval(windowCheckIntervalRef.current);
              windowCheckIntervalRef.current = null;
            }
            oauthWindowRef.current = null;
-            refreshKlavisServerTools(serverName);
+
+            // Start polling to check auth status after window closes
+            // Use shorter timeout since user has closed the window
+            // Keep loading state until we confirm success or timeout
+            startFallbackPolling(serverName, WINDOW_CLOSED_POLL_TIMEOUT_MS);
          }
        } catch {
          if (windowCheckIntervalRef.current) {
            clearInterval(windowCheckIntervalRef.current);
            windowCheckIntervalRef.current = null;
          }
+          // Use default timeout for fallback polling
          startFallbackPolling(serverName);
        }
      }, 500);
    },
-    [refreshKlavisServerTools, startFallbackPolling],
+    [startFallbackPolling],
  );

  const openOAuthWindow = useCallback(
@@ -0,0 +1,21 @@
+'use client';
+
+import { type ReactNode, useEffect } from 'react';
+
+interface DebugNodeProps {
+  children?: ReactNode;
+  trace: string;
+}
+
+const DebugNode = ({ children, trace }: DebugNodeProps) => {
+  if (process.env.NODE_ENV !== 'development') return null;
+  // eslint-disable-next-line react-hooks/rules-of-hooks
+  useEffect(() => {
+    // eslint-disable-next-line no-console
+    console.log(`[DebugNode] Suspense fallback active: ${trace}`);
+  }, [trace]);
+
+  return children ?? null;
+};
+
+export default DebugNode;
@@ -88,7 +88,7 @@ const KlavisServerItem = memo<KlavisServerItemProps>(
          try {
            await refreshKlavisServerTools(serverName);
          } catch (error) {
-            console.error('[Klavis] Failed to check auth status:', error);
+            console.debug('[Klavis] Polling check (expected during auth):', error);
          }
        }, POLL_INTERVAL_MS);

@@ -121,8 +121,8 @@ const KlavisServerItem = memo<KlavisServerItemProps>(
              }
              oauthWindowRef.current = null;

-              // 窗口关闭后立即检查一次认证状态
-              refreshKlavisServerTools(serverName);
+              // 窗口关闭后开始轮询检查认证状态
+              startFallbackPolling(serverName);
            }
          } catch {
            // COOP 阻止了访问，降级到轮询方案
@@ -1,6 +1,7 @@
 import { Flexbox } from '@lobehub/ui';
-import { memo } from 'react';
+import { Suspense, memo } from 'react';

+import DebugNode from '@/components/DebugNode';
 import PluginTag from '@/components/Plugins/PluginTag';
 import { useToolStore } from '@/store/tool';
 import { customPluginSelectors } from '@/store/tool/selectors';
@@ -11,18 +12,20 @@ const ToolItem = memo<CheckboxItemProps>(({ id, onUpdate, label, checked }) => {
  const isCustom = useToolStore((s) => customPluginSelectors.isCustomPlugin(id)(s));

  return (
-    <CheckboxItem
-      checked={checked}
-      hasPadding={false}
-      id={id}
-      label={
-        <Flexbox align={'center'} gap={8} horizontal>
-          {label || id}
-          {isCustom && <PluginTag showText={false} type={'customPlugin'} />}
-        </Flexbox>
-      }
-      onUpdate={onUpdate}
-    />
+    <Suspense fallback={<DebugNode trace="ActionBar/Tools/ToolItem" />}>
+      <CheckboxItem
+        checked={checked}
+        hasPadding={false}
+        id={id}
+        label={
+          <Flexbox align={'center'} gap={8} horizontal>
+            {label || id}
+            {isCustom && <PluginTag showText={false} type={'customPlugin'} />}
+          </Flexbox>
+        }
+        onUpdate={onUpdate}
+      />
+    </Suspense>
  );
 });

@@ -59,51 +59,62 @@ interface ToolsListProps {
  items: ItemType[];
 }

-const ToolsList = memo<ToolsListProps>(({ items }) => {
-  const renderItem = (item: ToolItemData, index: number) => {
-    if (item.type === 'divider') {
-      return <Divider key={`divider-${index}`} style={{ margin: '4px 0' }} />;
-    }
+const DividerItem = memo<{ index: number }>(({ index }) => (
+  <Divider key={`divider-${index}`} style={{ margin: '4px 0' }} />
+));

-    if (item.type === 'group') {
-      return (
-        <Fragment key={item.key || `group-${index}`}>
-          <Text className={toolsListStyles.groupLabel} fontSize={12} type="secondary">
-            {item.label}
-          </Text>
-          {item.children?.map((child, childIndex) => renderItem(child, childIndex))}
-        </Fragment>
-      );
-    }
-
-    // Regular item
-    // icon can be: ReactNode (already rendered), LucideIcon/ForwardRef (needs Icon wrapper), or undefined
-    const iconNode = item.icon ? (
-      isValidElement(item.icon) ? (
-        item.icon
-      ) : (
-        <Icon icon={item.icon as any} size={20} />
-      )
-    ) : null;
-
-    return (
-      <div
-        className={toolsListStyles.item}
-        key={item.key || `item-${index}`}
-        onClick={item.onClick}
-        role="button"
-        tabIndex={0}
-      >
-        {iconNode && <div className={toolsListStyles.itemIcon}>{iconNode}</div>}
-        <div className={toolsListStyles.itemContent}>{item.label}</div>
-        {item.extra}
-      </div>
-    );
-  };
+const RegularItem = memo<{ index: number; item: ToolItemData }>(({ item, index }) => {
+  const iconNode = item.icon ? (
+    isValidElement(item.icon) ? (
+      item.icon
+    ) : (
+      <Icon icon={item.icon as any} size={20} />
+    )
+  ) : null;

+  return (
+    <div
+      className={toolsListStyles.item}
+      key={item.key || `item-${index}`}
+      onClick={item.onClick}
+      role="button"
+      tabIndex={0}
+    >
+      {iconNode && <div className={toolsListStyles.itemIcon}>{iconNode}</div>}
+      <div className={toolsListStyles.itemContent}>{item.label}</div>
+      {item.extra}
+    </div>
+  );
+});
+
+const GroupItem = memo<{ index: number; item: ToolItemData }>(({ item, index }) => (
+  <Fragment key={item.key || `group-${index}`}>
+    <Text className={toolsListStyles.groupLabel} fontSize={12} type="secondary">
+      {item.label}
+    </Text>
+    {item.children?.map((child, childIndex) => (
+      <ToolListItem index={childIndex} item={child} key={child.key || `item-${childIndex}`} />
+    ))}
+  </Fragment>
+));
+
+const ToolListItem = memo<{ index: number; item: ToolItemData | null }>(({ item, index }) => {
+  if (!item) return null;
+  if (item.type === 'divider') return <DividerItem index={index} />;
+  if (item.type === 'group') return <GroupItem index={index} item={item} />;
+  return <RegularItem index={index} item={item} />;
+});
+
+const ToolsList = memo<ToolsListProps>(({ items }) => {
  return (
    <Flexbox gap={0} padding={4}>
-      {items.map((item, index) => renderItem(item as ToolItemData, index))}
+      {items.map((item, index) => (
+        <ToolListItem
+          index={index}
+          item={item as ToolItemData | null}
+          key={item?.key || `item-${index}`}
+        />
+      ))}
    </Flexbox>
  );
 });
@@ -17,6 +17,7 @@ import { createStaticStyles, cx } from 'antd-style';
 import {
  type CSSProperties,
  type ReactNode,
+  Suspense,
  isValidElement,
  memo,
  useCallback,
@@ -26,6 +27,7 @@ import {
  useState,
 } from 'react';

+import DebugNode from '@/components/DebugNode';
 import { useIsMobile } from '@/hooks/useIsMobile';

 const styles = createStaticStyles(({ css }) => ({
@@ -271,7 +273,11 @@ const ActionDropdown = memo<ActionDropdownProps>(
            hoverTrigger={Boolean(resolvedTriggerProps?.openOnHover)}
            placement={isMobile ? 'top' : placement}
          >
-            <DropdownMenuPopup {...resolvedPopupProps}>{menuContent}</DropdownMenuPopup>
+            <DropdownMenuPopup {...resolvedPopupProps}>
+              <Suspense fallback={<DebugNode trace="ActionDropdown > popup" />}>
+                {menuContent}
+              </Suspense>
+            </DropdownMenuPopup>
          </DropdownMenuPositioner>
        </DropdownMenuPortal>
      </DropdownMenuRoot>
@@ -2,8 +2,9 @@

 import { Flexbox, Popover, type PopoverProps } from '@lobehub/ui';
 import { createStaticStyles, cssVar, cx } from 'antd-style';
-import { type ReactNode, memo } from 'react';
+import { type ReactNode, Suspense, memo } from 'react';

+import DebugNode from '@/components/DebugNode';
 import UpdateLoading from '@/components/Loading/UpdateLoading';
 import { useIsMobile } from '@/hooks/useIsMobile';

@@ -65,16 +66,18 @@ const ActionPopover = memo<ActionPopoverProps>(

    // Compose content with optional title
    const popoverContent = (
-      <>
-        {title && (
-          <Flexbox gap={8} horizontal justify={'space-between'} style={{ marginBottom: 16 }}>
-            {title}
-            {extra}
-            {loading && <UpdateLoading style={{ color: cssVar.colorTextSecondary }} />}
-          </Flexbox>
-        )}
-        {content}
-      </>
+      <Suspense fallback={<DebugNode trace="ActionPopover > content" />}>
+        <>
+          {title && (
+            <Flexbox gap={8} horizontal justify={'space-between'} style={{ marginBottom: 16 }}>
+              {title}
+              {extra}
+              {loading && <UpdateLoading style={{ color: cssVar.colorTextSecondary }} />}
+            </Flexbox>
+          )}
+          {content}
+        </>
+      </Suspense>
    );

    return (
@@ -73,9 +73,13 @@ export const useWebUserStateRedirect = () =>
    }

    // Redirect away from invite-code page if no longer required
+    // Skip redirect if force=true is present (for re-entering invite code)
    if (pathname.startsWith('/invite-code')) {
-      window.location.href = '/';
-      return;
+      const params = new URLSearchParams(window.location.search);
+      if (params.get('force') !== 'true') {
+        window.location.href = '/';
+        return;
+      }
    }

    if (!onboardingSelectors.needsOnboarding(state)) return;
@@ -1,22 +1,23 @@
 import type { Mock } from 'vitest';
 import { afterEach, describe, expect, it, vi } from 'vitest';

+// eslint-disable-next-line import/first
+import { getActiveTraceId, injectSpanTraceHeaders } from './traceparent';
+
 vi.mock('@lobechat/observability-otel/api', () => {
  const inject = vi.fn();
  const setSpan = vi.fn((_ctx, span) => span);
+  const getActiveSpan = vi.fn();

  return {
    context: {
      active: vi.fn(() => ({})),
    },
    propagation: { inject },
-    trace: { setSpan },
+    trace: { getActiveSpan, setSpan },
  };
 });

-// eslint-disable-next-line import/first
-import { injectSpanTraceHeaders } from './traceparent';
-
 const mockSpan = (traceId: string, spanId: string) =>
  ({
    spanContext: () => ({
@@ -39,7 +40,9 @@ describe('injectSpanTraceHeaders', () => {

  it('uses propagator output when available', async () => {
    const { propagation } = await api;
-    (propagation.inject as unknown as Mock<typeof propagation.inject<Record<string, string>>>).mockImplementation((_ctx, carrier) => {
+    (
+      propagation.inject as unknown as Mock<typeof propagation.inject<Record<string, string>>>
+    ).mockImplementation((_ctx, carrier) => {
      carrier.traceparent = 'from-propagator';
      carrier.tracestate = 'state';
    });
@@ -56,7 +59,9 @@ describe('injectSpanTraceHeaders', () => {

  it('falls back to manual traceparent formatting when propagator gives none', async () => {
    const { propagation } = await api;
-    (propagation.inject as unknown as Mock<typeof propagation.inject<Record<string, string>>>).mockImplementation(() => undefined);
+    (
+      propagation.inject as unknown as Mock<typeof propagation.inject<Record<string, string>>>
+    ).mockImplementation(() => undefined);

    const headers = headersWith();
    const span = mockSpan('1'.repeat(32), '2'.repeat(16));
@@ -64,6 +69,40 @@ describe('injectSpanTraceHeaders', () => {
    const tp = injectSpanTraceHeaders(headers, span);

    expect(tp).toBe('00-11111111111111111111111111111111-2222222222222222-01');
-    expect(headers.get('traceparent')).toBe('00-11111111111111111111111111111111-2222222222222222-01');
+    expect(headers.get('traceparent')).toBe(
+      '00-11111111111111111111111111111111-2222222222222222-01',
+    );
+  });
+});
+
+describe('getActiveTraceId', () => {
+  const api = vi.importMock<typeof import('@lobechat/observability-otel/api')>(
+    '@lobechat/observability-otel/api',
+  );
+
+  afterEach(() => {
+    vi.resetAllMocks();
+  });
+
+  it('returns traceId from active span', async () => {
+    const { trace } = await api;
+    const expectedTraceId = 'a'.repeat(32);
+    (trace.getActiveSpan as Mock).mockReturnValue(mockSpan(expectedTraceId, 'b'.repeat(16)));
+
+    expect(getActiveTraceId()).toBe(expectedTraceId);
+  });
+
+  it('returns undefined when no active span', async () => {
+    const { trace } = await api;
+    (trace.getActiveSpan as Mock).mockReturnValue(undefined);
+
+    expect(getActiveTraceId()).toBeUndefined();
+  });
+
+  it('returns undefined when traceId is all zeros', async () => {
+    const { trace } = await api;
+    (trace.getActiveSpan as Mock).mockReturnValue(mockSpan('0'.repeat(32), 'b'.repeat(16)));
+
+    expect(getActiveTraceId()).toBeUndefined();
  });
 });
--- a/Show More
+++ b/Show More
Author	SHA1	Message	Date
arvinxx	d6732b14a1	update e2e test	2026-01-29 16:25:39 +08:00
lobehubbot	c60838489c	📝 docs(bot): Auto sync agents & plugin to readme	2026-01-29 04:00:48 +00:00
semantic-release-bot	d8765ca7f4	🔖 chore(release): v2.0.10 [skip ci] ### [Version 2.0.10](https://github.com/lobehub/lobe-chat/compare/v2.0.9...v2.0.10) <sup>Released on 2026-01-29</sup> #### 🐛 Bug Fixes - misc: Add ExtendParamsTypeSchema for enhanced model settings. <br/> <details> <summary><kbd>Improvements and Fixes</kbd></summary> #### What's fixed * misc: Add ExtendParamsTypeSchema for enhanced model settings, closes [#11437](https://github.com/lobehub/lobe-chat/issues/11437) ([`f58c980`](https://github.com/lobehub/lobe-chat/commit/f58c980)) </details> <div align="right"> [![](https://img.shields.io/badge/-BACK_TO_TOP-151515?style=flat-square)](#readme-top) </div>	2026-01-29 03:59:14 +00:00
sxjeru	f58c980f3a	🐛 fix: Add ExtendParamsTypeSchema for enhanced model settings (#11437 ) * 🐛 fix: Update reasoning handling in OpenRouter and VercelAIGateway to include thinkingLevel and adjust gpt-5 reasoning parameters * 🐛 fix: Add ExtendParamsTypeSchema and AiModelSettingsSchema for enhanced model settings * 🐛 fix: Add ModelSearchImplementTypeSchema and update AiModelSettingsSchema for enhanced model configuration * delete gemini-2.5-flash-image-preview model * Add GLM-4.7 model to volcengine and remove deprecated GLM-4 32B 0414 model from wenxin * ✨ feat: 添加 MiniMax-M2.1 和 GLM-4.7-Flash 模型到模型库 * ✨ feat: 更新 Zhipu 模型库，添加 GLM-4.7-FlashX 模型并移除 GLM-4.5-Flash 模型 * test: add extendParams mapping for gpt-5.x reasoning models in VercelAIGatewayAI * remove deprecated DeepSeek R1 model from nvidiaChatModels * i18n: 更新 MiniMax-M2.1 模型描述为英文	2026-01-29 11:41:38 +08:00
lobehubbot	8d00af4905	📝 docs(bot): Auto sync agents & plugin to readme	2026-01-29 03:18:12 +00:00
semantic-release-bot	f22453e1af	🔖 chore(release): v2.0.9 [skip ci] ### [Version 2.0.9](https://github.com/lobehub/lobe-chat/compare/v2.0.8...v2.0.9) <sup>Released on 2026-01-29</sup> #### 🐛 Bug Fixes - model-bank: Fix ZenMux model IDs by adding provider prefixes. <br/> <details> <summary><kbd>Improvements and Fixes</kbd></summary> #### What's fixed * model-bank: Fix ZenMux model IDs by adding provider prefixes, closes [#11947](https://github.com/lobehub/lobe-chat/issues/11947) ([`17f8a5c`](https://github.com/lobehub/lobe-chat/commit/17f8a5c)) </details> <div align="right"> [![](https://img.shields.io/badge/-BACK_TO_TOP-151515?style=flat-square)](#readme-top) </div>	2026-01-29 03:16:41 +00:00
iBenzene	17f8a5cf8c	🐛 fix(model-bank): fix ZenMux model IDs by adding provider prefixes (#11947 ) fix(model-bank): fix ZenMux model IDs by adding provider prefixes	2026-01-29 11:00:01 +08:00
R3pl4c3r	9ce958d136	chore(workflow): Update upstream repository and branch for sync action (#11923 ) Update upstream repository and branch for sync action	2026-01-28 23:20:29 +08:00
YuTengjing	d13b002546	📝 docs(locale): add proration price hint translations (#11941 )	2026-01-28 17:36:40 +08:00
lobehubbot	d6b6eba89e	📝 docs(bot): Auto sync agents & plugin to readme	2026-01-28 08:30:45 +00:00
semantic-release-bot	69ae342051	🔖 chore(release): v2.0.8 [skip ci] ### [Version 2.0.8](https://github.com/lobehub/lobe-chat/compare/v2.0.7...v2.0.8) <sup>Released on 2026-01-28</sup> #### 🐛 Bug Fixes - misc: Fix inbox agent in mobile. <br/> <details> <summary><kbd>Improvements and Fixes</kbd></summary> #### What's fixed * misc: Fix inbox agent in mobile, closes [#11929](https://github.com/lobehub/lobe-chat/issues/11929) ([`42f5c0b`](https://github.com/lobehub/lobe-chat/commit/42f5c0b)) </details> <div align="right"> [![](https://img.shields.io/badge/-BACK_TO_TOP-151515?style=flat-square)](#readme-top) </div>	2026-01-28 08:29:20 +00:00
Arvin Xu	42f5c0b67a	🐛 fix: fix inbox agent in mobile (#11929 ) fix inbox agent in mobile	2026-01-28 16:13:29 +08:00
Neko	4423d5c926	🔨 chore(userMemories): improved the memory related agents resolution order (#11933 )	2026-01-28 14:42:12 +08:00
lobehubbot	3106f48d68	📝 docs(bot): Auto sync agents & plugin to readme	2026-01-28 03:56:24 +00:00
semantic-release-bot	5308b27289	🔖 chore(release): v2.0.7 [skip ci] ### [Version 2.0.7](https://github.com/lobehub/lobe-chat/compare/v2.0.6...v2.0.7) <sup>Released on 2026-01-28</sup> #### 🐛 Bug Fixes - model-runtime: Include tool_calls in speed metrics & add getActiveTraceId. <br/> <details> <summary><kbd>Improvements and Fixes</kbd></summary> #### What's fixed * model-runtime: Include tool_calls in speed metrics & add getActiveTraceId, closes [#11927](https://github.com/lobehub/lobe-chat/issues/11927) ([`b24da44`](https://github.com/lobehub/lobe-chat/commit/b24da44)) </details> <div align="right"> [![](https://img.shields.io/badge/-BACK_TO_TOP-151515?style=flat-square)](#readme-top) </div>	2026-01-28 03:54:59 +00:00
YuTengjing	b24da448ad	🐛 fix(model-runtime): include tool_calls in speed metrics & add getActiveTraceId (#11927 )	2026-01-28 11:36:59 +08:00
Neko	74b8fb686e	🔨 chore(userMemories,database): should respect preferred providers/models (#11919 )	2026-01-28 07:06:54 +08:00
lobehubbot	2016ceda7e	📝 docs(bot): Auto sync agents & plugin to readme	2026-01-27 19:43:01 +00:00
semantic-release-bot	4a1cd1d80b	🔖 chore(release): v2.0.6 [skip ci] ### [Version 2.0.6](https://github.com/lobehub/lobe-chat/compare/v2.0.5...v2.0.6) <sup>Released on 2026-01-27</sup> #### 🐛 Bug Fixes - misc: The klavis in onboarding connect timeout fixed. <br/> <details> <summary><kbd>Improvements and Fixes</kbd></summary> #### What's fixed * misc: The klavis in onboarding connect timeout fixed, closes [#11918](https://github.com/lobehub/lobe-chat/issues/11918) ([`bc165be`](https://github.com/lobehub/lobe-chat/commit/bc165be)) </details> <div align="right"> [![](https://img.shields.io/badge/-BACK_TO_TOP-151515?style=flat-square)](#readme-top) </div>	2026-01-27 19:41:29 +00:00
Shinji-Li	bc165be510	🐛 fix: the klavis in onboarding connect timeout fixed (#11918 ) fix: the klavis in onboarding connect timeout fixed	2026-01-28 03:23:41 +08:00
Neko	a074f486d7	🔨 chore(userMemories): properly handle and process persona write (#11917 )	2026-01-28 01:59:02 +08:00
YuTengjing	225b1f4b47	📝 docs: remove outdated auth docs and simplify deployment guide (#11916 )	2026-01-28 01:14:53 +08:00
Innei	2a08e644f6	fix: add Suspense boundaries for i18n components (#11914 ) * fix: suspense Signed-off-by: Innei <tukon479@gmail.com> * fix: update DebugNode to conditionally log in development environment Signed-off-by: Innei <tukon479@gmail.com> --------- Signed-off-by: Innei <tukon479@gmail.com>	2026-01-28 00:34:45 +08:00
lobehubbot	5e06111610	📝 docs(bot): Auto sync agents & plugin to readme	2026-01-27 15:24:25 +00:00
semantic-release-bot	7c0dd9bbe0	🔖 chore(release): v2.0.5 [skip ci] ### [Version 2.0.5](https://github.com/lobehub/lobe-chat/compare/v2.0.4...v2.0.5) <sup>Released on 2026-01-27</sup> #### 🐛 Bug Fixes - misc: Update the artifact prompt. <br/> <details> <summary><kbd>Improvements and Fixes</kbd></summary> #### What's fixed * misc: Update the artifact prompt, closes [#11907](https://github.com/lobehub/lobe-chat/issues/11907) ([`217e689`](https://github.com/lobehub/lobe-chat/commit/217e689)) </details> <div align="right"> [![](https://img.shields.io/badge/-BACK_TO_TOP-151515?style=flat-square)](#readme-top) </div>	2026-01-27 15:23:00 +00:00
Shinji-Li	217e689b50	🐛 fix: update the artifact prompt (#11907 ) * fix: update the artifact prompt * fix: remove the lobethings and some examples	2026-01-27 23:04:49 +08:00
lobehubbot	1a2008b76a	📝 docs(bot): Auto sync agents & plugin to readme	2026-01-27 14:34:52 +00:00