clean data

remove openapi plugins clean InitClientDB fix isUsePgliteDB condition clean refactor and clean deprecated model list make pglite db default clean file
2026-06-18 21:36:12 +00:00 · 2025-08-22 14:40:20 +08:00
943 changed files with 5628 additions and 50816 deletions
@@ -1,183 +0,0 @@
---
-description: Complete guide for adding a new AI provider documentation to LobeChat
-alwaysApply: false
---
-
-# Adding New AI Provider Documentation
-
-This document provides a step-by-step guide for adding documentation for a new AI provider to LobeChat, based on the complete workflow used for adding providers like BFL (Black Forest Labs) and FAL.
-
-## Overview
-
-Adding a new provider requires creating both user-facing documentation and technical configuration files. The process involves:
-
-1. Creating usage documentation (EN + CN)
-2. Adding environment variable documentation (EN + CN)
-3. Updating Docker configuration files
-4. Updating .env.example file
-5. Preparing image resources
-
-## Step 1: Create Provider Usage Documentation
-
-Create user-facing documentation that explains how to use the new provider.
-
-### Required Files
-
-Create both English and Chinese versions:
- `docs/usage/providers/{provider-name}.mdx` (English)
- `docs/usage/providers/{provider-name}.zh-CN.mdx` (Chinese)
-
-### Documentation Structure
-
-Follow the structure and format used in existing provider documentation. For reference, see:
- `docs/usage/providers/fal.mdx` (English template)
- `docs/usage/providers/fal.zh-CN.mdx` (Chinese template)
-
-### Key Requirements
-
- **Images**: Prepare 5-6 screenshots showing the process
- **Cover Image**: Create or obtain a cover image for the provider
- **Accurate URLs**: Use real registration and dashboard URLs
- **Service Type**: Specify whether it's for image generation, text generation, etc.
- **Pricing Warning**: Include pricing information callout
-
-### Important Notes
-
- **🔒 API Key Security**: Never include real API keys in documentation. Always use placeholder format (e.g., `bfl-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx`)
- **🖼️ Image Hosting**: Use LobeHub's CDN for all images: `hub-apac-1.lobeobjects.space`
-
-## Step 2: Update Environment Variables Documentation
-
-Add the new provider's environment variables to the self-hosting documentation.
-
-### Files to Update
-
- `docs/self-hosting/environment-variables/model-provider.mdx` (English)
- `docs/self-hosting/environment-variables/model-provider.zh-CN.mdx` (Chinese)
-
-### Content to Add
-
-Add two sections for each provider:
-
-```markdown
-### `{PROVIDER}_API_KEY`
-
- Type: Required
- Description: This is the API key you applied for in the {Provider Name} service.
- Default: -
- Example: `{api-key-format-example}`
-
-### `{PROVIDER}_MODEL_LIST`
-
- Type: Optional
- Description: Used to control the {Provider Name} model list. Use `+` to add a model, `-` to hide a model, and `model_name=display_name` to customize the display name of a model. Separate multiple entries with commas. The definition syntax follows the same rules as other providers' model lists.
- Default: `-`
- Example: `-all,+{model-id-1},+{model-id-2}={display-name}`
-
-The above example disables all models first, then enables `{model-id-1}` and `{model-id-2}` (displayed as `{display-name}`).
-
-[model-list]: /docs/self-hosting/advanced/model-list
-```
-
-### Important Notes
-
- **API Key Format**: Use proper UUID format for examples (e.g., `12345678-1234-1234-1234-123456789abc`)
- **Real Model IDs**: Use actual model IDs from the codebase, not placeholders
- **Consistent Naming**: Follow the pattern `{PROVIDER}_API_KEY` and `{PROVIDER}_MODEL_LIST`
-
-## Step 3: Update Docker Configuration Files
-
-Add environment variables to all Docker configuration files to ensure the provider works in containerized deployments.
-
-### Files to Update
-
-All Dockerfile variants must be updated:
- `Dockerfile`
- `Dockerfile.database`
- `Dockerfile.pglite`
-
-### Changes Required
-
-Add the new provider's environment variables at the **end** of the ENV section, just before the final line:
-
-```dockerfile
-# Previous providers...
-    # 302.AI
-    AI302_API_KEY="" AI302_MODEL_LIST="" \
-    # {New Provider 1}
-    {PROVIDER1}_API_KEY="" {PROVIDER1}_MODEL_LIST="" \
-    # {New Provider 2}
-    {PROVIDER2}_API_KEY="" {PROVIDER2}_MODEL_LIST=""
-```
-
-### Important Rules
-
- **Position**: Add new providers at the **end** of the list
- **Ordering**: When adding multiple providers, use alphabetical order (e.g., FAL before BFL)
- **Consistency**: Maintain identical ordering across all Dockerfile variants
- **Format**: Follow the pattern `{PROVIDER}_API_KEY="" {PROVIDER}_MODEL_LIST="" \`
-
-## Step 4: Update .env.example File
-
-Add example configuration entries to help users understand how to configure the provider locally.
-
-### File to Update
-
- `.env.example`
-
-### Content to Add
-
-Add new sections before the "Market Service" section:
-
-```bash
-### {Provider Name} ###
-
-# {PROVIDER}_API_KEY={provider-prefix}-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
-```
-
-### Format Guidelines
-
- **Section Header**: Use `### {Provider Name} ###` format
- **Commented Example**: Use `#` to comment out the example
- **Key Format**: Use appropriate prefix for the provider (e.g., `bfl-`, `fal-`, `sk-`)
- **Position**: Add before the Market Service section
- **Spacing**: Maintain consistent spacing with existing entries
-
-## Step 5: Image Resources
-
-Prepare all necessary image resources for the documentation.
-
-### Required Images
-
-1. **Cover Image**: Provider logo or branded image
-2. **API Dashboard Screenshots**: 3-4 screenshots showing API key creation process
-3. **LobeChat Configuration Screenshots**: 2-3 screenshots showing provider setup in LobeChat
-
-### Image Guidelines
-
- **Quality**: Use high-resolution screenshots
- **Consistency**: Maintain consistent styling across all screenshots
- **Privacy**: Remove or blur any sensitive information
- **Format**: Use PNG format for screenshots
- **Hosting**: Use LobeHub's CDN (`hub-apac-1.lobeobjects.space`) for all images
-
-## Checklist
-
-Before submitting your provider documentation:
-
- [ ] Created both English and Chinese usage documentation
- [ ] Added environment variable documentation (EN + CN)
- [ ] Updated all 3 Dockerfile variants with consistent ordering
- [ ] Updated .env.example with proper key format
- [ ] Prepared all required screenshots and images
- [ ] Used actual model IDs from the codebase
- [ ] Verified no real API keys are included in documentation
- [ ] Used LobeHub CDN for all image hosting
- [ ] Tested the documentation for clarity and accuracy
-
-## Reference
-
-This guide was created based on the implementation of BFL (Black Forest Labs) provider documentation. For a complete example, refer to:
- Commits: `d2da03e1a` (documentation) and `6a2e95868` (environment variables)
- Files: `docs/usage/providers/bfl.mdx`, `docs/usage/providers/bfl.zh-CN.mdx`
- PR: Current branch `tj/feat/bfl-docs`
@@ -0,0 +1,193 @@
+---
+description: Debug 调试指南
+globs: 
+alwaysApply: false
+---
+# Debug 调试指南
+
+## 💡 调试流程概览
+
+当遇到问题时，请按照以下优先级进行处理：
+
+1. **快速判断** - 对于熟悉的错误，直接提供解决方案
+2. **信息收集** - 使用工具搜索相关代码和配置
+3. **网络搜索** - 查找现有解决方案
+4. **定位调试** - 添加日志进行问题定位
+5. **临时方案** - 如果找不到根本解决方案，提供临时解决方案
+6. **解决实施** - 提供可维护的最终解决方案
+
+## 🔍 错误信息分析
+
+### 错误来源识别
+
+错误信息可能来自：
+
+- **Terminal 输出** - 构建、运行时错误
+- **浏览器控制台** - 前端 JavaScript 错误
+- **开发工具** - ESLint、TypeScript、测试框架等
+- **服务器日志** - API、数据库连接等后端错误
+- **截图或文本** - 用户直接提供的错误信息
+
+## 🛠️ 信息收集工具
+
+### 代码搜索工具
+
+使用以下工具收集相关信息，并根据场景选择最合适的工具：
+
+- **`codebase_search` (语义搜索)**
+    - **何时使用**: 当你不确定具体的代码实现，想要寻找相关概念、功能或逻辑时。
+    - **示例**: `查询"文件上传"功能的实现`
+- **`grep_search` (精确/正则搜索)**
+    - **何时使用**: 当你知道要查找的确切字符串、函数名、变量名或一个特定的模式时。
+    - **示例**: `查找所有使用了 'useState' 的地方`
+- **`file_search` (文件搜索)**
+    - **何时使用**: 当你知道文件名的一部分，需要快速定位文件时。
+    - **示例**: `查找 'Button.tsx' 组件`
+- **`read_file` (内容读取)**
+    - **何时使用**: 在定位到具体文件后，用于查看其完整内容和上下文。
+- **`web_search` (网络搜索)**
+    - **何时使用**: 当错误信息可能与第三方库、API 或常见问题相关时，用于获取外部信息。
+
+### 环境与依赖检查
+
+- **检查 `package.json`**: 查看 `scripts` 了解项目如何运行、构建和测试。查看 `dependencies` 和 `devDependencies` 确认库版本，版本冲突有时是问题的根源。
+- **运行测试**: 使用 `ni vitest` 运行单元测试和集成测试，这可以快速定位功能回归或组件错误。
+
+### 项目特定搜索目标
+
+针对 lobe-chat 项目，重点关注：
+
+- **配置文件**: [package.json](mdc:package.json), [next.config.mjs](mdc:next.config.mjs)
+- **核心功能**: `src/features/` 下的相关模块
+- **状态管理**: `src/store/` 下的 Zustand stores
+- **数据库**: `src/database/` 和 `src/migrations/`
+- **类型定义**: `src/types/` 下的类型文件
+- **服务层**: `src/services/` 下的 API 服务
+- **启动流程**: [apps/desktop/src/main/core/App.ts](mdc:apps/desktop/src/main/core/App.ts) - 了解应用启动流程
+
+## 🌐 网络搜索策略
+
+### 搜索顺序优先级
+
+1. **和问题相关的项目的 github issue**
+
+2. **技术社区**
+    - Stack Overflow
+    - GitHub Discussions
+    - Reddit
+
+3. **官方文档**
+    - 使用 `mcp_context7_resolve-library-id` 和 `mcp_context7_get-library-docs` 工具
+    - 查阅官方文档网站
+
+### 搜索关键词策略
+
+- **错误信息**: 完整的错误消息
+- **技术栈**: "Next.js 15" + "error message"
+- **上下文**: 添加功能相关的关键词
+
+## 🔧 问题定位与结构化思考
+
+如果问题比较复杂，我们要按照先定位问题，再解决问题的大方向进行。
+
+### 结构化思考工具
+
+对于复杂或多步骤的调试任务，使用 `mcp_sequential-thinking_sequentialthinking` 工具来结构化思考过程。这有助于：
+
+- **分解问题**: 将大问题拆解成可管理的小步骤。
+- **清晰追踪**: 记录每一步的发现和决策，避免遗漏。
+- **自我修正**: 在过程中评估和调整调试路径。
+
+### 日志调试
+
+在问题产生的路径上添加日志，可以简单使用 `console.log` 或者参考 [debug-usage.mdc](mdc:.cursor/rules/debug-usage.mdc) 使用 `debug` 模块。添加完日志后，请求我运行相关的代码并提供关键输出和错误信息。
+
+### 引导式交互调试
+
+虽然我无法直接操作浏览器开发者工具，但我可以引导你进行交互式调试：
+
+1.  **设置断点**: 我会告诉你可以在哪些关键代码行设置断点。
+2.  **检查变量**: 我会请你在断点处检查特定变量的值或 `props`/`state`。
+3.  **分析调用栈**: 我会请你提供调用栈信息，以帮助理解代码执行流程。
+
+## 💡 临时解决方案策略
+
+当无法找到根本解决方案时，提供临时解决方案：
+
+### 临时方案准则
+
+- **快速修复** - 优先让功能可用
+- **最小修改** - 减少对现有代码的影响
+- **清晰标记** - 明确标注这是临时方案
+- **后续计划** - 说明后续如何找到更好的解决方案
+
+### 临时方案模板
+
+```markdown
+## 临时解决方案 ⚠️
+
+**问题**: [简要描述问题]
+
+**临时修复**:
+[具体的临时修复步骤]
+
+**风险说明**:
+
+- [可能的副作用或限制]
+- [需要注意的事项]
+
+**后续计划**:
+
+- [ ] 深入调研根本原因
+- [ ] 寻找更优雅的解决方案
+- [ ] 监控是否有其他影响
+```
+
+## ✅ 解决方案准则
+
+### 方案质量标准
+
+提供的解决方案应该：
+
+- **✅ 低侵入性** - 最小化对现有代码的修改
+- **✅ 可维护性** - 易于理解和后续维护
+- **✅ 类型安全** - 符合 TypeScript 规范
+- **✅ 最佳实践** - 遵循项目的编码规范
+- **✅ 测试友好** - 便于编写和运行测试
+- **❌ 避免长期 Hack** - 临时方案可以 hack，但要明确标注
+
+### 解决方案模板
+
+```markdown
+## 问题原因
+
+[简要说明问题产生的根本原因]
+
+## 解决方案
+
+[详细的解决步骤]
+
+## 代码修改
+
+[具体的代码变更]
+
+## 验证方法
+
+[如何验证问题已解决]
+
+## 预防措施
+
+[如何避免类似问题再次发生]
+```
+
+## 🔄 迭代调试流程
+
+如果初次解决方案无效：
+
+1.  **重新收集信息** - 基于新的错误信息搜索
+2.  **深入代码分析** - 查看更多相关代码文件
+3.  **运行相关测试** - 编写或运行一个失败的测试来稳定复现问题。
+4.  **扩大搜索范围** - 搜索更广泛的相关问题
+5.  **请求更多日志** - 添加更详细的调试信息
+6.  **提供临时方案** - 如果根本解决方案复杂，先提供临时修复
+7.  **分解问题** - 将复杂问题拆解为更小的子问题
@@ -10,7 +10,7 @@ Emoji logo: 🤯

 ## Project Technologies Stack

-read [package.json](mdc:package.json) to know all npm packages you can use.
+read [package.json](mdc:package.json) to know all npm packages you can use. read [folder-structure.mdx](mdc:docs/development/basic/folder-structure.mdx) to learn project structure.

 The project uses the following technologies:

@@ -42,3 +42,17 @@ The project uses the following technologies:
 - Cursor AI for code editing and AI coding assistance

 Note: All tools and libraries used are the latest versions. The application only needs to be compatible with the latest browsers;
+
+## Often used npm scripts and commands
+
+```bash
+# !: don't  any build script to check weather code can work after modify
+# type check
+bun run type-check
+
+# install dependencies
+pnpm install
+
+# run tests
+npx vitest run --config vitest.config.ts '[file-path-pattern]'
+```
@@ -1,239 +0,0 @@
---
-description: Project directory structure overview
-alwaysApply: false
---
-
-# LobeChat Project Structure
-
-## Directory Structure
-
-note: some files are not shown for simplicity.
-
-```plaintext
-lobe-chat/
-├── apps/                           # Applications directory
-│   └── desktop/                    # Electron desktop application
-│       ├── src/                    # Desktop app source code
-│       └── resources/              # Desktop app resources
-├── docs/                           # Project documentation
-│   ├── development/                # Development docs
-│   ├── self-hosting/               # Self-hosting docs
-│   └── usage/                      # Usage guides
-├── locales/                        # Internationalization files (multiple locales)
-│   ├── en-US/                      # English (example)
-│   └── zh-CN/                      # Simplified Chinese (example)
-├── packages/                       # Monorepo packages directory
-│   ├── const/                      # Constants definition package
-│   ├── database/                   # Database related package
-│   ├── electron-client-ipc/        # Electron renderer ↔ main IPC client
-│   ├── electron-server-ipc/        # Electron main process IPC server
-│   ├── model-bank/                 # Built-in model presets/catalog exports
-│   ├── model-runtime/              # AI model runtime package
-│   ├── types/                      # TypeScript type definitions
-│   ├── utils/                      # Utility functions package
-│   ├── file-loaders/               # File processing packages
-│   ├── prompts/                    # AI prompt management
-│   └── web-crawler/                # Web crawling functionality
-├── public/                         # Static assets
-│   ├── icons/                      # Application icons
-│   ├── images/                     # Image resources
-│   └── screenshots/                # Application screenshots
-├── scripts/                        # Build and tool scripts
-├── src/                            # Main application source code (see below)
-├── .cursor/                        # Cursor AI configuration
-├── docker-compose/                 # Docker configuration
-├── package.json                    # Project dependencies
-├── pnpm-workspace.yaml            # pnpm monorepo configuration
-├── next.config.ts                  # Next.js configuration
-├── drizzle.config.ts              # Drizzle ORM configuration
-└── tsconfig.json                   # TypeScript configuration
-```
-
-## Core Source Directory (`src/`)
-
-```plaintext
-src/
-├── app/                            # Next.js App Router routes
-│   ├── (backend)/                  # Backend API routes
-│   │   ├── api/                    # REST API endpoints
-│   │   │   ├── auth/               # Authentication endpoints
-│   │   │   └── webhooks/           # Webhook handlers for various auth providers
-│   │   ├── middleware/             # Request middleware
-│   │   ├── oidc/                   # OpenID Connect endpoints
-│   │   ├── trpc/                   # tRPC API routes
-│   │   │   ├── async/              # Async tRPC endpoints
-│   │   │   ├── desktop/            # Desktop runtime endpoints
-│   │   │   ├── edge/               # Edge runtime endpoints
-│   │   │   ├── lambda/             # Lambda runtime endpoints
-│   │   │   └── tools/              # Tools-specific endpoints
-│   │   └── webapi/                 # Web API endpoints
-│   │       ├── chat/               # Chat-related APIs for various providers
-│   │       ├── models/             # Model management APIs
-│   │       ├── plugin/             # Plugin system APIs
-│   │       ├── stt/                # Speech-to-text APIs
-│   │       ├── text-to-image/      # Image generation APIs
-│   │       └── tts/                # Text-to-speech APIs
-│   ├── [variants]/                 # Page route variants
-│   │   ├── (main)/                 # Main application routes
-│   │   │   ├── chat/               # Chat interface and workspace
-│   │   │   ├── discover/           # Discover page (assistants, models, providers)
-│   │   │   ├── files/              # File management interface
-│   │   │   ├── image/              # Image generation interface
-│   │   │   ├── profile/            # User profile and stats
-│   │   │   ├── repos/              # Knowledge base repositories
-│   │   │   └── settings/           # Application settings
-│   │   └── @modal/                 # Modal routes
-│   └── manifest.ts                 # PWA configuration
-├── components/                     # Global shared components
-│   ├── Analytics/                  # Analytics tracking components
-│   ├── Error/                      # Error handling components
-│   └── Loading/                    # Loading state components
-├── config/                         # Application configuration
-│   ├── featureFlags/               # Feature flags & experiments
-│   └── modelProviders/             # Model provider configurations
-├── features/                       # Feature components (UI Layer)
-│   ├── AgentSetting/               # Agent configuration and management
-│   ├── ChatInput/                  # Chat input with file upload and tools
-│   ├── Conversation/               # Message display and interaction
-│   ├── FileManager/                # File upload and knowledge base
-│   └── PluginStore/                # Plugin marketplace and management
-├── hooks/                          # Custom React hooks
-├── layout/                         # Global layout components
-│   ├── AuthProvider/               # Authentication provider
-│   └── GlobalProvider/             # Global state provider
-├── libs/                           # External library integrations
-│   ├── analytics/                  # Analytics services integration
-│   ├── next-auth/                  # NextAuth.js configuration
-│   └── oidc-provider/              # OIDC provider implementation
-├── locales/                        # Internationalization resources
-│   └── default/                    # Default language definitions
-├── migrations/                     # Client-side data migrations
-├── server/                         # Server-side code
-│   ├── modules/                    # Server modules
-│   ├── routers/                    # tRPC routers
-│   └── services/                   # Server services
-├── services/                       # Service layer (per-domain, client/server split)
-│   ├── user/                       # User services
-│   │   ├── client.ts               # Client DB (PGLite) implementation
-│   │   └── server.ts               # Server DB implementation (via tRPC)
-│   ├── aiModel/                    # AI model services
-│   ├── session/                    # Session services
-│   └── message/                    # Message services
-├── store/                          # Zustand state management
-│   ├── agent/                      # Agent state
-│   ├── chat/                       # Chat state
-│   └── user/                       # User state
-├── styles/                         # Global styles
-├── tools/                          # Built-in tool system
-│   ├── artifacts/                  # Code artifacts and preview
-│   └── web-browsing/               # Web search and browsing
-├── types/                          # TypeScript type definitions
-└── utils/                          # Utility functions
-    ├── client/                     # Client-side utilities
-    └── server/                     # Server-side utilities
-```
-
-## Key Monorepo Packages
-
-```plaintext
-packages/
-├── const/                          # Global constants and configurations
-├── database/                       # Database schemas and models
-│   ├── src/models/                 # Data models (CRUD operations)
-│   ├── src/schemas/                # Drizzle database schemas
-│   ├── src/repositories/           # Complex query layer
-│   └── migrations/                 # Database migration files
-├── model-runtime/                  # AI model runtime
-│   └── src/
-│       ├── openai/                 # OpenAI provider integration
-│       ├── anthropic/              # Anthropic provider integration
-│       ├── google/                 # Google AI provider integration
-│       ├── ollama/                 # Ollama local model integration
-│       ├── types/                  # Runtime type definitions
-│       └── utils/                  # Runtime utilities
-├── types/                          # Shared TypeScript type definitions
-│   └── src/
-│       ├── agent/                  # Agent-related types
-│       ├── message/                # Message and chat types
-│       ├── user/                   # User and session types
-│       └── tool/                   # Tool and plugin types
-├── utils/                          # Shared utility functions
-│   └── src/
-│       ├── client/                 # Client-side utilities
-│       ├── server/                 # Server-side utilities
-│       ├── fetch/                  # HTTP request utilities
-│       └── tokenizer/              # Token counting utilities
-├── file-loaders/                   # File loaders (PDF, DOCX, etc.)
-├── prompts/                        # AI prompt management
-└── web-crawler/                    # Web crawling functionality
-```
-
-## Architecture Map
-
- Presentation: `src/features`, `src/components`, `src/layout` — UI composition, global providers
- State: `src/store` — Zustand slices, selectors, middleware
- Client Services: `src/services/<domain>/{client|server}.ts` — client: PGLite; server: tRPC bridge
- API Routers: `src/app/(backend)/webapi` (REST), `src/app/(backend)/trpc/{edge|lambda|async|desktop|tools}`; Lambda router triggers Async router for long-running tasks (e.g., image)
- Server Services: `src/server/services` (business logic), `src/server/modules` (infra adapters)
- Data Access: `packages/database/src/{schemas,models,repositories}` — Schema (Drizzle), Model (CRUD), Repository (complex queries)
- Integrations: `src/libs` — analytics, auth, trpc, logging, runtime helpers
-
-## Data Flow Architecture
-
-### Unified Flow Pattern
-
-```
-UI Layer → State Management → Client Service → [Environment Branch] → Database
-   ↓              ↓               ↓                    ↓                ↓
- React         Zustand     Environment         Local/Remote        PGLite/
-Components      Store      Adaptation            Routing          PostgreSQL
-```
-
-### Environment-Specific Routing
-
-| Mode            | UI       | Service Route          | Database            |
-| --------------- | -------- | ---------------------- | ------------------- |
-| **Browser/PWA** | React    | Direct Model Access    | PGLite (Local)      |
-| **Server**      | React    | tRPC → Server Services | PostgreSQL (Remote) |
-| **Desktop**     | Electron | tRPC → Local Node.js   | PGLite/PostgreSQL\* |
-
-_\*Depends on cloud sync configuration_
-
-### Key Characteristics
-
- **Type Safety**: End-to-end type safety via tRPC and Drizzle ORM
- **Local/Remote Dual Mode**: PGLite enables user data ownership and local control
-
-## Quick Map
-
- App Routes: `src/app` — UI routes (App Router) and backend routes under `(backend)`
- Web API: `src/app/(backend)/webapi` — REST-like endpoints
- tRPC Routers: `src/server/routers` — typed RPC endpoints by runtime
- Client Services: `src/services` — environment-adaptive client-side business logic
- Server Services: `src/server/services` — platform-agnostic business logic
- Database: `packages/database` — schemas/models/repositories/migrations
- State: `src/store` — Zustand stores and slices
- Integrations: `src/libs` — analytics/auth/trpc/logging/runtime helpers
- Tools: `src/tools` — built-in tool system
-
-## Common Tasks
-
- Add Web API route: `src/app/(backend)/webapi/<module>/route.ts`
- Add tRPC endpoint: `src/server/routers/{edge|lambda|desktop}/...`
- Add client/server service: `src/services/<domain>/{client|server}.ts` (client: PGLite; server: tRPC)
- Add server service: `src/server/services/<domain>`
- Add a new model/provider: `src/config/modelProviders/<provider>.ts` + `packages/model-bank/src/aiModels/<provider>.ts` + `packages/model-runtime/src/<provider>/index.ts`
- Add DB schema/model/repository: `packages/database/src/{schemas|models|repositories}`
- Add Zustand slice: `src/store/<domain>/slices`
-
-## Env Modes
-
- `NEXT_PUBLIC_CLIENT_DB`: selects client DB mode (e.g., `pglite`) vs server-backed
- `NEXT_PUBLIC_IS_DESKTOP_APP`: enables desktop-specific routes and behavior
- `NEXT_PUBLIC_SERVICE_MODE`: controls service routing preference (client/server)
-
-## Boundaries
-
- Keep client logic in `src/services`; server-only logic stays in `src/server/services`
- Don’t mix Web API (`webapi/`) with tRPC (`src/server/routers/`)
- Place business UI under `src/features`, global reusable UI under `src/components`
@@ -5,8 +5,6 @@ alwaysApply: false

 ## 🗃️ 数据库 Model 测试指南

-测试 `packages/database` 下的数据库 Model 层。
-
 ### 测试环境选择 💡

 数据库 Model 层通过环境变量控制数据库类型，在两种测试环境下有不同的数据库后端：客户端环境 (PGLite) 和 服务端环境 (PostgreSQL)
@@ -19,10 +17,10 @@ alwaysApply: false

 ```bash
 # 1. 先在客户端环境测试（快速验证）
-cd packages/database && TEST_SERVER_DB=0 bunx vitest run --silent='passed-only' src/database/models/__tests__/myModel.test.ts
+npx vitest run --config vitest.config.ts src/database/models/__tests__/myModel.test.ts

-# 2. 再在服务端环境测试（兼容性验证）, 需要设置环境变量 `TEST_SERVER_DB=1`
-cd packages/database && TEST_SERVER_DB=1 bunx vitest run --silent='passed-only' src/database/models/__tests__/myModel.test.ts #
+# 2. 再在服务端环境测试（兼容性验证）
+npx vitest run --config vitest.config.server.ts src/database/models/__tests__/myModel.test.ts
 ```

 ### 创建新 Model 测试的最佳实践 📋
@@ -5,11 +5,11 @@ alwaysApply: false

 # 测试指南 - LobeChat Testing Guide

-## 测试环境概览
+## 🧪 测试环境概览

 LobeChat 项目使用 Vitest 测试库，配置了两种不同的测试环境：

-### 客户端数据库测试环境 (DOM Environment)
+### 客户端测试环境 (DOM Environment)

 - **配置文件**: [vitest.config.ts](mdc:vitest.config.ts)
 - **环境**: Happy DOM (浏览器环境模拟)
@@ -17,71 +17,60 @@ LobeChat 项目使用 Vitest 测试库，配置了两种不同的测试环境：
 - **用途**: 测试前端组件、客户端逻辑、React 组件等
 - **设置文件**: [tests/setup.ts](mdc:tests/setup.ts)

-### 服务端数据库测试环境 (Node Environment)
+### 服务端测试环境 (Node Environment)

-目前只有 `packages/database` 下的测试可以通过配置 `TEST_SERVER_DB=1` 环境变量来使用服务端数据库测试
-
- **配置文件**: [packages/database/vitest.config.mts](mdc:packages/database/vitest.config.mts) 并且设置环境变量 `TEST_SERVER_DB=1`
+- **配置文件**: [vitest.config.server.ts](mdc:vitest.config.server.ts)
 - **环境**: Node.js
 - **数据库**: 真实的 PostgreSQL 数据库
 - **并发限制**: 单线程运行 (`singleFork: true`)
 - **用途**: 测试数据库模型、服务端逻辑、API 端点等
- **设置文件**: [packages/database/tests/setup-db.ts](mdc:packages/database/tests/setup-db.ts)
+- **设置文件**: [tests/setup-db.ts](mdc:tests/setup-db.ts)

-## 测试运行命令
+## 🚀 测试运行命令

-** 性能警告**: 项目包含 3000+ 测试用例，完整运行需要约 10 分钟。务必使用文件过滤或测试名称过滤。
+**🚨 性能警告**: 项目包含 3000+ 测试用例，完整运行需要约 10 分钟。务必使用文件过滤或测试名称过滤。

-### 正确的命令格式
+### ✅ 正确的命令格式

 ```bash
 # 运行所有客户端/服务端测试
-bunx vitest run --silent='passed-only'                                          # 客户端测试
-cd packages/database && TEST_SERVER_DB=1 bunx vitest run --silent='passed-only' # 服务端测试
+npx vitest run --config vitest.config.ts        # 客户端测试
+npx vitest run --config vitest.config.server.ts # 服务端测试

 # 运行特定测试文件 (支持模糊匹配)
-bunx vitest run --silent='passed-only' user.test.ts
+npx vitest run --config vitest.config.ts user.test.ts

 # 运行特定测试用例名称 (使用 -t 参数)
-bunx vitest run --silent='passed-only' -t "test case name"
+npx vitest run --config vitest.config.ts -t "test case name"

 # 组合使用文件和测试名称过滤
-bunx vitest run --silent='passed-only' filename.test.ts -t "specific test"
+npx vitest run --config vitest.config.ts filename.test.ts -t "specific test"

 # 生成覆盖率报告 (使用 --coverage 参数)
-bunx vitest run --silent='passed-only' --coverage
+npx vitest run --config vitest.config.ts --coverage
 ```

-### 避免的命令格式
+### ❌ 避免的命令格式

 ```bash
-#  这些命令会运行所有 3000+ 测试用例，耗时约 10 分钟！
+# ❌ 这些命令会运行所有 3000+ 测试用例，耗时约 10 分钟！
 npm test
 npm test some-file.test.ts

-#  不要使用裸 vitest (会进入 watch 模式)
+# ❌ 不要使用裸 vitest (会进入 watch 模式)
 vitest test-file.test.ts
 ```

-## 测试修复原则
+## 🔧 测试修复原则

-### 核心原则
+### 核心原则 ⚠️

-1. **收集足够的上下文**  
-   在修复测试之前，务必做到：
-   - 完整理解测试的意图和实现
-   - 强烈建议阅读当前的 git diff 和 PR diff
+1. **充分阅读测试代码**: 在修复测试之前，必须完整理解测试的意图和实现
+2. **测试优先修复**: 如果是测试本身写错了，修改测试而不是实现代码
+3. **专注单一问题**: 只修复指定的测试，不要添加额外测试或功能
+4. **不自作主张**: 不要因为发现其他问题就直接修改，先提出再讨论

-2. **测试优先修复**  
-   如果是测试本身写错了，应优先修改测试，而不是实现代码。
-
-3. **专注单一问题**  
-   只修复指定的测试，不要顺带添加额外测试。
-
-4. **不自作主张**  
-   发现其他问题时，不要直接修改，需先提出并讨论。
-
-### 测试协作最佳实践
+### 测试协作最佳实践 🤝

 基于实际开发经验总结的重要协作原则：

@@ -95,10 +84,10 @@ vitest test-file.test.ts
 - **避免陷阱**: 不要陷入"不断尝试相同或类似方法"的循环

 ```typescript
-//  错误做法：连续失败后继续盲目尝试
+// ❌ 错误做法：连续失败后继续盲目尝试
 // 第3次、第4次仍在用相似的方法修复同一个问题

-//  正确做法：失败1-2次后总结问题
+// ✅ 正确做法：失败1-2次后总结问题
 /*
 问题总结：
 1. 尝试过的方法：修改 mock 数据结构
@@ -117,7 +106,7 @@ vitest test-file.test.ts
 - **保持稳定性**: 测试名称应该在代码重构后仍然有意义

 ```typescript
-//  错误的测试命名
+// ❌ 错误的测试命名
 describe('User component coverage', () => {
  it('covers line 45-50 in getUserData', () => {
    // 为了覆盖第45-50行而写的测试
@@ -128,7 +117,7 @@ describe('User component coverage', () => {
  });
 });

-//  正确的测试命名
+// ✅ 正确的测试命名
 describe('<UserAvatar />', () => {
  it('should render fallback icon when image url is not provided', () => {
    // 测试具体的业务场景，自然会覆盖相关代码分支
@@ -142,8 +131,8 @@ describe('<UserAvatar />', () => {

 **覆盖率提升的正确思路**:

- 通过设计各种业务场景（正常流程、边缘情况、错误处理）来自然提升覆盖率
- 不要为了达到覆盖率数字而写测试，更不要在测试中注释"为了覆盖 xxx 行"
+- ✅ 通过设计各种业务场景（正常流程、边缘情况、错误处理）来自然提升覆盖率
+- ❌ 不要为了达到覆盖率数字而写测试，更不要在测试中注释"为了覆盖 xxx 行"

 #### 3. 测试组织结构

@@ -154,7 +143,7 @@ describe('<UserAvatar />', () => {
 - **避免碎片化**: 不要为了单个测试用例就创建新的顶级 `describe` 块

 ```typescript
-//  错误的组织方式：创建过多顶级块
+// ❌ 错误的组织方式：创建过多顶级块
 describe('<UserProfile />', () => {
  it('should render user name', () => {});
 });
@@ -169,7 +158,7 @@ describe('UserProfile edge cases', () => {
  it('should handle missing avatar', () => {});
 });

-//  正确的组织方式：合并相关测试
+// ✅ 正确的组织方式：合并相关测试
 describe('<UserProfile />', () => {
  it('should render user name', () => {});

@@ -225,9 +214,9 @@ describe('<UserProfile />', () => {
 **修复方法**: 更新了测试文件中的 mock 数据结构，使其与最新的 API 响应格式保持一致。具体修改了 `user.test.ts` 中的 `mockUserData` 对象结构。
 ```

-## 测试编写最佳实践
+## 🎯 测试编写最佳实践

-### Mock 数据策略：追求"低成本的真实性"
+### Mock 数据策略：追求"低成本的真实性" 📋

 **核心原则**: 测试数据应默认追求真实性，只有在引入"高昂的测试成本"时才进行简化。

@@ -239,10 +228,10 @@ describe('<UserProfile />', () => {
 - **网络请求**：HTTP 调用、数据库连接
 - **系统调用**：获取系统时间、环境变量等

-#### 推荐做法：Mock 依赖，保留真实数据
+#### ✅ 推荐做法：Mock 依赖，保留真实数据

 ```typescript
-//  好的做法：Mock I/O 操作，但使用真实的文件内容格式
+// ✅ 好的做法：Mock I/O 操作，但使用真实的文件内容格式
 describe('parseContentType', () => {
  beforeEach(() => {
    // Mock 文件读取操作（避免真实 I/O）
@@ -260,7 +249,7 @@ describe('parseContentType', () => {
  });
 });

-//  过度简化：使用不真实的数据
+// ❌ 过度简化：使用不真实的数据
 describe('parseContentType', () => {
  it('should detect PDF content type correctly', () => {
    // 这种简化数据没有测试价值
@@ -270,116 +259,78 @@ describe('parseContentType', () => {
 });
 ```

-#### 真实标识符的价值
+#### 🎯 真实标识符的价值

 ```typescript
-// ✅ 使用真实标识符
-const result = parseModelString('openai', '+gpt-4,+gpt-3.5-turbo');
+// ✅ 使用真实的提供商标识符
+it('should parse OpenAI model list correctly', () => {
+  const result = parseModelString('openai', '+gpt-4,+gpt-3.5-turbo');
+  expect(result.add).toHaveLength(2);
+  expect(result.add[0].id).toBe('gpt-4');
+});

-// ❌ 使用占位符（价值较低）
-const result = parseModelString('test-provider', '+model1,+model2');
-```
-
-### 现代化Mock技巧：环境设置与Mock方法
-
-**环境设置 + Mock方法结合使用**
-
-客户端代码测试时，推荐使用环境注释配合现代化Mock方法：
-
-```typescript
-/**
- * @vitest-environment happy-dom  // 提供浏览器API
- */
-import { beforeEach, vi } from 'vitest';
-
-beforeEach(() => {
-  // 现代方法1：使用vi.stubGlobal替代global.xxx = ...
-  const mockImage = vi.fn().mockImplementation(() => ({
-    addEventListener: vi.fn(),
-    naturalHeight: 600,
-    naturalWidth: 800,
-  }));
-  vi.stubGlobal('Image', mockImage);
-
-  // 现代方法2：使用vi.spyOn保留原功能，只mock特定方法
-  vi.spyOn(URL, 'createObjectURL').mockReturnValue('blob:mock-url');
-  vi.spyOn(URL, 'revokeObjectURL').mockImplementation(() => {});
+// ❌ 使用占位符标识符（价值较低）
+it('should parse model list correctly', () => {
+  const result = parseModelString('test-provider', '+model1,+model2');
+  expect(result.add).toHaveLength(2);
+  // 这种测试对理解真实场景帮助不大
 });
 ```

-**环境选择优先级**
-
-1. **@vitest-environment happy-dom** (推荐) - 轻量、快速，项目已安装
-2. **@vitest-environment jsdom** - 功能完整，但需要额外安装jsdom包
-3. **不设置环境** - Node.js环境，需要手动mock所有浏览器API
-
-**Mock方法对比**
-
-```typescript
-// ❌ 旧方法：直接操作global对象（类型问题）
-global.Image = mockImage;
-global.URL = { ...global.URL, createObjectURL: mockFn };
-
-// ✅ 现代方法：类型安全的vi API
-vi.stubGlobal('Image', mockImage); // 完全替换全局对象
-vi.spyOn(URL, 'createObjectURL'); // 部分mock，保留其他功能
-```
-
-### 测试覆盖率原则：代码分支优于用例数量
-
-**核心原则**: 优先覆盖所有代码分支，而非编写大量重复用例
-
-```typescript
-// ❌ 过度测试：29个测试用例都验证相同分支
-describe('getImageDimensions', () => {
-  it('should reject .txt files');
-  it('should reject .pdf files');
-  // ... 25个类似测试，都走相同的验证分支
-});
-
-// ✅ 精简测试：4个核心用例覆盖所有分支
-describe('getImageDimensions', () => {
-  it('should return dimensions for valid File object'); // 成功路径 - File
-  it('should return dimensions for valid data URI'); // 成功路径 - String
-  it('should return undefined for invalid inputs'); // 输入验证分支
-  it('should return undefined when image fails to load'); // 错误处理分支
-});
-```
-
-**分支覆盖策略**
-
-1. **成功路径** - 每种输入类型1个测试即可
-2. **边界条件** - 合并类似场景到单个测试
-3. **错误处理** - 测试代表性错误即可
-4. **业务逻辑** - 覆盖所有if/else分支
-
-**合理测试数量**
-
- 简单工具函数：2-5个测试
- 复杂业务逻辑：5-10个测试
- 核心安全功能：适当增加，但避免重复路径
-
-### 错误处理测试：测试"行为"而非"文本"
+### 错误处理测试：测试"行为"而非"文本" ⚠️

 **核心原则**: 测试应该验证程序在错误发生时的行为是可预测的，而不是验证易变的错误信息文本。

-#### 推荐的错误测试方式
+#### ✅ 推荐的错误测试方式

 ```typescript
-// ✅ 测试错误类型和属性
-expect(() => validateUser({})).toThrow(ValidationError);
-expect(() => processPayment({})).toThrow(
-  expect.objectContaining({
-    code: 'INVALID_PAYMENT_DATA',
-    statusCode: 400,
-  }),
-);
+// ✅ 测试是否抛出错误
+it('should throw error when invalid input provided', () => {
+  expect(() => processInput(null)).toThrow();
+});

-// ❌ 避免测试具体错误文本
-expect(() => processUser({})).toThrow('用户数据不能为空，请检查输入参数');
+// ✅ 测试错误类型（最推荐）
+it('should throw ValidationError for invalid data', () => {
+  expect(() => validateUser({})).toThrow(ValidationError);
+});
+
+// ✅ 测试错误属性而非消息文本
+it('should throw error with correct error code', () => {
+  expect(() => processPayment({})).toThrow(
+    expect.objectContaining({
+      code: 'INVALID_PAYMENT_DATA',
+      statusCode: 400,
+    }),
+  );
+});
 ```

-### 疑难解答：警惕模块污染
+#### ❌ 应避免的做法
+
+```typescript
+// ❌ 过度依赖具体错误信息文本
+it('should throw specific error message', () => {
+  expect(() => processUser({})).toThrow('用户数据不能为空，请检查输入参数');
+  // 这种测试很脆弱，错误文案稍有修改就会失败
+});
+```
+
+#### 🎯 例外情况：何时可以测试错误信息
+
+```typescript
+// ✅ 测试标准 API 错误（这是契约的一部分）
+it('should return proper HTTP error for API', () => {
+  expect(response.statusCode).toBe(400);
+  expect(response.error).toBe('Bad Request');
+});
+
+// ✅ 测试错误信息的关键部分（使用正则）
+it('should include field name in validation error', () => {
+  expect(() => validateField('email', '')).toThrow(/email/i);
+});
+```
+
+### 疑难解答：警惕模块污染 🚨

 **识别信号**: 当你的测试出现以下"灵异"现象时，优先怀疑模块污染：

@@ -390,25 +341,55 @@ expect(() => processUser({})).toThrow('用户数据不能为空，请检查输
 #### 典型场景：动态 Mock 同一模块

 ```typescript
-// ❌ 问题：动态Mock同一模块
-it('dev mode', async () => {
-  vi.doMock('./config', () => ({ isDev: true }));
-  const { getSettings } = await import('./service'); // 可能使用缓存
+// ❌ 容易出现模块污染的写法
+describe('ConfigService', () => {
+  it('should work in development mode', async () => {
+    vi.doMock('./config', () => ({ isDev: true }));
+    const { getSettings } = await import('./configService'); // 第一次加载
+    expect(getSettings().debugMode).toBe(true);
+  });
+
+  it('should work in production mode', async () => {
+    vi.doMock('./config', () => ({ isDev: false }));
+    const { getSettings } = await import('./configService'); // 可能使用缓存的旧版本！
+    expect(getSettings().debugMode).toBe(false); // ❌ 可能失败
+  });
 });

-// ✅ 解决：清除模块缓存
-beforeEach(() => {
-  vi.resetModules(); // 确保每个测试都是干净环境
+// ✅ 使用 resetModules 解决模块污染
+describe('ConfigService', () => {
+  beforeEach(() => {
+    vi.resetModules(); // 清除模块缓存，确保每个测试都是干净的环境
+  });
+
+  it('should work in development mode', async () => {
+    vi.doMock('./config', () => ({ isDev: true }));
+    const { getSettings } = await import('./configService');
+    expect(getSettings().debugMode).toBe(true);
+  });
+
+  it('should work in production mode', async () => {
+    vi.doMock('./config', () => ({ isDev: false }));
+    const { getSettings } = await import('./configService');
+    expect(getSettings().debugMode).toBe(false); // ✅ 测试通过
+  });
 });
 ```

-**记住**: `vi.resetModules()` 是解决测试"灵异"失败的终极武器。
+#### 🔧 排查和解决步骤

-## 测试文件组织
+1. **识别问题**: 测试失败时，首先问自己："是否有多个测试在 Mock 同一个模块？"
+2. **添加隔离**: 在 `beforeEach` 中添加 `vi.resetModules()`
+3. **验证修复**: 重新运行测试，确认问题解决
+
+**记住**: `vi.resetModules()` 是解决测试"灵异"失败的终极武器，当常规调试方法都无效时，它往往能一针见血地解决问题。
+
+## 📂 测试文件组织

 ### 文件命名约定

-`*.test.ts`, `*.test.tsx` (任意位置)
+- **客户端测试**: `*.test.ts`, `*.test.tsx` (任意位置)
+- **服务端测试**: `src/database/models/**/*.test.ts`, `src/database/server/**/*.test.ts` (限定路径)

 ### 测试文件组织风格

@@ -425,10 +406,7 @@ src/components/Button/
 └── index.test.tsx      # 测试文件
 ```

- 也有少数情况会统一放到 `__tests__` 文件夹， 例如 `packages/database/src/models/__tests__`
- 测试使用的辅助文件放到 fixtures 文件夹
-
-## 测试调试技巧
+## 🛠️ 测试调试技巧

 ### 测试调试步骤

@@ -437,28 +415,40 @@ src/components/Button/
 3. **分析错误**: 仔细阅读错误信息、堆栈跟踪和最近的文件修改记录
 4. **添加调试**: 在测试中添加 `console.log` 了解执行流程

-### TypeScript 类型处理
+### TypeScript 类型处理 📝

 在测试中，为了提高编写效率和可读性，可以适当放宽 TypeScript 类型检测：

-#### 推荐的类型放宽策略
+#### ✅ 推荐的类型放宽策略

 ```typescript
-//  使用非空断言访问测试中确定存在的属性
+// ✅ 使用非空断言访问测试中确定存在的属性
 const result = await someFunction();
 expect(result!.data).toBeDefined();
 expect(result!.status).toBe('success');

-//  使用 any 类型简化复杂的 Mock 设置
+// ✅ 使用 any 类型简化复杂的 Mock 设置
 const mockStream = new ReadableStream() as any;
 mockStream.toReadableStream = () => mockStream;

-//  访问私有成员
-await instance['getFromCache']('key'); // 推荐中括号
-await (instance as any).getFromCache('key'); // 避免as any
+// ✅ 使用中括号访问私有属性和方法（推荐）
+class MyClass {
+  private _cache = new Map();
+  private getFromCache(key: string) { /* ... */ }
+}
+
+const instance = new MyClass();
+
+// 推荐：使用中括号访问私有成员
+await instance['getFromCache']('test-key');
+expect(instance['_cache'].size).toBe(1);
+
+// 避免：使用 as any 访问私有成员
+await (instance as any).getFromCache('test-key');  // ❌ 不推荐
+expect((instance as any)._cache.size).toBe(1);     // ❌ 不推荐
 ```

-#### 适用场景
+#### 🎯 适用场景

 - **Mock 对象**: 对于测试用的 Mock 数据，使用 `as any` 避免复杂的类型定义
 - **第三方库**: 处理复杂的第三方库类型时，适当使用 `any` 提高效率
@@ -466,30 +456,44 @@ await (instance as any).getFromCache('key'); // 避免as any
 - **私有成员访问**: 优先使用中括号 `instance['privateMethod']()` 而不是 `(instance as any).privateMethod()`
 - **临时调试**: 快速编写测试时，先用 `any` 保证功能，后续可选择性地优化类型

-#### 注意事项
+#### ⚠️ 注意事项

 - **适度使用**: 不要过度依赖 `any`，核心业务逻辑的类型仍应保持严格
 - **私有成员访问优先级**: 中括号访问 > `as any` 转换，保持更好的类型安全性
 - **文档说明**: 对于使用 `any` 的复杂场景，添加注释说明原因
 - **测试覆盖**: 确保即使使用了 `any`，测试仍能有效验证功能正确性

-### 检查最近修改记录
+### 检查最近修改记录 🔍

-**核心原则**：测试突然失败时，优先检查最近的代码修改。
+系统性地检查相关文件的修改历史是问题定位的关键步骤。

-#### 快速检查方法
+#### 三步检查法
+
+**Step 1: 查看当前状态**

 ```bash
-git status                  # 查看当前修改状态
-git diff HEAD -- '*.test.*' # 检查测试文件改动
-git diff main...HEAD        # 对比主分支差异
-gh pr diff                  # 查看PR中的所有改动
+git status                               # 查看未提交的修改
+git diff path/to/component.test.ts | cat # 查看测试文件修改
+git diff path/to/component.ts | cat      # 查看实现文件修改
 ```

-#### 常见原因与解决
+**Step 2: 查看提交历史**

- **最新提交引入bug** → 检查并修复实现代码
- **分支代码滞后** → `git rebase main` 同步主分支
+```bash
+git log --pretty=format:"%h %ad %s" --date=relative -3 path/to/component.ts | cat
+```
+
+**Step 3: 查看具体修改内容**
+
+```bash
+git show HEAD -- path/to/component.ts | cat # 查看最新提交的修改
+```
+
+#### 时间相关性判断
+
+- **24小时内的提交**: 🔴 **高度相关** - 很可能是直接原因
+- **1-7天内的提交**: 🟡 **中等相关** - 需要仔细分析
+- **超过1周的提交**: ⚪ **低相关性** - 除非重大重构

 ## 特殊场景的测试

@@ -498,9 +502,9 @@ gh pr diff                  # 查看PR中的所有改动
 - [Electron IPC 接口测试策略](mdc:./electron-ipc-test.mdc)
 - [数据库 Model 测试指南](mdc:./db-model-test.mdc)

-## 核心要点
+## 🎯 核心要点

- **命令格式**: 使用 `bunx vitest run --silent='passed-only'` 并指定文件过滤
+- **命令格式**: 使用 `npx vitest run --config [config-file]` 并指定文件过滤
 - **修复原则**: 失败1-2次后寻求帮助，测试命名关注行为而非实现细节
 - **调试流程**: 复现 → 分析 → 假设 → 修复 → 验证 → 总结
 - **文件组织**: 优先在现有 `describe` 块中添加测试，避免创建冗余顶级块
@@ -4,14 +4,6 @@
 # Specify your API Key selection method, currently supporting `random` and `turn`.
 # API_KEY_SELECT_MODE=random

-########################################
-########### Security Settings ###########
-########################################
-
-# Control Content Security Policy headers
-# Set to '1' to enable X-Frame-Options and Content-Security-Policy headers
-# Default is '0' (enabled)
-# ENABLED_CSP=1

 ########################################
 ########## AI Provider Service #########
@@ -161,17 +153,6 @@ OPENAI_API_KEY=sk-xxxxxxxxx

 # AIHUBMIX_API_KEY=sk-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx

-### BFL ###
-
-# BFL_API_KEY=bfl-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
-
-### FAL ###
-
-# FAL_API_KEY=fal-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
-
-### Nebius ###
-
-# NEBIUS_API_KEY=sk-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx

 ########################################
 ############ Market Service ############
@@ -1,122 +0,0 @@
-# LobeChat Development Server Configuration
-# This file contains environment variables for both LobeChat server mode and Docker compose setup
-
-COMPOSE_FILE="docker-compose.development.yml"
-
-# ⚠️⚠️⚠️ DO NOT USE THE SECRETS BELOW IN PRODUCTION!
-UNSAFE_SECRET="ww+0igxjGRAAR/eTNFQ55VmhQB5KE5trFZseuntThJs="
-UNSAFE_PASSWORD="CHANGE_THIS_PASSWORD_IN_PRODUCTION"
-
-# Core Server Configuration
-# Service mode - set to 'server' for server-side deployment
-NEXT_PUBLIC_SERVICE_MODE=server
-
-# Service Ports Configuration
-LOBE_PORT=3010
-
-# Application URL - the base URL where LobeChat will be accessible
-APP_URL=http://localhost:${LOBE_PORT}
-
-# Secret key for encrypting vault data (generate with: openssl rand -base64 32)
-KEY_VAULTS_SECRET=${UNSAFE_SECRET}
-
-# Database Configuration
-# Database name for LobeChat
-LOBE_DB_NAME=lobechat
-
-# PostgreSQL password
-POSTGRES_PASSWORD=${UNSAFE_PASSWORD}
-
-# PostgreSQL database connection URL
-DATABASE_URL=postgresql://postgres:${POSTGRES_PASSWORD}@localhost:5432/${LOBE_DB_NAME}
-
-# Database driver type
-DATABASE_DRIVER=node
-
-# Authentication Configuration
-# Enable NextAuth authentication
-NEXT_PUBLIC_ENABLE_NEXT_AUTH=1
-
-# NextAuth secret for JWT signing (generate with: openssl rand -base64 32)
-NEXT_AUTH_SECRET=${UNSAFE_SECRET}
-
-NEXTAUTH_URL=${APP_URL}
-
-# Authentication URL
-AUTH_URL=${APP_URL}/api/auth
-
-# SSO providers configuration - using Casdoor for development
-NEXT_AUTH_SSO_PROVIDERS=casdoor
-
-# Casdoor Configuration
-# Casdoor service port
-CASDOOR_PORT=8000
-
-# Casdoor OIDC issuer URL
-AUTH_CASDOOR_ISSUER=http://localhost:${CASDOOR_PORT}
-
-# Casdoor application client ID
-AUTH_CASDOOR_ID=a387a4892ee19b1a2249 # DO NOT USE IN PROD
-
-# Casdoor application client secret
-AUTH_CASDOOR_SECRET=dbf205949d704de81b0b5b3603174e23fbecc354 # DO NOT USE IN PROD
-
-# Origin URL for Casdoor internal configuration
-origin=http://localhost:${CASDOOR_PORT}
-
-# MinIO Storage Configuration
-# MinIO service port
-MINIO_PORT=9000
-
-# MinIO root user (admin username)
-MINIO_ROOT_USER=admin
-
-# MinIO root password
-MINIO_ROOT_PASSWORD=${UNSAFE_PASSWORD}
-
-# MinIO bucket for LobeChat files
-MINIO_LOBE_BUCKET=lobe
-
-# S3/MinIO Configuration for LobeChat
-# S3/MinIO access key ID
-S3_ACCESS_KEY_ID=${MINIO_ROOT_USER}
-
-# S3/MinIO secret access key
-S3_SECRET_ACCESS_KEY=${MINIO_ROOT_PASSWORD}
-
-# S3/MinIO endpoint URL
-S3_ENDPOINT=http://localhost:${MINIO_PORT}
-
-# S3 bucket name for storing files
-S3_BUCKET=${MINIO_LOBE_BUCKET}
-
-# Public domain for S3 file access
-S3_PUBLIC_DOMAIN=http://localhost:${MINIO_PORT}
-
-# Enable path-style S3 requests (required for MinIO)
-S3_ENABLE_PATH_STYLE=1
-
-# Disable S3 ACL setting (for MinIO compatibility)
-S3_SET_ACL=0
-
-# Use base64 encoding for LLM vision images
-LLM_VISION_IMAGE_USE_BASE64=1
-
-# Search Service Configuration
-# SearXNG search engine URL
-SEARXNG_URL=http://searxng:8080
-
-# Development Options
-# Uncomment to skip authentication during development
-
-# Proxy Configuration (Optional)
-# Uncomment if you need proxy support (e.g., for GitHub auth or API access)
-# HTTP_PROXY=http://localhost:7890
-# HTTPS_PROXY=http://localhost:7890
-
-# AI Model Configuration (Optional)
-# Add your AI model API keys and configurations here
-# ⚠️  WARNING: Never commit real API keys to version control!
-# OPENAI_API_KEY=sk-NEVER_USE_REAL_API_KEYS_IN_CONFIG_FILES
-# OPENAI_PROXY_URL=https://api.openai.com/v1
-# OPENAI_MODEL_LIST=...
@@ -8,7 +8,6 @@
 - [ ] 💄 style
 - [ ] 👷 build
 - [ ] ⚡️ perf
- [ ] ✅ test
 - [ ] 📝 docs
 - [ ] 🔨 chore

@@ -41,7 +41,7 @@ jobs:
            actions: read

          # Optional: Specify model (defaults to Claude Sonnet 4, uncomment for Claude Opus 4)
-          # model: 'claude-opus-4-1-20250805'
+          model: 'claude-opus-4-1-20250805'
          allowed_bots: 'bot'

          # Optional: Customize the trigger phrase (default: @claude)
@@ -51,7 +51,7 @@ jobs:
          # assignee_trigger: "claude-bot"

          # Optional: Allow Claude to run specific commands
-          allowed_tools: 'Bash(bun run:*),Bash(pnpm run:*),Bash(npm run:*),Bash(npx:*),Bash(bunx:*),Bash(vitest:*),Bash(rg:*),Bash(find:*),Bash(sed:*),Bash(grep:*),Bash(awk:*),Bash(wc:*),Bash(xargs:*)'
+          allowed_tools: 'Bash(bun run:*),Bash(pnpm run:*),Bash(npm run:*),Bash(npx vitest:*),Bash(rg:*),Bash(find:*),Bash(sed:*),Bash(grep:*),Bash(awk:*),Bash(wc:*),Bash(xargs:*)'

          # Optional: Add custom instructions for Claude to customize its behavior for your project
          # custom_instructions: |
@@ -16,15 +16,11 @@ jobs:
          POSTGRES_PASSWORD: postgres
        options: >-
          --health-cmd pg_isready --health-interval 10s --health-timeout 5s  --health-retries 5
-
-
        ports:
          - 5432:5432

    steps:
      - uses: actions/checkout@v5
-        with:
-          token: ${{ secrets.GH_TOKEN }}

      - name: Setup Node.js
        uses: actions/setup-node@v4
@@ -42,8 +38,10 @@ jobs:
      - name: Lint
        run: bun run lint

+      - uses: pnpm/action-setup@v4
+
      - name: Test Database Coverage
-        run: bun run --filter @lobechat/database test
+        run: pnpm --filter @lobechat/database test
        env:
          DATABASE_TEST_URL: postgresql://postgres:postgres@localhost:5432/postgres
          DATABASE_DRIVER: node
@@ -7,7 +7,7 @@ permissions:

 jobs:
  # Package tests - using each package's own test script
-  test-intenral-packages:
+  test-packages:
    runs-on: ubuntu-latest
    strategy:
      matrix:
@@ -23,39 +23,7 @@ jobs:
        with:
          node-version: 22

-      - name: Install bun
-        uses: oven-sh/setup-bun@v1
-        with:
-          bun-version: ${{ secrets.BUN_VERSION }}
-
-      - name: Install deps
-        run: bun i
-
-      - name: Test ${{ matrix.package }} package with coverage
-        run: bun run --filter @lobechat/${{ matrix.package }} test:coverage
-
-      - name: Upload ${{ matrix.package }} coverage to Codecov
-        uses: codecov/codecov-action@v4
-        with:
-          token: ${{ secrets.CODECOV_TOKEN }}
-          files: ./packages/${{ matrix.package }}/coverage/lcov.info
-          flags: packages/${{ matrix.package }}
-
-  test-packages:
-    runs-on: ubuntu-latest
-    strategy:
-      matrix:
-        package: [model-bank]
-
-    name: Test package ${{ matrix.package }}
-
-    steps:
-      - uses: actions/checkout@v5
-
-      - name: Setup Node.js
-        uses: actions/setup-node@v4
-        with:
-          node-version: 22
+      - uses: pnpm/action-setup@v4

      - name: Install bun
        uses: oven-sh/setup-bun@v1
@@ -66,7 +34,7 @@ jobs:
        run: bun i

      - name: Test ${{ matrix.package }} package with coverage
-        run: bun run --filter ${{ matrix.package }} test:coverage
+        run: pnpm --filter @lobechat/${{ matrix.package }} test:coverage

      - name: Upload ${{ matrix.package }} coverage to Codecov
        uses: codecov/codecov-action@v4
@@ -75,7 +43,6 @@ jobs:
          files: ./packages/${{ matrix.package }}/coverage/lcov.info
          flags: packages/${{ matrix.package }}

-
  # App tests
  test-website:
    name: Test Website
@@ -120,8 +87,6 @@ jobs:
          POSTGRES_PASSWORD: postgres
        options: >-
          --health-cmd pg_isready --health-interval 10s --health-timeout 5s  --health-retries 5
-
-
        ports:
          - 5432:5432

@@ -144,15 +109,10 @@ jobs:
      - name: Lint
        run: bun run lint

-      - name: Test Client DB
-        run: bun run --filter @lobechat/database test:client-db
-        env:
-          KEY_VAULTS_SECRET: LA7n9k3JdEcbSgml2sxfw+4TV1AzaaFU5+R176aQz4s=
-          S3_PUBLIC_DOMAIN: https://example.com
-          APP_URL: https://home.com
+      - uses: pnpm/action-setup@v4

      - name: Test Coverage
-        run: bun run --filter @lobechat/database test:coverage
+        run: pnpm --filter @lobechat/database test:coverage
        env:
          DATABASE_TEST_URL: postgresql://postgres:postgres@localhost:5432/postgres
          DATABASE_DRIVER: node
@@ -104,9 +104,6 @@ vertex-ai-key.json

 CLAUDE.local.md

-# MCP tools
-.serena/**
-
 # Misc
 ./packages/lobe-ui
 *.ppt*
@@ -25,7 +25,7 @@ module.exports = defineConfig({
  ],
  temperature: 0,
  saveImmediately: true,
-  modelName: 'gpt-4.1-mini',
+  modelName: 'gpt-5-mini',
  experimental: {
    jsonMode: true,
  },
@@ -4,9 +4,6 @@ resolution-mode=highest
 ignore-workspace-root-check=true
 enable-pre-post-scripts=true

-# Load dotenv files for all the npm scripts
-node-options="--require dotenv-expand/config"
-
 public-hoist-pattern[]=*@umijs/lint*
 public-hoist-pattern[]=*changelog*
 public-hoist-pattern[]=*commitlint*
@@ -5,6 +5,7 @@
 .DS_Store
 .editorconfig
 .idea
+.vscode
 .history
 .temp
 .env.local
@@ -1,93 +1,89 @@
 {
-  "editor.codeActionsOnSave": {
-    "source.addMissingImports": "explicit",
-    "source.fixAll.eslint": "explicit",
-    "source.fixAll.stylelint": "explicit"
-  },
-  "editor.formatOnSave": true,
-  // don't show errors, but fix when save and git pre commit
-  "eslint.rules.customizations": [
-    { "rule": "import/order", "severity": "off" },
-    { "rule": "prettier/prettier", "severity": "off" },
-    { "rule": "react/jsx-sort-props", "severity": "off" },
-    { "rule": "sort-keys-fix/sort-keys-fix", "severity": "off" },
-    { "rule": "typescript-sort-keys/interface", "severity": "off" }
-  ],
-  "eslint.validate": [
-    "javascript",
-    "javascriptreact",
-    "typescript",
-    "typescriptreact",
-    // support mdx
-    "mdx"
-  ],
-  "npm.packageManager": "pnpm",
-  "search.exclude": {
-    "**/node_modules": true,
-    // useless to search this big folder
-    "locales": true
-  },
-  "stylelint.validate": [
-    "css",
-    "postcss",
-    // make stylelint work with tsx antd-style css template string
-    "typescriptreact"
-  ],
-  "vitest.maximumConfigs": 20,
-  "workbench.editor.customLabels.patterns": {
-    "**/app/**/[[]*[]]/[[]*[]]/page.tsx": "${dirname(2)}/${dirname(1)}/${dirname} • page component",
-    "**/app/**/[[]*[]]/page.tsx": "${dirname(1)}/${dirname} • page component",
-    "**/app/**/page.tsx": "${dirname} • page component",
+    "npm.packageManager": "pnpm",
+    // don't show errors, but fix when save and git pre commit
+    "eslint.rules.customizations": [
+        { "rule": "import/order", "severity": "off" },
+        { "rule": "prettier/prettier", "severity": "off" },
+        { "rule": "react/jsx-sort-props", "severity": "off" },
+        { "rule": "sort-keys-fix/sort-keys-fix", "severity": "off" },
+        { "rule": "typescript-sort-keys/interface", "severity": "off" }
+    ],
+    "stylelint.validate": [
+        "css",
+        "postcss",
+        // make stylelint work with tsx antd-style css template string
+        "typescriptreact"
+    ],
+    "search.exclude": {
+        "**/node_modules": true,
+        // useless to search this big folder
+        "locales": true
+    },
+    "vitest.maximumConfigs": 6,
+    "workbench.editor.customLabels.patterns": {
+        "**/app/**/[[]*[]]/[[]*[]]/page.tsx": "${dirname(2)}/${dirname(1)}/${dirname} • page component",
+        "**/app/**/[[]*[]]/page.tsx": "${dirname(1)}/${dirname} • page component",
+        "**/app/**/page.tsx": "${dirname} • page component",

-    "**/app/**/[[]*[]]/[[]*[]]/layout.tsx": "${dirname(2)}/${dirname(1)}/${dirname} • page layout",
-    "**/app/**/[[]*[]]/layout.tsx": "${dirname(1)}/${dirname} • page layout",
-    "**/app/**/layout.tsx": "${dirname} • page layout",
+        "**/app/**/[[]*[]]/[[]*[]]/layout.tsx": "${dirname(2)}/${dirname(1)}/${dirname} • page layout",
+        "**/app/**/[[]*[]]/layout.tsx": "${dirname(1)}/${dirname} • page layout",
+        "**/app/**/layout.tsx": "${dirname} • page layout",

-    "**/app/**/[[]*[]]/[[]*[]]/default.tsx": "${dirname(2)}/${dirname(1)}/${dirname} • slot default",
-    "**/app/**/[[]*[]]/default.tsx": "${dirname(1)}/${dirname} • slot default",
-    "**/app/**/default.tsx": "${dirname} • slot default",
+        "**/app/**/[[]*[]]/[[]*[]]/default.tsx": "${dirname(2)}/${dirname(1)}/${dirname} • slot default",
+        "**/app/**/[[]*[]]/default.tsx": "${dirname(1)}/${dirname} • slot default",
+        "**/app/**/default.tsx": "${dirname} • slot default",

-    "**/app/**/[[]*[]]/[[]*[]]/error.tsx": "${dirname(2)}/${dirname(1)}/${dirname} • error component",
-    "**/app/**/[[]*[]]/error.tsx": "${dirname(1)}/${dirname} • error component",
-    "**/app/**/error.tsx": "${dirname} • error component",
+        "**/app/**/[[]*[]]/[[]*[]]/error.tsx": "${dirname(2)}/${dirname(1)}/${dirname} • error component",
+        "**/app/**/[[]*[]]/error.tsx": "${dirname(1)}/${dirname} • error component",
+        "**/app/**/error.tsx": "${dirname} • error component",

-    "**/app/**/[[]*[]]/[[]*[]]/loading.tsx": "${dirname(2)}/${dirname(1)}/${dirname} • loading component",
-    "**/app/**/[[]*[]]/loading.tsx": "${dirname(1)}/${dirname} • loading component",
-    "**/app/**/loading.tsx": "${dirname} • loading component",
+        "**/app/**/[[]*[]]/[[]*[]]/loading.tsx": "${dirname(2)}/${dirname(1)}/${dirname} • loading component",
+        "**/app/**/[[]*[]]/loading.tsx": "${dirname(1)}/${dirname} • loading component",
+        "**/app/**/loading.tsx": "${dirname} • loading component",

-    "**/src/**/route.ts": "${dirname(1)}/${dirname} • route",
-    "**/src/**/index.tsx": "${dirname} • component",
+        "**/src/**/route.ts": "${dirname(1)}/${dirname} • route",
+        "**/src/**/index.tsx": "${dirname} • component",

-    "**/packages/database/src/repositories/*/index.ts": "${dirname} • db repository",
-    "**/packages/database/src/models/*.ts": "${filename} • db model",
-    "**/packages/database/src/schemas/*.ts": "${filename} • db schema",
+        "**/src/database/repositories/*/index.ts": "${dirname} • db repository",
+        "**/src/database/models/*.ts": "${filename} • db model",
+        "**/src/database/schemas/*.ts": "${filename} • db schema",

-    "**/src/services/*.ts": "${filename} • service",
-    "**/src/services/*/client.ts": "${dirname} • client service",
-    "**/src/services/*/server.ts": "${dirname} • server service",
+        "**/src/services/*.ts": "${filename} • service",
+        "**/src/services/*/client.ts": "${dirname} • client service",
+        "**/src/services/*/server.ts": "${dirname} • server service",
+        
+        "**/src/store/*/action.ts": "${dirname} • action",
+        "**/src/store/*/slices/*/action.ts": "${dirname(2)}/${dirname} • action",
+        "**/src/store/*/slices/*/actions/*.ts": "${dirname(1)}/${dirname}/${filename} • action",
+        
+        "**/src/store/*/initialState.ts": "${dirname} • state",
+        "**/src/store/*/slices/*/initialState.ts": "${dirname(2)}/${dirname} • state",
+        
+        "**/src/store/*/selectors.ts": "${dirname} • selectors",
+        "**/src/store/*/slices/*/selectors.ts": "${dirname(2)}/${dirname} • selectors",
+        
+        "**/src/store/*/reducer.ts": "${dirname} • reducer",
+        "**/src/store/*/slices/*/reducer.ts": "${dirname(2)}/${dirname} • reducer",
+        
+        "**/src/config/modelProviders/*.ts": "${filename} • provider",
+        "**/src/config/aiModels/*.ts": "${filename} • model",
+        "**/src/config/paramsSchemas/*/*.json": "${dirname(1)}/${filename} • params",
+        "**/packages/model-runtime/src/*/index.ts": "${dirname} • runtime",
+        
+        "**/src/server/services/*/index.ts": "${dirname} • server/service",
+        "**/src/server/routers/lambda/*.ts": "${filename} • lambda",
+        "**/src/server/routers/async/*.ts": "${filename} • async",
+        "**/src/server/routers/edge/*.ts": "${filename} • edge",

-    "**/src/store/*/action.ts": "${dirname} • action",
-    "**/src/store/*/slices/*/action.ts": "${dirname(2)}/${dirname} • action",
-    "**/src/store/*/slices/*/actions/*.ts": "${dirname(1)}/${dirname}/${filename} • action",
-
-    "**/src/store/*/initialState.ts": "${dirname} • state",
-    "**/src/store/*/slices/*/initialState.ts": "${dirname(2)}/${dirname} • state",
-
-    "**/src/store/*/selectors.ts": "${dirname} • selectors",
-    "**/src/store/*/slices/*/selectors.ts": "${dirname(2)}/${dirname} • selectors",
-
-    "**/src/store/*/reducer.ts": "${dirname} • reducer",
-    "**/src/store/*/slices/*/reducer.ts": "${dirname(2)}/${dirname} • reducer",
-
-    "**/src/config/modelProviders/*.ts": "${filename} • provider",
-    "**/packages/model-bank/src/aiModels/*.ts": "${filename} • model",
-    "**/packages/model-runtime/src/*/index.ts": "${dirname} • runtime",
-
-    "**/src/server/services/*/index.ts": "${dirname} • server/service",
-    "**/src/server/routers/lambda/*.ts": "${filename} • lambda",
-    "**/src/server/routers/async/*.ts": "${filename} • async",
-    "**/src/server/routers/edge/*.ts": "${filename} • edge",
-
-    "**/src/locales/default/*.ts": "${filename} • locale"
-  }
-}
+        "**/src/locales/default/*.ts": "${filename} • locale",
+    },
+    "eslint.validate": [
+        "javascript",
+        "javascriptreact",
+        "typescript",
+        "typescriptreact",
+        "markdown",
+        // support mdx
+        "mdx"
+    ]
+}
@@ -1,133 +0,0 @@
-# LobeChat Development Guidelines
-
-This document serves as a comprehensive guide for all team members when developing LobeChat.
-
-## Tech Stack
-
-Built with modern technologies:
-
- **Frontend**: Next.js 15, React 19, TypeScript
- **UI Components**: Ant Design, @lobehub/ui, antd-style
- **State Management**: Zustand, SWR
- **Database**: PostgreSQL, PGLite, Drizzle ORM
- **Testing**: Vitest, Testing Library
- **Package Manager**: pnpm (monorepo structure)
- **Build Tools**: Next.js (Turbopack in dev, Webpack in prod), Vitest
-
-## Directory Structure
-
-The project follows a well-organized monorepo structure:
-
- `apps/` - Main applications
- `packages/` - Shared packages and libraries
- `src/` - Main source code
- `docs/` - Documentation
- `.cursor/rules/` - Development rules and guidelines
-
-## Development Workflow
-
-### Git Workflow
-
- Use rebase for git pull: `git pull --rebase`
- Git commit messages should prefix with gitmoji
- Git branch name format: `username/feat/feature-name`
- Use `.github/PULL_REQUEST_TEMPLATE.md` for PR descriptions
-
-### Package Management
-
- Use `pnpm` as the primary package manager
- Use `bun` to run npm scripts
- Use `bunx` to run executable npm packages
- Navigate to specific packages using `cd packages/<package-name>`
-
-### Code Style Guidelines
-
-#### TypeScript
-
- Follow strict TypeScript practices for type safety and code quality
- Use proper type annotations
- Prefer interfaces over types for object shapes
- Use generics for reusable components
-
-#### React Components
-
- Use functional components with hooks
- Follow the component structure guidelines
- Use antd-style & @lobehub/ui for styling
- Implement proper error boundaries
-
-#### Database Schema
-
- Follow Drizzle ORM naming conventions
- Use plural snake_case for table names
- Implement proper foreign key relationships
- Follow the schema style guide
-
-### Testing Strategy
-
-**Required Rule**: `testing-guide/testing-guide.mdc`
-
-**Commands**:
-
- Web: `bunx vitest run --silent='passed-only' '[file-path-pattern]'`
- Packages: `cd packages/[package-name] && bunx vitest run --silent='passed-only' '[file-path-pattern]'`
-
-**Important Notes**:
-
- Wrap file paths in single quotes to avoid shell expansion
- Never run `bun run test` - this runs all tests and takes ~10 minutes
- If a test fails twice, stop and ask for help
- Always add tests for new code
-
-### Type Checking
-
- Use `bun run type-check` to check for type errors
- Ensure all TypeScript errors are resolved before committing
-
-### Internationalization
-
- Add new keys to `src/locales/default/namespace.ts`
- Translate at least `zh-CN` files for development preview
- Use hierarchical nested objects, not flat keys
- Don't run `pnpm i18n` manually (handled by CI)
-
-## Available Development Rules
-
-The project provides comprehensive rules in `.cursor/rules/` directory:
-
-### Core Development
-
- `backend-architecture.mdc` - Three-layer architecture and data flow
- `react-component.mdc` - Component patterns and UI library usage
- `drizzle-schema-style-guide.mdc` - Database schema conventions
- `define-database-model.mdc` - Model templates and CRUD patterns
- `i18n.mdc` - Internationalization workflow
-
-### State Management & UI
-
- `zustand-slice-organization.mdc` - Store organization patterns
- `zustand-action-patterns.mdc` - Action implementation patterns
- `packages/react-layout-kit.mdc` - Flex layout component usage
-
-### Testing & Quality
-
- `testing-guide/testing-guide.mdc` - Comprehensive testing strategy
- `code-review.mdc` - Code review process and standards
-
-### Desktop (Electron)
-
- `desktop-feature-implementation.mdc` - Main/renderer process patterns
- `desktop-local-tools-implement.mdc` - Tool integration workflow
- `desktop-menu-configuration.mdc` - Menu system configuration
- `desktop-window-management.mdc` - Window management patterns
- `desktop-controller-tests.mdc` - Controller testing guide
-
-## Best Practices
-
- **Conservative for existing code, modern approaches for new features**
- **Code Language**: Use Chinese for files with existing Chinese comments, American English for new files
- Always add tests for new functionality
- Follow the established patterns in the codebase
- Use proper error handling and logging
- Implement proper accessibility features
- Consider internationalization from the start
@@ -2,30 +2,45 @@

 This document serves as a shared guideline for all team members when using Claude Code in this repository.

-## Tech Stack
+## Suggestions

-read @.cursor/rules/project-introduce.mdc
+- When searching the project source code, it is recommended to exclude: `src/database/migrations/meta`, `**/*.test.*`, `**/__snapshots__`, `**/fixtures`
+- Please store all temporary scripts (such as migration and refactoring scripts) in the `docs/.local/` directory; the contents of this folder will not be committed.

-## Directory Structure
+## Technologies Stack

-read @.cursor/rules/project-structure.mdc
+read @.cursor/rules/project-introduce.mdc for more details.
+
+### Directory Structure
+
+```plaintext
+src/
+├── app/                 # Next.js App Router
+├── features/            # Feature-based UI components
+├── store/              # Zustand state stores
+├── services/           # Client services (tRPC/Model calls)
+├── server/             # Server-side (tRPC routers, services)
+├── database/           # Schemas, models, repositories
+├── libs/               # External library integrations
+```
+
+### Data Flow
+
+- **Client DB Version**: UI → Zustand → Service → Model → PGLite
+- **Server DB Version**: UI → Zustand → Service → tRPC → Repository/Model → PostgreSQL

 ## Development

 ### Git Workflow

- use rebase for git pull
- git commit message should prefix with gitmoji
+- use rebase for git pull.
+- git commit message should prefix with gitmoji.
 - git branch name format example: tj/feat/feature-name
 - use .github/PULL_REQUEST_TEMPLATE.md to generate pull request description

 ### Package Management

-This repository adopts a monorepo structure.
-
- Use `pnpm` as the primary package manager for dependency management
- Use `bun` to run npm scripts
- Use `bunx` to run executable npm packages
+this is a monorepo project and we use `pnpm` as package manager

 ### TypeScript Code Style Guide

@@ -44,13 +59,10 @@ see @.cursor/rules/typescript.mdc
 Testing work follows the Rule-Aware Task Execution system above.

 - **Required Rule**: `testing-guide/testing-guide.mdc`
- **Command**:
-  - web: `bunx vitest run --silent='passed-only' '[file-path-pattern]'`
-  - packages(eg: database): `cd packages/database && bunx vitest run --silent='passed-only' '[file-path-pattern]'`
+- **Command**: `npx vitest run --config vitest.config.ts '[file-path-pattern]'`, wrapped in single quotes to avoid shell expansion

 **Important**:

- wrapped the file path in single quotes to avoid shell expansion
 - Never run `bun run test` etc to run tests, this will run all tests and cost about 10mins
 - If try to fix the same test twice, but still failed, stop and ask for help.

@@ -58,11 +70,12 @@ Testing work follows the Rule-Aware Task Execution system above.

 - use `bun run type-check` to check type errors.

-### i18n
+### Internationalization

 - **Keys**: Add to `src/locales/default/namespace.ts`
- **Dev**: Translate `locales/zh-CN/namespace.json` locale file only for preview
- DON'T run `pnpm i18n`, let CI auto handle it
+- **Dev**: Translate at least `zh-CN` files for preview
+- **Structure**: Hierarchical nested objects, not flat keys
+- **Script**: DON'T run `pnpm i18n` (user/CI handles it)

 ## Rules Index

@@ -78,13 +91,12 @@ Some useful rules of this project. Read them when needed.
 - `react-component.mdc` - antd-style, Lobe UI usage
 - `drizzle-schema-style-guide.mdc` - Schema naming, patterns
 - `define-database-model.mdc` - Model templates, CRUD patterns
- `i18n.mdc` - Internationalization workflow

 **State & UI**

 - `zustand-slice-organization.mdc` - Store organization
 - `zustand-action-patterns.mdc` - Action patterns
- `packages/react-layout-kit.mdc` - flex layout components usage
+- `packages/react-layout-kit.mdc` - Layout components usage

 **Testing & Quality**

@@ -98,3 +110,8 @@ Some useful rules of this project. Read them when needed.
 - `desktop-menu-configuration.mdc` - App menu, context menu, tray menu
 - `desktop-window-management.mdc` - Window creation, state management, multi-window
 - `desktop-controller-tests.mdc` - Controller unit testing guide
+
+**Development Tools**
+
+- `i18n.mdc` - Internationalization workflow
+- `debug.mdc` - Debugging strategies
@@ -66,7 +66,7 @@ ENV NEXT_PUBLIC_ANALYTICS_UMAMI="${NEXT_PUBLIC_ANALYTICS_UMAMI}" \
    NEXT_PUBLIC_UMAMI_WEBSITE_ID="${NEXT_PUBLIC_UMAMI_WEBSITE_ID}"

 # Node
-ENV NODE_OPTIONS="--max-old-space-size=6144"
+ENV NODE_OPTIONS="--max-old-space-size=8192"

 WORKDIR /app

@@ -194,8 +194,6 @@ ENV \
    MODELSCOPE_API_KEY="" MODELSCOPE_MODEL_LIST="" MODELSCOPE_PROXY_URL="" \
    # Moonshot
    MOONSHOT_API_KEY="" MOONSHOT_MODEL_LIST="" MOONSHOT_PROXY_URL="" \
-    # Nebius
-    NEBIUS_API_KEY="" NEBIUS_MODEL_LIST="" NEBIUS_PROXY_URL="" \
    # Novita
    NOVITA_API_KEY="" NOVITA_MODEL_LIST="" \
    # Nvidia NIM
@@ -251,11 +249,7 @@ ENV \
    # Infini-AI
    INFINIAI_API_KEY="" INFINIAI_MODEL_LIST="" \
    # 302.AI
-    AI302_API_KEY="" AI302_MODEL_LIST="" \
-    # FAL
-    FAL_API_KEY="" FAL_MODEL_LIST="" \
-    # BFL
-    BFL_API_KEY="" BFL_MODEL_LIST=""
+    AI302_API_KEY="" AI302_MODEL_LIST=""

 USER nextjs

@@ -74,7 +74,7 @@ ENV NEXT_PUBLIC_ANALYTICS_UMAMI="${NEXT_PUBLIC_ANALYTICS_UMAMI}" \
    NEXT_PUBLIC_UMAMI_WEBSITE_ID="${NEXT_PUBLIC_UMAMI_WEBSITE_ID}"

 # Node
-ENV NODE_OPTIONS="--max-old-space-size=6144"
+ENV NODE_OPTIONS="--max-old-space-size=8192"

 WORKDIR /app

@@ -236,8 +236,6 @@ ENV \
    MODELSCOPE_API_KEY="" MODELSCOPE_MODEL_LIST="" MODELSCOPE_PROXY_URL="" \
    # Moonshot
    MOONSHOT_API_KEY="" MOONSHOT_MODEL_LIST="" MOONSHOT_PROXY_URL="" \
-    # Nebius
-    NEBIUS_API_KEY="" NEBIUS_MODEL_LIST="" NEBIUS_PROXY_URL="" \
    # Novita
    NOVITA_API_KEY="" NOVITA_MODEL_LIST="" \
    # Nvidia NIM
@@ -293,11 +291,7 @@ ENV \
    # Infini-AI
    INFINIAI_API_KEY="" INFINIAI_MODEL_LIST="" \
    # 302.AI
-    AI302_API_KEY="" AI302_MODEL_LIST="" \
-    # FAL
-    FAL_API_KEY="" FAL_MODEL_LIST="" \
-    # BFL
-    BFL_API_KEY="" BFL_MODEL_LIST=""
+    AI302_API_KEY="" AI302_MODEL_LIST=""

 USER nextjs

@@ -68,7 +68,7 @@ ENV NEXT_PUBLIC_ANALYTICS_UMAMI="${NEXT_PUBLIC_ANALYTICS_UMAMI}" \
    NEXT_PUBLIC_UMAMI_WEBSITE_ID="${NEXT_PUBLIC_UMAMI_WEBSITE_ID}"

 # Node
-ENV NODE_OPTIONS="--max-old-space-size=6144"
+ENV NODE_OPTIONS="--max-old-space-size=8192"

 WORKDIR /app

@@ -196,8 +196,6 @@ ENV \
    MODELSCOPE_API_KEY="" MODELSCOPE_MODEL_LIST="" MODELSCOPE_PROXY_URL="" \
    # Moonshot
    MOONSHOT_API_KEY="" MOONSHOT_MODEL_LIST="" MOONSHOT_PROXY_URL="" \
-    # Nebius
-    NEBIUS_API_KEY="" NEBIUS_MODEL_LIST="" NEBIUS_PROXY_URL="" \
    # Novita
    NOVITA_API_KEY="" NOVITA_MODEL_LIST="" \
    # Nvidia NIM
@@ -249,11 +247,7 @@ ENV \
    # Infini-AI
    INFINIAI_API_KEY="" INFINIAI_MODEL_LIST="" \
    # 302.AI
-    AI302_API_KEY="" AI302_MODEL_LIST="" \
-    # FAL
-    FAL_API_KEY="" FAL_MODEL_LIST="" \
-    # BFL
-    BFL_API_KEY="" BFL_MODEL_LIST=""
+    AI302_API_KEY="" AI302_MODEL_LIST=""

 USER nextjs

@@ -150,7 +150,7 @@ From productivity tools to development environments, discover new ways to extend

 **Peak Performance, Zero Distractions**

-Get the full LobeChat experience without browser limitations—comprehensive, focused, and always ready to go. Our desktop application provides a dedicated environment for your AI interactions, ensuring optimal performance and minimal distractions.
+Get the full LobeChat experience without browser limitations—lightweight, focused, and always ready to go. Our desktop application provides a dedicated environment for your AI interactions, ensuring optimal performance and minimal distractions.

 Experience faster response times, better resource management, and a more stable connection to your AI assistant. The desktop app is designed for users who demand the best performance from their AI tools.

@@ -481,7 +481,7 @@ We deeply understand the importance of providing a seamless experience for users
 Therefore, we have adopted Progressive Web Application ([PWA](https://support.google.com/chrome/answer/9658361)) technology,
 a modern web technology that elevates web applications to an experience close to that of native apps.

-Through PWA, LobeChat can offer a highly optimized user experience on both desktop and mobile devices while maintaining high-performance characteristics.
+Through PWA, LobeChat can offer a highly optimized user experience on both desktop and mobile devices while maintaining its lightweight and high-performance characteristics.
 Visually and in terms of feel, we have also meticulously designed the interface to ensure it is indistinguishable from native apps,
 providing smooth animations, responsive layouts, and adapting to different device screen resolutions.

@@ -31,7 +31,6 @@
  "dependencies": {
    "electron-updater": "^6.6.2",
    "electron-window-state": "^5.0.3",
-    "fetch-socks": "^1.3.2",
    "get-port-please": "^3.1.2",
    "pdfjs-dist": "4.10.38"
  },
@@ -52,7 +51,7 @@
    "@typescript/native-preview": "7.0.0-dev.20250711.1",
    "consola": "^3.1.0",
    "cookie": "^1.0.2",
-    "electron": "^37.4.0",
+    "electron": "^37.2.0",
    "electron-builder": "^26.0.12",
    "electron-is": "^3.0.0",
    "electron-log": "^5.3.3",
@@ -25,7 +25,6 @@ export const defaultProxySettings: NetworkProxySettings = {
 * 存储默认值
 */
 export const STORE_DEFAULTS: ElectronMainStore = {
-  autoUpdateNotificationEnabled: true,
  dataSyncConfig: { storageMode: 'local' },
  encryptedTokens: {},
  locale: 'auto',
@@ -1,41 +0,0 @@
-import { createLogger } from '@/utils/logger';
-
-import { ControllerModule, ipcClientEvent } from './index';
-
-// Create logger
-const logger = createLogger('controllers:DownloadCtr');
-
-/**
- * 下载控制器
- * 处理桌面应用的下载相关功能，包括自动更新通知设置
- */
-export default class DownloadCtr extends ControllerModule {
-  /**
-   * 获取自动更新通知设置
-   */
-  @ipcClientEvent('getAutoUpdateNotificationEnabled')
-  async getAutoUpdateNotificationEnabled(): Promise<boolean> {
-    try {
-      const enabled = this.app.storeManager.get('autoUpdateNotificationEnabled', true);
-      logger.debug('Retrieved auto update notification setting:', enabled);
-      return enabled;
-    } catch (error) {
-      logger.error('Failed to get auto update notification setting:', error);
-      return true; // 默认启用
-    }
-  }
-
-  /**
-   * 设置自动更新通知
-   */
-  @ipcClientEvent('setAutoUpdateNotificationEnabled')
-  async setAutoUpdateNotificationEnabled(enabled: boolean): Promise<void> {
-    try {
-      this.app.storeManager.set('autoUpdateNotificationEnabled', enabled);
-      logger.info('Auto update notification setting updated:', enabled);
-    } catch (error) {
-      logger.error('Failed to set auto update notification setting:', error);
-      throw error;
-    }
-  }
-}
@@ -1,5 +1,4 @@
 import { NetworkProxySettings } from '@lobechat/electron-client-ipc';
-import { SocksProxies, socksDispatcher } from 'fetch-socks';
 import { Agent, ProxyAgent, getGlobalDispatcher, setGlobalDispatcher } from 'undici';

 import { createLogger } from '@/utils/logger';
@@ -92,29 +91,8 @@ export class ProxyDispatcherManager {
   */
  static createProxyAgent(proxyType: string, proxyUrl: string) {
    try {
-      if (proxyType === 'socks5') {
-        // 解析 SOCKS5 代理 URL
-        const url = new URL(proxyUrl);
-        const socksProxies: SocksProxies = [
-          {
-            host: url.hostname,
-            port: parseInt(url.port, 10),
-            type: 5,
-            ...(url.username && url.password
-              ? {
-                  password: url.password,
-                  userId: url.username,
-                }
-              : {}),
-          },
-        ];
-
-        // 使用 fetch-socks 处理 SOCKS5 代理
-        return socksDispatcher(socksProxies);
-      } else {
-        // undici 的 ProxyAgent 支持 http, https
-        return new ProxyAgent({ uri: proxyUrl });
-      }
+      // undici 的 ProxyAgent 支持 http, https 和 socks5
+      return new ProxyAgent({ uri: proxyUrl });
    } catch (error) {
      logger.error(`Failed to create proxy agent for ${proxyType}:`, error);
      throw new Error(
@@ -1,7 +1,6 @@
 import { DataSyncConfig, NetworkProxySettings } from '@lobechat/electron-client-ipc';

 export interface ElectronMainStore {
-  autoUpdateNotificationEnabled: boolean;
  dataSyncConfig: DataSyncConfig;
  encryptedTokens: {
    accessToken?: string;
@@ -1,286 +1,4 @@
 [
-  {
-    "children": {
-      "fixes": ["Not use branch topic when this topic is not save."]
-    },
-    "date": "2025-09-05",
-    "version": "1.123.2"
-  },
-  {
-    "children": {
-      "improvements": ["Update i18n."]
-    },
-    "date": "2025-09-05",
-    "version": "1.123.1"
-  },
-  {
-    "children": {
-      "features": ["Add NewAPI as a router provider for multi-model aggregation."]
-    },
-    "date": "2025-09-04",
-    "version": "1.123.0"
-  },
-  {
-    "children": {
-      "improvements": ["Make LobeNextAuthDBAdapter Edge Compatible."]
-    },
-    "date": "2025-09-04",
-    "version": "1.122.7"
-  },
-  {
-    "children": {},
-    "date": "2025-09-04",
-    "version": "1.122.6"
-  },
-  {
-    "children": {
-      "improvements": ["Make LobeNextAuthDBAdapter Edge Compatible."]
-    },
-    "date": "2025-09-04",
-    "version": "1.122.5"
-  },
-  {
-    "children": {
-      "improvements": ["Update i18n."]
-    },
-    "date": "2025-09-04",
-    "version": "1.122.4"
-  },
-  {
-    "children": {
-      "fixes": ["Support base64 image from markdown image syntax."],
-      "improvements": ["Update the price of the o3 model in OpenRouter."]
-    },
-    "date": "2025-09-04",
-    "version": "1.122.3"
-  },
-  {
-    "children": {},
-    "date": "2025-09-04",
-    "version": "1.122.2"
-  },
-  {
-    "children": {},
-    "date": "2025-09-04",
-    "version": "1.122.1"
-  },
-  {
-    "children": {
-      "features": ["Refactor to speed up send message in server mode."]
-    },
-    "date": "2025-09-04",
-    "version": "1.122.0"
-  },
-  {
-    "children": {
-      "fixes": ["Fix socks5 proxy not work problem, fix virtuaso minheight was null."]
-    },
-    "date": "2025-09-03",
-    "version": "1.121.1"
-  },
-  {
-    "children": {
-      "features": ["Add nano banana Chinese prompt notify."]
-    },
-    "date": "2025-09-03",
-    "version": "1.121.0"
-  },
-  {
-    "children": {
-      "improvements": ["Update i18n."]
-    },
-    "date": "2025-09-02",
-    "version": "1.120.7"
-  },
-  {
-    "children": {
-      "improvements": ["Add upload hint for non-visual model."]
-    },
-    "date": "2025-09-01",
-    "version": "1.120.6"
-  },
-  {
-    "children": {},
-    "date": "2025-09-01",
-    "version": "1.120.5"
-  },
-  {
-    "children": {
-      "improvements": ["Adjust ControlsForm component to adapt to mobile phone display."]
-    },
-    "date": "2025-09-01",
-    "version": "1.120.4"
-  },
-  {
-    "children": {
-      "improvements": ["Support new provider Nebius."]
-    },
-    "date": "2025-09-01",
-    "version": "1.120.3"
-  },
-  {
-    "children": {
-      "improvements": ["Remove base path."]
-    },
-    "date": "2025-08-31",
-    "version": "1.120.2"
-  },
-  {
-    "children": {
-      "improvements": ["Update i18n."]
-    },
-    "date": "2025-08-31",
-    "version": "1.120.1"
-  },
-  {
-    "children": {
-      "improvements": ["Remove webrtc sync feature flag."],
-      "features": ["Rename Gemini 2.5 flash image to Nano Banana."]
-    },
-    "date": "2025-08-30",
-    "version": "1.120.0"
-  },
-  {
-    "children": {},
-    "date": "2025-08-30",
-    "version": "1.119.2"
-  },
-  {
-    "children": {
-      "fixes": ["Update enableStreaming name."]
-    },
-    "date": "2025-08-30",
-    "version": "1.119.1"
-  },
-  {
-    "children": {
-      "features": ["Added support for Azure OpenAI Image Generation."]
-    },
-    "date": "2025-08-30",
-    "version": "1.119.0"
-  },
-  {
-    "children": {
-      "improvements": ["Update DeepSeek V3.1 & Gemini 2.5 Flash Image Preview models."]
-    },
-    "date": "2025-08-30",
-    "version": "1.118.8"
-  },
-  {
-    "children": {
-      "improvements": ["Update i18n."]
-    },
-    "date": "2025-08-30",
-    "version": "1.118.7"
-  },
-  {
-    "children": {
-      "improvements": ["Support non-stream mode."]
-    },
-    "date": "2025-08-29",
-    "version": "1.118.6"
-  },
-  {
-    "children": {
-      "improvements": ["Fix clerk scrollBox style, ModelFetcher support getting prices."]
-    },
-    "date": "2025-08-29",
-    "version": "1.118.5"
-  },
-  {
-    "children": {
-      "improvements": ["Fix chat session part switch theme issue."]
-    },
-    "date": "2025-08-29",
-    "version": "1.118.4"
-  },
-  {
-    "children": {
-      "fixes": ["Correct totalOutputTokens calculation for XAI provider."]
-    },
-    "date": "2025-08-29",
-    "version": "1.118.3"
-  },
-  {
-    "children": {
-      "improvements": ["Add Grok Code Fast 1 model."]
-    },
-    "date": "2025-08-29",
-    "version": "1.118.2"
-  },
-  {
-    "children": {
-      "fixes": ["Add Content-Security-Policy env."],
-      "improvements": ["Support Gemini URL context tool."]
-    },
-    "date": "2025-08-29",
-    "version": "1.118.1"
-  },
-  {
-    "children": {
-      "features": ["Add new provider AkashChat."]
-    },
-    "date": "2025-08-29",
-    "version": "1.118.0"
-  },
-  {
-    "children": {
-      "improvements": ["Move chat item into chat."]
-    },
-    "date": "2025-08-29",
-    "version": "1.117.1"
-  },
-  {
-    "children": {
-      "features": [
-        "Ai image support Gemini 2.5 Flash Image, Support Gemini 2.5 Flash Image Preview in OpenRouter."
-      ],
-      "improvements": ["Update i18n."]
-    },
-    "date": "2025-08-29",
-    "version": "1.117.0"
-  },
-  {
-    "children": {
-      "improvements": ["Support html preview."]
-    },
-    "date": "2025-08-28",
-    "version": "1.116.4"
-  },
-  {
-    "children": {
-      "fixes": ["Fix desktop route error."]
-    },
-    "date": "2025-08-28",
-    "version": "1.116.3"
-  },
-  {
-    "children": {},
-    "date": "2025-08-28",
-    "version": "1.116.2"
-  },
-  {
-    "children": {},
-    "date": "2025-08-27",
-    "version": "1.116.1"
-  },
-  {
-    "children": {
-      "features": ["Add gemini 2.5 flash image for vertex ai."]
-    },
-    "date": "2025-08-27",
-    "version": "1.116.0"
-  },
-  {
-    "children": {},
-    "date": "2025-08-26",
-    "version": "1.115.0"
-  },
-  {
-    "children": {},
-    "date": "2025-08-22",
-    "version": "1.114.6"
-  },
  {
    "children": {
      "improvements": ["Update mistral model vision ability."]
@@ -1,40 +0,0 @@
-name: lobe-chat-development
-services:
-  network-service:
-    image: alpine
-    container_name: lobe-network
-    restart: always
-    ports:
-      - '${MINIO_PORT}:${MINIO_PORT}' # MinIO API
-      - '9001:9001' # MinIO Console
-      - '${CASDOOR_PORT}:${CASDOOR_PORT}' # Casdoor
-    command: tail -f /dev/null
-    networks:
-      - lobe-network
-
-  postgresql:
-    extends:
-      file: docker-compose/local/docker-compose.yml
-      service: postgresql
-  minio:
-    extends:
-      file: docker-compose/local/docker-compose.yml
-      service: minio
-  casdoor:
-    extends:
-      file: docker-compose/local/docker-compose.yml
-      service: casdoor
-  searxng:
-    extends:
-      file: docker-compose/local/docker-compose.yml
-      service: searxng
-
-volumes:
-  data:
-    driver: local
-  s3_data:
-    driver: local
-
-networks:
-  lobe-network:
-    driver: bridge
@@ -1,2 +0,0 @@
-data/
-s3_data/
@@ -456,7 +456,7 @@ The project uses vitest for unit testing.

 Since our two new configuration fields are both optional, theoretically you could pass the tests without updating them. However, since we added the `openingQuestions` field to the `DEFAULT_AGENT_CONFIG` mentioned earlier, this causes many tests to calculate configurations that include this field, so we still need to update some test snapshots.

-For the current scenario, I recommend running the tests locally to see which tests fail, and then update them as needed. For example, for the test file `src/store/agent/slices/chat/selectors/agent.test.ts`, you need to run `bunx vitest -u src/store/agent/slices/chat/selectors/agent.test.ts` to update the snapshot.
+For the current scenario, I recommend running the tests locally to see which tests fail, and then update them as needed. For example, for the test file `src/store/agent/slices/chat/selectors/agent.test.ts`, you need to run `npx vitest -u src/store/agent/slices/chat/selectors/agent.test.ts` to update the snapshot.

 ## Summary

@@ -456,7 +456,7 @@ export default WelcomeMessage;

 由于我们目前两个新的配置字段都是可选的，所以理论上你不更新测试也能跑通，不过由于我们把前面提到的默认配置 `DEFAULT_AGENT_CONFIG` 增加了 `openingQuestions` 字段，这导致很多测试计算出的配置都是有这个字段的，因此我们还是需要更新一部分测试的快照。

-对于当前这个场景，我建议是本地直接跑下测试，看哪些测试失败了，针对需要更新，例如测试文件 `src/store/agent/slices/chat/selectors/agent.test.ts` 需要执行一下 `bunx vitest -u src/store/agent/slices/chat/selectors/agent.test.ts` 更新快照。
+对于当前这个场景，我建议是本地直接跑下测试，看哪些测试失败了，针对需要更新，例如测试文件 `src/store/agent/slices/chat/selectors/agent.test.ts` 需要执行一下 `npx vitest -u src/store/agent/slices/chat/selectors/agent.test.ts` 更新快照。

 ## 总结

@@ -17,14 +17,10 @@ Before starting development on LobeChat, you need to install and configure some
 First, you need to install the following software:

 - Node.js: LobeChat is built on Node.js, so you need to install Node.js. We recommend installing the latest stable version.
- PNPM: We use PNPM as the preferred package manager. You can download and install it from the [PNPM official website](https://pnpm.io/installation).
- Bun: We use Bun as the npm scripts runner. You can download and install it from the [Bun official website](https://bun.com/docs/installation).
+- Yarn: We use Yarn as the preferred package manager. You can download and install it from the Yarn official website.
+- PNPM: We use PNPM as an auxiliary package manager. You can download and install it from the PNPM official website.
 - Git: We use Git for version control. You can download and install it from the Git official website.
- IDE: You can choose your preferred integrated development environment (IDE). We recommend using WebStorm/VSCode.
-
-### VSCode Users
-
-We recommend installing the extensions listed in [.vscode/extensions.json](https://github.com/lobehub/lobe-chat/blob/main/.vscode/extensions.json) for the best development experience.
+- IDE: You can choose your preferred integrated development environment (IDE). We recommend using WebStorm, a powerful IDE particularly suitable for TypeScript development.

 ### Project Setup

@@ -36,17 +32,24 @@ After installing the above software, you can start setting up the LobeChat proje
 git clone https://github.com/lobehub/lobe-chat.git
 ```

-2. **Install dependencies**: Then, navigate to the project directory and use PNPM to install the project's dependencies:
+2. **Install dependencies**: Then, navigate to the project directory and use Yarn to install the project's dependencies:

 ```bash
 cd lobe-chat
-pnpm i
+yarn install
+```
+
+If you are using PNPM, you can execute:
+
+```bash
+cd lobe-chat
+pnpm install
 ```

 3. **Start the development server**: After installing the dependencies, you can start the development server:

 ```bash
-bun run dev
+yarn run dev
 ```

 Now, you can open `http://localhost:3010` in your browser, and you should see the welcome page of LobeChat. This indicates that you have successfully set up the development environment.
@@ -17,14 +17,10 @@
 首先，你需要安装以下软件：

 - Node.js：LobeChat 是基于 Node.js 构建的，因此你需要安装 Node.js。我们建议安装最新的稳定版。
- PNPM：我们使用 PNPM 作为管理器。你可以从 [pnpm 的官方网站](https://pnpm.io/installation) 上下载并安装。
- Bun：我们使用 Bun 作为 npm scripts runner, 你可以从 [Bun 的官方网站](https://bun.com/docs/installation) 上下载并安装。
+- Bun：我们使用 Bun 作为首选包管理器。你可以从 Bun 的官方网站上下载并安装。
+- PNPM：我们使用 PNPM 作为辅助包管理器。你可以从 pnpm 的官方网站上下载并安装。
 - Git：我们使用 Git 进行版本控制。你可以从 Git 的官方网站上下载并安装。
- IDE：你可以选择你喜欢的集成开发环境（IDE），我们推荐使用 WebStorm/VSCode。
-
-### VSCode 用户
-
-推荐安装 [.vscode/extensions.json](https://github.com/lobehub/lobe-chat/blob/main/.vscode/extensions.json) 中推荐安装的扩展获得最佳开发体验。
+- IDE：你可以选择你喜欢的集成开发环境（IDE）。我们推荐使用 WebStorm，它是一款功能强大的 IDE，特别适合 TypeScript 开发。

 ### 项目设置

@@ -36,7 +32,14 @@
 git clone https://github.com/lobehub/lobe-chat.git
 ```

-2. **安装依赖**：然后，进入项目目录，并使用 `pnpm` 安装项目的依赖包：
+2. **安装依赖**：然后，进入项目目录，并使用 bun 安装项目的依赖包：
+
+```bash
+cd lobe-chat
+bun i
+```
+
+如果你使用 pnpm ，可以执行:

 ```bash
 cd lobe-chat
@@ -51,7 +54,7 @@ bun run dev

 现在，你可以在浏览器中打开 `http://localhost:3010`，你应该能看到 LobeChat 的欢迎页面。这表明你已经成功地设置了开发环境。

-![Chat Page](https://hub-apac-1.lobeobjects.space/docs/fc7b157a3bc016bc97719065f80c555c.png)
+![](https://github-production-user-asset-6210df.s3.amazonaws.com/28616219/274655364-414bc31e-8511-47a3-af17-209b530effc7.png)

 在开发过程中，如果你在环境设置上遇到任何问题，或者有任何关于 LobeChat 开发的问题，欢迎随时向我们提问。我们期待看到你的贡献！

@@ -1,77 +0,0 @@
-# Work with Server-Side Database
-
-LobeChat provides a battery-included experience with its client-side database.
-While some features you really care about is only available at a server-side development.
-
-In order to work with the aspect of server-side database,
-you can setup all the prerequisites by following the [Deploying Server-Side Database](https://lobehub.com/docs/self-hosting/server-database) story.
-But here is the easier approach that can reduce your pain.
-
-## Quick Setup
-
-### Environment Configuration
-
-The project already includes a `.env.development` file with all necessary environment variables for server-side database mode. This file configures:
-
- **Service Mode**: `NEXT_PUBLIC_SERVICE_MODE=server`
- **Database**: PostgreSQL with connection string
- **Authentication**: NextAuth with Casdoor SSO
- **Storage**: MinIO S3-compatible storage
- **Search**: SearXNG search engine
-
-### Start Docker Services
-
-Start all required services using Docker Compose:
-
-```bash
-docker-compose -f docker-compose.development.yml up -d
-```
-
-This will start the following services:
-
- PostgreSQL database (port 5432)
- MinIO storage (port 9000)
- Casdoor authentication (port 8000)
- SearXNG search (port 8080)
-
-### Run Database Migrations
-
-Execute the database migration script to create all necessary tables:
-
-```bash
-pnpm db:migrate
-```
-
-You should see: `✅ database migration pass.`
-
-### Start Development Server
-
-Launch the LobeChat development server:
-
-```bash
-pnpm dev
-```
-
-The server will start on `http://localhost:3010`
-
-And you can check all Docker services are running by running:
-
-```bash
-docker-compose -f docker-compose.development.yml ps
-```
-
-### Reset Services
-
-If you encounter issues, you can reset the entire stack:
-
-```bash
-# Stop and remove all containers
-docker-compose -f docker-compose.development.yml down
-
-# Remove volumes (this will delete all data)
-docker-compose -f docker-compose.development.yml down -v
-
-# Start fresh
-docker-compose -f docker-compose.development.yml up -d
-pnpm db:migrate
-```
@@ -1,77 +0,0 @@
-# 使用服务端数据库
-
-LobeChat 提供了内置的客户端数据库体验。
-但某些重要功能仅在服务端开发中可用。
-
-为了使用服务端数据库功能，
-需要参考 [部署服务端数据库](https://lobehub.com/docs/self-hosting/server-database) 的说明来配置所有前置条件。
-本文档提供了一个更简化的配置方法，能够在本地开发时快速启动简化的服务端环境。
-
-## 快速设置
-
-### 环境配置
-
-项目已经包含了一个 `.env.development` 文件，其中包含服务端数据库模式所需的所有环境变量。此文件配置了：
-
- **服务模式**: `NEXT_PUBLIC_SERVICE_MODE=server`
- **数据库**: 带连接字符串的 PostgreSQL
- **身份验证**: 带 Casdoor SSO 的 NextAuth
- **存储**: MinIO S3 兼容存储
- **搜索**: SearXNG 搜索引擎
-
-### 启动 Docker 服务
-
-使用 Docker Compose 启动所有必需的服务：
-
-```bash
-docker-compose -f docker-compose.development.yml up -d
-```
-
-这将启动以下服务：
-
- PostgreSQL 数据库（端口 5432）
- MinIO 存储（端口 9000）
- Casdoor 身份验证（端口 8000）
- SearXNG 搜索（端口 8080）
-
-### 运行数据库迁移
-
-执行数据库迁移脚本以创建所有必要的表：
-
-```bash
-pnpm db:migrate
-```
-
-预期输出：`✅ database migration pass.`
-
-### 启动开发服务器
-
-启动 LobeChat 开发服务器：
-
-```bash
-pnpm dev
-```
-
-服务器将在 `http://localhost:3010` 上启动
-
-可以通过运行以下命令检查所有 Docker 服务运行状态：
-
-```bash
-docker-compose -f docker-compose.development.yml ps
-```
-
-### 重置服务
-
-如遇到问题，可以重置整个服务堆栈：
-
-```bash
-# 停止并删除所有容器
-docker-compose -f docker-compose.development.yml down
-
-# 删除卷（这将删除所有数据）
-docker-compose -f docker-compose.development.yml down -v
-
-# 重新启动
-docker-compose -f docker-compose.development.yml up -d
-pnpm db:migrate
-```
@@ -129,39 +129,6 @@ table async_tasks {
  updated_at "timestamp with time zone" [not null, default: `now()`]
 }

-table chat_groups {
-  id text [pk, not null]
-  title text
-  description text
-  config jsonb
-  client_id text
-  user_id text [not null]
-  pinned boolean [default: false]
-  accessed_at "timestamp with time zone" [not null, default: `now()`]
-  created_at "timestamp with time zone" [not null, default: `now()`]
-  updated_at "timestamp with time zone" [not null, default: `now()`]
-
-  indexes {
-    (client_id, user_id) [name: 'chat_groups_client_id_user_id_unique', unique]
-  }
-}
-
-table chat_groups_agents {
-  chat_group_id text [not null]
-  agent_id text [not null]
-  user_id text [not null]
-  enabled boolean [default: true]
-  order integer [default: 0]
-  role text [default: 'participant']
-  accessed_at "timestamp with time zone" [not null, default: `now()`]
-  created_at "timestamp with time zone" [not null, default: `now()`]
-  updated_at "timestamp with time zone" [not null, default: `now()`]
-
-  indexes {
-    (chat_group_id, agent_id) [pk]
-  }
-}
-
 table document_chunks {
  document_id varchar(30) [not null]
  chunk_id uuid [not null]
@@ -405,8 +372,6 @@ table messages {
  parent_id text
  quota_id text
  agent_id text
-  group_id text
-  target_id text
  accessed_at "timestamp with time zone" [not null, default: `now()`]
  created_at "timestamp with time zone" [not null, default: `now()`]
  updated_at "timestamp with time zone" [not null, default: `now()`]
@@ -873,7 +838,6 @@ table topics {
  title text
  favorite boolean [default: false]
  session_id text
-  group_id text
  user_id text [not null]
  client_id text
  history_summary text
@@ -945,14 +909,6 @@ ref: agents_to_sessions.session_id > sessions.id

 ref: agents_to_sessions.agent_id > agents.id

-ref: chat_groups_agents.chat_group_id > chat_groups.id
-
-ref: chat_groups_agents.agent_id > agents.id
-
-ref: chat_groups_agents.user_id - users.id
-
-ref: chat_groups.user_id - users.id
-
 ref: unstructured_chunks.file_id - files.id

 ref: document_chunks.document_id > documents.id
@@ -85,7 +85,7 @@ We need to configure an S3 storage service in the server-side database to store
  <Image alt={'Configure allowed site domain'} src={'https://github.com/lobehub/lobe-chat/assets/28616219/dfcc2cb3-2958-4498-a8a4-51bec584fe7d'} />

  <Callout type={'info'}>
-    If you also plan to use the desktop client, add <code>[http://localhost:3015](http://localhost:3015)</code> to <code>AllowedOrigins</code> so the desktop client (running locally) can access R2.
+    If you also plan to use the desktop client, add <code>http://localhost:3015</code> to <code>AllowedOrigins</code> so the desktop client (running locally) can access R2.
  </Callout>

  Example configuration is as follows:
@@ -82,11 +82,11 @@ tags:
  添加跨域规则，允许你的域名（在上文是 `https://your-project.vercel.app`）来源的请求：

  <Image alt={'配置允许你的站点域名'} src={'https://github.com/lobehub/lobe-chat/assets/28616219/dfcc2cb3-2958-4498-a8a4-51bec584fe7d'} />
-
  <Callout type={'info'}>
-    如果你还需要在桌面端使用，请在 <code>AllowedOrigins</code> 中额外添加 <code>[http://localhost:3015](http://localhost:3015)</code>，以便桌面端（本地运行）能够访问 R2。
+    如果你还需要在桌面端使用，请在 <code>AllowedOrigins</code> 中额外添加 <code>http://localhost:3015</code>，以便桌面端（本地运行）能够访问 R2。
  </Callout>

+
  示例配置如下：

  ```json
@@ -0,0 +1,86 @@
+---
+title: LobeChat WebRTC Sync - Real-Time Data Sharing
+description: >-
+  Explore LobeChat's WebRTC sync for real-time data sharing and privacy without servers.
+
+tags:
+  - WebRTC
+  - LobeChat
+  - Data Synchronization
+  - Real-Time Communication
+  - Peer-to-Peer
+---
+
+# LobeChat WebRTC Sync
+
+## Introduction to WebRTC
+
+WebRTC (Web Real-Time Communication) is a technology that enables peer-to-peer communication between browsers. In LobeChat, we experimentally implemented real-time data synchronization between devices based on WebRTC and YJS, without relying on traditional server databases. This solution offers high privacy, zero conflicts, and provides a real-time session synchronization experience.
+
+## Configuring WebRTC for Synchronization
+
+To use the WebRTC synchronization feature in LobeChat, you need to complete the following steps:
+
+<Steps>
+  ### Deploy Signaling Server
+
+  Deploy a WebRTC signaling server with one click using the Zeabur platform:
+
+  [![Deploy on Zeabur](https://zeabur.com/button.svg)](https://zeabur.com/templates/MY0JZG?referralCode=arvinxx)
+
+  Alternatively, you can view the [source code](https://github.com/lobehub/y-webrtc-signaling) and deploy it on your own.
+
+  After deployment, you will receive a URL, for example: `https://my-signaling-server.zeabur.app`.
+
+  ### Enable WebRTC Sync in the Deployment Instance
+
+  The WebRTC sync feature in LobeChat is hidden by default and needs to be enabled by adding the environment variable `FEATURE_FLAGS=+webrtc_sync`.
+
+  ### Configure WebRTC Sync Settings in LobeChat
+
+  1. Open LobeChat settings -> Data Sync
+  2. Enter the signaling server address in the WebRTC sync section;
+  3. Set the sync channel name and password
+
+  <Image alt={'LobeChat Data Sync Settings Page'} height={356} inStep src={'https://github.com/lobehub/lobe-chat/assets/28616219/bf86bf1e-87fb-4015-8587-15ff28bb9c24'} />
+
+  ### Repeat the Above Configuration on Devices that Need to Sync
+
+  Ensure all devices use the same signaling server, channel name, and password. Once configured, the devices should automatically start syncing data.
+</Steps>
+
+## Limitations and Known Issues
+
+Although WebRTC has the advantages of no database and flexibility, after extensive community testing, the following limitations and known issues have been identified:
+
+### Requirement for Devices to be Online Simultaneously
+
+WebRTC requires devices to be online simultaneously to synchronize, meaning changes cannot be made on one device while offline and then synced later on another device.
+
+This limitation is due to the communication nature of WebRTC. In a pure frontend, serverless scenario, data synchronization between two devices can only be achieved through peer-to-peer communication. When one device is online and the other is offline, it is impossible to determine where the data should come from. Only when both devices are online can data communication occur. This mode is more like an online chat room where everyone needs to be online to see each other's data and achieve synchronization.
+
+Therefore, in certain situations, WebRTC's pure peer-to-peer approach may not fully meet users' needs (e.g., one device is a work computer, and the other is a home computer), and there are also some issues with data synchronization.
+
+### Network Issues Leading to Sync Failures
+
+Due to the implementation mechanism of WebRTC, its peer-to-peer communication has strict network requirements. Many of our users have reported:
+
+- Syncing between PCs is possible, but syncing between a mobile device with a SIM card and a PC is not, although syncing is possible when using the same WIFI as the PC;
+- Syncing fails when switching networks.
+
+### Stability and Performance Issues
+
+- Some users have reported ICE connection failures on the Firefox browser: [WebRTC Data Sync Feedback](https://github.com/lobehub/lobe-chat/issues/1683#issuecomment-2094745907)
+- For extremely long text or large amounts of conversation records, the synchronization process may slow down or become unstable: [When the model outputs a very long conversation, the end of the conversation will contain synchronization-related content tags, leading to sync failures](https://github.com/lobehub/lobe-chat/issues/1962)
+
+## Our Recommendations
+
+Considering the above reasons, we recommend users treat the WebRTC sync feature as experimental and regularly back up important data.
+
+We have already released a more stable and user-friendly server database synchronization solution ([deployment guide](/docs/self-hosting/advanced/server-database)). We recommend users prioritize using the server database synchronization solution.
+
+<Callout type={'warning'}>
+  Please note that we have officially announced the archiving of this sync feature in [PR
+  3182](https://github.com/lobehub/lobe-chat/pull/3182), and the above issues will no longer be
+  considered for fixes.
+</Callout>
@@ -0,0 +1,80 @@
+---
+title: LobeChat WebRTC 同步配置指南
+description: 在 LobeChat 中实现基于 WebRTC 和 YJS 的设备间实时数据同步。了解如何配置 WebRTC 并开启同步功能，以及使用局限性和已知问题。
+tags:
+  - YJS
+  - 信令服务器
+---
+
+# LobeChat WebRTC 同步
+
+## WebRTC 简介
+
+WebRTC (Web Real-Time Communication) 是一项实现浏览器之间点对点通信的技术。在 LobeChat 中，我们实验性地基于 WebRTC 和 YJS 实现了设备间的实时数据同步，无需依赖传统的服务器数据库。这种方案具有高度隐私性、零冲突性，并能提供实时会话同步体验。
+
+## 配置 WebRTC 并实现同步
+
+要使用 LobeChat 的 WebRTC 同步功能，需要完成以下步骤:
+
+<Steps>
+  ### 部署信令服务器
+
+  使用 Zeabur 平台一键部署 WebRTC 信令服务器：
+
+  [![Deploy on Zeabur](https://zeabur.com/button.svg)](https://zeabur.com/templates/MY0JZG?referralCode=arvinxx)
+
+  或者查看 [源码](https://github.com/lobehub/y-webrtc-signaling) 自行部署。
+
+  部署完成后，可以得到一个 URL，例如：`https://my-signaling-server.zeabur.app`。
+
+  ### 在部署实例中开启 WebRTC 同步
+
+  LobeChat 默认隐藏了 WebRTC 同步功能，需要通过添加环境变量 `FEATURE_FLAGS=+webrtc_sync` 来开启 WebRTC 同步特性。
+
+  ### 配置 LobeChat 的 WebRTC 同步设置
+
+  1. 打开 LobeChat 设置 -> 数据同步
+  2. 在 WebRTC 同步中填写信令服务器地址；
+  3. 设置同步频道名称和密码
+
+  <Image alt={'LobeChat 数据同步设置页'} height={356} inStep src={'https://github.com/lobehub/lobe-chat/assets/28616219/bf86bf1e-87fb-4015-8587-15ff28bb9c24'} />
+
+  ### 在需要同步的设备上重复以上配置
+
+  确保所有设备使用相同的信令服务器、频道名称和密码，完成配置后，设备间应该可以开始自动同步数据。
+</Steps>
+
+## 使用局限性和已知问题
+
+虽然 WebRTC 具有无数据库、比较灵活的特性，但目前该功能经过大范围社区测试，存在以下局限性和已知问题：
+
+### 设备同时在线要求
+
+WebRTC 要求设备同时在线才能进行同步，这意味着无法在一台设备离线时在另一台设备上进行更改并稍后同步。
+
+这是 WebRTC 本身的通信特性有关系，由于在纯前端、无服务端的情况下，两个设备的数据同步只能通过点对点通信的形式达成。当一个设备在线，一个设备离线的情况下，我们无从感知数据到底应该从哪来，只有当两台设备都在线的时候，双发数据才能通信。其实这种模式更像是一个在线聊天室，大家都在线时才能看到对方的数据，然后达成同步。
+
+因此 WebRTC 这种纯点对点的方式在某些情况下并无法完全满足用户的诉求（例如一个是公司电脑，一个是家里电脑），同时也存在一些数据同步层面的问题。
+
+### 网络问题可能导致同步失败
+
+由于 WebRTC 的实现机制，其点对点通信对于网络要求非常苛刻，我们的很多用户反馈：
+
+- 在 PC 上可以互相同步、 手机 sim 卡无法和 PC 同步、但是换成和 PC 一样的 WIFI 可以和 PC 同步；
+- 任何切换网络都无法同步；
+
+### 稳定性与性能问题
+
+- 部分用户报告在 Firefox 浏览器上遇到 ICE 连接失败的问题：[WebRTC Data Sync Feedback](https://github.com/lobehub/lobe-chat/issues/1683#issuecomment-2094745907)
+- 对于超长文本或大量对话记录，同步过程可能变慢或不稳定：[当模型输出超长对话时，对话末尾会出现同步相关的内容标签，导致同步失败](https://github.com/lobehub/lobe-chat/issues/1962)
+
+## 我们的建议
+
+鉴于以上原因，我们建议用户将 WebRTC 同步功能视为实验性功能，并定期备份重要数据。
+
+目前我们已经发布了更稳定、更用户友好的服务端数据库同步方案（[部署指南](/zh/docs/self-hosting/advanced/server-database)），我们建议用户优先考虑使用服务端数据库同步方案。
+
+<Callout type={'warning'}>
+  请注意，我们已经在 [PR 3182](https://github.com/lobehub/lobe-chat/pull/3182)
+  中正式宣布归档该同步特性，上述问题将不再考虑进行修复。
+</Callout>
@@ -37,6 +37,13 @@ When using the `random` mode, a random API Key will be selected from the availab

 When using the `turn` mode, the API Keys will be retrieved in a polling manner according to the specified order.

+### `NEXT_PUBLIC_BASE_PATH`
+
+- Type: Optional
+- Description: Add a `basePath` for LobeChat.
+- Default: -
+- Example: `/test`
+
 ### `DEFAULT_AGENT_CONFIG`

 - Type: Optional
@@ -34,6 +34,13 @@ LobeChat 在部署时提供了一些额外的配置项，你可以使用环境

 使用 `turn` 模式下，将按照填写的顺序，轮询获取得到 API Key。

+### `NEXT_PUBLIC_BASE_PATH`
+
+- 类型：可选
+- 描述：为 LobeChat 添加 `basePath`
+- 默认值: `-`
+- 示例: `/test`
+
 ### `DEFAULT_AGENT_CONFIG`

 - 类型：可选
@@ -646,33 +646,8 @@ If you need to use Azure OpenAI to provide model services, you can refer to the
 - Type: Optional
 - Description: Used to control the FAL model list. Use `+` to add a model, `-` to hide a model, and `model_name=display_name` to customize the display name of a model. Separate multiple entries with commas. The definition syntax follows the same rules as other providers' model lists.
 - Default: `-`
- Example: `-all,+flux/schnell,+flux-pro/kontext=FLUX.1 Kontext [pro]`
+- Example: `-all,+fal-model-1,+fal-model-2=fal-special`

-The above example disables all models first, then enables `flux/schnell` and `flux-pro/kontext` (displayed as `FLUX.1 Kontext [pro]`).
-
-## BFL
-
-### `ENABLED_BFL`
-
- Type: Optional
- Description: Enables BFL as a model provider by default. Set to `0` to disable the BFL service.
- Default: `1`
- Example: `0`
-
-### `BFL_API_KEY`
-
- Type: Required
- Description: This is the API key you applied for in the BFL service.
- Default: -
- Example: `12345678-1234-1234-1234-123456789abc`
-
-### `BFL_MODEL_LIST`
-
- Type: Optional
- Description: Used to control the BFL model list. Use `+` to add a model, `-` to hide a model, and `model_name=display_name` to customize the display name of a model. Separate multiple entries with commas. The definition syntax follows the same rules as other providers' model lists.
- Default: `-`
- Example: `-all,+flux-pro-1.1,+flux-kontext-pro=FLUX.1 Kontext [pro]`
-
-The above example disables all models first, then enables `flux-pro-1.1` and `flux-kontext-pro` (displayed as `FLUX.1 Kontext [pro]`).
+The above example disables all models first, then enables `fal-model-1` and `fal-model-2` (displayed as `fal-special`).

 [model-list]: /docs/self-hosting/advanced/model-list
@@ -645,33 +645,8 @@ LobeChat 在部署时提供了丰富的模型服务商相关的环境变量，
 - 类型：可选
 - 描述：用来控制 FAL 模型列表，使用 `+` 增加一个模型，使用 `-` 来隐藏一个模型，使用 `模型名=展示名` 来自定义模型的展示名，用英文逗号隔开。模型定义语法规则与其他 provider 保持一致。
 - 默认值：`-`
- 示例：`-all,+flux/schnell,+flux-pro/kontext=FLUX.1 Kontext [pro]`
+- 示例：`-all,+fal-model-1,+fal-model-2=fal-special`

-上述示例表示先禁用所有模型，再启用 `flux/schnell` 和 `flux-pro/kontext`（显示名为 `FLUX.1 Kontext [pro]`）。
-
-## BFL
-
-### `ENABLED_BFL`
-
- 类型：可选
- 描述：默认启用 BFL 作为模型供应商，当设为 0 时关闭 BFL 服务
- 默认值：`1`
- 示例：`0`
-
-### `BFL_API_KEY`
-
- 类型：必选
- 描述：这是你在 BFL 服务中申请的 API 密钥
- 默认值：-
- 示例：`12345678-1234-1234-1234-123456789abc`
-
-### `BFL_MODEL_LIST`
-
- 类型：可选
- 描述：用来控制 BFL 模型列表，使用 `+` 增加一个模型，使用 `-` 来隐藏一个模型，使用 `模型名=展示名` 来自定义模型的展示名，用英文逗号隔开。模型定义语法规则与其他 provider 保持一致。
- 默认值：`-`
- 示例：`-all,+flux-pro-1.1,+flux-kontext-pro=FLUX.1 Kontext [pro]`
-
-上述示例表示先禁用所有模型，再启用 `flux-pro-1.1` 和 `flux-kontext-pro`（显示名为 `FLUX.1 Kontext [pro]`）。
+上述示例表示先禁用所有模型，再启用 `fal-model-1` 和 `fal-model-2`（显示名为 `fal-special`）。

 [model-list]: /zh/docs/self-hosting/advanced/model-list
@@ -1,68 +0,0 @@
---
-title: Using Black Forest Labs API Key in LobeChat
-description: >-
-  Learn how to integrate Black Forest Labs API Key in LobeChat for AI image generation using advanced models and high-quality output.
-
-tags:
-  - Black Forest Labs
-  - Image Generation
-  - API Key
-  - Web UI
---
-
-# Using Black Forest Labs in LobeChat
-
-<Image alt={'Using Black Forest Labs in LobeChat'} cover src={'https://hub-apac-1.lobeobjects.space/docs/c7274a5b037227f042ad7558f535b5ea.png'} />
-
-[Black Forest Labs](https://bfl.ai/) is currently the world's top-tier AI image generation research lab, having developed the FLUX series of high-quality image generation models and the FLUX Kontext series of image editing models. This document will guide you on how to use Black Forest Labs in LobeChat:
-
-<Steps>
-  ### Step 1: Obtain Black Forest Labs API Key
-
-  - Register for a [Black Forest Labs account](https://auth.bfl.ai/).
-  - Navigate to the [API Keys dashboard](https://dashboard.bfl.ai/api/keys) and click **Add Key** to generate a new API key.
-  - Copy the generated API key and keep it secure; it will only be shown once.
-
-  <Image
-    alt={'Open the API dashboard'}
-    inStep
-    src={
-'https://hub-apac-1.lobeobjects.space/docs/36331f581e36a72ba91fb6c1dacbedd4.png'
-}
-  />
-
-  <Image
-    alt={'Create API Key'}
-    inStep
-    src={
-'https://hub-apac-1.lobeobjects.space/docs/3049ad79746bf913d1b2736cfe1d38fa.png'
-}
-  />
-
-  <Image
-    alt={'Retrieve API Key'}
-    inStep
-    src={
-'https://hub-apac-1.lobeobjects.space/docs/33143deb04f2a0cdb2fd543ff8161633.png'
-}
-  />
-
-  ### Step 2: Configure Black Forest Labs in LobeChat
-
-  - Visit the `Settings` page in LobeChat.
-  - Under **AI Service Provider**, locate the **Black Forest Labs** configuration section.
-
-  <Image alt={'Enter API Key'} inStep src={'https://hub-apac-1.lobeobjects.space/docs/4fe1993d94fad72829612d22527a2ecd.png'} />
-
-  - Paste the API key you obtained.
-  - Choose a Black Forest Labs model for image generation.
-
-  <Image alt={'Select Black Forest Labs model for image generation'} inStep src={'https://hub-apac-1.lobeobjects.space/docs/7a6dfdb1a1bdd5443104a6d2cb3a8bf4.png'} />
-
-  <Callout type={'warning'}>
-    During usage, you may incur charges according to Black Forest Labs's pricing policy. Please review Black Forest Labs's
-    official pricing before heavy usage.
-  </Callout>
-</Steps>
-
-You can now use Black Forest Labs's advanced image generation models directly within LobeChat to create stunning visual content.
@@ -1,67 +0,0 @@
---
-title: 在 LobeChat 中使用 Black Forest Labs API Key
-description: >-
-  学习如何在 LobeChat 中配置和使用 Black Forest Labs API Key，使用先进模型进行高质量 AI 图像生成。
-
-tags:
-  - Black Forest Labs
-  - 图像生成
-  - API Key
-  - Web UI
---
-
-# 在 LobeChat 中使用 Black Forest Labs
-
-<Image alt={'在 LobeChat 中使用 Black Forest Labs'} cover src={'https://hub-apac-1.lobeobjects.space/docs/c7274a5b037227f042ad7558f535b5ea.png'} />
-
-[Black Forest Labs](https://bfl.ai/) 是当前世界最顶级的 AI 图像生成实验室团队，研发了 FLUX 系列高质量图像生成模型，FLUX Kontext 系列图像编辑模型。本文将指导你如何在 LobeChat 中使用 Black Forest Labs：
-
-<Steps>
-  ### 步骤一：获取 Black Forest Labs API Key
-
-  - 注册 [Black Forest Labs](https://auth.bfl.ai/) 账户；
-  - 前往 [API Keys 控制台](https://dashboard.bfl.ai/api/keys)，点击 **Add Key** 创建新的 API 密钥；
-  - 复制生成的 API Key 并妥善保存，它只会显示一次。
-
-  <Image
-    alt={'打开 API 控制台'}
-    inStep
-    src={
-'https://hub-apac-1.lobeobjects.space/docs/36331f581e36a72ba91fb6c1dacbedd4.png'
-}
-  />
-
-  <Image
-    alt={'创建 API Key'}
-    inStep
-    src={
-'https://hub-apac-1.lobeobjects.space/docs/3049ad79746bf913d1b2736cfe1d38fa.png'
-}
-  />
-
-  <Image
-    alt={'获取 API Key'}
-    inStep
-    src={
-'https://hub-apac-1.lobeobjects.space/docs/33143deb04f2a0cdb2fd543ff8161633.png'
-}
-  />
-
-  ### 步骤二：在 LobeChat 中配置 Black Forest Labs
-
-  - 访问 LobeChat 的 `设置` 页面；
-  - 在 `AI服务商` 下找到 `Black Forest Labs` 的设置项；
-
-  <Image alt={'填入 API 密钥'} inStep src={'https://hub-apac-1.lobeobjects.space/docs/4fe1993d94fad72829612d22527a2ecd.png'} />
-
-  - 粘贴获取到的 API Key；
-  - 选择一个 Black Forest Labs 模型用于图像生成。
-
-  <Image alt={'选择 Black Forest Labs 模型进行图像生成'} inStep src={'https://hub-apac-1.lobeobjects.space/docs/7a6dfdb1a1bdd5443104a6d2cb3a8bf4.png'} />
-
-  <Callout type={'warning'}>
-    在使用过程中，你可能需要向 Black Forest Labs 支付相应费用，请在大量调用前查阅 Black Forest Labs 的官方计费政策。
-  </Callout>
-</Steps>
-
-至此，你已经可以在 LobeChat 中使用 Black Forest Labs 提供的先进图像生成模型来创作精美的视觉内容了。
@@ -52,11 +52,7 @@
    "thinking": {
      "title": "مفتاح التفكير العميق"
    },
-    "title": "وظائف توسيع النموذج",
-    "urlContext": {
-      "desc": "عند التفعيل، سيتم تحليل روابط الويب تلقائيًا للحصول على محتوى السياق الفعلي للصفحة",
-      "title": "استخراج محتوى رابط الويب"
-    }
+    "title": "وظائف توسيع النموذج"
  },
  "history": {
    "title": "سيتذكر المساعد آخر {{count}} رسالة فقط"
@@ -129,7 +125,6 @@
      "inputWriteCached": "تخزين إدخال الكتابة",
      "output": "مخرجات",
      "outputAudio": "مخرجات صوتية",
-      "outputImage": "إخراج الصورة",
      "outputText": "مخرجات نصية",
      "outputTitle": "تفاصيل المخرجات",
      "reasoning": "تفكير عميق",
@@ -273,8 +268,7 @@
    "clientMode": {
      "actionFiletip": "رفع ملف",
      "actionTooltip": "رفع",
-      "disabled": "النموذج الحالي لا يدعم التعرف على الصور وتحليل الملفات، يرجى تغيير النموذج لاستخدامه",
-      "visionNotSupported": "النموذج الحالي لا يدعم التعرف البصري، يرجى تبديل النموذج لاستخدام هذه الميزة"
+      "disabled": "النموذج الحالي لا يدعم التعرف على الصور وتحليل الملفات، يرجى تغيير النموذج لاستخدامه"
    },
    "preview": {
      "prepareTasks": "تحضير الأجزاء...",
@@ -32,7 +32,6 @@
  "blog": "مدونة المنتجات",
  "branching": "إنشاء موضوع فرعي",
  "branchingDisable": "ميزة \"الموضوع الفرعي\" متاحة فقط في إصدار الخادم. إذا كنت بحاجة إلى هذه الميزة، يرجى التبديل إلى وضع نشر الخادم أو استخدام LobeChat Cloud",
-  "branchingRequiresSavedTopic": "الموضوع الحالي غير محفوظ، يجب الحفظ قبل استخدام ميزة الموضوع الفرعي",
  "cancel": "إلغاء",
  "changelog": "سجل التغييرات",
  "clientDB": {
@@ -183,13 +182,6 @@
    "title": "هل تحب منتجنا؟"
  },
  "fullscreen": "وضع كامل الشاشة",
-  "geminiImageChineseWarning": {
-    "content": "قد يفشل Nano Banana أحيانًا في إنشاء الصور عند استخدام اللغة الصينية. يُنصح باستخدام اللغة الإنجليزية للحصول على نتائج أفضل.",
-    "continueGenerate": "متابعة الإنشاء",
-    "continueSend": "متابعة الإرسال",
-    "doNotShowAgain": "عدم الإظهار مرة أخرى",
-    "title": "تنبيه إدخال اللغة الصينية"
-  },
  "historyRange": "نطاق التاريخ",
  "import": "استيراد",
  "importData": "استيراد البيانات",
@@ -1,9 +1,4 @@
 {
-  "ArgsInput": {
-    "addArgument": "إضافة معامل",
-    "argumentPlaceholder": "المعامل {{index}}",
-    "enterFirstArgument": "أدخل المعامل الأول..."
-  },
  "DragUpload": {
    "dragDesc": "اسحب الملفات هنا، يدعم تحميل عدة صور.",
    "dragFileDesc": "اسحب الصور والملفات هنا، يدعم تحميل عدة صور وملفات.",
@@ -73,18 +68,6 @@
  "GoBack": {
    "back": "عودة"
  },
-  "HtmlPreview": {
-    "actions": {
-      "download": "تنزيل",
-      "preview": "معاينة"
-    },
-    "iframeTitle": "معاينة HTML",
-    "mode": {
-      "code": "رمز",
-      "preview": "معاينة"
-    },
-    "title": "معاينة HTML"
-  },
  "ImageUpload": {
    "actions": {
      "changeImage": "انقر لتغيير الصورة",
@@ -142,12 +125,6 @@
    },
    "progress": {
      "uploadingWithCount": "تم تحميل {{completed}} من أصل {{total}}"
-    },
-    "validation": {
-      "fileSizeExceeded": "تجاوز حجم الملف الحد المسموح به",
-      "fileSizeExceededDetail": "{{fileName}} ({{actualSize}}) يتجاوز الحد الأقصى للحجم وهو {{maxSize}}",
-      "fileSizeExceededMultiple": "{{count}} من الملفات تتجاوز الحد الأقصى للحجم {{maxSize}}: {{fileList}}",
-      "imageCountExceeded": "تجاوز عدد الصور الحد المسموح به"
    }
  },
  "OllamaSetupGuide": {
@@ -85,17 +85,6 @@
    "CreateMessageError": "عذرًا، لم يتم إرسال الرسالة بشكل صحيح، يرجى نسخ المحتوى وإعادة إرساله، بعد تحديث الصفحة لن يتم الاحتفاظ بهذه الرسالة",
    "ExceededContextWindow": "المحتوى المطلوب الحالي يتجاوز الطول الذي يمكن للنموذج معالجته، يرجى تقليل كمية المحتوى ثم إعادة المحاولة",
    "FreePlanLimit": "أنت حاليًا مستخدم مجاني، لا يمكنك استخدام هذه الوظيفة، يرجى الترقية إلى خطة مدفوعة للمتابعة",
-    "GoogleAIBlockReason": {
-      "BLOCKLIST": "يحتوي المحتوى الذي أرسلته على كلمات محظورة. يرجى مراجعته وتعديل مدخلاتك ثم المحاولة مرة أخرى.",
-      "IMAGE_SAFETY": "تم حظر المحتوى الصوري الناتج لأسباب تتعلق بالأمان. يرجى محاولة تعديل طلب توليد الصورة.",
-      "LANGUAGE": "اللغة التي تستخدمها غير مدعومة مؤقتًا. يرجى المحاولة باللغة الإنجليزية أو بلغة أخرى مدعومة.",
-      "OTHER": "تم حظر المحتوى لسبب غير معروف. يرجى محاولة إعادة صياغة طلبك.",
-      "PROHIBITED_CONTENT": "قد يحتوي طلبك على محتوى محظور. يرجى تعديل طلبك لضمان توافقه مع سياسات الاستخدام.",
-      "RECITATION": "تم حظر محتواك لكونه قد ينتهك حقوق النشر. يرجى محاولة استخدام محتوى أصلي أو إعادة صياغة طلبك.",
-      "SAFETY": "تم حظر المحتوى بسبب سياسات السلامة. يرجى تعديل طلبك لتجنب أي محتوى ضار أو غير مناسب.",
-      "SPII": "قد يحتوي المحتوى على معلومات شخصية حساسة. لحماية الخصوصية، يرجى إزالة المعلومات الحساسة ثم المحاولة مرة أخرى.",
-      "default": "تم حظر المحتوى: {{blockReason}}. يرجى تعديل طلبك ثم المحاولة مرة أخرى."
-    },
    "InsufficientQuota": "عذرًا، لقد reached الحد الأقصى للحصة (quota) لهذه المفتاح، يرجى التحقق من رصيد الحساب الخاص بك أو زيادة حصة المفتاح ثم المحاولة مرة أخرى",
    "InvalidAccessCode": "كلمة المرور غير صحيحة أو فارغة، يرجى إدخال كلمة مرور الوصول الصحيحة أو إضافة مفتاح API مخصص",
    "InvalidBedrockCredentials": "فشلت مصادقة Bedrock، يرجى التحقق من AccessKeyId/SecretAccessKey وإعادة المحاولة",
@@ -153,28 +153,6 @@
    "searchProviders": "البحث عن مزودين...",
    "sort": "ترتيب مخصص"
  },
-  "newapi": {
-    "apiKey": {
-      "desc": "مفتاح API المقدم من منصة New API",
-      "placeholder": "مفتاح API الخاص بـ New API",
-      "required": "مفتاح API مطلوب",
-      "title": "مفتاح API"
-    },
-    "apiUrl": {
-      "desc": "عنوان API لخدمة New API، غالبًا ما يحتاج إلى /v1",
-      "title": "عنوان API"
-    },
-    "enabled": {
-      "title": "تمكين New API"
-    },
-    "models": {
-      "batchSelect": "تحديد نماذج متعددة ({{count}})",
-      "fetch": "جلب قائمة النماذج",
-      "selected": "النماذج المختارة",
-      "title": "النماذج المتاحة"
-    },
-    "title": "New API"
-  },
  "ollama": {
    "checker": {
      "desc": "اختبر ما إذا تم إدخال عنوان الوكيل بشكل صحيح",
@@ -207,10 +185,6 @@
    }
  },
  "providerModels": {
-    "batchSelect": {
-      "selected": "تم اختيار {{count}} نموذج",
-      "title": "تحديد متعدد"
-    },
    "config": {
      "aesGcm": "سيتم استخدام خوارزمية التشفير <1>AES-GCM</1> لتشفير مفتاحك وعنوان الوكيل وما إلى ذلك",
      "apiKey": {
@@ -74,15 +74,9 @@
  "DeepSeek-V3": {
    "description": "DeepSeek-V3 هو نموذج MoE تم تطويره ذاتيًا بواسطة شركة DeepSeek. حقق DeepSeek-V3 نتائج تقييم تفوقت على نماذج مفتوحة المصدر الأخرى مثل Qwen2.5-72B و Llama-3.1-405B، وفي الأداء ينافس النماذج المغلقة الرائدة عالميًا مثل GPT-4o و Claude-3.5-Sonnet."
  },
-  "DeepSeek-V3-1": {
-    "description": "DeepSeek V3.1: نموذج الاستدلال من الجيل التالي، يعزز القدرات على الاستدلال المعقد والتفكير التسلسلي، مناسب للمهام التي تتطلب تحليلاً عميقاً."
-  },
  "DeepSeek-V3-Fast": {
    "description": "مزود النموذج: منصة sophnet. DeepSeek V3 Fast هو النسخة السريعة عالية TPS من إصدار DeepSeek V3 0324، غير مكوّن بالكامل، يتمتع بقدرات برمجية ورياضية أقوى واستجابة أسرع!"
  },
-  "DeepSeek-V3.1": {
-    "description": "DeepSeek-V3.1 هو نموذج استدلال هجين جديد أطلقته DeepSeek، يدعم وضعين للاستدلال: التفكير وعدم التفكير، مع كفاءة تفكير أعلى مقارنة بـ DeepSeek-R1-0528. بعد تحسين ما بعد التدريب، تم تعزيز استخدام أدوات الوكيل وأداء مهام الوكيل بشكل كبير."
-  },
  "Doubao-lite-128k": {
    "description": "Doubao-lite يتميز بسرعة استجابة فائقة وقيمة أفضل مقابل المال، ويوفر خيارات أكثر مرونة للعملاء في سيناريوهات مختلفة. يدعم الاستدلال والتخصيص مع نافذة سياق 128k."
  },
@@ -137,15 +131,9 @@
  "ERNIE-Speed-Pro-128K": {
    "description": "نموذج اللغة الكبير عالي الأداء الذي طورته بايدو، والذي تم إصداره في عام 2024، يتمتع بقدرات عامة ممتازة، ويتميز بأداء أفضل من ERNIE Speed، مناسب كنموذج أساسي للتعديل الدقيق، مما يساعد على معالجة مشكلات السيناريوهات المحددة بشكل أفضل، مع أداء استدلال ممتاز."
  },
-  "FLUX-1.1-pro": {
-    "description": "FLUX.1.1 Pro"
-  },
  "FLUX.1-Kontext-dev": {
    "description": "FLUX.1-Kontext-dev هو نموذج متعدد الوسائط لتوليد وتحرير الصور طورته Black Forest Labs، يعتمد على بنية Rectified Flow Transformer ويحتوي على 12 مليار معلمة، يركز على توليد وإعادة بناء وتعزيز أو تحرير الصور بناءً على شروط سياقية محددة. يجمع النموذج بين مزايا التوليد القابل للتحكم في نماذج الانتشار وقدرات نمذجة السياق في Transformer، ويدعم إخراج صور عالية الجودة، ويستخدم على نطاق واسع في إصلاح الصور، إكمال الصور، وإعادة بناء المشاهد البصرية."
  },
-  "FLUX.1-Kontext-pro": {
-    "description": "FLUX.1 Kontext [pro]"
-  },
  "FLUX.1-dev": {
    "description": "FLUX.1-dev هو نموذج لغة متعدد الوسائط مفتوح المصدر طورته Black Forest Labs، مُحسّن لمهام النص والصورة، يدمج قدرات فهم وتوليد الصور والنصوص. يعتمد على نماذج اللغة الكبيرة المتقدمة مثل Mistral-7B، ويحقق معالجة متزامنة للنص والصورة واستدلالًا معقدًا من خلال مشفر بصري مصمم بعناية وضبط دقيق متعدد المراحل."
  },
@@ -182,9 +170,6 @@
  "Llama-3.2-90B-Vision-Instruct\t": {
    "description": "قدرات استدلال الصور المتقدمة المناسبة لتطبيقات الوكلاء في الفهم البصري."
  },
-  "Meta-Llama-3-3-70B-Instruct": {
-    "description": "Llama 3.3 70B: نموذج Transformer متعدد الاستخدامات، مناسب للحوار ومهام التوليد."
-  },
  "Meta-Llama-3.1-405B-Instruct": {
    "description": "نموذج نصي تم تعديله تحت الإشراف من Llama 3.1، تم تحسينه لحالات الحوار متعددة اللغات، حيث يتفوق في العديد من نماذج الدردشة مفتوحة ومغلقة المصدر المتاحة في المعايير الصناعية الشائعة."
  },
@@ -203,9 +188,6 @@
  "Meta-Llama-3.3-70B-Instruct": {
    "description": "Llama 3.3 هو النموذج اللغوي مفتوح المصدر متعدد اللغات الأكثر تقدمًا في سلسلة Llama، حيث يقدم تجربة تنافس أداء نموذج 405B بتكلفة منخفضة للغاية. يعتمد على هيكل Transformer، وتم تحسين فائدته وأمانه من خلال التعديل الدقيق تحت الإشراف (SFT) والتعلم المعزز من خلال ردود الفعل البشرية (RLHF). تم تحسين إصدار التعديل الخاص به ليكون مثاليًا للحوار متعدد اللغات، حيث يتفوق في العديد من المعايير الصناعية على العديد من نماذج الدردشة مفتوحة ومغلقة المصدر. تاريخ انتهاء المعرفة هو ديسمبر 2023."
  },
-  "Meta-Llama-4-Maverick-17B-128E-Instruct-FP8": {
-    "description": "Llama 4 Maverick: نموذج واسع النطاق قائم على مزيج من الخبراء، يوفر استراتيجية تفعيل خبراء فعالة لتحقيق أداء متميز في الاستدلال."
-  },
  "MiniMax-M1": {
    "description": "نموذج استدلال جديد مطور ذاتيًا. رائد عالميًا: 80 ألف سلسلة تفكير × 1 مليون إدخال، أداء يضاهي أفضل النماذج العالمية."
  },
@@ -275,9 +257,6 @@
  "Pro/deepseek-ai/DeepSeek-V3": {
    "description": "DeepSeek-V3 هو نموذج لغوي مختلط الخبراء (MoE) يحتوي على 6710 مليار معلمة، يستخدم الانتباه المتعدد الرؤوس (MLA) وهيكل DeepSeekMoE، ويجمع بين استراتيجيات توازن الحمل بدون خسائر مساعدة، مما يحسن كفاءة الاستدلال والتدريب. تم تدريبه مسبقًا على 14.8 تريليون توكن عالية الجودة، وتم إجراء تعديل دقيق تحت الإشراف والتعلم المعزز، مما يجعل DeepSeek-V3 يتفوق على نماذج مفتوحة المصدر الأخرى، ويقترب من النماذج المغلقة الرائدة."
  },
-  "Pro/deepseek-ai/DeepSeek-V3.1": {
-    "description": "DeepSeek-V3.1 هو نموذج لغة كبير بنمط هجين أصدرته DeepSeek AI، وقد شهد ترقيات مهمة متعددة مقارنة بالإصدارات السابقة. من الابتكارات الرئيسية في هذا النموذج دمج \"وضع التفكير\" و\"وضع عدم التفكير\" في نموذج واحد، حيث يمكن للمستخدمين التبديل بينهما بسهولة عبر تعديل قالب المحادثة لتلبية متطلبات المهام المختلفة. من خلال تحسينات ما بعد التدريب المخصصة، تم تعزيز أداء V3.1 في استدعاء الأدوات ومهام الوكيل بشكل ملحوظ، مما يمكنه من دعم أدوات البحث الخارجية وتنفيذ مهام معقدة متعددة الخطوات بشكل أفضل. يعتمد النموذج على DeepSeek-V3.1-Base مع تدريب إضافي، حيث تم توسيع حجم بيانات التدريب بشكل كبير عبر طريقة التوسيع النصي الطويل على مرحلتين، مما يحسن أدائه في معالجة المستندات الطويلة والرموز البرمجية الطويلة. كنموذج مفتوح المصدر، يظهر DeepSeek-V3.1 قدرة تنافسية مع أفضل النماذج المغلقة في مجالات الترميز والرياضيات والاستدلال، وبفضل هيكله المختلط للخبراء (MoE)، يحافظ على سعة نموذج ضخمة مع تقليل تكلفة الاستدلال بفعالية."
-  },
  "Pro/moonshotai/Kimi-K2-Instruct": {
    "description": "Kimi K2 هو نموذج أساسي يعتمد على بنية MoE مع قدرات قوية في البرمجة والوكيل، يحتوي على 1 تريليون معلمة و32 مليار معلمة مفعلة. يتفوق نموذج K2 في اختبارات الأداء الأساسية في مجالات المعرفة العامة، البرمجة، الرياضيات والوكيل مقارنة بالنماذج المفتوحة المصدر الأخرى."
  },
@@ -353,21 +332,12 @@
  "Qwen/Qwen3-30B-A3B-Instruct-2507": {
    "description": "Qwen3-30B-A3B-Instruct-2507 هو نسخة محدثة من Qwen3-30B-A3B في وضع عدم التفكير. هذا نموذج خبير مختلط (MoE) يحتوي على 30.5 مليار معلمة إجمالية و3.3 مليار معلمة تنشيط. تم تعزيز النموذج بشكل كبير في عدة جوانب، بما في ذلك تحسين كبير في الالتزام بالتعليمات، والتفكير المنطقي، وفهم النصوص، والرياضيات، والعلوم، والبرمجة، واستخدام الأدوات. كما حقق تقدمًا ملموسًا في تغطية المعرفة متعددة اللغات، ويستطيع التوافق بشكل أفضل مع تفضيلات المستخدم في المهام الذاتية والمفتوحة، مما يمكنه من توليد ردود أكثر فائدة ونصوص ذات جودة أعلى. بالإضافة إلى ذلك، تم تعزيز قدرة النموذج على فهم النصوص الطويلة إلى 256 ألف رمز. هذا النموذج يدعم فقط وضع عدم التفكير، ولن ينتج علامات `<think></think>` في مخرجاته."
  },
-  "Qwen/Qwen3-30B-A3B-Thinking-2507": {
-    "description": "Qwen3-30B-A3B-Thinking-2507 هو أحدث نموذج من سلسلة Qwen3 أصدره فريق Tongyi Qianwen في علي بابا. كنموذج خبير مختلط (MoE) يضم إجمالي 305 亿 (30.5 مليار) معلمة و33 亿 (3.3 مليار) معلمة تنشيط، يركز على تعزيز قدرة معالجة المهام المعقدة. أظهر هذا النموذج تحسناً ملحوظاً في الاستدلال المنطقي والرياضيات والعلوم والبرمجة والاختبارات المعيارية الأكاديمية التي تتطلب خبرة بشرية متخصصة. وفي الوقت نفسه، تحسنت قدراته العامة بشكل كبير في الالتزام بالتعليمات واستخدام الأدوات وتوليد النصوص ومحاذاة التفضيلات البشرية. يدعم النموذج أصلاً فهم سياق طويل بطول 256K وقابل للتوسع ليصل إلى مليون توكن. تم تصميم هذا الإصدار لوضع \"التفكير\"، ويهدف إلى حل المهام شديدة التعقيد من خلال استدلال تفصيلي خطوة بخطوة، كما برزت قدرات الوكلاء (Agent) فيه بشكل مميز."
-  },
  "Qwen/Qwen3-32B": {
    "description": "Qwen3 هو نموذج جديد من الجيل التالي مع تحسينات كبيرة في القدرات، حيث يصل إلى مستويات رائدة في الاستدلال، المهام العامة، الوكلاء، واللغات المتعددة، ويدعم تبديل وضع التفكير."
  },
  "Qwen/Qwen3-8B": {
    "description": "Qwen3 هو نموذج جديد من الجيل التالي مع تحسينات كبيرة في القدرات، حيث يصل إلى مستويات رائدة في الاستدلال، المهام العامة، الوكلاء، واللغات المتعددة، ويدعم تبديل وضع التفكير."
  },
-  "Qwen/Qwen3-Coder-30B-A3B-Instruct": {
-    "description": "Qwen3-Coder-30B-A3B-Instruct هو نموذج شيفرة من سلسلة Qwen3 طوّرته فريق Tongyi Qianwen التابع لشركة علي بابا. كنموذج مُبسّط ومُحسّن، يركز على تعزيز قدرات معالجة الشيفرة مع الحفاظ على أداء وكفاءة عاليتين. يُظهر هذا النموذج مزايا أداء بارزة بين النماذج مفتوحة المصدر في مهام معقدة مثل البرمجة الوكِيلية (Agentic Coding)، التشغيل الآلي لمتصفحات الويب واستدعاء الأدوات. يدعم النموذج بطبيعته سياقاً طويلاً يصل إلى 256K توكن، وقابلاً للتوسيع حتى 1M توكن، مما يتيح فهماً ومعالجة أفضل على مستوى مستودعات الشيفرة. بالإضافة إلى ذلك، يوفر النموذج دعماً قوياً للترميز الوكيل على منصات مثل Qwen Code وCLINE، وقد صُمّم بصيغة استدعاء دوال مخصّصة."
-  },
-  "Qwen/Qwen3-Coder-480B-A35B-Instruct": {
-    "description": "Qwen3-Coder-480B-A35B-Instruct هو نموذج برمجي أطلقته شركة علي بابا، ويعد حتى الآن الأكثر قدرةً على العمل كوكيل (Agentic). إنه نموذج مختلط الخبراء (Mixture-of-Experts, MoE) يضم 480 مليار معامل إجماليًا و35 مليار معامل نشط، محققًا توازنًا بين الكفاءة والأداء. يدعم النموذج بشكل أصلي طول سياق يصل إلى 256K (حوالي 260 ألف) توكن، ويمكن توسيعه عبر طرق استطراد مثل YaRN إلى مليون توكن، ممّا يمكّنه من التعامل مع مستودعات شفرة ضخمة ومهام برمجية معقّدة. صُمم Qwen3-Coder لسير عمل ترميز يعتمد على الوكلاء؛ فهو لا يولّد الشفرة فحسب، بل يتفاعل بشكلٍ مستقل مع أدوات وبيئات التطوير لحل مشكلات برمجية معقّدة. في اختبارات معيارية متعددة لمهام التكويد والوكالة، حقق النموذج مستوى متقدمًا بين النماذج مفتوحة المصدر، ويمكن أن ينافس نماذج رائدة مثل Claude Sonnet 4."
-  },
  "Qwen2-72B-Instruct": {
    "description": "Qwen2 هو أحدث سلسلة من نموذج Qwen، ويدعم سياقًا يصل إلى 128 ألف، مقارنةً بأفضل النماذج مفتوحة المصدر الحالية، يتفوق Qwen2-72B بشكل ملحوظ في فهم اللغة الطبيعية والمعرفة والترميز والرياضيات والقدرات متعددة اللغات."
  },
@@ -398,9 +368,6 @@
  "Qwen3-235B": {
    "description": "Qwen3-235B-A22B هو نموذج MoE (نموذج خبير مختلط) يقدم \"وضع الاستدلال المختلط\"، ويدعم المستخدمين في التبديل السلس بين \"وضع التفكير\" و\"وضع عدم التفكير\". يدعم فهم واستدلال 119 لغة ولهجة، ويتميز بقدرات قوية على استدعاء الأدوات. في اختبارات الأداء الشاملة، والبرمجة والرياضيات، واللغات المتعددة، والمعرفة والاستدلال، ينافس هذا النموذج النماذج الرائدة في السوق مثل DeepSeek R1، OpenAI o1، o3-mini، Grok 3، وGoogle Gemini 2.5 Pro."
  },
-  "Qwen3-235B-A22B-Instruct-2507-FP8": {
-    "description": "Qwen3 235B A22B Instruct 2507: نموذج موجه للاستدلال المتقدم وتحسين أوامر الحوار، يعتمد على بنية خبراء مختلطة للحفاظ على كفاءة الاستدلال مع عدد كبير من المعاملات."
-  },
  "Qwen3-32B": {
    "description": "Qwen3-32B هو نموذج كثيف (Dense Model) يقدم \"وضع الاستدلال المختلط\"، ويدعم التبديل السلس بين \"وضع التفكير\" و\"وضع عدم التفكير\". بفضل تحسينات في بنية النموذج، وزيادة بيانات التدريب، وأساليب تدريب أكثر فعالية، يقدم أداءً يعادل تقريبًا Qwen2.5-72B."
  },
@@ -857,9 +824,6 @@
  "deepseek-ai/DeepSeek-V3": {
    "description": "DeepSeek-V3 هو نموذج لغوي مختلط الخبراء (MoE) يحتوي على 6710 مليار معلمة، يستخدم انتباه متعدد الرؤوس (MLA) وبنية DeepSeekMoE، ويجمع بين استراتيجية توازن الحمل بدون خسارة مساعدة، مما يحسن كفاءة الاستدلال والتدريب. من خلال التدريب المسبق على 14.8 تريليون توكن عالي الجودة، وإجراء تعديلات إشرافية وتعلم معزز، يتفوق DeepSeek-V3 في الأداء على نماذج المصدر المفتوح الأخرى، ويقترب من النماذج المغلقة الرائدة."
  },
-  "deepseek-ai/DeepSeek-V3.1": {
-    "description": "DeepSeek-V3.1 هو نموذج لغة كبير بنمط هجين أصدرته DeepSeek AI، وقد شهد ترقيات مهمة متعددة مقارنة بالإصدارات السابقة. من الابتكارات الرئيسية في هذا النموذج دمج \"وضع التفكير\" و\"وضع عدم التفكير\" في نموذج واحد، حيث يمكن للمستخدمين التبديل بينهما بسهولة عبر تعديل قالب المحادثة لتلبية متطلبات المهام المختلفة. من خلال تحسينات ما بعد التدريب المخصصة، تم تعزيز أداء V3.1 في استدعاء الأدوات ومهام الوكيل بشكل ملحوظ، مما يمكنه من دعم أدوات البحث الخارجية وتنفيذ مهام معقدة متعددة الخطوات بشكل أفضل. يعتمد النموذج على DeepSeek-V3.1-Base مع تدريب إضافي، حيث تم توسيع حجم بيانات التدريب بشكل كبير عبر طريقة التوسيع النصي الطويل على مرحلتين، مما يحسن أدائه في معالجة المستندات الطويلة والرموز البرمجية الطويلة. كنموذج مفتوح المصدر، يظهر DeepSeek-V3.1 قدرة تنافسية مع أفضل النماذج المغلقة في مجالات الترميز والرياضيات والاستدلال، وبفضل هيكله المختلط للخبراء (MoE)، يحافظ على سعة نموذج ضخمة مع تقليل تكلفة الاستدلال بفعالية."
-  },
  "deepseek-ai/deepseek-llm-67b-chat": {
    "description": "DeepSeek 67B هو نموذج متقدم تم تدريبه للحوار المعقد."
  },
@@ -930,7 +894,7 @@
    "description": "DeepSeek R1 النسخة الكاملة، تحتوي على 671 مليار معلمة، تدعم البحث المتصل في الوقت الحقيقي، وتتمتع بقدرات فهم وتوليد أقوى."
  },
  "deepseek-reasoner": {
-    "description": "وضع التفكير في DeepSeek V3.1. قبل إخراج الإجابة النهائية، يقوم النموذج أولاً بإخراج سلسلة من التفكير لتحسين دقة الإجابة النهائية."
+    "description": "نموذج الاستدلال الذي أطلقته DeepSeek. قبل تقديم الإجابة النهائية، يقوم النموذج أولاً بإخراج سلسلة من المحتوى الفكري لتحسين دقة الإجابة النهائية."
  },
  "deepseek-v2": {
    "description": "DeepSeek V2 هو نموذج لغوي فعال من نوع Mixture-of-Experts، مناسب لاحتياجات المعالجة الاقتصادية."
@@ -944,18 +908,12 @@
  "deepseek-v3-0324": {
    "description": "DeepSeek-V3-0324 هو نموذج MoE يحتوي على 671 مليار معلمة، ويتميز بقدرات بارزة في البرمجة والتقنية، وفهم السياق ومعالجة النصوص الطويلة."
  },
-  "deepseek-v3.1": {
-    "description": "DeepSeek-V3.1 هو نموذج استدلال هجين جديد أطلقته DeepSeek، يدعم وضعين للاستدلال: التفكير وعدم التفكير، مع كفاءة تفكير أعلى مقارنة بـ DeepSeek-R1-0528. بعد تحسين ما بعد التدريب، تم تعزيز استخدام أدوات الوكيل وأداء مهام الوكيل بشكل كبير. يدعم نافذة سياق تصل إلى 128 ألف، وطول إخراج يصل إلى 64 ألف رمز."
-  },
  "deepseek/deepseek-chat-v3-0324": {
    "description": "DeepSeek V3 هو نموذج مختلط خبير يحتوي على 685B من المعلمات، وهو أحدث إصدار من سلسلة نماذج الدردشة الرائدة لفريق DeepSeek.\n\nيستفيد من نموذج [DeepSeek V3](/deepseek/deepseek-chat-v3) ويظهر أداءً ممتازًا في مجموعة متنوعة من المهام."
  },
  "deepseek/deepseek-chat-v3-0324:free": {
    "description": "DeepSeek V3 هو نموذج مختلط خبير يحتوي على 685B من المعلمات، وهو أحدث إصدار من سلسلة نماذج الدردشة الرائدة لفريق DeepSeek.\n\nيستفيد من نموذج [DeepSeek V3](/deepseek/deepseek-chat-v3) ويظهر أداءً ممتازًا في مجموعة متنوعة من المهام."
  },
-  "deepseek/deepseek-chat-v3.1": {
-    "description": "DeepSeek-V3.1 هو نموذج استدلال هجين كبير يدعم سياق طويل يصل إلى 128K وتبديل أوضاع فعال، ويحقق أداءً وسرعة ممتازة في استدعاء الأدوات، وتوليد الأكواد، والمهام الاستدلالية المعقدة."
-  },
  "deepseek/deepseek-r1": {
    "description": "DeepSeek-R1 يعزز بشكل كبير من قدرة النموذج على الاستدلال في ظل وجود بيانات محدودة جدًا. قبل تقديم الإجابة النهائية، يقوم النموذج أولاً بإخراج سلسلة من التفكير لتحسين دقة الإجابة النهائية."
  },
@@ -1145,27 +1103,12 @@
  "flux-dev": {
    "description": "FLUX.1 [dev] هو نموذج مفتوح المصدر للأوزان المكررة موجه للتطبيقات غير التجارية. يحافظ على جودة الصور وقدرة اتباع التعليمات مماثلة لإصدار FLUX الاحترافي، مع كفاءة تشغيل أعلى. مقارنة بالنماذج القياسية ذات الحجم المماثل، يستخدم الموارد بشكل أكثر فعالية."
  },
-  "flux-kontext-max": {
-    "description": "توليد وتحرير الصور السياقية بأحدث التقنيات — يجمع بين النص والصور لتحقيق نتائج دقيقة ومتسقة."
-  },
-  "flux-kontext-pro": {
-    "description": "توليد وتحرير الصور السياقية بأحدث التقنيات — يجمع بين النص والصورة للحصول على نتائج دقيقة ومتسقة."
-  },
  "flux-kontext/dev": {
    "description": "نموذج FLUX.1 مخصص لمهام تحرير الصور، يدعم إدخال النصوص والصور."
  },
  "flux-merged": {
    "description": "نموذج FLUX.1-merged يجمع بين ميزات العمق التي استكشفتها نسخة \"DEV\" أثناء التطوير ومزايا التنفيذ السريع التي تمثلها نسخة \"Schnell\". من خلال هذا الدمج، يعزز FLUX.1-merged حدود أداء النموذج ويوسع نطاق تطبيقاته."
  },
-  "flux-pro": {
-    "description": "نموذج توليد صور بالذكاء الاصطناعي من الطراز الأول للاستخدام التجاري — جودة صور لا تضاهى وقدرة عالية على إنتاج مخرجات متنوعة."
-  },
-  "flux-pro-1.1": {
-    "description": "نموذج متقدم احترافي لتوليد الصور بالذكاء الاصطناعي — يوفر جودة صور استثنائية وقدرة دقيقة على الالتزام بالمطالبات."
-  },
-  "flux-pro-1.1-ultra": {
-    "description": "توليد صور بالذكاء الاصطناعي بدقة فائقة — يدعم إخراج يصل إلى 4 ميجابكسل ويولد صورًا فائقة الوضوح خلال 10 ثوانٍ."
-  },
  "flux-pro/kontext": {
    "description": "FLUX.1 Kontext [pro] قادر على معالجة النصوص والصور المرجعية كمدخلات، مما يتيح تحريرًا محليًا مستهدفًا وتحولات معقدة للمشهد الكلي بسلاسة."
  },
@@ -1250,12 +1193,6 @@
  "gemini-2.5-flash": {
    "description": "Gemini 2.5 Flash هو نموذج Google الأكثر فعالية من حيث التكلفة، ويوفر وظائف شاملة."
  },
-  "gemini-2.5-flash-image-preview": {
-    "description": "Nano Banana هو أحدث وأسرع وأكثر نموذج متعدد الوسائط أصلي كفاءة من Google، يتيح لك إنشاء وتحرير الصور من خلال المحادثة."
-  },
-  "gemini-2.5-flash-image-preview:image": {
-    "description": "Nano Banana هو أحدث وأسرع وأكثر نموذج متعدد الوسائط أصلي كفاءة من Google، يتيح لك إنشاء وتحرير الصور من خلال المحادثة."
-  },
  "gemini-2.5-flash-lite": {
    "description": "Gemini 2.5 Flash-Lite هو أصغر وأفضل نموذج من حيث التكلفة من Google، مصمم للاستخدام على نطاق واسع."
  },
@@ -1358,9 +1295,6 @@
  "glm-4.5-x": {
    "description": "نسخة فائقة السرعة من GLM-4.5، تجمع بين أداء قوي وسرعة توليد تصل إلى 100 رمز في الثانية."
  },
-  "glm-4.5v": {
-    "description": "نموذج استدلال بصري من الجيل الجديد لشركة Zhipu مبني على بنية MOE، بإجمالي 106 مليار معامل و12 مليار معامل نشط، وقد بلغ مستوى الأداء الأعلى (SOTA) بين نماذج التعدد الوسائط مفتوحة المصدر المماثلة على مستوى العالم في عدة اختبارات معيارية، ويغطي مهامًا شائعة مثل فهم الصور والفيديو والمستندات وواجهات المستخدم الرسومية (GUI)."
-  },
  "glm-4v": {
    "description": "GLM-4V يوفر قدرات قوية في فهم الصور والاستدلال، ويدعم مجموعة متنوعة من المهام البصرية."
  },
@@ -1397,12 +1331,6 @@
  "google/gemini-2.5-flash": {
    "description": "Gemini 2.5 Flash هو النموذج الرئيسي الأكثر تقدمًا من Google، مصمم خصيصًا للمهام المتقدمة في الاستدلال، الترميز، الرياضيات والعلوم. يحتوي على قدرة مدمجة على \"التفكير\"، مما يمكنه من تقديم استجابات بدقة أعلى ومعالجة سياقية أكثر تفصيلاً.\n\nملاحظة: يحتوي هذا النموذج على نسختين: نسخة التفكير ونسخة غير التفكير. تختلف تكلفة الإخراج بشكل ملحوظ بناءً على تفعيل قدرة التفكير. إذا اخترت النسخة القياسية (بدون لاحقة \":thinking\"), سيتجنب النموذج بوضوح توليد رموز التفكير.\n\nلاستغلال قدرة التفكير واستلام رموز التفكير، يجب عليك اختيار النسخة \":thinking\"، والتي ستؤدي إلى تكلفة إخراج أعلى للتفكير.\n\nبالإضافة إلى ذلك، يمكن تكوين Gemini 2.5 Flash من خلال معلمة \"الحد الأقصى لعدد رموز الاستدلال\" كما هو موضح في الوثائق (https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning)."
  },
-  "google/gemini-2.5-flash-image-preview": {
-    "description": "نموذج تجريبي Gemini 2.5 Flash، يدعم توليد الصور."
-  },
-  "google/gemini-2.5-flash-image-preview:free": {
-    "description": "نموذج تجريبي Gemini 2.5 Flash، يدعم توليد الصور."
-  },
  "google/gemini-2.5-flash-preview": {
    "description": "Gemini 2.5 Flash هو النموذج الرائد الأكثر تقدمًا من Google، مصمم للاستدلال المتقدم، الترميز، المهام الرياضية والعلمية. يحتوي على قدرة \"التفكير\" المدمجة، مما يمكّنه من تقديم استجابات بدقة أعلى ومعالجة سياقات أكثر تفصيلاً.\n\nملاحظة: يحتوي هذا النموذج على نوعين: التفكير وغير التفكير. تختلف تسعير الإخراج بشكل ملحوظ بناءً على ما إذا كانت قدرة التفكير مفعلة. إذا اخترت النوع القياسي (بدون لاحقة \" :thinking \")، سيتجنب النموذج بشكل صريح توليد رموز التفكير.\n\nلاستغلال قدرة التفكير واستقبال رموز التفكير، يجب عليك اختيار النوع \" :thinking \"، مما سيؤدي إلى تسعير إخراج تفكير أعلى.\n\nبالإضافة إلى ذلك، يمكن تكوين Gemini 2.5 Flash من خلال معلمة \"الحد الأقصى لعدد رموز الاستدلال\"، كما هو موضح في الوثائق (https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning)."
  },
@@ -1506,7 +1434,7 @@
    "description": "يوفر GPT-4.1 mini توازنًا بين الذكاء والسرعة والتكلفة، مما يجعله نموذجًا جذابًا للعديد من الاستخدامات."
  },
  "gpt-4.5-preview": {
-    "description": "GPT-4.5-preview هو أحدث نموذج عام متعدد الأغراض، يتمتع بمعرفة عالمية عميقة وفهم محسن لنوايا المستخدم، ويتفوق في المهام الإبداعية وفي تخطيط الوكلاء. معارف هذا النموذج محدّثة حتى أكتوبر 2023."
+    "description": "نسخة المعاينة البحثية لـ GPT-4.5، وهي أكبر وأقوى نموذج GPT لدينا حتى الآن. تتمتع بمعرفة واسعة عن العالم وتفهم أفضل لنوايا المستخدم، مما يجعلها بارعة في المهام الإبداعية والتخطيط الذاتي. يمكن لـ GPT-4.5 قبول المدخلات النصية والصورية وتوليد مخرجات نصية (بما في ذلك المخرجات الهيكلية). تدعم ميزات المطورين الأساسية مثل استدعاء الدوال، وواجهة برمجة التطبيقات الجماعية، والمخرجات المتدفقة. تتألق GPT-4.5 بشكل خاص في المهام التي تتطلب التفكير الإبداعي، والتفكير المفتوح، والحوار (مثل الكتابة، والتعلم، أو استكشاف أفكار جديدة). تاريخ انتهاء المعرفة هو أكتوبر 2023."
  },
  "gpt-4o": {
    "description": "ChatGPT-4o هو نموذج ديناميكي يتم تحديثه في الوقت الحقيقي للحفاظ على أحدث إصدار. يجمع بين فهم اللغة القوي وقدرات التوليد، مما يجعله مناسبًا لمجموعة واسعة من التطبيقات، بما في ذلك خدمة العملاء والتعليم والدعم الفني."
@@ -1574,9 +1502,6 @@
  "gpt-oss": {
    "description": "GPT-OSS 20B هو نموذج لغة كبير مفتوح المصدر أصدرته OpenAI، يستخدم تقنية التكميم MXFP4، ومناسب للتشغيل على وحدات معالجة الرسومات الاستهلاكية المتقدمة أو أجهزة Mac بمعالج Apple Silicon. يتميز هذا النموذج بأداء ممتاز في توليد المحادثات، وكتابة الأكواد، ومهام الاستدلال، ويدعم استدعاء الدوال واستخدام الأدوات."
  },
-  "gpt-oss-120b": {
-    "description": "GPT-OSS-120B MXFP4: هيكل Transformer محسّن بالكمية، يحافظ على أداء قوي حتى في ظل محدودية الموارد."
-  },
  "gpt-oss:120b": {
    "description": "GPT-OSS 120B هو نموذج لغة كبير مفتوح المصدر أصدرته OpenAI، يستخدم تقنية التكميم MXFP4، ويعتبر نموذجًا رائدًا. يتطلب تشغيله بيئة متعددة وحدات معالجة الرسومات أو محطة عمل عالية الأداء، ويتميز بأداء متفوق في الاستدلال المعقد، وتوليد الأكواد، ومعالجة اللغات المتعددة، ويدعم استدعاء الدوال المتقدمة وتكامل الأدوات."
  },
@@ -1604,9 +1529,6 @@
  "grok-4": {
    "description": "نموذجنا الرائد الأحدث والأقوى، يتميز بأداء ممتاز في معالجة اللغة الطبيعية، الحسابات الرياضية، والاستدلال — إنه لاعب شامل مثالي."
  },
-  "grok-code-fast-1": {
-    "description": "نحن سعداء بإطلاق grok-code-fast-1، وهو نموذج استدلال سريع وفعال من حيث التكلفة، يتميز بأداء ممتاز في ترميز الوكلاء."
-  },
  "gryphe/mythomax-l2-13b": {
    "description": "MythoMax l2 13B هو نموذج لغوي يجمع بين الإبداع والذكاء من خلال دمج عدة نماذج رائدة."
  },
@@ -1715,18 +1637,9 @@
  "image-01-live": {
    "description": "نموذج توليد صور يقدم تفاصيل دقيقة، يدعم توليد الصور من النصوص مع إمكانية ضبط الأسلوب الفني."
  },
-  "imagen-4.0-fast-generate-001": {
-    "description": "Imagen، سلسلة نماذج تحويل النص إلى صورة من الجيل الرابع، الإصدار السريع"
-  },
-  "imagen-4.0-generate-001": {
-    "description": "سلسلة نماذج Imagen لتحويل النص إلى صورة من الجيل الرابع"
-  },
  "imagen-4.0-generate-preview-06-06": {
    "description": "سلسلة نموذج Imagen للجيل الرابع لتحويل النص إلى صورة"
  },
-  "imagen-4.0-ultra-generate-001": {
-    "description": "سلسلة نماذج Imagen لتحويل النص إلى صورة من الجيل الرابع — إصدار Ultra"
-  },
  "imagen-4.0-ultra-generate-preview-06-06": {
    "description": "نسخة ألترا من سلسلة نموذج Imagen للجيل الرابع لتحويل النص إلى صورة"
  },
@@ -1766,9 +1679,6 @@
  "kimi-k2-0711-preview": {
    "description": "kimi-k2 هو نموذج أساسي بمعمارية MoE يتمتع بقدرات فائقة في البرمجة والوكيل، مع إجمالي 1 تريليون معلمة و32 مليار معلمة مفعلة. في اختبارات الأداء الأساسية في مجالات المعرفة العامة، البرمجة، الرياضيات، والوكيل، يتفوق نموذج K2 على النماذج المفتوحة المصدر الرئيسية الأخرى."
  },
-  "kimi-k2-turbo-preview": {
-    "description": "kimi-k2 هو نموذج أساسي بمعمارية MoE يتمتع بقدرات قوية للغاية في البرمجة وقدرات الوكيل (Agent)، بإجمالي معلمات يبلغ 1 تريليون والمعلمات المُفعَّلة 32 مليار. في اختبارات الأداء المعيارية للفئات الرئيسية مثل الاستدلال المعرفي العام والبرمجة والرياضيات والوكلاء (Agent)، تفوق أداء نموذج K2 على النماذج المفتوحة المصدر السائدة الأخرى."
-  },
  "kimi-latest": {
    "description": "يستخدم منتج كيمي المساعد الذكي أحدث نموذج كبير من كيمي، وقد يحتوي على ميزات لم تستقر بعد. يدعم فهم الصور، وسيختار تلقائيًا نموذج 8k/32k/128k كنموذج للتسعير بناءً على طول سياق الطلب."
  },
@@ -1853,9 +1763,6 @@
  "llava:34b": {
    "description": "LLaVA هو نموذج متعدد الوسائط يجمع بين مشفرات بصرية وVicuna، يستخدم لفهم بصري ولغوي قوي."
  },
-  "magistral-medium-latest": {
-    "description": "Magistral Medium 1.1 هو نموذج استدلال رائد أطلقته Mistral AI في يوليو 2025."
-  },
  "mathstral": {
    "description": "MathΣtral مصمم للبحث العلمي والاستدلال الرياضي، يوفر قدرة حسابية فعالة وتفسير النتائج."
  },
@@ -2187,7 +2094,7 @@
    "description": "o1-mini هو نموذج استدلال سريع وفعال من حيث التكلفة مصمم لتطبيقات البرمجة والرياضيات والعلوم. يحتوي هذا النموذج على 128K من السياق وتاريخ انتهاء المعرفة في أكتوبر 2023."
  },
  "o1-preview": {
-    "description": "يركّز على الاستدلال المتقدّم وحل المشكلات المعقّدة، بما في ذلك المهام الرياضية والعلمية. مناسب للغاية للتطبيقات التي تتطلّب فهماً عميقاً للسياق وسير عمل مستقل."
+    "description": "o1 هو نموذج استدلال جديد من OpenAI، مناسب للمهام المعقدة التي تتطلب معرفة عامة واسعة. يحتوي هذا النموذج على 128K من السياق وتاريخ انتهاء المعرفة في أكتوبر 2023."
  },
  "o1-pro": {
    "description": "نماذج سلسلة o1 مدربة بالتعلم المعزز، قادرة على التفكير قبل الإجابة وتنفيذ مهام استدلال معقدة. يستخدم نموذج o1-pro موارد حسابية أكبر للتفكير الأعمق، مما يضمن تقديم إجابات ذات جودة أعلى باستمرار."
@@ -2306,14 +2213,8 @@
  "qwen-coder-turbo-latest": {
    "description": "نموذج Qwen للبرمجة."
  },
-  "qwen-flash": {
-    "description": "سلسلة Qwen-Flash هي الأسرع والأقل تكلفة بشكل كبير، ومناسبة للمهام البسيطة."
-  },
  "qwen-image": {
-    "description": "Qwen-Image هي نموذج عام لتوليد الصور يدعم أنماطًا فنية متعددة، ويتميز بقدرته على عرض النصوص المعقدة، خصوصًا النصوص بالصينية والإنجليزية. يدعم النموذج تخطيطات متعددة الأسطر، وتوليد نص على مستوى الفقرات، وتمثيل التفاصيل الدقيقة، مما يتيح إنشاء تصميمات معقدة تمزج بين النص والصورة."
-  },
-  "qwen-image-edit": {
-    "description": "أصدر فريق Qwen نموذجًا احترافيًا لتحرير الصور يدعم التحرير الدلالي وتحرير المظهر، ويستطيع تحرير النصوص بالصينية والإنجليزية بدقة، وتحقيق تحويلات النمط وتدوير الكائنات، وغيرها من عمليات تحرير الصور عالية الجودة."
+    "description": "نموذج قوي من فريق Qwen لتوليد الصور الخام، يتميز بقدرة مميزة على توليد النصوص الصينية وأنماط بصرية متنوعة للصور."
  },
  "qwen-long": {
    "description": "نموذج Qwen العملاق للغة، يدعم سياقات نصية طويلة، بالإضافة إلى وظائف الحوار المستندة إلى الوثائق الطويلة والعديد من الوثائق."
@@ -2340,7 +2241,7 @@
    "description": "نموذج لغة ضخم من توغي، نسخة معززة، يدعم إدخال لغات مختلفة مثل الصينية والإنجليزية."
  },
  "qwen-turbo": {
-    "description": "لن يتم تحديث 通义千问 Turbo مستقبلًا؛ يُنصح باستبداله بـ 通义千问 Flash. 通义千问 هو نموذج لغوي ضخم جدًا ويدعم إدخال لغات مختلفة مثل الصينية والإنجليزية."
+    "description": "نموذج لغة ضخم من توغي، يدعم إدخال لغات مختلفة مثل الصينية والإنجليزية."
  },
  "qwen-vl-chat-v1": {
    "description": "نموذج Qwen العملاق للغة البصرية يدعم طرق تفاعل مرنة، بما في ذلك الصور المتعددة، والأسئلة والأجوبة المتعددة، والإبداع."
@@ -2657,15 +2558,9 @@
  "step-2x-large": {
    "description": "نموذج الجيل الجديد من Step Star، يركز على مهام توليد الصور، قادر على توليد صور عالية الجودة بناءً على الأوصاف النصية المقدمة من المستخدم. يتميز النموذج الجديد بجودة صور أكثر واقعية وقدرات أفضل في توليد النصوص الصينية والإنجليزية."
  },
-  "step-3": {
-    "description": "يمتلك هذا النموذج قدرة فائقة على الإدراك البصري وعلى الاستدلال المعقّد. يمكنه إنجاز فهم دقيق للمعارف المعقّدة عبر مجالات متعدّدة، وإجراء تحليلات تقاطعية بين المعلومات الرياضية والبصرية، وكذلك معالجة مختلف مسائل التحليل البصري في الحياة اليومية."
-  },
  "step-r1-v-mini": {
    "description": "هذا النموذج هو نموذج استدلال كبير يتمتع بقدرة قوية على فهم الصور، يمكنه معالجة المعلومات النصية والصورية، ويخرج نصوصًا بعد تفكير عميق. يظهر هذا النموذج أداءً بارزًا في مجال الاستدلال البصري، كما يمتلك قدرات رياضية، برمجية، ونصية من الدرجة الأولى. طول السياق هو 100k."
  },
-  "stepfun-ai/step3": {
-    "description": "Step3 هو نموذج استدلال متعدد الوسائط متقدم أصدرته شركة 阶跃星辰 (StepFun). بُني على بنية مزيج الخبراء (MoE) التي تضم 321 مليار معلمة إجمالية و38 مليار معلمة تنشيط. صُمم النموذج بنهج من الطرف إلى الطرف ليقلل تكلفة فك الترميز، مع تقديم أداء رائد في الاستدلال البصري-اللغوي. من خلال التصميم التعاوني لآلية انتباه تفكيك متعدد المصفوفات (MFA) وفصل الانتباه عن شبكة التغذية الأمامية (AFD)، يحافظ Step3 على كفاءة ممتازة على كل من المسرعات الرائدة والمسرعات منخفضة التكلفة. في مرحلة ما قبل التدريب عالج Step3 أكثر من 20 تريليون توكن نصي و4 تريليون توكن مختلط نص-صورة، مغطياً أكثر من عشر لغات. حقق النموذج أداءً متقدماً بين نماذج المصدر المفتوح في عدة معايير قياسية تشمل الرياضيات والبرمجة والمهام متعددة الوسائط."
-  },
  "taichu_llm": {
    "description": "نموذج اللغة الكبير TaiChu يتمتع بقدرات قوية في فهم اللغة، بالإضافة إلى إنشاء النصوص، والإجابة على الأسئلة، وبرمجة الأكواد، والحسابات الرياضية، والاستدلال المنطقي، وتحليل المشاعر، وتلخيص النصوص. يجمع بشكل مبتكر بين التدريب المسبق على البيانات الضخمة والمعرفة الغنية من مصادر متعددة، من خلال تحسين تقنيات الخوارزميات باستمرار واستيعاب المعرفة الجديدة من البيانات النصية الضخمة، مما يحقق تطورًا مستمرًا في أداء النموذج. يوفر للمستخدمين معلومات وخدمات أكثر سهولة وتجربة أكثر ذكاءً."
  },
@@ -2693,9 +2588,18 @@
  "thudm/glm-4-9b-chat": {
    "description": "الإصدار المفتوح من الجيل الأحدث من نموذج GLM-4 الذي أطلقته Zhizhu AI."
  },
+  "thudm/glm-4-9b:free": {
+    "description": "GLM-4-9B-0414 هو نموذج لغوي يحتوي على 9 مليار معلمة من سلسلة GLM-4 التي تم تطويرها بواسطة THUDM. يستخدم GLM-4-9B-0414 نفس استراتيجيات تعزيز التعلم والتوافق المستخدمة في النموذج المقابل الأكبر 32B، مما يحقق أداءً عاليًا بالنسبة لحجمه، مما يجعله مناسبًا للنشر في البيئات المحدودة الموارد التي لا تزال تتطلب قدرات قوية في فهم اللغة وتوليدها."
+  },
  "thudm/glm-z1-32b": {
    "description": "GLM-Z1-32B-0414 هو نسخة محسنة من GLM-4-32B، مصممة لحل المشكلات المعقدة في الرياضيات العميقة، المنطق، والشيفرات. يستخدم التعلم المعزز الموسع (المخصص للمهام والمبني على تفضيلات عامة) لتحسين الأداء في المهام المعقدة متعددة الخطوات. مقارنةً بنموذج GLM-4-32B الأساسي، زادت Z1 بشكل ملحوظ من قدرات الاستدلال الهيكلي والمجالات الرسمية.\n\nيدعم هذا النموذج تنفيذ خطوات \"التفكير\" من خلال هندسة التلميحات، ويقدم اتساقًا محسنًا للإخراج الطويل. تم تحسينه لعمليات سير العمل الخاصة بالوكيل، ويدعم السياقات الطويلة (عبر YaRN)، واستدعاءات أدوات JSON، وتكوينات أخذ العينات الدقيقة للاستدلال المستقر. مثالي للحالات التي تتطلب تفكيرًا عميقًا، استدلالًا متعدد الخطوات، أو استنتاجات رسمية."
  },
+  "thudm/glm-z1-32b:free": {
+    "description": "GLM-Z1-32B-0414 هو نسخة محسنة من GLM-4-32B، مصممة لحل المشكلات المعقدة في الرياضيات العميقة، المنطق، والشيفرات. يستخدم التعلم المعزز الموسع (المخصص للمهام والمبني على تفضيلات عامة) لتحسين الأداء في المهام المعقدة متعددة الخطوات. مقارنةً بنموذج GLM-4-32B الأساسي، زادت Z1 بشكل ملحوظ من قدرات الاستدلال الهيكلي والمجالات الرسمية.\n\nيدعم هذا النموذج تنفيذ خطوات \"التفكير\" من خلال هندسة التلميحات، ويقدم اتساقًا محسنًا للإخراج الطويل. تم تحسينه لعمليات سير العمل الخاصة بالوكيل، ويدعم السياقات الطويلة (عبر YaRN)، واستدعاءات أدوات JSON، وتكوينات أخذ العينات الدقيقة للاستدلال المستقر. مثالي للحالات التي تتطلب تفكيرًا عميقًا، استدلالًا متعدد الخطوات، أو استنتاجات رسمية."
+  },
+  "thudm/glm-z1-9b:free": {
+    "description": "GLM-Z1-9B-0414 هو نموذج لغوي يحتوي على 9 مليار معلمة من سلسلة GLM-4 التي تم تطويرها بواسطة THUDM. يستخدم تقنيات تم تطبيقها في الأصل على نموذج GLM-Z1 الأكبر، بما في ذلك تعزيز التعلم الموسع، والتوافق القائم على الترتيب الثنائي، والتدريب على المهام التي تتطلب استدلالًا مكثفًا مثل الرياضيات، والترميز، والمنطق. على الرغم من حجمه الأصغر، إلا أنه يظهر أداءً قويًا في المهام العامة للاستدلال، ويتفوق على العديد من النماذج مفتوحة المصدر في مستوى وزنه."
+  },
  "thudm/glm-z1-rumination-32b": {
    "description": "THUDM: GLM Z1 Rumination 32B هو نموذج استدلال عميق يحتوي على 32 مليار معلمة من سلسلة GLM-4-Z1، تم تحسينه للمهام المعقدة والمفتوحة التي تتطلب تفكيرًا طويل الأمد. يعتمد على glm-4-32b-0414، ويضيف مراحل تعزيز التعلم الإضافية واستراتيجيات التوافق متعددة المراحل، ويقدم قدرة \"التفكير\" المصممة لمحاكاة معالجة الإدراك الموسع. يشمل ذلك الاستدلال التكراري، والتحليل متعدد القفزات، وسير العمل المعزز بالأدوات مثل البحث، والاسترجاع، والتوليف المدرك للاقتباسات.\n\nيظهر هذا النموذج أداءً ممتازًا في الكتابة البحثية، والتحليل المقارن، والأسئلة المعقدة. يدعم استدعاء الوظائف المستخدمة في البحث والتنقل (مثل `search`، `click`، `open`، `finish`)، مما يسمح باستخدامه في أنابيب الوكلاء. يتم تشكيل سلوك التفكير من خلال مكافآت قائمة على القواعد وآلية اتخاذ القرار المتأخرة، ويتم قياسه باستخدام أطر بحث عميقة مثل كومة التوافق الداخلية لـ OpenAI. هذا المتغير مناسب للسيناريوهات التي تتطلب عمقًا بدلاً من السرعة."
  },
@@ -2803,8 +2707,5 @@
  },
  "zai-org/GLM-4.5-Air": {
    "description": "GLM-4.5-Air هو نموذج أساسي مصمم لتطبيقات الوكلاء الذكية، يستخدم بنية Mixture-of-Experts (MoE). تم تحسينه بعمق في مجالات استدعاء الأدوات، تصفح الويب، هندسة البرمجيات، وبرمجة الواجهة الأمامية، ويدعم التكامل السلس مع وكلاء الكود مثل Claude Code وRoo Code. يستخدم وضع استدلال مختلط ليتكيف مع سيناريوهات الاستدلال المعقدة والاستخدام اليومي."
-  },
-  "zai-org/GLM-4.5V": {
-    "description": "GLM-4.5V هو نموذج لغوي بصري (VLM) من الجيل الأحدث صدر عن Zhipu AI (智谱 AI). بُني النموذج على نموذج النص الرائد GLM-4.5-Air الذي يحتوي على 106B من المعاملات الإجمالية و12B من معاملات التنشيط، ويعتمد على بنية الخبراء المختلطين (MoE) بهدف تحقيق أداء متميز بتكلفة استدلال أقل. من الناحية التقنية، يواصل GLM-4.5V نهج GLM-4.1V-Thinking ويقدّم ابتكارات مثل ترميز المواقع الدوراني ثلاثي الأبعاد (3D-RoPE)، مما عزّز بشكل ملحوظ قدرته على إدراك واستنتاج العلاقات المكانية ثلاثية الأبعاد. وبفضل تحسينات في مراحل ما قبل التدريب، والتعديل بالإشراف، والتعلّم المعزّز، أصبح النموذج قادراً على معالجة محتوى بصري متنوّع مثل الصور والفيديوهات والمستندات الطويلة، وقد حقق مستوى متقدماً ضمن أفضل نماذج المصدر المفتوح في 41 معياراً متعدد الوسائط منشوراً. بالإضافة إلى ذلك، أضاف النموذج مفتاح \"وضع التفكير\" الذي يتيح للمستخدمين التبديل بين الاستجابة السريعة والاستدلال العميق بحرية لتوازن أفضل بين الكفاءة والفعالية."
  }
 }
@@ -11,9 +11,6 @@
  "aihubmix": {
    "description": "يوفر AiHubMix الوصول إلى نماذج الذكاء الاصطناعي المتعددة من خلال واجهة برمجة تطبيقات موحدة."
  },
-  "akashchat": {
-    "description": "آكاش هو سوق موارد سحابية بدون ترخيص، يتميز بأسعار تنافسية مقارنة بمزودي السحابة التقليديين."
-  },
  "anthropic": {
    "description": "Anthropic هي شركة تركز على أبحاث وتطوير الذكاء الاصطناعي، وتقدم مجموعة من نماذج اللغة المتقدمة، مثل Claude 3.5 Sonnet وClaude 3 Sonnet وClaude 3 Opus وClaude 3 Haiku. تحقق هذه النماذج توازنًا مثاليًا بين الذكاء والسرعة والتكلفة، وتناسب مجموعة متنوعة من سيناريوهات التطبيقات، من أحمال العمل على مستوى المؤسسات إلى الاستجابات السريعة. يعتبر Claude 3.5 Sonnet أحدث نماذجها، وقد أظهر أداءً ممتازًا في العديد من التقييمات مع الحفاظ على نسبة تكلفة فعالة."
  },
@@ -29,9 +26,6 @@
  "bedrock": {
    "description": "Bedrock هي خدمة تقدمها أمازون AWS، تركز على توفير نماذج لغة ورؤية متقدمة للذكاء الاصطناعي للشركات. تشمل عائلة نماذجها سلسلة Claude من Anthropic وسلسلة Llama 3.1 من Meta، وتغطي مجموعة من الخيارات من النماذج الخفيفة إلى عالية الأداء، وتدعم مهام مثل توليد النصوص، والحوار، ومعالجة الصور، مما يجعلها مناسبة لتطبيقات الشركات بمختلف أحجامها واحتياجاتها."
  },
-  "bfl": {
-    "description": "مختبر أبحاث رائد في مقدمة الذكاء الاصطناعي، يبني البنية التحتية البصرية للمستقبل."
-  },
  "cloudflare": {
    "description": "تشغيل نماذج التعلم الآلي المدفوعة بوحدات معالجة الرسوميات بدون خادم على شبكة Cloudflare العالمية."
  },
@@ -92,12 +86,6 @@
  "moonshot": {
    "description": "Moonshot هي منصة مفتوحة أطلقتها شركة Beijing Dark Side Technology Co.، Ltd، تقدم مجموعة متنوعة من نماذج معالجة اللغة الطبيعية، وتغطي مجالات واسعة، بما في ذلك ولكن لا تقتصر على إنشاء المحتوى، والبحث الأكاديمي، والتوصيات الذكية، والتشخيص الطبي، وتدعم معالجة النصوص الطويلة والمهام المعقدة."
  },
-  "nebius": {
-    "description": "نيبيوس توفر بنية تحتية عالية الأداء للمبتكرين في مجال الذكاء الاصطناعي حول العالم من خلال بناء مجموعات ضخمة من وحدات معالجة الرسومات ومنصة سحابية متكاملة رأسياً."
-  },
-  "newapi": {
-    "description": "منصة مفتوحة المصدر لتجميع وتحويل خدمات الذكاء الاصطناعي المتعددة بشكل موحد"
-  },
  "novita": {
    "description": "Novita AI هي منصة تقدم خدمات API لمجموعة متنوعة من نماذج اللغة الكبيرة وتوليد الصور بالذكاء الاصطناعي، مرنة وموثوقة وفعالة من حيث التكلفة. تدعم أحدث النماذج مفتوحة المصدر مثل Llama3 وMistral، وتوفر حلول API شاملة وسهلة الاستخدام وقابلة للتوسع تلقائيًا لتطوير تطبيقات الذكاء الاصطناعي، مما يجعلها مناسبة لنمو الشركات الناشئة في مجال الذكاء الاصطناعي."
  },
@@ -237,10 +237,6 @@
      "title": "تحديد عدد الرسائل التاريخية",
      "unlimited": "غير محدود"
    },
-    "enableStreaming": {
-      "desc": "تمكين الإخراج المتدفق لعرض الاستجابات في الوقت الفعلي. عند التعطيل، يتم عرض الاستجابة الكاملة فقط.",
-      "title": "تمكين الإخراج المتدفق"
-    },
    "historyCount": {
      "desc": "عدد الرسائل التي يتم إرفاقها في كل طلب (تشمل الأسئلة والأجوبة الجديدة. يُحسب كل سؤال وجواب كرسالة واحدة)",
      "title": "عدد الرسائل المرفقة"
@@ -52,11 +52,7 @@
    "thinking": {
      "title": "Превключвател за дълбоко мислене"
    },
-    "title": "Разширени функции на модела",
-    "urlContext": {
-      "desc": "Когато е включено, автоматично ще се анализират уеб връзки, за да се получи реалното съдържание на уеб страницата",
-      "title": "Извличане на съдържание от уеб връзки"
-    }
+    "title": "Разширени функции на модела"
  },
  "history": {
    "title": "Асистентът ще запомни само последните {{count}} съобщения"
@@ -129,7 +125,6 @@
      "inputWriteCached": "Входящи кеширани данни",
      "output": "Изход",
      "outputAudio": "Аудио изход",
-      "outputImage": "Изходно изображение",
      "outputText": "Текстов изход",
      "outputTitle": "Детайли за изхода",
      "reasoning": "Дълбочинно разсъждение",
@@ -273,8 +268,7 @@
    "clientMode": {
      "actionFiletip": "Качване на файл",
      "actionTooltip": "Качване",
-      "disabled": "Текущият модел не поддържа визуално разпознаване и анализ на файлове, моля, превключете модела и опитайте отново",
-      "visionNotSupported": "Текущият модел не поддържа визуално разпознаване, моля, превключете на друг модел, за да използвате тази функция"
+      "disabled": "Текущият модел не поддържа визуално разпознаване и анализ на файлове, моля, превключете модела и опитайте отново"
    },
    "preview": {
      "prepareTasks": "Подготовка на парчета...",
@@ -32,7 +32,6 @@
  "blog": "Продуктов блог",
  "branching": "Създаване на подтема",
  "branchingDisable": "Функцията „подтема“ е налична само в сървърната версия. Ако искате да използвате тази функция, моля, превключете на режим на сървърно разполагане или използвайте LobeChat Cloud.",
-  "branchingRequiresSavedTopic": "Текущата тема не е запазена, моля запазете я, за да използвате функцията за под-теми",
  "cancel": "Отказ",
  "changelog": "Дневник на промените",
  "clientDB": {
@@ -183,13 +182,6 @@
    "title": "Харесвате нашия продукт?"
  },
  "fullscreen": "Цял екран",
-  "geminiImageChineseWarning": {
-    "content": "Nano Banana може да не успее да генерира изображение при използване на китайски език. Препоръчваме използването на английски за по-добри резултати.",
-    "continueGenerate": "Продължи генерирането",
-    "continueSend": "Продължи изпращането",
-    "doNotShowAgain": "Не показвай отново",
-    "title": "Подсказка за въвеждане на китайски"
-  },
  "historyRange": "Диапазон на историята",
  "import": "Импортиране",
  "importData": "Импорт на данни",
@@ -1,9 +1,4 @@
 {
-  "ArgsInput": {
-    "addArgument": "Добави параметър",
-    "argumentPlaceholder": "Параметър {{index}}",
-    "enterFirstArgument": "Въведете първия параметър..."
-  },
  "DragUpload": {
    "dragDesc": "Плъзнете файлове тук, поддържа качване на множество изображения.",
    "dragFileDesc": "Плъзнете изображения и файлове тук, поддържа качване на множество изображения и файлове.",
@@ -73,18 +68,6 @@
  "GoBack": {
    "back": "Назад"
  },
-  "HtmlPreview": {
-    "actions": {
-      "download": "Изтегляне",
-      "preview": "Преглед"
-    },
-    "iframeTitle": "HTML Преглед",
-    "mode": {
-      "code": "Код",
-      "preview": "Преглед"
-    },
-    "title": "HTML Преглед"
-  },
  "ImageUpload": {
    "actions": {
      "changeImage": "Кликнете, за да смените изображението",
@@ -142,12 +125,6 @@
    },
    "progress": {
      "uploadingWithCount": "{{completed}}/{{total}} качени"
-    },
-    "validation": {
-      "fileSizeExceeded": "Превишен допустим размер на файла",
-      "fileSizeExceededDetail": "{{fileName}} ({{actualSize}}) надвишава максимално допустимия размер {{maxSize}}",
-      "fileSizeExceededMultiple": "{{count}} файла надвишават максимално допустимия размер {{maxSize}}: {{fileList}}",
-      "imageCountExceeded": "Надвишен е допустимият брой изображения"
    }
  },
  "OllamaSetupGuide": {
@@ -85,17 +85,6 @@
    "CreateMessageError": "Съжалявам, съобщението не можа да бъде изпратено успешно. Моля, копирайте съдържанието и го изпратете отново. След опресняване на страницата, това съобщение няма да бъде запазено.",
    "ExceededContextWindow": "Текущото съдържание на заявката надвишава дължината, която моделът може да обработи. Моля, намалете обема на съдържанието и опитайте отново.",
    "FreePlanLimit": "В момента сте потребител на безплатен план и не можете да използвате тази функционалност. Моля, надстройте до платен план, за да продължите да я използвате.",
-    "GoogleAIBlockReason": {
-      "BLOCKLIST": "Вашето съдържание съдържа забранени думи. Моля, проверете и коригирайте входа си и опитайте отново.",
-      "IMAGE_SAFETY": "Генерираното изображение е блокирано поради съображения за безопасност. Моля, опитайте да промените заявката за генериране на изображение.",
-      "LANGUAGE": "Езикът, който използвате, все още не се поддържа. Моля, опитайте да зададете въпроса на английски или на друг поддържан език.",
-      "OTHER": "Съдържанието е блокирано по неизвестна причина. Моля, опитайте да преформулирате заявката си.",
-      "PROHIBITED_CONTENT": "Вашата заявка може да съдържа забранено съдържание. Моля, коригирайте заявката, за да отговаря на правилата за ползване.",
-      "RECITATION": "Съдържанието ви е блокирано поради възможни проблеми с авторските права. Моля, опитайте да използвате оригинално съдържание или да преформулирате заявката си.",
-      "SAFETY": "Вашето съдържание е блокирано поради правила за безопасност. Моля, опитайте да промените заявката, като избягвате потенциално вредно или неподходящо съдържание.",
-      "SPII": "Вашето съдържание може да съдържа чувствителна лична информация. За да защитите поверителността, моля, премахнете съответната чувствителна информация и опитайте отново.",
-      "default": "Съдържанието е блокирано: {{blockReason}}。请调整您的请求内容后重试。"
-    },
    "InsufficientQuota": "Съжаляваме, квотата за този ключ е достигнала лимита. Моля, проверете баланса на акаунта си или увеличете квотата на ключа и опитайте отново.",
    "InvalidAccessCode": "Невалиден или празен код за достъп. Моля, въведете правилния код за достъп или добавете персонализиран API ключ.",
    "InvalidBedrockCredentials": "Удостоверяването на Bedrock е неуспешно. Моля, проверете AccessKeyId/SecretAccessKey и опитайте отново.",
@@ -153,28 +153,6 @@
    "searchProviders": "Търсене на доставчици...",
    "sort": "Персонализирано сортиране"
  },
-  "newapi": {
-    "apiKey": {
-      "desc": "API ключът, предоставен от платформата New API",
-      "placeholder": "API ключ на New API",
-      "required": "API ключът е задължителен",
-      "title": "API ключ"
-    },
-    "apiUrl": {
-      "desc": "API адресът на услугата New API, обикновено трябва да включва /v1",
-      "title": "API адрес"
-    },
-    "enabled": {
-      "title": "Активиране на New API"
-    },
-    "models": {
-      "batchSelect": "Избор на множество модели ({{count}} броя)",
-      "fetch": "Вземане на списък с модели",
-      "selected": "Избрани модели",
-      "title": "Налични модели"
-    },
-    "title": "New API"
-  },
  "ollama": {
    "checker": {
      "desc": "Тестване дали адресът на прокси е попълнен правилно",
@@ -207,10 +185,6 @@
    }
  },
  "providerModels": {
-    "batchSelect": {
-      "selected": "Избрани {{count}} модела",
-      "title": "Множествен избор"
-    },
    "config": {
      "aesGcm": "Вашият ключ и адреса на прокси ще бъдат криптирани с <1>AES-GCM</1> алгоритъм",
      "apiKey": {
@@ -74,15 +74,9 @@
  "DeepSeek-V3": {
    "description": "DeepSeek-V3 е MoE модел, разработен от компанията DeepSeek. DeepSeek-V3 постига резултати в множество оценки, които надминават други отворени модели като Qwen2.5-72B и Llama-3.1-405B, като по отношение на производителност е наравно с водещите затворени модели в света като GPT-4o и Claude-3.5-Sonnet."
  },
-  "DeepSeek-V3-1": {
-    "description": "DeepSeek V3.1: Следващо поколение модел за разсъждение, подобряващ сложното разсъждение и веригата на мислене, подходящ за задачи, изискващи задълбочен анализ."
-  },
  "DeepSeek-V3-Fast": {
    "description": "Доставчик на модела: платформа sophnet. DeepSeek V3 Fast е високоскоростната версия с висока TPS на DeepSeek V3 0324, с пълна точност без квантизация, с по-силни кодови и математически възможности и по-бърз отговор!"
  },
-  "DeepSeek-V3.1": {
-    "description": "DeepSeek-V3.1 е новият хибриден модел за разсъждение на DeepSeek, който поддържа два режима на разсъждение: мислене и немислене, с по-висока ефективност на мислене в сравнение с DeepSeek-R1-0528. След оптимизация чрез пост-тренировка, използването на агентски инструменти и изпълнението на задачи от интелигентни агенти са значително подобрени."
-  },
  "Doubao-lite-128k": {
    "description": "Doubao-lite предлага изключително бърза реакция и по-добро съотношение цена-качество, осигурявайки по-гъвкави опции за различни сценарии на клиентите. Поддържа разсъждения и финна настройка с контекстен прозорец от 128k."
  },
@@ -137,15 +131,9 @@
  "ERNIE-Speed-Pro-128K": {
    "description": "Най-новият модел на Baidu за големи езикови модели с висока производителност, разработен самостоятелно, с отлични общи способности, по-добри резултати в сравнение с ERNIE Speed, подходящ за основен модел за фина настройка, за по-добро справяне с конкретни проблеми, като същевременно предлага отлична производителност при извеждане."
  },
-  "FLUX-1.1-pro": {
-    "description": "FLUX.1.1 Pro"
-  },
  "FLUX.1-Kontext-dev": {
    "description": "FLUX.1-Kontext-dev е мултимоделен модел за генериране и редактиране на изображения, разработен от Black Forest Labs, базиран на архитектурата Rectified Flow Transformer с 12 милиарда параметри. Моделът е специализиран в генериране, реконструкция, подобряване и редактиране на изображения при зададени контекстуални условия. Той съчетава предимствата на контролираното генериране на дифузионни модели с контекстуалното моделиране на Transformer, поддържайки висококачествен изход и широко приложение в задачи като възстановяване, допълване и реконструкция на визуални сцени."
  },
-  "FLUX.1-Kontext-pro": {
-    "description": "FLUX.1 Kontext [pro]"
-  },
  "FLUX.1-dev": {
    "description": "FLUX.1-dev е отворен мултимодален езиков модел (Multimodal Language Model, MLLM), разработен от Black Forest Labs, оптимизиран за задачи с текст и изображения. Той интегрира разбиране и генериране на изображения и текст, базиран на напреднали големи езикови модели като Mistral-7B, с внимателно проектиран визуален енкодер и многостепенно фино настройване с инструкции, което позволява съвместна обработка на текст и изображения и сложни задачи за разсъждение."
  },
@@ -182,9 +170,6 @@
  "Llama-3.2-90B-Vision-Instruct\t": {
    "description": "Напреднали способности за визуално разсъждение, подходящи за приложения на агенти за визуално разбиране."
  },
-  "Meta-Llama-3-3-70B-Instruct": {
-    "description": "Llama 3.3 70B: Универсален трансформър модел, подходящ за диалог и задачи за генериране."
-  },
  "Meta-Llama-3.1-405B-Instruct": {
    "description": "Текстов модел с оптимизация за инструкции на Llama 3.1, проектиран за многоезични диалогови случаи, който показва отлични резултати на много налични отворени и затворени чат модели на общи индустриални бенчмаркове."
  },
@@ -203,9 +188,6 @@
  "Meta-Llama-3.3-70B-Instruct": {
    "description": "Llama 3.3 е най-напредналият многоезичен отворен голям езиков модел от серията Llama, който предлага производителност, сравнима с 405B моделите, на изключително ниска цена. Базиран на структурата Transformer и подобрен чрез супервизирано фино настройване (SFT) и обучение с човешка обратна връзка (RLHF) за повишаване на полезността и безопасността. Неговата версия с оптимизация за инструкции е специално проектирана за многоезични диалози и показва по-добри резултати от много от наличните отворени и затворени чат модели на множество индустриални бенчмаркове. Краен срок за знанията е декември 2023 г."
  },
-  "Meta-Llama-4-Maverick-17B-128E-Instruct-FP8": {
-    "description": "Llama 4 Maverick: Голям модел, базиран на Mixture-of-Experts, предлагащ ефективна стратегия за активиране на експерти за отлични резултати при разсъждение."
-  },
  "MiniMax-M1": {
    "description": "Изцяло ново самостоятелно разработено модел за разсъждение. Световен лидер: 80K вериги на мислене x 1M вход, с резултати, сравними с водещите модели в чужбина."
  },
@@ -275,9 +257,6 @@
  "Pro/deepseek-ai/DeepSeek-V3": {
    "description": "DeepSeek-V3 е модел на езика с 6710 милиарда параметри, който използва архитектура на смесени експерти (MoE) с много глави на потенциално внимание (MLA) и стратегия за баланс на натоварването без помощни загуби, оптимизираща производителността на инференцията и обучението. Чрез предварително обучение на 14.8 трилиона висококачествени токени и последващо супервизирано фино настройване и обучение с подсилване, DeepSeek-V3 надминава производителността на други отворени модели и е близо до водещите затворени модели."
  },
-  "Pro/deepseek-ai/DeepSeek-V3.1": {
-    "description": "DeepSeek-V3.1 е хибриден голям езиков модел, пуснат от DeepSeek AI, който включва множество важни подобрения спрямо предишните версии. Основната иновация на модела е интеграцията на „режим на мислене“ (Thinking Mode) и „режим без мислене“ (Non-thinking Mode), които потребителите могат гъвкаво да превключват чрез настройка на чат шаблони, за да отговарят на различни задачи. След специална пост-тренировка, V3.1 значително подобрява производителността при използване на инструменти и задачи на агенти, като по-добре поддържа външни търсачки и изпълнение на сложни многостъпкови задачи. Моделът е дообучен върху DeepSeek-V3.1-Base чрез двуфазен метод за разширяване на дълги текстове, което значително увеличава обема на тренировъчните данни и подобрява работата с дълги документи и кодове. Като отворен модел, DeepSeek-V3.1 демонстрира способности, сравними с водещи затворени модели в области като кодиране, математика и разсъждение, като същевременно с хибридната си експертна (MoE) архитектура поддържа голям капацитет на модела и ефективно намалява разходите за изчисления."
-  },
  "Pro/moonshotai/Kimi-K2-Instruct": {
    "description": "Kimi K2 е базов модел с MoE архитектура с изключителни кодови и агентски способности, с общо 1 трилион параметри и 32 милиарда активирани параметри. В бенчмаркове за общо знание, програмиране, математика и агентски задачи моделът K2 превъзхожда други водещи отворени модели."
  },
@@ -353,21 +332,12 @@
  "Qwen/Qwen3-30B-A3B-Instruct-2507": {
    "description": "Qwen3-30B-A3B-Instruct-2507 е обновена версия на Qwen3-30B-A3B в режим без мислене. Това е хибриден експертен (MoE) модел с общо 30,5 милиарда параметри и 3,3 милиарда активни параметри. Моделът е получил ключови подобрения в множество аспекти, включително значително подобрена способност за следване на инструкции, логическо разсъждение, разбиране на текст, математика, наука, кодиране и използване на инструменти. Освен това, той постига съществен напредък в покритието на дългоопашатите знания на многоезично ниво и по-добре се съгласува с предпочитанията на потребителите при субективни и отворени задачи, което позволява генериране на по-полезни отговори и по-висококачествен текст. Освен това, способността му за разбиране на дълги текстове е увеличена до 256K. Този модел поддържа само режим без мислене и в изхода му не се генерират тагове `<think></think>`."
  },
-  "Qwen/Qwen3-30B-A3B-Thinking-2507": {
-    "description": "Qwen3-30B-A3B-Thinking-2507 е най-новият мисловен модел от серията Qwen3, публикуван от екипа Tongyi Qianwen на Alibaba. Като хибриден модел от типа Mixture of Experts (MoE) с общо 30,5 милиарда параметри и 3,3 милиарда активни параметри, той е насочен към повишаване на възможностите за справяне със сложни задачи. Моделът показва значително подобрение в логическото разсъждение, математиката, естествените науки, програмирането и академичните бенчмаркове, изискващи човешка експертиза. В същото време общите му способности — следване на инструкции, използване на инструменти, генериране на текст и съгласуване с човешките предпочитания — също са значително подсилени. Моделът поддържа нативно дълъг контекст до 256K и може да бъде разширен до 1 000 000 токена. Тази версия е специално проектирана за мисловен режим, с цел да решава изключително сложни задачи чрез подробни стъпкови разсъждения; агентните ѝ възможности също се представят отлично."
-  },
  "Qwen/Qwen3-32B": {
    "description": "Qwen3 е ново поколение модел на Tongyi Qianwen с значително подобрени способности, достигащи водещо ниво в индустрията в разсъждения, общи, агенти и многоезични основни способности, и поддържа превключване на режим на мислене."
  },
  "Qwen/Qwen3-8B": {
    "description": "Qwen3 е ново поколение модел на Tongyi Qianwen с значително подобрени способности, достигащи водещо ниво в индустрията в разсъждения, общи, агенти и многоезични основни способности, и поддържа превключване на режим на мислене."
  },
-  "Qwen/Qwen3-Coder-30B-A3B-Instruct": {
-    "description": "Qwen3-Coder-30B-A3B-Instruct е кодов модел от серията Qwen3, разработен от екипа Tongyi Qianwen на Alibaba. Като рационализиран и оптимизиран модел, той запазва висока производителност и ефективност, като същевременно е фокусиран върху подобряване на възможностите за обработка на код. Моделът показва значително предимство сред отворените модели при сложни задачи като агентно програмиране (Agentic Coding), автоматизирани браузърни операции и извикване на инструменти. Той предлага нативна поддръжка за дълги контексти до 256K токена и може да се разшири до 1M токена, което позволява по-добро разбиране и обработка на ниво кодова база. Освен това моделът предоставя силна поддръжка за агентно кодиране в платформи като Qwen Code и CLINE и е проектирал специален формат за извикване на функции."
-  },
-  "Qwen/Qwen3-Coder-480B-A35B-Instruct": {
-    "description": "Qwen3-Coder-480B-A35B-Instruct е публикуван от Alibaba и до момента е един от най-агентно ориентираните (agentic) кодови модели. Това е смесен експертен (MoE) модел с общо 480 милиарда параметри и 35 милиарда активни параметри, който постига баланс между ефективност и производителност. Моделът поддържа родно контекстна дължина от 256K (прибл. 260 000) токена и може да бъде екстраполиран чрез методи като YaRN до 1 милион токена, което му позволява да обработва големи кодови бази и сложни програмистки задачи. Qwen3-Coder е специално проектиран за агентно ориентирани (agentic) кодови работни потоци — той не само генерира код, но може и автономно да взаимодейства с инструменти и среди за разработка, за да решава сложни програмистки проблеми. В множество бенчмаркове за кодиране и агентни задачи моделът постига водещи резултати сред отворените модели и неговата производителност е сравнима с тази на водещи модели като Claude Sonnet 4."
-  },
  "Qwen2-72B-Instruct": {
    "description": "Qwen2 е най-новата серия на модела Qwen, поддържаща 128k контекст. В сравнение с текущите най-добри отворени модели, Qwen2-72B значително надминава водещите модели в области като разбиране на естествен език, знания, код, математика и многоезичност."
  },
@@ -398,9 +368,6 @@
  "Qwen3-235B": {
    "description": "Qwen3-235B-A22B е MoE (хибриден експертен модел), който въвежда „хибриден режим на разсъждение“, позволяващ на потребителите безпроблемно превключване между „режим мислене“ и „режим без мислене“. Поддържа разбиране и разсъждение на 119 езика и диалекта и разполага с мощни възможности за извикване на инструменти. В множество базови тестове за общи способности, кодиране, математика, многоезичност, знания и разсъждение, той може да се конкурира с водещите големи модели на пазара като DeepSeek R1, OpenAI o1, o3-mini, Grok 3 и Google Gemini 2.5 Pro."
  },
-  "Qwen3-235B-A22B-Instruct-2507-FP8": {
-    "description": "Qwen3 235B A22B Instruct 2507: Модел, оптимизиран за напреднало разсъждение и диалогови инструкции, с хибридна експертна архитектура, поддържаща ефективност при голям брой параметри."
-  },
  "Qwen3-32B": {
    "description": "Qwen3-32B е плътен модел (Dense Model), който въвежда „хибриден режим на разсъждение“, позволяващ на потребителите безпроблемно превключване между „режим мислене“ и „режим без мислене“. Благодарение на подобрения в архитектурата на модела, увеличени тренировъчни данни и по-ефективни методи за обучение, общата производителност е сравнима с тази на Qwen2.5-72B."
  },
@@ -857,9 +824,6 @@
  "deepseek-ai/DeepSeek-V3": {
    "description": "DeepSeek-V3 е езиков модел с 6710 милиарда параметри, базиран на смесени експерти (MoE), който използва многоглаво потенциално внимание (MLA) и архитектурата DeepSeekMoE, комбинирайки стратегии за баланс на натоварването без помощни загуби, за да оптимизира производителността на извеждане и обучение. Чрез предварително обучение на 14.8 трилиона висококачествени токени и последващо наблюдавано фино настройване и подсилено обучение, DeepSeek-V3 надминава производителността на други отворени модели и се приближава до водещите затворени модели."
  },
-  "deepseek-ai/DeepSeek-V3.1": {
-    "description": "DeepSeek-V3.1 е хибриден голям езиков модел, пуснат от DeepSeek AI, който включва множество важни подобрения спрямо предишните версии. Основната иновация на модела е интеграцията на „режим на мислене“ (Thinking Mode) и „режим без мислене“ (Non-thinking Mode), които потребителите могат гъвкаво да превключват чрез настройка на чат шаблони, за да отговарят на различни задачи. След специална пост-тренировка, V3.1 значително подобрява производителността при използване на инструменти и задачи на агенти, като по-добре поддържа външни търсачки и изпълнение на сложни многостъпкови задачи. Моделът е дообучен върху DeepSeek-V3.1-Base чрез двуфазен метод за разширяване на дълги текстове, което значително увеличава обема на тренировъчните данни и подобрява работата с дълги документи и кодове. Като отворен модел, DeepSeek-V3.1 демонстрира способности, сравними с водещи затворени модели в области като кодиране, математика и разсъждение, като същевременно с хибридната си експертна (MoE) архитектура поддържа голям капацитет на модела и ефективно намалява разходите за изчисления."
-  },
  "deepseek-ai/deepseek-llm-67b-chat": {
    "description": "DeepSeek 67B е напреднал модел, обучен за диалози с висока сложност."
  },
@@ -930,7 +894,7 @@
    "description": "DeepSeek R1 пълна версия, с 671B параметри, поддържаща търсене в реално време, с по-силни способности за разбиране и генериране."
  },
  "deepseek-reasoner": {
-    "description": "DeepSeek V3.1 режим на мислене. Преди да изведе окончателния отговор, моделът първо генерира мисловна верига, за да повиши точността на крайния отговор."
+    "description": "Модел за извеждане, разработен от DeepSeek. Преди да предостави окончателния отговор, моделът първо извежда част от веригата на мислене, за да повиши точността на крайния отговор."
  },
  "deepseek-v2": {
    "description": "DeepSeek V2 е ефективен модел на Mixture-of-Experts, подходящ за икономически ефективни нужди от обработка."
@@ -944,18 +908,12 @@
  "deepseek-v3-0324": {
    "description": "DeepSeek-V3-0324 е MoE модел с 671B параметри, който се отличава с предимства в програмирането и техническите способности, разбирането на контекста и обработката на дълги текстове."
  },
-  "deepseek-v3.1": {
-    "description": "DeepSeek-V3.1 е новият хибриден модел за разсъждение на DeepSeek, който поддържа два режима на разсъждение: мислене и немислене, с по-висока ефективност на мислене в сравнение с DeepSeek-R1-0528. След оптимизация чрез пост-тренировка, използването на агентски инструменти и изпълнението на задачи от интелигентни агенти са значително подобрени. Поддържа контекстен прозорец до 128k и максимална дължина на изхода до 64k токена."
-  },
  "deepseek/deepseek-chat-v3-0324": {
    "description": "DeepSeek V3 е експертен смесен модел с 685B параметри, последната итерация на флагманската серия чат модели на екипа DeepSeek.\n\nТой наследява модела [DeepSeek V3](/deepseek/deepseek-chat-v3) и показва отлични резултати в различни задачи."
  },
  "deepseek/deepseek-chat-v3-0324:free": {
    "description": "DeepSeek V3 е експертен смесен модел с 685B параметри, последната итерация на флагманската серия чат модели на екипа DeepSeek.\n\nТой наследява модела [DeepSeek V3](/deepseek/deepseek-chat-v3) и показва отлични резултати в различни задачи."
  },
-  "deepseek/deepseek-chat-v3.1": {
-    "description": "DeepSeek-V3.1 е голям хибриден модел за разсъждение, който поддържа 128K дълъг контекст и ефективно превключване на режими, постигащ изключителна производителност и скорост при използване на инструменти, генериране на код и сложни задачи за разсъждение."
-  },
  "deepseek/deepseek-r1": {
    "description": "DeepSeek-R1 значително подобри способността на модела за разсъждение при наличието на много малко маркирани данни. Преди да предостави окончателния отговор, моделът първо ще изведе част от съдържанието на веригата на мислене, за да повиши точността на окончателния отговор."
  },
@@ -1145,27 +1103,12 @@
  "flux-dev": {
    "description": "FLUX.1 [dev] е отворен и пречистен модел, предназначен за нетърговска употреба. Той запазва качество на изображенията и способността за следване на инструкции, близки до професионалната версия на FLUX, като същевременно предлага по-висока ефективност на работа и по-добро използване на ресурсите в сравнение със стандартни модели със същия размер."
  },
-  "flux-kontext-max": {
-    "description": "Най-съвременно генериране и редактиране на контекстуални изображения — комбиниране на текст и изображения за постигане на прецизни и кохерентни резултати."
-  },
-  "flux-kontext-pro": {
-    "description": "Най-съвременни възможности за контекстно генериране и редактиране на изображения — комбиниране на текст и изображения за постигане на прецизни и последователни резултати."
-  },
  "flux-kontext/dev": {
    "description": "FLUX.1 модел, фокусиран върху задачи за редактиране на изображения, поддържащ текстови и визуални входни данни."
  },
  "flux-merged": {
    "description": "FLUX.1-merged комбинира дълбоките характеристики, изследвани в разработката на \"DEV\" версията, с високоскоростните предимства на \"Schnell\". Тази комбинация не само разширява границите на производителността на модела, но и увеличава обхвата на неговото приложение."
  },
-  "flux-pro": {
-    "description": "Водещ комерсиален модел за генериране на изображения с изкуствен интелект — несравнимо качество на изображенията и богато разнообразие на генерираните резултати."
-  },
-  "flux-pro-1.1": {
-    "description": "Усъвършенстван професионален модел за генериране на изображения с изкуствен интелект — предлага изключително качество на изображенията и прецизно изпълнение на подадените подсказки."
-  },
-  "flux-pro-1.1-ultra": {
-    "description": "Генериране на изображения с изкуствен интелект с изключително висока резолюция — поддържа изход 4 мегапиксела, създава ултраясни изображения за по-малко от 10 секунди."
-  },
  "flux-pro/kontext": {
    "description": "FLUX.1 Kontext [pro] може да обработва текст и референтни изображения като вход, осигурявайки безпроблемно целенасочено локално редактиране и сложни трансформации на цялостната сцена."
  },
@@ -1250,12 +1193,6 @@
  "gemini-2.5-flash": {
    "description": "Gemini 2.5 Flash е най-ефективният модел на Google, предлагащ пълна функционалност."
  },
-  "gemini-2.5-flash-image-preview": {
-    "description": "Nano Banana е най-новият, най-бързият и най-ефективният роден мултимодален модел на Google, който ви позволява да генерирате и редактирате изображения чрез диалог."
-  },
-  "gemini-2.5-flash-image-preview:image": {
-    "description": "Nano Banana е най-новият, най-бързият и най-ефективният роден мултимодален модел на Google, който ви позволява да генерирате и редактирате изображения чрез диалог."
-  },
  "gemini-2.5-flash-lite": {
    "description": "Gemini 2.5 Flash-Lite е най-малкият и най-ефективен модел на Google, създаден специално за масово използване."
  },
@@ -1358,9 +1295,6 @@
  "glm-4.5-x": {
    "description": "Експресната версия на GLM-4.5, която съчетава силна производителност с генериране на скорост до 100 токена в секунда."
  },
-  "glm-4.5v": {
-    "description": "Новото поколение визуален модел за разсъждение на Zhipu, базиран на MOE архитектура, с общо 106B параметри и 12B активни параметри, постига SOTA сред отворените мултимодални модели в своя клас в различни бенчмаркове, обхващайки често срещани задачи като обработка на изображения, видео, разбиране на документи и GUI задачи."
-  },
  "glm-4v": {
    "description": "GLM-4V предлага мощни способности за разбиране и разсъждение на изображения, поддържаща множество визуални задачи."
  },
@@ -1397,12 +1331,6 @@
  "google/gemini-2.5-flash": {
    "description": "Gemini 2.5 Flash е най-усъвършенстваният основен модел на Google, специално проектиран за напреднали задачи по разсъждение, кодиране, математика и наука. Той включва вградена способност за „мислене“, която му позволява да предоставя отговори с по-висока точност и по-детайлна обработка на контекста.\n\nЗабележка: Този модел има два варианта: с мислене и без мислене. Ценообразуването на изхода се различава значително в зависимост от това дали способността за мислене е активирана. Ако изберете стандартния вариант (без суфикса „:thinking“), моделът ясно избягва генерирането на мисловни токени.\n\nЗа да използвате способността за мислене и да получавате мисловни токени, трябва да изберете варианта „:thinking“, което ще доведе до по-висока цена за изход с мислене.\n\nОсвен това, Gemini 2.5 Flash може да бъде конфигуриран чрез параметъра „максимален брой токени за разсъждение“, както е описано в документацията (https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning)."
  },
-  "google/gemini-2.5-flash-image-preview": {
-    "description": "Gemini 2.5 Flash експериментален модел, поддържащ генериране на изображения."
-  },
-  "google/gemini-2.5-flash-image-preview:free": {
-    "description": "Gemini 2.5 Flash експериментален модел, поддържащ генериране на изображения."
-  },
  "google/gemini-2.5-flash-preview": {
    "description": "Gemini 2.5 Flash е най-напредналият основен модел на Google, проектиран за напреднали разсъждения, кодиране, математика и научни задачи. Той включва вградена способност за \"мислене\", което му позволява да предоставя отговори с по-висока точност и детайлна обработка на контекста.\n\nЗабележка: Този модел има два варианта: с мислене и без мислене. Цените на изхода значително варират в зависимост от активирането на способността за мислене. Ако изберете стандартния вариант (без суфикс \":thinking\"), моделът ще избягва генерирането на токени за мислене.\n\nЗа да се възползвате от способността за мислене и да получите токени за мислене, трябва да изберете варианта \":thinking\", което ще доведе до по-високи цени на изхода за мислене.\n\nОсвен това, Gemini 2.5 Flash може да бъде конфигуриран чрез параметъра \"максимален брой токени за разсъждение\", както е описано в документацията (https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning)."
  },
@@ -1506,7 +1434,7 @@
    "description": "GPT-4.1 mini предлага баланс между интелигентност, скорост и разходи, което го прави привлекателен модел за много случаи на употреба."
  },
  "gpt-4.5-preview": {
-    "description": "GPT-4.5-preview е най-новият универсален модел, който притежава задълбочени световни познания и по-добро разбиране на намеренията на потребителите, отличава се в творчески задачи и при планирането на агенти. Знанията на модела са актуални до октомври 2023 г."
+    "description": "Изследователската предварителна версия на GPT-4.5, която е нашият най-голям и мощен GPT модел до момента. Тя притежава обширни знания за света и може по-добре да разбира намеренията на потребителите, което я прави изключително ефективна в креативни задачи и автономно планиране. GPT-4.5 приема текстови и изображен вход и генерира текстови изход (включително структурирани изходи). Поддържа ключови функции за разработчици, като извикване на функции, пакетно API и потоков изход. В задачи, изискващи креативно, открито мислене и диалог (като писане, учене или изследване на нови идеи), GPT-4.5 показва особени способности. Крайната дата на знанията е октомври 2023."
  },
  "gpt-4o": {
    "description": "ChatGPT-4o е динамичен модел, който се актуализира в реално време, за да поддържа най-новата версия. Той комбинира мощно разбиране на езика и генериране на текст, подходящ за мащабни приложения, включително обслужване на клиенти, образование и техническа поддръжка."
@@ -1574,9 +1502,6 @@
  "gpt-oss": {
    "description": "GPT-OSS 20B е отворен голям езиков модел, публикуван от OpenAI, използващ технологията за квантуване MXFP4, подходящ за работа на висок клас потребителски GPU или Apple Silicon Mac. Този модел се отличава с отлични резултати в генерирането на диалози, писането на код и задачи за разсъждение, като поддържа извикване на функции и използване на инструменти."
  },
-  "gpt-oss-120b": {
-    "description": "GPT-OSS-120B MXFP4 квантизиран трансформър модел, който запазва силна производителност при ограничени ресурси."
-  },
  "gpt-oss:120b": {
    "description": "GPT-OSS 120B е голям отворен езиков модел, публикуван от OpenAI, използващ технологията за квантуване MXFP4, предназначен за флагмански клас модели. Изисква многократни GPU или високопроизводителна работна станция за работа, с изключителни възможности в сложни разсъждения, генериране на код и многоезична обработка, поддържайки усъвършенствано извикване на функции и интеграция на инструменти."
  },
@@ -1604,9 +1529,6 @@
  "grok-4": {
    "description": "Нашият най-нов и най-мощен флагмански модел, който се отличава с изключителни резултати в обработката на естествен език, математическите изчисления и разсъжденията — перфектен универсален играч."
  },
-  "grok-code-fast-1": {
-    "description": "С удоволствие представяме grok-code-fast-1, бърз и икономичен модел за извод, който се отличава с отлични резултати при кодиране на агенти."
-  },
  "gryphe/mythomax-l2-13b": {
    "description": "MythoMax l2 13B е езиков модел, който комбинира креативност и интелигентност, обединявайки множество водещи модели."
  },
@@ -1715,18 +1637,9 @@
  "image-01-live": {
    "description": "Модел за генериране на изображения с фини детайли, поддържащ генериране от текст и настройка на стил."
  },
-  "imagen-4.0-fast-generate-001": {
-    "description": "Imagen — серия модели за преобразуване от текст към изображение от 4-то поколение, бърза версия"
-  },
-  "imagen-4.0-generate-001": {
-    "description": "Imagen: серия от модели от 4-то поколение за генериране на изображения от текст"
-  },
  "imagen-4.0-generate-preview-06-06": {
    "description": "Imagen 4-то поколение текст-към-изображение модел серия"
  },
-  "imagen-4.0-ultra-generate-001": {
-    "description": "Imagen, 4-то поколение модел за преобразуване на текст в изображение, серия Ultra"
-  },
  "imagen-4.0-ultra-generate-preview-06-06": {
    "description": "Imagen 4-то поколение текст-към-изображение модел серия Ултра версия"
  },
@@ -1766,9 +1679,6 @@
  "kimi-k2-0711-preview": {
    "description": "kimi-k2 е базов модел с MoE архитектура с изключителни способности за кодиране и агентски функции, с общо 1 трилион параметри и 32 милиарда активни параметри. В тестове за общо знание, програмиране, математика и агентски задачи, моделът K2 превъзхожда други водещи отворени модели."
  },
-  "kimi-k2-turbo-preview": {
-    "description": "Kimi-k2 е базов модел с MoE архитектура, който притежава изключителни възможности за работа с код и агентни функции. Общият брой параметри е 1T, а активните параметри са 32B. В бенчмарковете за основни категории като общо знание и разсъждение, програмиране, математика и агентни задачи, моделът K2 превъзхожда другите водещи отворени модели."
-  },
  "kimi-latest": {
    "description": "Kimi интелигентен асистент използва най-новия Kimi голям модел, който може да съдържа нестабилни функции. Поддържа разбиране на изображения и автоматично избира 8k/32k/128k модел за таксуване в зависимост от дължината на контекста на заявката."
  },
@@ -1853,9 +1763,6 @@
  "llava:34b": {
    "description": "LLaVA е многомодален модел, комбиниращ визуален кодер и Vicuna, предназначен за мощно визуално и езиково разбиране."
  },
-  "magistral-medium-latest": {
-    "description": "Magistral Medium 1.1 е водещ модел за инференция, публикуван от Mistral AI през юли 2025 г."
-  },
  "mathstral": {
    "description": "MathΣtral е проектиран за научни изследвания и математически разсъждения, предоставяйки ефективни изчислителни способности и интерпретация на резултати."
  },
@@ -2187,7 +2094,7 @@
    "description": "o1-mini е бърз и икономичен модел за изводи, проектиран за приложения в програмирането, математиката и науката. Моделът разполага с контекст от 128K и дата на знание до октомври 2023."
  },
  "o1-preview": {
-    "description": "Фокусиран върху усъвършенствано разсъждение и решаване на сложни проблеми, включително математически и научни задачи. Отлично подходящ за приложения, които изискват дълбоко разбиране на контекста и автономни работни процеси."
+    "description": "o1 е новият модел за изводи на OpenAI, подходящ за сложни задачи, изискващи обширни общи знания. Моделът разполага с контекст от 128K и дата на знание до октомври 2023."
  },
  "o1-pro": {
    "description": "Моделите от серията o1 са обучени чрез подсилващо обучение, което им позволява да мислят преди да отговорят и да изпълняват сложни задачи за разсъждение. Моделът o1-pro използва повече изчислителни ресурси за по-задълбочено мислене, осигурявайки постоянно по-високо качество на отговорите."
@@ -2306,14 +2213,8 @@
  "qwen-coder-turbo-latest": {
    "description": "Моделът на кода Qwen."
  },
-  "qwen-flash": {
-    "description": "Серията \"Tongyi Qianwen\" включва най-бързите и с изключително ниски разходи модели, подходящи за прости задачи."
-  },
  "qwen-image": {
-    "description": "Qwen-Image е универсален модел за генериране на изображения, който поддържа множество художествени стилове и е особено добър в рендериране на сложни текстове, включително на китайски и английски. Моделът поддържа многоредови оформления, генериране на текст на ниво абзац и изобразяване на детайли с висока прецизност, позволявайки създаване на сложни комбинирани оформления от изображение и текст."
-  },
-  "qwen-image-edit": {
-    "description": "Професионален модел за редактиране на изображения, публикуван от екипа на Qwen, който поддържа семантично редактиране и редактиране на външния вид и може прецизно да обработва текст на китайски и английски, извършвайки висококачествени редакции на изображения като трансформация на стил и въртене на обекти."
+    "description": "Мощен модел за генериране на изображения от екипа на Qwen, с впечатляващи възможности за генериране на китайски текст и разнообразни визуални стилове на изображения."
  },
  "qwen-long": {
    "description": "Qwen е мащабен езиков модел, който поддържа дълги текстови контексти и диалогови функции, базирани на дълги документи и множество документи."
@@ -2340,7 +2241,7 @@
    "description": "通义千问（Qwen） е подобрена версия на мащабен езиков модел, който поддържа вход на различни езици, включително китайски и английски."
  },
  "qwen-turbo": {
-    "description": "Версията „Tongyi Qianwen Turbo“ няма да получава повече актуализации; препоръчваме да я замените с „Tongyi Qianwen Flash“. Tongyi Qianwen е много голям езиков модел, който поддържа въвеждане на китайски, английски и други езици."
+    "description": "通义千问（Qwen） е мащабен езиков модел, който поддържа вход на различни езици, включително китайски и английски."
  },
  "qwen-vl-chat-v1": {
    "description": "Qwen VL поддържа гъвкави интерактивни методи, включително множество изображения, многократни въпроси и отговори, творчество и др."
@@ -2657,15 +2558,9 @@
  "step-2x-large": {
    "description": "Новото поколение модел за генериране на изображения Step Star, специализиран в генериране на висококачествени изображения според текстови описания от потребителя. Новият модел създава по-реалистични текстури и има по-силни способности за генериране на китайски и английски текст."
  },
-  "step-3": {
-    "description": "Този модел притежава мощни способности за визуално възприятие и сложни разсъждения. Той може точно да извършва междудисциплинарно разбиране на сложни знания, съвместен анализ на математическа и визуална информация, както и да решава различни визуални аналитични задачи от ежедневието."
-  },
  "step-r1-v-mini": {
    "description": "Този модел е мощен модел за разсъждение с отлични способности за разбиране на изображения, способен да обработва информация от изображения и текст, и след дълбочинно разсъждение да генерира текстово съдържание. Моделът показва изключителни резултати в областта на визуалните разсъждения, като същевременно притежава първокласни способности в математиката, кода и текстовите разсъждения. Дължината на контекста е 100k."
  },
-  "stepfun-ai/step3": {
-    "description": "Step3 е авангарден мултимодален модел за разсъждение, публикуван от StepFun (阶跃星辰). Той е изграден върху архитектура на смес от експерти (MoE) с общо 321 милиарда параметъра и 38 милиарда активни параметъра. Моделът е с енд-ту-енд дизайн, целящ минимизиране на разходите за декодиране, като същевременно предоставя водещи резултати във визуално-лингвистичното разсъждение. Чрез кооперативния дизайн на многоматрично факторизирано внимание (MFA) и декуплиране на внимание и FFN (AFD), Step3 поддържа отлична ефективност както на флагмански, така и на по-бюджетни ускорители. По време на предварителното обучение Step3 е обработил над 20 трилиона текстови токена и 4 трилиона смесени текстово-изображенчески токена, обхващайки повече от десет езика. Моделът постига водещи резултати сред отворените модели в множество бенчмаркове, включително математика, код и мултимодални задачи."
-  },
  "taichu_llm": {
    "description": "Моделът на езика TaiChu е с изключителни способности за разбиране на езика, текстово генериране, отговори на знания, програмиране, математически изчисления, логическо разсъждение, анализ на емоции, резюмиране на текст и др. Иновативно комбинира предварително обучение с големи данни и разнообразни източници на знания, чрез непрекъснато усъвършенстване на алгоритмичните технологии и усвояване на нови знания от масивни текстови данни, за да осигури на потребителите по-удобна информация и услуги, както и по-интелигентно изживяване."
  },
@@ -2693,9 +2588,18 @@
  "thudm/glm-4-9b-chat": {
    "description": "GLM-4 е последната версия на предварително обучен модел от серията, публикувана от Zhizhu AI."
  },
+  "thudm/glm-4-9b:free": {
+    "description": "GLM-4-9B-0414 е езиков модел с 9 милиарда параметри от серията GLM-4, разработен от THUDM. GLM-4-9B-0414 използва същите стратегии за усилено обучение и подравняване, които се прилагат за по-голямата му 32B версия, за да постигне висока производителност в съотношение с размера си, което го прави подходящ за внедряване с ограничени ресурси, което все пак изисква силни способности за разбиране и генериране на език."
+  },
  "thudm/glm-z1-32b": {
    "description": "GLM-Z1-32B-0414 е подобрена версия на GLM-4-32B, проектирана за дълбока математика, логика и решаване на проблеми, свързани с код. Той прилага разширено обучение с подсилване (за специфични задачи и на базата на общи предпочитания) за подобряване на производителността при сложни многостепенни задачи. В сравнение с основния модел GLM-4-32B, Z1 значително подобрява способностите в структурираното разсъждение и формалните области.\n\nМоделът поддържа прилагане на стъпки за \"мислене\" чрез инженеринг на подсказки и предлага подобрена последователност за дълги формати на изхода. Той е оптимизиран за работни потоци на агенти и поддържа дълъг контекст (чрез YaRN), извиквания на JSON инструменти и конфигурации за фино проби за стабилно разсъждение. Идеален е за случаи, изискващи дълбочинно разсъждение, многостепенни разсъждения или формализирани изводи."
  },
+  "thudm/glm-z1-32b:free": {
+    "description": "GLM-Z1-32B-0414 е подобрена версия на GLM-4-32B, проектирана за дълбока математика, логика и решаване на проблеми, свързани с код. Той прилага разширено обучение с подсилване (за специфични задачи и на базата на общи предпочитания) за подобряване на производителността при сложни многостепенни задачи. В сравнение с основния модел GLM-4-32B, Z1 значително подобрява способностите в структурираното разсъждение и формалните области.\n\nМоделът поддържа прилагане на стъпки за \"мислене\" чрез инженеринг на подсказки и предлага подобрена последователност за дълги формати на изхода. Той е оптимизиран за работни потоци на агенти и поддържа дълъг контекст (чрез YaRN), извиквания на JSON инструменти и конфигурации за фино проби за стабилно разсъждение. Идеален е за случаи, изискващи дълбочинно разсъждение, многостепенни разсъждения или формализирани изводи."
+  },
+  "thudm/glm-z1-9b:free": {
+    "description": "GLM-Z1-9B-0414 е езиков модел с 9B параметри от серията GLM-4, разработен от THUDM. Той прилага технологии, първоначално използвани в по-големия GLM-Z1 модел, включително разширено усилено обучение, подравняване на двойки и обучение за интензивни разсъждения в области като математика, кодиране и логика. Въпреки по-малкия си размер, той показва силна производителност в общите задачи за разсъждение и надминава много от отворените модели на нивото на теглата."
+  },
  "thudm/glm-z1-rumination-32b": {
    "description": "THUDM: GLM Z1 Rumination 32B е дълбок разсъдъчен модел с 32B параметри от серията GLM-4-Z1, оптимизиран за сложни, отворени задачи, изискващи дълго разсъждение. Той е построен на основата на glm-4-32b-0414, с добавени допълнителни етапи на усилено обучение и многостепенни стратегии за подравняване, въвеждайки \"разсъждателни\" способности, предназначени да симулират разширена когнитивна обработка. Това включва итеративно разсъждение, многократен анализ и работни потоци, подобрени с инструменти, като търсене, извличане и синтез с осведоменост за цитати.\n\nМоделът показва отлични резултати в изследователското писане, сравнителния анализ и сложните въпроси и отговори. Той поддържа извиквания на функции за търсене и навигация (\"search\", \"click\", \"open\", \"finish\"), което позволява използването му в агенти. Разсъждателното поведение се контролира от многократни цикли с базирани на правила награди и механизми за забавено вземане на решения, с референтни рамки за дълбоки изследвания, като вътрешния стек за подравняване на OpenAI. Този вариант е подходящ за сценарии, изискващи дълбочина, а не скорост."
  },
@@ -2803,8 +2707,5 @@
  },
  "zai-org/GLM-4.5-Air": {
    "description": "GLM-4.5-Air е базов модел, специално създаден за интелигентни агенти, използващ архитектура с микс от експерти (Mixture-of-Experts). Той е дълбоко оптимизиран за използване на инструменти, уеб браузване, софтуерно инженерство и фронтенд програмиране, и поддържа безпроблемна интеграция с кодови агенти като Claude Code и Roo Code. GLM-4.5 използва смесен режим на разсъждение, подходящ за сложни и ежедневни приложения."
-  },
-  "zai-org/GLM-4.5V": {
-    "description": "GLM-4.5V е най-новото поколение визуално-езиков модел (VLM), публикуван от Zhipu AI (智谱 AI). Моделът е изграден върху водещия текстов модел GLM-4.5-Air, който разполага с общо 106 милиарда параметри и 12 милиарда активационни параметри, и използва архитектура с разбъркани експерти (Mixture of Experts, MoE), целяща постигане на висока производителност при по-ниски разходи за инференция. Технически GLM-4.5V продължава линията на GLM-4.1V-Thinking и въвежда иновации като триизмерно ротационно позиционно кодиране (3D-RoPE), което значително засилва възприемането и разсъжденията относно триизмерните пространствени взаимовръзки. Чрез оптимизации в етапите на предварително обучение, супервизирано фино настройване и подсилено обучение, моделът може да обработва различни визуални формати — изображения, видео и дълги документи — и в 41 публични мултимодални бенчмарка достига водещи резултати сред отворените модели от същия клас. Освен това моделът добавя превключвател за 'режим на мислене', който позволява на потребителите гъвкаво да избират между бърз отговор и дълбоко разсъждение, за да балансират ефективността и качеството."
  }
 }
@@ -11,9 +11,6 @@
  "aihubmix": {
    "description": "AiHubMix предоставя достъп до множество AI модели чрез единен API интерфейс."
  },
-  "akashchat": {
-    "description": "Akash е пазар за облачни ресурси без нужда от разрешение, който предлага конкурентни цени в сравнение с традиционните облачни доставчици."
-  },
  "anthropic": {
    "description": "Anthropic е компания, специализирана в изследвания и разработка на изкуствен интелект, предлагаща набор от напреднали езикови модели, като Claude 3.5 Sonnet, Claude 3 Sonnet, Claude 3 Opus и Claude 3 Haiku. Тези модели постигат идеален баланс между интелигентност, скорост и разходи, подходящи за различни приложения, от корпоративни натоварвания до бързи отговори. Claude 3.5 Sonnet, като най-новия им модел, показва отлични резултати в множество оценки, като същевременно поддържа висока цена-качество."
  },
@@ -29,9 +26,6 @@
  "bedrock": {
    "description": "Bedrock е услуга, предоставяна от Amazon AWS, фокусирана върху предоставянето на напреднали AI езикови и визуални модели за предприятия. Семейството на моделите включва серията Claude на Anthropic, серията Llama 3.1 на Meta и други, обхващащи разнообразие от опции от леки до високо производителни, поддържащи текстово генериране, диалог, обработка на изображения и много други задачи, подходящи за различни мащаби и нужди на бизнес приложения."
  },
-  "bfl": {
-    "description": "Водеща изследователска лаборатория за авангарден изкуствен интелект, която изгражда визуалната инфраструктура на утрешния ден."
-  },
  "cloudflare": {
    "description": "Работа с модели на машинно обучение, задвижвани от безсървърни GPU, в глобалната мрежа на Cloudflare."
  },
@@ -92,12 +86,6 @@
  "moonshot": {
    "description": "Moonshot е отворена платформа, представена от Beijing Dark Side Technology Co., Ltd., предлагаща множество модели за обработка на естествен език, с широко приложение, включително, но не само, създаване на съдържание, академични изследвания, интелигентни препоръки, медицинска диагностика и др., поддържаща обработка на дълги текстове и сложни генериращи задачи."
  },
-  "nebius": {
-    "description": "Nebius предоставя високопроизводителна инфраструктура за глобалните иноватори в областта на изкуствения интелект чрез изграждане на мащабни GPU клъстери и вертикално интегрирана облачна платформа."
-  },
-  "newapi": {
-    "description": "Отворена платформа за обединено препращане на множество AI услуги"
-  },
  "novita": {
    "description": "Novita AI е платформа, предлагаща API услуги за множество големи езикови модели и генериране на AI изображения, гъвкава, надеждна и икономически ефективна. Поддържа най-новите отворени модели, като Llama3 и Mistral, и предлага цялостни, потребителски приятелски и автоматично разширяеми API решения за разработка на генеративни AI приложения, подходящи за бързото развитие на AI стартъпи."
  },
@@ -237,10 +237,6 @@
      "title": "Ограничаване на броя на съобщенията в историята",
      "unlimited": "Неограничен брой съобщения в историята"
    },
-    "enableStreaming": {
-      "desc": "Активирайте поточно предаване, за да показвате отговорите в реално време. Ако е деактивирано, ще се показва само пълният отговор.",
-      "title": "Активиране на поточно предаване"
-    },
    "historyCount": {
      "desc": "Брой исторически съобщения, носени с всяка заявка",
      "title": "Брой прикачени съобщения в историята"
@@ -52,11 +52,7 @@
    "thinking": {
      "title": "Tiefdenk-Schalter"
    },
-    "title": "Modell Erweiterungsfunktionen",
-    "urlContext": {
-      "desc": "Wenn aktiviert, werden Webseiten-Links automatisch analysiert, um den tatsächlichen Webseiteninhalt zu erfassen",
-      "title": "Webseiten-Link-Inhalt extrahieren"
-    }
+    "title": "Modell Erweiterungsfunktionen"
  },
  "history": {
    "title": "Der Assistent wird nur die letzten {{count}} Nachrichten speichern"
@@ -129,7 +125,6 @@
      "inputWriteCached": "Eingabe Cache schreiben",
      "output": "Ausgabe",
      "outputAudio": "Audioausgabe",
-      "outputImage": "Bildausgabe",
      "outputText": "Text-Ausgabe",
      "outputTitle": "Ausgabedetails",
      "reasoning": "Tiefes Denken",
@@ -273,8 +268,7 @@
    "clientMode": {
      "actionFiletip": "Datei hochladen",
      "actionTooltip": "Hochladen",
-      "disabled": "Das aktuelle Modell unterstützt keine visuelle Erkennung und Dateianalyse. Bitte wechseln Sie das Modell, um diese Funktionen zu nutzen.",
-      "visionNotSupported": "Das aktuelle Modell unterstützt keine visuelle Erkennung. Bitte wechseln Sie das Modell, um diese Funktion zu nutzen."
+      "disabled": "Das aktuelle Modell unterstützt keine visuelle Erkennung und Dateianalyse. Bitte wechseln Sie das Modell, um diese Funktionen zu nutzen."
    },
    "preview": {
      "prepareTasks": "Vorbereitung der Teile...",
@@ -32,7 +32,6 @@
  "blog": "Produkt-Blog",
  "branching": "Unterthema erstellen",
  "branchingDisable": "Die Funktion „Unterthema“ ist nur in der Serverversion verfügbar. Wenn Sie diese Funktion benötigen, wechseln Sie bitte in den Serverbereitstellungsmodus oder verwenden Sie LobeChat Cloud.",
-  "branchingRequiresSavedTopic": "Das aktuelle Thema wurde nicht gespeichert. Speichern Sie es, um die Unterthemenfunktion nutzen zu können.",
  "cancel": "Abbrechen",
  "changelog": "Änderungsprotokoll",
  "clientDB": {
@@ -183,13 +182,6 @@
    "title": "Mögen Sie unser Produkt?"
  },
  "fullscreen": "Vollbildmodus",
-  "geminiImageChineseWarning": {
-    "content": "Nano Banana kann bei der Verwendung von Chinesisch möglicherweise keine Bilder generieren. Es wird empfohlen, Englisch zu verwenden, um bessere Ergebnisse zu erzielen.",
-    "continueGenerate": "Weiter generieren",
-    "continueSend": "Weiter senden",
-    "doNotShowAgain": "Nicht mehr anzeigen",
-    "title": "Hinweis zur chinesischen Eingabe"
-  },
  "historyRange": "Verlaufsbereich",
  "import": "Importieren",
  "importData": "Daten importieren",
@@ -1,9 +1,4 @@
 {
-  "ArgsInput": {
-    "addArgument": "Parameter hinzufügen",
-    "argumentPlaceholder": "Parameter {{index}}",
-    "enterFirstArgument": "Geben Sie den ersten Parameter ein..."
-  },
  "DragUpload": {
    "dragDesc": "Ziehen Sie Dateien hierher, um mehrere Bilder hochzuladen.",
    "dragFileDesc": "Ziehen Sie Bilder und Dateien hierher, um mehrere Bilder und Dateien hochzuladen.",
@@ -73,18 +68,6 @@
  "GoBack": {
    "back": "Zurück"
  },
-  "HtmlPreview": {
-    "actions": {
-      "download": "Herunterladen",
-      "preview": "Vorschau"
-    },
-    "iframeTitle": "HTML-Vorschau",
-    "mode": {
-      "code": "Code",
-      "preview": "Vorschau"
-    },
-    "title": "HTML-Vorschau"
-  },
  "ImageUpload": {
    "actions": {
      "changeImage": "Klicken, um das Bild zu ändern",
@@ -142,12 +125,6 @@
    },
    "progress": {
      "uploadingWithCount": "{{completed}}/{{total}} hochgeladen"
-    },
-    "validation": {
-      "fileSizeExceeded": "Maximale Dateigröße überschritten",
-      "fileSizeExceededDetail": "{{fileName}} ({{actualSize}}) überschreitet die maximal zulässige Größe von {{maxSize}}",
-      "fileSizeExceededMultiple": "{{count}} Dateien überschreiten die maximal zulässige Größe von {{maxSize}}: {{fileList}}",
-      "imageCountExceeded": "Maximale Anzahl an Bildern überschritten"
    }
  },
  "OllamaSetupGuide": {
@@ -85,17 +85,6 @@
    "CreateMessageError": "Es tut uns leid, die Nachricht konnte nicht erfolgreich gesendet werden. Bitte kopieren Sie den Inhalt und senden Sie ihn erneut. Nach dem Aktualisieren der Seite wird diese Nachricht nicht gespeichert.",
    "ExceededContextWindow": "Der aktuelle Anfrageinhalt überschreitet die von dem Modell verarbeitbare Länge. Bitte reduzieren Sie die Menge des Inhalts und versuchen Sie es erneut.",
    "FreePlanLimit": "Sie sind derzeit ein kostenloser Benutzer und können diese Funktion nicht nutzen. Bitte aktualisieren Sie auf ein kostenpflichtiges Abonnement, um fortzufahren.",
-    "GoogleAIBlockReason": {
-      "BLOCKLIST": "Ihr Inhalt enthält verbotene Wörter. Bitte prüfen und ändern Sie Ihre Eingabe und versuchen Sie es erneut.",
-      "IMAGE_SAFETY": "Die Bildgenerierung wurde aus Sicherheitsgründen blockiert. Bitte passen Sie Ihre Anfrage zur Bildgenerierung an und versuchen Sie es erneut.",
-      "LANGUAGE": "Die von Ihnen verwendete Sprache wird derzeit nicht unterstützt. Bitte versuchen Sie es erneut auf Englisch oder in einer anderen unterstützten Sprache.",
-      "OTHER": "Der Inhalt wurde aus unbekannten Gründen blockiert. Bitte formulieren Sie Ihre Anfrage neu.",
-      "PROHIBITED_CONTENT": "Ihre Anfrage könnte verbotene Inhalte enthalten. Bitte passen Sie Ihre Anfrage an und stellen Sie sicher, dass sie den Nutzungsrichtlinien entspricht.",
-      "RECITATION": "Ihr Inhalt wurde wegen möglicher Urheberrechtsverletzungen blockiert. Bitte verwenden Sie Originalinhalte oder formulieren Sie Ihre Anfrage um.",
-      "SAFETY": "Ihr Inhalt wurde aufgrund von Sicherheitsrichtlinien blockiert. Bitte passen Sie Ihre Anfrage an und vermeiden Sie potenziell schädliche oder unangemessene Inhalte.",
-      "SPII": "Ihr Inhalt könnte sensible personenbezogene Daten enthalten. Zum Schutz der Privatsphäre entfernen Sie bitte diese Informationen und versuchen Sie es erneut.",
-      "default": "Inhalt blockiert: {{blockReason}}. Bitte passen Sie Ihre Anfrage an und versuchen Sie es erneut."
-    },
    "InsufficientQuota": "Es tut uns leid, das Kontingent (Quota) für diesen Schlüssel ist erreicht. Bitte überprüfen Sie Ihr Kontoguthaben oder erhöhen Sie das Kontingent des Schlüssels und versuchen Sie es erneut.",
    "InvalidAccessCode": "Das Passwort ist ungültig oder leer. Bitte geben Sie das richtige Zugangspasswort ein oder fügen Sie einen benutzerdefinierten API-Schlüssel hinzu.",
    "InvalidBedrockCredentials": "Die Bedrock-Authentifizierung ist fehlgeschlagen. Bitte überprüfen Sie AccessKeyId/SecretAccessKey und versuchen Sie es erneut.",
@@ -124,6 +113,18 @@
    "PluginServerError": "Fehler bei der Serveranfrage des Plugins. Bitte überprüfen Sie die Fehlerinformationen unten in Ihrer Plugin-Beschreibungsdatei, Plugin-Konfiguration oder Serverimplementierung",
    "PluginSettingsInvalid": "Das Plugin muss korrekt konfiguriert werden, um verwendet werden zu können. Bitte überprüfen Sie Ihre Konfiguration auf Richtigkeit",
    "ProviderBizError": "Fehler bei der Anforderung des {{provider}}-Dienstes. Bitte überprüfen Sie die folgenden Informationen oder versuchen Sie es erneut.",
+
+    "GoogleAIBlockReason": {
+      "BLOCKLIST": "Ihr Inhalt enthält verbotene Begriffe. Bitte überprüfen und ändern Sie Ihre Eingabe, bevor Sie es erneut versuchen.",
+      "IMAGE_SAFETY": "Der generierte Bildinhalt wurde aus Sicherheitsgründen blockiert. Bitte versuchen Sie, Ihre Bildgenerierungsanfrage zu ändern.",
+      "LANGUAGE": "Die von Ihnen verwendete Sprache wird nicht unterstützt. Bitte versuchen Sie es mit Englisch oder anderen unterstützten Sprachen.",
+      "OTHER": "Inhalt wurde aus unbekannten Gründen blockiert. Bitte versuchen Sie, Ihre Anfrage umzuformulieren oder wenden Sie sich an den technischen Support.",
+      "PROHIBITED_CONTENT": "Ihr Inhalt könnte verbotene Inhaltstypen enthalten. Bitte passen Sie Ihre Anfrage an, um sicherzustellen, dass sie den Nutzungsrichtlinien entspricht.",
+      "RECITATION": "Ihr Inhalt wurde aufgrund möglicher Urheberrechtsprobleme blockiert. Bitte versuchen Sie, originalen Inhalt zu verwenden oder Ihre Anfrage umzuformulieren.",
+      "SAFETY": "Ihr Inhalt wurde aufgrund von Sicherheitsrichtlinien blockiert. Bitte versuchen Sie, Ihre Anfrage anzupassen, um potenziell schädliche oder unangemessene Inhalte zu vermeiden.",
+      "SPII": "Ihr Inhalt könnte sensible persönlich identifizierbare Informationen enthalten. Zum Schutz der Privatsphäre entfernen Sie bitte relevante sensible Informationen, bevor Sie es erneut versuchen.",
+      "default": "Inhalt wurde blockiert: {{blockReason}}. Bitte passen Sie Ihren Anfrageinhalt an und versuchen Sie es erneut."
+    },
    "QuotaLimitReached": "Es tut uns leid, die aktuelle Token-Nutzung oder die Anzahl der Anfragen hat das Kontingent (Quota) für diesen Schlüssel erreicht. Bitte erhöhen Sie das Kontingent für diesen Schlüssel oder versuchen Sie es später erneut.",
    "StreamChunkError": "Fehler beim Parsen des Nachrichtenchunks der Streaming-Anfrage. Bitte überprüfen Sie, ob die aktuelle API-Schnittstelle den Standards entspricht, oder wenden Sie sich an Ihren API-Anbieter.",
    "SubscriptionKeyMismatch": "Es tut uns leid, aufgrund eines vorübergehenden Systemfehlers ist das aktuelle Abonnement vorübergehend ungültig. Bitte klicken Sie auf die Schaltfläche unten, um das Abonnement wiederherzustellen, oder kontaktieren Sie uns per E-Mail für Unterstützung.",
@@ -153,28 +153,6 @@
    "searchProviders": "Anbieter suchen...",
    "sort": "Benutzerdefinierte Sortierung"
  },
-  "newapi": {
-    "apiKey": {
-      "desc": "API-Schlüssel, der von der New API-Plattform bereitgestellt wird",
-      "placeholder": "New API API-Schlüssel",
-      "required": "API-Schlüssel ist erforderlich",
-      "title": "API-Schlüssel"
-    },
-    "apiUrl": {
-      "desc": "API-Adresse des New API-Dienstes, meistens mit /v1 am Ende",
-      "title": "API-Adresse"
-    },
-    "enabled": {
-      "title": "New API aktivieren"
-    },
-    "models": {
-      "batchSelect": "Modelle in Stapeln auswählen ({{count}} Stück)",
-      "fetch": "Modellliste abrufen",
-      "selected": "Ausgewählte Modelle",
-      "title": "Verfügbare Modelle"
-    },
-    "title": "New API"
-  },
  "ollama": {
    "checker": {
      "desc": "Testen Sie, ob die Proxy-Adresse korrekt eingetragen wurde",
@@ -207,10 +185,6 @@
    }
  },
  "providerModels": {
-    "batchSelect": {
-      "selected": "{{count}} Modelle ausgewählt",
-      "title": "Stapel-Auswahl"
-    },
    "config": {
      "aesGcm": "Ihr Schlüssel und die Proxy-Adresse werden mit dem <1>AES-GCM</1>-Verschlüsselungsalgorithmus verschlüsselt",
      "apiKey": {
@@ -74,15 +74,9 @@
  "DeepSeek-V3": {
    "description": "DeepSeek-V3 ist ein von der DeepSeek Company entwickeltes MoE-Modell. Die Ergebnisse von DeepSeek-V3 übertreffen die anderer Open-Source-Modelle wie Qwen2.5-72B und Llama-3.1-405B und stehen in der Leistung auf Augenhöhe mit den weltweit führenden Closed-Source-Modellen GPT-4o und Claude-3.5-Sonnet."
  },
-  "DeepSeek-V3-1": {
-    "description": "DeepSeek V3.1: Das nächste Generation Inferenzmodell, das komplexe Schlussfolgerungen und vernetztes Denken verbessert und sich für Aufgaben eignet, die eine tiefgehende Analyse erfordern."
-  },
  "DeepSeek-V3-Fast": {
    "description": "Modellanbieter: sophnet-Plattform. DeepSeek V3 Fast ist die Hochgeschwindigkeitsversion mit hohem TPS des DeepSeek V3 0324 Modells, voll funktionsfähig ohne Quantisierung, mit stärkerer Code- und mathematischer Leistungsfähigkeit und schnellerer Reaktionszeit!"
  },
-  "DeepSeek-V3.1": {
-    "description": "DeepSeek-V3.1 ist ein neu eingeführtes hybrides Inferenzmodell von DeepSeek, das zwei Inferenzmodi unterstützt: Denkmodus und Nicht-Denkmodus. Es ist effizienter im Denkprozess als DeepSeek-R1-0528. Durch Post-Training-Optimierung wurden die Nutzung von Agenten-Tools und die Leistung bei Agentenaufgaben erheblich verbessert."
-  },
  "Doubao-lite-128k": {
    "description": "Doubao-lite bietet extrem schnelle Reaktionszeiten und ein hervorragendes Preis-Leistungs-Verhältnis, um Kunden in verschiedenen Szenarien flexiblere Optionen zu bieten. Unterstützt Inferenz und Feintuning mit einem Kontextfenster von 128k."
  },
@@ -137,15 +131,9 @@
  "ERNIE-Speed-Pro-128K": {
    "description": "Das neueste von Baidu im Jahr 2024 veröffentlichte hochleistungsfähige Sprachmodell, das überragende allgemeine Fähigkeiten bietet und bessere Ergebnisse als ERNIE Speed erzielt. Es eignet sich als Basis-Modell für Feinabstimmungen, um spezifische Szenarien besser zu bearbeiten, und bietet gleichzeitig hervorragende Inferenzleistung."
  },
-  "FLUX-1.1-pro": {
-    "description": "FLUX.1.1 Pro"
-  },
  "FLUX.1-Kontext-dev": {
    "description": "FLUX.1-Kontext-dev ist ein von Black Forest Labs entwickeltes multimodales Bildgenerierungs- und Bearbeitungsmodell auf Basis der Rectified Flow Transformer-Architektur mit 12 Milliarden Parametern. Es konzentriert sich auf die Generierung, Rekonstruktion, Verbesserung oder Bearbeitung von Bildern unter gegebenen Kontextbedingungen. Das Modell kombiniert die kontrollierbare Generierung von Diffusionsmodellen mit der Kontextmodellierung von Transformern, unterstützt hochwertige Bildausgaben und ist vielseitig einsetzbar für Bildrestaurierung, Bildvervollständigung und visuelle Szenenrekonstruktion."
  },
-  "FLUX.1-Kontext-pro": {
-    "description": "FLUX.1 Kontext [pro]"
-  },
  "FLUX.1-dev": {
    "description": "FLUX.1-dev ist ein von Black Forest Labs entwickeltes Open-Source-multimodales Sprachmodell (Multimodal Language Model, MLLM), das für Bild-Text-Aufgaben optimiert ist und Verständnis sowie Generierung von Bildern und Texten vereint. Es basiert auf fortschrittlichen großen Sprachmodellen wie Mistral-7B und erreicht durch sorgfältig gestaltete visuelle Encoder und mehrstufige Instruktions-Feinabstimmung eine kooperative Verarbeitung von Bild und Text sowie komplexe Aufgabenlogik."
  },
@@ -182,9 +170,6 @@
  "Llama-3.2-90B-Vision-Instruct\t": {
    "description": "Fortgeschrittene Bildschlussfolgerungsfähigkeiten für Anwendungen im Bereich der visuellen Verständigung."
  },
-  "Meta-Llama-3-3-70B-Instruct": {
-    "description": "Llama 3.3 70B: Ein vielseitiges Transformer-Modell, geeignet für Dialog- und Generierungsaufgaben."
-  },
  "Meta-Llama-3.1-405B-Instruct": {
    "description": "Das auf Anweisungen optimierte Textmodell Llama 3.1 wurde für mehrsprachige Dialoganwendungen optimiert und zeigt in vielen verfügbaren Open-Source- und geschlossenen Chat-Modellen in gängigen Branchenbenchmarks hervorragende Leistungen."
  },
@@ -203,9 +188,6 @@
  "Meta-Llama-3.3-70B-Instruct": {
    "description": "Llama 3.3 ist das fortschrittlichste mehrsprachige Open-Source-Sprachmodell der Llama-Serie, das eine Leistung bietet, die mit einem 405B-Modell vergleichbar ist, und das zu extrem niedrigen Kosten. Es basiert auf der Transformer-Architektur und wurde durch überwachte Feinabstimmung (SFT) und verstärkendes Lernen mit menschlichem Feedback (RLHF) in Bezug auf Nützlichkeit und Sicherheit verbessert. Die auf Anweisungen optimierte Version ist speziell für mehrsprachige Dialoge optimiert und übertrifft in mehreren Branchenbenchmarks viele verfügbare Open-Source- und geschlossene Chat-Modelle. Das Wissensdatum endet im Dezember 2023."
  },
-  "Meta-Llama-4-Maverick-17B-128E-Instruct-FP8": {
-    "description": "Llama 4 Maverick: Ein groß angelegtes Modell basierend auf Mixture-of-Experts, das eine effiziente Expertenaktivierungsstrategie bietet, um bei der Inferenz herausragende Leistungen zu erzielen."
-  },
  "MiniMax-M1": {
    "description": "Ein völlig neu entwickeltes Inferenzmodell. Weltweit führend: 80K Denkketten x 1M Eingaben, Leistung auf Augenhöhe mit den besten Modellen im Ausland."
  },
@@ -275,9 +257,6 @@
  "Pro/deepseek-ai/DeepSeek-V3": {
    "description": "DeepSeek-V3 ist ein hybrides Experten (MoE) Sprachmodell mit 6710 Milliarden Parametern, das eine Multi-Head-Latente-Attention (MLA) und DeepSeekMoE-Architektur verwendet, kombiniert mit einer Lastenausgleichsstrategie ohne Hilfskosten, um die Inferenz- und Trainingseffizienz zu optimieren. Durch das Pre-Training auf 14,8 Billionen hochwertigen Tokens und anschließende überwachte Feinabstimmung und verstärktes Lernen übertrifft DeepSeek-V3 in der Leistung andere Open-Source-Modelle und nähert sich führenden geschlossenen Modellen."
  },
-  "Pro/deepseek-ai/DeepSeek-V3.1": {
-    "description": "DeepSeek-V3.1 ist ein hybrides großes Sprachmodell, das von DeepSeek AI veröffentlicht wurde und auf dem Vorgängermodell in vielerlei Hinsicht bedeutende Verbesserungen aufweist. Eine wesentliche Innovation dieses Modells ist die Integration des „Denkmodus“ und des „Nicht-Denkmodus“ in einem System, wobei Nutzer durch Anpassung der Chat-Vorlagen flexibel zwischen den Modi wechseln können, um unterschiedlichen Aufgabenanforderungen gerecht zu werden. Durch spezielles Post-Training wurde die Leistung von V3.1 bei Tool-Aufrufen und Agentenaufgaben deutlich gesteigert, was eine bessere Unterstützung externer Suchwerkzeuge und die Ausführung komplexer mehrstufiger Aufgaben ermöglicht. Das Modell basiert auf DeepSeek-V3.1-Base und wurde durch eine zweistufige Langtext-Erweiterungsmethode nachtrainiert, wodurch das Trainingsdatenvolumen erheblich erhöht wurde und es sich besonders bei der Verarbeitung langer Dokumente und umfangreicher Codes bewährt. Als Open-Source-Modell zeigt DeepSeek-V3.1 in Benchmarks zu Codierung, Mathematik und logischem Denken Fähigkeiten, die mit führenden Closed-Source-Modellen vergleichbar sind. Gleichzeitig senkt seine hybride Expertenarchitektur (MoE) die Inferenzkosten bei gleichzeitiger Beibehaltung einer enormen Modellkapazität."
-  },
  "Pro/moonshotai/Kimi-K2-Instruct": {
    "description": "Kimi K2 ist ein MoE-Architektur-Basis-Modell mit herausragenden Code- und Agentenfähigkeiten, insgesamt 1 Billion Parameter und 32 Milliarden aktivierten Parametern. In Benchmark-Tests zu allgemeinem Wissen, Programmierung, Mathematik und Agentenaufgaben übertrifft das K2-Modell andere führende Open-Source-Modelle."
  },
@@ -353,21 +332,12 @@
  "Qwen/Qwen3-30B-A3B-Instruct-2507": {
    "description": "Qwen3-30B-A3B-Instruct-2507 ist eine aktualisierte Version des Qwen3-30B-A3B im Nicht-Denkmodus. Es handelt sich um ein Mixture-of-Experts (MoE)-Modell mit insgesamt 30,5 Milliarden Parametern und 3,3 Milliarden Aktivierungsparametern. Das Modell wurde in mehreren Bereichen entscheidend verbessert, darunter eine signifikante Steigerung der Befolgung von Anweisungen, logisches Denken, Textverständnis, Mathematik, Wissenschaft, Programmierung und Werkzeugnutzung. Gleichzeitig wurden substanzielle Fortschritte bei der Abdeckung von Langschwanzwissen in mehreren Sprachen erzielt, und es kann besser auf die Präferenzen der Nutzer bei subjektiven und offenen Aufgaben abgestimmt werden, um hilfreichere Antworten und qualitativ hochwertigere Texte zu generieren. Darüber hinaus wurde die Fähigkeit zum Verständnis langer Texte auf 256K erweitert. Dieses Modell unterstützt ausschließlich den Nicht-Denkmodus und generiert keine `<think></think>`-Tags in der Ausgabe."
  },
-  "Qwen/Qwen3-30B-A3B-Thinking-2507": {
-    "description": "Qwen3-30B-A3B-Thinking-2507 ist das neueste Denkmodell der Qwen3‑Serie, veröffentlicht vom Alibaba Tongyi Qianwen‑Team. Als ein Mixture-of-Experts-(MoE)-Modell mit 30,5 Milliarden Gesamtparametern und 3,3 Milliarden aktiven Parametern konzentriert es sich auf die Verbesserung der Bewältigung komplexer Aufgaben. Das Modell zeigt deutliche Leistungssteigerungen in akademischen Benchmarks für logisches Schließen, Mathematik, Naturwissenschaften, Programmierung sowie Aufgaben, die menschliche Fachkenntnisse erfordern. Gleichzeitig wurden seine allgemeinen Fähigkeiten bei der Befolgung von Anweisungen, der Nutzung von Werkzeugen, der Textgenerierung und der Anpassung an menschliche Präferenzen erheblich gestärkt. Das Modell unterstützt nativ ein langes Kontextverständnis von 256K und ist auf bis zu 1 Million Tokens skalierbar. Diese Version ist speziell für den 'Denkmodus' konzipiert und zielt darauf ab, hochkomplexe Aufgaben durch ausführliches, schrittweises Denken zu lösen; auch seine Agent‑Fähigkeiten sind hervorragend."
-  },
  "Qwen/Qwen3-32B": {
    "description": "Qwen3 ist ein neues, leistungsstark verbessertes Modell von Tongyi Qianwen, das in den Bereichen Denken, Allgemeinwissen, Agenten und Mehrsprachigkeit in mehreren Kernfähigkeiten branchenführende Standards erreicht und den Wechsel zwischen Denkmodi unterstützt."
  },
  "Qwen/Qwen3-8B": {
    "description": "Qwen3 ist ein neues, leistungsstark verbessertes Modell von Tongyi Qianwen, das in den Bereichen Denken, Allgemeinwissen, Agenten und Mehrsprachigkeit in mehreren Kernfähigkeiten branchenführende Standards erreicht und den Wechsel zwischen Denkmodi unterstützt."
  },
-  "Qwen/Qwen3-Coder-30B-A3B-Instruct": {
-    "description": "Qwen3-Coder-30B-A3B-Instruct ist ein Code-Modell der Qwen3-Serie, das vom Alibaba-Team Tongyi Qianwen entwickelt wurde. Als schlank optimiertes Modell konzentriert es sich darauf, die Code-Verarbeitungsfähigkeiten zu verbessern, während es hohe Leistung und Effizienz beibehält. Das Modell zeigt unter Open-Source-Modellen deutliche Leistungsvorteile bei komplexen Aufgaben wie agentischem Programmieren (Agentic Coding), automatisierten Browseroperationen und Werkzeugaufrufen. Es unterstützt nativ lange Kontexte mit 256K Tokens und lässt sich auf bis zu 1M Tokens erweitern, sodass es Verständnis- und Verarbeitungsaufgaben auf Ebene ganzer Codebasen besser bewältigen kann. Darüber hinaus bietet das Modell starke Agenten-Codierungsunterstützung für Plattformen wie Qwen Code und CLINE und verfügt über ein speziell entwickeltes Format für Funktionsaufrufe."
-  },
-  "Qwen/Qwen3-Coder-480B-A35B-Instruct": {
-    "description": "Qwen3-Coder-480B-A35B-Instruct wurde von Alibaba veröffentlicht und ist bislang das agentischste Code-Modell. Es ist ein Mixture-of-Experts-(MoE)-Modell mit 480 Milliarden Gesamtparametern und 35 Milliarden aktivierten Parametern, das ein ausgewogenes Verhältnis von Effizienz und Leistung bietet. Das Modell unterstützt nativ eine Kontextlänge von 256K (≈260.000) Token und lässt sich mittels Extrapolationsverfahren wie YaRN auf bis zu 1.000.000 Token erweitern, sodass es große Codebasen und komplexe Programmieraufgaben verarbeiten kann. Qwen3-Coder wurde für agentenbasierte Coding-Workflows entwickelt: Es generiert nicht nur Code, sondern kann auch eigenständig mit Entwicklungswerkzeugen und -umgebungen interagieren, um komplexe Programmierprobleme zu lösen. In mehreren Benchmarks zu Coding- und Agentenaufgaben gehört das Modell zu den Spitzenreitern unter Open-Source-Modellen und erreicht eine Leistungsfähigkeit, die mit führenden Modellen wie Claude Sonnet 4 vergleichbar ist."
-  },
  "Qwen2-72B-Instruct": {
    "description": "Qwen2 ist die neueste Reihe des Qwen-Modells, das 128k Kontext unterstützt. Im Vergleich zu den derzeit besten Open-Source-Modellen übertrifft Qwen2-72B in den Bereichen natürliche Sprachverständnis, Wissen, Code, Mathematik und Mehrsprachigkeit deutlich die führenden Modelle."
  },
@@ -398,9 +368,6 @@
  "Qwen3-235B": {
    "description": "Qwen3-235B-A22B ist ein MoE (Mixture-of-Experts)-Modell, das den „Hybrid-Reasoning-Modus“ einführt und Nutzern nahtloses Umschalten zwischen „Denkmodus“ und „Nicht-Denkmodus“ ermöglicht. Es unterstützt das Verständnis und die Argumentation in 119 Sprachen und Dialekten und verfügt über leistungsstarke Werkzeugaufruffähigkeiten. In umfassenden Benchmark-Tests zu allgemeinen Fähigkeiten, Programmierung und Mathematik, Mehrsprachigkeit, Wissen und Argumentation konkurriert es mit führenden aktuellen Großmodellen auf dem Markt wie DeepSeek R1, OpenAI o1, o3-mini, Grok 3 und Google Gemini 2.5 Pro."
  },
-  "Qwen3-235B-A22B-Instruct-2507-FP8": {
-    "description": "Qwen3 235B A22B Instruct 2507: Ein Modell, optimiert für fortgeschrittene Schlussfolgerungen und Dialoganweisungen, mit einer hybriden Expertenarchitektur, die bei großem Parameterumfang die Inferenz-Effizienz bewahrt."
-  },
  "Qwen3-32B": {
    "description": "Qwen3-32B ist ein dichtes Modell (Dense Model), das den „Hybrid-Reasoning-Modus“ einführt und Nutzern nahtloses Umschalten zwischen „Denkmodus“ und „Nicht-Denkmodus“ ermöglicht. Aufgrund von Verbesserungen in der Modellarchitektur, einer Erweiterung der Trainingsdaten und effizienteren Trainingsmethoden entspricht die Gesamtleistung der von Qwen2.5-72B."
  },
@@ -857,9 +824,6 @@
  "deepseek-ai/DeepSeek-V3": {
    "description": "DeepSeek-V3 ist ein hybrides Expertenmodell (MoE) mit 6710 Milliarden Parametern, das eine Multi-Head-Latent-Attention (MLA) und die DeepSeekMoE-Architektur verwendet, kombiniert mit einer Lastenausgleichsstrategie ohne Hilfskosten, um die Inferenz- und Trainingseffizienz zu optimieren. Durch das Pre-Training auf 14,8 Billionen hochwertigen Tokens und anschließendes überwachten Feintuning und verstärkendes Lernen übertrifft DeepSeek-V3 in der Leistung andere Open-Source-Modelle und nähert sich führenden Closed-Source-Modellen."
  },
-  "deepseek-ai/DeepSeek-V3.1": {
-    "description": "DeepSeek-V3.1 ist ein hybrides großes Sprachmodell, das von DeepSeek AI veröffentlicht wurde und auf dem Vorgängermodell in vielerlei Hinsicht bedeutende Verbesserungen aufweist. Eine wesentliche Innovation dieses Modells ist die Integration des „Denkmodus“ und des „Nicht-Denkmodus“ in einem System, wobei Nutzer durch Anpassung der Chat-Vorlagen flexibel zwischen den Modi wechseln können, um unterschiedlichen Aufgabenanforderungen gerecht zu werden. Durch spezielles Post-Training wurde die Leistung von V3.1 bei Tool-Aufrufen und Agentenaufgaben deutlich gesteigert, was eine bessere Unterstützung externer Suchwerkzeuge und die Ausführung komplexer mehrstufiger Aufgaben ermöglicht. Das Modell basiert auf DeepSeek-V3.1-Base und wurde durch eine zweistufige Langtext-Erweiterungsmethode nachtrainiert, wodurch das Trainingsdatenvolumen erheblich erhöht wurde und es sich besonders bei der Verarbeitung langer Dokumente und umfangreicher Codes bewährt. Als Open-Source-Modell zeigt DeepSeek-V3.1 in Benchmarks zu Codierung, Mathematik und logischem Denken Fähigkeiten, die mit führenden Closed-Source-Modellen vergleichbar sind. Gleichzeitig senkt seine hybride Expertenarchitektur (MoE) die Inferenzkosten bei gleichzeitiger Beibehaltung einer enormen Modellkapazität."
-  },
  "deepseek-ai/deepseek-llm-67b-chat": {
    "description": "DeepSeek 67B ist ein fortschrittliches Modell, das für komplexe Dialoge trainiert wurde."
  },
@@ -930,7 +894,7 @@
    "description": "DeepSeek R1 Vollversion mit 671B Parametern, die Echtzeit-Online-Suche unterstützt und über verbesserte Verständnis- und Generierungsfähigkeiten verfügt."
  },
  "deepseek-reasoner": {
-    "description": "DeepSeek V3.1 Denkmodus. Bevor die endgültige Antwort ausgegeben wird, generiert das Modell eine Kette von Überlegungen, um die Genauigkeit der finalen Antwort zu verbessern."
+    "description": "Das von DeepSeek entwickelte Inferenzmodell. Bevor das Modell die endgültige Antwort ausgibt, gibt es zunächst eine Denkprozesskette aus, um die Genauigkeit der endgültigen Antwort zu erhöhen."
  },
  "deepseek-v2": {
    "description": "DeepSeek V2 ist ein effizientes Mixture-of-Experts-Sprachmodell, das für wirtschaftliche Verarbeitungsanforderungen geeignet ist."
@@ -944,18 +908,12 @@
  "deepseek-v3-0324": {
    "description": "DeepSeek-V3-0324 ist ein MoE-Modell mit 671 Milliarden Parametern, das in den Bereichen Programmierung und technische Fähigkeiten, Kontextverständnis und Verarbeitung langer Texte herausragende Vorteile bietet."
  },
-  "deepseek-v3.1": {
-    "description": "DeepSeek-V3.1 ist ein neu eingeführtes hybrides Inferenzmodell von DeepSeek, das zwei Inferenzmodi unterstützt: Denkmodus und Nicht-Denkmodus. Es ist effizienter im Denkprozess als DeepSeek-R1-0528. Durch Post-Training-Optimierung wurden die Nutzung von Agenten-Tools und die Leistung bei Agentenaufgaben erheblich verbessert. Unterstützt ein Kontextfenster von 128k und eine maximale Ausgabelänge von 64k Tokens."
-  },
  "deepseek/deepseek-chat-v3-0324": {
    "description": "DeepSeek V3 ist ein Experten-Mischmodell mit 685B Parametern und die neueste Iteration der Flaggschiff-Chatmodellreihe des DeepSeek-Teams.\n\nEs erbt das [DeepSeek V3](/deepseek/deepseek-chat-v3) Modell und zeigt hervorragende Leistungen in verschiedenen Aufgaben."
  },
  "deepseek/deepseek-chat-v3-0324:free": {
    "description": "DeepSeek V3 ist ein Experten-Mischmodell mit 685B Parametern und die neueste Iteration der Flaggschiff-Chatmodellreihe des DeepSeek-Teams.\n\nEs erbt das [DeepSeek V3](/deepseek/deepseek-chat-v3) Modell und zeigt hervorragende Leistungen in verschiedenen Aufgaben."
  },
-  "deepseek/deepseek-chat-v3.1": {
-    "description": "DeepSeek-V3.1 ist ein großes hybrides Inferenzmodell, das 128K langen Kontext und effizienten Moduswechsel unterstützt. Es erzielt herausragende Leistung und Geschwindigkeit bei Tool-Aufrufen, Codegenerierung und komplexen Inferenzaufgaben."
-  },
  "deepseek/deepseek-r1": {
    "description": "DeepSeek-R1 hat die Schlussfolgerungsfähigkeiten des Modells erheblich verbessert, selbst bei nur wenigen gekennzeichneten Daten. Bevor das Modell die endgültige Antwort ausgibt, gibt es zunächst eine Denkprozesskette aus, um die Genauigkeit der endgültigen Antwort zu erhöhen."
  },
@@ -1145,27 +1103,12 @@
  "flux-dev": {
    "description": "FLUX.1 [dev] ist ein Open-Source-Gewichtungs- und Feinschlichtungsmodell für nicht-kommerzielle Anwendungen. Es bietet eine Bildqualität und Instruktionsbefolgung ähnlich der professionellen FLUX-Version, jedoch mit höherer Effizienz. Im Vergleich zu Standardmodellen gleicher Größe ist es ressourcenschonender."
  },
-  "flux-kontext-max": {
-    "description": "Modernste kontextbezogene Bildgenerierung und -bearbeitung – verbindet Text und Bilder, um präzise, kohärente Ergebnisse zu erzielen."
-  },
-  "flux-kontext-pro": {
-    "description": "Modernste kontextbezogene Bildgenerierung und -bearbeitung – verbindet Text und Bild zu präzisen, kohärenten Ergebnissen."
-  },
  "flux-kontext/dev": {
    "description": "FLUX.1 Modell, spezialisiert auf Bildbearbeitungsaufgaben, unterstützt Text- und Bildeingaben."
  },
  "flux-merged": {
    "description": "Das FLUX.1-merged Modell kombiniert die tiefgehenden Eigenschaften, die in der Entwicklungsphase von „DEV“ erforscht wurden, mit der hohen Ausführungsgeschwindigkeit von „Schnell“. Dadurch werden sowohl die Leistungsgrenzen des Modells erweitert als auch dessen Anwendungsbereich vergrößert."
  },
-  "flux-pro": {
-    "description": "Premium-kommerzielles KI-Bildgenerierungsmodell — unvergleichliche Bildqualität und vielfältige Ausgabemöglichkeiten."
-  },
-  "flux-pro-1.1": {
-    "description": "Verbessertes professionelles KI-Modell zur Bildgenerierung — bietet herausragende Bildqualität und eine präzise Umsetzung von Eingabeaufforderungen."
-  },
-  "flux-pro-1.1-ultra": {
-    "description": "Ultrahochauflösende KI-Bildgenerierung — unterstützt Ausgaben mit 4 Megapixeln und erstellt hochauflösende Bilder innerhalb von 10 Sekunden."
-  },
  "flux-pro/kontext": {
    "description": "FLUX.1 Kontext [pro] kann Text und Referenzbilder als Eingabe verarbeiten und ermöglicht nahtlose zielgerichtete lokale Bearbeitungen sowie komplexe umfassende Szenenveränderungen."
  },
@@ -1250,12 +1193,6 @@
  "gemini-2.5-flash": {
    "description": "Gemini 2.5 Flash ist Googles kosteneffizientestes Modell und bietet umfassende Funktionen."
  },
-  "gemini-2.5-flash-image-preview": {
-    "description": "Nano Banana ist Googles neuestes, schnellstes und effizientestes natives multimodales Modell, das es Ihnen ermöglicht, Bilder durch Dialog zu generieren und zu bearbeiten."
-  },
-  "gemini-2.5-flash-image-preview:image": {
-    "description": "Nano Banana ist Googles neuestes, schnellstes und effizientestes natives multimodales Modell, das es Ihnen ermöglicht, Bilder durch Dialog zu generieren und zu bearbeiten."
-  },
  "gemini-2.5-flash-lite": {
    "description": "Gemini 2.5 Flash-Lite ist Googles kleinstes und kosteneffizientestes Modell, das speziell für den großflächigen Einsatz entwickelt wurde."
  },
@@ -1358,9 +1295,6 @@
  "glm-4.5-x": {
    "description": "Die Turbo-Version von GLM-4.5, die bei starker Leistung eine Generierungsgeschwindigkeit von bis zu 100 Tokens pro Sekunde erreicht."
  },
-  "glm-4.5v": {
-    "description": "Das neue visuelle Inferenzmodell der nächsten Generation von Zhipu, basierend auf der MOE-Architektur, verfügt über 106B Gesamtparameter und 12B aktivierte Parameter und erzielt in verschiedenen Benchmarks State-of-the-Art‑Ergebnisse (SOTA) unter weltweit vergleichbaren Open‑Source‑multimodalen Modellen. Es deckt gängige Aufgaben wie Bild-, Video- und Dokumentenverständnis sowie GUI‑Aufgaben ab."
-  },
  "glm-4v": {
    "description": "GLM-4V bietet starke Fähigkeiten zur Bildverständnis und -schlussfolgerung und unterstützt eine Vielzahl visueller Aufgaben."
  },
@@ -1397,12 +1331,6 @@
  "google/gemini-2.5-flash": {
    "description": "Gemini 2.5 Flash ist Googles fortschrittlichstes Hauptmodell, speziell entwickelt für anspruchsvolle Aufgaben in den Bereichen logisches Denken, Programmierung, Mathematik und Wissenschaft. Es verfügt über eingebaute \"Denkfähigkeiten\", die es ermöglichen, Antworten mit höherer Genauigkeit und detaillierter Kontextverarbeitung zu liefern.\n\nHinweis: Dieses Modell gibt es in zwei Varianten: mit und ohne Denkfähigkeit. Die Preisgestaltung für die Ausgabe variiert erheblich, je nachdem, ob die Denkfähigkeit aktiviert ist. Wenn Sie die Standardvariante (ohne den Suffix \":thinking\") wählen, vermeidet das Modell ausdrücklich die Erzeugung von Denk-Token.\n\nUm die Denkfähigkeit zu nutzen und Denk-Token zu erhalten, müssen Sie die \":thinking\"-Variante wählen, was zu höheren Kosten für die Denk-Ausgabe führt.\n\nDarüber hinaus kann Gemini 2.5 Flash über den Parameter \"Maximale Tokenanzahl für das Denken\" konfiguriert werden, wie in der Dokumentation beschrieben (https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning)."
  },
-  "google/gemini-2.5-flash-image-preview": {
-    "description": "Gemini 2.5 Flash Experimentelles Modell, unterstützt Bildgenerierung"
-  },
-  "google/gemini-2.5-flash-image-preview:free": {
-    "description": "Gemini 2.5 Flash Experimentelles Modell, unterstützt Bildgenerierung"
-  },
  "google/gemini-2.5-flash-preview": {
    "description": "Gemini 2.5 Flash ist Googles fortschrittlichstes Hauptmodell, das für fortgeschrittenes Denken, Codierung, Mathematik und wissenschaftliche Aufgaben entwickelt wurde. Es enthält die eingebaute Fähigkeit zu \"denken\", was es ihm ermöglicht, Antworten mit höherer Genauigkeit und detaillierter Kontextverarbeitung zu liefern.\n\nHinweis: Dieses Modell hat zwei Varianten: Denken und Nicht-Denken. Die Ausgabepreise variieren erheblich, je nachdem, ob die Denkfähigkeit aktiviert ist oder nicht. Wenn Sie die Standardvariante (ohne den Suffix \":thinking\") wählen, wird das Modell ausdrücklich vermeiden, Denk-Tokens zu generieren.\n\nUm die Denkfähigkeit zu nutzen und Denk-Tokens zu erhalten, müssen Sie die \":thinking\"-Variante wählen, was zu höheren Preisen für Denk-Ausgaben führt.\n\nDarüber hinaus kann Gemini 2.5 Flash über den Parameter \"maximale Tokenanzahl für das Denken\" konfiguriert werden, wie in der Dokumentation beschrieben (https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning)."
  },
@@ -1506,7 +1434,7 @@
    "description": "GPT-4.1 mini bietet ein Gleichgewicht zwischen Intelligenz, Geschwindigkeit und Kosten, was es zu einem attraktiven Modell für viele Anwendungsfälle macht."
  },
  "gpt-4.5-preview": {
-    "description": "GPT-4.5-preview ist das neueste Allzweckmodell, verfügt über fundiertes Weltwissen und ein verbessertes Verständnis der Nutzerintentionen und ist besonders leistungsfähig bei kreativen Aufgaben sowie in der Planung von Agenten. Das Wissen des Modells reicht bis Oktober 2023."
+    "description": "Die Forschungs-Vorschau von GPT-4.5, unserem bisher größten und leistungsstärksten GPT-Modell. Es verfügt über umfangreiches Weltwissen und kann die Absichten der Benutzer besser verstehen, was es in kreativen Aufgaben und autonomer Planung herausragend macht. GPT-4.5 akzeptiert Text- und Bild-Eingaben und generiert Textausgaben (einschließlich strukturierter Ausgaben). Es unterstützt wichtige Entwicklerfunktionen wie Funktionsaufrufe, Batch-APIs und Streaming-Ausgaben. In Aufgaben, die kreatives, offenes Denken und Dialog erfordern (wie Schreiben, Lernen oder das Erkunden neuer Ideen), zeigt GPT-4.5 besonders gute Leistungen. Der Wissensstand ist bis Oktober 2023."
  },
  "gpt-4o": {
    "description": "ChatGPT-4o ist ein dynamisches Modell, das in Echtzeit aktualisiert wird, um die neueste Version zu gewährleisten. Es kombiniert starke Sprachverständnis- und Generierungsfähigkeiten und eignet sich für großangelegte Anwendungsszenarien, einschließlich Kundenservice, Bildung und technische Unterstützung."
@@ -1574,9 +1502,6 @@
  "gpt-oss": {
    "description": "GPT-OSS 20B ist ein von OpenAI veröffentlichtes Open-Source-Sprachmodell, das die MXFP4-Quantisierungstechnologie verwendet und sich für den Einsatz auf High-End-Consumer-GPUs oder Apple Silicon Macs eignet. Dieses Modell zeigt hervorragende Leistungen bei der Dialoggenerierung, Codeerstellung und bei Inferenzaufgaben und unterstützt Funktionsaufrufe sowie die Nutzung von Werkzeugen."
  },
-  "gpt-oss-120b": {
-    "description": "GPT-OSS-120B MXFP4 quantisierte Transformer-Struktur, die auch bei begrenzten Ressourcen starke Leistung beibehält."
-  },
  "gpt-oss:120b": {
    "description": "GPT-OSS 120B ist ein von OpenAI veröffentlichtes großes Open-Source-Sprachmodell, das die MXFP4-Quantisierungstechnologie verwendet und als Flaggschiff-Modell gilt. Es erfordert den Betrieb auf Multi-GPU- oder Hochleistungs-Workstation-Umgebungen und bietet herausragende Leistungen bei komplexen Inferenzaufgaben, Codegenerierung und mehrsprachiger Verarbeitung. Es unterstützt fortgeschrittene Funktionsaufrufe und die Integration von Werkzeugen."
  },
@@ -1604,9 +1529,6 @@
  "grok-4": {
    "description": "Unser neuestes und leistungsstärkstes Flaggschiffmodell, das in der Verarbeitung natürlicher Sprache, mathematischen Berechnungen und logischem Denken herausragende Leistungen erbringt – ein perfekter Allrounder."
  },
-  "grok-code-fast-1": {
-    "description": "Wir freuen uns, grok-code-fast-1 vorzustellen, ein schnelles und kosteneffizientes Inferenzmodell, das sich durch hervorragende Leistung bei der Agentencodierung auszeichnet."
-  },
  "gryphe/mythomax-l2-13b": {
    "description": "MythoMax l2 13B ist ein Sprachmodell, das Kreativität und Intelligenz kombiniert und mehrere führende Modelle integriert."
  },
@@ -1715,18 +1637,9 @@
  "image-01-live": {
    "description": "Bildgenerierungsmodell mit feiner Bilddarstellung, unterstützt Text-zu-Bild und Stil-Einstellungen."
  },
-  "imagen-4.0-fast-generate-001": {
-    "description": "Imagen – Text-zu-Bild-Modellreihe der 4. Generation (Fast-Version)"
-  },
-  "imagen-4.0-generate-001": {
-    "description": "Imagen, Text-zu-Bild-Modellreihe der 4. Generation"
-  },
  "imagen-4.0-generate-preview-06-06": {
    "description": "Imagen 4. Generation Text-zu-Bild Modellserie"
  },
-  "imagen-4.0-ultra-generate-001": {
-    "description": "Imagen, Text-zu-Bild-Modell der 4. Generation (Ultra-Version)"
-  },
  "imagen-4.0-ultra-generate-preview-06-06": {
    "description": "Imagen 4. Generation Text-zu-Bild Modellserie Ultra-Version"
  },
@@ -1766,9 +1679,6 @@
  "kimi-k2-0711-preview": {
    "description": "kimi-k2 ist ein MoE-Architektur-Basis-Modell mit außergewöhnlichen Fähigkeiten in Code und Agentenfunktionen, mit insgesamt 1 Billion Parametern und 32 Milliarden aktiven Parametern. In Benchmark-Tests zu allgemeinem Wissen, Programmierung, Mathematik und Agenten übertrifft das K2-Modell andere führende Open-Source-Modelle."
  },
-  "kimi-k2-turbo-preview": {
-    "description": "kimi-k2 ist ein Basis-Modell mit MoE-Architektur und besonders starken Fähigkeiten im Bereich Code und Agenten. Es verfügt über insgesamt 1T Parameter und 32B aktivierte Parameter. In Benchmark-Tests der wichtigsten Kategorien – allgemeines Wissens-Reasoning, Programmierung, Mathematik und Agenten – übertrifft das K2-Modell die Leistung anderer gängiger Open‑Source‑Modelle."
-  },
  "kimi-latest": {
    "description": "Das Kimi intelligente Assistenzprodukt verwendet das neueste Kimi Großmodell, das möglicherweise noch instabile Funktionen enthält. Es unterstützt die Bildverarbeitung und wählt automatisch das Abrechnungsmodell 8k/32k/128k basierend auf der Länge des angeforderten Kontexts aus."
  },
@@ -1853,9 +1763,6 @@
  "llava:34b": {
    "description": "LLaVA ist ein multimodales Modell, das visuelle Encoder und Vicuna kombiniert und für starke visuelle und sprachliche Verständnisse sorgt."
  },
-  "magistral-medium-latest": {
-    "description": "Magistral Medium 1.1 ist ein fortschrittliches Inferenzmodell, das Mistral AI im Juli 2025 veröffentlicht hat."
-  },
  "mathstral": {
    "description": "MathΣtral ist für wissenschaftliche Forschung und mathematische Schlussfolgerungen konzipiert und bietet effektive Rechenfähigkeiten und Ergebnisinterpretationen."
  },
@@ -2187,7 +2094,7 @@
    "description": "o1-mini ist ein schnelles und kosteneffizientes Inferenzmodell, das für Programmier-, Mathematik- und Wissenschaftsanwendungen entwickelt wurde. Das Modell hat einen Kontext von 128K und einen Wissensstand bis Oktober 2023."
  },
  "o1-preview": {
-    "description": "Konzentriert auf fortgeschrittenes Schlussfolgern und die Lösung komplexer Probleme, einschließlich mathematischer und naturwissenschaftlicher Aufgaben. Sehr gut geeignet für Anwendungen, die ein tiefes Kontextverständnis und autonome Arbeitsabläufe benötigen."
+    "description": "o1 ist OpenAIs neues Inferenzmodell, das für komplexe Aufgaben geeignet ist, die umfangreiches Allgemeinwissen erfordern. Das Modell hat einen Kontext von 128K und einen Wissensstand bis Oktober 2023."
  },
  "o1-pro": {
    "description": "Die o1-Serie wurde durch verstärkendes Lernen trainiert, um vor der Antwort nachzudenken und komplexe Schlussfolgerungen zu ziehen. Das o1-pro Modell nutzt mehr Rechenressourcen für tiefere Überlegungen und liefert dadurch kontinuierlich qualitativ hochwertigere Antworten."
@@ -2306,14 +2213,8 @@
  "qwen-coder-turbo-latest": {
    "description": "Das Tongyi Qianwen Code-Modell."
  },
-  "qwen-flash": {
-    "description": "Die Tongyi-Qianwen-Reihe bietet besonders schnelle und sehr kostengünstige Modelle und eignet sich für einfache Aufgaben."
-  },
  "qwen-image": {
-    "description": "Qwen-Image ist ein universelles Bildgenerierungsmodell, das zahlreiche Kunststile unterstützt und sich besonders bei der Wiedergabe komplexer Texte auszeichnet, insbesondere bei chinesischen und englischen Schriftzügen. Das Modell unterstützt mehrzeilige Layouts, absatzweises Textgenerieren sowie die präzise Darstellung feiner Details und ermöglicht die Erstellung komplexer Bild-Text-Kombinationen."
-  },
-  "qwen-image-edit": {
-    "description": "Das Qwen-Team hat ein professionelles Modell zur Bildbearbeitung veröffentlicht, das semantische Bearbeitungen und Aussehensbearbeitungen unterstützt. Es kann chinesische und englische Texte präzise bearbeiten und ermöglicht Stiltransformationen, Objektrotationen sowie weitere hochwertige Bildbearbeitungen."
+    "description": "Leistungsstarkes Rohbildmodell vom Qwen-Team mit beeindruckenden Fähigkeiten zur chinesischen Textgenerierung und vielfältigen visuellen Bildstilen."
  },
  "qwen-long": {
    "description": "Qwen ist ein groß angelegtes Sprachmodell, das lange Textkontexte unterstützt und Dialogfunktionen für verschiedene Szenarien wie lange Dokumente und mehrere Dokumente bietet."
@@ -2340,7 +2241,7 @@
    "description": "Qwen Plus ist die verbesserte Version des großangelegten Sprachmodells, das Eingaben in verschiedenen Sprachen wie Chinesisch und Englisch unterstützt."
  },
  "qwen-turbo": {
-    "description": "通义千问 Turbo wird künftig nicht mehr aktualisiert. Es wird empfohlen, auf 通义千问 Flash umzusteigen. 通义千问 ist ein äußerst groß angelegtes Sprachmodell und unterstützt Eingaben in Chinesisch, Englisch und weiteren Sprachen."
+    "description": "Qwen Turbo ist ein großangelegtes Sprachmodell, das Eingaben in verschiedenen Sprachen wie Chinesisch und Englisch unterstützt."
  },
  "qwen-vl-chat-v1": {
    "description": "Qwen VL unterstützt flexible Interaktionsmethoden, einschließlich Mehrbild-, Mehrfachfragen und kreativen Fähigkeiten."
@@ -2657,15 +2558,9 @@
  "step-2x-large": {
    "description": "Das neue Generationen-Bildmodell von Step Star konzentriert sich auf Bildgenerierung und kann basierend auf Textbeschreibungen des Nutzers hochwertige Bilder erzeugen. Das neue Modell erzeugt realistischere Bildtexturen und bietet verbesserte Fähigkeiten bei der Erzeugung chinesischer und englischer Schriftzeichen."
  },
-  "step-3": {
-    "description": "Dieses Modell verfügt über eine leistungsfähige visuelle Wahrnehmung und ausgeprägte Fähigkeiten zum komplexen Schlussfolgern. Es kann fachübergreifendes Verständnis komplexer Zusammenhänge, die kombinierte Analyse von mathematischen und visuellen Informationen sowie vielfältige visuelle Analyseaufgaben des Alltags präzise bewältigen."
-  },
  "step-r1-v-mini": {
    "description": "Dieses Modell ist ein leistungsstarkes Schlussfolgerungsmodell mit starker Bildverständnisfähigkeit, das in der Lage ist, Bild- und Textinformationen zu verarbeiten und nach tiefem Denken Textinhalte zu generieren. Es zeigt herausragende Leistungen im Bereich der visuellen Schlussfolgerung und verfügt über erstklassige Fähigkeiten in Mathematik, Programmierung und Textschlussfolgerung. Die Kontextlänge beträgt 100k."
  },
-  "stepfun-ai/step3": {
-    "description": "Step3 ist ein wegweisendes multimodales Inferenzmodell, veröffentlicht von StepFun (阶跃星辰). Es basiert auf einer Mixture-of-Experts-(MoE)-Architektur mit insgesamt 321 Milliarden Parametern und 38 Milliarden Aktivierungsparametern. Das Modell ist als End-to-End-System konzipiert, um die Decodierungskosten zu minimieren und gleichzeitig erstklassige Leistung bei visuell-sprachlicher Inferenz zu bieten. Durch die synergistische Kombination von Multi-Matrix-Factorization-Attention (MFA) und Attention-FFN-Dekopplung (AFD) erzielt Step3 sowohl auf High-End- als auch auf ressourcenbeschränkten Beschleunigern hohe Effizienz. In der Vortrainingsphase verarbeitete Step3 mehr als 20 Billionen Text-Tokens und 4 Billionen multimodale (Bild‑Text) Tokens und deckt dabei über zehn Sprachen ab. Das Modell erzielt in zahlreichen Benchmarks — etwa in Mathematik, Programmierung und Multimodalität — führende Ergebnisse unter den Open‑Source‑Modellen."
-  },
  "taichu_llm": {
    "description": "Das Zīdōng Taichu Sprachmodell verfügt über außergewöhnliche Sprachverständnisfähigkeiten sowie Fähigkeiten in Textgenerierung, Wissensabfrage, Programmierung, mathematischen Berechnungen, logischem Denken, Sentimentanalyse und Textzusammenfassung. Es kombiniert innovativ große Datenvortrainings mit reichhaltigem Wissen aus mehreren Quellen, verfeinert kontinuierlich die Algorithmen und absorbiert ständig neues Wissen aus umfangreichen Textdaten in Bezug auf Vokabular, Struktur, Grammatik und Semantik, um die Leistung des Modells kontinuierlich zu verbessern. Es bietet den Nutzern bequemere Informationen und Dienstleistungen sowie ein intelligenteres Erlebnis."
  },
@@ -2693,9 +2588,18 @@
  "thudm/glm-4-9b-chat": {
    "description": "Die Open-Source-Version des neuesten vortrainierten Modells der GLM-4-Serie, das von Zhizhu AI veröffentlicht wurde."
  },
+  "thudm/glm-4-9b:free": {
+    "description": "GLM-4-9B-0414 ist ein Sprachmodell mit 9 Milliarden Parametern aus der GLM-4-Serie, das von THUDM entwickelt wurde. GLM-4-9B-0414 verwendet die gleichen Verstärkungs- und Ausrichtungsstrategien wie das größere 32B-Modell und erzielt in Bezug auf seine Größe hohe Leistungen, was es für ressourcenbeschränkte Bereitstellungen geeignet macht, die dennoch starke Sprachverständnis- und Generierungsfähigkeiten erfordern."
+  },
  "thudm/glm-z1-32b": {
    "description": "GLM-Z1-32B-0414 ist eine verbesserte Denkvariante von GLM-4-32B, die für tiefgehende Mathematik, Logik und codeorientierte Problemlösungen entwickelt wurde. Es verwendet erweiterte Verstärkungslernen (aufgabenspezifisch und basierend auf allgemeinen Paarpräferenzen), um die Leistung bei komplexen mehrstufigen Aufgaben zu verbessern. Im Vergleich zum Basis-GLM-4-32B-Modell hat Z1 die Fähigkeiten im strukturierten Denken und im formalen Bereich erheblich verbessert.\n\nDieses Modell unterstützt die Durchsetzung von \"Denk\"-Schritten durch Prompt-Engineering und bietet verbesserte Kohärenz für Ausgaben im Langformat. Es ist für Agenten-Workflows optimiert und unterstützt langen Kontext (über YaRN), JSON-Toolaufrufe und feinkörnige Sampling-Konfigurationen für stabiles Denken. Besonders geeignet für Anwendungsfälle, die durchdachtes, mehrstufiges Denken oder formale Ableitungen erfordern."
  },
+  "thudm/glm-z1-32b:free": {
+    "description": "GLM-Z1-32B-0414 ist eine verbesserte Denkvariante von GLM-4-32B, die für tiefgehende Mathematik, Logik und codeorientierte Problemlösungen entwickelt wurde. Es verwendet erweiterte Verstärkungslernen (aufgabenspezifisch und basierend auf allgemeinen Paarpräferenzen), um die Leistung bei komplexen mehrstufigen Aufgaben zu verbessern. Im Vergleich zum Basis-GLM-4-32B-Modell hat Z1 die Fähigkeiten im strukturierten Denken und im formalen Bereich erheblich verbessert.\n\nDieses Modell unterstützt die Durchsetzung von \"Denk\"-Schritten durch Prompt-Engineering und bietet verbesserte Kohärenz für Ausgaben im Langformat. Es ist für Agenten-Workflows optimiert und unterstützt langen Kontext (über YaRN), JSON-Toolaufrufe und feinkörnige Sampling-Konfigurationen für stabiles Denken. Besonders geeignet für Anwendungsfälle, die durchdachtes, mehrstufiges Denken oder formale Ableitungen erfordern."
+  },
+  "thudm/glm-z1-9b:free": {
+    "description": "GLM-Z1-9B-0414 ist ein Sprachmodell mit 9B Parametern aus der GLM-4-Serie, das von THUDM entwickelt wurde. Es verwendet Techniken, die ursprünglich auf das größere GLM-Z1-Modell angewendet wurden, einschließlich erweiterten verstärkten Lernens, paarweiser Rangordnungsausrichtung und Training für inferenzintensive Aufgaben wie Mathematik, Programmierung und Logik. Trotz seiner kleineren Größe zeigt es starke Leistungen bei allgemeinen Inferenzaufgaben und übertrifft viele Open-Source-Modelle in Bezug auf seine Gewichtung."
+  },
  "thudm/glm-z1-rumination-32b": {
    "description": "THUDM: GLM Z1 Rumination 32B ist ein tiefes Inferenzmodell mit 32B Parametern aus der GLM-4-Z1-Serie, das für komplexe, offene Aufgaben optimiert wurde, die langes Nachdenken erfordern. Es basiert auf glm-4-32b-0414 und hat zusätzliche Phasen des verstärkten Lernens und mehrstufige Ausrichtungsstrategien hinzugefügt, die die \"Reflexions\"-Fähigkeit einführen, die darauf abzielt, erweiterte kognitive Prozesse zu simulieren. Dazu gehören iterative Inferenz, mehrstufige Analysen und werkzeuggestützte Arbeitsabläufe wie Suche, Abruf und zitationsbewusste Synthese.\n\nDieses Modell zeigt hervorragende Leistungen in forschungsorientiertem Schreiben, vergleichender Analyse und komplexen Fragen und Antworten. Es unterstützt Funktionsaufrufe für Such- und Navigationsprimitiven (`search`, `click`, `open`, `finish`), sodass es in agentenbasierten Pipelines verwendet werden kann. Reflexionsverhalten wird durch ein mehrstufiges Regelbelohnungssystem und verzögerte Entscheidungsmechanismen geformt und wird an tiefen Forschungsrahmen wie dem internen Ausrichtungsstapel von OpenAI gemessen. Diese Variante eignet sich für Szenarien, die Tiefe statt Geschwindigkeit erfordern."
  },
@@ -2803,8 +2707,5 @@
  },
  "zai-org/GLM-4.5-Air": {
    "description": "GLM-4.5-Air ist ein speziell für Agentenanwendungen entwickeltes Basismodell mit Mixture-of-Experts-Architektur. Es ist tief optimiert für Werkzeugaufrufe, Web-Browsing, Softwareentwicklung und Frontend-Programmierung und unterstützt nahtlos die Integration in Code-Agenten wie Claude Code und Roo Code. GLM-4.5 verwendet einen hybriden Inferenzmodus und ist für komplexe Schlussfolgerungen sowie den Alltagsgebrauch geeignet."
-  },
-  "zai-org/GLM-4.5V": {
-    "description": "GLM-4.5V ist das neueste visuell-sprachliche Modell (VLM), das von Zhipu AI veröffentlicht wurde. Das Modell basiert auf dem Flaggschiff-Textmodell GLM-4.5-Air mit insgesamt 106 Milliarden Parametern und 12 Milliarden Aktivierungsparametern und verwendet eine Mixture-of-Experts-(MoE)-Architektur. Es zielt darauf ab, bei geringeren Inferenzkosten herausragende Leistung zu erzielen. Technisch setzt es die Entwicklungslinie von GLM-4.1V-Thinking fort und führt Innovationen wie die dreidimensionale Rotations-Positionskodierung (3D-RoPE) ein, wodurch die Wahrnehmung und das Schließen über dreidimensionale Raumbeziehungen deutlich verbessert werden. Durch Optimierungen in den Phasen des Pre-Trainings, der überwachten Feinabstimmung und des Reinforcement Learnings ist das Modell in der Lage, verschiedene visuelle Inhalte wie Bilder, Videos und lange Dokumente zu verarbeiten; in 41 öffentlichen multimodalen Benchmarks erreichte es Spitzenwerte unter frei verfügbaren Modellen derselben Klasse. Zudem wurde ein \"Denkmodus\"-Schalter hinzugefügt, der es Nutzern erlaubt, flexibel zwischen schneller Reaktion und tiefgehendem Schlussfolgern zu wählen, um Effizienz und Ergebnisqualität auszubalancieren."
  }
 }
@@ -11,9 +11,6 @@
  "aihubmix": {
    "description": "AiHubMix bietet über eine einheitliche API-Schnittstelle Zugriff auf verschiedene KI-Modelle."
  },
-  "akashchat": {
-    "description": "Akash ist ein genehmigungsfreier Cloud-Ressourcenmarkt, dessen Preisgestaltung im Vergleich zu herkömmlichen Cloud-Anbietern wettbewerbsfähig ist."
-  },
  "anthropic": {
    "description": "Anthropic ist ein Unternehmen, das sich auf Forschung und Entwicklung im Bereich der künstlichen Intelligenz spezialisiert hat und eine Reihe fortschrittlicher Sprachmodelle anbietet, darunter Claude 3.5 Sonnet, Claude 3 Sonnet, Claude 3 Opus und Claude 3 Haiku. Diese Modelle erreichen ein ideales Gleichgewicht zwischen Intelligenz, Geschwindigkeit und Kosten und sind für eine Vielzahl von Anwendungsszenarien geeignet, von unternehmensweiten Arbeitslasten bis hin zu schnellen Reaktionen. Claude 3.5 Sonnet, als neuestes Modell, hat in mehreren Bewertungen hervorragend abgeschnitten und bietet gleichzeitig ein hohes Preis-Leistungs-Verhältnis."
  },
@@ -29,9 +26,6 @@
  "bedrock": {
    "description": "Bedrock ist ein Service von Amazon AWS, der sich darauf konzentriert, Unternehmen fortschrittliche KI-Sprach- und visuelle Modelle bereitzustellen. Die Modellfamilie umfasst die Claude-Serie von Anthropic, die Llama 3.1-Serie von Meta und mehr, und bietet eine Vielzahl von Optionen von leichtgewichtig bis hochleistungsfähig, die Textgenerierung, Dialoge, Bildverarbeitung und andere Aufgaben unterstützen und für Unternehmensanwendungen unterschiedlicher Größen und Anforderungen geeignet sind."
  },
-  "bfl": {
-    "description": "Ein führendes, an vorderster Front tätiges KI-Forschungslabor, das die visuelle Infrastruktur von morgen gestaltet."
-  },
  "cloudflare": {
    "description": "Führen Sie von serverlosen GPUs betriebene Machine-Learning-Modelle im globalen Netzwerk von Cloudflare aus."
  },
@@ -92,12 +86,6 @@
  "moonshot": {
    "description": "Moonshot ist eine Open-Source-Plattform, die von Beijing Dark Side Technology Co., Ltd. eingeführt wurde und eine Vielzahl von Modellen zur Verarbeitung natürlicher Sprache anbietet, die in vielen Bereichen Anwendung finden, darunter, aber nicht beschränkt auf, Inhaltserstellung, akademische Forschung, intelligente Empfehlungen und medizinische Diagnosen, und unterstützt die Verarbeitung langer Texte und komplexer Generierungsaufgaben."
  },
-  "nebius": {
-    "description": "Nebius bietet globalen KI-Innovatoren durch den Aufbau großflächiger GPU-Cluster und einer vertikal integrierten Cloud-Plattform leistungsstarke Infrastruktur."
-  },
-  "newapi": {
-    "description": "Open-Source-Plattform zur einheitlichen Weiterleitung mehrerer KI-Dienste"
-  },
  "novita": {
    "description": "Novita AI ist eine Plattform, die eine Vielzahl von großen Sprachmodellen und API-Diensten für die KI-Bilderzeugung anbietet, die flexibel, zuverlässig und kosteneffektiv ist. Sie unterstützt die neuesten Open-Source-Modelle wie Llama3 und Mistral und bietet umfassende, benutzerfreundliche und automatisch skalierbare API-Lösungen für die Entwicklung generativer KI-Anwendungen, die für das schnelle Wachstum von KI-Startups geeignet sind."
  },
@@ -237,10 +237,6 @@
      "title": "Historiennachrichten begrenzen",
      "unlimited": "Unbegrenzte Historiennachrichten"
    },
-    "enableStreaming": {
-      "desc": "Aktivieren Sie den Streaming-Ausgang, um Antworten in Echtzeit anzuzeigen. Wenn deaktiviert, wird nur die vollständige Antwort angezeigt.",
-      "title": "Streaming-Ausgabe aktivieren"
-    },
    "historyCount": {
      "desc": "Anzahl der Nachrichten pro Anfrage (einschließlich der neuesten Fragen und Antworten. Jede Frage und Antwort zählt als 1)",
      "title": "Anzahl der mitgelieferten Nachrichten"
@@ -52,11 +52,7 @@
    "thinking": {
      "title": "Deep Thinking Switch"
    },
-    "title": "Model Extension Features",
-    "urlContext": {
-      "desc": "When enabled, web links will be automatically parsed to retrieve the actual webpage context content",
-      "title": "Extract Webpage Link Content"
-    }
+    "title": "Model Extension Features"
  },
  "history": {
    "title": "The assistant will only remember the last {{count}} messages."
@@ -129,7 +125,6 @@
      "inputWriteCached": "Input cache write",
      "output": "Output",
      "outputAudio": "Audio Output",
-      "outputImage": "Image Output",
      "outputText": "Text Output",
      "outputTitle": "Output Details",
      "reasoning": "Deep Thinking",
@@ -273,8 +268,7 @@
    "clientMode": {
      "actionFiletip": "Upload File",
      "actionTooltip": "Upload",
-      "disabled": "The current model does not support visual recognition and file analysis. Please switch models to use this feature.",
-      "visionNotSupported": "The current model does not support visual recognition. Please switch to a different model to use this feature."
+      "disabled": "The current model does not support visual recognition and file analysis. Please switch models to use this feature."
    },
    "preview": {
      "prepareTasks": "Preparing chunks...",
@@ -32,7 +32,6 @@
  "blog": "Product Blog",
  "branching": "Create Subtopic",
  "branchingDisable": "The 'Subtopic' feature is only available in the server version. If you need this feature, please switch to server deployment mode or use LobeChat Cloud.",
-  "branchingRequiresSavedTopic": "Current topic is not saved, please save it first to use subtopic feature",
  "cancel": "Cancel",
  "changelog": "Changelog",
  "clientDB": {
@@ -183,13 +182,6 @@
    "title": "Like Our Product?"
  },
  "fullscreen": "Full Screen Mode",
-  "geminiImageChineseWarning": {
-    "content": "Nano Banana may occasionally fail to generate images when using Chinese. It is recommended to use English for better results.",
-    "continueGenerate": "Continue Generating",
-    "continueSend": "Continue Sending",
-    "doNotShowAgain": "Do Not Show Again",
-    "title": "Chinese Input Notice"
-  },
  "historyRange": "History Range",
  "import": "Import",
  "importData": "Import Data",
@@ -73,18 +73,6 @@
  "GoBack": {
    "back": "Back"
  },
-  "HtmlPreview": {
-    "actions": {
-      "download": "Download",
-      "preview": "Preview"
-    },
-    "iframeTitle": "HTML Preview",
-    "mode": {
-      "code": "Code",
-      "preview": "Preview"
-    },
-    "title": "HTML Preview"
-  },
  "ImageUpload": {
    "actions": {
      "changeImage": "Click to change image",
@@ -142,12 +130,6 @@
    },
    "progress": {
      "uploadingWithCount": "{{completed}}/{{total}} uploaded"
-    },
-    "validation": {
-      "fileSizeExceeded": "File size exceeds the maximum allowed",
-      "fileSizeExceededDetail": "{{fileName}} ({{actualSize}}) exceeds the maximum allowed size of {{maxSize}}",
-      "fileSizeExceededMultiple": "{{count}} files exceed the maximum allowed size of {{maxSize}}: {{fileList}}",
-      "imageCountExceeded": "Maximum number of images exceeded"
    }
  },
  "OllamaSetupGuide": {
@@ -85,17 +85,6 @@
    "CreateMessageError": "Sorry, the message could not be sent successfully. Please copy the content and try sending it again. This message will not be retained after refreshing the page.",
    "ExceededContextWindow": "The current request content exceeds the length that the model can handle. Please reduce the amount of content and try again.",
    "FreePlanLimit": "You are currently a free user and cannot use this feature. Please upgrade to a paid plan to continue using it.",
-    "GoogleAIBlockReason": {
-      "BLOCKLIST": "Your content contains prohibited terms. Please review and modify your input, then try again.",
-      "IMAGE_SAFETY": "The generated image was blocked for safety reasons. Please try modifying your image request.",
-      "LANGUAGE": "The language you are using is not supported. Please try again in English or another supported language.",
-      "OTHER": "The content was blocked for an unknown reason. Please try rephrasing your request.",
-      "PROHIBITED_CONTENT": "Your request may contain prohibited content. Please adjust your request to comply with the usage guidelines.",
-      "RECITATION": "Your content was blocked due to potential copyright concerns. Please try using original content or rephrase your request.",
-      "SAFETY": "Your content was blocked for safety policy reasons. Please adjust your request to avoid potentially harmful or inappropriate content.",
-      "SPII": "Your content may contain sensitive personally identifiable information (PII). To protect privacy, please remove any sensitive details and try again.",
-      "default": "Content blocked: {{blockReason}}. Please adjust your request and try again."
-    },
    "InsufficientQuota": "Sorry, the quota for this key has been reached. Please check your account balance or increase the key quota and try again.",
    "InvalidAccessCode": "Invalid access code or empty. Please enter the correct access code or add a custom API Key.",
    "InvalidBedrockCredentials": "Bedrock authentication failed. Please check the AccessKeyId/SecretAccessKey and retry.",
@@ -124,6 +113,18 @@
    "PluginServerError": "Plugin server request returned an error. Please check your plugin manifest file, plugin configuration, or server implementation based on the error information below",
    "PluginSettingsInvalid": "This plugin needs to be correctly configured before it can be used. Please check if your configuration is correct",
    "ProviderBizError": "Error requesting {{provider}} service, please troubleshoot or retry based on the following information",
+
+    "GoogleAIBlockReason": {
+      "BLOCKLIST": "Your content contains prohibited terms. Please review and modify your input before retrying.",
+      "IMAGE_SAFETY": "Generated image content was blocked for safety reasons. Please try modifying your image generation request.",
+      "LANGUAGE": "The language you used is not supported. Please try using English or other supported languages.",
+      "OTHER": "Content was blocked for unknown reasons. Please try rephrasing your request or contact technical support.",
+      "PROHIBITED_CONTENT": "Your content may contain prohibited content types. Please adjust your request to ensure it complies with usage guidelines.",
+      "RECITATION": "Your content was blocked due to potential copyright issues. Please try using original content or rephrasing your request.",
+      "SAFETY": "Your content was blocked due to safety policies. Please try adjusting your request to avoid potentially harmful or inappropriate content.",
+      "SPII": "Your content may contain sensitive personally identifiable information. For privacy protection, please remove relevant sensitive information before retrying.",
+      "default": "Content was blocked: {{blockReason}}. Please adjust your request content and try again."
+    },
    "QuotaLimitReached": "We apologize, but the current token usage or number of requests has reached the quota limit for this key. Please increase the quota for this key or try again later.",
    "StreamChunkError": "Error parsing the message chunk of the streaming request. Please check if the current API interface complies with the standard specifications, or contact your API provider for assistance.",
    "SubscriptionKeyMismatch": "We apologize for the inconvenience. Due to a temporary system malfunction, your current subscription usage is inactive. Please click the button below to restore your subscription, or contact us via email for support.",
@@ -153,28 +153,6 @@
    "searchProviders": "Search Providers...",
    "sort": "Custom Sort"
  },
-  "newapi": {
-    "apiKey": {
-      "desc": "API key provided by the New API platform",
-      "placeholder": "New API API Key",
-      "required": "API key is required",
-      "title": "API Key"
-    },
-    "apiUrl": {
-      "desc": "API endpoint for the New API service, usually includes /v1",
-      "title": "API URL"
-    },
-    "enabled": {
-      "title": "Enable New API"
-    },
-    "models": {
-      "batchSelect": "Select models in bulk ({{count}} items)",
-      "fetch": "Fetch model list",
-      "selected": "Selected models",
-      "title": "Available Models"
-    },
-    "title": "New API"
-  },
  "ollama": {
    "checker": {
      "desc": "Test if the proxy address is correctly filled in",
@@ -207,10 +185,6 @@
    }
  },
  "providerModels": {
-    "batchSelect": {
-      "selected": "{{count}} models selected",
-      "title": "Bulk Selection"
-    },
    "config": {
      "aesGcm": "Your key and proxy URL will be encrypted using <1>AES-GCM</1> encryption algorithm",
      "apiKey": {
@@ -74,15 +74,9 @@
  "DeepSeek-V3": {
    "description": "DeepSeek-V3 is a MoE model developed in-house by Deep Seek Company. Its performance surpasses that of other open-source models such as Qwen2.5-72B and Llama-3.1-405B in multiple assessments, and it stands on par with the world's top proprietary models like GPT-4o and Claude-3.5-Sonnet."
  },
-  "DeepSeek-V3-1": {
-    "description": "DeepSeek V3.1: Next-generation reasoning model, enhancing complex reasoning and chain-of-thought capabilities, ideal for tasks requiring in-depth analysis."
-  },
  "DeepSeek-V3-Fast": {
    "description": "Model provider: sophnet platform. DeepSeek V3 Fast is the high-TPS ultra-fast version of DeepSeek V3 0324, fully powered without quantization, featuring enhanced coding and mathematical capabilities for faster response!"
  },
-  "DeepSeek-V3.1": {
-    "description": "DeepSeek-V3.1 is a newly launched hybrid reasoning model by DeepSeek, supporting two reasoning modes: thinking and non-thinking. It offers higher thinking efficiency compared to DeepSeek-R1-0528. With post-training optimization, the use of Agent tools and agent task performance have been significantly enhanced."
-  },
  "Doubao-lite-128k": {
    "description": "Doubao-lite offers ultra-fast response times and better cost-effectiveness, providing customers with more flexible options for different scenarios. Supports inference and fine-tuning with a 128k context window."
  },
@@ -137,15 +131,9 @@
  "ERNIE-Speed-Pro-128K": {
    "description": "Baidu's latest self-developed high-performance large language model released in 2024, with outstanding general capabilities, providing better results than ERNIE Speed, suitable as a base model for fine-tuning, effectively addressing specific scenario issues while also exhibiting excellent inference performance."
  },
-  "FLUX-1.1-pro": {
-    "description": "FLUX.1.1 Pro"
-  },
  "FLUX.1-Kontext-dev": {
    "description": "FLUX.1-Kontext-dev is a multimodal image generation and editing model developed by Black Forest Labs based on the Rectified Flow Transformer architecture, featuring 12 billion parameters. It specializes in generating, reconstructing, enhancing, or editing images under given contextual conditions. The model combines the controllable generation advantages of diffusion models with the contextual modeling capabilities of Transformers, supporting high-quality image output and widely applicable to image restoration, completion, and visual scene reconstruction tasks."
  },
-  "FLUX.1-Kontext-pro": {
-    "description": "FLUX.1 Kontext [pro]"
-  },
  "FLUX.1-dev": {
    "description": "FLUX.1-dev is an open-source multimodal language model (MLLM) developed by Black Forest Labs, optimized for vision-and-language tasks by integrating image and text understanding and generation capabilities. Built upon advanced large language models such as Mistral-7B, it achieves vision-language collaborative processing and complex task reasoning through a carefully designed visual encoder and multi-stage instruction fine-tuning."
  },
@@ -182,9 +170,6 @@
  "Llama-3.2-90B-Vision-Instruct\t": {
    "description": "Advanced image reasoning capabilities suitable for visual understanding agent applications."
  },
-  "Meta-Llama-3-3-70B-Instruct": {
-    "description": "Llama 3.3 70B: A versatile Transformer model suitable for conversational and generative tasks."
-  },
  "Meta-Llama-3.1-405B-Instruct": {
    "description": "Llama 3.1 instruction-tuned text model optimized for multilingual dialogue use cases, performing excellently on common industry benchmarks among many available open-source and closed chat models."
  },
@@ -203,9 +188,6 @@
  "Meta-Llama-3.3-70B-Instruct": {
    "description": "Llama 3.3 is the most advanced multilingual open-source large language model in the Llama series, offering performance comparable to a 405B model at a very low cost. Based on the Transformer architecture, it enhances usability and safety through supervised fine-tuning (SFT) and reinforcement learning from human feedback (RLHF). Its instruction-tuned version is optimized for multilingual dialogue and outperforms many open-source and closed chat models on various industry benchmarks. Knowledge cutoff date is December 2023."
  },
-  "Meta-Llama-4-Maverick-17B-128E-Instruct-FP8": {
-    "description": "Llama 4 Maverick: A large-scale model based on Mixture-of-Experts, offering an efficient expert activation strategy for superior inference performance."
-  },
  "MiniMax-M1": {
    "description": "A brand-new self-developed inference model. Globally leading: 80K reasoning chains x 1M input, performance comparable to top overseas models."
  },
@@ -275,9 +257,6 @@
  "Pro/deepseek-ai/DeepSeek-V3": {
    "description": "DeepSeek-V3 is a mixed expert (MoE) language model with 671 billion parameters, utilizing multi-head latent attention (MLA) and the DeepSeekMoE architecture, combined with a load balancing strategy without auxiliary loss to optimize inference and training efficiency. Pre-trained on 14.8 trillion high-quality tokens and fine-tuned with supervision and reinforcement learning, DeepSeek-V3 outperforms other open-source models and approaches leading closed-source models."
  },
-  "Pro/deepseek-ai/DeepSeek-V3.1": {
-    "description": "DeepSeek-V3.1 is a hybrid large language model released by DeepSeek AI, featuring multiple significant upgrades over its predecessor. A key innovation of this model is the integration of both \"Thinking Mode\" and \"Non-thinking Mode,\" allowing users to flexibly switch between modes by adjusting chat templates to suit different task requirements. Through dedicated post-training optimization, V3.1 significantly enhances performance in tool invocation and Agent tasks, better supporting external search tools and executing complex multi-step tasks. Based on DeepSeek-V3.1-Base, it employs a two-stage long-text extension method to greatly increase training data volume, improving its handling of long documents and extensive code. As an open-source model, DeepSeek-V3.1 demonstrates capabilities comparable to top closed-source models across benchmarks in coding, mathematics, and reasoning. Its Mixture of Experts (MoE) architecture maintains a massive model capacity while effectively reducing inference costs."
-  },
  "Pro/moonshotai/Kimi-K2-Instruct": {
    "description": "Kimi K2 is a MoE architecture base model with exceptional coding and agent capabilities, featuring 1 trillion total parameters and 32 billion activated parameters. In benchmark tests across general knowledge reasoning, programming, mathematics, and agent tasks, the K2 model outperforms other mainstream open-source models."
  },
@@ -353,21 +332,12 @@
  "Qwen/Qwen3-30B-A3B-Instruct-2507": {
    "description": "Qwen3-30B-A3B-Instruct-2507 is an updated version of the Qwen3-30B-A3B non-thinking mode. It is a Mixture of Experts (MoE) model with a total of 30.5 billion parameters and 3.3 billion active parameters. The model features key enhancements across multiple areas, including significant improvements in instruction following, logical reasoning, text comprehension, mathematics, science, coding, and tool usage. Additionally, it has made substantial progress in covering long-tail multilingual knowledge and better aligns with user preferences in subjective and open-ended tasks, enabling it to generate more helpful responses and higher-quality text. Furthermore, its long-text comprehension capability has been extended to 256K tokens. This model supports only the non-thinking mode and does not generate `<think></think>` tags in its output."
  },
-  "Qwen/Qwen3-30B-A3B-Thinking-2507": {
-    "description": "Qwen3-30B-A3B-Thinking-2507 is the latest “thinking” model in the Qwen3 series released by Alibaba’s Tongyi Qianwen team. As a mixture-of-experts (MoE) model with 30.5 billion total parameters and 3.3 billion active parameters, it is designed to improve capabilities for handling complex tasks. The model demonstrates significant performance gains on academic benchmarks requiring logical reasoning, mathematics, science, programming, and domain expertise. At the same time, its general abilities—such as instruction following, tool use, text generation, and alignment with human preferences—have been substantially enhanced. The model natively supports long-context understanding of 256K tokens and can scale up to 1 million tokens. This version is tailored for “thinking mode,” intended to solve highly complex problems through detailed step-by-step reasoning, and it also exhibits strong agent capabilities."
-  },
  "Qwen/Qwen3-32B": {
    "description": "Qwen3 is a next-generation model with significantly enhanced capabilities, achieving industry-leading levels in reasoning, general tasks, agent functions, and multilingual support, with a switchable thinking mode."
  },
  "Qwen/Qwen3-8B": {
    "description": "Qwen3 is a next-generation model with significantly enhanced capabilities, achieving industry-leading levels in reasoning, general tasks, agent functions, and multilingual support, with a switchable thinking mode."
  },
-  "Qwen/Qwen3-Coder-30B-A3B-Instruct": {
-    "description": "Qwen3-Coder-30B-A3B-Instruct is a code model in the Qwen3 series developed by Alibaba's Tongyi Qianwen team. As a streamlined and optimized model, it focuses on enhancing code-handling capabilities while maintaining high performance and efficiency. The model demonstrates notable advantages among open-source models on complex tasks such as agentic coding, automated browser operations, and tool invocation. It natively supports a long context of 256K tokens and can be extended up to 1M tokens, enabling better understanding and processing at the codebase level. Additionally, the model provides robust agentic coding support for platforms like Qwen Code and CLINE, and it employs a dedicated function-calling format."
-  },
-  "Qwen/Qwen3-Coder-480B-A35B-Instruct": {
-    "description": "Qwen3-Coder-480B-A35B-Instruct, released by Alibaba, is the most agentic code model to date. It is a mixture-of-experts (MoE) model with 480 billion total parameters and 35 billion active parameters, striking a balance between efficiency and performance. The model natively supports a 256K (~260k) token context window and can be extended to 1,000,000 tokens through extrapolation methods such as YaRN, enabling it to handle large codebases and complex programming tasks. Qwen3-Coder is designed for agent-style coding workflows: it not only generates code but can autonomously interact with development tools and environments to solve complex programming problems. On multiple benchmarks for coding and agent tasks, this model achieves top-tier results among open-source models, with performance comparable to leading models like Claude Sonnet 4."
-  },
  "Qwen2-72B-Instruct": {
    "description": "Qwen2 is the latest series of the Qwen model, supporting 128k context. Compared to the current best open-source models, Qwen2-72B significantly surpasses leading models in natural language understanding, knowledge, coding, mathematics, and multilingual capabilities."
  },
@@ -398,9 +368,6 @@
  "Qwen3-235B": {
    "description": "Qwen3-235B-A22B is a Mixture of Experts (MoE) model that introduces a \"Hybrid Reasoning Mode,\" allowing users to seamlessly switch between \"Thinking Mode\" and \"Non-Thinking Mode.\" It supports understanding and reasoning in 119 languages and dialects and possesses powerful tool invocation capabilities. In comprehensive benchmarks covering overall ability, coding and mathematics, multilingual proficiency, knowledge, and reasoning, it competes with leading large models on the market such as DeepSeek R1, OpenAI o1, o3-mini, Grok 3, and Google Gemini 2.5 Pro."
  },
-  "Qwen3-235B-A22B-Instruct-2507-FP8": {
-    "description": "Qwen3 235B A22B Instruct 2507: A model optimized for advanced reasoning and dialogue instructions, featuring a mixture-of-experts architecture to maintain inference efficiency at large scale."
-  },
  "Qwen3-32B": {
    "description": "Qwen3-32B is a dense model that introduces a \"Hybrid Reasoning Mode,\" enabling users to seamlessly switch between \"Thinking Mode\" and \"Non-Thinking Mode.\" Thanks to architectural improvements, increased training data, and more efficient training methods, its overall performance is comparable to that of Qwen2.5-72B."
  },
@@ -857,9 +824,6 @@
  "deepseek-ai/DeepSeek-V3": {
    "description": "DeepSeek-V3 is a mixture of experts (MoE) language model with 671 billion parameters, utilizing multi-head latent attention (MLA) and the DeepSeekMoE architecture, combined with a load balancing strategy that does not rely on auxiliary loss, optimizing inference and training efficiency. Pre-trained on 14.8 trillion high-quality tokens and fine-tuned with supervision and reinforcement learning, DeepSeek-V3 outperforms other open-source models and approaches leading closed-source models in performance."
  },
-  "deepseek-ai/DeepSeek-V3.1": {
-    "description": "DeepSeek-V3.1 is a hybrid large language model released by DeepSeek AI, featuring multiple significant upgrades over its predecessor. A key innovation of this model is the integration of both \"Thinking Mode\" and \"Non-thinking Mode,\" allowing users to flexibly switch between modes by adjusting chat templates to suit different task requirements. Through dedicated post-training optimization, V3.1 significantly enhances performance in tool invocation and Agent tasks, better supporting external search tools and executing complex multi-step tasks. Based on DeepSeek-V3.1-Base, it employs a two-stage long-text extension method to greatly increase training data volume, improving its handling of long documents and extensive code. As an open-source model, DeepSeek-V3.1 demonstrates capabilities comparable to top closed-source models across benchmarks in coding, mathematics, and reasoning. Its Mixture of Experts (MoE) architecture maintains a massive model capacity while effectively reducing inference costs."
-  },
  "deepseek-ai/deepseek-llm-67b-chat": {
    "description": "DeepSeek 67B is an advanced model trained for highly complex conversations."
  },
@@ -930,7 +894,7 @@
    "description": "DeepSeek R1 full version, with 671B parameters, supporting real-time online search, offering enhanced understanding and generation capabilities."
  },
  "deepseek-reasoner": {
-    "description": "DeepSeek V3.1 Thinking Mode. Before outputting the final answer, the model first generates a chain of thought to improve the accuracy of the final response."
+    "description": "The reasoning model launched by DeepSeek. Before outputting the final answer, the model first provides a chain of thought to enhance the accuracy of the final response."
  },
  "deepseek-v2": {
    "description": "DeepSeek V2 is an efficient Mixture-of-Experts language model, suitable for cost-effective processing needs."
@@ -944,18 +908,12 @@
  "deepseek-v3-0324": {
    "description": "DeepSeek-V3-0324 is a 671B parameter MoE model, excelling in programming and technical capabilities, contextual understanding, and long text processing."
  },
-  "deepseek-v3.1": {
-    "description": "DeepSeek-V3.1 is a newly launched hybrid reasoning model by DeepSeek, supporting two reasoning modes: thinking and non-thinking. It offers higher thinking efficiency compared to DeepSeek-R1-0528. With post-training optimization, the use of Agent tools and agent task performance have been significantly enhanced. It supports a 128k context window and an output length of up to 64k tokens."
-  },
  "deepseek/deepseek-chat-v3-0324": {
    "description": "DeepSeek V3 is a 685B parameter expert mixture model, the latest iteration in the DeepSeek team's flagship chat model series.\n\nIt inherits from the [DeepSeek V3](/deepseek/deepseek-chat-v3) model and performs excellently across various tasks."
  },
  "deepseek/deepseek-chat-v3-0324:free": {
    "description": "DeepSeek V3 is a 685B parameter expert mixture model, the latest iteration in the DeepSeek team's flagship chat model series.\n\nIt inherits from the [DeepSeek V3](/deepseek/deepseek-chat-v3) model and performs excellently across various tasks."
  },
-  "deepseek/deepseek-chat-v3.1": {
-    "description": "DeepSeek-V3.1 is a large hybrid reasoning model supporting 128K long context and efficient mode switching, delivering outstanding performance and speed in tool invocation, code generation, and complex reasoning tasks."
-  },
  "deepseek/deepseek-r1": {
    "description": "DeepSeek-R1 significantly enhances model reasoning capabilities with minimal labeled data. Before outputting the final answer, the model first provides a chain of thought to improve the accuracy of the final response."
  },
@@ -1145,27 +1103,12 @@
  "flux-dev": {
    "description": "FLUX.1 [dev] is an open-source weight and fine-tuned model for non-commercial applications. It maintains image quality and instruction-following capabilities close to the FLUX professional version while offering higher operational efficiency. Compared to standard models of the same size, it is more resource-efficient."
  },
-  "flux-kontext-max": {
-    "description": "State-of-the-art contextual image generation and editing — combining text and images for precise, coherent results."
-  },
-  "flux-kontext-pro": {
-    "description": "State-of-the-art contextual image generation and editing — combining text and images for precise, coherent results."
-  },
  "flux-kontext/dev": {
    "description": "FLUX.1 model focused on image editing tasks, supporting both text and image inputs."
  },
  "flux-merged": {
    "description": "The FLUX.1-merged model combines the deep features explored during the development phase of “DEV” with the high-speed execution advantages represented by “Schnell.” This integration not only pushes the model's performance boundaries but also broadens its application scope."
  },
-  "flux-pro": {
-    "description": "A top-tier commercial AI image generation model — delivering unparalleled image quality and a wide variety of outputs."
-  },
-  "flux-pro-1.1": {
-    "description": "Upgraded professional-grade AI image generation model — delivers outstanding image quality and precise adherence to prompts."
-  },
-  "flux-pro-1.1-ultra": {
-    "description": "Ultra-high-resolution AI image generation — supports up to 4-megapixel output, producing ultra-high-definition images in under 10 seconds."
-  },
  "flux-pro/kontext": {
    "description": "FLUX.1 Kontext [pro] can process text and reference images as input, seamlessly enabling targeted local edits and complex overall scene transformations."
  },
@@ -1250,12 +1193,6 @@
  "gemini-2.5-flash": {
    "description": "Gemini 2.5 Flash is Google's most cost-effective model, offering comprehensive capabilities."
  },
-  "gemini-2.5-flash-image-preview": {
-    "description": "Nano Banana is Google's latest, fastest, and most efficient native multimodal model, enabling you to generate and edit images through conversation."
-  },
-  "gemini-2.5-flash-image-preview:image": {
-    "description": "Nano Banana is Google's latest, fastest, and most efficient native multimodal model, enabling you to generate and edit images through conversation."
-  },
  "gemini-2.5-flash-lite": {
    "description": "Gemini 2.5 Flash-Lite is Google's smallest and most cost-effective model, designed for large-scale use."
  },
@@ -1358,9 +1295,6 @@
  "glm-4.5-x": {
    "description": "The high-speed version of GLM-4.5, combining strong performance with generation speeds up to 100 tokens per second."
  },
-  "glm-4.5v": {
-    "description": "Zhipu's next-generation visual reasoning model is built on a Mixture-of-Experts (MoE) architecture. With 106B total parameters and 12B activated parameters, it achieves state-of-the-art performance among open-source multimodal models of similar scale across various benchmarks, supporting common tasks such as image, video, document understanding, and GUI-related tasks."
-  },
  "glm-4v": {
    "description": "GLM-4V provides strong image understanding and reasoning capabilities, supporting various visual tasks."
  },
@@ -1397,12 +1331,6 @@
  "google/gemini-2.5-flash": {
    "description": "Gemini 2.5 Flash is Google's most advanced flagship model, designed for advanced reasoning, coding, mathematics, and scientific tasks. It features built-in \"thinking\" capabilities, enabling it to provide responses with higher accuracy and more nuanced contextual understanding.\n\nNote: This model has two variants: thinking and non-thinking. Output pricing varies significantly depending on whether the thinking capability is activated. If you choose the standard variant (without the \":thinking\" suffix), the model will explicitly avoid generating thinking tokens.\n\nTo leverage the thinking capability and receive thinking tokens, you must select the \":thinking\" variant, which incurs higher pricing for thinking outputs.\n\nAdditionally, Gemini 2.5 Flash can be configured via the \"max tokens for reasoning\" parameter, as detailed in the documentation (https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning)."
  },
-  "google/gemini-2.5-flash-image-preview": {
-    "description": "Gemini 2.5 Flash experimental model, supporting image generation."
-  },
-  "google/gemini-2.5-flash-image-preview:free": {
-    "description": "Gemini 2.5 Flash experimental model, supporting image generation."
-  },
  "google/gemini-2.5-flash-preview": {
    "description": "Gemini 2.5 Flash is Google's most advanced flagship model, designed for advanced reasoning, coding, mathematics, and scientific tasks. It includes built-in 'thinking' capabilities that allow it to provide responses with higher accuracy and detailed context handling.\n\nNote: This model has two variants: thinking and non-thinking. Output pricing varies significantly based on whether the thinking capability is activated. If you choose the standard variant (without the ':thinking' suffix), the model will explicitly avoid generating thinking tokens.\n\nTo leverage the thinking capability and receive thinking tokens, you must select the ':thinking' variant, which will incur higher thinking output pricing.\n\nAdditionally, Gemini 2.5 Flash can be configured via the 'maximum tokens for reasoning' parameter, as described in the documentation (https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning)."
  },
@@ -1506,7 +1434,7 @@
    "description": "GPT-4.1 nano provides a balance of intelligence, speed, and cost, making it an appealing model for numerous applications."
  },
  "gpt-4.5-preview": {
-    "description": "GPT-4.5-preview is the latest general-purpose model, offering extensive world knowledge and an improved understanding of user intent. It excels at creative tasks and agent-style planning. The model's knowledge cutoff is October 2023."
+    "description": "The research preview of GPT-4.5, our largest and most powerful GPT model to date. It possesses extensive world knowledge and better understands user intent, excelling in creative tasks and autonomous planning. GPT-4.5 accepts both text and image inputs and generates text outputs (including structured outputs). It supports key developer features such as function calling, batch API, and streaming output. GPT-4.5 particularly shines in tasks that require creativity, open-ended thinking, and dialogue, such as writing, learning, or exploring new ideas. Knowledge cutoff date is October 2023."
  },
  "gpt-4o": {
    "description": "ChatGPT-4o is a dynamic model that updates in real-time to stay current with the latest version. It combines powerful language understanding and generation capabilities, making it suitable for large-scale applications, including customer service, education, and technical support."
@@ -1574,9 +1502,6 @@
  "gpt-oss": {
    "description": "GPT-OSS 20B is an open-source large language model released by OpenAI, utilizing MXFP4 quantization technology. It is suitable for running on high-end consumer GPUs or Apple Silicon Macs. This model excels in dialogue generation, code writing, and reasoning tasks, supporting function calls and tool usage."
  },
-  "gpt-oss-120b": {
-    "description": "GPT-OSS-120B MXFP4 quantized Transformer architecture, delivering strong performance even under resource constraints."
-  },
  "gpt-oss:120b": {
    "description": "GPT-OSS 120B is a large open-source language model released by OpenAI, employing MXFP4 quantization technology as a flagship model. It requires multi-GPU or high-performance workstation environments to operate and delivers outstanding performance in complex reasoning, code generation, and multilingual processing, supporting advanced function calls and tool integration."
  },
@@ -1604,9 +1529,6 @@
  "grok-4": {
    "description": "Our latest and most powerful flagship model, excelling in natural language processing, mathematical computation, and reasoning — a perfect all-rounder."
  },
-  "grok-code-fast-1": {
-    "description": "We are excited to introduce grok-code-fast-1, a fast and cost-effective inference model that excels in agent coding."
-  },
  "gryphe/mythomax-l2-13b": {
    "description": "MythoMax l2 13B is a language model that combines creativity and intelligence by merging multiple top models."
  },
@@ -1715,18 +1637,9 @@
  "image-01-live": {
    "description": "An image generation model with delicate visual performance, supporting text-to-image generation and style setting."
  },
-  "imagen-4.0-fast-generate-001": {
-    "description": "Imagen 4th-generation text-to-image model, Fast version"
-  },
-  "imagen-4.0-generate-001": {
-    "description": "Imagen 4th-generation text-to-image model series"
-  },
  "imagen-4.0-generate-preview-06-06": {
    "description": "Imagen 4th generation text-to-image model series"
  },
-  "imagen-4.0-ultra-generate-001": {
-    "description": "Imagen 4th-generation text-to-image model, Ultra version"
-  },
  "imagen-4.0-ultra-generate-preview-06-06": {
    "description": "Imagen 4th generation text-to-image model series Ultra version"
  },
@@ -1766,9 +1679,6 @@
  "kimi-k2-0711-preview": {
    "description": "kimi-k2 is a MoE architecture base model with powerful coding and agent capabilities, totaling 1 trillion parameters with 32 billion active parameters. In benchmark tests across general knowledge reasoning, programming, mathematics, and agent tasks, the K2 model outperforms other mainstream open-source models."
  },
-  "kimi-k2-turbo-preview": {
-    "description": "Kimi-K2 is a Mixture-of-Experts (MoE) foundation model with exceptional coding and agent capabilities, featuring 1T total parameters and 32B activated parameters. In benchmark evaluations across core categories — general knowledge reasoning, programming, mathematics, and agent tasks — the K2 model outperforms other leading open-source models."
-  },
  "kimi-latest": {
    "description": "The Kimi Smart Assistant product uses the latest Kimi large model, which may include features that are not yet stable. It supports image understanding and will automatically select the 8k/32k/128k model as the billing model based on the length of the request context."
  },
@@ -1853,9 +1763,6 @@
  "llava:34b": {
    "description": "LLaVA is a multimodal model that combines a visual encoder with Vicuna for powerful visual and language understanding."
  },
-  "magistral-medium-latest": {
-    "description": "Magistral Medium 1.1 is a state-of-the-art inference model released by Mistral AI in July 2025."
-  },
  "mathstral": {
    "description": "MathΣtral is designed for scientific research and mathematical reasoning, providing effective computational capabilities and result interpretation."
  },
@@ -2187,7 +2094,7 @@
    "description": "o1-mini is a fast and cost-effective reasoning model designed for programming, mathematics, and scientific applications. This model features a 128K context and has a knowledge cutoff date of October 2023."
  },
  "o1-preview": {
-    "description": "Focused on advanced reasoning and solving complex problems, including mathematical and scientific tasks. Ideal for applications that require deep contextual understanding and autonomous workflows."
+    "description": "o1 is OpenAI's new reasoning model, suitable for complex tasks that require extensive general knowledge. This model features a 128K context and has a knowledge cutoff date of October 2023."
  },
  "o1-pro": {
    "description": "The o1 series models are trained with reinforcement learning to think before answering and perform complex reasoning tasks. The o1-pro model uses more computational resources for deeper thinking, consistently delivering higher-quality responses."
@@ -2306,14 +2213,8 @@
  "qwen-coder-turbo-latest": {
    "description": "The Tongyi Qianwen Coder model."
  },
-  "qwen-flash": {
-    "description": "The Tongyi Qianwen Flash series offers the fastest, most cost-effective models, suitable for simple tasks."
-  },
  "qwen-image": {
-    "description": "Qwen-Image is a general-purpose image generation model that supports a wide range of artistic styles and is particularly adept at rendering complex text, especially Chinese and English. The model supports multi-line layouts, paragraph-level text generation, and fine-grained detail rendering, enabling complex mixed text-and-image layout designs."
-  },
-  "qwen-image-edit": {
-    "description": "A professional image-editing model released by the Qwen team, supporting semantic editing and appearance editing. It can precisely edit Chinese and English text and perform high-quality image edits such as style transfer and object rotation."
+    "description": "A powerful raw image model from the Qwen team, featuring impressive Chinese text generation capabilities and diverse visual styles."
  },
  "qwen-long": {
    "description": "Qwen is a large-scale language model that supports long text contexts and dialogue capabilities based on long documents and multiple documents."
@@ -2340,7 +2241,7 @@
    "description": "Qwen Plus is an enhanced large-scale language model supporting input in various languages including Chinese and English."
  },
  "qwen-turbo": {
-    "description": "Tongyi Qianwen Turbo will no longer receive updates; it is recommended to switch to Tongyi Qianwen Flash. Tongyi Qianwen is an ultra-large language model that supports input in Chinese, English, and other languages."
+    "description": "Qwen Turbo is a large-scale language model supporting input in various languages including Chinese and English."
  },
  "qwen-vl-chat-v1": {
    "description": "Qwen VL supports flexible interaction methods, including multi-image, multi-turn Q&A, and creative capabilities."
@@ -2657,15 +2558,9 @@
  "step-2x-large": {
    "description": "Step Star next-generation image generation model, focusing on image generation tasks. It can generate high-quality images based on user-provided text descriptions. The new model produces more realistic textures and stronger Chinese and English text generation capabilities."
  },
-  "step-3": {
-    "description": "This model has powerful visual perception and advanced reasoning capabilities. It can accurately handle complex cross-domain knowledge comprehension, perform integrated analysis of mathematical and visual information, and solve a wide range of visual analysis tasks encountered in everyday life."
-  },
  "step-r1-v-mini": {
    "description": "This model is a powerful reasoning model with strong image understanding capabilities, able to process both image and text information, generating text content after deep reasoning. It excels in visual reasoning while also possessing first-tier capabilities in mathematics, coding, and text reasoning. The context length is 100k."
  },
-  "stepfun-ai/step3": {
-    "description": "Step3 is a cutting-edge multimodal reasoning model released by StepFun. It is built on a mixture-of-experts (MoE) architecture with 321B total parameters and 38B active parameters. The model adopts an end-to-end design to minimize decoding cost while delivering top-tier performance in visual-language reasoning. Through the combined design of Multi-Matrix Factorized Attention (MFA) and Attention-FFN Decoupling (AFD), Step3 maintains exceptional efficiency on both high-end and low-end accelerators. During pretraining, Step3 processed over 20 trillion text tokens and 4 trillion image-text mixed tokens, covering more than a dozen languages. The model achieves leading performance among open-source models across benchmarks in mathematics, code, and multimodal tasks."
-  },
  "taichu_llm": {
    "description": "The ZD Taichu language model possesses strong language understanding capabilities and excels in text creation, knowledge Q&A, code programming, mathematical calculations, logical reasoning, sentiment analysis, and text summarization. It innovatively combines large-scale pre-training with rich knowledge from multiple sources, continuously refining algorithmic techniques and absorbing new knowledge in vocabulary, structure, grammar, and semantics from vast text data, resulting in an evolving model performance. It provides users with more convenient information and services, as well as a more intelligent experience."
  },
@@ -2693,9 +2588,18 @@
  "thudm/glm-4-9b-chat": {
    "description": "The open-source version of the latest generation pre-trained model from the GLM-4 series released by Zhiyuan AI."
  },
+  "thudm/glm-4-9b:free": {
+    "description": "GLM-4-9B-0414 is a 9 billion parameter language model in the GLM-4 series developed by THUDM. GLM-4-9B-0414 is trained using the same reinforcement learning and alignment strategies as its larger 32B counterpart, achieving high performance relative to its scale, making it suitable for resource-constrained deployments that still require strong language understanding and generation capabilities."
+  },
  "thudm/glm-z1-32b": {
    "description": "GLM-Z1-32B-0414 is an enhanced reasoning variant of GLM-4-32B, built for deep mathematics, logic, and code-oriented problem solving. It applies extended reinforcement learning (task-specific and based on general pairwise preferences) to improve performance on complex multi-step tasks. Compared to the base GLM-4-32B model, Z1 significantly enhances capabilities in structured reasoning and formal domains.\n\nThis model supports enforcing 'thinking' steps through prompt engineering and provides improved coherence for long-format outputs. It is optimized for agent workflows and supports long context (via YaRN), JSON tool calls, and fine-grained sampling configurations for stable reasoning. It is ideal for use cases requiring thoughtful, multi-step reasoning or formal derivation."
  },
+  "thudm/glm-z1-32b:free": {
+    "description": "GLM-Z1-32B-0414 is an enhanced reasoning variant of GLM-4-32B, built for deep mathematics, logic, and code-oriented problem solving. It applies extended reinforcement learning (task-specific and based on general pairwise preferences) to improve performance on complex multi-step tasks. Compared to the base GLM-4-32B model, Z1 significantly enhances capabilities in structured reasoning and formal domains.\n\nThis model supports enforcing 'thinking' steps through prompt engineering and provides improved coherence for long-format outputs. It is optimized for agent workflows and supports long context (via YaRN), JSON tool calls, and fine-grained sampling configurations for stable reasoning. It is ideal for use cases requiring thoughtful, multi-step reasoning or formal derivation."
+  },
+  "thudm/glm-z1-9b:free": {
+    "description": "GLM-Z1-9B-0414 is a 9 billion parameter language model in the GLM-4 series developed by THUDM. It employs techniques initially applied to the larger GLM-Z1 model, including extended reinforcement learning, pairwise ranking alignment, and training for reasoning-intensive tasks such as mathematics, coding, and logic. Despite its smaller scale, it demonstrates strong performance on general reasoning tasks and outperforms many open-source models at its weight level."
+  },
  "thudm/glm-z1-rumination-32b": {
    "description": "THUDM: GLM Z1 Rumination 32B is a deep reasoning model with 32 billion parameters in the GLM-4-Z1 series, optimized for complex, open-ended tasks that require prolonged thought. It builds upon glm-4-32b-0414, adding additional reinforcement learning stages and multi-stage alignment strategies, introducing a 'rumination' capability designed to simulate extended cognitive processing. This includes iterative reasoning, multi-hop analysis, and tool-enhanced workflows such as search, retrieval, and citation-aware synthesis.\n\nThe model excels in research-style writing, comparative analysis, and complex question answering. It supports function calls for search and navigation primitives (`search`, `click`, `open`, `finish`), allowing it to be used in agent-based pipelines. The rumination behavior is shaped by rule-based rewards and a delayed decision-making mechanism, controlled by multi-round cycles, benchmarked against deep research frameworks like OpenAI's internal alignment stack. This variant is suitable for scenarios requiring depth over speed."
  },
@@ -2803,8 +2707,5 @@
  },
  "zai-org/GLM-4.5-Air": {
    "description": "GLM-4.5-Air is a foundational model designed specifically for agent applications, using a Mixture-of-Experts (MoE) architecture. It is deeply optimized for tool invocation, web browsing, software engineering, and front-end programming, supporting seamless integration with code agents like Claude Code and Roo Code. GLM-4.5 employs a hybrid inference mode, adaptable to complex reasoning and everyday use scenarios."
-  },
-  "zai-org/GLM-4.5V": {
-    "description": "GLM-4.5V is the latest-generation vision-language model (VLM) released by Zhipu AI. It is built on the flagship text model GLM-4.5-Air, which has 106B total parameters and 12B active parameters, and adopts a Mixture-of-Experts (MoE) architecture to deliver outstanding performance at reduced inference cost. Technically, GLM-4.5V continues the trajectory of GLM-4.1V-Thinking and introduces innovations such as three-dimensional rotary position encoding (3D-RoPE), significantly improving perception and reasoning of three-dimensional spatial relationships. Through optimizations across pretraining, supervised fine-tuning, and reinforcement learning stages, the model can handle a wide range of visual content including images, video, and long documents, and has achieved top-tier performance among comparable open-source models across 41 public multimodal benchmarks. The model also adds a \"Thinking Mode\" toggle that lets users flexibly choose between fast responses and deep reasoning to balance efficiency and effectiveness."
  }
 }
@@ -11,9 +11,6 @@
  "aihubmix": {
    "description": "AiHubMix provides access to various AI models through a unified API interface."
  },
-  "akashchat": {
-    "description": "Akash is a permissionless cloud resource marketplace with competitive pricing compared to traditional cloud providers."
-  },
  "anthropic": {
    "description": "Anthropic is a company focused on AI research and development, offering a range of advanced language models such as Claude 3.5 Sonnet, Claude 3 Sonnet, Claude 3 Opus, and Claude 3 Haiku. These models achieve an ideal balance between intelligence, speed, and cost, suitable for various applications from enterprise workloads to rapid-response scenarios. Claude 3.5 Sonnet, as their latest model, has excelled in multiple evaluations while maintaining a high cost-performance ratio."
  },
@@ -29,9 +26,6 @@
  "bedrock": {
    "description": "Bedrock is a service provided by Amazon AWS, focusing on delivering advanced AI language and visual models for enterprises. Its model family includes Anthropic's Claude series, Meta's Llama 3.1 series, and more, offering a range of options from lightweight to high-performance, supporting tasks such as text generation, conversation, and image processing for businesses of varying scales and needs."
  },
-  "bfl": {
-    "description": "A leading, cutting-edge artificial intelligence research lab building the visual infrastructure of tomorrow."
-  },
  "cloudflare": {
    "description": "Run serverless GPU-powered machine learning models on Cloudflare's global network."
  },
@@ -92,12 +86,6 @@
  "moonshot": {
    "description": "Moonshot is an open-source platform launched by Beijing Dark Side Technology Co., Ltd., providing various natural language processing models with a wide range of applications, including but not limited to content creation, academic research, intelligent recommendations, and medical diagnosis, supporting long text processing and complex generation tasks."
  },
-  "nebius": {
-    "description": "Nebius provides high-performance infrastructure for global AI innovators by building large-scale GPU clusters and vertically integrated cloud platforms."
-  },
-  "newapi": {
-    "description": "Open-source unified forwarding platform aggregating multiple AI services"
-  },
  "novita": {
    "description": "Novita AI is a platform providing a variety of large language models and AI image generation API services, flexible, reliable, and cost-effective. It supports the latest open-source models like Llama3 and Mistral, offering a comprehensive, user-friendly, and auto-scaling API solution for generative AI application development, suitable for the rapid growth of AI startups."
  },
@@ -237,10 +237,6 @@
      "title": "Limit History Message Count",
      "unlimited": "Unlimited history message count"
    },
-    "enableStreaming": {
-      "desc": "Enable streaming output to display responses in real-time. When disabled, only the complete response is shown.",
-      "title": "Enable Streaming Output"
-    },
    "historyCount": {
      "desc": "Number of historical messages carried with each request",
      "title": "Attached History Message Count"
@@ -52,11 +52,7 @@
    "thinking": {
      "title": "Interruptor de pensamiento profundo"
    },
-    "title": "Funcionalidad de extensión del modelo",
-    "urlContext": {
-      "desc": "Al activarlo, se analizarán automáticamente los enlaces web para obtener el contenido contextual real de la página",
-      "title": "Extraer contenido del enlace web"
-    }
+    "title": "Funcionalidad de extensión del modelo"
  },
  "history": {
    "title": "El asistente solo recordará los últimos {{count}} mensajes"
@@ -129,7 +125,6 @@
      "inputWriteCached": "Escritura en caché de entrada",
      "output": "Salida",
      "outputAudio": "Salida de audio",
-      "outputImage": "Salida de imagen",
      "outputText": "Salida de texto",
      "outputTitle": "Detalles de salida",
      "reasoning": "Razonamiento profundo",
@@ -273,8 +268,7 @@
    "clientMode": {
      "actionFiletip": "Subir archivo",
      "actionTooltip": "Subir",
-      "disabled": "El modelo actual no soporta reconocimiento visual ni análisis de archivos, por favor cambie de modelo para usar esta función",
-      "visionNotSupported": "El modelo actual no admite reconocimiento visual, por favor cambie de modelo para usar esta función"
+      "disabled": "El modelo actual no soporta reconocimiento visual ni análisis de archivos, por favor cambie de modelo para usar esta función"
    },
    "preview": {
      "prepareTasks": "Preparando fragmentos...",
@@ -32,7 +32,6 @@
  "blog": "Blog de productos",
  "branching": "Crear subtemas",
  "branchingDisable": "La función de «subtemas» solo está disponible en la versión del servidor. Si necesita esta función, cambie al modo de implementación del servidor o utilice LobeChat Cloud.",
-  "branchingRequiresSavedTopic": "El tema actual no está guardado, guárdalo para poder usar la función de subtemas",
  "cancel": "Cancelar",
  "changelog": "Registro de cambios",
  "clientDB": {
@@ -183,13 +182,6 @@
    "title": "¿Te gusta nuestro producto?"
  },
  "fullscreen": "Pantalla completa",
-  "geminiImageChineseWarning": {
-    "content": "Nano Banana tiene una probabilidad de fallo al generar imágenes usando chino. Se recomienda usar inglés para obtener mejores resultados.",
-    "continueGenerate": "Continuar generando",
-    "continueSend": "Continuar enviando",
-    "doNotShowAgain": "No mostrar de nuevo",
-    "title": "Aviso de entrada en chino"
-  },
  "historyRange": "Rango de historial",
  "import": "Importar",
  "importData": "Importar datos",
@@ -1,9 +1,4 @@
 {
-  "ArgsInput": {
-    "addArgument": "Añadir argumento",
-    "argumentPlaceholder": "Argumento {{index}}",
-    "enterFirstArgument": "Introduce el primer argumento..."
-  },
  "DragUpload": {
    "dragDesc": "Arrastra los archivos aquí, se admite la carga de múltiples imágenes.",
    "dragFileDesc": "Arrastra imágenes y archivos aquí, se admite la carga de múltiples imágenes y archivos.",
@@ -73,18 +68,6 @@
  "GoBack": {
    "back": "Regresar"
  },
-  "HtmlPreview": {
-    "actions": {
-      "download": "Descargar",
-      "preview": "Vista previa"
-    },
-    "iframeTitle": "Vista previa HTML",
-    "mode": {
-      "code": "Código",
-      "preview": "Vista previa"
-    },
-    "title": "Vista previa HTML"
-  },
  "ImageUpload": {
    "actions": {
      "changeImage": "Haz clic para cambiar la imagen",
@@ -142,12 +125,6 @@
    },
    "progress": {
      "uploadingWithCount": "{{completed}}/{{total}} subidas"
-    },
-    "validation": {
-      "fileSizeExceeded": "El tamaño del archivo supera el límite permitido",
-      "fileSizeExceededDetail": "{{fileName}} ({{actualSize}}) supera el tamaño máximo permitido de {{maxSize}}",
-      "fileSizeExceededMultiple": "{{count}} archivos superan el tamaño máximo permitido de {{maxSize}}: {{fileList}}",
-      "imageCountExceeded": "Se ha superado el límite de imágenes permitido"
    }
  },
  "OllamaSetupGuide": {
@@ -85,17 +85,6 @@
    "CreateMessageError": "Lo sentimos, el mensaje no se pudo enviar correctamente. Por favor, copia el contenido y vuelve a enviarlo. Después de actualizar la página, este mensaje no se conservará.",
    "ExceededContextWindow": "El contenido de la solicitud actual excede la longitud que el modelo puede procesar. Por favor, reduzca la cantidad de contenido y vuelva a intentarlo.",
    "FreePlanLimit": "Actualmente eres un usuario gratuito y no puedes utilizar esta función. Por favor, actualiza a un plan de pago para seguir utilizando.",
-    "GoogleAIBlockReason": {
-      "BLOCKLIST": "Su contenido contiene términos prohibidos. Revíselo y modifique su entrada antes de intentarlo de nuevo.",
-      "IMAGE_SAFETY": "La generación de la imagen fue bloqueada por motivos de seguridad. Intente modificar su petición de generación de imágenes.",
-      "LANGUAGE": "El idioma que está usando no está soportado por el momento. Por favor, intente en inglés u otro idioma compatible.",
-      "OTHER": "El contenido fue bloqueado por una razón desconocida. Intente reformular su solicitud.",
-      "PROHIBITED_CONTENT": "Su petición podría contener contenido prohibido. Ajuste su solicitud para garantizar que cumple las normas de uso.",
-      "RECITATION": "Su contenido fue bloqueado por posibles problemas de derechos de autor. Intente usar contenido original o reformule su solicitud.",
-      "SAFETY": "Su contenido fue bloqueado por razones de seguridad. Ajuste su solicitud para evitar incluir material potencialmente dañino o inapropiado.",
-      "SPII": "Su contenido podría contener información personal sensible. Para proteger la privacidad, elimine la información sensible y vuelva a intentarlo.",
-      "default": "Contenido bloqueado: {{blockReason}}. Ajuste su solicitud y vuelva a intentarlo."
-    },
    "InsufficientQuota": "Lo sentimos, la cuota de esta clave ha alcanzado su límite. Por favor, verifique si el saldo de su cuenta es suficiente o aumente la cuota de la clave y vuelva a intentarlo.",
    "InvalidAccessCode": "La contraseña no es válida o está vacía. Por favor, introduce una contraseña de acceso válida o añade una clave API personalizada",
    "InvalidBedrockCredentials": "La autenticación de Bedrock no se ha completado con éxito, por favor, verifica AccessKeyId/SecretAccessKey e inténtalo de nuevo",
@@ -153,28 +153,6 @@
    "searchProviders": "Buscar proveedores...",
    "sort": "Orden personalizado"
  },
-  "newapi": {
-    "apiKey": {
-      "desc": "Clave API proporcionada por la plataforma New API",
-      "placeholder": "Clave API de New API",
-      "required": "La clave API es obligatoria",
-      "title": "Clave API"
-    },
-    "apiUrl": {
-      "desc": "Dirección API del servicio New API, generalmente debe incluir /v1",
-      "title": "Dirección API"
-    },
-    "enabled": {
-      "title": "Habilitar New API"
-    },
-    "models": {
-      "batchSelect": "Seleccionar modelos en lote ({{count}})",
-      "fetch": "Obtener lista de modelos",
-      "selected": "Modelos seleccionados",
-      "title": "Modelos disponibles"
-    },
-    "title": "New API"
-  },
  "ollama": {
    "checker": {
      "desc": "Prueba si la dirección del proxy de la interfaz se ha introducido correctamente",
@@ -207,10 +185,6 @@
    }
  },
  "providerModels": {
-    "batchSelect": {
-      "selected": "{{count}} modelos seleccionados",
-      "title": "Selección múltiple"
-    },
    "config": {
      "aesGcm": "Tu clave y dirección del proxy se cifrarán utilizando el algoritmo de cifrado <1>AES-GCM</1>",
      "apiKey": {
@@ -74,15 +74,9 @@
  "DeepSeek-V3": {
    "description": "DeepSeek-V3 es un modelo MoE desarrollado internamente por la empresa DeepSeek. Los resultados de DeepSeek-V3 en múltiples evaluaciones superan a otros modelos de código abierto como Qwen2.5-72B y Llama-3.1-405B, y su rendimiento es comparable al de los modelos cerrados de primer nivel mundial como GPT-4o y Claude-3.5-Sonnet."
  },
-  "DeepSeek-V3-1": {
-    "description": "DeepSeek V3.1: modelo de inferencia de próxima generación, mejora la capacidad de razonamiento complejo y pensamiento en cadena, adecuado para tareas que requieren análisis profundo."
-  },
  "DeepSeek-V3-Fast": {
    "description": "Proveedor del modelo: plataforma sophnet. DeepSeek V3 Fast es la versión de alta velocidad y alto TPS de DeepSeek V3 0324, completamente sin cuantificación, con mayor capacidad en código y matemáticas, ¡y respuesta más rápida!"
  },
-  "DeepSeek-V3.1": {
-    "description": "DeepSeek-V3.1 es un nuevo modelo híbrido de razonamiento lanzado por DeepSeek, que soporta dos modos de razonamiento: con pensamiento y sin pensamiento, con una eficiencia de pensamiento superior a DeepSeek-R1-0528. Tras una optimización post-entrenamiento, el uso de herramientas Agent y el rendimiento en tareas inteligentes han mejorado significativamente."
-  },
  "Doubao-lite-128k": {
    "description": "Doubao-lite ofrece una velocidad de respuesta excepcional y una mejor relación calidad-precio, proporcionando opciones más flexibles para diferentes escenarios de los clientes. Soporta inferencia y ajuste fino con una ventana de contexto de 128k."
  },
@@ -137,15 +131,9 @@
  "ERNIE-Speed-Pro-128K": {
    "description": "Modelo de lenguaje de alto rendimiento desarrollado por Baidu, lanzado en 2024, con capacidades generales excepcionales, superando a ERNIE Speed, adecuado como modelo base para ajustes finos, manejando mejor problemas en escenarios específicos, y con un rendimiento de inferencia excelente."
  },
-  "FLUX-1.1-pro": {
-    "description": "FLUX.1.1 Pro"
-  },
  "FLUX.1-Kontext-dev": {
    "description": "FLUX.1-Kontext-dev es un modelo multimodal de generación y edición de imágenes desarrollado por Black Forest Labs, basado en la arquitectura Rectified Flow Transformer, con una escala de 12 mil millones de parámetros. Se especializa en generar, reconstruir, mejorar o editar imágenes bajo condiciones contextuales dadas. Combina las ventajas de generación controlada de modelos de difusión con la capacidad de modelado contextual de Transformers, soportando salidas de alta calidad y aplicándose ampliamente en tareas como restauración de imágenes, completado y reconstrucción de escenas visuales."
  },
-  "FLUX.1-Kontext-pro": {
-    "description": "FLUX.1 Kontext [pro]"
-  },
  "FLUX.1-dev": {
    "description": "FLUX.1-dev es un modelo multimodal de lenguaje (MLLM) de código abierto desarrollado por Black Forest Labs, optimizado para tareas de texto e imagen, integrando capacidades de comprensión y generación tanto visual como textual. Está basado en avanzados modelos de lenguaje grande (como Mistral-7B) y mediante un codificador visual cuidadosamente diseñado y un ajuste fino por etapas con instrucciones, logra procesamiento colaborativo de texto e imagen y razonamiento para tareas complejas."
  },
@@ -182,9 +170,6 @@
  "Llama-3.2-90B-Vision-Instruct\t": {
    "description": "Capacidad avanzada de razonamiento de imágenes para aplicaciones de agentes de comprensión visual."
  },
-  "Meta-Llama-3-3-70B-Instruct": {
-    "description": "Llama 3.3 70B: modelo Transformer de gran versatilidad, adecuado para tareas de diálogo y generación."
-  },
  "Meta-Llama-3.1-405B-Instruct": {
    "description": "Modelo de texto ajustado por instrucciones de Llama 3.1, optimizado para casos de uso de diálogos multilingües, que se destaca en muchos modelos de chat de código abierto y cerrados en benchmarks de la industria comunes."
  },
@@ -203,9 +188,6 @@
  "Meta-Llama-3.3-70B-Instruct": {
    "description": "Llama 3.3 es el modelo de lenguaje de código abierto multilingüe más avanzado de la serie Llama, que ofrece un rendimiento comparable al modelo de 405B a un costo extremadamente bajo. Basado en la estructura Transformer, y mejorado en utilidad y seguridad a través de ajuste fino supervisado (SFT) y aprendizaje por refuerzo con retroalimentación humana (RLHF). Su versión ajustada por instrucciones está optimizada para diálogos multilingües, superando a muchos modelos de chat de código abierto y cerrados en múltiples benchmarks de la industria. La fecha límite de conocimiento es diciembre de 2023."
  },
-  "Meta-Llama-4-Maverick-17B-128E-Instruct-FP8": {
-    "description": "Llama 4 Maverick: modelo a gran escala basado en Mixture-of-Experts, que ofrece una estrategia eficiente de activación de expertos para un rendimiento sobresaliente en inferencia."
-  },
  "MiniMax-M1": {
    "description": "Modelo de inferencia de desarrollo propio completamente nuevo. Líder mundial: 80K cadenas de pensamiento x 1M de entradas, con un rendimiento comparable a los modelos de vanguardia internacionales."
  },
@@ -275,9 +257,6 @@
  "Pro/deepseek-ai/DeepSeek-V3": {
    "description": "DeepSeek-V3 es un modelo de lenguaje de expertos mixtos (MoE) con 671 mil millones de parámetros, que utiliza atención potencial de múltiples cabezas (MLA) y la arquitectura DeepSeekMoE, combinando estrategias de balanceo de carga sin pérdidas auxiliares para optimizar la eficiencia de inferencia y entrenamiento. Preentrenado en 14.8 billones de tokens de alta calidad, y ajustado mediante supervisión y aprendizaje por refuerzo, DeepSeek-V3 supera a otros modelos de código abierto y se acerca a los modelos cerrados líderes."
  },
-  "Pro/deepseek-ai/DeepSeek-V3.1": {
-    "description": "DeepSeek-V3.1 es un modelo de lenguaje grande híbrido lanzado por DeepSeek AI, que incorpora múltiples mejoras importantes sobre su predecesor. Una innovación clave es la integración de los modos \"Pensamiento\" y \"No pensamiento\" en un solo modelo, permitiendo a los usuarios alternar flexiblemente mediante la configuración de plantillas de chat para adaptarse a diferentes tareas. Gracias a una optimización post-entrenamiento especializada, V3.1 mejora significativamente el rendimiento en llamadas a herramientas y tareas Agent, soportando mejor herramientas de búsqueda externas y la ejecución de tareas complejas en múltiples pasos. Basado en DeepSeek-V3.1-Base, se amplió considerablemente la cantidad de datos de entrenamiento mediante un método de extensión de texto largo en dos fases, mejorando su desempeño en documentos extensos y código largo. Como modelo de código abierto, DeepSeek-V3.1 demuestra capacidades comparables a los mejores modelos cerrados en benchmarks de codificación, matemáticas y razonamiento, y gracias a su arquitectura de expertos mixtos (MoE), mantiene una gran capacidad de modelo mientras reduce eficazmente los costos de inferencia."
-  },
  "Pro/moonshotai/Kimi-K2-Instruct": {
    "description": "Kimi K2 es un modelo base con arquitectura MoE que posee capacidades avanzadas de codificación y agentes, con un total de 1 billón de parámetros y 32 mil millones de parámetros activados. En pruebas de referencia en categorías principales como razonamiento general, programación, matemáticas y agentes, el rendimiento del modelo K2 supera a otros modelos de código abierto populares."
  },
@@ -353,21 +332,12 @@
  "Qwen/Qwen3-30B-A3B-Instruct-2507": {
    "description": "Qwen3-30B-A3B-Instruct-2507 es una versión actualizada del modelo Qwen3-30B-A3B en modo no reflexivo. Es un modelo de expertos mixtos (MoE) con un total de 30.5 mil millones de parámetros y 3.3 mil millones de parámetros activados. El modelo ha mejorado significativamente en varios aspectos, incluyendo el seguimiento de instrucciones, razonamiento lógico, comprensión de texto, matemáticas, ciencias, codificación y uso de herramientas. Además, ha logrado avances sustanciales en la cobertura de conocimientos multilingües de cola larga y se alinea mejor con las preferencias del usuario en tareas subjetivas y abiertas, generando respuestas más útiles y textos de mayor calidad. También se ha mejorado la capacidad de comprensión de textos largos hasta 256K. Este modelo solo soporta el modo no reflexivo y no genera etiquetas `<think></think>` en su salida."
  },
-  "Qwen/Qwen3-30B-A3B-Thinking-2507": {
-    "description": "Qwen3-30B-A3B-Thinking-2507 es el último modelo de pensamiento de la serie Qwen3, publicado por el equipo Tongyi Qianwen de Alibaba. Como un modelo Mixture of Experts (MoE) con 30.500 millones de parámetros en total y 3.300 millones de parámetros activados, está enfocado en mejorar la capacidad de abordar tareas complejas. Este modelo muestra mejoras significativas en razonamiento lógico, matemáticas, ciencias, programación y en evaluaciones académicas que requieren conocimientos humanos especializados. Al mismo tiempo, presenta avances notables en capacidades generales como el cumplimiento de instrucciones, el uso de herramientas, la generación de texto y la alineación con las preferencias humanas. El modelo soporta de forma nativa la comprensión de contextos largos de 256K tokens y puede ampliarse hasta 1 millón de tokens. Esta versión está diseñada específicamente para el “modo de pensamiento”, con el objetivo de resolver tareas altamente complejas mediante razonamientos detallados y paso a paso; asimismo, sus capacidades como agente (Agent) también resultan sobresalientes."
-  },
  "Qwen/Qwen3-32B": {
    "description": "Qwen3 es un nuevo modelo de Tongyi Qianwen de próxima generación con capacidades significativamente mejoradas, alcanzando niveles líderes en la industria en razonamiento, general, agente y múltiples idiomas, y admite el cambio de modo de pensamiento."
  },
  "Qwen/Qwen3-8B": {
    "description": "Qwen3 es un nuevo modelo de Tongyi Qianwen de próxima generación con capacidades significativamente mejoradas, alcanzando niveles líderes en la industria en razonamiento, general, agente y múltiples idiomas, y admite el cambio de modo de pensamiento."
  },
-  "Qwen/Qwen3-Coder-30B-A3B-Instruct": {
-    "description": "Qwen3-Coder-30B-A3B-Instruct es un modelo de código de la serie Qwen3 desarrollado por el equipo Tongyi Qianwen (通义千问) de Alibaba. Como un modelo depurado y optimizado, mantiene un alto rendimiento y eficiencia a la vez que se centra en mejorar la capacidad de procesamiento de código. Este modelo muestra una ventaja de rendimiento notable frente a otros modelos de código abierto en tareas complejas como la programación agente (Agentic Coding), la automatización de operaciones en navegadores y la invocación de herramientas. Soporta de forma nativa contextos largos de 256K tokens y puede ampliarse hasta 1M tokens, lo que le permite entender y gestionar mejor repositorios de código a escala. Además, proporciona un sólido soporte de codificación por agentes para plataformas como Qwen Code y CLINE, y está diseñado con un formato específico para llamadas a funciones."
-  },
-  "Qwen/Qwen3-Coder-480B-A35B-Instruct": {
-    "description": "Qwen3-Coder-480B-A35B-Instruct es un modelo de código publicado por Alibaba, hasta la fecha el más capaz en términos de agencia (agentic). Es un modelo de expertos mixtos (MoE) con 480 000 millones de parámetros en total y 35 000 millones de parámetros de activación, que logra un equilibrio entre eficiencia y rendimiento. El modelo admite de forma nativa una longitud de contexto de 256K (aprox. 260 000) tokens y puede ampliarse hasta 1 000 000 tokens mediante métodos de extrapolación como YaRN, lo que le permite manejar bases de código a gran escala y tareas de programación complejas. Qwen3-Coder está diseñado para flujos de trabajo de codificación orientados a agentes: no solo genera código, sino que puede interactuar de forma autónoma con herramientas y entornos de desarrollo para resolver problemas de programación complejos. En múltiples pruebas de referencia de tareas de codificación y de agente, este modelo ha alcanzado un nivel superior entre los modelos de código abierto, y su rendimiento puede compararse con el de modelos líderes como Claude Sonnet 4."
-  },
  "Qwen2-72B-Instruct": {
    "description": "Qwen2 es la última serie del modelo Qwen, que admite un contexto de 128k. En comparación con los modelos de código abierto más óptimos actuales, Qwen2-72B supera significativamente a los modelos líderes actuales en comprensión del lenguaje natural, conocimiento, código, matemáticas y capacidades multilingües."
  },
@@ -398,9 +368,6 @@
  "Qwen3-235B": {
    "description": "Qwen3-235B-A22B es un modelo MoE (modelo de expertos mixtos) que introduce el “modo de razonamiento mixto”, permitiendo a los usuarios cambiar sin problemas entre el “modo reflexivo” y el “modo no reflexivo”. Soporta la comprensión y el razonamiento en 119 idiomas y dialectos, y cuenta con una potente capacidad de invocación de herramientas. En pruebas de referencia que evalúan capacidades generales, código y matemáticas, multilingüismo, conocimiento y razonamiento, compite con los principales modelos del mercado como DeepSeek R1, OpenAI o1, o3-mini, Grok 3 y Google Gemini 2.5 Pro."
  },
-  "Qwen3-235B-A22B-Instruct-2507-FP8": {
-    "description": "Qwen3 235B A22B Instruct 2507: modelo optimizado para razonamiento avanzado e instrucciones de diálogo, con arquitectura de expertos mixtos para mantener la eficiencia en inferencia con gran cantidad de parámetros."
-  },
  "Qwen3-32B": {
    "description": "Qwen3-32B es un modelo denso (Dense Model) que introduce el “modo de razonamiento mixto”, permitiendo a los usuarios cambiar sin problemas entre el “modo reflexivo” y el “modo no reflexivo”. Gracias a mejoras en la arquitectura del modelo, aumento de datos de entrenamiento y métodos de entrenamiento más eficientes, su rendimiento general es comparable al de Qwen2.5-72B."
  },
@@ -857,9 +824,6 @@
  "deepseek-ai/DeepSeek-V3": {
    "description": "DeepSeek-V3 es un modelo de lenguaje de expertos mixtos (MoE) con 6710 millones de parámetros, que utiliza atención latente de múltiples cabezas (MLA) y la arquitectura DeepSeekMoE, combinando una estrategia de balanceo de carga sin pérdidas auxiliares para optimizar la eficiencia de inferencia y entrenamiento. Al ser preentrenado en 14.8 billones de tokens de alta calidad y realizar ajustes supervisados y aprendizaje reforzado, DeepSeek-V3 supera en rendimiento a otros modelos de código abierto, acercándose a los modelos cerrados líderes."
  },
-  "deepseek-ai/DeepSeek-V3.1": {
-    "description": "DeepSeek-V3.1 es un modelo de lenguaje grande híbrido lanzado por DeepSeek AI, que incorpora múltiples mejoras importantes sobre su predecesor. Una innovación clave es la integración de los modos \"Pensamiento\" y \"No pensamiento\" en un solo modelo, permitiendo a los usuarios alternar flexiblemente mediante la configuración de plantillas de chat para adaptarse a diferentes tareas. Gracias a una optimización post-entrenamiento especializada, V3.1 mejora significativamente el rendimiento en llamadas a herramientas y tareas Agent, soportando mejor herramientas de búsqueda externas y la ejecución de tareas complejas en múltiples pasos. Basado en DeepSeek-V3.1-Base, se amplió considerablemente la cantidad de datos de entrenamiento mediante un método de extensión de texto largo en dos fases, mejorando su desempeño en documentos extensos y código largo. Como modelo de código abierto, DeepSeek-V3.1 demuestra capacidades comparables a los mejores modelos cerrados en benchmarks de codificación, matemáticas y razonamiento, y gracias a su arquitectura de expertos mixtos (MoE), mantiene una gran capacidad de modelo mientras reduce eficazmente los costos de inferencia."
-  },
  "deepseek-ai/deepseek-llm-67b-chat": {
    "description": "DeepSeek 67B es un modelo avanzado entrenado para diálogos de alta complejidad."
  },
@@ -930,7 +894,7 @@
    "description": "DeepSeek R1 versión completa, con 671B de parámetros, que soporta búsqueda en línea en tiempo real, con una capacidad de comprensión y generación más potente."
  },
  "deepseek-reasoner": {
-    "description": "Modo de pensamiento DeepSeek V3.1. Antes de emitir la respuesta final, el modelo genera una cadena de razonamiento para mejorar la precisión de la respuesta."
+    "description": "Modelo de inferencia lanzado por DeepSeek. Antes de proporcionar la respuesta final, el modelo genera primero una cadena de pensamiento para mejorar la precisión de la respuesta final."
  },
  "deepseek-v2": {
    "description": "DeepSeek V2 es un modelo de lenguaje Mixture-of-Experts eficiente, adecuado para necesidades de procesamiento económico."
@@ -944,18 +908,12 @@
  "deepseek-v3-0324": {
    "description": "DeepSeek-V3-0324 es un modelo MoE de 671B parámetros, destacándose en habilidades de programación y técnicas, comprensión del contexto y procesamiento de textos largos."
  },
-  "deepseek-v3.1": {
-    "description": "DeepSeek-V3.1 es un nuevo modelo híbrido de razonamiento lanzado por DeepSeek, que soporta dos modos de razonamiento: con pensamiento y sin pensamiento, con una eficiencia de pensamiento superior a DeepSeek-R1-0528. Tras una optimización post-entrenamiento, el uso de herramientas Agent y el rendimiento en tareas inteligentes han mejorado significativamente. Soporta una ventana de contexto de 128k y una longitud máxima de salida de 64k tokens."
-  },
  "deepseek/deepseek-chat-v3-0324": {
    "description": "DeepSeek V3 es un modelo experto de mezcla de 685B parámetros, la última iteración de la serie de modelos de chat insignia del equipo de DeepSeek.\n\nHereda el modelo [DeepSeek V3](/deepseek/deepseek-chat-v3) y se desempeña excepcionalmente en diversas tareas."
  },
  "deepseek/deepseek-chat-v3-0324:free": {
    "description": "DeepSeek V3 es un modelo experto de mezcla de 685B parámetros, la última iteración de la serie de modelos de chat insignia del equipo de DeepSeek.\n\nHereda el modelo [DeepSeek V3](/deepseek/deepseek-chat-v3) y se desempeña excepcionalmente en diversas tareas."
  },
-  "deepseek/deepseek-chat-v3.1": {
-    "description": "DeepSeek-V3.1 es un modelo híbrido de razonamiento grande que soporta contexto largo de 128K y cambio eficiente de modos, logrando un rendimiento y velocidad sobresalientes en llamadas a herramientas, generación de código y tareas complejas de razonamiento."
-  },
  "deepseek/deepseek-r1": {
    "description": "DeepSeek-R1 mejora significativamente la capacidad de razonamiento del modelo con muy pocos datos etiquetados. Antes de proporcionar la respuesta final, el modelo genera una cadena de pensamiento para mejorar la precisión de la respuesta final."
  },
@@ -1145,27 +1103,12 @@
  "flux-dev": {
    "description": "FLUX.1 [dev] es un modelo refinado y de pesos abiertos para aplicaciones no comerciales. Mantiene una calidad de imagen y capacidad de seguimiento de instrucciones similar a la versión profesional de FLUX, pero con mayor eficiencia operativa. En comparación con modelos estándar de tamaño similar, es más eficiente en el uso de recursos."
  },
-  "flux-kontext-max": {
-    "description": "Generación y edición de imágenes contextuales de vanguardia — combinando texto e imágenes para obtener resultados precisos y coherentes."
-  },
-  "flux-kontext-pro": {
-    "description": "Generación y edición de imágenes contextuales de vanguardia: combina texto e imágenes para obtener resultados precisos y coherentes."
-  },
  "flux-kontext/dev": {
    "description": "Modelo FLUX.1 centrado en tareas de edición de imágenes, compatible con entradas de texto e imagen."
  },
  "flux-merged": {
    "description": "El modelo FLUX.1-merged combina las características profundas exploradas durante la fase de desarrollo de “DEV” con las ventajas de ejecución rápida representadas por “Schnell”. Esta combinación no solo amplía los límites de rendimiento del modelo, sino que también amplía su rango de aplicaciones."
  },
-  "flux-pro": {
-    "description": "Modelo comercial de generación de imágenes por IA de primer nivel — calidad de imagen incomparable y gran diversidad de resultados."
-  },
-  "flux-pro-1.1": {
-    "description": "Modelo profesional mejorado de generación de imágenes con IA — ofrece una calidad de imagen excepcional y una capacidad precisa para seguir las indicaciones."
-  },
-  "flux-pro-1.1-ultra": {
-    "description": "Generación de imágenes por IA de ultra alta resolución — compatible con salida de 4 megapíxeles; genera imágenes en alta definición en menos de 10 segundos."
-  },
  "flux-pro/kontext": {
    "description": "FLUX.1 Kontext [pro] puede procesar texto e imágenes de referencia como entrada, logrando sin problemas ediciones locales específicas y transformaciones complejas de escenas completas."
  },
@@ -1250,12 +1193,6 @@
  "gemini-2.5-flash": {
    "description": "Gemini 2.5 Flash es el modelo de mejor relación calidad-precio de Google, que ofrece funcionalidades completas."
  },
-  "gemini-2.5-flash-image-preview": {
-    "description": "Nano Banana es el modelo multimodal nativo más reciente, rápido y eficiente de Google, que permite generar y editar imágenes mediante diálogo."
-  },
-  "gemini-2.5-flash-image-preview:image": {
-    "description": "Nano Banana es el modelo multimodal nativo más reciente, rápido y eficiente de Google, que permite generar y editar imágenes mediante diálogo."
-  },
  "gemini-2.5-flash-lite": {
    "description": "Gemini 2.5 Flash-Lite es el modelo más pequeño y rentable de Google, diseñado para un uso a gran escala."
  },
@@ -1358,9 +1295,6 @@
  "glm-4.5-x": {
    "description": "Versión ultra rápida de GLM-4.5, que combina un rendimiento potente con una velocidad de generación de hasta 100 tokens por segundo."
  },
-  "glm-4.5v": {
-    "description": "La nueva generación del modelo de razonamiento visual de Zhipu, basada en la arquitectura MOE, cuenta con 106B de parámetros totales y 12B de parámetros de activación; alcanza el estado del arte (SOTA) entre los modelos multimodales de código abierto de la misma categoría a nivel mundial en diversas pruebas de referencia, y cubre tareas comunes como comprensión de imágenes, vídeo, documentos y tareas de interfaz gráfica de usuario (GUI)."
-  },
  "glm-4v": {
    "description": "GLM-4V proporciona una poderosa capacidad de comprensión e inferencia de imágenes, soportando diversas tareas visuales."
  },
@@ -1397,12 +1331,6 @@
  "google/gemini-2.5-flash": {
    "description": "Gemini 2.5 Flash es el modelo principal más avanzado de Google, diseñado para tareas avanzadas de razonamiento, codificación, matemáticas y ciencias. Incluye una capacidad incorporada de \"pensamiento\" que le permite proporcionar respuestas con mayor precisión y un manejo detallado del contexto.\n\nNota: este modelo tiene dos variantes: con pensamiento y sin pensamiento. La tarificación de salida varía significativamente según si la capacidad de pensamiento está activada. Si elige la variante estándar (sin el sufijo \":thinking\"), el modelo evitará explícitamente generar tokens de pensamiento.\n\nPara aprovechar la capacidad de pensamiento y recibir tokens de pensamiento, debe seleccionar la variante \":thinking\", lo que generará una tarificación más alta para la salida de pensamiento.\n\nAdemás, Gemini 2.5 Flash se puede configurar mediante el parámetro \"máximo de tokens para razonamiento\", como se describe en la documentación (https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning)."
  },
-  "google/gemini-2.5-flash-image-preview": {
-    "description": "Modelo experimental Gemini 2.5 Flash, compatible con generación de imágenes."
-  },
-  "google/gemini-2.5-flash-image-preview:free": {
-    "description": "Modelo experimental Gemini 2.5 Flash, compatible con generación de imágenes."
-  },
  "google/gemini-2.5-flash-preview": {
    "description": "Gemini 2.5 Flash es el modelo principal más avanzado de Google, diseñado para razonamiento avanzado, codificación, matemáticas y tareas científicas. Incluye la capacidad de 'pensar' incorporada, lo que le permite proporcionar respuestas con mayor precisión y un manejo más detallado del contexto.\n\nNota: Este modelo tiene dos variantes: con pensamiento y sin pensamiento. La fijación de precios de salida varía significativamente según si la capacidad de pensamiento está activada. Si elige la variante estándar (sin el sufijo ':thinking'), el modelo evitará explícitamente generar tokens de pensamiento.\n\nPara aprovechar la capacidad de pensamiento y recibir tokens de pensamiento, debe elegir la variante ':thinking', lo que resultará en un precio de salida de pensamiento más alto.\n\nAdemás, Gemini 2.5 Flash se puede configurar a través del parámetro 'número máximo de tokens de razonamiento', como se describe en la documentación (https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning)."
  },
@@ -1505,7 +1433,9 @@
  "gpt-4.1-nano": {
    "description": "GPT-4.1 mini ofrece un equilibrio entre inteligencia, velocidad y costo, lo que lo convierte en un modelo atractivo para muchos casos de uso."
  },
-  "gpt-4.5-preview": "GPT-4.5-preview es el modelo de propósito general más reciente, con un profundo conocimiento del mundo y una mejor comprensión de las intenciones de los usuarios; destaca en tareas creativas y en la planificación de agentes. El conocimiento de este modelo está actualizado hasta octubre de 2023.",
+  "gpt-4.5-preview": {
+    "description": "Versión de investigación de GPT-4.5, que es nuestro modelo GPT más grande y potente hasta la fecha. Posee un amplio conocimiento del mundo y puede comprender mejor la intención del usuario, lo que lo hace destacar en tareas creativas y planificación autónoma. GPT-4.5 acepta entradas de texto e imagen y genera salidas de texto (incluidas salidas estructuradas). Soporta funciones clave para desarrolladores, como llamadas a funciones, API por lotes y salida en streaming. En tareas que requieren pensamiento creativo, abierto y diálogo (como escritura, aprendizaje o exploración de nuevas ideas), GPT-4.5 brilla especialmente. La fecha límite de conocimiento es octubre de 2023."
+  },
  "gpt-4o": {
    "description": "ChatGPT-4o es un modelo dinámico que se actualiza en tiempo real para mantener la versión más actual. Combina una poderosa comprensión y generación de lenguaje, adecuado para aplicaciones a gran escala, incluyendo servicio al cliente, educación y soporte técnico."
  },
@@ -1572,9 +1502,6 @@
  "gpt-oss": {
    "description": "GPT-OSS 20B es un modelo de lenguaje abierto lanzado por OpenAI, que utiliza la tecnología de cuantificación MXFP4, adecuado para ejecutarse en GPU de consumo de alta gama o en Mac con Apple Silicon. Este modelo destaca en la generación de diálogos, escritura de código y tareas de razonamiento, y soporta llamadas a funciones y uso de herramientas."
  },
-  "gpt-oss-120b": {
-    "description": "GPT-OSS-120B MXFP4: estructura Transformer cuantificada que mantiene un rendimiento sólido incluso con recursos limitados."
-  },
  "gpt-oss:120b": {
    "description": "GPT-OSS 120B es un modelo de lenguaje abierto de gran escala lanzado por OpenAI, que emplea la tecnología de cuantificación MXFP4, siendo un modelo insignia. Requiere múltiples GPU o estaciones de trabajo de alto rendimiento para su ejecución, y ofrece un rendimiento sobresaliente en razonamiento complejo, generación de código y procesamiento multilingüe, soportando llamadas avanzadas a funciones e integración de herramientas."
  },
@@ -1602,9 +1529,6 @@
  "grok-4": {
    "description": "Nuestro modelo insignia más reciente y potente, que destaca en procesamiento de lenguaje natural, cálculo matemático y razonamiento — un competidor versátil y perfecto."
  },
-  "grok-code-fast-1": {
-    "description": "Nos complace presentar grok-code-fast-1, un modelo de inferencia rápido y económico que destaca en la codificación de agentes."
-  },
  "gryphe/mythomax-l2-13b": {
    "description": "MythoMax l2 13B es un modelo de lenguaje que combina creatividad e inteligencia, fusionando múltiples modelos de vanguardia."
  },
@@ -1713,18 +1637,9 @@
  "image-01-live": {
    "description": "Modelo de generación de imágenes con detalles finos, soporta generación a partir de texto y configuración de estilo artístico."
  },
-  "imagen-4.0-fast-generate-001": {
-    "description": "Versión Fast de la serie de modelos Imagen de texto a imagen de cuarta generación"
-  },
-  "imagen-4.0-generate-001": {
-    "description": "Serie Imagen de cuarta generación para generar imágenes a partir de texto."
-  },
  "imagen-4.0-generate-preview-06-06": {
    "description": "Serie de modelos de texto a imagen de cuarta generación de Imagen"
  },
-  "imagen-4.0-ultra-generate-001": {
-    "description": "Imagen, serie de modelos de texto a imagen de cuarta generación, versión Ultra"
-  },
  "imagen-4.0-ultra-generate-preview-06-06": {
    "description": "Serie de modelos de texto a imagen de cuarta generación de Imagen, versión Ultra"
  },
@@ -1764,9 +1679,6 @@
  "kimi-k2-0711-preview": {
    "description": "kimi-k2 es un modelo base con arquitectura MoE que posee capacidades excepcionales en código y agentes, con un total de 1T parámetros y 32B parámetros activados. En pruebas de rendimiento en categorías principales como razonamiento general, programación, matemáticas y agentes, el modelo K2 supera a otros modelos de código abierto populares."
  },
-  "kimi-k2-turbo-preview": {
-    "description": "kimi-k2 es un modelo base con arquitectura MoE que ofrece potentes capacidades para código y agentes, con 1T parámetros totales y 32B parámetros activados. En las pruebas de referencia en categorías principales como razonamiento de conocimiento general, programación, matemáticas y agentes, el rendimiento del modelo K2 supera al de otros modelos de código abierto más extendidos."
-  },
  "kimi-latest": {
    "description": "El producto asistente inteligente Kimi utiliza el último modelo grande de Kimi, que puede incluir características que aún no están estables. Soporta la comprensión de imágenes y seleccionará automáticamente el modelo de facturación de 8k/32k/128k según la longitud del contexto de la solicitud."
  },
@@ -1851,9 +1763,6 @@
  "llava:34b": {
    "description": "LLaVA es un modelo multimodal que combina un codificador visual y Vicuna, utilizado para una poderosa comprensión visual y lingüística."
  },
-  "magistral-medium-latest": {
-    "description": "Magistral Medium 1.1 es un modelo de inferencia de última generación lanzado por Mistral AI en julio de 2025."
-  },
  "mathstral": {
    "description": "MathΣtral está diseñado para la investigación científica y el razonamiento matemático, proporcionando capacidades de cálculo efectivas y explicación de resultados."
  },
@@ -2185,7 +2094,7 @@
    "description": "o1-mini es un modelo de inferencia rápido y rentable diseñado para aplicaciones de programación, matemáticas y ciencias. Este modelo tiene un contexto de 128K y una fecha de corte de conocimiento en octubre de 2023."
  },
  "o1-preview": {
-    "description": "Enfocado en el razonamiento avanzado y en la resolución de problemas complejos, incluidas tareas de matemáticas y de ciencias. Es ideal para aplicaciones que requieren una comprensión profunda del contexto y flujos de trabajo autónomos."
+    "description": "o1 es el nuevo modelo de inferencia de OpenAI, adecuado para tareas complejas que requieren un amplio conocimiento general. Este modelo tiene un contexto de 128K y una fecha de corte de conocimiento en octubre de 2023."
  },
  "o1-pro": {
    "description": "La serie o1 ha sido entrenada mediante aprendizaje reforzado para pensar antes de responder y ejecutar tareas de razonamiento complejas. El modelo o1-pro utiliza más recursos computacionales para un pensamiento más profundo, proporcionando respuestas de calidad superior de manera constante."
@@ -2304,14 +2213,8 @@
  "qwen-coder-turbo-latest": {
    "description": "El modelo de código Tongyi Qwen."
  },
-  "qwen-flash": {
-    "description": "La serie Tongyi Qianwen ofrece modelos de la mayor rapidez y de coste extremadamente bajo, adecuados para tareas sencillas."
-  },
  "qwen-image": {
-    "description": "Qwen-Image es un modelo de generación de imágenes de uso general que admite diversos estilos artísticos y destaca por su capacidad para renderizar textos complejos, especialmente textos en chino e inglés. El modelo soporta maquetación en varias líneas, generación de texto a nivel de párrafo y representación de detalles finos, lo que permite crear diseños complejos que combinan texto e imagen."
-  },
-  "qwen-image-edit": {
-    "description": "Modelo profesional de edición de imágenes lanzado por el equipo Qwen. Admite edición semántica y de apariencia, puede editar con precisión texto en chino e inglés y realizar ediciones de alta calidad, como transferencia de estilo y rotación de objetos."
+    "description": "Potente modelo de imágenes en bruto del equipo Qwen, con impresionante capacidad para generar texto en chino y diversos estilos visuales de imágenes."
  },
  "qwen-long": {
    "description": "Qwen es un modelo de lenguaje a gran escala que admite contextos de texto largos y funciones de conversación basadas en documentos largos y múltiples."
@@ -2338,7 +2241,7 @@
    "description": "La versión mejorada del modelo de lenguaje a gran escala Qwen admite entradas en diferentes idiomas como chino e inglés."
  },
  "qwen-turbo": {
-    "description": "通义千问 Turbo dejará de recibir actualizaciones; se recomienda sustituirlo por 通义千问 Flash. 通义千问 es un modelo de lenguaje a gran escala que admite entradas en chino, inglés y otros idiomas."
+    "description": "El modelo de lenguaje a gran escala Qwen-Turbo admite entradas en diferentes idiomas como chino e inglés."
  },
  "qwen-vl-chat-v1": {
    "description": "Qwen VL admite formas de interacción flexibles, incluyendo múltiples imágenes, preguntas y respuestas en múltiples rondas, y capacidades creativas."
@@ -2655,15 +2558,9 @@
  "step-2x-large": {
    "description": "Nueva generación del modelo Step Star para generación de imágenes, enfocado en tareas de generación basadas en texto, capaz de crear imágenes de alta calidad según descripciones proporcionadas por el usuario. El nuevo modelo produce imágenes con texturas más realistas y mejor capacidad para generar texto en chino e inglés."
  },
-  "step-3": {
-    "description": "Este modelo cuenta con una destacada capacidad de percepción visual y de razonamiento complejo. Es capaz de realizar con precisión la comprensión de conocimientos complejos entre distintos ámbitos, el análisis cruzado de información matemática y visual, así como una amplia variedad de problemas de análisis visual en la vida cotidiana."
-  },
  "step-r1-v-mini": {
    "description": "Este modelo es un gran modelo de inferencia con una poderosa capacidad de comprensión de imágenes, capaz de procesar información de imágenes y texto, generando contenido textual tras un profundo razonamiento. Este modelo destaca en el campo del razonamiento visual, además de poseer capacidades de razonamiento matemático, de código y textual de primer nivel. La longitud del contexto es de 100k."
  },
-  "stepfun-ai/step3": {
-    "description": "Step3 es un modelo de inferencia multimodal de vanguardia publicado por 阶跃星辰 (StepFun), construido sobre una arquitectura Mixture-of-Experts (MoE) con 321B de parámetros totales y 38B de parámetros de activación. El modelo presenta un diseño de extremo a extremo orientado a minimizar el coste de decodificación, al tiempo que ofrece un rendimiento de primer nivel en razonamiento visual-lingüístico. Gracias al diseño sinérgico entre la atención por descomposición de múltiples matrices (MFA) y el desacoplamiento atención‑FFN (AFD), Step3 mantiene una eficiencia sobresaliente tanto en aceleradores de gama alta como de gama baja. En la fase de preentrenamiento, Step3 procesó más de 20T de tokens de texto y 4T de tokens mixtos imagen-texto, abarcando más de una decena de idiomas. El modelo ha alcanzado niveles líderes entre los modelos de código abierto en múltiples benchmarks, incluidos matemáticas, código y tareas multimodales."
-  },
  "taichu_llm": {
    "description": "El modelo de lenguaje Taichu de Zīdōng tiene una poderosa capacidad de comprensión del lenguaje, así como habilidades en creación de textos, preguntas y respuestas, programación de código, cálculos matemáticos, razonamiento lógico, análisis de sentimientos y resúmenes de texto. Combina de manera innovadora el preentrenamiento con grandes datos y un conocimiento rico de múltiples fuentes, perfeccionando continuamente la tecnología algorítmica y absorbiendo nuevos conocimientos en vocabulario, estructura, gramática y semántica de grandes volúmenes de datos textuales, logrando una evolución constante del modelo. Proporciona a los usuarios información y servicios más convenientes, así como una experiencia más inteligente."
  },
@@ -2691,9 +2588,18 @@
  "thudm/glm-4-9b-chat": {
    "description": "Versión de código abierto de la última generación del modelo preentrenado GLM-4 lanzado por Zhizhu AI."
  },
+  "thudm/glm-4-9b:free": {
+    "description": "GLM-4-9B-0414 es un modelo de lenguaje de 9B parámetros en la serie GLM-4 desarrollado por THUDM. GLM-4-9B-0414 utiliza las mismas estrategias de aprendizaje por refuerzo y alineación que su modelo correspondiente de 32B, logrando un alto rendimiento en relación con su tamaño, lo que lo hace adecuado para implementaciones con recursos limitados que aún requieren una fuerte capacidad de comprensión y generación de lenguaje."
+  },
  "thudm/glm-z1-32b": {
    "description": "GLM-Z1-32B-0414 es una variante de razonamiento mejorada de GLM-4-32B, construida para resolver problemas de matemáticas profundas, lógica y orientados al código. Aplica aprendizaje por refuerzo extendido (específico para tareas y basado en preferencias emparejadas generales) para mejorar el rendimiento en tareas complejas de múltiples pasos. En comparación con el modelo base GLM-4-32B, Z1 mejora significativamente las capacidades de razonamiento estructurado y en dominios formalizados.\n\nEste modelo admite la ejecución forzada de pasos de 'pensamiento' a través de ingeniería de indicaciones y proporciona una coherencia mejorada para salidas de formato largo. Está optimizado para flujos de trabajo de agentes y admite contextos largos (a través de YaRN), llamadas a herramientas JSON y configuraciones de muestreo de alta precisión para razonamiento estable. Es ideal para casos de uso que requieren razonamiento reflexivo, de múltiples pasos o deducción formal."
  },
+  "thudm/glm-z1-32b:free": {
+    "description": "GLM-Z1-32B-0414 es una variante de razonamiento mejorada de GLM-4-32B, construida para resolver problemas de matemáticas profundas, lógica y orientados al código. Aplica aprendizaje por refuerzo extendido (específico para tareas y basado en preferencias emparejadas generales) para mejorar el rendimiento en tareas complejas de múltiples pasos. En comparación con el modelo base GLM-4-32B, Z1 mejora significativamente las capacidades de razonamiento estructurado y en dominios formalizados.\n\nEste modelo admite la ejecución forzada de pasos de 'pensamiento' a través de ingeniería de indicaciones y proporciona una coherencia mejorada para salidas de formato largo. Está optimizado para flujos de trabajo de agentes y admite contextos largos (a través de YaRN), llamadas a herramientas JSON y configuraciones de muestreo de alta precisión para razonamiento estable. Es ideal para casos de uso que requieren razonamiento reflexivo, de múltiples pasos o deducción formal."
+  },
+  "thudm/glm-z1-9b:free": {
+    "description": "GLM-Z1-9B-0414 es un modelo de lenguaje de 9B parámetros en la serie GLM-4 desarrollado por THUDM. Utiliza técnicas inicialmente aplicadas al modelo GLM-Z1 más grande, incluyendo aprendizaje por refuerzo extendido, alineación de clasificación por pares y entrenamiento para tareas intensivas en razonamiento como matemáticas, código y lógica. A pesar de su menor tamaño, muestra un rendimiento robusto en tareas de razonamiento general y supera a muchos modelos de código abierto en su nivel de pesos."
+  },
  "thudm/glm-z1-rumination-32b": {
    "description": "THUDM: GLM Z1 Rumination 32B es un modelo de razonamiento profundo de 32B parámetros en la serie GLM-4-Z1, optimizado para tareas complejas y abiertas que requieren un pensamiento prolongado. Se basa en glm-4-32b-0414, añadiendo una fase adicional de aprendizaje por refuerzo y estrategias de alineación multietapa, introduciendo una capacidad de 'reflexión' diseñada para simular el procesamiento cognitivo extendido. Esto incluye razonamiento iterativo, análisis de múltiples saltos y flujos de trabajo mejorados por herramientas, como búsqueda, recuperación y síntesis consciente de citas.\n\nEste modelo destaca en escritura de investigación, análisis comparativo y preguntas complejas. Soporta llamadas a funciones para primitivos de búsqueda y navegación (`search`, `click`, `open`, `finish`), lo que permite su uso en tuberías de agentes. El comportamiento reflexivo está moldeado por un control cíclico de múltiples rondas con mecanismos de recompensa basados en reglas y decisiones retrasadas, y se basa en marcos de investigación profunda como el stack de alineación interno de OpenAI. Esta variante es adecuada para escenarios que requieren profundidad en lugar de velocidad."
  },
@@ -2801,8 +2707,5 @@
  },
  "zai-org/GLM-4.5-Air": {
    "description": "GLM-4.5-Air es un modelo base diseñado para aplicaciones de agentes inteligentes, utilizando arquitectura Mixture-of-Experts (MoE). Está profundamente optimizado para llamadas a herramientas, navegación web, ingeniería de software y programación frontend, soportando integración fluida con agentes de código como Claude Code y Roo Code. GLM-4.5 emplea un modo de inferencia híbrido que se adapta a escenarios de razonamiento complejo y uso cotidiano."
-  },
-  "zai-org/GLM-4.5V": {
-    "description": "GLM-4.5V es la última generación de modelo de lenguaje visual (VLM) publicada por Zhipu AI. Este modelo se basa en el modelo de texto insignia GLM-4.5-Air, que cuenta con 106.000 millones de parámetros totales y 12.000 millones de parámetros de activación, y emplea una arquitectura de expertos mixtos (MoE) para lograr un rendimiento excelente con un coste de inferencia reducido. Técnicamente, GLM-4.5V continúa la línea de GLM-4.1V-Thinking e introduce innovaciones como el codificado rotacional de posiciones en 3D (3D-RoPE), que mejora de forma notable la percepción y el razonamiento sobre las relaciones en el espacio tridimensional. Gracias a optimizaciones en preentrenamiento, ajuste supervisado y aprendizaje por refuerzo, este modelo es capaz de procesar diversos tipos de contenido visual, como imágenes, vídeo y documentos largos, y ha alcanzado niveles punteros entre los modelos open source de su categoría en 41 benchmarks multimodales públicos. Además, el modelo incorpora un interruptor de 'modo de pensamiento' que permite a los usuarios alternar entre respuestas rápidas y razonamiento profundo para equilibrar eficiencia y rendimiento."
  }
 }
@@ -11,9 +11,6 @@
  "aihubmix": {
    "description": "AiHubMix ofrece acceso a múltiples modelos de IA a través de una interfaz API unificada."
  },
-  "akashchat": {
-    "description": "Akash es un mercado de recursos en la nube sin necesidad de permisos, con precios competitivos en comparación con los proveedores de nube tradicionales."
-  },
  "anthropic": {
    "description": "Anthropic es una empresa centrada en la investigación y desarrollo de inteligencia artificial, que ofrece una serie de modelos de lenguaje avanzados, como Claude 3.5 Sonnet, Claude 3 Sonnet, Claude 3 Opus y Claude 3 Haiku. Estos modelos logran un equilibrio ideal entre inteligencia, velocidad y costo, adecuados para una variedad de escenarios de aplicación, desde cargas de trabajo empresariales hasta respuestas rápidas. Claude 3.5 Sonnet, como su modelo más reciente, ha demostrado un rendimiento excepcional en múltiples evaluaciones, manteniendo una alta relación calidad-precio."
  },
@@ -29,9 +26,6 @@
  "bedrock": {
    "description": "Bedrock es un servicio proporcionado por Amazon AWS, enfocado en ofrecer modelos de lenguaje y visuales avanzados para empresas. Su familia de modelos incluye la serie Claude de Anthropic, la serie Llama 3.1 de Meta, entre otros, abarcando una variedad de opciones desde ligeras hasta de alto rendimiento, apoyando tareas como generación de texto, diálogos y procesamiento de imágenes, adecuadas para aplicaciones empresariales de diferentes escalas y necesidades."
  },
-  "bfl": {
-    "description": "Laboratorio líder en investigación de inteligencia artificial de vanguardia, construyendo la infraestructura visual del mañana."
-  },
  "cloudflare": {
    "description": "Ejecuta modelos de aprendizaje automático impulsados por GPU sin servidor en la red global de Cloudflare."
  },
@@ -92,12 +86,6 @@
  "moonshot": {
    "description": "Moonshot es una plataforma de código abierto lanzada por Beijing Dark Side Technology Co., que ofrece una variedad de modelos de procesamiento del lenguaje natural, con aplicaciones en campos amplios, incluyendo pero no limitado a creación de contenido, investigación académica, recomendaciones inteligentes y diagnóstico médico, apoyando el procesamiento de textos largos y tareas de generación complejas."
  },
-  "nebius": {
-    "description": "Nebius proporciona infraestructura de alto rendimiento a innovadores de IA en todo el mundo mediante la construcción de grandes clústeres de GPU y una plataforma en la nube integrada verticalmente."
-  },
-  "newapi": {
-    "description": "Plataforma de reenvío unificado y agregación de múltiples servicios de IA de código abierto"
-  },
  "novita": {
    "description": "Novita AI es una plataforma que ofrece servicios API para múltiples modelos de lenguaje de gran tamaño y generación de imágenes de IA, siendo flexible, confiable y rentable. Soporta los últimos modelos de código abierto como Llama3 y Mistral, proporcionando soluciones API completas, amigables para el usuario y autoescalables para el desarrollo de aplicaciones de IA, adecuadas para el rápido crecimiento de startups de IA."
  },
@@ -237,10 +237,6 @@
      "title": "Limitar número de mensajes históricos",
      "unlimited": "Sin límite de mensajes históricos"
    },
-    "enableStreaming": {
-      "desc": "Habilita la salida en streaming para mostrar la respuesta en tiempo real. Si se desactiva, solo se mostrará la respuesta completa.",
-      "title": "Habilitar salida en streaming"
-    },
    "historyCount": {
      "desc": "Número de mensajes incluidos en cada solicitud (incluyendo las preguntas más recientes. Cada pregunta y respuesta se cuenta como 1)",
      "title": "Número de mensajes incluidos"
@@ -52,11 +52,7 @@
    "thinking": {
      "title": "کلید تفکر عمیق"
    },
-    "title": "ویژگی‌های گسترش مدل",
-    "urlContext": {
-      "desc": "با فعال‌سازی، لینک‌های وب به‌طور خودکار تجزیه می‌شوند تا محتوای واقعی زمینه وب‌سایت به‌دست آید",
-      "title": "استخراج محتوای لینک وب"
-    }
+    "title": "ویژگی‌های گسترش مدل"
  },
  "history": {
    "title": "دستیار فقط آخرین {{count}} پیام را به خاطر خواهد سپرد"
@@ -129,7 +125,6 @@
      "inputWriteCached": "ذخیره ورودی نوشتن",
      "output": "خروجی",
      "outputAudio": "خروجی صوتی",
-      "outputImage": "خروجی تصویر",
      "outputText": "خروجی متنی",
      "outputTitle": "جزئیات خروجی",
      "reasoning": "تفکر عمیق",
@@ -273,8 +268,7 @@
    "clientMode": {
      "actionFiletip": "بارگذاری فایل",
      "actionTooltip": "بارگذاری",
-      "disabled": "مدل فعلی از تشخیص بصری و تحلیل فایل پشتیبانی نمی‌کند، لطفاً مدل را تغییر دهید و دوباره امتحان کنید",
-      "visionNotSupported": "مدل فعلی از شناسایی بصری پشتیبانی نمی‌کند، لطفاً مدل را تغییر دهید و دوباره امتحان کنید"
+      "disabled": "مدل فعلی از تشخیص بصری و تحلیل فایل پشتیبانی نمی‌کند، لطفاً مدل را تغییر دهید و دوباره امتحان کنید"
    },
    "preview": {
      "prepareTasks": "آماده‌سازی بخش‌ها...",
@@ -32,7 +32,6 @@
  "blog": "وبلاگ محصولات",
  "branching": "ایجاد زیرموضوع",
  "branchingDisable": "ویژگی «زیرموضوع» تنها در نسخه سرور قابل استفاده است، اگر به این ویژگی نیاز دارید، لطفاً به حالت استقرار سرور تغییر دهید یا از LobeChat Cloud استفاده کنید.",
-  "branchingRequiresSavedTopic": "موضوع فعلی ذخیره نشده است، پس از ذخیره می‌توانید از قابلیت زیرموضوع استفاده کنید",
  "cancel": "لغو",
  "changelog": "تغییرات",
  "clientDB": {
@@ -183,13 +182,6 @@
    "title": "آیا از محصول ما خوشتان آمده؟"
  },
  "fullscreen": "حالت تمام صفحه",
-  "geminiImageChineseWarning": {
-    "content": "Nano Banana احتمال دارد در استفاده از زبان چینی در تولید تصویر با خطا مواجه شود. توصیه می‌شود برای دریافت نتایج بهتر از زبان انگلیسی استفاده کنید.",
-    "continueGenerate": "ادامه تولید",
-    "continueSend": "ادامه ارسال",
-    "doNotShowAgain": "دیگر نمایش نده",
-    "title": "هشدار ورودی به زبان چینی"
-  },
  "historyRange": "محدوده تاریخی",
  "import": "وارد کردن",
  "importData": "وارد کردن داده‌ها",
@@ -1,9 +1,4 @@
 {
-  "ArgsInput": {
-    "addArgument": "افزودن پارامتر",
-    "argumentPlaceholder": "پارامتر {{index}}",
-    "enterFirstArgument": "اولین پارامتر را وارد کنید..."
-  },
  "DragUpload": {
    "dragDesc": "فایل‌ها را اینجا بکشید، امکان بارگذاری چندین تصویر وجود دارد.",
    "dragFileDesc": "تصاویر و فایل‌ها را اینجا بکشید، امکان بارگذاری چندین تصویر و فایل وجود دارد.",
@@ -73,18 +68,6 @@
  "GoBack": {
    "back": "بازگشت"
  },
-  "HtmlPreview": {
-    "actions": {
-      "download": "دانلود",
-      "preview": "پیش‌نمایش"
-    },
-    "iframeTitle": "پیش‌نمایش HTML",
-    "mode": {
-      "code": "کد",
-      "preview": "پیش‌نمایش"
-    },
-    "title": "پیش‌نمایش HTML"
-  },
  "ImageUpload": {
    "actions": {
      "changeImage": "برای تغییر تصویر کلیک کنید",
@@ -142,12 +125,6 @@
    },
    "progress": {
      "uploadingWithCount": "{{completed}}/{{total}} بارگذاری شده"
-    },
-    "validation": {
-      "fileSizeExceeded": "اندازه فایل از حد مجاز فراتر رفته",
-      "fileSizeExceededDetail": "{{fileName}} ({{actualSize}}) از حداکثر اندازه مجاز {{maxSize}} فراتر رفته است",
-      "fileSizeExceededMultiple": "{{count}} فایل از حداکثر اندازه مجاز {{maxSize}} فراتر رفته‌اند: {{fileList}}",
-      "imageCountExceeded": "تعداد تصاویر از حد مجاز فراتر رفته"
    }
  },
  "OllamaSetupGuide": {
@@ -85,17 +85,6 @@
    "CreateMessageError": "متأسفیم، پیام نتوانست به درستی ارسال شود، لطفاً محتوا را کپی کرده و دوباره ارسال کنید، پس از تازه‌سازی صفحه، این پیام حفظ نخواهد شد",
    "ExceededContextWindow": "محتوای درخواست فعلی از طول قابل پردازش مدل فراتر رفته است، لطفاً حجم محتوا را کاهش داده و دوباره تلاش کنید",
    "FreePlanLimit": "شما در حال حاضر کاربر رایگان هستید و نمی‌توانید از این قابلیت استفاده کنید، لطفاً به یک طرح پولی ارتقا دهید تا ادامه دهید",
-    "GoogleAIBlockReason": {
-      "BLOCKLIST": "محتوای شما شامل واژگان ممنوعه است. لطفاً ورودی خود را بررسی و اصلاح کرده و دوباره تلاش کنید.",
-      "IMAGE_SAFETY": "تولید تصویر به‌دلیل ملاحظات ایمنی مسدود شد. لطفاً درخواست تولید تصویر خود را اصلاح کرده و مجدداً تلاش کنید.",
-      "LANGUAGE": "زبانی که استفاده کرده‌اید در حال حاضر پشتیبانی نمی‌شود. لطفاً دوباره به زبان انگلیسی یا یکی از زبان‌های پشتیبانی‌شده سؤال خود را مطرح کنید.",
-      "OTHER": "محتوا به دلایل نامشخص مسدود شده است. لطفاً درخواست خود را به شکل دیگری بازنویسی کنید.",
-      "PROHIBITED_CONTENT": "درخواست شما ممکن است شامل محتوای ممنوعه باشد. لطفاً آن را تنظیم کنید تا با دستورالعمل‌های استفاده مطابقت داشته باشد.",
-      "RECITATION": "محتوای شما به‌دلیل احتمال نقض حقوق تکثیر مسدود شده است. لطفاً از محتوای اصلی استفاده کنید یا درخواست خود را بازنویسی کنید.",
-      "SAFETY": "محتوای شما به‌دلیل سیاست‌های ایمنی مسدود شده است. لطفاً درخواست خود را اصلاح کنید تا شامل محتوای مضر یا نامناسب نباشد.",
-      "SPII": "محتوای شما ممکن است شامل اطلاعات هویتی حساس فردی باشد. برای محافظت از حریم خصوصی، لطفاً اطلاعات حساس را حذف کرده و دوباره تلاش کنید.",
-      "default": "محتوا مسدود شد: {{blockReason}}。لطفاً محتوای درخواست خود را اصلاح کرده و دوباره تلاش کنید."
-    },
    "InsufficientQuota": "متأسفیم، سهمیه این کلید به حداکثر رسیده است، لطفاً موجودی حساب خود را بررسی کرده یا سهمیه کلید را افزایش دهید و دوباره تلاش کنید",
    "InvalidAccessCode": "رمز عبور نادرست یا خالی است، لطفاً رمز عبور صحیح را وارد کنید یا API Key سفارشی اضافه کنید",
    "InvalidBedrockCredentials": "اعتبارسنجی Bedrock ناموفق بود، لطفاً AccessKeyId/SecretAccessKey را بررسی کرده و دوباره تلاش کنید",
@@ -153,28 +153,6 @@
    "searchProviders": "جستجوی ارائه‌دهندگان...",
    "sort": "مرتب‌سازی سفارشی"
  },
-  "newapi": {
-    "apiKey": {
-      "desc": "کلید API ارائه شده توسط پلتفرم New API",
-      "placeholder": "کلید API New API",
-      "required": "کلید API الزامی است",
-      "title": "کلید API"
-    },
-    "apiUrl": {
-      "desc": "آدرس API سرویس New API، اغلب نیاز به /v1 دارد",
-      "title": "آدرس API"
-    },
-    "enabled": {
-      "title": "فعال‌سازی New API"
-    },
-    "models": {
-      "batchSelect": "انتخاب دسته‌ای مدل‌ها ({{count}} عدد)",
-      "fetch": "دریافت فهرست مدل‌ها",
-      "selected": "مدل‌های انتخاب شده",
-      "title": "مدل‌های قابل استفاده"
-    },
-    "title": "New API"
-  },
  "ollama": {
    "checker": {
      "desc": "آزمایش کنید که آیا آدرس پروکسی به درستی وارد شده است",
@@ -207,10 +185,6 @@
    }
  },
  "providerModels": {
-    "batchSelect": {
-      "selected": "{{count}} مدل انتخاب شده",
-      "title": "انتخاب دسته‌ای"
-    },
    "config": {
      "aesGcm": "کلید شما و آدرس پروکسی و غیره با استفاده از <1>AES-GCM</1> رمزگذاری خواهد شد",
      "apiKey": {
@@ -74,15 +74,9 @@
  "DeepSeek-V3": {
    "description": "DeepSeek-V3 یک مدل MoE است که توسط شرکت DeepSeek توسعه یافته است. نتایج ارزیابی‌های متعدد DeepSeek-V3 از مدل‌های متن باز دیگر مانند Qwen2.5-72B و Llama-3.1-405B فراتر رفته و از نظر عملکرد با مدل‌های بسته جهانی برتر مانند GPT-4o و Claude-3.5-Sonnet برابری می‌کند."
  },
-  "DeepSeek-V3-1": {
-    "description": "DeepSeek V3.1: مدل استنتاج نسل بعدی که توانایی‌های استدلال پیچیده و تفکر زنجیره‌ای را بهبود می‌بخشد و برای وظایف نیازمند تحلیل عمیق مناسب است."
-  },
  "DeepSeek-V3-Fast": {
    "description": "تأمین‌کننده مدل: پلتفرم sophnet. DeepSeek V3 Fast نسخه‌ای با TPS بالا و سرعت بسیار زیاد از نسخه DeepSeek V3 0324 است، بدون کمیت‌سازی، با توانایی‌های کد و ریاضی قوی‌تر و پاسخ‌دهی سریع‌تر!"
  },
-  "DeepSeek-V3.1": {
-    "description": "DeepSeek-V3.1 یک مدل استدلال ترکیبی جدید از DeepSeek است که از دو حالت استدلال تفکری و غیرتفکری پشتیبانی می‌کند و نسبت به DeepSeek-R1-0528 در حالت تفکری کارایی بالاتری دارد. پس از آموزش تکمیلی، استفاده از ابزارهای Agent و عملکرد وظایف هوشمند به طور قابل توجهی بهبود یافته است."
-  },
  "Doubao-lite-128k": {
    "description": "Doubao-lite دارای سرعت پاسخگویی بی‌نظیر و نسبت قیمت به کارایی بهتر است و گزینه‌های انعطاف‌پذیرتری را برای سناریوهای مختلف مشتریان ارائه می‌دهد. از پنجره متنی 128k برای استدلال و تنظیم دقیق پشتیبانی می‌کند."
  },
@@ -137,15 +131,9 @@
  "ERNIE-Speed-Pro-128K": {
    "description": "مدل زبان بزرگ با عملکرد بالا که در سال 2024 توسط بایدو به‌طور مستقل توسعه یافته است. این مدل دارای توانایی‌های عمومی برجسته‌ای است و عملکرد بهتری نسبت به ERNIE Speed دارد. مناسب برای استفاده به عنوان مدل پایه برای تنظیم دقیق و حل بهتر مسائل در سناریوهای خاص، همچنین دارای عملکرد استنتاجی بسیار عالی است."
  },
-  "FLUX-1.1-pro": {
-    "description": "FLUX.1.1 Pro"
-  },
  "FLUX.1-Kontext-dev": {
    "description": "FLUX.1-Kontext-dev یک مدل تولید و ویرایش تصویر چندرسانه‌ای است که توسط Black Forest Labs توسعه یافته و بر اساس معماری Rectified Flow Transformer ساخته شده است. این مدل با 12 میلیارد پارامتر، بر تولید، بازسازی، تقویت یا ویرایش تصاویر تحت شرایط متنی تمرکز دارد. این مدل ترکیبی از مزایای تولید کنترل‌شده مدل‌های انتشار و قابلیت مدل‌سازی زمینه‌ای ترنسفورمر است و از خروجی تصاویر با کیفیت بالا پشتیبانی می‌کند و در وظایفی مانند ترمیم تصویر، تکمیل تصویر و بازسازی صحنه‌های بصری کاربرد گسترده دارد."
  },
-  "FLUX.1-Kontext-pro": {
-    "description": "FLUX.1 Kontext [pro]"
-  },
  "FLUX.1-dev": {
    "description": "FLUX.1-dev یک مدل زبان چندرسانه‌ای متن‌باز است که توسط Black Forest Labs توسعه یافته و برای وظایف ترکیبی تصویر و متن بهینه شده است. این مدل بر پایه مدل‌های زبان بزرگ پیشرفته مانند Mistral-7B ساخته شده و با استفاده از رمزگذار بصری طراحی‌شده و تنظیم دقیق چندمرحله‌ای دستوری، توانایی پردازش همزمان تصویر و متن و استدلال در وظایف پیچیده را دارد."
  },
@@ -182,9 +170,6 @@
  "Llama-3.2-90B-Vision-Instruct\t": {
    "description": "توانایی استدلال تصویری پیشرفته برای برنامه‌های نمایندگی درک بصری."
  },
-  "Meta-Llama-3-3-70B-Instruct": {
-    "description": "Llama 3.3 70B: مدل ترنسفورمر چندمنظوره که برای مکالمه و وظایف تولید محتوا مناسب است."
-  },
  "Meta-Llama-3.1-405B-Instruct": {
    "description": "مدل متنی تنظیم شده لاما 3.1 که برای موارد مکالمه چند زبانه بهینه‌سازی شده و در بسیاری از مدل‌های چت متن باز و بسته موجود، در معیارهای صنعتی رایج عملکرد عالی دارد."
  },
@@ -203,9 +188,6 @@
  "Meta-Llama-3.3-70B-Instruct": {
    "description": "لاما 3.3 پیشرفته‌ترین مدل زبان چند زبانه و متن باز در سری لاما است که با هزینه‌ای بسیار کم، عملکردی مشابه مدل 405B را ارائه می‌دهد. این مدل بر اساس ساختار ترنسفورمر طراحی شده و از طریق تنظیم دقیق نظارتی (SFT) و یادگیری تقویتی با بازخورد انسانی (RLHF) بهبود یافته است تا کارایی و ایمنی آن افزایش یابد. نسخه تنظیم شده آن به طور خاص برای مکالمات چند زبانه بهینه‌سازی شده و در چندین معیار صنعتی، عملکردی بهتر از بسیاری از مدل‌های چت متن باز و بسته دارد. تاریخ قطع دانش آن تا دسامبر 2023 است."
  },
-  "Meta-Llama-4-Maverick-17B-128E-Instruct-FP8": {
-    "description": "Llama 4 Maverick: مدل بزرگ مبتنی بر معماری Mixture-of-Experts که استراتژی فعال‌سازی کارآمد کارشناسان را برای عملکرد برتر در استنتاج ارائه می‌دهد."
-  },
  "MiniMax-M1": {
    "description": "مدل استنتاج کاملاً توسعه‌یافته داخلی. پیشرو در جهان: ۸۰ هزار زنجیره فکری در برابر ۱ میلیون ورودی، عملکردی برابر با مدل‌های برتر خارجی."
  },
@@ -275,9 +257,6 @@
  "Pro/deepseek-ai/DeepSeek-V3": {
    "description": "DeepSeek-V3 یک مدل زبان با 671 میلیارد پارامتر است که از معماری متخصصان ترکیبی (MoE) و توجه چندسر (MLA) استفاده می‌کند و با استراتژی تعادل بار بدون ضرر کمکی بهینه‌سازی کارایی استنتاج و آموزش را انجام می‌دهد. این مدل با پیش‌آموزش بر روی 14.8 تریلیون توکن با کیفیت بالا و انجام تنظیم دقیق نظارتی و یادگیری تقویتی، در عملکرد از سایر مدل‌های متن‌باز پیشی می‌گیرد و به مدل‌های بسته پیشرو نزدیک می‌شود."
  },
-  "Pro/deepseek-ai/DeepSeek-V3.1": {
-    "description": "DeepSeek-V3.1 یک مدل زبان بزرگ با حالت ترکیبی است که توسط DeepSeek AI منتشر شده و در مقایسه با نسخه‌های قبلی خود به‌روزرسانی‌های مهمی را تجربه کرده است. نوآوری اصلی این مدل ادغام «حالت تفکر» و «حالت غیرتفکر» در یک مدل است که کاربران می‌توانند با تنظیم قالب گفتگو به صورت انعطاف‌پذیر بین آن‌ها جابجا شوند تا نیازهای مختلف وظایف را برآورده کنند. با بهینه‌سازی پس از آموزش تخصصی، عملکرد V3.1 در فراخوانی ابزارها و وظایف Agent به طور قابل توجهی افزایش یافته و پشتیبانی بهتری از ابزارهای جستجوی خارجی و اجرای وظایف پیچیده چندمرحله‌ای ارائه می‌دهد. این مدل بر پایه DeepSeek-V3.1-Base آموزش داده شده و با روش توسعه متن بلند دو مرحله‌ای، حجم داده‌های آموزشی را به طور چشمگیری افزایش داده است که باعث بهبود عملکرد در پردازش اسناد طولانی و کدهای بلند می‌شود. به عنوان یک مدل متن‌باز، DeepSeek-V3.1 در آزمون‌های معیار مختلفی مانند کدنویسی، ریاضیات و استدلال توانایی‌هایی در حد مدل‌های بسته پیشرفته نشان می‌دهد و با معماری متخصص ترکیبی (MoE) خود، ضمن حفظ ظرفیت عظیم مدل، هزینه‌های استدلال را به طور موثری کاهش می‌دهد."
-  },
  "Pro/moonshotai/Kimi-K2-Instruct": {
    "description": "Kimi K2 یک مدل پایه با معماری MoE است که دارای توانایی‌های بسیار قوی در کدنویسی و عامل است، با 1 تریلیون پارامتر کل و 32 میلیارد پارامتر فعال. در آزمون‌های معیار عملکرد در حوزه‌های دانش عمومی، برنامه‌نویسی، ریاضیات و عامل، مدل K2 عملکردی فراتر از سایر مدل‌های متن‌باز اصلی دارد."
  },
@@ -353,21 +332,12 @@
  "Qwen/Qwen3-30B-A3B-Instruct-2507": {
    "description": "Qwen3-30B-A3B-Instruct-2507 نسخه به‌روزرسانی شده مدل غیرتفکری Qwen3-30B-A3B است. این یک مدل متخصص ترکیبی (MoE) با مجموع ۳۰.۵ میلیارد پارامتر و ۳.۳ میلیارد پارامتر فعال است. این مدل در جنبه‌های مختلف بهبودهای کلیدی داشته است، از جمله افزایش قابل توجه در پیروی از دستورالعمل‌ها، استدلال منطقی، درک متن، ریاضیات، علوم، برنامه‌نویسی و استفاده از ابزارها. همچنین، پیشرفت قابل توجهی در پوشش دانش چندزبانه و تطابق بهتر با ترجیحات کاربران در وظایف ذهنی و باز دارد، که منجر به تولید پاسخ‌های مفیدتر و متون با کیفیت بالاتر می‌شود. علاوه بر این، توانایی درک متن‌های بلند این مدل تا ۲۵۶ هزار توکن افزایش یافته است. این مدل فقط از حالت غیرتفکری پشتیبانی می‌کند و خروجی آن شامل برچسب‌های `<think></think>` نخواهد بود."
  },
-  "Qwen/Qwen3-30B-A3B-Thinking-2507": {
-    "description": "Qwen3-30B-A3B-Thinking-2507 توسط تیم Tongyi Qianwen شرکت علی‌بابا به‌عنوان جدیدترین مدل «تفکر» از سری Qwen3 منتشر شده است. این مدل که یک مدل ترکیبی از متخصصان (MoE) با مجموع 30.5 میلیارد پارامتر و 3.3 میلیارد پارامتر فعال‌شونده است، بر ارتقای توانایی پردازش وظایف پیچیده تمرکز دارد. این مدل در معیارهای علمی نیازمند تخصص انسانی—از جمله استدلال منطقی، ریاضیات، علوم و برنامه‌نویسی—بهبود قابل‌توجهی در عملکرد نشان داده است. همچنین توانمندی‌های عمومی آن در پیروی از دستورالعمل‌ها، استفاده از ابزارها، تولید متن و همسویی با ترجیح‌های انسانی نیز به‌سرعت تقویت شده‌اند. مدل به‌طور ذاتی از درک بافت‌های طولانی تا 256K پشتیبانی می‌کند و قابل گسترش تا 1,000,000 توکن است. این نسخه به‌طور ویژه برای «حالت تفکر» طراحی شده است تا از طریق استدلال گام‌به‌گام دقیق مسائل بسیار پیچیده را حل کند و قابلیت‌های عامل (Agent) آن نیز درخشان است."
-  },
  "Qwen/Qwen3-32B": {
    "description": "Qwen3 یک مدل بزرگ جدید با توانایی‌های بهبود یافته است که در استدلال، عمومی، نمایندگی و چند زبانی به سطح پیشرفته صنعت دست یافته و از تغییر حالت تفکر پشتیبانی می‌کند."
  },
  "Qwen/Qwen3-8B": {
    "description": "Qwen3 یک مدل بزرگ جدید با توانایی‌های بهبود یافته است که در استدلال، عمومی، نمایندگی و چند زبانی به سطح پیشرفته صنعت دست یافته و از تغییر حالت تفکر پشتیبانی می‌کند."
  },
-  "Qwen/Qwen3-Coder-30B-A3B-Instruct": {
-    "description": "Qwen3-Coder-30B-A3B-Instruct یک مدل کدنویسی از مجموعه Qwen3 است که توسط تیم Tongyi Qianwen شرکت علی‌بابا توسعه یافته است. به‌عنوان یک مدل پالایش‌شده و بهینه‌شده، این مدل در حالی که عملکرد و کارایی بالایی را حفظ می‌کند، بر بهبود توانمندی‌های پردازش کد متمرکز شده است. این مدل در وظایف پیچیده‌ای مانند برنامه‌نویسی عامل‌محور (Agentic Coding)، خودکارسازی عملیات مرورگر و فراخوانی ابزارها، نسبت به مدل‌های متن‌باز مزایای عملکرد چشمگیری از خود نشان می‌دهد. این مدل به‌صورت بومی از زمینه‌های متنی طولانی تا 256K توکن پشتیبانی می‌کند و قابل گسترش تا 1M توکن است، که امکان درک و پردازش در سطح مخازن کد را بهبود می‌بخشد. علاوه بر این، این مدل پشتیبانی قدرتمندی برای کدنویسی عاملی در پلتفرم‌هایی مانند Qwen Code و CLINE فراهم می‌آورد و فرمت ویژه‌ای برای فراخوانی توابع طراحی شده است."
-  },
-  "Qwen/Qwen3-Coder-480B-A35B-Instruct": {
-    "description": "Qwen3-Coder-480B-A35B-Instruct مدلی برای برنامه‌نویسی است که توسط علی‌بابا منتشر شده و تا کنون بیشترین قابلیت‌های عامل‌محور (Agentic) را داراست. این مدل یک مدل ترکیب متخصصان (Mixture of Experts - MoE) با حدود 480 میلیارد پارامتر کل و 35 میلیارد پارامتر فعال است که تعادلی میان کارایی و عملکرد برقرار می‌کند. این مدل به‌صورت بومی از طول زمینه 256K (حدود 260 هزار) توکن پشتیبانی می‌کند و با استفاده از روش‌های برون‌یابی مانند YaRN می‌تواند تا 1,000,000 توکن گسترش یابد، که آن را قادر می‌سازد مخازن کد بزرگ و وظایف پیچیده برنامه‌نویسی را پردازش کند. Qwen3-Coder برای جریان‌های کاری کدنویسی عامل‌محور طراحی شده است؛ نه تنها می‌تواند کد تولید کند، بلکه قادر است به‌صورت خودکار با ابزارها و محیط‌های توسعه تعامل نماید تا مسائل پیچیده برنامه‌نویسی را حل کند. در چندین بنچ‌مارک مربوط به کدنویسی و وظایف عامل، این مدل در میان مدل‌های متن‌باز در سطح برتر قرار گرفته و عملکرد آن با مدل‌های پیشرو مانند Claude Sonnet 4 قابل مقایسه است."
-  },
  "Qwen2-72B-Instruct": {
    "description": "Qwen2 جدیدترین سری مدل‌های Qwen است که از 128k زمینه پشتیبانی می‌کند. در مقایسه با بهترین مدل‌های متن‌باز فعلی، Qwen2-72B در درک زبان طبیعی، دانش، کد، ریاضی و چندزبانگی به طور قابل توجهی از مدل‌های پیشرو فعلی فراتر رفته است."
  },
@@ -398,9 +368,6 @@
  "Qwen3-235B": {
    "description": "Qwen3-235B-A22B، مدل MoE (متخصص ترکیبی)، حالت «استدلال ترکیبی» را معرفی کرده است که به کاربران امکان می‌دهد به‌طور یکپارچه بین «حالت تفکر» و «حالت غیرتفکر» جابجا شوند. این مدل از درک و استدلال در ۱۱۹ زبان و گویش پشتیبانی می‌کند و دارای قابلیت‌های قدرتمند فراخوانی ابزار است. در آزمون‌های معیار مختلف از جمله توانایی‌های جامع، کد نویسی و ریاضیات، چندزبانه، دانش و استدلال، این مدل می‌تواند با مدل‌های پیشرو بازار مانند DeepSeek R1، OpenAI o1، o3-mini، Grok 3 و Google Gemini 2.5 Pro رقابت کند."
  },
-  "Qwen3-235B-A22B-Instruct-2507-FP8": {
-    "description": "Qwen3 235B A22B Instruct 2507: مدلی بهینه‌شده برای استدلال پیشرفته و دستورهای مکالمه با معماری کارشناسان ترکیبی که کارایی استنتاج را در پارامترهای بزرگ حفظ می‌کند."
-  },
  "Qwen3-32B": {
    "description": "Qwen3-32B، مدل متراکم (Dense Model)، حالت «استدلال ترکیبی» را معرفی کرده است که به کاربران امکان می‌دهد به‌طور یکپارچه بین «حالت تفکر» و «حالت غیرتفکر» جابجا شوند. به دلیل بهبود ساختار مدل، افزایش داده‌های آموزشی و روش‌های مؤثرتر آموزش، عملکرد کلی این مدل با Qwen2.5-72B قابل مقایسه است."
  },
@@ -857,9 +824,6 @@
  "deepseek-ai/DeepSeek-V3": {
    "description": "DeepSeek-V3 یک مدل زبانی ترکیبی از متخصصان (MoE) با 671 میلیارد پارامتر است که از توجه چندسر (MLA) و معماری DeepSeekMoE استفاده می‌کند و با ترکیب استراتژی تعادل بار بدون ضرر کمکی، کارایی استنتاج و آموزش را بهینه می‌کند. با پیش‌آموزش بر روی 14.8 تریلیون توکن با کیفیت بالا و انجام تنظیم دقیق نظارتی و یادگیری تقویتی، DeepSeek-V3 در عملکرد از سایر مدل‌های متن‌باز پیشی می‌گیرد و به مدل‌های بسته پیشرو نزدیک می‌شود."
  },
-  "deepseek-ai/DeepSeek-V3.1": {
-    "description": "DeepSeek-V3.1 یک مدل زبان بزرگ با حالت ترکیبی است که توسط DeepSeek AI منتشر شده و در مقایسه با نسخه‌های قبلی خود به‌روزرسانی‌های مهمی را تجربه کرده است. نوآوری اصلی این مدل ادغام «حالت تفکر» و «حالت غیرتفکر» در یک مدل است که کاربران می‌توانند با تنظیم قالب گفتگو به صورت انعطاف‌پذیر بین آن‌ها جابجا شوند تا نیازهای مختلف وظایف را برآورده کنند. با بهینه‌سازی پس از آموزش تخصصی، عملکرد V3.1 در فراخوانی ابزارها و وظایف Agent به طور قابل توجهی افزایش یافته و پشتیبانی بهتری از ابزارهای جستجوی خارجی و اجرای وظایف پیچیده چندمرحله‌ای ارائه می‌دهد. این مدل بر پایه DeepSeek-V3.1-Base آموزش داده شده و با روش توسعه متن بلند دو مرحله‌ای، حجم داده‌های آموزشی را به طور چشمگیری افزایش داده است که باعث بهبود عملکرد در پردازش اسناد طولانی و کدهای بلند می‌شود. به عنوان یک مدل متن‌باز، DeepSeek-V3.1 در آزمون‌های معیار مختلفی مانند کدنویسی، ریاضیات و استدلال توانایی‌هایی در حد مدل‌های بسته پیشرفته نشان می‌دهد و با معماری متخصص ترکیبی (MoE) خود، ضمن حفظ ظرفیت عظیم مدل، هزینه‌های استدلال را به طور موثری کاهش می‌دهد."
-  },
  "deepseek-ai/deepseek-llm-67b-chat": {
    "description": "DeepSeek LLM Chat (67B) یک مدل نوآورانه هوش مصنوعی است که توانایی درک عمیق زبان و تعامل را فراهم می‌کند."
  },
@@ -930,7 +894,7 @@
    "description": "DeepSeek R1 نسخه کامل است که دارای 671B پارامتر است و از جستجوی آنلاین زنده پشتیبانی می‌کند و دارای توانایی‌های درک و تولید قوی‌تری است."
  },
  "deepseek-reasoner": {
-    "description": "حالت تفکر DeepSeek V3.1. قبل از ارائه پاسخ نهایی، مدل یک زنجیره فکری را تولید می‌کند تا دقت پاسخ نهایی را افزایش دهد."
+    "description": "مدل استدلالی ارائه شده توسط DeepSeek. قبل از ارائه پاسخ نهایی، مدل ابتدا یک زنجیره تفکر را تولید می‌کند تا دقت پاسخ نهایی را افزایش دهد."
  },
  "deepseek-v2": {
    "description": "DeepSeek V2 یک مدل زبانی Mixture-of-Experts کارآمد است که برای پردازش نیازهای اقتصادی و کارآمد مناسب می‌باشد."
@@ -944,18 +908,12 @@
  "deepseek-v3-0324": {
    "description": "DeepSeek-V3-0324 یک مدل MoE با ۶۷۱ میلیارد پارامتر است که در زمینه‌های برنامه‌نویسی و توانایی‌های فنی، درک زمینه و پردازش متن‌های طولانی برتری دارد."
  },
-  "deepseek-v3.1": {
-    "description": "DeepSeek-V3.1 یک مدل استدلال ترکیبی جدید از DeepSeek است که از دو حالت استدلال تفکری و غیرتفکری پشتیبانی می‌کند و نسبت به DeepSeek-R1-0528 در حالت تفکری کارایی بالاتری دارد. پس از آموزش تکمیلی، استفاده از ابزارهای Agent و عملکرد وظایف هوشمند به طور قابل توجهی بهبود یافته است. پشتیبانی از پنجره متنی 128k و طول خروجی تا 64k توکن."
-  },
  "deepseek/deepseek-chat-v3-0324": {
    "description": "DeepSeek V3 یک مدل ترکیبی متخصص با 685B پارامتر است و جدیدترین نسخه از سری مدل‌های چت پرچمدار تیم DeepSeek می‌باشد.\n\nاین مدل از [DeepSeek V3](/deepseek/deepseek-chat-v3) به ارث برده و در انواع وظایف عملکرد عالی از خود نشان می‌دهد."
  },
  "deepseek/deepseek-chat-v3-0324:free": {
    "description": "DeepSeek V3 یک مدل ترکیبی متخصص با 685B پارامتر است و جدیدترین نسخه از سری مدل‌های چت پرچمدار تیم DeepSeek می‌باشد.\n\nاین مدل از [DeepSeek V3](/deepseek/deepseek-chat-v3) به ارث برده و در انواع وظایف عملکرد عالی از خود نشان می‌دهد."
  },
-  "deepseek/deepseek-chat-v3.1": {
-    "description": "DeepSeek-V3.1 یک مدل بزرگ استدلال ترکیبی است که از زمینه طولانی 128K و تغییر حالت کارآمد پشتیبانی می‌کند و در فراخوانی ابزارها، تولید کد و وظایف استدلال پیچیده عملکرد و سرعت برجسته‌ای دارد."
-  },
  "deepseek/deepseek-r1": {
    "description": "DeepSeek-R1 با وجود داده‌های برچسب‌گذاری شده بسیار کم، توانایی استدلال مدل را به طرز چشمگیری افزایش می‌دهد. قبل از ارائه پاسخ نهایی، مدل ابتدا یک زنجیره تفکر را تولید می‌کند تا دقت پاسخ نهایی را افزایش دهد."
  },
@@ -1145,27 +1103,12 @@
  "flux-dev": {
    "description": "FLUX.1 [dev] یک مدل وزن باز و پالایش شده متن‌باز برای کاربردهای غیرتجاری است. این مدل کیفیت تصویر و پیروی از دستورالعمل را نزدیک به نسخه حرفه‌ای FLUX حفظ کرده و در عین حال کارایی اجرایی بالاتری دارد. نسبت به مدل‌های استاندارد با اندازه مشابه، بهره‌وری منابع بهتری دارد."
  },
-  "flux-kontext-max": {
-    "description": "پیشرفته‌ترین فناوری تولید و ویرایش تصاویر مبتنی بر زمینه — ترکیب متن و تصویر برای دستیابی به نتایجی دقیق و منسجم."
-  },
-  "flux-kontext-pro": {
-    "description": "پیشرفته‌ترین تولید و ویرایش تصاویر زمینه‌ای — ترکیب متن و تصویر برای به‌دست آوردن نتایجی دقیق و منسجم."
-  },
  "flux-kontext/dev": {
    "description": "مدل FLUX.1 متمرکز بر وظایف ویرایش تصویر، با پشتیبانی از ورودی‌های متنی و تصویری."
  },
  "flux-merged": {
    "description": "مدل FLUX.1-merged ترکیبی از ویژگی‌های عمیق کشف شده در مرحله توسعه \"DEV\" و مزایای اجرای سریع \"Schnell\" است. این اقدام باعث افزایش مرزهای عملکرد مدل و گسترش دامنه کاربردهای آن شده است."
  },
-  "flux-pro": {
-    "description": "پیشرفته‌ترین مدل تولید تصاویر مبتنی بر هوش مصنوعی برای مصارف تجاری — کیفیت تصویر بی‌نظیر و تنوع خروجی چشمگیر."
-  },
-  "flux-pro-1.1": {
-    "description": "نسخهٔ ارتقاء یافتهٔ مدل تولید تصویر حرفه‌ای مبتنی بر هوش مصنوعی — کیفیت تصویر برجسته و توانایی دقیق در پیروی از پرومپت‌ها را ارائه می‌دهد."
-  },
-  "flux-pro-1.1-ultra": {
-    "description": "تولید تصاویر هوش مصنوعی با رزولوشن فوق‌العاده — پشتیبانی از خروجی ۴ مگاپیکسلی و تولید تصاویر با وضوح بالا در کمتر از ۱۰ ثانیه."
-  },
  "flux-pro/kontext": {
    "description": "FLUX.1 Kontext [pro] قادر است متن و تصاویر مرجع را به عنوان ورودی پردازش کند و ویرایش‌های موضعی هدفمند و تغییرات پیچیده در کل صحنه را به‌صورت یکپارچه انجام دهد."
  },
@@ -1250,12 +1193,6 @@
  "gemini-2.5-flash": {
    "description": "Gemini 2.5 Flash مدل با بهترین نسبت قیمت به کارایی گوگل است که امکانات جامع را ارائه می‌دهد."
  },
-  "gemini-2.5-flash-image-preview": {
-    "description": "Nano Banana جدیدترین، سریع‌ترین و کارآمدترین مدل چندرسانه‌ای بومی گوگل است که به شما امکان می‌دهد از طریق گفتگو تصاویر را تولید و ویرایش کنید."
-  },
-  "gemini-2.5-flash-image-preview:image": {
-    "description": "Nano Banana جدیدترین، سریع‌ترین و کارآمدترین مدل چندرسانه‌ای بومی گوگل است که به شما امکان می‌دهد از طریق گفتگو تصاویر را تولید و ویرایش کنید."
-  },
  "gemini-2.5-flash-lite": {
    "description": "Gemini 2.5 Flash-Lite کوچک‌ترین و مقرون‌به‌صرفه‌ترین مدل گوگل است که برای استفاده در مقیاس وسیع طراحی شده است."
  },
@@ -1358,9 +1295,6 @@
  "glm-4.5-x": {
    "description": "نسخه فوق‌العاده سریع GLM-4.5 که در کنار قدرت عملکرد، سرعت تولید تا 100 توکن در ثانیه را ارائه می‌دهد."
  },
-  "glm-4.5v": {
-    "description": "نسل جدید مدل استنتاج بصری Zhipu مبتنی بر معماری MOE، با مجموع 106B پارامتر و 12B پارامتر فعال، در انواع بنچ‌مارک‌ها به SOTA در میان مدل‌های چندمودال متن‌باز هم‌رده در سطح جهانی دست یافته است و وظایف متداولی مانند درک تصویر، ویدئو، اسناد و تعامل با رابط‌های گرافیکی (GUI) را پوشش می‌دهد."
-  },
  "glm-4v": {
    "description": "GLM-4V قابلیت‌های قدرتمندی در درک و استدلال تصویری ارائه می‌دهد و از وظایف مختلف بصری پشتیبانی می‌کند."
  },
@@ -1397,12 +1331,6 @@
  "google/gemini-2.5-flash": {
    "description": "Gemini 2.5 Flash پیشرفته‌ترین مدل اصلی گوگل است که به‌طور خاص برای استدلال پیشرفته، کدنویسی، ریاضیات و وظایف علمی طراحی شده است. این مدل دارای قابلیت «تفکر» داخلی است که به آن امکان می‌دهد پاسخ‌هایی با دقت بالاتر و پردازش دقیق‌تر زمینه ارائه دهد.\n\nتوجه: این مدل دو نسخه دارد: تفکری و غیرتفکری. قیمت‌گذاری خروجی به طور قابل توجهی بسته به فعال بودن قابلیت تفکر متفاوت است. اگر نسخه استاندارد (بدون پسوند «:thinking») را انتخاب کنید، مدل به‌طور صریح از تولید توکن‌های تفکر خودداری می‌کند.\n\nبرای بهره‌مندی از قابلیت تفکر و دریافت توکن‌های تفکر، باید نسخه «:thinking» را انتخاب کنید که منجر به قیمت‌گذاری بالاتر برای خروجی تفکر می‌شود.\n\nعلاوه بر این، Gemini 2.5 Flash را می‌توان از طریق پارامتر «حداکثر توکن‌های استدلال» پیکربندی کرد، همان‌طور که در مستندات آمده است (https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning)."
  },
-  "google/gemini-2.5-flash-image-preview": {
-    "description": "مدل آزمایشی Gemini 2.5 Flash با پشتیبانی از تولید تصویر"
-  },
-  "google/gemini-2.5-flash-image-preview:free": {
-    "description": "مدل آزمایشی Gemini 2.5 Flash با پشتیبانی از تولید تصویر"
-  },
  "google/gemini-2.5-flash-preview": {
    "description": "Gemini 2.5 Flash مدل اصلی پیشرفته گوگل است که به طور خاص برای استدلال پیشرفته، کدنویسی، ریاضیات و وظایف علمی طراحی شده است. این مدل دارای قابلیت «تفکر» داخلی است که به آن اجازه می‌دهد پاسخ‌هایی با دقت بالاتر و پردازش زمینه‌ای دقیق‌تری ارائه دهد.\n\nتوجه: این مدل دارای دو واریانت است: تفکر و غیرتفکر. قیمت‌گذاری خروجی بسته به فعال بودن قابلیت تفکر به طور قابل توجهی متفاوت است. اگر شما واریانت استاندارد (بدون پسوند «:thinking») را انتخاب کنید، مدل به وضوح از تولید توکن‌های تفکر اجتناب خواهد کرد.\n\nبرای استفاده از قابلیت تفکر و دریافت توکن‌های تفکر، شما باید واریانت «:thinking» را انتخاب کنید که منجر به قیمت‌گذاری بالاتر خروجی تفکر خواهد شد.\n\nعلاوه بر این، Gemini 2.5 Flash می‌تواند از طریق پارامتر «حداکثر تعداد توکن‌های استدلال» پیکربندی شود، همانطور که در مستندات توضیح داده شده است (https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning)."
  },
@@ -1506,7 +1434,7 @@
    "description": "GPT-4.1 mini تعادلی بین هوش، سرعت و هزینه ارائه می‌دهد و آن را به مدلی جذاب در بسیاری از موارد استفاده تبدیل می‌کند."
  },
  "gpt-4.5-preview": {
-    "description": "GPT-4.5-preview یک مدل عمومی و جدید است که دانش گسترده‌ای از جهان دارد و درک عمیق‌تری از نیت کاربران ارائه می‌دهد؛ در انجام وظایف خلاقانه و برنامه‌ریزی به‌عنوان عامل (agent planning) توانمند است. دانش این مدل تا اکتبر ۲۰۲۳ به‌روز است."
+    "description": "نسخه پیش‌نمایش تحقیقاتی GPT-4.5، بزرگ‌ترین و قدرتمندترین مدل GPT ما تا به امروز است. این مدل دارای دانش وسیع جهانی است و می‌تواند بهتر از قبل نیت‌های کاربران را درک کند، که باعث می‌شود در وظایف خلاقانه و برنامه‌ریزی مستقل عملکرد فوق‌العاده‌ای داشته باشد. GPT-4.5 قادر به پذیرش ورودی‌های متنی و تصویری است و خروجی‌های متنی (شامل خروجی‌های ساختاریافته) تولید می‌کند. از ویژگی‌های کلیدی توسعه‌دهندگان مانند فراخوانی توابع، API دسته‌ای و خروجی جریانی پشتیبانی می‌کند. در وظایفی که نیاز به تفکر خلاق، تفکر باز و گفتگو دارند (مانند نوشتن، یادگیری یا کاوش ایده‌های جدید)، GPT-4.5 به‌ویژه عملکرد خوبی دارد. تاریخ قطع دانش در اکتبر 2023 است."
  },
  "gpt-4o": {
    "description": "پیشرفته‌ترین مدل چندوجهی در سری GPT-4 OpenAI که می‌تواند ورودی‌های متنی و تصویری را پردازش کند."
@@ -1574,9 +1502,6 @@
  "gpt-oss": {
    "description": "GPT-OSS 20B یک مدل زبان بزرگ متن‌باز منتشر شده توسط OpenAI است که از فناوری کوانتیزاسیون MXFP4 استفاده می‌کند و برای اجرا روی GPUهای مصرفی پیشرفته یا مک‌های Apple Silicon مناسب است. این مدل در تولید گفتگو، نوشتن کد و وظایف استدلال عملکرد برجسته‌ای دارد و از فراخوانی توابع و استفاده از ابزارها پشتیبانی می‌کند."
  },
-  "gpt-oss-120b": {
-    "description": "GPT-OSS-120B MXFP4: ساختار ترنسفورمر کوانتیزه شده که حتی در منابع محدود عملکرد قوی خود را حفظ می‌کند."
-  },
  "gpt-oss:120b": {
    "description": "GPT-OSS 120B یک مدل زبان بزرگ متن‌باز منتشر شده توسط OpenAI است که از فناوری کوانتیزاسیون MXFP4 بهره می‌برد و به عنوان مدل پرچمدار شناخته می‌شود. این مدل نیازمند محیطی با چند GPU یا ایستگاه کاری با عملکرد بالا برای اجرا است و در استدلال پیچیده، تولید کد و پردازش چندزبانه عملکردی برجسته دارد و از فراخوانی توابع پیشرفته و یکپارچه‌سازی ابزارها پشتیبانی می‌کند."
  },
@@ -1604,9 +1529,6 @@
  "grok-4": {
    "description": "جدیدترین و قدرتمندترین مدل پرچمدار ما که در پردازش زبان طبیعی، محاسبات ریاضی و استدلال عملکردی برجسته دارد — یک انتخاب همه‌کاره بی‌نظیر است."
  },
-  "grok-code-fast-1": {
-    "description": "ما خوشحالیم که grok-code-fast-1 را معرفی کنیم، مدلی سریع و مقرون‌به‌صرفه برای استنتاج که در کدگذاری نماینده عملکرد برجسته‌ای دارد."
-  },
  "gryphe/mythomax-l2-13b": {
    "description": "MythoMax l2 13B یک مدل زبانی است که خلاقیت و هوش را با ترکیب چندین مدل برتر به هم پیوند می‌دهد."
  },
@@ -1715,18 +1637,9 @@
  "image-01-live": {
    "description": "مدل تولید تصویر با نمایش ظریف که از تولید تصویر از متن پشتیبانی می‌کند و امکان تنظیم سبک نقاشی را دارد."
  },
-  "imagen-4.0-fast-generate-001": {
-    "description": "سری مدل‌های متن‌به‌تصویر Imagen، نسل چهارم، نسخهٔ سریع"
-  },
-  "imagen-4.0-generate-001": {
-    "description": "سری مدل‌های Imagen نسل چهارم برای تولید تصویر از متن"
-  },
  "imagen-4.0-generate-preview-06-06": {
    "description": "سری مدل متن به تصویر نسل چهارم Imagen"
  },
-  "imagen-4.0-ultra-generate-001": {
-    "description": "نسخهٔ اولترا از مجموعهٔ مدل‌های متن‌به‌تصویر Imagen نسل چهارم"
-  },
  "imagen-4.0-ultra-generate-preview-06-06": {
    "description": "نسخه اولترا سری مدل متن به تصویر نسل چهارم Imagen"
  },
@@ -1766,9 +1679,6 @@
  "kimi-k2-0711-preview": {
    "description": "kimi-k2 یک مدل پایه با معماری MoE است که دارای توانایی‌های بسیار قوی در کدنویسی و عامل‌سازی است، با مجموع یک تریلیون پارامتر و 32 میلیارد پارامتر فعال. در تست‌های معیار عملکرد در حوزه‌های دانش عمومی، برنامه‌نویسی، ریاضیات و عامل‌ها، مدل K2 عملکردی فراتر از سایر مدل‌های متن‌باز اصلی دارد."
  },
-  "kimi-k2-turbo-preview": {
-    "description": "kimi-k2 یک مدل پایه با معماری MoE است که دارای توانمندی‌های بسیار قوی در حوزهٔ برنامه‌نویسی و عامل‌ها (Agent) می‌باشد. مجموع پارامترها 1T و پارامترهای فعال‌شده 32B است. در آزمون‌های بنچمارک در دسته‌های اصلی مانند استدلال دانش عمومی، برنامه‌نویسی، ریاضیات و Agent، عملکرد مدل K2 از سایر مدل‌های متن‌باز مرسوم پیشی گرفته است."
-  },
  "kimi-latest": {
    "description": "محصول دستیار هوشمند کیمی از جدیدترین مدل بزرگ کیمی استفاده می‌کند و ممکن است شامل ویژگی‌های ناپایدار باشد. از درک تصویر پشتیبانی می‌کند و به‌طور خودکار بر اساس طول متن درخواست، مدل‌های 8k/32k/128k را به‌عنوان مدل محاسبه انتخاب می‌کند."
  },
@@ -1853,9 +1763,6 @@
  "llava:34b": {
    "description": "LLaVA یک مدل چندوجهی است که رمزگذار بصری و Vicuna را برای درک قدرتمند زبان و تصویر ترکیب می‌کند."
  },
-  "magistral-medium-latest": {
-    "description": "Magistral Medium 1.1 یک مدل استنتاج پیشرفته است که توسط Mistral AI در ژوئیهٔ ۲۰۲۵ منتشر شد."
-  },
  "mathstral": {
    "description": "MathΣtral به‌طور ویژه برای تحقیقات علمی و استدلال‌های ریاضی طراحی شده است و توانایی محاسباتی مؤثر و تفسیر نتایج را ارائه می‌دهد."
  },
@@ -2187,7 +2094,7 @@
    "description": "کوچکتر و سریعتر از o1-preview، با ۸۰٪ هزینه کمتر، و عملکرد خوب در تولید کد و عملیات با زمینه‌های کوچک."
  },
  "o1-preview": {
-    "description": "متمرکز بر استدلال پیشرفته و حل مسائل پیچیده، از جمله مسائل ریاضی و علمی. بسیار مناسب برای برنامه‌هایی که نیاز به درک عمیقِ زمینه و جریان‌های کاری خودگردان دارند."
+    "description": "تمرکز بر استدلال پیشرفته و حل مسائل پیچیده، از جمله وظایف ریاضی و علمی. بسیار مناسب برای برنامه‌هایی که نیاز به درک عمیق از زمینه و جریان کاری خودمختار دارند."
  },
  "o1-pro": {
    "description": "مدل‌های سری o1 با آموزش تقویت یادگیری قادرند پیش از پاسخ‌دهی تفکر کنند و وظایف استدلال پیچیده را انجام دهند. مدل o1-pro از منابع محاسباتی بیشتری استفاده می‌کند تا تفکر عمیق‌تری داشته باشد و پاسخ‌های با کیفیت‌تری ارائه دهد."
@@ -2306,14 +2213,8 @@
  "qwen-coder-turbo-latest": {
    "description": "مدل کدنویسی تونگی چیان‌ون."
  },
-  "qwen-flash": {
-    "description": "مدل‌های سری «通义千问» با سریع‌ترین پاسخ‌دهی و هزینه‌ای بسیار پایین، مناسب برای وظایف ساده."
-  },
  "qwen-image": {
-    "description": "Qwen-Image یک مدل عمومی تولید تصویر است که از سبک‌های هنری متنوعی پشتیبانی می‌کند و به‌ویژه در رندر متن‌های پیچیده تبحر دارد، به‌خصوص رندر متن‌های چینی و انگلیسی. این مدل از چینش چندخطی، تولید متن در سطح پاراگراف و بازنمایی جزئیات ریز پشتیبانی می‌کند و قادر است طراحی‌های پیچیده ترکیبی متن و تصویر را تحقق بخشد."
-  },
-  "qwen-image-edit": {
-    "description": "مدل ویرایش تصویر حرفه‌ای منتشرشده توسط تیم Qwen که از ویرایش معنایی و ویرایش ظاهر پشتیبانی می‌کند، قادر به ویرایش دقیق متن‌های چینی و انگلیسی بوده و امکان تبدیل سبک، چرخش اشیاء و دیگر ویرایش‌های تصویری با کیفیت بالا را فراهم می‌آورد."
+    "description": "مدل قدرتمند تولید تصویر خام از تیم Qwen، با توانایی چشمگیر در تولید متن‌های چینی و سبک‌های بصری متنوع تصاویر."
  },
  "qwen-long": {
    "description": "مدل زبانی بسیار بزرگ Tongyi Qianwen که از متن‌های طولانی و همچنین قابلیت مکالمه در چندین سناریو مانند اسناد طولانی و چندین سند پشتیبانی می‌کند."
@@ -2340,7 +2241,7 @@
    "description": "مدل زبان بسیار بزرگ Qwen در نسخه تقویت شده، از ورودی زبان‌های مختلف مانند چینی و انگلیسی پشتیبانی می‌کند."
  },
  "qwen-turbo": {
-    "description": "نسخهٔ Turbo مدل «通义千问» از این پس به‌روزرسانی نخواهد شد؛ پیشنهاد می‌شود آن را با «通义千问 Flash» جایگزین کنید. 通义千问 یک مدل زبانی فوق‌العاده بزرگ است که از ورودی‌هایی به زبان‌های چینی، انگلیسی و دیگر زبان‌ها پشتیبانی می‌کند."
+    "description": "مدل زبان بسیار بزرگ Qwen، از ورودی زبان‌های مختلف مانند چینی و انگلیسی پشتیبانی می‌کند."
  },
  "qwen-vl-chat-v1": {
    "description": "مدل Qwen-VL از روش‌های تعاملی انعطاف‌پذیر پشتیبانی می‌کند، از جمله قابلیت‌های چندتصویری، پرسش و پاسخ چندمرحله‌ای و خلاقیت."
@@ -2657,15 +2558,9 @@
  "step-2x-large": {
    "description": "مدل نسل جدید Step Star برای تولید تصویر است که بر تولید تصویر بر اساس توصیف متنی کاربر تمرکز دارد و تصاویر با کیفیت بالا تولید می‌کند. مدل جدید تصاویر با بافت واقعی‌تر و توانایی تولید متن‌های چینی و انگلیسی قوی‌تر دارد."
  },
-  "step-3": {
-    "description": "این مدل از توانایی‌های قوی در ادراک بصری و استدلال پیچیده برخوردار است. می‌تواند به‌دقت مفاهیم پیچیده میان‌رشته‌ای را درک کند، تحلیل‌های تقاطعی اطلاعات ریاضی و بصری را انجام دهد و به انواع مسائل تحلیل بصری در زندگی روزمره پاسخ دهد."
-  },
  "step-r1-v-mini": {
    "description": "این مدل یک مدل استدلال بزرگ با توانایی‌های قوی در درک تصویر است که می‌تواند اطلاعات تصویری و متنی را پردازش کند و پس از تفکر عمیق، متن تولید کند. این مدل در زمینه استدلال بصری عملکرد برجسته‌ای دارد و همچنین دارای توانایی‌های ریاضی، کدنویسی و استدلال متنی در سطح اول است. طول متن زمینه‌ای 100k است."
  },
-  "stepfun-ai/step3": {
-    "description": "Step3 یک مدل استنتاج چندمودالی پیشرفته است که توسط شرکت StepFun منتشر شده است. این مدل بر پایهٔ معماری مخلوط متخصصان (MoE) با مجموع 321 میلیارد پارامتر و 38 میلیارد پارامتر فعال ساخته شده است. طراحی آن انتها‌به‌انتها است و هدفش کمینه‌سازی هزینهٔ رمزگشایی در حالی‌ست که در استدلال بینایی-زبانی عملکردی در سطح برتر ارائه می‌دهد. از طریق طراحی هم‌افزا مبتنی بر توجه چند-ماتریسی تجزیه‌شده (MFA) و جداسازی توجه و FFN (AFD)، Step3 قادر است کارایی برجسته‌ای را هم روی شتاب‌دهنده‌های رده‌پرچم‌دار و هم روی شتاب‌دهنده‌های سطح پایین حفظ کند. در مرحلهٔ پیش‌آموزش، Step3 بیش از 20T توکن متنی و 4T توکن ترکیبی تصویر-متن را پردازش کرده و بیش از ده زبان را پوشش داده است. این مدل در بنچ‌مارک‌های متعددی از جمله ریاضیات، کدنویسی و چندمودال در میان مدل‌های متن‌باز در جایگاه پیشرو قرار گرفته است."
-  },
  "taichu_llm": {
    "description": "Taichu 2.0 بر اساس حجم زیادی از داده‌های با کیفیت بالا آموزش دیده است و دارای توانایی‌های قوی‌تری در درک متن، تولید محتوا، پرسش و پاسخ در مکالمه و غیره می‌باشد."
  },
@@ -2693,9 +2588,18 @@
  "thudm/glm-4-9b-chat": {
    "description": "نسخه متن باز جدیدترین نسل مدل‌های پیش‌آموزش GLM-4 منتشر شده توسط Zhizhu AI."
  },
+  "thudm/glm-4-9b:free": {
+    "description": "GLM-4-9B-0414 یک مدل زبان با ۹۰ میلیارد پارامتر در سری GLM-4 است که توسط THUDM توسعه یافته است. GLM-4-9B-0414 از همان استراتژی‌های تقویت یادگیری و هم‌راستایی که برای مدل بزرگ‌تر ۳۲B خود استفاده می‌شود، استفاده می‌کند و نسبت به اندازه خود عملکرد بالایی را ارائه می‌دهد و برای استقرار در منابع محدود که هنوز به توانایی‌های قوی در درک و تولید زبان نیاز دارند، مناسب است."
+  },
  "thudm/glm-z1-32b": {
    "description": "GLM-Z1-32B-0414 یک واریانت تقویت‌شده استدلال GLM-4-32B است که به طور خاص برای حل مسائل عمیق ریاضی، منطقی و کد محور طراحی شده است. این مدل از یادگیری تقویتی گسترش‌یافته (وظیفه‌محور و مبتنی بر ترجیحات جفتی عمومی) برای بهبود عملکرد در وظایف پیچیده چند مرحله‌ای استفاده می‌کند. نسبت به مدل پایه GLM-4-32B، Z1 به طور قابل توجهی توانایی‌های استدلال ساختاری و حوزه‌های رسمی را افزایش می‌دهد.\n\nاین مدل از طریق مهندسی نشانه‌گذاری، مراحل «تفکر» را تحمیل می‌کند و برای خروجی‌های طولانی، انسجام بهبودیافته‌ای را فراهم می‌کند. این مدل برای جریان‌های کاری نمایندگی بهینه‌سازی شده و از زمینه‌های طولانی (از طریق YaRN)، فراخوانی ابزار JSON و پیکربندی نمونه‌برداری دقیق برای استدلال پایدار پشتیبانی می‌کند. این مدل برای مواردی که نیاز به تفکر عمیق، استدلال چند مرحله‌ای یا استنتاج رسمی دارند، بسیار مناسب است."
  },
+  "thudm/glm-z1-32b:free": {
+    "description": "GLM-Z1-32B-0414 یک واریانت تقویت‌شده استدلال GLM-4-32B است که به طور خاص برای حل مسائل عمیق ریاضی، منطقی و کد محور طراحی شده است. این مدل از یادگیری تقویتی گسترش‌یافته (وظیفه‌محور و مبتنی بر ترجیحات جفتی عمومی) برای بهبود عملکرد در وظایف پیچیده چند مرحله‌ای استفاده می‌کند. نسبت به مدل پایه GLM-4-32B، Z1 به طور قابل توجهی توانایی‌های استدلال ساختاری و حوزه‌های رسمی را افزایش می‌دهد.\n\nاین مدل از طریق مهندسی نشانه‌گذاری، مراحل «تفکر» را تحمیل می‌کند و برای خروجی‌های طولانی، انسجام بهبودیافته‌ای را فراهم می‌کند. این مدل برای جریان‌های کاری نمایندگی بهینه‌سازی شده و از زمینه‌های طولانی (از طریق YaRN)، فراخوانی ابزار JSON و پیکربندی نمونه‌برداری دقیق برای استدلال پایدار پشتیبانی می‌کند. این مدل برای مواردی که نیاز به تفکر عمیق، استدلال چند مرحله‌ای یا استنتاج رسمی دارند، بسیار مناسب است."
+  },
+  "thudm/glm-z1-9b:free": {
+    "description": "GLM-Z1-9B-0414 یک مدل زبان با ۹B پارامتر در سری GLM-4 است که توسط THUDM توسعه یافته است. این مدل از تکنیک‌هایی که در ابتدا برای مدل بزرگ‌تر GLM-Z1 استفاده شده بود، شامل تقویت یادگیری گسترش‌یافته، هم‌راستایی رتبه‌بندی جفت و آموزش برای وظایف استدلال فشرده مانند ریاضیات، کدنویسی و منطق استفاده می‌کند. با وجود اندازه کوچکتر، این مدل در وظایف استدلال عمومی عملکرد قوی دارد و در سطح وزن خود از بسیاری از مدل‌های متن‌باز برتر است."
+  },
  "thudm/glm-z1-rumination-32b": {
    "description": "THUDM: GLM Z1 Rumination 32B یک مدل عمیق استدلال با ۳۲B پارامتر در سری GLM-4-Z1 است که برای وظایف پیچیده و باز که نیاز به تفکر طولانی دارند بهینه‌سازی شده است. این مدل بر اساس glm-4-32b-0414 ساخته شده و مراحل تقویت یادگیری اضافی و استراتژی‌های هم‌راستایی چند مرحله‌ای را اضافه کرده است و توانایی «تفکر» را که به شبیه‌سازی پردازش شناختی گسترش یافته طراحی شده است، معرفی می‌کند. این شامل استدلال تکراری، تحلیل چندپرش و جریان‌های کاری تقویت‌شده با ابزارهایی مانند جستجو، بازیابی و ترکیب آگاهانه است.\n\nاین مدل در نوشتن تحقیقاتی، تحلیل مقایسه‌ای و پرسش و پاسخ پیچیده عملکرد عالی دارد. این مدل از فراخوانی توابع برای جستجو و ناوبری (جستجو، کلیک، باز کردن، اتمام) پشتیبانی می‌کند و می‌تواند در لوله‌های نمایندگی استفاده شود. رفتار تفکری توسط کنترل چند دوری با پاداش‌های مبتنی بر قوانین و مکانیزم تصمیم‌گیری تأخیری شکل می‌گیرد و به عنوان مرجع از چارچوب‌های عمیق تحقیقاتی مانند انباشت هم‌راستایی داخلی OpenAI استفاده می‌شود. این واریانت برای صحنه‌هایی که نیاز به عمق به جای سرعت دارند مناسب است."
  },
@@ -2803,8 +2707,5 @@
  },
  "zai-org/GLM-4.5-Air": {
    "description": "GLM-4.5-Air یک مدل پایه طراحی شده برای کاربردهای عامل هوشمند است که از معماری Mixture-of-Experts استفاده می‌کند. این مدل در زمینه‌های فراخوانی ابزار، مرور وب، مهندسی نرم‌افزار و برنامه‌نویسی فرانت‌اند بهینه‌سازی عمیق شده و از ادغام بی‌وقفه با عامل‌های کد مانند Claude Code و Roo Code پشتیبانی می‌کند. GLM-4.5 از حالت استدلال ترکیبی بهره می‌برد و می‌تواند در سناریوهای استدلال پیچیده و استفاده روزمره به خوبی عمل کند."
-  },
-  "zai-org/GLM-4.5V": {
-    "description": "GLM-4.5V نسل جدیدی از مدل‌های زبان-بینایی (VLM) است که توسط Zhipu AI (智谱 AI) منتشر شده. این مدل بر پایهٔ مدل متنی پرچم‌دار GLM-4.5-Air ساخته شده که دارای 106 میلیارد پارامتر کل و 12 میلیارد پارامتر فعال‌سازی است؛ از معماری متخصصان ترکیبی (MoE) بهره می‌برد و هدفش ارائهٔ عملکرد برجسته با هزینهٔ استدلال کمتر است. از منظر فناوری، GLM-4.5V راهبرد GLM-4.1V-Thinking را ادامه می‌دهد و نوآوری‌هایی مانند کدگذاری موقعیت چرخشی سه‌بعدی (3D-RoPE) را معرفی کرده که به‌طور چشمگیری درک و استدلال نسبت‌های فضایی سه‌بعدی را تقویت می‌کند. با بهینه‌سازی در مراحل پیش‌آموزش، ریزتنظیم نظارتی و یادگیری تقویتی، این مدل قادر به پردازش انواع محتواهای بصری از جمله تصویر، ویدیو و اسناد بلند شده و در 41 معیار چندوجهی عمومی به سطح برتر مدل‌های متن‌باز هم‌رده دست یافته است. علاوه بر این، یک سوئیچ «حالت تفکر» به مدل افزوده شده که به کاربران اجازه می‌دهد بین پاسخ‌دهی سریع و استدلال عمیق به‌صورت انعطاف‌پذیر انتخاب کنند تا تعادل بین کارایی و کیفیت برقرار شود."
  }
 }
@@ -11,9 +11,6 @@
  "aihubmix": {
    "description": "AiHubMix دسترسی به مدل‌های مختلف هوش مصنوعی را از طریق یک رابط برنامه‌نویسی کاربردی (API) یکپارچه فراهم می‌کند."
  },
-  "akashchat": {
-    "description": "Akash یک بازار منابع ابری بدون نیاز به مجوز است که قیمت‌گذاری آن در مقایسه با ارائه‌دهندگان ابری سنتی رقابتی است."
-  },
  "anthropic": {
    "description": "Anthropic یک شرکت متمرکز بر تحقیق و توسعه هوش مصنوعی است که مجموعه‌ای از مدل‌های پیشرفته زبان مانند Claude 3.5 Sonnet، Claude 3 Sonnet، Claude 3 Opus و Claude 3 Haiku را ارائه می‌دهد. این مدل‌ها تعادلی ایده‌آل بین هوشمندی، سرعت و هزینه برقرار می‌کنند و برای انواع کاربردها از بارهای کاری در سطح سازمانی تا پاسخ‌های سریع مناسب هستند. Claude 3.5 Sonnet به عنوان جدیدترین مدل آن، در ارزیابی‌های متعدد عملکرد برجسته‌ای داشته و در عین حال نسبت هزینه به عملکرد بالایی را حفظ کرده است."
  },
@@ -29,9 +26,6 @@
  "bedrock": {
    "description": "Bedrock یک سرویس ارائه شده توسط آمازون AWS است که بر ارائه مدل‌های پیشرفته زبان AI و مدل‌های بصری برای شرکت‌ها تمرکز دارد. خانواده مدل‌های آن شامل سری Claude از Anthropic، سری Llama 3.1 از Meta و غیره است که از مدل‌های سبک تا مدل‌های با عملکرد بالا را پوشش می‌دهد و از وظایفی مانند تولید متن، مکالمه و پردازش تصویر پشتیبانی می‌کند. این سرویس برای برنامه‌های شرکتی با مقیاس‌ها و نیازهای مختلف مناسب است."
  },
-  "bfl": {
-    "description": "آزمایشگاهی پیشرو در پژوهش‌های پیشرفتهٔ هوش مصنوعی که زیرساخت‌های بصریِ فردا را می‌سازد."
-  },
  "cloudflare": {
    "description": "مدل‌های یادگیری ماشین مبتنی بر GPU بدون سرور را در شبکه جهانی Cloudflare اجرا کنید."
  },
@@ -92,12 +86,6 @@
  "moonshot": {
    "description": "Moonshot یک پلتفرم متن‌باز است که توسط شرکت فناوری Beijing Dark Side of the Moon ارائه شده است. این پلتفرم مدل‌های مختلف پردازش زبان طبیعی را ارائه می‌دهد و در زمینه‌های گسترده‌ای از جمله، اما نه محدود به، تولید محتوا، تحقیقات علمی، توصیه‌های هوشمند، تشخیص پزشکی و غیره کاربرد دارد و از پردازش متون طولانی و وظایف پیچیده تولید پشتیبانی می‌کند."
  },
-  "nebius": {
-    "description": "Nebius با ساخت خوشه‌های بزرگ GPU و پلتفرم ابری یکپارچه، زیرساخت‌های با عملکرد بالا را برای نوآوران هوش مصنوعی در سراسر جهان فراهم می‌کند."
-  },
-  "newapi": {
-    "description": "پلتفرم یکپارچه و بازمتن برای تجمیع و انتقال چندین سرویس هوش مصنوعی"
-  },
  "novita": {
    "description": "Novita AI یک پلتفرم ارائه‌دهنده خدمات API برای مدل‌های بزرگ زبانی و تولید تصاویر هوش مصنوعی است که انعطاف‌پذیر، قابل‌اعتماد و مقرون‌به‌صرفه می‌باشد. این پلتفرم از جدیدترین مدل‌های متن‌باز مانند Llama3 و Mistral پشتیبانی می‌کند و راه‌حل‌های API جامع، کاربرپسند و خودکار برای توسعه برنامه‌های هوش مصنوعی مولد ارائه می‌دهد که مناسب رشد سریع استارتاپ‌های هوش مصنوعی است."
  },
@@ -237,10 +237,6 @@
      "title": "محدودیت تعداد پیام‌های تاریخی",
      "unlimited": "بدون محدودیت در تعداد پیام‌های تاریخی"
    },
-    "enableStreaming": {
-      "desc": "فعال‌سازی خروجی جریانی برای نمایش پاسخ‌ها به‌صورت زنده. در صورت غیرفعال بودن، فقط پاسخ کامل نمایش داده می‌شود.",
-      "title": "فعال‌سازی خروجی جریانی"
-    },
    "historyCount": {
      "desc": "تعداد پیام‌هایی که در هر درخواست ارسال می‌شوند (شامل آخرین سوال نوشته‌شده. هر سوال و پاسخ به‌عنوان 1 محاسبه می‌شود)",
      "title": "تعداد پیام‌های همراه"
@@ -52,11 +52,7 @@
    "thinking": {
      "title": "Interrupteur de réflexion approfondie"
    },
-    "title": "Fonctionnalités d'extension du modèle",
-    "urlContext": {
-      "desc": "Une fois activé, il analysera automatiquement les liens web pour obtenir le contenu contextuel réel de la page web",
-      "title": "Extraction du contenu des liens web"
-    }
+    "title": "Fonctionnalités d'extension du modèle"
  },
  "history": {
    "title": "L'assistant ne se souviendra que des {{count}} derniers messages"
@@ -129,7 +125,6 @@
      "inputWriteCached": "Écriture de cache d'entrée",
      "output": "Sortie",
      "outputAudio": "Sortie audio",
-      "outputImage": "Sortie d'image",
      "outputText": "Sortie texte",
      "outputTitle": "Détails de la sortie",
      "reasoning": "Raisonnement approfondi",
@@ -273,8 +268,7 @@
    "clientMode": {
      "actionFiletip": "Télécharger un fichier",
      "actionTooltip": "Télécharger",
-      "disabled": "Le modèle actuel ne prend pas en charge la reconnaissance visuelle et l'analyse de fichiers, veuillez changer de modèle pour l'utiliser",
-      "visionNotSupported": "Le modèle actuel ne prend pas en charge la reconnaissance visuelle, veuillez changer de modèle pour l'utiliser"
+      "disabled": "Le modèle actuel ne prend pas en charge la reconnaissance visuelle et l'analyse de fichiers, veuillez changer de modèle pour l'utiliser"
    },
    "preview": {
      "prepareTasks": "Préparation des morceaux...",
--- a/Show More
+++ b/Show More